Текст
                    ПРОБЛЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Л.А. ПОСПЕЛОВ
СИТУАЦИОННОЕ
УПРАВЛЕНИЕ
ТЕОРИЯ И ПРАКТИКА
Алтайскяй
!-«..-тч- .т
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1986


ББК 32.81 П62 УДК 51971 Поспелов Д. А. Ситуационное управление: теория и практика.— М.: Наука.—Гл. ред. физ.-мат. лит., 1986.— 288 с. Ситуационное управление — метод управления сложными техническими и организационными системами, основанный на идеях теории искусственного интеллекта: представление знаний об объекте управления и способах управления им на уровне логико-лингвистических моделей, использование обучения и обобщения в качестве основных процедур при построении процедур управления по текущим ситуациям, использование дедуктивных систем для" построения многошаговых решений. Излагается методология ситуационного управления, его теоретические основы и приводятся примеры его конкретных применений. Для специалистов в области теории управления и систем искусственного интеллекта. Табл. 42. Ил. 97. Библиогр. 186 иазв. Рецензент кандидат физико-математических наук В. Л, Стефанюк ''с) Издательство «Наука » 1504000000—033 Главная редакция о 150-86 физико-матемитическоГ! 053 (02)-86 ^^^О'^ литературы. 1986
ОГЛАВЛЕНИЕ Предисловие 3- Г vT а в а 1. Принципы ситуационного управления 9 §1.1. Традиционная схема управления 9 §1.2. Нетрадиционные объекты управления 11 § 1.3. Психологические предпосылки 17 § 1.4. В чем состоит ситуационное управление? 25 § 1.5. Семиотические модели * 32 § 1.6. Данные и знания ■ 39 § 1.7. План дальнейшего изложения 42 Глава 2. Языки для описания объекта и ситуаций 43 §2.1. Вступительные замечания 43 § 2.2. Роли и отношения 45 § 2.3. Естественный язык и теория управления 46 § 2.4. Язык ситуационного управления (ЯСУ) 55 §2.5. Формирование лексики ЯСУ** 57 § 2.6. Формальная модель синтаксиса ЯСУ * 61 § 2.7. Дискретные ситуационные сети (ДСС) 63 § 2.8. Другие языки описания ситуаций * 67 §2.9. Языки представления знаний** 71 §2.10. Переход от текстов на естественном языке к внутреннему представлению ** 83 §2.11. Формализация качественных характеристик* 87 Глава 3, Пополнение описаний ситуаций 96 §3.1. Постановка задачи 96 § 3.2. Сценарии 99 §3.3. Сценарии и фреймы** 102 §3.4. Псевдофизические логики* 106 §3.5. Временная логика** 111 §3.6. Пространственная логика** 125 §3.7. Каузальная логика* 136 §3.8. Неполнота и «абсурдность» знаний 156 Глава 4. Обобщение и классификация ситуаций 159 §4.1. Суть проблемы 159 §4.2, Обобщение понятий и классификация у человека 162 §4.3. Обобщение по признакам* 167 §4.4. Обобщение по структурам * 182 §4.5. «Слоеный пи.рог» 203 §4.6. Некоторые сведения о классифицирующих системах** , . . 206 §4.7. Дополнительные замечания 212 1*
4 ОГЛАВЛЕНИЕ Глава 5. Формирование решений по управлению 216 §5.1. Цели, ситуации и планы 216 § 5.2. Стратегии планирования 220 §5.3. Использование метода резолюции при планировании ** ... 227 § 5.4. Функциональные модели для планирования 234 § 5.5. Сценарии и логики действий * 238 § 5.6. Экстраполяция решений 243 § 5.7. Особенности рассуждений у человека 249 Заключительные замечания 252 Приложение. Исторический очерк развития ситуациониого управления 254 Комментарии 259 Список литературы 270 Именной указатель 279 * Предметный указатель 280
ПРЕДИСЛОВИЕ Когда я задумал написать эту книгу и обдумывал способ, как наилучшим образом это сделать, мне пришло в голову воспоминание о Боробудуре. Боробудур — знаменитый храмовый буддийский комплекс, расположенный в центре Явы, в широкой долине, окруженной горами, часть из которых — действуюш^ие вулканы. Когда путник подхо* дит к Боробудуру, он видит перед собой огромное сооружение, поднимаюш^ееся вверх террасами-уступами. Каждая такая ступень снаружи сплошь покрыта каменными рельефами, там и сям в пе- ш^ерах-углублениях сидят будды и бодисатвы. Многие километры каменной книги, в которой причудливо переплетаются мифологические и сказочные сюжеты, сцены из жизни Будды и бодисатв. Поднимаясь вверх по галереям, опоясываюш^им Боробудур, путник постепенно теряет ош.уш,ение реальности среди тысяч скульптур и каменных рельефов. Но наступает момент, и он выходит на очередной уступ — каменную плош^адку, с которой открывается удивительный вид на долину и горы. Каменный хаос фантомов остался внизу. А здесь, наверху, только природа в своей первозданной красе и величии. Но эта терраса еш,е не последняя. Поднимаясь все выше и выше, путник достигает высшей точки Бо- робудура, где воздвигнута гигантская ступа — непременный атрибут буддийского сооружения. И отсюда уже не видно тех нижних ярусов, в которых застыла каменная летопись реального и фантастического миров. Двигаясь так, трудно уловить оби;ую идею Боробудура, его скрытый смысл, воплош,енный неизвестными строителями в VHI или IX веках в камне. Но XX век дал новую возможность для проникновения в тайну этого древнего сооружения. С sepTOvieTa его можно увидеть сразу, в единстве всех его ярусов, интегрально. И тогда возникает четкий план сооружения. Эта громоздкая пирамида в своем стремлении ввысь отражает три мира: мир чувственных образов, мир идей-представлений и мир абстрактных идей. То, что путник, движуш,ийся вверх по галереям храма, должен был вычленить из пестрой мозаики своих впечатлений, вид с воздуха выявляет сразу. Описывая некоторую область науки, можно также идти двумя путями. Можно вести путника-читателя по длинным галереям,
б ПРЕДИСЛОВИИ наполненным отдельными фактами, cocтaвляюIди^uI все вместе нечто целое, объединенное общими идеями и принципами. А можно описать эту область «с высоты птичьего полета», сразу сформулировав эти основные идеи и принципы, отбросив все детали, даже если каждая из них удивительна и интересна. Но можно попытаться соединить оба пути: аналитический и синтетический. В настоящей книге реализован именно этот замысел. Насколько хорошо — судить не мне, а читателю. Во всяком случае, книга состоит как бы из четырех уровней. На первом дается концептуальный взгляд на те вопросы, которые составляют суть ситуационного управления. Для чтения этих параграфов не требуется никаких знаний более низкого уровня. И весь первый уровень, как мне представляется, дает читателю, интересующемуся лишь сутью ситуационного управления, его идеями и возможностями практического применения, достаточно полную картину. На втором уровне (относящиеся к нему параграфы книги помечены звездочкой) излагаются методы и процедуры, используемые в ситуационном управлении. Эти методы могут оказаться полезными не только для тех, кто захочет применять метод ситуационного управления. Они могут пригодиться и в иных случаях. Поэтому второй уровень рассчитан на достаточно широкие круги специалистов, интересующихся бурно развивающимися методами решения задач, опирающимися на логико-лингвистические модели. Для понимания параграфов, входящих в этот уровень, требуется прочитать и разделы, образующие верхний уровень. Третий уровень (его параграфы отмечены двумя звездочкалш) рассчитан на специалистов, которые захотят практически применить метод ситуационного управления для решения собственных задач. В нем сосредоточены методические и методологические рекомендации и советы по построению подобных систем. До чтения параграфов третьего уровня желательно прочитать и те, которые относятся к первым двум. Но, вообще говоря, в большинстве случаев ^южнo обойтись только теми сведениями, которые имеются на первом уровне. Четвертый уровень — вспомогательный. Поэтому он выделен в тексте книги петитом. В его разделах комментируются некоторые положения и методы, описанные на предшествующих уровнях, и дается обзор литературы. В текстах основных трех уровней нет прямых ссылок на литературу. Они отвлекают читателя и засоряют текст. Поэтому на четвертом уровне есть полный обзор использованных при написании книги источников и тех работ, которые близко примыкают по своим идеям к тому, что говорится в книге. Четвертый уровень завершается историческим очерком развития ситуационного управления. И еще две особенности книги. В ней довольно ^шoгo всяких историй, литературных цитат и анекдотов, вкрапленных в текст,
ПРЕДИСЛОВИЕ 7 особенно на первом уровне. Я придаю им важное значение, хотя читатели-пуристы могут посчитать, что они неуместны в научной монографии. Введены они для того, чтобы вызвать у читателя нужные мне ассоциации. И это все, что я могу сказать здесь в свое оправдание. Второе — это примеры. В них нередко содержатся утверждения, важные для понимания того или иного положения данного уровня, которое они иллюстрируют. Поэтому их желательно не опускать при чтении. Теперь надо сказать несколько слов о том, почему эта книга выходит в серии книг «Проблемы искусственного интеллекта», чья эмблема украшает обложку книги. Идеи ситуационного управления, как узнает об этом читатель из исторического очерка, помещенного в Приложении, возникли куда раньше того момента, когда на горизонте исследователей появилась новая наука — теория искусственного интеллекта. Но логика рождения новых научных направлений такова, что они никогда не зарождаются на пустом месте, не возникают, как феникс, из ничего. Новое зреет и зарождается в недрах «старых», признанных наук. Только тогда, когда это созревание достигнет определенного уровня, происходит рождение новой науки или новой научной парадигмы. Искусственный интеллект, этот кумир сегодняшнего дня, конечно, не был исключением. То, что потом вошло в него, возникало в недрах кибернетики и лингвистики, психологии и программирования. Если очень сжато (и поэтому неточно с позиций пуриста) определить, что сегодня понимают под теорией искусственного интеллекта, то можно сказать, что это наука о знаниях, о том, как их добывать, представлять в искусственных системах, перерабатывать внутри системы и использовать для решения практических задач. Другими словами, системы, изучаемые в рамках искусственного интеллекта и создаваемые в русле этой науки, это системы, работа которых опирается на знания, отражаюш,ие семантику и прагматику того внешнего мира, в котором действуют интеллектуальные системы. При таком понимании области исследований, относяш,ихся к искусственному интеллекту, работы в области ситуационного управления, без всякой натяжки, к ней принадлежат. Зародившись в недрах теории управления большими системами, ситуационное управление с самого начала было ориентировано на использование знаний об объекте управления и способах управления им, которые не могут быть строго формализованы, и на активный диалог с управленцем на языке, максимально приближенном к его профессиональному языку. А это значит, что включение этой книги в серию книг по искусственному интеллекту полностью оправдано. Завершая предисловие, мне хотелось бы отметить, что основные положения этой книги формировались и окончательно оформились в течение многолетних контактов со всеми активными участниками
8 ПРЕДИСЛОВИЕ ТОГО, ЧТО МОЖНО было бы назвать «ситуационным движением» (термин Г. П. Щедровицкого). Я глубоко благодарен всем моим товарищам и коллегам по этому «движению». Многочисленные конференции, симпозиумы, школы и семинары по ситуационному управлению сплотили нас, позволили выработать общую терминологию и сформулировать концептуальные модели, лежащие в основе метода ситуационного управления. И вряд ли можно теперь точно определить, «кто первый сказал А», и я не хотел бы, чтобы из текста книги читатель мог бы предположить, что ее автор придерживается известного правила: «Автор не тот, кто первый сказал А, а тот — кто первый сказал Я».
ГЛАВА 1 ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ У народов обыкновенно много слов для обозначения того, что их больше всего интересует. Э. Ренан § 1.1. Традиционная схема управления Традиционная теория автоматического управления техническими объектами, выросшая на суш^ествовавшей ранее теории автоматического регулирования, имеет дело с такими объектами, для которых процедура управления в самом обш^ем виде представляется так, как показано на рис. 1.1. На управляемый объект воздействуют {п+г) входов, причем значение входов Xt можно оценить в каждый момент времени, а для входов Wj такая возможность отсутствует. Ча- ш,е всего это происходит. из-за отсутствия необходи- ■ мых датчиков. Но бывает, - что измерение входов Wj физически невозможно или слишком дорого обходится. В идеальном случае входов Wj нет. Объект имеет т выходов. Предполагается, что между входным вектором <Х, Wy и выходным У есть некоторая связь Г=/(X, W). Эта связь мо- Уг Ут ■ Объект ^2 ... ' Система управления ЛПР\ Рис. 1.1 жет иметь самые разные характеры: она может быть функциональной,. статистической, в виде неоднозначного отображения и т. п. Важно лишь то, что изменения в X и как-то сказываются на значениях F. Значения Y небезразличны некоторому лицу, которое мы в дальнейшем будем условно называть лицо, принимающее реиление (ЛИР), как принято в современной теории исследования операций. Для ЛПР важно добиться получения определенных значений Y при любых значениях X и На векторы X и оно влиять не может. Поэтому оно строит систему управления так, чтобы получить от объекта интересуюш^ие его значения Y. Это делается с помош,ью специальных управляющих воздействий W/, подаваемых от системы управления на объект. Подобно векторам X и W, значения вектора воздействий U влияют на значения вектора У. Другими словами, вместо соотношения Y=f{X, W) возникает соотношение y=f(X, (У, W). Задача ЛПР — сделать систему управления такой, чтобы при наличии информации о текущих значениях X (ин-
10 1-1. 1. ПРИНЦИПЫ CUTN'AUllOHIlorc) У! 11>Л l£l И I>I формация о значениях W системе управления, естественно, недоступна) добиться таких значений К, которые устраивают ЛПР. Это означает, что система управления реализует некоторую зави- cи^юcть вида (7-^([)(Х, F), с пo^ющью которой она находит необходимые управляющие воздействия на объект. Если ЛПР не удовлетворено своим детищем, то оно ^южeт внести коррективы в его функционирование. На рис. 1.1 эта возможность показана в виде подачи на систему управления корректирующего вектора Z. Если же коррекция не приводит к цели или невозможна, то ЛПР может сменить систему управления. Не будем вдаваться в дальнейшее расслютрение приведенной схемы. Для нас важно следующее: для того чтобы ЛПР смогло построить удовлетворяющую его систему управления, оно должно знать две вещи: множество предпочтительных векторов Y и как задано отображение /. Отображение / описывает функционирование объекта управления, а знание предпочтительных значений Y говорит о понимании цели его функционирования. Итак, ЛПР нeoбxoди^ю знать описание объекта (т. е. его структуры и функционирования), которым он собирается управлять, и цели существования этого объекта. Зная это, он ^южeт сформулировать критерий управления, в котором воплощаются требования к системе управления. Отображение Ф па рис. 1.1 воплощает в себе критерий управления объектом. Он может быть различным: максимизация или минимизация каких-то значений вектора К, их поддержание в некоторых заданных пределах, недопущение некоторых комбинаций этих значений или запрещение появления определенных временных последовательностей значений вектора К и т. п. Но именно наличие критерия управления позволяет ЛПР ставить и решать традиционную задачу управления объектом. Так возникает цепочка: описание объекта управления — описание целей существования объекта управления — формирование критерия управления им — проектирование и создание системы управления. Следовало бы ожидать, что теория управления уделит одинаковое внимание всем элементам цепочки. Однако исторически этого не произошло. Как правило, специалисты в области управления прилагали усилия лишь к поиску процедуры управления объектом, когда и сам объект, и критерий управления им были уже описаны в точных терминах. Оптимизация управления была центральной проблемой традиционной теории автоматического управления. И лишь на последнем этапе ее развития внимание специалистов переместилось на проблему идентификации объекта управления и на проблему выявления критериев управления им. Но здесь возник ряд трудностей, связанных с тем, что объек- тa^иI управления стали системы, для которых привычные, наработанные десятилетиями приемы оказались HenpHMennMbiNHi. Какова же была их природа?
§1.2. ИНТРЛДПЦИОПП ЫЕ ОБ'ЬЕКТЫ УПРЛПЛЕМИЯ П § 1.2. Нетрадиционные объекты управления Их называют по-разному: плохо определенные или слабоструктурированные, организационные или обладающие «свободой воли». Но независилю от названия эти новые объекты обладают рядом неожиданных для традиционного управленца свойств, отличающих их от привычных объектов прошлого. Перечислим основные их свойства. 1. Уникальность. Каждый объект обладает, такой структурой и функционирует так, что система управления им должна строиться с учетом всех его качеств и к нему нельзя применить какую- либо-типовую стандартную процедуру управления. Если, например, удалось спроектировать систему управления движением для aвтo^юбиля ВАЗ 2103, то она пригодна для любого конкретного автомобиля такой ^юдeли. Если же спроектирована система управления для министерства здравоохранения некоторой союзной республики, то ее нельзя перенести без изменений для того же министерства другой республики. При переносе надо учесть все индивидуальные особенности нового объекта управления. Это обстоятельство резко удорожает процедуру построения системы управления, ибо фактически нужно создавать столько систем управления, сколько объектов мы хотим автоматизировать. 2. Отсутствие формализуемой цели существования. Для старых, привычных для теории автоматического управления объектов всегда было ясно, зачем был создан тот объект, управление которым мы строим. Как правило, управленцы имели дело с объектами искусственного происхождения, созданными людьми для достижения понятных им целей. Станок должен был производить определенную обработку заготовок, самолет должен был перевозить по воздуху пассажиров и грузы. Но не для всех объектов (даже созданных человеком) можно так же четко сформулировать цель их существования. Сейчас, когда мы хотим управлять городами, отраслями народного хозяйства, регионами, экосистемами, мы попадаем в весьма затруднительное положение при попытке четко сформулировать цель существования этих объектов. Даже созданные людьми, они возникли не по чьему-то плану, для решения какой-то конкретной задачи, а развились постепенно в силу определенных социально-экономических и исторических причин. Каковы, например, цели существования сверхгородов? Или для чего возникла экосистема Азово-Черноморского бассейна? На такие вопросы практически нeвoз^южнo ответить, А это приводит к весьма большим сложностям в формировании критерия управления. Ибо критерий управления в традиционных системах управления был теснейшим образом связан с целью существования объекта. Критерий управления самолетом был основан на достижении им своей цели существования — перевозки людей и грузов по воздуху, управления производством синтети-
12 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ ческого каучука — на соображениях повышения качества продукта. Именно поэтому в различных автоматизированных системах управления, создаваемых для объектов нового класса, очень часто можно наблюдать реализацию различных критериев управления. 3. Отсутствие оптимальности. Следствием того, о чем говорилось в предшествующ,их двух пунктах, является неправомочность постановки для объектов новой природы классической задачи оптимизации. Из-за отсутствия цели сущ,ествования (в рамках теории управления) для рассматриваемых объектов нельзя построить объективный критерий управления. Критерий управления становится субъективным, целиком зависяш.им от ЛПР. Эту чрезвычайно важную для дальнейшего мысль можно проиллюстрировать следующ,им примером, стояи;им, правда, несколько в стороне от собственно задачи управления. Пусть с помои;ью людей-экспертов мы хотим измерить размер какого-либо предмета. Например, длину автомашины ВАЗ 2105. Каждый специалист называет некоторое число, которое, по его мнению, означает длину автомобиля. ЛПР (которое также может прикинуть длину автомобиля) анализирует показания экспертов. Если находится эксперт, оценивающий длину автомобиля в 10 м или в 50 см, то ЛПР вправе усомниться в его квалификации как эксперта. Отбросив такие аномальные предложения, ЛПР может просуммировать остальные числа и найти среднее арифметическое от полученного результата. Такое усреднение как бы объективизирует результат. Если экспертов было много и они обладали неплохим глазомером, то результат экспертизы будет близок к истинной длине автомобиля. Отметим две особенности описанной нами процедуры. Во-первых, если экспертов уже много, то появление некоторого нового эксперта не внесет особых изменений в результат, полученный ЛПР. Другими словами, такая экспертиза обладает свойством устойчивости. Во-вторых, можно проверить качество экспертизы, взяв какое-либо измерительное приспособление, точность которого удовлетворяет ЛПР, и провести измерение. Та или иная близость данных измерения к результату, полученному с помощью экспертов, будет характеризовать качество экспертизы. А это позволяет ставить, например, задачу оптимизации формирования коллектива экспертов по их количеству или каким-либо социальным или физиологическим особенностям. Теперь рассмотрим пример другой экспертизы. Группа людей заблудилась в пещере. После долгого блуждания они оказались на площадке, с которой путь, приведший их на нее, разветвляется. Влево и вправо уходят подземные коридоры. Требуется решить: куда идти? Руководитель группы (ЛПР) устраивает опрос. Сторонники движения по левому коридору высказывают свои соображения, их противники — другие. Для ЛПР доводы тех и других не кажутся слишком убедительными, и оно проводит простое
§1.2. НЕТРАДИЦИОННЫЕ ОБЪЕКТЫ УПРАВЛЕНИЯ 13 голосование. Предположим, что большинство участников этой экспертизы высказалось за движение по левому коридору. Группа пошла по нему. После нескольких дней, ослабевшие от голода и жажды, они выбрались на поверхность. И с тех пор ЛПР мучает вопрос: правильно ли оно приняло решение? Ясно, что ответа на этот вопрос нет. Он был бы, если бы группа прошла и правым коридором. Возможно, что он сразу бы вывел их на поверхность, но весьма вероятно, что они могли бы навсегда остаться под землей. Оценить правильность выбора, его целесообразность, оптимальность в этом случае можно, только имея план пещ,еры, а значит, «пройдя» по всем ее коридорам. В отличие от ситуации с измерением длины автомобиля, здесь нет возможности оценить качество принятого решения, если альтернативные решения не проверялись. Кроме того, экспертиза второго типа не обладает устойчивостью, характерной для предшествуюн;его примера. Если бы после принятия решения о движении по левому коридору подавляющ,им большинством экспертов на площ,адку, где стоит группа, выбрался бы из левого коридора человек, тоже блуждаюш,ий в поисках выхода, и сказал бы, что этот путь ведет в тупик, то весь результат опроса рухнул бы. И дальнейшее движение было бы продолжено по правому коридору. Ситуация, аналогичная поиску пути в пеи;ере, складывается весьма часто. При решении о выборе тех или иных характеристик будущ,его изделия, при принятии тех или иных решений по структуре и методам функционирования автоматизированной системы управления, при всяком «волевом» решении (хотя и подкрепленным рядом соображений самого ЛПР и других экспертов) всегда возникает ситуация, описанная нами. Отсюда следует, что в этих случаях невозможно говорить об оптимальности получаемых решений. Нельзя, например, требовать, чтобы проектировщ.ики создали оптимальную АСУ отраслью или городом. Такая постановка некорректна и неправомочна. Качество созданной системы для управления объектами новой природы может оцениваться только субъективно самим ЛПР или их коллективом. Поэтому здесь уместнее говорить о целесообразности результата управления, а не об его оптимальности. Важно только, чтобы ЛПР в нужных случаях не боялось принимать решения. В одноактной пьесе Славомира Мрожека, которая называется «Стриптиз», описана как раз такая ситуация, при которой одно из ЛПР увиливает от принятия решений. Два человека, не знакомых между собой, оказываются некоторым непостижимым для них образом перенесенными в помеи;ение, из которого имеется выход через открытую дверь. Им надо принять решение: что делать? Происходит следующ,ий диалог: Первый. Что такое свобода? Это возможность выбирать. Пока я нахожусь здесь, я знаю, что могу выйти в эти двери, до тех пор я свободен. Зато в тот момент, когда я встану и выйду отсюда,
14 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ я тем самым произведу выбор, т. е. ограничу возможность моего поведения и утрачу свободу. Я стану рабом своего ухода. Второй. Но, оставаясь на месте и никуда не выходя, вы тоже производите выбор. Вы избираете сидение и невыход. Первый. Неправда. Я сижу, но я могу выйти. Выйдя, я исключаю возможность сидения. 4. Динамичность. В каком-то смысле объекты, с которыми сейчас сталкивается теория управления, подобны жавым системам. С течением времени изменяется их структура и функционирование. Объекты как бы эволюционируют во времени. На предприятии строят новые цеха, возникают новые производства, хменяет- ся технология. Сеть ЭВМ растет, отдельные сети начинают соединяться между собой, стремясь к общемировой сети обработки данных. Меняется структура отрасли, города расширяют свои границы, меняется их застройка, смещаются транспортные и людские потоки. И эта динамичность должна быть учтена в системах управления подобными объектами. Они поневоле должны быть адаптивными, готовыми к изменению своего функционирования. 5. Неполнота описания. Как правило, никакой коллектив экспертов, знающих объект управления, не в состоянии сразу же обеспечить информацию, которой бы заведомо хватило для создания системы управления объектом. Существует несколько причин, почему это происходит. Описывая объект управления старого типа, управленец всегда знал о тех допущениях, которые он принял, строя описание. Он мог предполагать, что передаточная функция объекта имеет тот или иной вид, что запаздывание не играет в его функционировании большой роли, что влияние параметров Wj незначительно и им можно пренебречь и т. п. И если созданная им система управления оказывалась не слишком хорошей, то он знал, от каких допущений надо отказываться. Но при работе с объектами новой природы эти допущения нельзя сформулировать столь ясно и просто. Управленец в этом случае почти целиком полагается на экспертов, знающих объект управления. И тот или иной уровень допущений фактически предлагают они. Но, не будучи специалистами по системам управления, эксперты не ^югyт оценить тот уровень полноты описания, который нужен специалисту по управлению. Ведь само описание, вычленение в нем тех или иных аспектов и особенностей тесно связано с задачей управления. И это не всегда может уловить человек, смотрящий на объект управления другими глазши — глазами технолога. Проиллюстрирую свою мысль примером разговора двух управленцев, двух превосходных летчиков Антуана де Сент Экзюпери и его друга Гийоме. Гийоме объясняет своему коллеге, как летать над Испанией из Франции в Африку: «Странный то был урок географии! Гийоме не преподносил мне сведений об Испании, он дарил мне ее дружбу. Он не говорил о водных бассейнах, о численности населения и поголовье скота. Он гово-
§ 1.2. НЕТРАДИЦИОННЫЕ ОБЪЕКТЫ УПРАВЛЕНИЯ 15 рил не о Гуадисе, но о трех апельсиновых деревьях, что растут на краю поля неподалеку от Гуадиса. «Берегись, отметь их на карте...» И с того часа эти три дерева занимали на ^юeй карте больше места, чем Сьерра-Невада. Он говорил не о Лорке, но о маленькой ферме возле Лорки. О жизни этой фермы. О ее хозяине. И о хозяйке. И эта чета, затерявшаяся на земных просторах за тысячу с лишним километров от нас, безмерно вырастала в моих глазах. Их дом стоял на горном склоне, их окна светили издалека, словно звезды,— подобно смотрителям маяка эти двое всегда были готовы помочь людям своим огнем... Так понемногу Испания на моей карте, под лампой Гийоме, становилась какой-то сказочной страной. Я отмечал крестиками посадочные плош,адки и опасные ловушки. Отметил фермера на горе и ручеек на лугу. Старательно нанес на карту пастушку с тридцатью баранами...» («Планета людей»). Это образец того, как один профессионал описывает объект другому профессионалу. Тут важно все: о чем говорится, с каким уровнем детализации, на каком языке. При работе управленца со сложным объектом самые большие сложности возникают при контактах с технологами, знающими данный объект. Несходство их взглядов на него иногда приводит к полному непониманию друг друга, в результате чего возникает неполнота описания, которым руководствуется проектировщик системы управления. Другая немаловажная причина неполноты описания объекта — незнание некоторых сторон функционирования его самим технологом. Некоторые ситуации, никогда не встречавшиеся им ранее, естественно, нельзя сообщить и проектировщику системы управления. Чаще всего это всевозможные аварийные ситуации. Для иллюстрации возможных последствий аварий вспомним катастрофу с энергетической системой США, происшедшую несколько десятилетий назад. Развал системы возник по вине системы управления. Автоматическое отключение линий и источников энергии при перегрузках привело к тому, что значительная часть страны лишилась электроэнергии, а это привело к огромным потерям. Другим примером может служить система управления большой ЭВМ, ее операционная система. Когда специалисты по ее проектированию в шестидесятых годах создавали мультипрограммные операционные системы с развитыми системами прерываний и приоритетов, то они вовсе не рассчитывали на ситуации, в которых система управления блокировала бы сама себя из-за невозможности выйти из прерываний. И в том, и в другом случае управленцев подвела неполнота описания функционирования объекта и влияния сигналов Ui на это функционирование. Третья причина неполноты описания — отсутствие у самого технолога четкого понимания функционирования объекта. Выдавая управлешху большое количество информации, он тем не менее не сообщает ему c.a^юй главной, по которой сам принимает penie- нпе о функционировании объекта. Делает он это не сознательно,
16 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ ибо «самая главная информация» может учитываться им только на уровне собственной интуиции. Мне вспоминается следующий случай, свидетелем которого я был. Всемирная организация здравоохранения (ВОЗ) распространила в ряде стран истории болезни нескольких больных из скандинавских стран. И попросила ведущих психиатров различных стран дать заочный диагноз заболевания на основании историй болезни. В СССР последние были размножены и разосланы значительному количеству специалистов. Через некоторое время они собрались все вместе в Москве для обсуждения своих диагнозов. Была составлена и вывешена для всеобщего обозрения сводная таблица, в которой для всех больных были указаны диагнозы. Это была удивительная таблица! Почти для каждого случая имелся разброс диагноза от «практически здоров» до «заболевание X в самой тяжелой форме». Авторы диагнозов выходили на трибуну и обосновывали свою точку зрения. Самым интересным было то, что, привлекая одни и те же данные из истории болезни, они приходили к почти противоположным выводам. Например, из того, что больной отказался входить в контакт с близкими и врачом, в одном случае следовал вывод о стремлении к изоляции, неконтактности, а в другом — о вполне адекватной данной ситуации форме поведения. Споры фактически прекратились после выступления одной очень уважаемой пожилой специалистки в области психиатрии. Она сказала, буквально, следующее: «Коллеги, о чем мы спорим? Ведь мы все знаем, что как только к нам на прием придет пациент, мы в первую же секунду определим — болен он или нет. Только мы не можем сказать, как это у нас получается». И все согласились с выступавшей. И, наконец, еще одна причина, приводящая к неполноте описания сложных объектов. Эта причина состоит в том, что многие особенности функционирования объекта, а иногда и его структуры не могут быть описаны количественно. Они допускают лишь качественное, словесное описание. Переход от качественных описаний к некоторым формальным представлениям должен производиться управленцем, который не всегда в состоянии решить такую сложную проблему. 6. Наличие свободы воли. Во многих объектах управления люди являются элементами их структуры. Это так называемые организационные системы. В отличие от всех других элементов, образующих объекты, люди функционируют в нем с учетом своих личных интересов и целей. Их интересы и цели могут значительно отличаться от того, что они должны делать с точки зрения ЛПР. Их индивидуальное поведение практически невозможно учесть при создании системы управления, и требуются специальные приемы для нейтрализации их воздействия на функционирование объекта управления. Иначе могут возникнуть ситуации вроде той, которая описана в следующем анекдоте.
§1.3. ПСИХОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ 17 § 1.3. Психологические предпосылки Психологи много внимания уделяли проблеме исследования поведения человека при решении возникающих перед ним задач. Было создано немало концептуальных схем, объясняющих особенности его поведения при решении различных по своему характеру задач. Рассмотрим три такие схемы, получившие наиболее широкое распространение и представляющие для нас интерес в рамках нашей книги. Самая грубая схема носит название стымульно-реактивной теории. В ее основе лежит представление об объекте управления как о «черном ящике». Внутренняя структура объекта непостижима для ЛПР. Наблюдению доступны лишь внешние входные сигналы, поступающие на объект (стимулы), и выходные сигналы объекта (реакции). Задача ЛПР состоит в том, чтобы, меняя значения входных сигналов и наблюдая за возникающим при этом изменением выходных сигналов, сказать что-то о Д т. е. об описании функционирования объекта. В психологии такой подход к изучению поведения человека носит название бихевиоризма. Он справедливо подвергся критике, ибо сводит весь процесс решения проблемы к методу проб и ошибок с постепенным накоплением вероятностной информации о целесообразном поведении в данной ситуации. Тем ие менее ряд систем управления может быть построен на основе этой весьма грубой теории. Ограничимся для иллюстрации этого утверждения всего одним примером. Пример 1.1. Рассмотрим объект, имеющий выходной канал и два входных канала и х.^. На входы х^ и х^_ могут подаваться сигналы двух типов 1 и О, что соответствует возбуждению и невозбуждению соответствующих входов. На выходе также могут появиться два сигнала О и 1, что соответствует невозбуждеиию и возбуждению выхода объекта. При фиксированном возбужденном входе случай, когда оба входа возбуждены, исключается; значение сигнала на выходе определяется распределением (р/; 1—р/), где i—1, 2. Другими словами, с вероятностью р/ на выходе объекта при возбужденном входе лг/ появляется сигнал О, а с вероятностью 1—pi — сигнал 1. Задача ЛПР состоит в проектировании такой системы управления, которая минимизировала бы случаи невозбуждения выхода объекта. Если бы значения р/ были ЛПР известны, то дело обстояло бы весьма просто. Пусть, например, для Xi распределение имеет вид (0,9; 0,1), а для х^ — вид (0,01; 0,99). Тогда совершенно ясно, что необходимо всегда возбуждать вход х^ и только его. При этом случаи невозбуждения объекта будут сведены к минимуму. Но в случае «черного ящика» информация о распределениях (р/; 1—р/) априорно неизвестна. Надо суметь построить такую систему управления, которая бы при любых заранее неизвестных распределениях добивалась бы успеха, минимизируя число невозбуждений объекта. Как это сделать, показано на схеме, приведенной на Некто Ху большой начальник, говорит подчиненным: «Я считаю, что должность А должен занять генерал в отставке в возрасте около 60 лет». Один из подчиненных радостно восклицает, что он знает такого человека. Но X явно недоволен. «Идиот,—■ шепчет на ухо выступившему его сосед,— он просто хочет посадить на это место своего приятеля». Суи;ествует еш.е несколько особенностей объектов нового типа, с которыми теория управления начала сталкиваться с конца пятидесятых годов нашего столетия. Но и сказанного, по-видимому, вполне достаточно для того, чтобы оценить необходимость в новом подходе к объекту управления при попытке создать систему, управляющую им. Но прежде чем мы перейдем к описанию, возможных путей решения этой проблемы, нам нужно совершить экскурс в психологию мышления.
18 ГЛ, I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ рис. 1.2. в качестве системы управления использован конечный автомат вероят- ностносО пита. Он работает следующим образом. Во всех состояниях левой группы автомат выдает на объект сигнал x-i, а во всех состояниях правой группы — сигнал х.у. Смена состояний автомата происходит с помощью анализа сигнала, jToCTynHBuiero от объекта после подачи на него того или иного входного сигнала. Если этот сигнал равен О, то происходит смена текущего состояния автомата по стрелке, приведенной на рисунке штриховой линией, или сохранение текущего состояния, что показано петлеобразной штриховой дугой. Выбор того или другого Анализатор Рис. 1.2 происходит равновероятно. Если выходной сигнал от объекта равен 1, то всегда происходит смена текущего состояния автомата в соответствии со сплошной стрелкой. Можно строго доказать, что подобный автомат с увеличением глубины памяти п будет, по мнению ЛПР, асимптотически стремиться к наилучшему функционированию. Но и без строгого доказательства это видно из структуры автомата. Пусть, например, объект описывается распределениями, приведенными выше: (0^9; ОД) и (0,01; 0,99). И пусть в начальный момент наш автомат находится в состоянии 2 левой группы. Он выдает на объект сигнал х^. С вероятностью 0,9 в ответ будет получен сигнал о том, что объект не возбудился. Тогда с вероятностью 0,5 автомат останется в состоянии 2 левой группы, а с вероятностью 0,5 перейдет в состояние / той же группы. Таким образом, с вероятностью 0,45 сохранится состояние 2 в левой группе, с такой же вероятностью возникает состояние / в левой группе и лишь с вероятностью 0,1 — состояние 3 в левой группе. На следующем такте работы автомат опять выдаст сигнал и снова с вероятностью 0,9 получит сигнал о невозбуждении объекта. Если он находился в состоянии / левой группы, то с вероятностью 0,45 это состояние сохранится, а с вероятностью 0,45 произойдет переход автомата в состояние / правой группы. Рассужде[1ия относительно остальных состояний левой группы, в которых мог находиться автомат, аналогичны. После двух тактов работы из начального состояния (состояние 2 левой группы) его очередным состоянием будет с вероятностью 0,2025 состояние I правой группы, с вероятностью 0,405 — состояние / левой группы, с вероятностью 0,2025 — состояние 2 левой группы, с вероятностью 0,09 — состояние 3 левой группы и с вероятностью 0,01 — состояние 4 левой группы. Легко посчитать, что с течением времени вероятность уйти в глубь левой группы будет все время падать, а вероятность перейти в правую группу — возрастать. Но как только автомат перейдет в правую группу и начнет выдавать сигнал х.-^г положение резко изменится. Теперь с вероятностью 0,99 на каждом такте работы он будет переходить в глубь состояний этой группы и лишь с вероятностями 0,005 сохранять свое текун^ее состояние или менять его, переходя влево. Очевидно, что с течением времени автомат обязательно попадет в правую группу состояний и практически при большом п никогда ее не покинет. Тем самым он найдет иравиль-
§1.3. ПСПХОЛОГИЧРХКИЕ ПРЕДПОСЫЛКИ 19 ный способ управления об1>ектом лишь на основании знания его выходных сигналов, ничего априорно не зная о внутренней структуре объекта. Несмотря на столь эффектный пример, следует все-таки отметить, что стн- мульно-реактнвная теория слишком слаба как для объяснения сложных форм поведения человека при решении задач, так и для использования подобного подхода в системах управления сложными объектами. Даже там, где поначалу казалось, что модели такого типа могут привести к успеху, в теории опознавания образов (наиболее популярная модель стимульно-реактивного типа в этой области — персептрон), оказалось, что отсутствие структурирования задачи (объекта) неминуемо приводит к непреодолимым трудностям. Научив, например, персептрон устойчиво отличать букву А от буквы Б и показав-ему сочетание АБ, мы поставим его полностью в тупик. Ибо сочетание АБ он не может расчленить на известные ему А и Б. Это сочетание выступает для него как абсолютно новый образ, никак не связанный с ранее усвоенными. Другая концепция, получившая значительное развитие в моделях решения задач человеком и оказавшая существенное влияние на развитие эвристического программирования для ЭВЛ\, носит название лабиринтной теории. Согласно этой теории перед человеком, принимающ.им решение, находится как бы лабиринт возможных путей. Используя некоторые локальные критерии, он выбирает то или иное продолжение движения в лабиринте возможностей. Особенность лабиринтной модели состоит в том, что человек видит лабиринт не целиком, а только в некоторой фиксированной окрестности площадки, где он находится. Иллюстрацией этого могут служить ситуации, складывающиеся в различных позиционных играх. Пусть разыгрывается некоторая шахматная партия. Любая позиция, сложившаяся в процессе игры на доске, есть площадка некоего лаби- зинта, коридорами которого являются все возможные ходы, допустимые в игре. >1так, мы находимся на некоторой площадке. Игрок, собирающийся сделать очередной ход, имеет возможность выбора любого хода (коридора лабиринта), допустимого в данной позиции. Если бы он видел лабиринт с высоты птичьего полета, то он мог бы наметить последовательность ходов, ведущую к матовой позиции или к ничьей. Но для человека это исключено. Он может мысленно экстраполировать развитие партии только на несколько ходов вперед, учитывая возможные ответные ходы противника. А это означает, что он может проанализировать лишь некоторую часть лабиринта, некоторую окрестность той площадки, где он сейчас находится. И он должен сделать выбор на основе этой локальной информации. Поэтому правила, которыми игрок руководствуется при выборе хода, неточны, эвристичны. Его выбор не обязательно приведет его к положению, которое приближает для него победу в игре. Он может допустить ошибку, чего-то не учесть вне анализируемой окрестности лабиринта. Точное решение в лабиринтной модели достигается только тогда, когда удается проанализировать весь лабиринт. Пример такого положения — игра в крестики- нолики на поле 3x3. Недаром ею увлекаются малыши. Они еще не сообразили, что можно априорно проанализировать все пути развития игры и всегда выигрывать, если противник допускает ошибку. При безошибочной игре крестики-нолики всегда заканчиваются ничьей. Л\алые конечные лабиринты приводят к модели решения задачи, имитируемой конечными автоматами. Любая площадка лабиринта соответствует некоторому состоянию автомата, а коридоры — переходам автомата из состояния в состояние под воздействием входного сигнала и с учетом того состояния (той площадки лабиринта), где автомат сейчас находится. Входной сигнал имитирует те решения, которые принимает ЛПР при выборе коридора лабиринта. При этом ЛПР может создать систему управления объектом также в виде некоторого конечного (детерминированного или вероятностного) автомата. Подобная схема управления показана на рис. 1.3. На нем V и V" отражают обратные связи, характеризующие память автоматов, имитирующих объект управления и систему управления. Если ЛПР структ\ра автомата, имитирующего объект, полностью известна (т.е. известен автоматный граф смены состояний п формирования выходных сигналов), то обратная связь от объекта к системе управления не нужна. Поэтому она показана штриховой линией.
20 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИ51 г Объект и Необходимость в ней возникает только тогда, когда в процессе работы нужно производить «настройку» автомата, имитирующего систему управления, из-за неполного априорного знания об объекте управления. По сравнению со схемой на рис. 1.1 здесь нет входов, характеризуемых вектором Это соответствует тому, что в лабиринтной теории поведения предполагается, что влияние этих не поддающихся измерению параметров можно описать некоторой вероятностной схемой связи между вектором (X, U^) и вектором У. Пример 1.2. Проиллюстрируем схему, показанную на рис. 1.3, для конкретного примера. Для этого выберем простейшую схему условного рефлекса с двумя раздражителями: безусловным и условным х.2. Как известно, при поступлении на вход схемы безусловного раздражителя должна быть выдана некоторая фиксированная реакция — сигнал у. При подаче на вход схемы только условного раздражителя необученная схема сигнала у выдавать не должна. Пусть в течение некоторого числа тактов (некоторого времени) на вход схемы подаются одновременно два сигнала: и Xg. Тогда через опредаченное время должен возникнуть условный рефлекс. Он заключается в том, что при подаче на вход схемы только сигнала дг^ он^ все-таки выдает сигнал у, т. е. реагирует на условный раздражитель, как собака в опытах И. П. Павлова, которая после долгого кормления одновременно со звонком начинает выделять желудочный сок при наличии звонка. Если теперь некоторое число тактов на вход схемы подается только сигнал х^_, то возникает явление угасания условного рефлекса. Через какое-то число тактов рефлекс должен исчезнуть и наступит такой момент, что подача х^^ на вход схемы не вызовет сигнала у на ее выходе. На рис. 1.4 показана схема вероятностного конечного автомата, которая имитирует^ описанный процесс. Автомат состоит из трех блоков: логического L Cucmeria управления h \ : Рис. 1.3 Датчик Рис. 1.4 блока ЛБ, магазинной памяти и датчика, на выходе которого появляется си1нал \, принимающий с вероятностями ^/з значения —1,0, 1. Автомат работает следующим образом. В начальный момент память-магазин пуста. Пусть глубина магазина есть п. Если на вход автомата поступает только сигнал х^, то на выходе ЛБ по-
§ 1.3, ПСИХОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ 21 является сигнал у и содержимое магазина не меняется. Датчик при наличии только не срабатывает. Если на вход автомата поступили два сигнала х^ и Х2, то ЛБ выдает сигнал у. Кроме того, в магазин передается сигнал s^, вызывающий появление единицы на самом нижнем уровне магазина. При повторении комбинации сигналов дг^ и х.^ сигнал Si сдвигает эту единицу каждый раз на одну ячейку магазина вверх. При комбинации сигналов Xi и Х2 срабатывает и датчик случайных сигналов. При ^=0 он не оказывает никакого действия на запись в магазине. При 1 он выдает сигнал, заставляющий единицу в магазине сдвинуться еще на одну ячейку вверх. Наконец, при ^ — — 1 сигнал от датчика заставляет единицу в магазине сдвинуться на одну ячейку вниз или исчезнуть из магазина, если единица находилась на самом нижнем его уровне. При поступлении на вход автомата только сигнала Х2 происходит следующее. Если единица в магазине находится выше некоторого уровня /п, то магазин вырабатывает сигнал q, который формирует на выходе ЛБ сигнал у. Если же уровень т в магазине не достигнут, то сигнал q не выдается и на выходе автомата нет сигнала у. Кроме того, при наличии только л'з ЛБ выдает в магазин сигнал s^, заставляющий единицу в магазине опуститься на одну ячейку вниз. Датчик при наличии только Х2 работает так же, как и при наличии Xi и х^. Таким образом, положение единицы в магазине характеризует степень обу- чениости автомата условному рефлексу. Уровень т есть порог рефлекса. Меняя его, можно имитировать различные предрасположенности системы к установлению рефлекса. Датчик вносит необходимую вероятностную компоненту. Но так как математическое ожидание ^ равно нулю, то он не вносит в процесс систематических искажений. Как следует из рис. 1.3, мы предполагаем, что имитирующий автомат и объект описываются одинаковыми (с точностью до вероятностных реализаций) процессами функционирования. Другими словами, схема эта как бы обратима. И подопытное животное может рассматривать себя в качестве экспериментатора, устанавливающего условный рефлекс у истинного экспериментатора (ЛПР). Ситуация эта хорошо отражена в следующем анекдоте. В клетке находятся две подопытные обезьяны. В комнату входит научный сотрудник, экспериментирующий с обезьянами. В этот момент одна обезьяна говорит другой: «Посмотри, чему я научилась. Сейчас я дерну за веревку, зазвенит колокольчик, и этот чудак даст мне банан. Правда, получилось это не сразу. Пришлось с ним поработать.» Однако в большинстве практически интересных случаев ЛПР не стремится к тому, чтобы система управления имитировала объект управления. В этом нет никакой необходимости. Как правило, систему управления можно сделать проще объекта, которым она управляет. Например, нетрудно показать, что с усложнением объекта имитации — с переходом от простейшей схемы условного рефлекса к цепочкам таких рефлексов и сетям условных рефлексов, способным моделировать весьма сложные поведенческие акты,— система управления, воспроизводящая их особенности, останется таким же конечным автоматом, который был использован в примере 1.2. Но что де.аать, если лабиринт оказывается слишком большим? Или вообще бесконечным. Например, мы играем в крестики-нолики на неограниченном поле с условием, что / одинаковых крестиков или ноликов (/ выбирается по договоренности) в горизонтальных или вертикальных рядах или на диагонали приводят к выигрышу. Такой лабиринт нельзя отобразить в схему конечного автомата, В этом с^1учае можно воспользоваться гипотетическим устройством, легко имитируемым на ЭВМ, которое носит название «Общий решатель задач-» (ОРЗ). Его функционирование протекает следующим образом. Пусть мы имеем некоторую начальную площадку лабиринта. Эту площадку (текущую ситуацию) можно как-то описать. Если снова привлечь в качестве примера шахматную игру, то описание начальной площадки может заключаться, например, в том, что в нем будут перечислены все фигуры, имеющиеся на доске, с указанием полей, на которых они находятся. А описание конечной площадки также будет описанием некоторой позиции на шахматной доске. И цель состоит в поиске такой последовательности ходов, которая постепенно преобразует исходное описание в желаемое (целевое). Для
/ 22 гл. i. ПРИНЦИПЫ ГИТУАЦНОПНОГО УПРАВЛЕНИЯ преобразования описаний используются специальные операторы из некоторого фиксированного списка, хранящегося в ОРЗ. Условие их применения формируется на основе системы различий и приоритетов различий. Каждые два несовпадающих описания в чем-то различаются между собой. Это фиксируется в ОРЗ в виде некоторого типового различия. Например, в шахматной игре одна позиция от другой может отличаться набором фигур на доске или их положением на игровых полях. Приоритет различий задает локальные правила выбора. Они определяют, какие различия требуется устранить в первую очередь. Такая приоритетность различий позволяет ОРЗ на каждом шаге его работы выбирать для применения те операторы (выбирать коридоры в лабиринте), которые устраняют наиболее приоритетные различия. При нескольких операторах, способных устранить определенное различие, в ОРЗ может быть задан и набор приоритетов для операторов. Проиллюстрируем работу ОРЗ на примере, который понадобится нам и в дальнейшем. Пример 1.3. Игра в 5 есть усеченный вариант игры в 15, которой, наверное, увлекались многие читатели. Игра Рис. 1.5 происходит на поле 2x3 (рис. 1.5), на котором расположено пять фишек с цифрами от / до 5. Одно иоле остается свободным. Требуется перевести фишки из начального расположения (например, показанного на рис. 1.5) в некоторое заранее заданное положение (например, в положение, при котором все фишки стоят по порядку, а правая нижняя клетка свободна). Введем теперь различия между позициями этой игры и операторы устранения различий. Можно, например, считать, что позиции имеют элементарное различие, если в соответствующих клетках поля стоят разные фишки, а различием двух позиций считать сумму элементарных различий, которыми они характеризуются. Тогда позиция, показанная на рис. 1.5, будет отличаться от целевой позиции на 4 единицы, так как фишки с номерами 4и 5 уже стоят на тех местах, которые требуются для целевой позиции. Но такое определение различий не слишком удобно для решения поставленной задачи. Если, например, в позиции на рис. 1.5 поменять местами фишки с номерами 3 и 2, то различие сохранится, но нет уверенности, что исходная позиция и вновь полученная ('одинаково далеки» (в смысле числа необходимых преобразований) от целевой позиции. Более удобно ввести различие через суммарное число транспозиций, необходимых для перевода текущей ситуации в целевую. (Транспозиция — это перестановка двух соседних фишек или сдвиг фишки на пустое поле.) Например, для того чтобы фишка с номером 2 стояла там где надо, требуется одна транспозиция — передвижка ее на одно поле вправо. Для фишки с номером / требуется две транспозиции, а для фишки с номером 3 — одна. Как уже говорилось, фишки с номерами 4 и 5 уже стоят на своих местах. Тогда суммарное отличие начальной позиции от целевой будет равно 4 единицам. Но если фишки с номерами 2 и 3 поменять местами, то различие в транспозициях будет другим (в отличие от того, что было при другом определении различия, приведенном ранее). При таком изменении различие будет равняться 6 единицам. Другими словами, вновь полученная позиция будет отстоять от целевой на большее расстояние, чем исходная. Для устранения различий в рассматриваемой игре можно использовать операторы четырех типов: сдвинуть на свободное поле нижнюю, верхнюю, левую, правую фишки. В конкретной позиции можно использовать не все операторы. При свободном иоле в середине — три из четырех, а при свободном угловом поле — два из четырех. Выбор того или иного оператора определяется их приоритетностью. Приоритетность, в свою очередь, определяется тем, насколько данный оператор уменьшает различие. Например, в той позиции, которая изображена на рис. 1.0, нет смысла двигать фишку с номером 5 (применять оператор «сдвинуть на свободное поле нижнюю фишку»), так как это приведет к увеличению различия. Применение же операторов: «сдвинуть на свободнее поле левую фишку» и «сдвинуть на свободное поле правую фишку» здесь равноправно. Применение любого из них vMeiibOjaeT отличие данной пози1Ши от целевой на одну единицу. Пример 1.3 демонстрирует одну важную особенность ОРЗ. Планы решения, которые строит ОРЗ, обладают свойством монотонности. На каждом шаге рсшс-
§1.3. ПСИХОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ 23 ПИЯ долж[[о ириисходить улу'шюггис, приближение к цели. Именно это своГгство и оказалось роковым дли ОРЗ и подобных ему программ и систем. Можно привести следующую аналогию из математики. ЛАетод градиента позволяет находить экстремум функции только при условии, что эта функция имеет один экстремум. Тогда возможно монотонное движение к экстремальной точке. Но в большинстве случаев экстремумов у функции несколько. Тогда метод градиента, последовательно «улучшающий» значения функции, может завести нас в любой локальный экстремум, который окажется для нас ловушкой. Куда бы мы ни двигались из данной точки с заданным шагом градиента, везде нас ожидает неудача, ибо значения функции во всей доступной нам окрестности «хуже» того, которое соответствует точке, в которой мы находимся. Для поиска глобального экстремума в теории оптимизации придумано немало приемов: изменение градиентного шага, движение «вдоль оврага» и т. п. В системах типа ОРЗ также построены некоторые приемы улучшения планов решения. Например, переход от исходного лабиринта к более простому, более грубому. Планирование движения сначала по нему, а потом уточнение этого плана на исходном лабиринте, причем при монотонности грубого плана уточненный план может стать немонотонным. Но, к сожалению, пока не удалось найти хорошие процедуры для построения грубых планов. А пока это не сделано, нельзя надеяться на построение хороших моделей принятия решений. Но у лабиринтной теории есть куда более важный недостаток, чем свойство монотонности, присущее практически всем процедурам движения по лабиринту. Этот недостаток заключается в априорной задаиности лабиринта или способа его построения. Но откуда берутся эти сведения? В терминах, принятых в п. 1,1, это •означает, что ЛПР знает / и ему нужно лишь построить процедуру управления. Но мы уже говорили, что создание описания объекта управления — задача не только более сложная, чем нахождение самой процедуры управления, но и не имеющая пока каких-либо стандартных приемов решения. При решении различных задач, при принятии решений мы всегда сталкиваемся с двумя случаями. Либо перед нами задача, которую, в принципе, мы умеем решать "и надо только найти решение данной конкретной задачи, либо мы сталкиваемся с совершенно неясной для пас проблемой, для которой даже неизвестно, с чего начать. Вот ребенок пробует сложить из кубиков то, что нарисовано на картинке. Если в коробке всего шесть кубиков, на сторонах которых что-то нарисовано, то его лабиринт весьма велик — можно сложить более 48 тысяч комбинаций. Но маленький ребенок справляется с таким громадным лабиринтом. Ибо он не складывает кубики хаотично, а соотносит их с концевой площадкой лабиринта, выбирая для каждого кубика одну верную грань из шести. В этой задаче лабиринт налицо. Раз научившись что-либо складывать, ребенок уверенно выполняет аналогичную работу для других кубиков, даже если число их значительно больше шести. Но вот перед ним другая задача. Обратимся к рис. 1.6. На нем изображена карта острова. На ней отмечены города и связывающие их железные дороги. Мистер Браун живет в городе А, находящемся на севере острова. Во время отпуска он поставил перед собой следующую задачу: не пользуясь шоссейными дорогами и автомобилем, проехать из города Л в I ород Я, посетив по пути все города, отмеченные на карте, ровно по одному разу. Разрешима ли эта задача? Лабиринт перед вами. Остается только пробовать. Прежде чем читать дальше, попробуйте. Теперь вам стало ясно, что решение, по-видимому, не существует, но мистер Браун рецикл поставленную перед собой задачу. Как он это сделал? По-видимому, он кое-что слышал о лабт^ринтной и модельной теориях мышления, а скорее всего, обошелся без них, не зная, что он «говорит прозой». Он знал, что задача разрешима. Для этого достаточно воспользоваться тем, что между городами В и Щ можно проехать морским путем, на который нет запрета в условии задачи. Тогда поставленная задача разрешима. Если вы сами догадались о подобном решении, то вы испытали инсайт (озарение), чувстио радостного изумления от найденного решения. При этом от лабиринта, навязанного чертежом, приведенным на рис. 1.6, вы сумели перейти к новому лабиринту, построенному вами.
24 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ В рассмотренной задаче подсказка о новом лабиринте содержалась в чертеже. Города В \\ Щ стоят на море. Но подобная подсказка может и отсутствовать. Такое положение имеется в весьма популярной в психологических экспериментах головоломке «не ломая и не сгибая спичек, сложить из шести спичек четыре одинаковых равносторонних треугольника». В эксперименте все шесть спичек кладутся перед испытуемым на стол, что задает лабиринт всевозможных положений шести спнчек на плоскости стола. Испытуемые делятся на две группы. Те, кто относится к первой группе, подвигав спички и убедившись, что задача не решается (в данном лабиринте!), отказываются от ее решения, считая, что их попросту надули. Испытуемые второй группы начинают пытаться выяснить условия, при которых решение задачи возможно. И вознаграждаются за усилия тем, что строят новый лабиринт возможностей — пространственный. В нем легко решают поставленную экспериментальную задачу, сооружая правильную треугольную пирамиду. Можно считать, что в какой-то мере лабиринтная модель описывает поведение человека при решении задач, когда им используется стандартная шаблонная модель, найденная ранее им самим, или сообщенная ему учителем, или почерпнутая им из книг и учебников. Итак, кроме поиска по лабиринту возможностей для человека при решении нетривиальных проблем весьма важна процедура поиска самого лабиринта (или его части), в котором можно найти необходимое решение. В процессе решения задачи он должен сформировать этот лабиринт, а затем уже искать решение. Именно нахождение такого лабиринта вызывает у человека поток положительных эмоций, «радость открытия». Сформулированное нами положение о двухэтапности решения любой задачи является краеугольным камнем третьей психологической теории решения задач — модельной теории. В рамках этой теории всякое решение некоторой проблемы состоит из последовательности нескольких шагов: описание исходной позиции задачи, описа- ние целевой позиции задачи, установление гомоморфизма между этими описаниями или сведение их к одинаковому языку описания, установление системы преобразований описаний, поиск последовательности преобразований, ведущих от начальной позиции к целевой. Лишь последний шаг отражен в лабиринтной модели решения задач, первые четыре шага в ней считаются уже реализованными. Рассмотрим суть первых четырех этапов. На этапе описания исходной позиции можно поступать по-разному. Для иллюстрации этого опять обратимся к шахматам. В некоторой шахматной позиции можно, как уже говорилось, описать положение каждой фигуры на игровом поле. И это описание будет полным и исчерпывающим. Но шахматист вряд ли использует его для поиска своего хода. Оно для него слишком далеко от способа описания целевой йозиции. В самом деле, окончательная позиция в шахматной игре не описана в терминах расположения конкретных фигур на полях доски. Она описана в других терминах, типа «Король противника находится под ударом, не может покинуть клетку, где он находится, так, чтобы перейти на клетку, не находящуюся под ударом, и не может другими фигурами ликвидировать угрозу взятия короля». Это означает, что описание ис- Рис. 1.6
§ 1.4. В ЧЕМ СОСТОИТ СИТУАЦИОННОЕ УПРАВЛЕНИЕ? 25 ходной позиции, которое мы приняли, и описание конечной позиции (описание патовой позиции производится в тех же терминах, что и описание мата) не гомоморфны друг другу. Они не лежат в пределах одного лабиринта. И именно в этом состоит психологическая трудность решения шахматных задач для неопытных шахматистов. Опытные же шахматисты описывают исходную позицию на языке того же уровня, что и язык, использованный для описания заключительной позиции. Так вместо отдельных фигур и ходов появляются связки, вилки, сдвоенные и проходные пешки, форсированные ходы и многое другое. В шахматах нет нужды искать систему преобразовании описаний. Она определена правилами игры. Но во многих случаях это необходимо делать. На соревнованиях кондитеров, которые должны приготовить торт из заданного для всех одинакового набора исходных компонент, каждый участник соревнования формирует свою систему «преобразования позиций». И насколько успешно он это сделает, настолько успешен будет результат его работы. Заканчивая этот экскурс в пcиxOv^oгию решения задач человеком, остановимся еще на одном важном для нас вопросе. До сих пор мы рассматривали решение задач человеком в статике, вне времени и пространства. Но для реальных объектов управления такое ограничение вряд ли возможно. Как правило, решения по управлению принимаются с учетом динамики функционирования объекта управления. Что по этому поводу может сказать нам психология? При наблюдении за поведением людей, занятых управлением динамическими объектами, психологи выявили определенные принципы, которыми люди руководствуются при принятии своих решений. И основной вывод заключается в том, что при решении управленческих задач, в которых учитывается динамика процессов в объекте, человек строит их динамическую модель. Они как бы протекают у него в уме, сохраняя относительный временной масштаб частей процессов. В зависимости от «удаленности» управленца от процесса управления динамическая модель может быть различной. Если дежурный на железнодорожной сортировочной горке, который управляет перемещением локомотивов и вагонов с помощью стрелок, видит всю пространственную картину перемещений непосредственно, то дежурный по станции воспринимает ее с помощью мнемосхемы, а поездной диспетчер — лишь по графику движения поездов, вычерчиваемому по дискретным сообщениям, поступающим к нему. Таким образом, динамическая модель процесса на сортировочной горке не требует от дежурного специальных способов отображения кроме тех, которые связаны с непосредственным наблюдением за реальным положением вещей. Дежурный по станции непосредственно наблюдать и оценивать может только то, что видно из окна помещения, где он находится. Остальная информация является опосредованной, она отражена на мнемосхеме. Поэтому развитие процессов частично происходит как бы в его голове. Он вынужден интерполировать и экстраполировать это развитие. В наибольшей степени интерполяция и экстраполяция процессов происходит в голове поездного диспетчера или дежурного по отделению железной дороги. В его голове как бы отражается в реальном масштабе времени процесс перемещения поездов на участке, которым он управляет. У опытных дежурных и диспетчеров такое протекание процессов на объекте управления отражается как бы «само собой», вне активного сознания. Поступающие к диспетчеру или дежурному словесные сообщения перекодируются им на уровень представлений, характерных для имитационной модели, работающей в его голове. § 1.4. В чем состоит ситуационное управление? Итак, при работе с объектами, с которыми столкнулась сейчас теория управления, по-видимому, не приходится надеяться на возможность использования для управления ими традиционных методов и приемов. Как уже выяснилось, проблема состоит в самом описании уникального объекта управления, учета в этом описании
26 ГЛ. 1. ПРИНЦИПЫ СИТУЛЦИОШЮГО ^-ПРАВЛЕНИЯ не только его специфической структуры и функционирования, но и поведения людей, и возможностей эволюции объекта во времени. Требуется создать такой подход, который на едином языке давал бы возможность описывать как объект управления и его функционирование, так и процедуру управления им. Рассмотрим сначала постановку задачи управления, в схему которой укладываются все известные сегодня задачи управления сложными объектами. Определение 1.1. Будем называть текущей ситуацией на объекте управления совокупность всех сведений о структуре объекта управления и его функционировании в данный момент времени. Определение 1.2. Будем называть полной ситуацией совокупность, состоящую из текущей ситуации, знаний о состоянии системы управления в данный момент и знаний о технологии управления. В этих двух определениях многое нуждается в уточнении. Но на концептуальном уровне изложения, по-видимому, достаточно того их понимания, которое было дано выше. Будем обозначать полные ситуации через Si (i есть отличительный номер ситуации), а текущие ситуации — через Qj (j есть отличительный номер ситуации). Пусть в распоряжении системы управления имеется п различных способов воздействия на объект управления (одноша- говых реилений). Каждое такое решение мы будем обозначать как {k есть отличительный номер воздействия). Элементарный акт управления можно представить в следующем виде: Смысл этого соотношения заключается в следующем. Если на объекте управления сложилась ситуация Qj и состояние системы управления и технологическая схема управления, определяемые Si, допускают использование Еоздействия t/^, то оно применяется, и текущая ситуация Qj превращается в новую ситуацию Q/. Подобные правила преобразования в дальнейшем называются логико- трансформационными правилами (ЛТП) или корреляционными правилами. Полный список ЛТП задает еозможности системы управления Еоздействовать на процессы, протекающие в объекте. Очевидно, что в силу конечности числа различных воздействий все множество возможных полных ситуаций как-то распадается на п классов, каждому из которых будет соответствовать одно из возможных воздействий на объект управления. Другими словами, должны существовать такие процедуры, которые позволили бы классифицировать полные ситуации так, чтобы из них можно было образовать столько классов, сколько различных одношаговых решений есть в распоряжении системы управления. Эти процедуры можно назвать процедурами классификации. Если для не-
§ i.l. в ЧЕМ СОСТОИТ СНТУЛЦИОИНОН УПРАВЛЕНИЕ? 27 текущрй Анализатор Класси(рикатор Норрелртор J Smok с/гу^аишго выбора которых полных ситуаций невозможно в силу не слишком хорошего знания как объекта, так и влияния воздействий на него, указать единственное одношаговое решение, то можно пока включить эту ситуацию в несколько классов. Но из-за такого пересечения классов возникнет задача выбора того или иного решения из числа возможных для данной полной ситуации. Для осуи;ествления подобного выбора нужны специальные процедуры экстраполяции последствий принятия того или иного решения. С их помощью можно на основании знаний об объекте управления и его функционировании заранее оценить результаты применения выбранного воздействия и сравнить полученные прогнозы для всех возможных для данной полной ситуации воздействий. Если все указанные процедуры оказалось возможным построить, то об- ш,ая схема решения задачи управления выглядела бы так, как показано на рис. 1.7. Описание текуш^ей ситуации, сложившейся на объекте управления, дается на вход Анализатора. Его задача состоит в оценке сообш^ения и определения необходимости вмен1ательства системы управления в процесс, протекаюи;ий в объекте управления. Если текущая ситуация не требует такого вмешательства, то Анализатор не передает ее на дальнейшую обработку. В противном случае описание текущей ситуации поступает в Классификатор, Используя информацию, хранящуюся в нем. Классификатор относит текущую ситуацию к одному или нескольким классам, которым соответствуют одношаговые решения. Эта информация передается в Коррелятор, в котором хранятся все ЛТП. Коррелятор определяет то ЛТП, которое должно быть использовано. Если такое правило единственное, то оно выдается для исполнения. Если же таких правил несколько, то выбор лучшего из них производится после обработки предварительных решений в Экстраполяторе, после чего Коррелятор выдает решение о воздействии на объект. Если Коррелятор или Классификатор не могут принять решения по поступившему описанию текущей ситуации, то срабатывает Блок случайного выбора и выбирается одно из воздействий, оказывающих не слишком большое влияние на объект, или же система отказывается от какого-либо воздействия на объект. Это говорит Возд(?йстбие на одъект Рис. 1.7
28 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ о том, что система управления не располагает необходимой информацией о своем поведении в данной ситуации. Фактически из-за сложности объектов управления, которыми мы занимаемся, нет надежды на то, что исходные знания о них и способах управления ими будут достаточно полны. Поэтому система управления подобного типа принципиально должна быть открытой системой. Она должна иметь возможность корректировать свои знания об объекте и методах управления им. В работе такой системы управления имеется как бы два этапа: этап обучения и настройки и этап работы. В начальный период, когда система управления только еще создается, собираются многочисленные сведения от технологов, хорошо знающих объект управления. С их помощью формируются классы ситуаций и ЛТП. Они определяют целесообразность использования тех или иных воздействий на объект управления в той или иной ситуации. При этом мнения экспертов могут не совпадать, что и приводит к попаданию одной и той же ситуации в различные классы по управлению. С помощью экспертов формируются и процедуры экстраполяции, способы оценки ситуаций, исходящие из желаемого функционирования объекта управления. Это означает, что на первом этапе в проект системы закладывается значительное количество субъективной информации об объекте управления и процедурах управления им. Это как бы коллективный опыт тех людей, которые — хорошо или плохо — справлялись со своими обязанностями при управлении объектом. Здесь важно, что при проектировании системы желательно учитывать самые, на первый взгляд, незначительные сведения об объекте. Зачастую оказывается, что именно такие побочные знания играют большую роль в принятии решений по управлению объектом. После этапа накопления знаний и формирования процедур в блоках, показанных на рис. 1.7, система может начинать работать. Но в процессе своей эксплуатации, особенно на первых порах, она будет довольно часто принимать неверные решения из-за неполноты информации и неточности процедур. Во всех этих случаях необходим! этап дообучения системы управления. Отметим одну важную особенность рассматриваемого класса систем. Число различных полных ситуаций обычно весьма велико. Возможно, что их заранее и нельзя перечислить. А число решений конечно и невелико. Другими словами, чаще всего где, как всегда, \А\ означает число элементов, входящих в множество А. Находясь за рулем автомобиля, водитель воспринимает огромное число полных ситуаций, определяемых внешней обстановкой на пути движения и состоянием автомобиля. А число принимаемых им одношаговых решений невелико. Регулировщик на перекрестке сводит все множество ситуаций в окрестности перекрестка к двум одношаговым решениям по переключению сигнала
§ {.А. В ЧЕМ СОСТОИТ СИТУАЦИОННОЕ УПРАВЛЕНИЕ? 29^ светофора в некотором фиксированном направлении. Секретарь, находящийся в приемной большого начальника, мгновенно оценивает полную ситуацию и принимает одно из трех решений, выражаемых, обычно в стандартных словах «Проходите, пожалуйста», «Подождите, сейчас он занят», «К сожалению, Его нет и сегодня не будет». Чем больше число возможных ситуаций и чем меньше число допустимых одношаговых решений, тем эффективнее выглядит работа схемы управления, которую мы показали на рис. 1.7. Но и тогда, когда ^ можно применить подобную схему. Хотя ее эффективность в таком случае и не будет очень высока, но, возможно, что это единственный путь управления объектом. Метод управления, который в обш,их чертах мы описали, основан на введении понятия ситуации, классификации ситуаций и их преобразовании. Естественно поэтому назвать его методом ситуационного управления, ибо, в противовес к эпиграфу данной главы, в русском языке слово, определяюш,ее суть описываемого подхода, фактически единственное. И лишь большой интерес к методам управления подобного типа породил в последнее время ряд названий методов, частично более широких, а частично и более узких по сравнению с тем, что вкладывается в понятие метода ситуационного управления (семиотическое моделирование, семиотическое управление, логико-лингвистические методы управления и т. п.). Сформулируем теперь ряд особенностей, присущ^их методу ситуационного управления. 1. Ситуационное управление требует больших затрат на создание предварительной базы сведений об объекте управления, его функционировании и способах управления им. Эти затраты оправданы только тогда, когда традиционные пути формализации описания объекта управления и процедуры управления реализовать невозможно. Другими словами, если объект управления таков, что адекватно описывается, например, системой линейных дифференциальных уравнений первой степени с постоянными коэффициентами, то нет никакой нужды использовать метод ситуационного управления. Это оправдано лишь тогда, когда традиционная формализация приводит к задаче такой размерности, что ее практическое решение известными методами невозможно — например в случае, когда число уравнений в системе составляет несколько десятков тысяч. 2. Описание ситуаций, складывающихся на объекте управления (текущих ситуаций), должно быть произведено на таком языке, в котором отражались бы все основные параметры и связи, необходимые для классификации этого описания и сопоставления ему одношагового решения по управлению. При этом необходимо правильно выбрать уровень описания, который не должен быть
3(1 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРЛВЛЕРП^Я tin слишком подробным, ни слишком грубым. При слишком подробном описании возникает «шумовой эффект», частности и несу- ш,ественные для управления факты и явления могут сильно усложнить понимание сути функционирования объекта и сделать построение системы управления невозможным. Этот случай можно проиллюстрировать следуюи;им примером. Некто, никогда не видевший игры в футбол описывает свои впечатления от игры другому лицу, также не имеюш,ему представления об этой игре, следуюи;им образом: «двадцать два человека, одиннадцать из которых одеты в одну форму с номерами на спине, а одиннадцать других — в другую форму, также с номерами на спине, перемещаются по полю, которое имеет следующие особенности (следует точное и подробное описание поля и его разметки). Каждый из играющих может перемещаться по следующим, по-видимому, связанным с его номерами траекториями (следует формальное описание динамики перемещения игроков по полю). Иногда вместе с перемещением игроков перемещается круглый предмет (следует описание мяча), но с некоторой вероятностью осуществляется передача этого предмета от одного играющего к другому или вывод его из поля игры (следует описание вероятностного процесса передачи мяча). В последнем случае специальные игроки возвращают мяч на поле по некоторым траекториям (следует описание динамики вбрасывания мяча). И т. д.». Возникает вопрос: сможет ли слушающий уловить в этом научном изложении, достаточно точно описывающем наблюдавшийся матч, суть игры в футбол? Думаю, что это весьма затруднительно. А если бы футбольный матч был описан на уровне языка статистической физики (что тоже принципиально возможно), то что тогда можно было извлечь из этого описания? 3. Язык описания ситуаций должен позволять отражать в нем не только количественные факты и соотношения, характеризующие объект управления, но и качественные знания, которые не могут быть формализованы в обычном математическом смысле. Ведь большинство сведений, которые управленец будет получать от технолога, будут иметь примерно такой вид: «в большинстве случаев я думаю, что надо делать X, если имеет место К»; «мне кажется, что в ситуации X хорошо было бы сделать Z», «когда X растет, то, как правило, Y убывает, но не очень сильно» и т. п. И надо научиться отражать эти качественные высказывания на языке описания ситуаций. Следует также учитывать, что высказывания человека об объекте и способах управления им неполны. Нужны специальные приемы для получения от него всей той информации, которая нужна для принятия решений по управлению (вспомним случай с диагностикой психических заболеваний, когда на самом деле истории болезней не содержали информации). Известная детская задача: «в движущемся поезде, состоящем из 40 вагонов, три из которых пассажирские, а остальные товарные, имеется три
§1.1. в ЧE^\ состоит ситуационное управление? 31 проводника и один охранник; требуется узнать сколько лет машинисту» — иллюстрирует сказанное. 4. Классификация ситуаций, объединение их в классы при использовании одношаговых решений происходит на субъективной основе, ибо первоначальная информация о соответствии той или иной текуш,ей ситуации тому или иному решению получается от экспертов. Система как бы суммирует знания отдельных экспертов и становится носительницей коллективного опыта людей. Однако процедуры классификации должны быть построены таким образом, чтобы сама классификация годилась бы для тех текуш,их ситуаций,, о которых система не получила информации от экспертов. Это приводит к тому, что задача классификации становится аналогичной задаче формирования понятий на основе обучаюи;их последовательностей. Система, сформировав некоторое понятие, обладает уже большими знаниями, чем те, которые были заложены в нее вначале эксперталш, хотя эти дополнительные знания могут оказаться и неверными, что может выявиться в процессе ее эксплуатации. Таким образом, в системе могут появляться «предрассудки», неверные представления и неправомерные обоби;ения. Она может вести себя, как жени;ина, которая говорит в разговоре: «знаю я вас. Все мужчины лгут». А на ехидный вопрос «вы что же, имели дело со всеми мужчинами?», простодушно отвечает: «да, была знакома с одним вроде вас...». 5. Аналогичные слова можно сказать и о формировании ЛТП. Они первоначально также получаются с помош,ью информации, сооби;аемой экспертами. Уточнение этих правил, уничтожение противоречий в них и формирование новых ЛТП происходят уже в процессе эксплуатации системы. Все это верно и для правил экстраполяции и для оценки тех или иных текуи;их ситуаций. 6. Из двух последних пунктов вытекает принципиальный вывод о том, что системы ситуационного управления не могут оптимизировать сам процесс управления. Они ориентированы лишь на такое управление, когда достигнутые результаты будут не хуже лучи]их результатов, которые ^юг бы получить человек. Однако, как 1Ю- казала практика применения систем подобного типа, чаш,е всего результаты, выдаваемые систе]\юй, лучше человеческих. Это происходит по ряду причин. В частности, на систему не влияют элю- ции человека-управленца и в стрессовых ситуациях она принимает решения так же, как и в обычных; система ничего не забывает и не упускает решений, которые для человека апостериори «сами собою разумеюш,иеся», но не пришли ему вовремя в голову. Помните, как в известном рассказе А. П. Чехова: «Было б >ше козьей ножкой!». Таким образом, метод ситуационного управления можно считать эвристическим. 7. На самом деле- для ашогих реальных объектов управления одношаговые решения не определяют стратегии управления. В таких объектах необходимо формировать в качестве решений цепочки
^2 ГЛ. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ ИЗ одношаговых решений. Для этого в системе экстраполяции должны быть предусмотрены специальные процедуры «склейки» одношаговых решений. С их помощью формируются более сложные решения по управлению. Указанные особенности учтены в процедурах и методах, описанных в последующих главах. Надо помнить, что эти методы не единственно возможные. И любой специалист вправе придумывать и предлагать свои подходы к решению задач, вытекающих из сути метода ситуационного управления. И последнее замечание. Как следует из Исторического очерка развития ситуационного управления, приведенного в конце книги, оно возникло много раньше, чем сформировалось активно развивающееся сейчас научное направление, называемое теорией ис- куссшенного интеллекта. У ситуационного управления много общего с методами, характерными для исследований в области искусственного интеллекта. По ходу изложения эти аналогии мы будем отмечать, что поможет читателю использовать из арсенала теории искусственного интеллекта не только терминологию, но и те результаты, которые там получены, для обогащения своих систем управления сложными объектами. § 1.5. Семиотические модели * Цель настоящего параграфа — уточнить понятие семиотической модели, лежащее в основе метода ситуационного управления и вообще методов семиотического управления. В том, что в таких методах используется именно данная модель, состоит главное отличие от традиционных методов теории управления, в основе которых лежит некая формальная (в логическом смысле) модель. Начнем с определения формальной модели. Определение 1.3. Формальной моделью называется четверка Л1 = <Г, Р, Л, П>, где Т — множество базовых элементов, Р — синтаксические правила, А — система аксиом, П — семантические правила. Поясним суть элементов, образующих формальную модель. Множество Т состоит из конечного или счетного множества элементов любой природы. Это как бы алфавит формальной системы, набор элементов, из которых будут строиться все остальные ее элементы. На элементы формальной системы не накладывается никаких ограничений. Важно только, чтобы любые два элемента из Т чем-то отличались друг от друга. Иными словами, должна существовать такая конструктивная (завершающаяся через конечное число шагов) процедура п^, что ее применение к элементам множества Т дает ответ на вопрос: одинаковы ли два сравниваемых элемента или нет. Важность этой процедуры аюжно проиллюстри-
§ 1.5. СЕМИОТИЧЕСКИЕ МОДЕЛИ 33 ровать на примере множества Г, состоящего из букв русского алфавита. Отождествление различных написаний буквы А, например, дело не такое простое. А иногда, особенно в скорописи, бывает довольно трудно идентифицировать в слове ту или иную букву. кроме того, должна существовать конструктивная процедура Яа, которая дает ответ на вопрос: принадлежит ли данный элемент к Т или не принадлежит. Для того же иллюстративного примера это соответствует ответу на вопрос о принадлежности некоторой графемы к списку букв русского алфавита. Синтаксические правила Р используются для того, чтобы из базовых элементов строить такие их совокупности, которые в рамках данной формальной системы считаются синтаксически правильными совокупностями. На множество синтаксических правил нет особых ограничений. Требуется только наличие конструктивной процедуры Лд, которая давала бы однозначный ответ на вопрос: является ли данная совокупность базовых элементов синтаксически правильной или нет. Систему аксиом А образует любое множество синтаксически правильных совокупностей. На это множество не накладывается никаких специальных ограничений. В частности, оно может совпадать со всем множеством синтаксически правильных совокупностей. Наконец, семантические правила П (по-другому они называются правилами вывода) расширяют, если это возможно, лиюжество аксиом, добавляя к ним новые синтаксически правильные совокупности. Множество, получаемое после применения семантических правил к аксиомам, носит название ^шoжecтвa семантически правильных совокупностей. На рис. 1.8 условно показан результат работы формальной системы, которая выступает как автономный генератор. Процедуры порождения множества синтаксически правильных совокупностей, основанные на произвольном применении правил Я, и процедуры порождения множества семантически правильных д. л. Поспелов
34 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ совокупностей, основанные на применении правил П, работают независимо. Определение 1.4. Формальная модель, для которой существуют конструктивные процедуры Лх, л2 и Яд, называется конструктивной формальной моделью. Определение 1.5. Конструктивная формальная модель, для которой существует конструктивная процедура Я4, дающая однозначный ответ на вопрос — принадлежит ли данная синтаксически правильная совокупность множеству семантически правильных совокупностей, называется разрешимой формальной моделью. Приведем несколько иллюстративных примеров. Пример 1.4. Вернемся снова к коробке детских кубиков, содержащей всего шесть кубиков. Каждый кубик есть базовый элемент. Легко убедиться, что существуют и Яз, позволяющие отличать один кубик от другого (по несовпадающему рисунку хотя бы на одной грани двух сравниваемых кубиков) и отличать кубики из других наборов (например, по несовпадению концевых точек линий или границ между цветами на всех шести гранях данного кубика со всеми другими кубиками набора, если нет более простого признака типа другого размера кубика). Система синтаксических правил такова, что она считает синтаксически правильными любые совокупности кубиков, в которых все шесть кубиков выложены в виде прямоугольника 2x3 или 3x2. Ясно, что существует конструктивная процедура Яд. Система аксиом совпадает с такой совокупностью кубиков, которая соответствует одной из приложенных к коробке картинок (эта картинка как бы фиксируется в виде начальной позиции). Правила П дают возможность получать из исходной картинки новые картинки (думаю, что читатели в детстве сами строили эти правила). И, наконец, ясно, что существует конструктивная процедура Я4, ибо определение всех семантически правильных совокупностей содержится в наборе шести картинок, приложенных к набору. Следовательно, мы имеем дело с разрешимой формальной моделью. Пример 1.5. Рассмотрим классическое исчисление высказываний. В качестве элементов Т будем использовать малые латинские буквы без индексов и с нижними индексами, а также символы "|, &, V и В качестве Р возьмем следующий набор правил: 1. Каждый базовый элемент есть синтаксически правильная совокупность. 2. Если а — синтаксически правильная совокупность (формула), то "Iа также есть формула. 3. Если а и |3 — формулы, то (ot\/|3), (а&Р), (а-->|3) — также формулы. Здесь а и |3 — метасимволы, не входящие в Т. Процедура Яд явно существует. РассАютрим, например, совокупность базовых элементов вида ("|^Vb). Это, конечно, формула, ибо а w Ь — формулы согласно первому правилу из Я, "^а — формула согласно второму правилу из Р^ а ("|а\/Ь) — формула по третьему правилу из Р. В противопо-
§ 1.5. СЕМИОТИЧЕСКИЕ МОДЕЛИ 35 2* ложность предыдущей совокупности совокупность С] У а) не есть формула, ибо в Р нет правил, последовательное применение которых привело бы к ее построению. Явное выражение процедуры Яз не приводится, чтобы доставить читателю удовольствие самому написать ее. Система аксиом имеет следующий вид: (1) (а^(р^а)); (2) ((а ^ (р -> у)) ^ ((а ^ р) ^ (а у)); (3) ((а&Р)--а); (4) ((а&Р)^р); (5) ((а ^ Р) ((а Y) _ (а ^ (Р & у)))); (6) (а-.(а VP)); (7) (p^(aVP)); (8) ((a--v)->((P-^Y)^((aVP)->Y))); (9) ((а_р)_(-1Р_ la)); (10) (cc-^l la); (11) (1 "Icc-^cc). Конечно, аксиом многовато и непривычному к логической символике читателю трудно их охватить единым взглядом. Но это и не нужно. Надо смотреть на них, как на множество произвольно выбранных из правильных совокупностей элементов. Наконец, правила П в классическом исчислении высказываний в той его форме, как она рассматривается в данном примере, имеют вид: 1. Если а — семантически правильная совокупность (выводимая формула), то при замене в а любого базового элемента (везде, где он входит в а) любой формулой вновь получается выводимая •формула; 2. Если (а-^^Р) и а — выводимые формулы, то р также выводимая формула. Вопрос о существовании конструктивной процедуры Я4, которая позволяла бы для любой формулы исчисления высказываний определять выводима она или нет, пока остается открытым. Но в рассуждениях, которые будут следовать после определения 1.6, мы дадим на этот вопрос положительный ответ. И тогда читателю станет ясно, почему в данном примере выбрана именно такая система аксиом. Приведенных примеров, по-видимому, достаточно. Отметим только, что исчисление предикатов и формальные грамматики, широко используемые в языках программирования, суть конструктивные формальные системы. Но в общем случае они не являются разрешимыми формальными системами. Рассмотрим теперь модель вида L = <Z, D, Я, V>. Здесь Z — некое ^шoжecтвo, которое мы будем называть множеством интерпретируемых значений. Правила D, называемые правилами отображения, устанавливают возможность отображения T^Z, которое является Nmoro3Ha4HbiM в обе стороны. Эти правила при некоторой конкретной реализации дают отображение T-^Z, од-
36 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ позначное в одну сторону, т. е, приписывают каждому элементу, из Т некоторое интерпретирующее значение. Та или иная реализация отображения задается Я — правилами отображения или задается извне. Наконец, правила интерпретации V позволяют приписывать любой синтаксически правильной совокупности базовых элементов некоторое интерпретирующее значение, если заданы интерпретирующие значения для всех базовых элементов, входящих в эту совокупность. Определение 1.6. Формальная модель М, для которой задана модель L, называется интерпретированной форлшльной моделью. Пример 1.6. Для исчисления высказываний, рассмотренного в примере 1.5, можно в качестве модели интерпретации взять модель, в которой Z={Истина, Ложь}, правила отображения задают произвольное отображение любых элементов из 7, кроме "] , &, V и ^ в любой элемент Z, правила Я отсутствуют, а правила V определяются табл. 1.1. Таблица 1.1 а b la а & Ь ау b а b Ложь Ложь Истина Ложь Ложь Истина Ложь Истина Истина Ложь Истина Истина Истина Ложь Ложь Ложь Истина Ложь Истина Истина Ложь Истина Истина Истина Эти правила позволяют для любой синтаксически правильной формулы исчисления высказываний приписать некоторое интерпретирующее значение. Нетрудно проверить, что всем аксиомам, перечисленным в примере 1.5, эти правила при любых интерпретациях входящих в них базовых элементов приписывают значение «Истина». Семантические правила, приведенные в том же примере, не могут изменить значение формул, к которым они применяются. Таким образом, все формулы, которые выводятся из аксиом, также всегда имеют интерпретирующее значение «Истина». Можно доказать, что аксиомы и правила вывода, приведенные нами, обладают свойством полноты в том смысле, что любая формула исчисления высказываний, которая имеет значение «Истина», выводима из этого множества аксиом с помощью имеющихся семантических правил. А это означает, что исчисление высказываний, рассмотренное нами, является разрешимой формальной системой. Процедура Л4 состоит в проверке того, что при любых интерпретациях базовых элементов проверяемой формулы она принимает значение «Истина». Если это не так, то проверяемая формула не пр1И1ад-
§ 1.3. сел\110Т11ЧЕСКИЕ .модели 37 лежит множеству семантически правильных формул (совокупностей). В фор.мальных системах Т. Р. А и П остаются неизменными. Это означает, что если бы формальные системы использовались для создания ситуационных люделей управления, то язык описания ситуаций (он определяется 7 и Я), исходные знания об объекте управления и законах управления (они определяются задан1!ем множества аксиом) и ЛТП (они совпадают с се^лантнческими правилами) оставались бы неизменны>ш и нeзыблeмы^пi. Но это противоречит всему, что мы говорили об объектах управления и самой системе ситуационного управления, ее принципиальной открытости для обучения и дообучения. Система управления, базирующаяся на формальной людели, априорно должна иметь всю информацию, которая остается для нее неизменной в течение всего периода управления. Все утверждения, выведенные в ней в любой момент времени, остаются выведенными навсегда. Ясно, что для объектов управления, отличных от детских кубиков из примера 1.4, такое положение не имеет места. В процессе функционирования системы управления могут корректироваться языки описания ситуаций, изменяться знания об объекте и методах управления им. Это означает, что все элементы, входящие в определение М, могут изменяться в процессе ее функционирования. Рассмотрим в связи с этим людель вида С = <уИ, /у., 7р, хл» Хп>- Здесь Хг, Хл, Ха Хп — соответственно правила изменения Г, Р, Л и П. Определение 1.7. Модель С называется семиотической моделью. Подобное название С связано с тем, что в отличие от формальных моделей, в которых элементы, образующие множество Г, обладают жестким синтаксисом, задаваемым процедурой Л1, жесткой семантикой, определяемой процедурой интерпретации, и жесткой прагматикой (то, как трактует этот элемент ЛПР с точка зрения процесса управления), в ^юдeли С все эти свойства элементов ii становятся доступными для изменения. Но именно такой особенностью обладают знаки — элементы знаковых, или семиотических, систем, изучаемых в ceNHioTHKe. Такие системы тесно связаны со всей человеческой деятельностью. Именно изменчивость и условность знаков делают эту деятельность эффективной. Поясним сказанное на простом примере. Сигнал звонка ^южeт означать, что кому-то надо поднять телефонную трубку. Но прагматика звонка для меня может быть различной в зaвиcи^юcти от того, жду л\\ я с кем-то разговора или знаю, что трубку должны снять в соседней комнате. Вместо звонка меня >югут позвать к телефону стуком в перегородку. Синтаксис знака изменился, а семантика и прагматика сохранились. И точно такой же звонок >южет означать конец
38 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ зависилюсти от работы, что при неизменном синтаксисе знака дает другую семантику. А в странах, где надо особо платить за каждое соединение абонентов, люди договариваются о том, что если телефон прозвонит четыре раза, то встреча состоится, а если пять — откладывается. Сохраняя синтаксис телефонных звонков, они меняют их семантику и прагматику. Человек окружен знаковыми системами, его деятельность пронизана ими. Он постоянно творит такие системы, договариваясь с другими партнерами о синтаксисе, семантике и прагматике знаков. Правила изменения, введенные нами в модель С, в какой-то мере отражают подобный процесс. Правила Хг и Хя меняют синтаксис базовых элементов и их совокупностей, правила Хл и хп— семантику и прагматику совокупностей. Можно было бы еще изменять модель интерпретации. Тогда бы мы получили модель, подобную знаковым системам человека. Но мы этого делать не будем. Для систем управления вполне достаточно изменения элементов в формальных моделях. Другое название знаковых систем и моделей — семиотические модели. Этого названия мы и будем придерживаться в дальнейшем. Посмотрим, что означают правила изменения в модели С в тep^шнoлoгии системы управления. Начнем с ЛТП. Модель М детерминирована и неизменна. Правила хп Дают возможность отказаться от этого, сделать ЛТП переменными, например адаптивными. Примерами таких ЛТП могут служить ЛТП с вероятностной перенастройкой вида Qy->(Q/., q,\ Qu. q,\ Q/„ ^,). В таком ЛТП текущая ситуация Qj при полной ситуации Si преобразуется не в одну фиксированную текущую ситуацию Qj, как было ранее, а в г различных текущих ситуаций. Выбор того или иного преобразования осуществляется вероятностным механизмом с х'четом того, что qi {i=\, 2, . . ., г) — вероятности реализации соответствующего преобразования \ 2 ^/^ ^ • В удачи или неудачи применения такого ЛТП происходит изменение распределения. Если, например, в полной ситуации Si было применено преобразование Qj^Q^. и оно оказалось удачным (например, с точки зрения ЛПР), то может увеличиться на некоторую величину при условии сохранения нормировки, т. е. при условии соответствующего уменьшения остальных Qj. Такой способ изменения ЛТП позволяет подстраивать семантические правила под тот объект, для которого построена система управления. Вместо пересчета вероятностной схемы можно менять ЛТП и другими cпocoбa^иI, и об этом будет говориться в соответствующем разделе книги.
?j 1.6. ДАННЫЕ 11 ЗНАНИЯ 39 В кажлый текущий момент некоторые утверждения об объекте, его состоянии, а также состоянии системы управления являются истинными, отражают положение вещей. Эти знания можно выразить в виде набора аксиом. Можно считать, что все, составляющее в момент принятия решений описание полной ситуации S^, есть набор таких аксиом. Они служат источником вывода о том решении (У^, которое надо применить в данном случае. Однако в другой момент времени эти знания будут уже другими. И утверждение о том, что станок № 1245 свободен, которое могло выступать как аксиома в предшествующий такт управления, на данном такте может уже оказаться ложным. Система аксиом все время «дышит», меняется. И эти изменения можно явно указывать, например, в правых частях ЛТП, записывая их в виде Si\ Qj=>Qr, h- Здесь li — те изменения, которые необходимо внести в описание полной ситуации St после того, как Qj перешла в Qi. Конечно, возможны и другие способы описания изменений аксиом, задаваемых правилами Хл- Наконец, изменения синтаксических правил могут свидетельствовать, что язык описания ситуаций на объекте управления, полные знания о нем и процедурах управления оказался слишком бедным. В него необходимо ввести новые способы образования функций, отношений типовых сообщений. Функции такого из- рис. 1.9 менения выполняют правила Хр- Правила добавляют в список исходных понятий, отношений или функций новые элементы или исключают из него те, которые оказались ненужными для целей управления. Семиотическую модель можно представить в виде сети, показанной на рис. 1.9. Каждая вершина сети представляет собой некоторую формальную систему, а связи между вершинами определяют переходы от одной формальной системы к другой под влиянием изменений Эти изменения могут совпадать с Хг» Хя' Хл или хп или быть какой-то их комбинацией. За один такт работы семиотической модели в зaвиcи^юcти от coдepжи^югo It ^юдeль либо останется в том же состоянии (в рамках той же формальной системы), что и ранее, либо перейдет в новое состояние. § 1.6. Данные и знания Введенное нами понятие семиотической модели и ее интерпретация, показанная на рис. 1.9, позволяют рассмотреть важную проблему искусственного интеллекта — взаимоотношение данных и знании и логическую противоречивость знаний. Вопрос этот важен и для ситуационного управления. Но прежде чем мы непосредственно перейдем к его обсуждению, отметим, что до последнего времени в
40 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ теории программирования задач для систем искусственного интеллекта оживленно дебатировался вопрос о двух возможных путях построения подобных систем: процедурном и декларативном. В процедурном подходе в центре внимания разработчика находилась процедура, программа, а информация для нее играла второстепенную роль. Программа работала с данными, вызывала их по мере необходимости, уничтожала в памяти. Данные оставались где-то на периферии. Считалось, что основная работа по созданию системы лежит в области создания процедур. Это положение стало меняться, когда данные стали усложняться. Появились сгруктурированные данные — списки, документы, семантические сети, фреймы. О некоторых из них речь еще впереди, они будут играть важную роль на страницах нашей книги. Затем возникли специальные средства для хранения данных — информационные банки и базы, к которым стал добавляться термин интеллектуальный. Это означало, что вместе с хранением данных в базах и банках происходит их элементарная обработка, выполняемая специальными вспомогательными программами. Они осуществляют поиск данных, запись их в отведенное место и ряд других операций. Форма записи данных в хранилище может не совпадать с той их формой, которую использует программа, решающая основную задачу, ибо таких программ много, а хранилище одно. Поэтому сервисные программы стали брать на себя функцию перевода запроса и выдаваемого ответа из одной формы представления в "другую. Информация усложняла свою форму представления, она становилась структурированной, одни порции информации стали связываться с другими некоторыми отношвниями. Процедуры, связанные с ее обработкой, начинали усложняться, становились самодовлеющими. Многие преобразования, 'которые раньшз о:ущзствлялись программами, решающими основную задачу (например, поиск по образцу) стали выполняться вне основной программы. Во многих случаях Рис. 1.10 привычные программы, перерабатывающие информацию за счет ее прямого видоизменения, заменялись специальными процедурами по переработке информации. Так возник декларативный подход, в котором работа с данными (их начинают называть знаниями) выходит на первый план, оттесняя сами процедуры на второй план. В чем же принципиальная разница между данными и знаниями? Традиционное программирование не дает на это ответа. Но в рамках теории семиотических моделей такой ответ можно HaiiTii. Давайте посмотрим на рис. 1.10. На нем очень услоЕно показана лошадь, пасущаяся на лугу, что вызыг.аег в голове видящего
§ 1.6. ДАННЫЕ Л ЗНАНИЯ 41 ее индивида иексторый обобщенный образ оошади, пасущейся на лугу». Этот образ включен в некоторую систему данных о такой ситуации. Индивид может, например, понять, что движения, которые делает лошадь, сводятся к перемещению по лугу, отгону надоедливых слепней и к поглощению травы — пищи для лошади. Он может установить, что это лошадь определенной масти (если он, конечно, знает, что это такое), домашняя и. следовательно, она кому-то принадлежит. По некоторой ассоциации он может себе представить конюшню (не конкретную, где живет данная лошадь, а конюшню вообще), человека, который за лошадью ухаживает, и т. п. Важно, что весь тот информационный комплекс, который возникает у индивида, видящего пасущуюся лошадь, оказывается логически непротиворечивым, ибо он может представить себе конкретную ситуацию (ей в ситуационном управлении соответствует текущая ситуация), в рамках которой все эти сведения могут быть совмещены. И если индивиду задать вопрос: «Лошадь летает?.), то он ответит на него отрицательно. Такие лошади, конечно, не летают. Но индивид может легко представить себе летающую лошадь. Например, Пегаса, если он что-то слышал о нем. В мире греческой мифологии, где действует Пегас, лошадь молсет летать. Но если в мире мифологии задать вопрос: «С помощью чего летает Пегас?», то ответом будет: «С помощью крыльев». Ибо Пегас — крылатая лошадь. А в мире русской народной сказки лошади не надо иметь даже крыльев. Конек-Горбунок умеет летать и без них, перенося героя сказки куда тому нужно. Если эти знания о лошади совместить в рамках одной конкретной ситуации, то получится логически противоречивая система. В ней лошадь летает и не летает, летает только если у нее есть крылья и может летать без крыльев. Получается абсурд. Но подобный абсурд встречается на пути человека постоянно, и он нисколько не страдает от этого. Он вполне спокойно оперирует с такими, например, логически противоречивыми образами: «Началась третья половина игры», «Исполнение всех желаний, у которых нет предела», «Речка движется и не движется, вся из лунного серебра» и т. п. Более того, подобные абсурдные утверждения развлекают человеческий ум, приятны для человека. Это происходит потому, что в голове человека вся такая информация не хранится в рамках одной системы. Тогда бы он был лишен возможности производить над ней логические операции, а следовательно, не смог бы использовать хранимую информацию для своих прагматических целей. Значит, эта логически противоречивая информация так организована в его памяти, чтобы избежать возможных логических противоречий. Одна из возможностей такой организации информации как раз и показана на рис. 1.9. В каждой вершине сети хранится логически непротиворечивая информация, совместимая в рамках одной ситуации, и эта информация может быть отражена в некоторой формальной системе. Относительно нее можно делать логически обоснованные выводы, которые можно использовать при наличии подобной ситуации. Но возможны и другие ситуации, в которых действуют свои аксиомы и семантические правила, своя интерпретация. В этих ситуациях (возможных мирах) может выводиться то, что в другой ситуации оказалось бы бессмысленным. Отметим еще один важный аспект, позволяющий уяснить разницу между данными и знаниями. Любое понятие, используемое человеком, имеет как бы две стороны — экстенсионал и интенсионал. В науке до сих пор продолжаются споры относительно точной нх интерпретации. Поэтому наши дальнейшие рассуждения нельзя рассматривать как способ разрешить эти споры. Понятия <окстенспонал» и «интенсионал» мы будем трактовать прагматически, как принято в теории представления знаний. Под экстенсионалом некоторого понятия мы будем подразумевать набор конкретных фактов, соответствующих данному понятию. Если, например, для некоторой конкретной лаборатории в данном научном учреждении мы рассмотрим понятие «сотрудник», то его экстенсионалом может быть список работающих в этой лаборатории. Экстенсионалом понятия «ателье по ремонту микрокалькуляторов в г. Минске» служит перечень всех таких ателье, имеющихся в данном городе в данный момент времени. Экстенсионал понятия может сыть конечным, как было в приведенных нами примерах, но может быть и бесконечным. В последнем случае, разумеется, его нельзя задать простым перечислением. В этом случае поступают по-иному. Например, задают некоторое характеристическое правило, удовлетворение или неудовлетворение которому определяет принадлежность к
42 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ экстенсионалу данного понятия. Например, опреди^ляя экстснснонал понятия «четное число», мы не можем просто перечислить все четные числа, но можем задать его путем следующего характеристического правила: если при делении на 2 данное число имеет нулевой остаток, то оно принадлежит экстенспоиалу понятия «четное число». Подобное правило можно (что обычно и делается) использовать для определения понятия «четное число». Это определение и будет интенсионалом данного понятия. Между декларативным и процедурным представлением, с одной стороны, и экстенсионалом и интенсионалом, с другой, существует очевидная связь. Экс- тенсионал — это набор конкретных данных, заданных в декларативной форме. Интенсионал же, как правило, задает некоторую процедуру, позволяющую определять принадлежность того или иного конкретного факта к некоторому понятию. Интенсионал выделяет знания, отделяет их от данных, которые всегда задаются экстенсионально. Теперь можно описать разницу между данными и знаниями. Данные есть комплекс информации, совместимый в рамках некоторой формальной системы с учетом всех воз.можных интерпретаций этой системы. В случае ситуационного управления множество данных есть множество текущих ситуаций, которые могут складываться на объекте управления (последний предполагается неизменным), и информация о текущем состоянии объекта и системы управления им. Знания же есть информация, которая хранится во всех возможных мирах вместе с условиями перехода от одного мира к другому. Другими словами, знания — это не только множество всех текущих ситуаций в объектах данного типа, но и способы перехода от одного описания объекта к другому, способы изменения компонент формальной системы, а, следовательно, знания — это то, что воплощается в некоторой семиотической модели. § 1.7. План дальнейшего изложения Прежде чем переходить к изложению основных проблем, связанных с созданием систем ситуационного управления, наметим план изложения. В последующих главах мы прежде всего займемся описанием языка ситуационного управления, с помощью которого будут описываться ситуации. Этот язык допускает согласование с языком описания знаний об объекте управления и управления им, а также с языком, на котором описываются цели управления. Затем мы рассмотрим процедуры классификации, столь важные для ситуационного управления. Опишем методы пополнения описаний ситуаций за счет использования знаний относительно объекта управления и методов управления им, хранящихся в памяти системы. В связи с этим мы обсудим специальные псевдофизические логики, используемые для пополнения описаний и процедуры индуктивного вывода, позволяющие получать в процессе управления новые знания. Наконец мы обсудим различные подходы к проблеме принятия решений по управлению, традиционные для ситуационного управления. Будут описаны как традиционные дедуктивные системы вывода решений, так и нетрадиционные системы, опирающиеся на специфические свойства семиотических моделей.
ГЛАВА 2 ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ Понятие розы так же мало обладает ароматом, как мало ноиятие прыжка прыгает. Г. Фсрстер §2.1. Вступительные замечания В традиционных методах управления объект управления, как правило, заменяется некоторой синтаксической формальной моделью. Поясним, что вкладывается в это название. Пусть мы имеем некоторое дифференциальное уравнение вида л'-г2л' —3^^ = /^ Попробуем задать себе вопрос — какой объект описывается этим уравнением? К сожалению, ответить на него невозлюжно, если не знать,, для описания какого объекта было оно построено. Переход от содержательной задачи управления к ее математическому аналогу исключает семантику исходной задачи, лишает проблему конкретности. Если такой переход совершен, математик берется за дело. Ему нет дела до объекта управления. С него вполне достаточно той математической реальности, которая скрывается за синтаксической ^юделью. Он люжет исследовать самые тонкие оттенки поведения интегральных кривых для этого уравнения, решать проблему об устойчивости его решений, разрабатывать методы решения уравнений подобного типа. Это его епархия, и для владения ею ему совершенно необязательно видеть и знать объект управления. Аналогичная картина возникает при переходе от объекта управления к любой синтаксической (формальной по своей природе) математической модели. При этом обнаруживается сила математики, широкая применимость предлагаемых ею методов. Если математику удалось найти и исследовать решения уравнения, описываюш,его колебание мембраны в телефонной трубке, а колебания крыльев салюлета, приводящие, в конце концов, к их разрушению (флаттер), описываются уравнениями такого же вида, то решения, полученные для колеблюш.ейся мембраны, полностью переносятся на явление флаттера. Или, если лшожества различных задач можно свести к задаче целочисленного линейного программирования, то для всех них, нeзaвиcи^ю от семантики решаемой задачи, математик даст метод нахождения оптимального решения. Но, как уже говорилось в гл. 1, новые объекты не дают такой возможности. Стандартизация методов решений возникающих тут задач практически нeвoз^южнa. Всем памятен призыв, прозвучавший десяток лет тому назад среди специалистов по пресловутым
44 f'^. языки для описания объекта и сит^-ацип автоматизированным системам управления, как они мыслились их первым адептам, призыв к стандартизации блоков этих АСУ. Если бы такие блоки оказалось возможным изготовить, то проблема проектирования АСУ, одна из наиболее актуальных проблем последнего двадцатилетия, существенно упростилась бы, и можно было бы надеяться на возникновение теории АСУ. Но опыт показал, что подобные надежды призрачны. И кроме типового блока расчета заработной платы и некоторых других (кадровая система, система \чета на складе и т. п.), вообще говоря, не удалось создать никаких типовых модулей. Ибо, как уже отмечалось ранее, каждый объект АСУ уникален. Для него требуется разработка ориентированной на него системы управления. И, по-видимому единственное, что можно стандартизовать, это методику проектирования однотипных АСУ, Уникальность объекта управления (а только такие объекты мы и рассматриваем в нашей книге) требует для описания его структуры, функционирования и особенностей управления им специальных семантических и прагматических формальных моделей. Это требует специальных языковых средств для описания таких моделей. Языковые средства должны быть способны отображать семантику и прагматику описываемого явления. К сожалению, классическая математика не позволяет сделать это. Поэтому приходится расширять ее средства. И их расширение легче всего производить в области математической логики, наиболее близко сталкивающейся со способом описания явлений и получения выводов из этих описаний qevioBCKOM. С другой стороны, технологи, которые до автоматизации объекта управления как-то справлялись со своей задачей, ^югyт дать много информации о нем и о своей деятельности по управлению. Но сообщаемая ими информация всегда выражена на естественном языке, весьма далеком от точного языка математики. Что происходит, когда на сложный объект, управление которым еще не автоматизировано, приходит ученик? Что делает опытный технолог-управленец в этом случае? Конечно, он не может сообщить ученику точного алгоритма управления, ибо он его не знает. Но кое-что, находящееся на каком-то интуитивном уровне, он знает. И он начинает объяснять ученику принципы управления объектом. И велит следить ученику за тем, как он реализует процесс управления. И вот через некоторое время наступает чудо. Обыкновенное чудо, происходившее в истории человечества миллионы раз. "^у'ченик гюстроил в своей голове модель объекта и модель управления им и становится сам технологом-управленцем. Ему для этого вполне хватило объяснений учителя, сделанных на обычном естественном языке, и наблюдения за его действиями по управлению. Это позволяет нам выдвинуть следующую естественнонаучную гипотезу.
§ '2.'2. роли и отношения 45 Гипотеза 2.1. Всю информацию об объекте управления и способах управленР1я им аюжно выразить cpeдcтвa^пi обычного естественного языка. Эту гипотезу, конечно, нельзя строго обосновать. Возможно, что для некоторых объектов она просто неверна. Вспомним описанный в гл. 1 случай с диагностикой психических заболеваний. Вряд ли то мгновенное «ощущение» болезни, позволяющее опытным врачам практически безошибочно ставить правильный диагноз, можно записать в виде текста на русском языке. Тогда бы не было проблемы диагностики. Но для многих объектов подобную гипотезу можно принять. А следствием этого является тот интерес к естественному языку и его изобразительным средствам, который характерен для метода ситуационного управления. Но для современных ЭВМ, на базе которых строятся наиболее гибкие системы управления, естественный язык в его полном объеме недоступен. Поэтому возникает проблема сужения текстов на естественном языке, описывающих сам объект управления и опыт по управлению им, до такого уровня, чтобы полученные описания можно было «погрузить» в семиотическую систему. Это приводит к некоторому утверждению, выливающемуся в гипотезу. Гипотеза 2.2. Всякий текст на естественном языке, относящийся к тому, о чем говорится в гипотезе 2.1, можно перевести на формальный язык семиотической модели. Эта гипотеза, как и предыдущая, верна, по-видимому, не всегда. Но практический опыт автора книги и всех разработчиков систем ситуационного управления подтверждает ее справедливость. Таким образом, мы приходим к следующей постановке основной задачи, связанной с описанием ситуаций, а также структуры и функционирования объекта управления: найти такой способ естественно-языкового описания необходимой информации, который позволял бы реализовать основные процедуры ситуационного управления: классификацию, корреляцию (соотнесение с помощью ЛТП описания ситуации с одношаговыми peшeния^п^), экстраполяцию. Этой проблемой мы и будем заниматься в настоящей главе. § 2.2. Роли и отношения Постигая мир, осуществляя свою деятельность в нем, человек должен уметь Иоделировать и описывать окружающий его мир. Однако как он это делает, мы знаем еще очень плохо. Л\ногие детали этого процесса остаются нам неизвестными. Гем не менее в последние десятилетия в психологии, психолингвистике и теории дознания получено немало фактов, на основании которых можно сформулировать следующую гипотезу. Ги потеза 2.3. При отображении внешнего мира, при описании его человек вычленяет в нем конечный набор отношений. Эти отношения связывают между собой отдельные элементы модели внешнего мира. Сами элементы. связа1{иые отношениями, выступают в них как определенные po.ui, семантика которых определяется видом отношения.
46 гл. 2. языки ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИП Эта гипотеза нуждается в некоторых пояснениях. По-видимому, не вызывает сомнений, что человек (возможно, что и все животные, находящиеся на достаточно высокой ступени развития) воспринимает окружающий мир структурированно. Свидетельство этого — человеческий язык, предназначенный, в частности, для описания мира, в котором человек живет. Человек выделяет в этом мире отдельные конкретные факты, предметы, явления, процессы, события и отношения между ними. Язык сохраняет эту структуризацию. Факты, предметы, явления, процессы и события получают в языке свои, присущие им имена, а отношения выражаются либо с помощью специальных имен, либо чисто языковыми синтаксическими средствами. Семантика отношений неразрывно связана с теми ролями, в которых выступают элементы, связанные отношением. Например, отношение начальник — подчиненный связывает двух людей (элементов модели), которым присущи определенные роли, одна из которых называется начальник, а вторая — подчиненный. Во фразе «Иванов — начальник Петрова» Иванов и Петров находятся именно в этих ролях. Постигая роли, человек познает ситуацию реальной действительности и может организовать свою целенаправленную деятельность в ней. Для решения последней задачи он использует роли типа средство — результат, причина — следствие, и ряд других ролей. Согласно гипотезе 2.3 таких ролей существует конечное число, а следовательно, существует и конечное число отношений, выделяемых человеком в реальном мире, ибо каждое такое отношение есть пара взаимосвязанных между собой ролей. Справедливость подобного утверждения вряд ли можно доказать. Но наблюдения над языковыми текстами и методами построения специальных языков для описания действительности, с которыми мы познакомимся в последующих параграфах, как будто подтверждают эту гипотезу. Приведем в заключение данного параграфа список ролей (явно неполный): целое, признак, признак признака (и далее рекурсивно любое число раз), владелец, количество, множество, порядок, сравнение, вышестоящее понятие, мера, приписываемый признак (например, «человек из тех, которых я знаю»), действие, признак действия, лицо, совершающее действие, пособник, средство, объект, информационный объект (например, «Иван получил известие о своих делах»), источник, принимающий, место, время, причина, обстоятельство, цель, результат, заместитель («Он выпил чай вместо меня»). Как мы увидим далее, все эти роли можно отразить в предлагаемых языках описания ситуаций. § 2.3. Естественный язык и теория управления Для представителей разных наук естественный язык видится по-разному. Для лингвиста он есть объект изучения как таковой. Для психолога он выступает как инструмент мышления и коммуникации между людьми, для философа — как модель, с помои;ью которой организуются познавательные процессы. Специалист в теории управления также имеет свою концепцию языка. Для него язык выступает прежде всего как средство описания тех объектов, которыми он собирается управлять, ситуаций, складываюш,ихся на этих объектах, и процедур управления. Высказанные нами гипотезы об использовании естественного языка в ситуационном управлении инициируют поиск тех механизмов, с помои;ью которых естественный язык может выражать понятия, отношения и роли, важные для управленца. И первый шаг на пути нахождения этих механизмов — выделение в лексике языка групп, не- суш.их определенную функциональную нагрузку при описании объектов, ситуаций и процедур управления.
§2.3. естественный язык и теория управления 47 1, Понятия. Сюда входит большая группа лексических единиц языка, которая используется для обозначения однородных групп фактов, событий, явлени!! и других элементов в реальном мире. Примерами понятий могут служить: стол, подъемный кран, фрезерование, конец смены, землетрясение, премия и т. и. Важно здесь то, что слово стол означает не какой-то конкретный предмет реального мира, а стол вооби;е, любой предмет, который можно назвать столом. Аналогично, конец смены также не конкретизирован и событие, описываемое данным словосочетанием, может происходить неизвестно где и неизвестно когда. Это означает, что понятиям соответствует какая-то своя структура, некий набор обязательных характеристик, с помош,ью которых одни понятия отделяются от других, причем конкретные элементы действительности называются этими словами и словосочетаниями. Это, действительно так. И в следуюш,ей главе книги мы специально остановимся на этом вопросе. Пока же будем апел- лир01зать к нашей интуиции, которая должна нам подсказать, что можно отнести к группе понятий. В дальнейшем понятия будут обозначаться латинскими буквами с индексами или без них. Не будут использоваться лишь те буквы, которые мы введем для обозначения других функциональных групп лексики естественного языка. Договоримся также о следуюи;ем обозначении. Когда понятие будет употребляться по отношению к некоторому конкретному элементу действительности, мы будем применять малые, строчные, буквы, а когда оно будет относиться к классу однородных элементов — большие, прописные. Например, для фразы «Стол может быть деревянным, железным или каменным», понятие стол мы будем обозначать какой-либо большой латинской буквой, а во фразе: «Этот стол мне нравится» понятие стол мы будем обозначать малой буквой. Таким образом, величина буквы показывает, имеем ли мы дело с конкретным понятием или понятием-классом. 2. Имена, Практически любые слова и словосочетания могут играть роль имен. Имена служат для конкретизации тех или иных элементов действительности, входяи;их в понятие-класс. Примерами имен могут служить: Петр Петрович Петров, поезд номер 33, вагон номер 7, номер вешалки Театра на Бронной и т. д. Номера не всегда выделяют единственный элемент из класса. Петровых с именем отчеством Петр Петрович суи;ествуют сотни, если не тысячи, поездов с номером 33 и вагонов с номером 7 — десятки > номеров в гардеробе Театра на Бронной — сотни. Поэтому, как и для понятий, мы введем два обозначения для имен. Малыми буквами i с различными индексами мы будем обозначать имена конкретных элементов, а большими буквами / с различными индексами — имена подклассов понятия-класса, всем элементам которого присвоено это имя. Pacc^ютpим фразу «Л\ой дядя Петр Петрович Петров». В этой фразе используется понятие-класс «дядя».
48 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ М От лнглийского слова relation, означающего отношение. В названии этих языков подчеркивается, что именно отношения играют в них основную роль. Его мы обозначим некоторой большой латинской буквой. «Мой дядя» выделяет из этого класса некий подкласс людей, для которых я являюсь племянником. Это как бы имя, которое мы должны были бы обозначить как /i. Наконец, Петр Петрович Петров из этого подкласса выделяет конкретного человека, и, согласно нашей договоренности, его имя нужно обозначить какой-либо малой буквой с индексом, например t'l. Иногда трудно узнать, относится ли имя к конкретному элементу, или речь идет о неком подклассе элементов. Но можно надеяться, что при описании узких проблемных областей, связанных с управлением конкретным объектом, подобная трудность исчезает. 3. Отношения. Отношения фиксируют связи между понятиями и именами, а также между другими функциональными группами языка, о которых речь пойдет ниже. В отличие от других функциональных групп, отношения могут задаваться не только с по- ^ющью лексики языка, но и с помощ,ью грамматических связей, выражаемых средствами языка. В силу большой важности отношений для построения языка ситуационного управления и других языков реляционного типа опишем группы отношений языка более детально. 3.1. Отношения классификации. С помош.ью этих отношений происходит классификация элементов реального мира, образуются классы элементов, устанавливаются отношения между клacca^ш, а также между классами и отдельными элементами. Важнейшее из этих отношений — иметь имя, которое в дальнейшем мы будем обозначать буквой р. Это отношение позволяет выделять из понятия-класса разные по мои;ности подклассы, вплоть до выделения конкретного элемента из класса однородных элементов. Его действие мы продемонстрировали в предшествую- щ,ем разделе, когда говорили об именах. К той же группе отношений принадлежат отношения класс — подкласс и элемент — класс. По сути, эти два отношения выполняют роль, аналогичную отношению иметь имя. Но в языке они могут фиксироваться и без каких-либо применений слов и словосочетаний, относящихся к именам. Например, «Некоторые члены бригады 1», «Часть рабочих сборочного цеха», «Один из автомобилей колонны таксопарка». Близким по духу к этим отношениям являются отношения типа: род —вид, нижестоящее понятие — вышестояцее понятие, Пpимepa^п^ их использования могут служить «В число подъемных кранов входят как стационарные краны, так и передвижные», «Молоток люжет служить примером инструмента». К той же группе отношений принадлежит и отношение часть — целое, суть кото- рого ясна из следующих примеров: «Это окна моего дома», «Токарный станок имеет станину», «Карбюратор двигателя автомобиля
$2.3. ЕСТЕСТВЕННЫП ЯЗЫК И ТЕОРИЯ УПРАВЛЕНИЯ 49 является одной из важных частей системы». Все эти отношения (как и отношения других типов) мы будем в дальнейшем обозначать малыми буквами г с различными индексами. В конце раздела об отношениях мы приведем список некоторых отношений вместе с теми индексами, которые будут присвоены им в рамках данной книги. 3.2. Признаковые отношения. Эти отношения приписывают различные качественные признаки понятиям. Все их можно представить в виде последовательной ко>тозицни двух отношений: иметь признаком и иметь значение признака. Примерами их могут служить «Очередь на шлюзование большая» («Очередь на шлюзование имеет длину. Эта длина — большая»), «Портальный кран», «Ткацкий станок». Эти отношения описывают совокупность атрибутов, присуш,их понятиям, являются их характеристиками. Одни из них имеют для понятий определяюш,ий характер (например, иметь длину d для понятия очередь), а для других это не так, и они характеризуют лишь данный конкретный элемент в данном месте и в данное время (например, «Этот дом белый», но, конечно, в другое время он люжет оказаться перекрашенным). Признаковые отношения тесно связаны с понятиями. Можно считать, что понятия есть некоторый набор определенных атрибутивных признаковых отношений. Понятие есть как бы сумма определяющих его признаков. В понятии сосредоточено то общее, что объединяют отдельные, конкретные элементы в один класс. И это общее как бы колеблется в некоторых пределах изменения значений атрибутивных понятий. К признаковым отношениям относятся и различные отношения, имеющие метафорический смысл (напри.мер «План тяжелый»). 3.3. Количественные отношения. Они выражают квантитативные характеристики понятий. Количественные отношения можно свести к композиции двух отношений иметь меру и иметь значение меры. Примера>и1 фраз, в которых реализованы подобные отношения, могут служить: «В распоряжении диспетчера имеется два свободных автобуса», «Расстояние между пунктами А и В равно десяти километрам». Особую роль играют количественные отношения, в которых вместо конкретного значения меры указано некоторое качественное значение: «Имеется много времени для выполнения этой работы», «Часто станок 7 не работает». Этот случай мы в нашем анализе языка выделим особо и расоют- рим после анализа отношений. 3.4. Отношения сравнения. Эти отношения по какому-то признаковому или количественному отношению сопоставляют две характеристики некоторого понятия или группы понятий. Примерами их могут служить «Это решение эффективнее того, которое принял диспетчер Петров», «Танкер по длине больше
50 Гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ причала», «Рабочий Иванов в два раза быстрее выполняет работу, чем Смирнов». 3.5. Отношения принадлежности. Эти отношения близки к отношениям классификации, но отличаются от них тем, что связывают два элемента внешнего мира, которые связаны лишь ситуативно. Примерами таких отношений могут служить: «Иванов — коллега Петрова, у них одинаковая специальность», «Работы X и Y находятся сейчас в поле зрения диспетчера», «Сидоров — брат Купцова». | 3.6. Временные отношения. К ним принадлежат отношения типа быть одновременно, быть раньше, совпадать по началу, пересекаться во времени и ряд других. Сюда же относятся и отношения, приписывающие элементам некоторое цремя существования или дату: «План будет выполнен в этом году», «Сборка изделия закончилась в 8 ч утра 30 ноября 1983 г.». 3.7. Пространственные отношения. Эти отношения фиксируют место пребывания некоторого элемента реального мира или вазимоотношение элементов между собой в некотором пространстве. Примерами их служат отношения находиться в, быть между, быть слева, касаться и т. п. В следующих фразах реализованы пространственные отношения: «Эти два цеха разделяет стена», «Справа от причала находится судно», «Деталь лежит на станине». 3.8. Каузальные отношения. Это отношения для отражения причинно-следственных связей, а также связей, отражающих цель, мотивацию, предпочтения при принятии решений и действиях. Примерами фраз, в которых проявляются подобные отношения, могут служить: «Передвижка судов от причала позволит разгрузить танкер «Баку»», «Для устранения аварии диспетчер отключил линию Х9 6», «Когда давление поднимается выше нормы, то температура расплава резко возрастает». 3.9. Инструментальные отношения. Эти отношения отражают прагматический аспект деятельности. Самые важные из них — служить для или быть средством для. Сюда же относятся отношения типа быть инструментом, быть вспомогательным средством, способствовать и т. п. Отношения такого типа присутствуют, например, в следующих фразах: «Десятник топором срубил сосну», «Для разгрузки сухогрузов используется причал № 8», «Этот процесс может быть реализован только в ва- к\"уме». 3.10. Информационные отношения. Эта группа отношений описывает различные стороны передачи и получения информации, приказов, просьб и т. п. Примерами могут служить фразы «Иванов передал Сидорову приказ начать бурение скважины», «Министерство не получило в срок отчета о работе предприятия А». 3.11. Порядковые отношения. Они описывают соотнесенность элементов реального мира между собой. Они вы-
§2.3. ЕСТЕСТВЕННЫП ЯЗЫК И ТЕОРИЯ УПРАВЛЕНИЯ 51 ражаются такр1ми, например, словами, как следующий, ближайший, очередной и т. п. Существуют и другие группы отношений (например, отношение замещения: «Бригада Иванова выполнила разгрузку вместо бригады Петрова»), но основные группы отношений, важные для задач управления, мы перечислили. В табл. 2.1 представлены ос- Таблиц а 2.1 п/п Наименование отношения No П/П Наименование отношения 1 Иметь 32 Быть справа 2 Быть элементом класса 33 Быть спереди Быть сзади 3 Быть подклассом класса 34 4 Род — вид 35 Наискосок 5 Нижестоящее — вышестоящее 36 Пересекаться в пространстве (по иерархии) 37 Касаться 6 Часть — целое 38 Быть внутри (в пространстве) 7 Иметь признак 39 Находиться на 8 Признак — значение 40 Быть сверху 9 Признак — мера 41 Быть снизу 10 Мера — значение 42 Быть между И Равно 43 Находиться в 12 Сравнимо 44 П ринадлежать 13 Больше 45 Служить для • 14 Больше или равно 46 Быть средством для 15 Меньше 47 Быть инструментом для 16 Меньше или равно 48 Способствовать 17 Несравнимо 49 Причина—следствие 18 Сравнимость—мера 50 Быть целью 19 Соотноситься 51 Быть мотивом 20 Соотнесенность—значение i 52 Быть отправителем 21 Одновременно 53 Быть получателем 22 Быть раньше 54 Быть источником информации 23 Быть позже 55 Быть следующим 24 Начинаться одновременно 1 56 Быть очередным 25 Кончаться одновременно 1 57 Быть ближайшим 25 Примыкать по времени слеза 58 Быть замещающим 27 Пересекаться во времени 59 Находиться в состоянии 28 Совпадать ео времени 60 Иметь имя (обозначается че29 Быть внутри (во времени) рез р) 30 Совпадать в пространстве 61 Иметь оценку (обозначается 31 Быть слева через е) новные отношения. (Порядковый номер отношения в таблице в дальнейшем будет совпадать с индексом соответствующего г^.) Этот список не есть полное перечисление всех статических отношений русского языка (статических, так как мы еще не рассматривали действия). Кроме того, легко заметить, что не все отношения, приведенные в таблице, взаимозаменяемы. Это обстоятельство мы обсудим несколько далее. Смысл списка, приведенного
52 гл. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАипП В табл. 2.1, скорее иллюстративный. Мы будем использовать отношения, включенные в него, для примеров, которые будут даны в настоящей и последующих главах. 4. Действия. Всю динамику внешнего мирг язык выражает словами и словосочетания\п1, описывающими действия. Эти действия бывают разных типов, и для нас важно выделить из них основные. Д.1Я обозначения действий будем использовать букву d с раз- личны^и^ индeкca^иI. 4.1. Императивы. Входящие сюда действия — это различные приказы и указания на выполнение некоторых действий: включить, выполнить план, снизить давление и т. п. Эти императивы, как правило, задают те решения, которые выдает система управления на управляемый объект. 4.2. Процессы. В эту группу входят лексические единицы, соответствующие названиям технологических процессов, которые могут протекать на yпpaвляe^юм объекте. Часто мы будем называть их дейстзиями-процессами. Примера.\и1 их люгут служить перевалка груза, регулировка клапана, окраска и т. п. 4.3. Состояния. В эту группу входят слова и словосочетания, фиксирующие определенные состояния управляемого объекта и системы управления. Примерами их могут служить неисправный автомобиль, свободный причал и т. п. Состояния мы часто будем называть дейстзиями-состояниями. Читателя не должно смущать наше весьма широкое толкование термина действия. К процессам и состояниям такая терминология I ©-ЧЕ) Рис. 2.1 вполне применима, когда в текстах встречаются выражения типа «Происходит погрузка автомобиля» ил[1 «Причал освобождается». К сожалению, на сегодняшний день не существует полной и удобной для решения прикладных задач классификации действий. Попытки ее создания делались неоднократно. На рис. 2.1 при-
§2.3. естественный 513ык и теория управления 53 ведена одна из таких классификациР!. На нем через С обозначен субъект, совершающий действие, а через О — объект, на который это действие направлено. Верхние индексы соответствуют состояниям субъекта и объекта, нижние — различным субъектам. Сплошные стрелки символизируют активные воздействия, а штриховые — пассивные переходы. Приведем примеры для различных классов действий, показанных на рисунке: 1 — Нагружать судно, 2 — Наблюдать за показанием высотомера, 3 — Послать сигнал ре- гулятэру на изменение давления, 4 — Построить дом [знак Ф, как всегда, означает пустоту), 5 — Включить компмкс программ, управляюи^их стиральной машиной, 6 — Сменить реэшм слежения, 7 — Проверить исправность своих цепей, 8 — Подавать аварийные сигналы. Подобно таблице для статических отношений можно создать таблицу динамических отношений. В нее, кроме тех отношений, которые определяются классами действий, показанных на рис. 2.1, войдут еще отношения, связанные с перемещением предметов во Бремени и пространстве. В табл. 2.2 приведены примеры динa^п^- ческих отношений (нумерация этих отношений продолжает нумерацию табл. 2.1). Таблица 2.2 № Наименование Наименование п/п отношения п/п отношения 62 Двигаться к 70 Быть свободным 63 Опускаться 71 Иметь объектом действия 64 Приближаться 72 Перевести в состояние 65 Стареть 73 Двигаться из-за какого-либо 66 Нагружать предмета 67 Включить 74 Действие—место 68 Забивать 75 Дей ствие—врем я 69 Быть исправным 76 Совершать действие 5. Квантификаторы. Особую группу слов и словосочетаний языка образуют так называемые квантификаторы. Два из них имеют четкий смысл. Один из них, называемый обычно квантором общности и обозначаемый перевернутой буквой А, задает утверждения Еида «Все рабочие получили зарплату», «Каждый автомобиль таксопарка проверен ГАИ». Его смысл сводится к тому, что некая информация распространяется на все без исключения элементы какого-то фиксированного класса. Другой квантификатор, называемый обычно квантором суи^ествования и обозначаемый зеркально отраженной буквой Ё, задает утверждения вида «Среди автомобилей, ждущих погрузки, имеются автомашины ЗИЛ 130», «Эта деталь хранится по крайней мере на одном из складов». Смысл
54 ГЛ. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ квантора существования сводится к тому, что некоторая информация является истинной хотя бы для одного элемента из рассматриваемого класса. Остальные квантификаторы, широко используемые в естественных языках и столь же широко применяемые технологами при описании процессов на объекте управления и способов управления им, такой однозначной семантикой не обладают. Примерами их могут служить: часто, много, вскоре, через большой промежуток времени, только, даже и т. п. Мы специально посвятим этим нечетким квантификаторам несколько параграфов книги как в данной главе, так и в последующих. Сейчас мы только проиллюстрируем сложности, которые здесь возникают. Во фразе «Даже Иванов мог выполнить эту работу» квантификатор даже как бы проецирует всех рабочих на некоторую шкалу по умению выполнить ту работу, о которой говорится во фразе, и Иванов помещается в самом низу этой шкалы. Но во фразе: «Даже Петров не смог выполнить эту работу» тот же самый квантификатор даже фиксирует уже не низ шкалы, а ее верх. Но кроме способности выделять в упорядоченных шкалах крайние значения, этот квантификатор может передавать и совсем другие смысловые оттенки (например, во фразе «Он не мог даже встать»). Столь же трудно выявить все оттенки, которые придает тексту на естественном языке квантификатор только. Приведем ряд примеров: «Кран только что начал работу», «На стройке занято только три студента», «Работа будет выполнена только завтра, а не сегодня», «Работа будет выполнена только завтра, а не послезавтра». Смысл квантификаторов типа много, часто, близко и т. п. представляется более простым, и несколько позже мы опишем процедуры интерпретации подобных нередко встречающихся в практике управления квантификаторов. Квантификаторы мы будем обозначать через >|^-, сохраняя традицию перевернутых букв, идущую от логики. 6. Модификаторы. Эта группа слов и словосочетаний практически входит в группу отношений, устанавливающих признаки элементов. Но по ряду причин нам удобнее рассмотреть их отдельно. К ним относятся такие лексические единицы, как: быстро, осторожно, портовый, грузовой и т. п. Для обозначения модификаторов будем использовать буквы т^-. 7. Модальности. К ним относятся лексические единицы типа: необходимо, желательно, совершенно невозможно, обязательном т. п. Эти единицы языка мы будем обозначать 8. Оценки. К оценкам относятся хорошо, целесообразно, вредно, достижимо и т. п. Для обозначения оценок будем использовать символы Vi. Рассмотренные нами восемь функциональных групп для естественных языков, конечно, не единственно возможные. Можно произвести разделение единиц и по-другому. Но такое деление дает нам возможность построить удобный язык для описания ситуаций, скла-
§2.1, язык ситуационного управления {ЯСУ) 50 дывающихся на объекте управления и в самой системе управления, а также производить над описаниями необходимые процедуры классификации, корреляции и экстраполяции. § 2.4. Язык ситуационного управления (ЯСУ) Здесь мы опишем основы языка ситуационного управления. Это описание будет носить полуформальный характер для того, чтобы не слишком утомлять читателя многоскобочными фopмyлa^ш. В §2.5 мы опишем строгий подход к формированию лексики языка подобного типа на примере ЯСУ, ориентированного на определенную проблемную область, а в § 2.6 дадим формальное определение основных синтаксических структур ЯСУ. После рассмотрения языков, близкич по своей идеологии к ЯСУ, и сравнения их возможностей мы уточним понятие семиотической модели, введенной в гл. 1, и укажем место ЯСУ в этой ^юдeли. Основной единицей ЯСУ является простая ядерная конструкция в виде тройки (xzy). В средней ее позиции находится некоторое отношение или действие. В крайних позициях — понятия. Если в средней позиции стоит отношение иметь имя, то в правой позиции стоит имя, а если отношение в средней части тройки есть отношение иметь оценку, то в правой позиции стоит оценка. Если, наконец, в средней позиции стоит отношение мера — значение, то в левой позиции стоит понятие — мера, а в правой —числовое значение. Пример 2.1. Покажем, как фразы, описывающие некоторую ситуацию, можно представить простыми ядерными конструкциями ЯСУ. Начнем с фразы «Деталь № 1244 обрабатывается на станке». В этой фразе на ЯСУ как бы две фразы: «Деталь имеет имя Кя 1244» и «Деталь обрабатывается на станке». Будем использовать для указания одновременного существования двух фактов знак конъюнкции &,'который везде, где в нем не будет специальной необходимости, будем опускать. Тогда, если ввести обозначения: а — деталь, b — станок, d — обрабатывается (здесь и сейчас), i — № 1244, то сообщение в языке ситуационного управления запишется в виде (apt) (adb). Или в другой эквивалентной форме, не требующей повторения некоторых символов: {{api)db). Другое описание: «Изготовлено 100 автомобилей ВАЗ 2103». Если q — автомобиль, 1^ — ВАЗ 2103, r^g — находится в состоянии^ di — быть готовым, и — мера, ■—• мера — значение, — иметь, v — штука, то это описание примет вид iiiqph) г, {{upv) r,,lOO))r,,d,). Здесь самая левая простая ядерная конструкция говорит о том, что в описании идет речь об автомобилях ВАЗ 2103, конструкция (upv) — о том, что мера имеет имя штука, а присоединенная к ней Гц, 100—100 штук. Тогда все в большой левой скобке соответствует тому, что речь идет о 100 штуках автомобилей ВАЗ 2103. И, наконец.
56 "Л. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ отношенпе находиться в состоянии и состояние быть готовым позволяют получить отображение той информации, которая содержалась в исходном описании. Из приведенного примера видно, что в ЯСУ важное значение имеет операция подстановки вместо левого или правого члена простой ядерной конструкции целой простой ядерной конструкции. И этот процесс можно продолжать рекурсивно. В частности, в последнем описании на ЯСУ слева от Гх такая подстановка произведена один раз, а справа от Гх — два раза. Сложной ядерной конструкцией называется тройка вида >1 ((aix) (а^г) (адг/)). На месте а^- могут стоять некоторые квантификаторы или модификаторы, на месте кроме того, люгут стоять модальные операторы, на месте >| — только квантификаторы. На каждом месте люжет стоять несколько модификаторов. Пример 2.2. Рассмотрим следующее описание: «Часто, когда давление выше нормы, температура также выше нормы». Пусть >]j есть квантификатор часто, h — давление, / — температура, т — модификатор выше нормы. Тогда этому описанию соответствует следующая запись на ЯСУ: yii{{mh)r^^{mt)). Отношение г^э, взятое из табл. 2.1, есть отношение причина — следствие. Вместо него можно было бы использовать и отношение способствовать, так как в исходном описании не утверждается строгая каузальная зависимость повышения температуры от повышения давления. При утверждении такой зависимости описание имело бы вид «Всегда при повышении давления выше нормы тe^шepaтypa также превышает норму». Другое описание: «Автомобиль быстро двигался к складу № 2». Если для понятия автомобиль использовать обозначение а, для склада обозначение с, через г^^ обозначить динамическое отношение двигаться к, а через т — модификатор быстро, то приведенное описание можно представить в виде: {а(тг^^{ср Х2 2)). Заметим, что в этом примере мы вместо символьного имени склада, как и в случае 100 штук ВАЗ 2103, использовали в записи непосредственное значение и.мени. Приведенные примеры дают возлюжность записывать на ЯСУ достаточно произвольные описания ситуаций. При этом фразы описания переводятся в отдельные «фразы» ЯСУ. Пример2.3. Рассмотрим следующее описание ситуации на объекте: «Одновременно с погрузкой состава «Москва — Владивосток» необходимо перевести поезд Лд 126 на шестой путь. Бригаду носильщиков № 1 вызвать на платформу Лд 6. На ту же платформу необходимо вызвать тележку для получения почты из почтового вагона. Желательно из бригады Иванова». Это сложное описание ситуаций можно представить в следующей форме, где арабские цифры, необязательные при использовании ЯСУ в ЭВМ, здесь применяются для большей наглядности записи. Они отделяют одни «предложения» ЯСУ от других (1) {{S9h)rb,e)[in9i,){fA){i9h))>
§ 2.S. ФОРЛ\ИРОВЛНИЕ ЛЕКСИКИ ЯСУ 57 (2) {{bpi,)d,{gpi,)), (3) {{kd, (gpi,)) r,3 /) (//'38 ('"^0) {k (Ш q). Здесь использованы следующие обозначения: s — состав, ii — «Москва — Владивосток», е— погрузка, п — поезд, i.^ — № 126, — перевести, — необходимо, / — путь, — бригада носильщиков, ^3 — ^9 1, ^4 — № 6, g — платформа, k — почтовая тележка, / — почта, — вагон, т — почтовый, /з — желательно, q — бригада Иванова. Отношения, использованные в записи на ЯСУ, взяты из табл. 2.1. Таким образом, мы видим, что достаточно сложные описания ситуаций, складывающихся на объекте управления, можно описывать на языке ситуационного управления. Если читателю идея этого языка уже понятна, то он может перейти к тому, как описывать ситуации на ЯСУ в связи со структурой и функционированием объекта управления. Об этом говорится в § 2.7. Параграфы 2.5 и 2.6 не относятся к первому уровню изложения. § 2.5. Формирование лексики ЯСУ ** При работе с некоторой конкретной проблемной областью возникает первая основная проблема: формирование лексики ЯСУ. Словари базовых понятий, отношений, действий, оценок, квантификаторов, модификаторов, имен и модальных операторов должны быть достаточно полными и отражать все стороны объекта управления и способов управления им, необходимые для создания полноценной системы ситуационного управления. И прежде всего это касается создания трех .словарей: словаря понятий, словаря отношений и словаря действий (операций). Эти три словаря — основные для всех систем ситуационного управления. Ибо остальные словари, кроме словаря имен, универсальны. Они одинаковы для всех систем ситуационного управления и носят универсальный характер. Словарь имен является открытым, и в каждой системе надо просто указать принцип образования имен в данной системе. Аналогичное замечание касается словаря значений меры или мер, используемых в данной проблемной области. Словари понятий и действий целиком определяются семантикой проблемной области. Словарь же отношений носит более широкий характер. Из гипотезы 2.3 ^южнo было бы сделать вывод, что этот словарь (в его базовой части) вообще конечен. Некоторые эксперименты, проведенные для нескольких европейских языков (итальянского, английского, русского), как будто подтверждают эту гипотезу. Эксперименты проводились следующим образом. Брался достаточно большой текст из универсальной области (как правило, текст из художественной литературы). Анализируя последовательно фразу за фразой, фиксировались отношения, встречающиеся в этих фразах. Если вновь фикcиpye^юe отношение уже было включено в
58 гл. 2. ЯЗЫКМ для ОППСЛНМЯ ОГЛ.ЕКТЛ и CUTV.MUm ранее рассматриваемый список, то оно пропускалось, если же нет, то сначала делалась попытка выразить его через комбинацию ранее найденных отношений. Например, в тексте «Когда начался бой, начались и его страдания, страхи за свою жизнь. Но в середине сражения эти страхи куда-то исчезли, как бы пропали навечно»; отношение двух событий «бой» и «страх» можно зафиксировать отношением 4 начинаться одновременно, но ^южнo перейти к событиям — «начало боя и начало страха»», «конец боя и конец страха». Тогда вместо отношения Г24 можно употребить для первых двух новых событий отношение — одновременно, а для двух других новых событий — отношение Г22 — быть раньше. Взяв конъюнкцию двух простых ядерных конструкций, мы получим запись, эквивалентную той, которая использовала отношение Гц. Это послужило бы сигналом Р>1с. 2.2 о невключении отношения начинаться одновременно в базовый список отношений. Если же вновь найденное отношение нельзя свести к комбинации уже включенных в список ранее, то оно вносится в список как базовое. Эти эксперименты, проведенные на достаточно больших объемах текстов, дали для разных языков приблизительно одинаковую картину. Список насыш,ался где-то при 175—185 отношениях и далее не пополнялся, что подтверждает гипотезу 2.3 в отношении описания реального мира. Внутренний мир человека, конечно, описывается целым рядом других отношений, не вошедших в тот список, который формировался в экспериментах. Конечность списка отношений интересна скорее концептуально, чем практически. На практике нет особой нужды сокраи;ать его. Ибо это приводит к ненужному усложнению записей, которые и так плохо обозримы. Поэтому на практике стараются построить достаточно полный список отношений, важных для данного объекта управления и методов управления им. Дадим классификацию отношений, несколько отличную от той, которая была приведена в предшествуюи;ем параграфе. Эта классификация опирается на рис. 2.2. На нем А, В и С обозначают множества элементов, присущих объекту управления или выделяемых в процессе управления им, свойств данных элементов и операций, которые могут реализоваться на нем или в системе управления им. Обозначения Rij соответствуют классам отношений, которые можно установить между вершина.\и1 диаграммы, показанной на рисунке. Смысл этих классов очевиден. Например, отношения, входящие в класс Rii, это отношения типа элемент — элемент, а отношения, образующие класс 7?зь—отношения типа операция — элемент. Аналогично интерпретируются и остальные классы отношений.
§2.5. ФОРМИРОВАНИЕ ЛЕКСИКИ ЯСУ 59 а диаграмма, В табл. 2.3 Если теперь через X обозначить любую из вершин Л, В или С, то для X получим диаграмму, показанную на рис. 2.3. На ней D есть множество мер с различными именами, а ^ — множество значений. Штриховая стрелка на диаграмме соответствует тому, что отношение Гд реализуется только, когда X совпадает с 5, а в качестве значений выступают качественные значения признака. В §2.3 мы выделили 11 классов отношений, показанная на рис. 2.2, фиксирует 9 их типов, показана связь этих разбиений. Крестики поставлены в тех клетках, где пересечение разбиений непусто. Здесь нет признаковых отношений. Они поглощены свойствами. Вместо отношения иметь цвет, например, использовано свойство цвет. Нет и количественных отношений, которые определяются не диаграммой, показанной на рис. 2.2, а диаграммой, показанной на рис. 2.3. Приведем примеры отношений, которые могут характеризовать совокупности, отмеченные в табл 2.3 крестиками. Для типа R-ii отношение классификации — «портальный кран относится к погрузочно-разгрузочным механизмам»; отношение при- Таблица 2.3 Типы Классы 1. Отношения фикации класси- + -г 2. Отношения и и я срзЕне- + 3. Отношения лежности принад- -j- -U + + 4. Временные ния отноше- + 5. Пространственные от+ ношения 6. Каузальные ния отноше- 1 1 -г + 7. Инструментальные отношения 8. Информационные от~р ношения 9. Отношения поридка -f- -г надлежности — «стрела есть часть портального крана»; пространственное отношение — «автомобиль находится правее въезда на
GO гл. языки для ОПИСАНИЯ ОБЪЕКТА И CHTNAUHn МОСТ»; каузальное отношение — «перегрев вызывает пожар»; 1шфор- маиионное отноигение — «директор информировал диспетчера», отношение порядка — «станок обрабатывает следуюш,ую деталь». Для типа Ri-.: отношение принадлежности — «пожарный автомобиль есть красный предмет». Для типа R13 каузальное отношение — «преграда заставляет обойти ее», инструментальное отношение — «гвозди забивают молотком». Для типа R21: отношение принадлежности — «пожарный автомобиль красный», информационное отношение — «красное — сигнал опасности». Для типа 7?22- отношение классификации — «синее часть окрашенных», отношение сравнения — «ВАЗ 2106 мощнее ВАЗ 2103», отношение порядка — «оранжевый цвет в спектре следует за красным». Для типа R^y. инструментальное отношение — «рыхлость грунта требует предварительного укрепления пути». Для типа R^y. отношение принадлежности — «операция сложения входит в систему команд ЭВМ», каузальное отношение — «просека возникла из-за вырубки деревьев», информационное отношение — «включение аварийной сигнализации свидетельствует о нарушении работы объекта». Для типа Rs2'. каузальное отношение — «после полировки поверхность стала гладкой». Для типа Rs3- отношение классификации — «смена масла входит в комплекс работ по техническому обслуживанию автомобиля», отношение сравнения — «операция фрезерования труднее операции точечной сварки», отношение принадлежности — «крепление детали в зажиме — часть операции токарной обработки», временное отношение — «реактор сработал раньше, чем включились насосы», каузальное отношение — «из-за прокладки кабеля было необходимо прекратить выполнение монтажных работ», отношение порядка — «сборка является следующей по порядку операцией». Пример 2.4. Приведем для иллюстрации словарь основных лексических единиц, который был использован при создании системы ситуационного управления, помогающей мастеру участка приборостроительного завода принимать решения по распределению работ на участке. В этом словаре содержалось 17 базовых отношений: быть именем, быть частью, быть классом, быть ранее (во времени), быть равным, быть больше, подчиняться, обеспечивать, подготавливать, субъект — объект, перемеи^аться в пространстве на место.,, (для объекта действия), перемеи^аться в пространстве на место... (для субъекта действия), перемеш^аться во времени на..., находиться в окрестности, быть одновременно, быть местом, быть временем.. В этом списке некоторые отношения по сути — действия, но в описаниях текущих ситуаций они представляют собой как бы застывшие действия. Кроме того, в словаре основной лексики содержалось 158 базовых понятий. Перечислим для примера некоторые из них: инвентарный номер, показатель точности, ремонт, фонд времени, время освобождения от работы, деталь — операция, план, срок, длительность, брак, исправление, смена, сутки, рабочая суббота, комплект.
§ :.g. ФОРЛ\ЛЛЬНЛЯ МОДЕЛЬ спнтлкспсл ясу П1 продукция, вал, расценка, трудоемкость, слесарь, фрезеровщик, токарь, кладовщик, автомобиль, электрокар, линия конвейера, корпус, втулка, заглушка, ключ, развертка, матрица, пуансон, обмотка, трансформатор и т. п. Наконец, словарь содержал 7 операций-решений, которые могла принимать система управления: запустить в производство; снять с производства; получить оснастку, материалы, приспособления; выдать оснастку, материалы, приспособления; отремонтировать оборудование; перевеспш рабочего,., на деталь-операцию...; объявить субботу рабочей. Этот пример еще раз демонстрирует, что словарь базовых отношений зависит от специфики задачи куда меньше, чем словари базовых понятий и операций-решений. Отметим также, что при переходе от описаний, использующих естественный язык, к описаниям на ЯСУ не всегда ^южнo провести четкую границу между понятиями и CBoflcTBaNHi, а также свойствами и операциями. Столь же неформальна и граница между отношениями и операциями и отношениями и cвoйcтвa^ш. Это позволяет проектировщику системы с учетом тех или иных прагматических соображений относить те или иные элементы к нужному виду лексики. § 2.6. Формальная модель синтаксиса ЯСУ * Синтаксис ЯСУ можно задать формальным способом, как делается при задании лшожества базовых элементов и синтаксических правил в формальных системах или при задании синтаксиса языков программирования для ЭВМ. Определение 2.1. Множество X={xi}, где х — любые малые буквы латинского алфавита кроме d, f, i, т, п, о, р, v, а i пробегает натуральный ряд, есть множество базовых понятий ЯСУ, Определение 2.2. Множество l = {ij}, где / пробегает натуральный ряд, называется множеством имен понятий ЯСУ. Определение 2.3. Множество D = {di), где i пробегает натуральный ряд, называется множеством действий {опера- ций) ЯСУ, Определение 2.4. Множество V={vi}, где i пробегает натуральный ряд, называется множеством свойств понятий (объектов) и действий ЯСУ. Определение 2.5. Множество Л1 = (т/}, где / пробегает натуральный ряд, называется множеством модификаторов ЯСУ. Определение 2.6. .Множество '>1^{>^}, где / пробегает натуральный ряд, называется множеством квантификаторов ЯСУ. Определение 2.7. Множество 0={oJ, где i пробегает натуральный ряд, называется множеством оценок ЯСУ. В это лшоже- ство входят, в частности, все действительные чихла. Определение 2.8. Множество F={fi}, где i пробегает натуральный ряд, называется множеством модальностей ЯСУ.
6> гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ Определение 2.9. Множество 7? = {г,}и (р, е}, где i пробегает натуральный ряд, называется множеством отношений ЯСУ. Отношения р и е синтаксически отличаются от г,-. Определение 2.10. Множество Х' = {т,л:;}, где g М, а Xj g X, называется множеством модифицированных понятий ЯСУ. О п р е д е л е н и е 2.11. Множество Х"={>|,л:у}, где yit^yi, а Xj^X, называется множеством квантифицированных понятий ЯСУ. Определение 2.12. Множество D' = {m,dy}, где ^УИ, а dj^D, называется множеством модифицированных действий ЯСУ. Определение 2.13. Множество D''={^4j}. где а djeD, называется множеством квантифицированных действий ЯСУ, Определение 2.14. Множество = где а d;€D, называется множеством «модализированных» действий ЯСУ. Определение 2.15. Множество V'^{mtVj}, rjxemj^M, а Vf^V, называется множеством модифицированных свойств ЯСУ. Определение 2.16. Множество V" = {yiiVj}, где ^i^^, а vj^V, называется множеством квантифицированных свойств ЯСУ. Эти определения полностью задают множество базовых элементов формальной системы, соответствуюш,ей синтаксической части ЯСУ. Введем обозначения X=XuX' [)Х'\ D=^D \J D' {} D" {] D"\ V== = V'U V"' и V"• Для задания синтаксиса ЯСУ введем еще три операции: конкатенацию (приписывание символов друг другу), которую никак специально обозначать не будем, конъюнкцию и отрицание с их обычными обозначениями]. При введении синтаксически правильных совокупностей в ЯС^' будем использовать еще круглые скобки. Элементы Л", D и V будем обозначать соответствующими мaлы^ш бук- BaNHi, noMe4eHHbiNm значком тильда. Определение 2.17. Множество простых ядерных конструкций ЯСУ состоит из троек^ bra^ (XirjXh), {Xipjh), (Xi^Oh), (xjrjdk), {xypj), (dir/if,), (dipin), (dt^Oj,), {dirjX^), {dtrf)^), {virpu). i^tn^k)* (Virfdk). Эти конструкции считаются синтаксически правильными. Рис. 2,4 иллюстрирует это определение. Легко yc^ютpeть связь этой диаграммы с диаграмма.\и1, пoкaзaнны^ш на рис. 2.2 и 2.3, а также с табл. 2.3. Подчеркнем, что в данном параграфе речь идет лишь о синтаксической правильности, а не о семантической интерпретации простых ядерных конструкций. В условиях того или иного объекта управления в ЯСУ различные конструкции будут Рис. 2.4
G4 гл. 2, языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ 1'Ь '^2 Теперь охарактеризуем основные элементы ДСС. Определение 2.20. Функционирование истока заключается в порождении в каждый такт функционирования ДСС одного или нескольких объектов с заданными характеристиками в соответствии с законом pix порождения или с законом непорождення никакого объекта в некоторые такты функционирования. Отсюда, в частности, следует, что ДСС функционирует в дискретные такты. Закон порождения объектов в истоках ДСС может быть детерминированным (например, по фиксированному расписанию), либо вероятностным с известным распределением. Определение 2.21. Функционирование стока заключается в устранении из ДСС объектов, попавших в сток. Решатели ДСС делятся на два типа — пассивные и активные. Определение 2.22. Пассивный решатель ДСС представляет собой задержку на определенное число тактов, определяемое типом объекта и этим решателем. Таким образом, пассивный решатель может имитировать в ДСС ожидание в очереди или затраты времени на перемещение между вершинами ДСС, если путь между ними проходит через пассивный решатель. Определение 2.23. Объекты, попавшие в активный решатель, либо меняют свои характеристики, либо для них решается альтернатива о дальнейшем движении по ДСС, либо происходит и то, и другое. Из приведенных определений следует, что истоки не должны иметь входящих связей, а стоки — выходящих связей. Пассивные решатели могут иметь произвольное число входящих связей и одну выходящую связь. Активные решатели имеют по крайней мере одну входящую и одну выходящую связи, но их число может быть и большим. в ряде случаев полезно вводить еще позиции. Их роль состоит в фиксации положения объектов на сети, когда они находятся вне решателей, истоков и стоков. Позиции обычно нумеруются. На рис. 2.5 показана некоторая Р'^^- ДСС. Истоки И на ней изображены квадратиками, пассивные решатели Р — кружками, активные решатели АР — двойными кружками, а стоки С — треугольниками. Позиции отмечены маленькими зачерненными кружками. В графическом представлении ЯСС, конечно, нет особой необходимости, хотя оно и наглядно. ДСС ^южнo задать чисто функцио- .иально, определив законы порождения объектов различного типа
§2.7. ДИСКРЕТНЫЕ СИТУАЦИОННЫЕ СЕТИ (ДСС) 65 В истоках, правила перемещения объектов по ДСС, правила их обслуживания в пассивных и активных решателях. Здесь мы этого не будем делать, а перенесем это в главу, посвященную экстраполяции развития ситуаций. Задача данного параграфа другая. На примерах мы покажем, как ЯСУ ^южнo использовать при описании статических ситуаций, складывающихся в некоторый момент времени на ДСС. Но прежде чем перейти к примерам, введем понятие объекта на ДСС: Здесь первые т характеристик объекта носят временной характер (например, суммарное время, прошедшее с момента появления объекта в ДСС, суммарное время потерь на обслуживание в активных решателях, время ожидания обслуживания в каждом из активных решателей и т. п.), а остальные характеристики могут быть произвольными. Для объектов управления транспортного типа они могут, например, иметь следующее значение: тип объекта, скорость в данный момент, приоритет в перемещении, приоритет в обслуживании, габаритные размеры и вес, конечный пункт перемещения. Для систем другого типа (например, при использовании ДСС для описания системы документопотоков в организационных системах или конвейерного производства) эти характеристики могут быть другими. Пример 2.5. Пусть нам необходимо управлять светофорами на участке города, показанном на рис. 2.6. Он включает в себя два перекрестка с регулируемым движением, соединенных между собой магистралями с односторонним движением. На рисунке эти перекрестки показаны кружками — знаками светофоров. Для описания ситуаций, которые могут сложиться на таком объекте управления, перейдем от конкретного объекта управле}И1я к ДСС. Результирующая ДСС показана на рис. 2.7. Индексы истоков на схеме совпадают с номерами, отмеченными на предшествующем рисунке. Индексы стоков соответствуют римским цифрам на этом рисунке. Верхний перекресток соответствует АР^ нижний ^ ЛР.^. Позиции введены произвольно. Они соответствуют некоторы.м сечениям магистралей, на которых производится учет автомашин. Вместо непрерывного движения автомашин, которое происходит в / t Ж Рис. 2.6 3 д. А. Поспелов
66 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ реальности, на ДСС объекты, соответствующие автомашинам, перемещаются дискретно по позициям и основным вершинам сети. На тех дугах, где позиций нет, перемещение происходит за один такт работы ДСС. Для целей управления исток //^ можно не учитывать, так как он никак не влияет на переключение светофоров на регулируемых перекрестках. Позиции /, 2, 5, 6, 7 можно рассматривать как линии СТОП перед соответствующим перекрестком. Пусть а есть понятие автомашина. Тройка вида (api\) будет пониматься нами как автома- uhiha с государственным номером if^, который и является ее именем. Если b есть позиция, то (bpi'm) означает позицию ДСС с номером 1^,. Тогда запись mh)f39{b9hn)) соответствует тому, что автомашина с номером ij. находится на позиции с номером/^п- Не будем для простоты и удобства описания фиксировать автомашины в вершинах ДСС. Другими словами, все автомашины находятся только на позициях ДСС. Это позволяет нам при описании статических ситуаций (мгновенных фотографий положения) не рассматривать истоки и стоки, а ограничиться только позициями и активными решателями. Активные решатели будем обозначать через h и присваивать им имена 1 и 2. Активные решатели могут находиться в двух состояниях. В первом из них по горизонтальному направлению магистралей (рис. 2.6) горит зеленый сигнал. Во втором состоянии — красный сигнал. Эти состояния мы будем соответственно обозначать kakgi \\g2- Тогда запись ((/гр1) r.^g-o) будет означать, что в горизонтальном направлении магистрали, которая проходит через перекресток, первый светофор находится в таком состоянии, что на нем горит красный сигнал. Введем две характеристики автомобилей: v — скорость, р — тип. Значения скорости будут браться из >шожества (О, 5, 10, 140}, а значения типа — из множества {q^ — специальный, q^ — обычный}. Тогда запись {(oph) гз, фр])) {{api,) г, (vpO)) {{api,} г, (ppq,)) {{hpl) r.^g^) соответствует той ситуации, когда обычный автомобиль с номером стоит на позиции / перед первым светофором, так как в его направлении горит красный сигнал. Такое описание можно выполнить для каждой автомашины, находящейся в этот момент на ДСС. Совокупность подобных описаний и есть полное описание статической ситуации, которая существует в данный момент на объекте управления.
§2.8. другие языки описания ситуации (>7 Пример 2.6. Рассмотрим учреждение, в котором имеются плановый отдел, бухгалтерия, отдел кадров. Между эшып подразделениями существует некоторый документопоток. Имеются стандартные документы нескольких типов и нестандартные документы. В качестве характеристик документов люгут выступать названия атрибутов, имена заполнителей для этих атрибутов и т. п. Каждый документ ^южнo рассматривать как объект на ДСС, в которой есть три истока, три стока и три активных решателя. Другилш словами, каждое подразделение учреждения как бы разделяется на три части: исток, сток и активный решатель (не хотелось бы, чтобы они были пассивными peшaтeля^ш, ибо это означало бы, что документы в некоторых инстанциях не обрабатываются, а «вылеживаются»). Можно ввести позиции, которым, например, будут соответствовать стопки документов, ждущих своей очереди на столе у того или иного работника. При необходимости дюжно развернуть структуру каждого подразделения, сделав каждого его работника, имеющего дело с документами, активным решателем. Но важно, что полученная ДСС принципиально ничем не будет отличаться от ДСС для системы перекрестков, а некоторый объект — документ — от автомобиля. Только смысл его характеристик будет другим и другими законами будет описываться функционирование ДСС. Приведенные примеры иллюстрируют одну важную мысль. Если различные по своей природе объекты управления можно представить в виде некоторой ДСС, то описания текущих ситуаций на этих объектах будут строиться однотипно с использованием универсальных отношений ЯСУ типа н2ходиться в позиции с номером..., иметь имя..., иметь приоритет... и т. п. Это позволяет надеяться на создание универсального по своему составу ЯСУ для описания текущих ситуаций на ДСС. Такая надежда не лишена оснований. В разделе об экстраполяции ситуаций мы еще вернемся к этому вопросу. § 2.8. Другие языки описания ситуаций * Язык ситуационного управления, конечно, не единственный, который можно использовать для описания текущих и полных ситуаций. В настоящем параграфе мы рассмютрим еще три языка, пригодных для этих целей, хотя и обладающих некоторыми недостатками при их использовании для ситуационного управления. Один из них RX-Kod, послуживший исходным прототипом для создания ЯСУ. В языке /?Х-кодов используются лишь понятия и отношения. Каждое понятие, кроме базовых, задается стандартным выражением следующего вида: П-1' /2-1- Графической иллюстрацией этого выражения служит сеть, показанная на рис. 2.8. Из нее вытекает, что понятие как бы определяется через понятия Xi, х.>, x^^_i с помоихью отношений Гь го,
68 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ Пример 2.7. Рассмотрим RX-kojx вида х^ = r^iX^r^^X2r2Xs' Если Xi — мощность, Х2 — увеличение, л:., — прибор, а отношения определяются из табл, 2.1 и табл. 2.2, то этот код можно трактовать как определение понятия усилитель мощности. Для RX-код^ов возможна операция подстановки на место х/, отличных от Хп, /?Х-кодов, определяющих эти Xt. Процесс такой подстановки можно продолжать столько раз, сколько нужно. Получающаяся в результате древообразная структура в виде фрагмента показана на рис. 2.9. В отличие от записей на языке ситуационного управления, RX-Kojlhi не позволяют явно указать связи между лг^, используемыми для определения х^. Если Ху^ — код некоторой ситуации, то компоненты л:,-, в.ходя- щие в ее описание, никак не Рис. 2.8 Рис. 2.9 взаимодействуют друг с другом. Если их взаимодействие нужно отразить, то приходится дублировать компоненты в описании. Пример 2.8. Пусть х^естъ код ситуации, которая задается следующим описанием: «К перекрестку приближается санитарный автомобиль, а сзади него движется грузовик». Пусть Xi — санитарный автомобиль, а — грузовик. Описание ситуации Хз с пo^ющью RX-Kojxsi имеет вид •^'з ^64-^1 64-^2^34-^'l)- Рис. 2.10 Графически этой записи соответствует сеть, показанная на рис. 2.10. Мы не будем останавливаться на тех проблемах, которые вызывает необходимость повторения записей в RX-колгх, так как не собираемся особенно ратовать за применение этого языка в ситуационном управлении, хотя у него и были сторонники. Отметим только одну особенность языка RX'KojxoB. С его помощью можно определять Такие понятия.
§2.8. ДРУГИЕ ЯЗЫКИ ОПИСАНИЯ СИТУАЦИЙ 69 которые образуют классы объектов, никак не связанных между собой. Другими словами, 7?Х^коды могут задавать классы путем простого перечисления их элементов. Например, если Xi есть стол, х2 — кровать, Хз — секретер и т. п., то определяет понятие мебель. В ЯСУ такое понятие ввести невозможно, если не использовать операцию дизъюнкции между простыми ядерными конструкциями этого языка. Второй язык для описания ситуаций, который до сих пор пользуется популярностью среди специалистов по ситуационному управлению,— язык исчисления предикатов первого порядка. В этом языке .можно выразить все то, что выразимо и в ЯСУ, если не учитывать модификаторы и все квантификаторы, кроме принятых в исчислении предикатов кванторов V и 3. У исчисления предикатов есть свои преимущества, связанные с наличием развитых процедур вывода. Об этом мы будем говорить в дальнейшем. Предполагая, что большинство читателей знакомо с классическим исчислением предикатов, не будем тратить здесь место для его описания и ограничимся лишь примером. Пример 2.9. Пусть имеется описание следующей ситуации: «Между роботом и складом находится яма, слева от которой расположен экскаватор». Введем двуместный предикат (х, у) со значением х левее у. Введем еще трехместный предикат Ра (л:, У, 2) со значением у находится между х и z. Если х* — экскаватор, у* — яма, а 2* — склад, то конъюнкция Pi{x*, у*)&Р2{х*, у*, z*) описывает исходную словесную ситуацию. Менее известен среди разработчиков систем ситуационного управления третий язык описания ситуаций — универсальный семантический код (УСК).Простой ядерной конструкцией в УСК является тройка вида (SAO), В этой тройке 5 соответствует субъекту, совершающему акцию Л, а О — объекту, на который направлена данная акция. Такой тройке может, например, соответствовать предложение «Кран разгружает судно». В УСК вводится замкнутая система операций, позволяющих из простых ядерных конструкций строить более сложные цепочки. Пример 2.10. Пусть 5^ — самолет, So — бензозаправщик, А^ — совершать посадку, А 2 — двигаться к, О2 — стоянка № 12. Тогда запись на УСК (Si^ lOi)^ 3(52^ 2О2) трактуется следующим образом: «Самолет совершает посадку и одновременно бензозаправщик двигается к стоянке № 12». Черта над Oi означает незамещенность этой позиции, так как акция совершать посадку относится к самому объекту Si. Незамещенность акции Аз трактуется в УСК как отношение одновременности. Если же A3 трактовать как причина — следствие, то з^^писъ (SiA^Oi)Аз{SiAoO^z) будет соответствовать тексту «Бензозаправщик двигается к стоянке № 12 потому, что са]\юлет совершает посадку».
70 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СНТУАЦИП При создании УСК были реализованы следующие принципы. 1. Полная экспликация смысла. Другими словами, любая запись в УСК имеет один соответствующий ей смысл, причем это смысл на некотором метауровне. Например, первой из цепочек, приведенных в примере 2.10, соответствует метасмысл «Субъект X совершает действие, направленное на себя, одновременно с этим субъект Y совершает действие, направленное на объект Z». Конкретизация метасмыс- ла происходит при конкретной интерпретации всех элементов, входящих в цепочку. Требование полной экспликации смысла приводит к необходимости введения в УСК разнообразных средств для уточнения смысла записи. Например, фраза естественного языка «Станки работают» может трактоваться по-разному, иметь разный смысл. Она может рассматриваться как некоторое общее утверждение о станках вообще или как утверждение, касающееся некоторых конкретных станков, как утверждение, относящееся к некоторому моменту времени, а также как утверждение, справедливое всегда. В УСК вводятся для подобных высказываний специальные маркеры, помогающие уточнить тот смысл, который должен быть приписан данному высказыванию. Так возникают следующие четыре цепочки УСК: {S}oA6~ «Эти станки сейчас и здесь работают (работают одновременно)», {S}^ АО — «Эти станки работают (всегда и везде)», {S' }^ Л О — «Некоторые станки работают», {{S}}^ ЛО — «Все станки работают». Интерпретация таких цепочек в терминах станков означает, что S' в цепочках интерпретировано кгк станок, г А — работают. Фигурные скобки в УСК означают множественность. Двойные фигурные скобки соответствуют квантору общности исчисления предикатов, а штрих — квантору существования того же исчисления. Знаки >| и q —специфические для УСК, соответствуют кванторным и дейктическим утверждениям {всегда и везде и здесь и сейчас). Кроме этих средств в УСК используются символы обычного логического отрицания, модальные операторы и еще целый ряд специальных символов. Важным представляется то, что в последних версиях УСК действительно удалось однозначно приписывать смысл любой цепочке, допустимой синтаксисом УСК, если это приписывание происходит на некотором метауровне. 2. УСК реализует принцип независимости от предметной области. При различных интерпретациях символов, входящих в цепочки, можно получать описания, пригодные для любых мыслимых предметных областей. Это обстоятельство носит принципиальный характер. В языке ситуационного управления принцип полной экспликации смысла реализован не полностью, отношения из базового множества как бы «свалены в одну кучу». Они конкретизованы до различного уровня общности, что требует введения модификаторов на отношения. В языках типа языка исчисления предикатов не реализован принцип экспликации смысла. Записи в этих языках не дают возможности сопоставить \\v смысл ни на каком уровне общности.
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ 71 3. Та семантика, которая реализуется в УСК на метауровне, т. е. без интерпретации символов, входящих в цепочку, является недоговоренной. Она жестко задается семантикой простых ядерных конструкций и синтаксисом производной цепочки. Такое свойство УСК также отличает этот язык от языка исчисления предикатов, в котором смысл предикатных формул зависит от той или иной договоренности. Язык ситуационного управления при заданном списке базовых отношений и их интерпретации приближается в этом смысле к возможностям УСК. 4. Как уже говорилось, исчисление предикатов и другие чисто логические исчисления обладают тем преимуществом, что в них часто можно cфop^шpoвaтb процедуры вывода, имеющие целенаправленный характер, позволяющие за конечное число шагов либо получить нужное преобразование, либо показать, что интересующий нас вывод построить невозможно. К сожалению, ЯСУ и в этом отношении уступает языку логических исчислений. УСК обладает набором правил преобразования цепочек друг в друга. Однако пока еще не доказана ни полнота этого набора, ни эффективность процедуры преобразования, oпpeдeляe^юй способностью через конечное число шагов прекратить преобразования, если цель недостижима. Указанные особенности УСК делают его весьма интересным для использования в системах ситуационного управления. Однако необходимо отметить, что структура цепочек УСК (в отличие от ЯСУ) такова, что для человека интерпретация их смысла бывает весьма зат- руднитель а, а хорошего алгоритма перевода текстов на естественном языке в записи на УСК пока еще не существует. §2.9. Языки представления знаний** Описанный нши язык ситуационного управления, а также другие языки, о которых шла речь выше, при работе с ЭВМ преобразуются в специальные языки представления знаний, удобные для организации машинных процедур. В языках представления знаний (ЯПЗ), используемых в настоящее время, основная единица — слот. Слот имеет следующий вид: -|<имя слота); <f,><v,y: </,><^>„>; <^,>; . . .; <q^,y}. Здесь fi — имена атрибутов, характерных для данного слота, Vi — значения этих атрибутов или множества их значений, а qt — различные ссылки на другие слоты. Пример 2.11. {<АВТОМОБИЛЬ>; <НОМЕРНОЙ ЗНАК) <ММГ 06-40, МММ 65-12); чСОСТОЯНИЕ) <ИСПРАВЕН, В РЕМОНТЕ); <ТИП) <ГАЗ-24, ГАЗ-24); <КОЛОННА), <ГАРАЖ), <ВОДИТЕЛЬ>}. Этот слот имеет имя АВТОМОБИЛЬ, В нем хранится информация о двух автомобилях с указанными номерами, один из которых
72 ГЛ. 2. языки ДЛЯ ОПИСАНИЯ ОБЪЕКТА и СИТУАЦИИ находится в ремонте, а второй — в рабочем состоянии. Оба автомобиля имеют одинаковый тип. Некоторые другие сведения, относящиеся к этим объектам, можно найти в слотах с именами КОЛОННА, ГАРАЖ и ВОДИТЕЛЬ. Например, слот ВОДИТЕЛЬ может иметь вид: (<ВОДИТЕЛЬ>; <ФИО> (Иванов Иван Петрович, Сидоров Никанор Степанович); <НОМЕРНОЙ ЗНАК) <ММГ 06-40, ММЛ\ 65-12)}, При переходе от слота АВТОМОБИЛЬ к слоту ВОДИТЕЛЬ можно установить, что Никанор Степанович Сидоров в данный момент не на линии, а в гараже, или в отпуске, или... Конечно, что происходит в данный момент с Никанором Степановичем сказать нельзя, но одно можно утверждать точно. Он является водителем автомашины МММ 65-12, которая в настоящий момент находится в ремонте. Для упорядочивания информации, хранящейся в отдельных слотах, используется более крупная структурная единица — фрейм. Структура фрейма, как правило, имеет следующий вид: {<имя фреймаХимя слота><значение слота) <имя слота)<значение слота) Отметим, что каждый фрейм — это как бы готовая структура, которая при том или ином заполнении слотов значениями превращается в описание конкретного факта, события, явления или процесса. Поэтому можно говорить о фреймах-прототипах и конкретных фреймах. Фреймы-прототипы хранят знания о предметной области, а конкретные фреймы пополняют эти единицы знания реальными данными. Данные и знания во фреймовых структурах начинают то совместное существование, которое было невозможно реализовать прежними средствами. Отметим также, что имена слотов часто называют ролевыми метками или просто ролями. Это подчеркивает ту особенность этих имен, которая легко демонстрируется, например, на структуре фрейма КОМАНДИРОВКА: {(КОМАНДИРОВКА) <КТО> <значение слота) <КУДА> (значение слота) (К0ГДА)<значение слота) (НА КАКОЙ СРОК) (значение слота) (С КЕМ) (значение слота)}. При этом некоторые слоты при переходе к конкретному фрейму должны быть обязательно заполнены, а другие могут оставаться пу.- стыми. Для нашего примера такой необязательной ролью может быть роль с КЕМ. Во фреймовых языках основной операцией является поиск по образцу. Образец представляет собой фрейм, в котором заполнены не все структурные единицы, а только те, по которым среди фреймов, хранящихся в памяти ЭВМ, будут отыскиваться нужные фреймы. Образец может, например, содержать имя фрейма, а также имя некоторого слота во фрейме с указанием значения слота. Такой обра-
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ 73 зец проверяет наличие в памяти ЭВМ фрейма с данным именем и данным значением слота, указанного в образце. Или в образце может быть указано имя некоторого слота и его значение. Тогда процедура поиска по образцу должна обеспечить выборку из памяти ЭВМ всех фреймов, в которых содержится слот с таким именем и таким значением слота, как у образца. Наконец, может быть задана некоторая логическая функция от имени фрейма, каких-то имен слотов и значений слотов, например, {<КТО> <Иванов В. В.> <КУДА> <Минск>у<Киев> <КОГДА> <1.07.83:>\/<10.07.83^}. Такой образец заставит выбрать из памяти все фреймы, в которых имеются слот <КТО> со значением <Иванов В. В.>, слот <КУДА> со значением <Минск> или <Киев>, а также слот <КОГДА> со значением <1.07.83> или <10.07.83>. Имя фрейма, который будет выбираться процедурой поиска по образцу, в данном случае произвольно. В конкретных реализациях фреймовых языков на процедуру поиска по образцу накладываются конкретные ограничения, которые, однако, дают для пользователя достаточно широкий простор для манипулирования знаниями и данными. Другими процедурами, характерными для фреймовых языков, являются процедуры наполнения слотов данными, а также процедуры введения в систему новых фреймов-прототипов (т, е. новых знаний) и введение новых связей между ними. Применение фреймовых языков для задач управления породило желание ввести типологию основных фреймов-прототипов. В одной из них предполагается ввести четыре типа фреймов: фрейм технологии, фрейм конфликтности, фрейм продукции и фрейм показателя. Первый тип фреймов используется при описании знаний и данных, связанных с протеканием процессов в объекте управления и технологическими моделями, применяемыми при управлении процессом в нормальных режимах. Второй тип фреймов служит для классификации конфликтных ситуаций, способов их обнаружения, выявления причин, вызвавших их, и описания способов устранения конфликтных ситуаций. Фреймы, относяш,иеся к третьему типу, описывают причинно-следственные связи, лежаш,ие в основе процесса получения некоторого конечного продукта или результата (ситуации), что является непосредственной целью управления. Наконец, фреймы четвертого типа задают структуру тех показателей, которыми оценивается сам процесс, протекающий в объекте управления, и результаты воздействия на него со стороны системы управления. Пример 2.12. На рис. 2. И показана структура фрейма конфликтности, в котором использованы следующие обозначения фреймов и ссылок между фреймами: F — фрейм-прототип, Fi — конкретный фрейм, в котором хранятся конкретные данные о возникшем конфликте. Эти данные используются во фрейме F для возбуждения тех или иных связей. Множество {Fi} — все те фреймы, которые требуется анализировать при возникновении конфликта, описанного во
74 ГЛ. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОПЪЕКТА И СИТУАЦИИ Рис. 2.11 фрейме Fi. Множество {Fi} содержит фреймы, выступающие в качестве родовых для фрейма F. В них содержится информация, характеризующая тот класс конфликтных ситуаций, к которому принадлежит ситуация, составляющая значение слотов в f i. Фрейм Л — тот фрейм технологии, к которому относится конфликтная ситуация рассматриваемого вида. Множества (f^}, {fj}, {F\} и (Я}— множества фреймов, в которых содержатся процедуры, позволяющие анализировать конфликтность, возникшую, соответственно, при нарушении работы структурных подразделений на объекте управления, при отклонениях показателей для полуфабрикатов и изделий, при отклонении показателей для материальных и энергетических потоков, циркулирующих в объекте управления, при нарушениях в работе обслуживающего персонала. Эти группы фреймов, по сути, формируют основные сведения о способах устранения конфликта. Фрейм f 9 содержит оценки, позволяющие считать причинам!! возникновения конфликтной ситуации, задаваемой fi, те причины, которым соответствуют только что описанные четыре группы фреймов. В том же фрейме F^ может формироваться оценка степени конфликтности возникшей ситуации. Фрейм fio фиксирует динамику развития конфликтной ситуации, хранит те мероприятия, которые уже были применены при уменьшении степени конфликтности ситуации. Наконец, множество фреймов {f ii} соответствует множеству фреймов, где хранится информация, интересная для анализа причин возникновения конфликтной ситуации типа описанной во фрейме F, а ее конкретным представителем является ситуация, описанная во фрейме f ь Движение по всем связям^/, показанным на рисунке, происходит за счет процедуры, которая хранится во фрейме- прототипе F. Такие многосортные системы фреймов оказываются близкими по своей природе к тому, что многие авторы называют семантической сетью. Это понятие в современной литературе не имеет четкого определения. Поэтому мы ограничимся здесь лишь содержательным обсуждением семантических сетей, затрагивая в основном лишь те аспекты, которые важны для их использования в системах ситуационного управления. Рассмотрим прежде всего два возможных типа семантических сетей: экстенсиональные и интенсиональные семантические сети (ЭСС и ИСС). Напомним читателям, которые читают всю книгу без пропусков, что в § 1.6 мы затрагивали проблему экстенсиональных и интенсиональных знаний. Во фреймовых представле-
§2.9 ЯЗЫКИ ПРЕДСТАВЛЕНИЯ 3}-1АИИИ 75 ниях им в известной мере соответствуют конкретный фрейм и фре^'ьм- прототип с его связями. ЭСС отражает знание о некотором конкретном факте или некоторой конкретной ситуации, фиксируемой в системе управления. ЭСС состоит из вершин и связей между ними. Вершинам соответствуют некоторые объекты, присутствующие в данном факте или ситуации и выделенные с помощью индивидуальных имен из классов однотипных объектов, а связям — те конкретные отношения, которые связывали их в описываемой ситуации или факте. Таким образом, ЭСС фиксируют в себе мгновенные снимки реальной действительности. ИСС внешне ничем не отличаются от ЭСС. Но только вершинам ее соответствуют имена классов, а не индивидуальные имена, а связи отражают те отношения, которые всегда присущи этим объектам. Таким образом, в ИСС фиксируются некоторые закономерности, характерные для той или иной проблемной области. Пример 2.13. Рассмотрим пример ЭСС. Пусть имеется группа фактов, относящихся к множеству, состоящему из трех чисел: О, 1,2. Эти факты касаются двух отношений, определенных на множестве Сумма Рис. 2.12 указанных чисел. Первое из них — отношение строгого порядка, второе — отношение, определяемое операцией суммирования. Пусть Фх — имена этих фактов; тогда всю группу фактов мюжно задать, например, табл. 2.4 и 2.5. ЭСС, в которой отражены факты, приведенные в этих таблицах, показана на рис. 2.12.. На нем вершины сети (квадратики) соответствуют элементам базового множества О, 1,2, вершины, показанные кружками,— факты, отраженные в табл. 2.4 и табл. 2.5. Около стоят
76 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ имена аргументов соответствующих отношений. Имена отношений записаны в вершинах сети, обозначенных ромбиками. Связи от фактов к именам отношений для простоты в нашей ЭСС не имеют специальных меток. Отметим, что в нашем примере знание об отношении суммирования не является полным. Мы не знаем, чему равна сумма 2+0 и сумма / + /. Мы не знаем также, что отношение суммирования на нашем базовом множестве не может быть установлено между элементами 2, стоящими в позициях обоих слагаемых, и между элементами 2 и 1, двумя способами, расставленными по первым двум позициям, характеризующим отношение суммирования. Пример 2.14. В качестве примера ИСС рассмотрим сеть, показанную на рис. 2.13. Она определяет понятие КОМАНДИРОВКА в соответствии с тем ролевым фреймом, который мы рассмотрели для этого понятия в начале данного параграфа. На рисунке имена ролей Рис. 2.13 Таблица 2.4 Таблица 2.5 Имена фактов Имя отношения меньше (<) аргументы отношения меньший больший фу 0 1 ф. 1 2 0 2 Имя отношения суммирование { + ) Имена фактов аргументы отношения 1-е слагаемое 2-е слагаемое сумма Ф, 0 0 0 Фъ 0 , 1 1 Фь 1 0 1 0 2 2 выступают в качестве меток на дугах, а вершины сети помечены именами классов объектов, элементы которых могут заполнять в экстен- сионалах эти вершины. Таким образом, в языках представления знаний можно выделить экстенсиональную и интенсиональную составляющие. При этом различные языки отличаются друг от друга теми или иными средствами для представления интенсиональных знаний. В заключение данного параграфа опишем кратко структуру одного из языков представления знаний, получившего название ФРЛ {язык представления фреймов). Этот ЯПЗ пока единственный, для которого имеется реализация на отечественных ЭВМ. Эта реализа-
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИИ 77 (1-й комментарий: сообщение)) (второе данное )) (/-е данное ))) (имя второй ячейки ))) (имя k-u ячейки )))) (имя второго слота )))) (имя /-Г0 слота ))))) В такой структуре могут отсутствовать некоторые уровни. Например, могут отсутствовать комментарии и сообщения к некоторым данным, во фрейме может быть только один слот, а в слоте только одна ячейка, в ячейке может содержаться только одно данное. Для указания местоположения некоторой порции информации во фрейме в ФРЛ используется индикаторный путь. Примером его служит индикаторный путь для поиска сообщения, хранящегося во втором комментарии к третьему данному первой ячейки седьмого слота во фрейме с именем /. Этот путь имеет вид (/; s7; /1; d3; с2). Анализируя его, легко найти нужный «адрес» в структуре фрейма с именем /. В советских реализациях ФРЛ индикаторный путь требует явного указания всех имен частей структуры фрейма. Сделано это для того, чтобы при поиске адреса использовать не счетчики, а стандартную операцию поиска по образцу. ция существует в двух версиях, одна из которых опирается в качестве базового языка на ЛИСП ЕС, а другая — на версию языка РЕФАЛ ЕС. Имеется несколько систем ситуационного управления, использующих ФРЛ для представления знаний и манипулирования ими. В ФРЛ каждый фрейм представляет собой структуру с максимальной степенью вложенности, равной пяти. Эта структура имеет следующий вид: (Имя фрейма (имя первого слота (имя первой ячейки (первое'данное (первый комментарий: сообщение) (второй комментарий: сообщение)
78 гл. 2. языки для ОПИСАНИЯ OBl>riKTA И СИТУАЦИИ Для работы с фреймами в ФРЛ имеется четыре основных оператора FASSERT, FPUT, FGET и FREMOVE. Оператор FASSERT позволяет ввести в базу знаний тот фрейм, который является аргументом этого оператора. Пусть, например, имеется запись FASSERT (КОМАНДИРОВКА (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович))) (КУДА (S VALUE (Ленинград) (Баку) (Ашхабад))) (КОГДА (S VALUE (2.03.84 (CO.MMENT (Распоряжение и. о. директора Сидорова Евгения Степановича)))))) В этом фрейме три слота с именами КТО, КУДА, КОГДА. Каждый слот содержит одну ячейку со стандартным именем S VALUE. Это имя показывает, что в данной ячейке хранятся обычные данные. К данному, хранящемуся в ячейке S VALUE слота КОГДА, добавлен комментарий, говорящий о том, что лицо, направляющееся в командировку 2 июня 1984 г., отправляется в нее в соответствии с распоряжением и. о. директора Сидорова Евгения Степановича. С помощью оператора FASSERT этот фрейм будет занесен в базу знаний системы, допуская вызов по имени КОМАНДИРОВКА. Оператор FPUT добавляет новые данные в некоторое место фрейма. Аргументом этого оператора служит введенный выше индикаторный путь, в конце которого явно выписывается вставляемая часть. Например, FPUT (КОМАНДИРОВКА; КТО; S VALUE; Сидоров Евгений Степанович; COMMENT; распоряжение директора Петрова Ильи Алексеевича) приведет к тому, что фрейм КОМАНДИРОВКА изменит coдepжи^юe первого слота, который теперь будет выглядеть так: (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович) (Сидоров ЕвгеЕ1ИЙ Степанович) (COMMENT (распоряжение директора Петрова Ильи Алексеевича))))
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИИ 79 При необходимости извлечь из фрейма некоторую информацию для работы используется оператор FGET. В качестве его аргумента используется тот же индикаторный путь. Если, например, имеется оператор FGET (КОМАНДИРОВКА; КУДА; SVALUE;), то с его помощью из фрейма КОМАНДИРОВКА будет извлечена информация, хранящаяся в ячейке слота КУДА. Эта информация будет выдана в виде списка ((Ленинград), (Баку), (Ашхабад)). Наконец, оператор FREMOVE, в качестве аргумента которого выступает все тот же индикаторный путь, позволяет исключать из фрейма ненужную информацию. Если, например, к нашему фрейму применить оператор FREMOVE (КОМАНДИРОВКА; КУДА; SVALUE Баку), то в слоте КУДА в соответствующей ячейке исчезнет данное Баку и содержимым этой ячейки будут лишь Ленинград и Ашхабад. При наличии оператора FREMOVE (КОМАНДИРОВКА) фрейм с этим именем убирается из базы знаний. (В некоторых версиях ФРЛ для удаления фрейма используется специальный оператор FERASE.) Так как истинная адресация в памяти ЭВМ прямо никак не связана с той адресацией, которая образует индикаторные пути, то реальное расположение фреймов и их подструктур в памяти пользователю неизвестно. Соотнесение реальных адресов с индикаторными путями при записи и поиске фреймов и их подструктур осуществляется системой управления базой знаний. В этой же системе работает стандартный «мусорщик», который включается в работу или по специальным сигналам в программе, или автоматически после работы операторов типа FREMOVE. В языке ФРЛ, кроме ячеек SVALUE, предусмотрено еще пять типов ячеек, распознающихся системой как специальные. Ячейки первого специального типа имеют имя S DEFAULT. Содержимое таких ячеек используется «по умолчанию». Такое использование информации возникает тогда, когда при поиске в слоте информации, указанной, например, в индикаторном пути оператора FGET, обнаруживается, что такой информации нет. Тогда вместо нее выдается информация, содержащаяся в ячейке S DEFAULT. Если бы первый слот нашего фрейма КОМАНДИРОВКА имел вид (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович)) (S DEFAULT (Приказа на командировку пока нет))), ТО при наличии оператора FGET (КОМАНДИРОВКА; SVALUE; Сидоров Евгений Степанович) индикаторный путь при поиске привел бы к ненахождению нужного данного. При сигнале об этом систе-
80 ГЛ. 2. языки для ОПИСАНИЯ ОБЪЕКТА И С]Л'УАЦИЙ ма автоматически переилла бы к содержимому ячейки S DEFAULT из этого слота и выдала бы информацию о том, что на Сидорова Евгения Степановича приказа на командировку пока нет. Два типа специальных ячеек SIF ADDED и SIF REMOVED используются соответственно 'при работе операторов FPUT и FRE- MOVE. В качестве данных в этих ячейках стоят имена некоторых процедур, по которым они вызываются и выполняются. Сами процедуры написаны на том языке программирования, на который опирается язык ФРЛ. Как уже говорилось, отечественные системы в качестве базового языка используют ЛИСП или РЕФАЛ. Когда оператор FPUT добавляет что-то в ячейку S VALUE данного слота, то автоматически выполняются процедуры, указанные в ячейке SIF ADDED. Эти процедуры в ФРЛ называются присоединенными. Пусть, например, необходимо хранить сведения о числе командируемых. Тогда первый слот фрейма КОМАНДИРОВКА может иметь следующую структуру: (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович)) (SIF ADDED (A.VIOUNT))) Здесь AMOUNT — имя процедуры, написанной, например, на ЛИСПе. Эта процедура работает следующим образом: к числу, хранимому в определенном месте памяти, добавляется число вновь добавляемых в ячейку S VALUE слота КТО данных. Ячейка SIF REMOVED используется так же, как и ячейка SIF ADDED, но при удалении данных из ячейки S VALUE с по- лющью оператора FPEMOVE. В только что приведенном примере при вычеркивании из списка КТО тех или иных лиц при наличии в структуре этого слова ячейки SIF REMOVED, в которой хранится данное DECREASE, будет включаться процедура, уменьшающая количество командируемых на число данных, указанных в индикаторном пути оператора FREMOVE. В качестве данных ячейки SIF NEEDED также выступают имена процедур. Эти процедуры также являются присоединенными, т. е. выполняются вне языка ФРЛ на базовом языке программирования. Процедуры, хранящиеся в ячейке SIF NEEDED, выполняются тогда, когда в индикаторном пути оператора FGET имеется ссылка на эту ячейку и имя соответствующей процедуры. Если имя процедуры не указано, то выполняются последовательно все процедуры, хранящиеся в ячейке SIF NEEDED.
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ SI Присоединенные процедуры позволяют использовать все возможности вычислительного характера, которые доступны системе программирования базового уровня. Последняя специальная ячейка ■— ячейка с именем S REQUIRE, В качестве данных в этой ячейке хранятся имена некоторых предикатов, определенных на значениях данного слота. Такие предикаты принимают истинное или ложное значение в зависимости от тех реальных ячеек и данных, которые хранятся в данный момент в слоте. Это позволяет, например, отвечать на вопросы: «Верно ли, что среди городов, указанных в слоте КУДА, нет Москвы?», «Верно ли, что в мае командировок не было?», «Верно ли, что Иванов Иван Иванович и Петров Петр Петрович единственные, кто уезжал в командировку в июне 1984 г.?» Предикаты, подобно присоединенным процедурам для проверки истинного значения, вызывают соответствующие процедуры, написанные на базовом языке программирования. В качестве ответа на действие, оказываемое оператором FGET, в индикаторном пути которого после имени некоторого слота указана ячейка S REQUIRE, система выдает список истинных значений всех предикатов на тех данных слота, которые в этих предикатах выступают в качестве аргументов. Пока мы рассматривали изолированные фреймы и работу с ними. Но в языке ФРЛ имеется возможность связывать фреймы между собой в единую сеть. Прежде всего, фреймы связываются друг с другом с помощью отношения род — вид. В ФРЛ связи, характеризующие переход от вида к роду, называются АКО-связи (сокращение от а kind of, т. е. один из). Обратные связи носят название INSTAN- СЕ-связи. Они используются для запоминания пути вверх по АКО- связям для возвращения к начальному фрейму. АКО-связи позволяют сокращать объем информации, хранящейся в базе знаний. Информация, общая для нескольких фреймов, собирается в специальный фрейм, в котором она и хранится в единственном экземпляре. Для получения ее (наследования) фреймами более низкого уровня в них создается специальный слот с именем АКО. В качестве данных, хранимых в ячейке S VALUE этого слота, выступают имена фрейлюв, с которыми данный фрейм связан АКО-связями. Пусть, например, в базе знаний, кроме фрейма КОМАНДИРОВКА, хранится еще фрейм СОВМЕСТИТЕЛЬ. По существующим нормам, если человек отбывает в командировку, то необходимо учесть это при оплате его труда по совместительству. Это означает, что во фреймах КОМАНДИРОВКА и СОВМЕСТИТЕЛЬ слот КТО окажется общим. Для того чтобы не дублировать информацию, можно завести специальный фрейм, присвоив ему имя КОМАНДИРУЕМЫЙ. Этот новый фрейм будет иметь вид: (КОМАНДИРУЕМЫЙ (КТО (S VALUE
82 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ (Иванов Иван Иванович) (Петров Петр Петрович))) (INSTANCE (S VALUE (КОМАНДИРОВКА) (С О В М Е С Т И Т Е Л Ь))) Во фреймах КОМАНДИРОВКА и СОВМЕСТИТЕЛЬ слота с именем КТО не будет. Вместо него будет стоять слот с именем АКО, в котором в ячейке S VALUE будет стоять в качестве данного КОМАНДИРУЕМЫЙ. При наличии подобных ячеек во фреймах КОМАНДИРОВКА и СОВМЕСТИТЕЛЬ выполнение, например, оператора FGET (КОМАНДИРОВКА; КТО; SVALUE) будет происходить следующим образом. Анализируя индикаторный путь, система найдет фрейм с именем КОМАНДИРОВКА и, просматривая его, не обнаружит слота с именем КТО. Это служит сигналом для автоматического обращения к слоту АКО в этом фрейме. Получив информацию о данных, хранящихся в его ячейке S VALUE,^система переходит к поиску фрейма с именем КОМАНДИРУЕМЫЙ, в котором ищет слот с именем КТО. Найдя этот слот, система выделяет информацию, требование на которую было сформулировано в индикаторном пути. При нахождении фрейма КОМАНДИРУЕМЫЙ оператор FGET записывает в его слот INSTANCE имя того фрейма, от которого осуществлен переход по АКО-связи. Поэтому мы и выделили данные в слоте INSTANCE фрейма КОМАНДИРУЕМЫЙ разрядкой. Фактически, их там нет, пока некоторый оператор не перешел к данному фрейму по АКО-связи. В некоторых системах эти данные уже есть, а оператор, пришедший к данному фрейму по АКО-связи, лишь активизирует то или иное данное с помощью специальной метки. Оператор FGET отказывается от выполнения поставленной перед ним задачи (как и другие операторы ФРЛ), если им будут использованы все возможности поиска, предоставляемые АКО-свя- зями и содержимыми ячеек S DEFAULT. В существующих версиях ФРЛ пока еще слабо развиты процедуры, позволяющие вводить на фреймах отношения, отличные от тех, которые образуют структуру типа дерево {род — вид, целое — часть, класс — элемент и т. п.). Однако в последнее время видны успешные шаги в этом направлении, что сделает ФРЛ еще более перспективным для использования в системах ситуационного управления и других системах, традиционно относимых к сфере искусственного интеллекта. Если в ФРЛ не выделяются специальные типы фреймов, что, как отмечалось выше, удобно для практических систем, то в другом языке представления знаний KRL введено семь различных типов фреймов: базисный фрейм, абстрактный фрейм, фрейм-специализация, индивидуальный фрейм, декларирующий фрейм, фрейм-отношение
§ 2.10. ПЕРЕХОД ОТ ТЕКСТОВ К ВНУТРЕННЕМУ ПРЕДСТАВЛЕНИЮ 83 И фрейм-условие. Увеличено в этом языке по сравнению с ФРЛ и число различных по своему значению ячеек. Однако и в этом языке плохо развиты (по крайней мере в тех версиях, которые работают на ЭВМ) средства для эффективной организации и манипулирования с сетевыми фреймовыми структурами. §2.10. Переход от текстов на естественном языке к внутреннему представлению ** Между описанием ситуаций на естественном языке и внутренними представлениями информации о них в управляющей системе имеется явный разрыв. Поэтому одной из трудных проблем, которые приходится решать при создании систем ситуационного управ ления, является проблема преобразования словесных описаний во внутренние представления. Эта проблема тесно связана с задачей построения диалоговых систем, базирующихся на естественном языке. Однако для ее решения недостаточно воспользоваться готовыми лингвистическими процессорами, обеспечивающилш диалог. Требуется еще получать специфическую информацию, связанную с функционированием Анализатора, показанного на рис. 1.7. Напомним, что его задача состоит в классификации поступившей информации в соответствии с теми задачами, которые должна решать система управления. Эти задачи могут быть трех типов: пополнение системы новой информацией об объекте управления или способах управления, формирование ответа на некоторый запрос на основе информации, уже хранящейся в системе, поиск решения в ситуации, описание которой уже поступило в систему. Первые две задачи — вспомогательные, третья — основная. Но разделение их на три класса нужно производить при преобразовании входного текста во внутренние представления. Именно на этом этапе система должна «понять», что от нее требуется. Поэтому Анализатор может рассматриваться как составная часть лингвистического процессора. На рис. 2.14 показана традиционная структура лингвистического процессора, в котором анализ поступившего на вход текста идет по предложениям в порядке их поступления. Сначала для всех слов, входящих в него, из словаря находят нужные ^юpфoлoгичe- ские и синтаксические характеристики, приписывают род, число, падеж, наклонение и т. п. Затем происходит синтаксический анализ, цель которого состоит в выявлении синтаксической структуры предложения. Она имеет вид дерева и nanoNHiHaeT известные всем деревья, получающиеся в результате школьного разбора предложений. На этом этапе вычленяется сказуемое и именная группа существительного, а также все остальные зависящие от них члены предложения. На этапе семантического анализа строится семантическая структура предложения, происходит процесс его интерпретации в терминах, используемых в языке представления знаний. На этом этапе лингвистический процессор взаимодействует не только с соб-
84 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ ственными словарями, но и с базой данных и базой знаний, отображенных на наилем рисунке в виде блока Модель проблемной области. После этой интерпретации наступает очередь Анализатора, которому в нашей схеме соответствует Блок прагматического анализа. В реальных лингвистических процессорах и диалоговых системах структура, показанная на рис. 2.14, может видоизменяться. Последовательный харак- Входное предло>нение блок морсрологического анализа Блок синтокси^/еского анализа Словарь Блок семантического анализа Модель проблемной области L Блок прагматического анализа Решение на основании текста тер выполнения отдельных этапов анализа может стать последовательно - параллельным, когда некоторые этапы начинают выполняться раньше окончания пред- шествуюи;их. Некоторые этапы (например, этап морфологического анализа) могут вообще отсутствовать. При построении систем, ориентированных на узкие проблемные области, можно вообще отказаться от структуры, показанной на рис. 2.14. Кроме того, большим недостатком существующих лингвистических процессоров является то, что они работают лишь с отдельными предложениями и не улавливают смысла целого текста, что резко сужает возможности таких систем. Особенно это следует учитывать при создании систем управления обсуждаемого здесь типа. Ибо описание ситуации, как правило, носит характер текста, состоящего из ряда предложений. И как тут не вспомнить высказывание выдающегося советского психолога А. Н. Соколянского, создавшего методику обучения языку слепоглухонемых. Он писал: «Основным элементом является текст, но ни в коем случае не отдельное слово и не отдельное предложение. Название закрепляется не за предметом, а за ситуацией, в которой используется предмет» ^). Мы не будем здесь развивать его мысль, поскольку это увело бы нас в сторону от основной темы настоящего параграфа. В комментариях к данной главе читатель найдет сведения о той литературе, где эти вопросы обсуждаются подробно. Мы же перейдем к описанию мето- Рис. 2.14 ^) С о к о л я н с к и й А. Н. Обучение слепоглухонемых языку.— Тезисы конференции по машинному переводу. М.: 1958.
§ 2.10. ПЕРЕХОД от ТЕКСТОВ К ВНУТРЕННЕМУ ПРЕДСТАВЛЕНИЮ 85 дов перехода от текста к представлениям, характерным для языка ситуационного управления. В § 2.3 мы приводили таблицы статических и динамических отношений, которые могут использоваться при описании ситуаций, складывающихся на объекте управления. Мы говорили о том, что число базовых отношений такого рода конечно и включает в себя не более 200 отношений. Некоторые из них приведены в табл. 2.1 и 2.2. В § 2.4 мы привели табл. 2.3, которая показывает, что на множестве отношений можно ввести некоторую иерархию (в данном случае двухуровневую). Пусть теперь выбрана некоторая проблемная область и зафиксирован словарь основных понятий, которые будут использоваться для описания характерных для нее ситуаций. Для перехода от словесных описаний к записям на ЯСУ необходимо научиться находить соответствие между некоторыми частями текста и символами, используемыми в ЯСУ. В § 2.3 мы выделили восемь классов — понятия, имена, отношения, действия, квантификаторы, модификаторы, модальности и оценки. Кроме того, для отношений и действий мы дали более подробную классификацию внутри этих классов. При небольшой проблемной области (в смысле используемого словаря для описания ситуаций и принимаемых решений по управлению) нужное нам соответствие можно задать с помощью специальных таблиц. Пример 2.15. Предположим, что в памяти системы хранится табл. 2.5. Таблица 2.6 Лексическая единица Фрагмент на ЯСУ Лексическая единица Фрагмент на ЯСУ Температура ё Из-за /-73 Давление b Насос а В коллекторе Насоса а Повысилось ds Необходимо fi Снизилось d2 Включить Нормальное d. № 5 9h Остановка di № 8 pi 2 Остановки d. № 9 Из-за /-49 Автокар h Пусть на ход системы поступил следующий текст: «Давление в коллекторе № 5 снизилось из-за остановки насоса № 8. Необходимо включить насос № 8 или насос № 9». Анализируя последовательно этот текст, можно построить соответствующее ему внутреннее представление. Сначала вместо слова давление подставляется b ~ его обозначение во внутреннем языке. Затем находятся фрагменты пред-
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 87 страма Шенди, джентельмена»эта ситуация иллюстрируется следующими словами: «Мать моя... могла употреблять трудное слово 20 лет подряд, а также отвечать на него, если то был глагол, во всех временах и наклонениях, не утруждая себя расспросами о его значении». В комментариях к данной главе читатель найдет указания на литературу, в которой описаны системы, опирающиеся на прямой переход от текстов к внутренним представлениям. В настоящее время практика построения транслирующих блоков для перехода от текстов на естественном языке к внутренним представлениям в системах ситуационного управления такова, что создаются узкоспециализированные трансляторы, полностью ориентированные на те проблемные области, для которых они предназначаются. §2.11. Формализация качественных характеристик* Наиболее трудно формализуются при переходе от естественного языка к ЯСУ квантификаторы, модификаторы, оценки и модальности, которые человек использует чисто качественно. Примерами такого рода описаний, присущих человеку, могут служить «Турбина часто выходит из строя», «Потери от плохой регулировки температуры весьма значительны», «Можно включить дополнительный двигатель, но это опасно». Что скрывается за приведенными фразами? Что значит, что турбина выходит из строя часто? Раз в день, в месяц, в год? Каковы на самом деле потери, которые весьма значительны? Сколько они составляют процентов — 20 или 80? И какая регулировка температуры называется плохой? И, наконец, включать или не включать все-таки дополнительный двигатель, ибо сделать это можно, но 0П2СН0? На эти вопросы нет прямого ответа. Язык человека не оперирует точными значениями слов, выделенных в наших вопросах курсивом, и это понятно, так как эти слова сами по себе, вообще говоря, ничего не обозначают. Их смысл полностью определяется некоторой конкретной действительностью, для описания которой они привлекаются. Поэтому утверждения «Для изделия требуется весьма много крепежных элементов» и «В изготовлении изделия участвует весьма много предприятий» говорят о разных весьма много. В первом случае речь, по-видимому, идет о тысячах или десятках тысяч крепежных элементов, а во втором случае количество предприятий, наверное, исчисляется десятками. Человек для понимания смысла подобных слов и словосочетаний очень часто привлекает понятие нормы, характеризующей данное явление, факт или процесс. Само понятие нормы тоже текуче, ситуативно, зависит от конкретных условий, в которых воспринимается текст или речь. Если в разговоре двух москвичей фраза «Я живу далеко от работы» ассоциируется у собеседника с затратами времени на транспорт порядка часа, то для жителей Академгородка под Новосибирском та же фраза означает куда меньише затраты
88 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ Норма Рис. 2.15 Никогда Очень редко Не часто, нЕ'рвдко Рис. 2.16 Часто 04i часто Ьеда или словосочетаний, входящих в шкалу. Кроме того, испытуемому предъявляется отрезок шкалы, в левом и правом концах которой стоят слова антонимы, замыкающие шкалу (например, никогда и всегда для шкалы частот), а в середине шкалы расположено слово или словосочетание, соответствующее норме для данной шкалы. На шкале нанесены деления, количество которых больше слов образующих ряд-шкалу. Задача испытуемых состоит в указании интервалов, которые, по их мнению, соответствуют словам шкалы. На рис. 2.16 показан результат такого эксперимента, проведенного с одним испытуемым по построению шкалы никогда — всегда, когда времени на дорогу до работы. И это связано с различной нормой затрат у москвичей и жителей Академгородка. Пусть некоторая переменная х принимает значения из отрезка [а, Ь] (рис. 2.15), И пусть наблюдения за значениями х позволили построить гистограмму, показанную на этом рисунке. Тогда норму будут характеризовать те значения х, которые встречались наиболее часто. Человек выде- ляет некоторый интервал значений (х*, x**), внутри которого он готов считать все значения нормальными. Если значения х ъ Значение лежат левее интервала нормы, •2^ то человек склонен их считать меньилими нормы, а когда значения X оказываются правее а'**, то человек интерпретирует их как превосходящие норму. 'icM самым он оперирует с некоторой шкалой, в которой понятие нормы занимает центральное положение. Примером такой шкалы для оценки расстояний служит следующий ряд слов: вплотную; очень близко; близко; не далеко, не близко (норма); далеко; очень далеко. Другим примером может служить шкала для оценки частоты событий или явлений: никогда; почти никогда; очень редко; редко; не часто, не редко (норма); часто; очень часто; почти всегда; всегда. Такого же типа шкалы можно образовать на антонимичных парах слов: большой — маленький, много — мало, сильно — слабо и т. п. Можно провести следующий эксперимент, который действительно неоднократно проводился с испытуемылш разного возраста, социального положения, национальности. Испытуемому предъявляется стопка карточек, на каждой из которых написано одно из слов
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 89 шкала включала следуюш.ие слова: никогда; очень редко; редко; не часто, не редко; часто; очень часто; всегда. С понятиями никогда и всегда испытуемые, как правило, связывают лишь конечные точки отрезка. Остальные слова интерпретируются ими некоторыми отрезками, аналогично тому, как показано на нашем рисунке. Если теперь набрать достаточную статистику на большой группе испытуемых, то можно построить некоторую обобщенную шкалу по группе испытуемых. При этом возникает определенная трудность, так как границы интервалов для слов у разных испытуемых Рис. 2.17 могут оказаться различными, что заставляет переходить к некоторой гистограмме, пример которой показан на рис. 2.17. Пять кривых, показанных на ней (для слов никогда и всегда отклонений, практически, нет) называются функциями принадлежности слов очень редко; редко; не часто, не редко; часто и очень часто. Понятие функции принадлежности, которое возникло у нас в связи с обработкой экспериментального материала, может быть задано вполне строго. Функцией принадмжности для некоторого множества W называется функция \i{w), определенная на всех элементах множества W'^W и принимающая значения из отрезка 10,1]. Смысл этого определения можно интерпретировать следующим образом. Если для некоторого w^W \i{w)=Q, то это означает, что w не принадлежит W\ если для некоторого w^W |л (ii^) =^ 1, то ^ принадлежит Если же для некоторого w 0<|х(^)<1, то это означает, что W принадлежит W с некоторой возможностью, оцениваемой величиной \i{w). Пример 2.16. На рис. 2.18 показан ряд картинок. Относительно левой из них мы не сомневаемся — это человек. Относительно правой сомнения также нет. Это, конечно, кошка. Будем формировать по множеству показанных на рис. 2.18 изображений множество W, интерпретируемое кг^к изображения кошек. Тогда для правого изображения функция принадлежности к этому множеству |х(^) = 1, а для левого — |х(^) = 0. Остальные изображения, по-видимому, нельзя со столь глубокой уверенностью отнести к данному множе-
90 ГЛ. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ Рис. 2.18 дает по каждому изображению свою числовую оценку, можно усреднить ее по всем экспертам и получить для каждого изображения значение функции принадлежности для множества изображения кошек. Интересно отметить, что характер экспертизы во NmoroM зависит, как уже говорилось, от нормы, которой придерживаются эксперты. Если в данном социуме не принято носить усы, то, возможно, все оценки экспертизы сместятся в сторону их увеличения. Еще более наглядно это может быть продемонстрировано на примере образования значений функции принадлежности к такому, например, ^шoжecтвy, как старые люди в зависимости от конкретного возраста людей. В социуме долгожителей возраст 50 лет вряд ли может получить большое значение функции принадлежности к этому множеству. Но в социуме, где продолжительность жизни в среднем невелика, для возраста 50 лет может быть получена весьма высокая степень принадлежности к множеству старые люди. Вернемся к рис. 2.16 и 2.17. Л\ожно ли их связать между собой? Введем уровень отсечки а, где а принимает определенное значение в интервале от О до 1. На рис. 2.17 показано два уровня отсечки с ai>0,5 и а2<;0,5. Эти уровни позволяют выделить две системы заштрихованных отрезков для ai и а.2 на нижних осях. Точки, попавшие в них, соответствуют значениям частоты, которые принадлежат с возможностью, превосходящей данный уровень, к множествам, характеризуемым нашими пятью словами. «Пустые» интервалы значений содержат такие значения частоты, относительно которых с данным уровнем возможности ничего сказать нельзя. Чем меньше а, тем, естественно, большее место занимают заштрихованные от- ству ИЛИ ИСКЛЮЧИТЬ ИЗ него. Значение [i(w) явно возрастает при анализе изображений слева направо. Но возникает проблема, какое численное значение нужно приписать каждому изображению. Ответ на этот вопрос может дать только человеческая экспертиза. Опросив достаточное число людей-экспертов, каждый из которых
§2.11. ФОРМАЛИЗАЦИЯ КАЧНСТВЕННЫХ ХАРАКТЕРИСТИК 91 резки. При некотором значении а* они заполняют всю ось, а при дальнейшем уменьшении а начинают налагаться друг на друга. Это будет означать, что с заданным уровнем возможности некоторое отношение частоты может принадлежать как множеству, определяемому некоторым словом на шкале, так и соседнему с ним множеству. Отсюда вытекает способ выбора а^, обеспечивающий отнесение всех значений на шкале к некоторому единственному множеству. Рассмотрим теперь весьма важную проблему — проблему универсальной шкалы. Пока значения функций принадлежности будут целиком определяться семантикой некоторой конкретной проблемной области, трудно делать какое-либо общее заключение о шкалах или строить процедуры работы с ними. Преобразуем гистограм^ му, показанную на рис. 2.15, следующим образом (рис. 2.19). Отобразим участок кривой, который находится правее экстремальной точки, зеркально вверх, а затем проведем аффинное преобразование полученной кривой так, чтобы точка бывшего максимума получила координаты (0,5; 0,5), а вся кривая вписалась в единичный квадрат таким образом, что Ьг=\^ а=0, f{b) = l и [{а) = =0. Теперь отметим на оси ординат отрезки, соответствующие шкале частоты и полученные экспериментальным путем с некоторым уровнем отсечки а*. Переход на универсальную шкалу происходит следующим образом. Пусть некоторое явление или событие имеет частоту встречи, лежащую в отрезке [ti, ^2!. Спроектируем этот отрезок, используя гистограмму /1 (х), на ось ординат. Ему будет соответствовать отрезок, оцениваемый характеристикой редко. Это означает, что появление события, определяемого гистограммой fi{x) с такой частотой, оценивается как редкое событие. Если мы имеем другое событие или явление со своей гистограммой f-zix), то истинные частоты его появления, оцениваемые как редкие, будут другими. На рис. 2.19 им соответствует отрезок [t|i, TI2], который не совпадает с отрезком [Ei, E2I. Подобно случаю нечеткой шкалы для частот можно построить универсальные шкалы и для других нечетких шкал. Например, для пространственной шкалы по оси абсцисс вначале откладываются расстояния, выраженные в каких-нибудь натуральных единицах Редко ред/<о Частота Рис. 2.19
92 гл. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ измерения расстояний (например в метрах), а по оси ординат размещаются отрезки, соответствующие словам очень далеко, далеко и т. д. Затем происходит перевод всего графика в единичный квадрат при условии, что точка максимума гистограммы попадает в точку (0,5; 0,5). После этого переход от нечеткой пространственной шкалы к универсальной шкале происходит так же, как было сделано для частотной шкалы. Вообще, если имеется некоторая шкала, отражающая некоторый порядок в словесных оценках какого-то явления или факта, и существует способ количественной их оценки, то при наличии гистограммы всегда можно перейти к универсальной шкале, независящей от конкретной семантики данного явления или факта. Опишем теперь иной подход к процессу введения универсальной шкалы. Если объект управления сложен и при описании текущих ситуаций на нем, а также для описания знаний о функционировании объекта и управлении им приходится использовать качественные описания, то ясно, что модель, формируемая-в системе управления, является лишь приближенным описанием объекта и процесса управления им. Но не всякая приближенная модель пригодна для этого, а лишь такая, для которой верно утверждение о согласованности. Смысл нашего утверждения можно проиллюстрировать с помощью рис. 2.20. На нем есть множество состояний w (понимаемых в самом широком смысле) объекта управления. Его можно трактовать как множество всех возможных для объекта точных описаний его состояний. Множество S есть множество описаний полных ситуаций, которые используются системой управления для принятия решений. Отдельные полные ситуации не точно соответствуют истинным описаниям того, что характеризует текущее состояние объекта с учетом его специфики Wi. Поэтому отображение к является нечетким. Вместо четкого однозначного в обе стороны отображения б: Wi<r-^Si мы имеем в обе стороны многозначное отображение X: WiT^Si, где Wi и Si суть подмножества W и S соответственно. При этом отображение б: Wi<r^Si как бы «включается» в отображение X: Wi^^Si, т. е. является одним из отображений этого многозначного отображения к. Пусть О есть некоторый оператор перевода одного полного описания ситуации в другое, а Л — некоторый процесс перехода из состояния Wi объекта управления в состояние Wz- И пусть О имитирует в системе управления переход А. Тогда модель описания будет согласованной, если б: Wi<r-^Si включается в Рис. 2.20
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 93 Я: Wi^Su б: W2<r-^S2 включается в К: й^а^^з и подмножества Wi и W2 таковы, что при данном критерии управления объектом (или соображений о целесообразности, используемых при его управлении) все состояния, попавшие в U^i и W2. требуют одинаковых (с некоторой допустимой точностью) решений по управлению. Другими словами, от X требуется лишь «приблизительная правдивость» передачи того, что происходит на объекте управления, но степень приблизительности не должна превышать некую границу, вне которой решения по управлению, принимаемые в модели, не будут соответствовать необходимым. Это отображение должно быть зеркалом с небольшими искажениями, а не тем «диким зеркалом», о котором в свое время писал В. Набоков: «Одним словом, у вас было такое дикое зеркало и целая коллекция разных неток, т. е. абсолютно нелепых предметов: всякие такие бесформенные, пестрые, шишковатые штуки, вроде каких-то ископаемых,— но зеркало, которое обыкновенные предметы абсолютно искажало, теперь, значит, получало на- стояш,ую пиш,у, т. е. когда вы такой непонятный и уродливый предмет ставили так, что он отражался в непонятном и уродливом зеркале, получалось замечательно; нет на нет дайало да, все восстанавливалось, все было хорошо...» Отображение Я можно задать в виде некоторой матрицы, в которой строкам соответствуют состояния Wi, а столбцам — полные ситуации Si. На пересечении строк и столбцов можно задать число O^m^j^l, которое будет характеризовать возможность замены Wi на Sj или обратной замены. Тогда строки матрицы можно рассматривать как функции принадлежности Wi на множестве полных ситуаций. А столбцы матрицы — как функции принадлежности St на множестве истинных состояний объекта управления. Пример 2.17. Рассмотрим таблицу-матрицу 2.7. Таблица 2.7 Расстояние, Очень близко Близко Не далеко. Да.]еко Очень м не близко далеко 0,5 0,9 0,1 2 0,05 0,65 0,2 20 0,15 0,6 0,05 100 0,05 0,4 0,8 3000 0,05 0,7 0,2 Эта матрица отражает мнение некоторого эксперта и получена в процессе психологического эксперимента. Эксперимент заключался в том, что испытуемые могли ставить свои оценки из отрезка [0,11 с шагом 0,05 в клетках матрицы. Матрица задает пять функций принадлежности значений точной метрической шкалы расстояний к ело-
94 1Л. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ весным оценкам расстояний и пять функций принадлежности словесных оценок на нечеткой шкале расстояний к точным метрическим значениям. На рис. 2.21 для иллюстрации приведена функция принадлежности для не далеко, не близко. Ее график состоит из пяти точек, определяемых тре- долено,не бшдко тьим столбцом матрицы. Кусочно-линейная аппроксимация сделана для наглядности. Отображение Л, за- даваедюе матрицей, можно назвать нечетким отношением модели рова- ния. Оно показывает, как моделируется одна четкая или нечеткая шкала некой другой шкалой. И в частности, как происходит переход от словесных оценок некоторых качественных характеристик к их числовым оценкам, что и является целью настоящего параграфа. С нечетким отношением моделирования можно связать диаграмму моделирования А =^ А' 5000 м в' Здесь А \\ А' — состояния некоторой среды, а В и В' — связанные сними состояния модели, отображающей эту среду. Операторам преобразования Т в среде должны согласованно соответствовать операторы преобразования в модели Q. Для успешности моделирования необходимо, чтобы диаграмма моделирования была коммутативной. Пример 2.18. В предшествующем примере испытуемые строили матрицу как бы вне учета семантики. Представляет интерес выявление ее влияния на построение нечеткого отношения моделирования. В одном из проведенных экспериментов испытуемые должны были вписать оценки в матрицы, подобные использованным в предыдущем примере, при попадании в следующие три реальные ситуации: обход ямы со скользкими краями, обход работающей поливальной автомашины и переход дороги перед быстро движущимся транспортом. Результатом эксперимента оказалась практически та же матрица, которая зафиксирована в примере 2.17, но оценки при переходе от одной ситуации к другой как бы сдвигались на один разряд вправо при переходе от более опасной (третьей) ситуации.
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 95 которой соответствовала матрица из примера 2.17, к менее опасным второй и первой ситуациям эксперимента. Например, в ситуации с поливальной автомашиной расстояние в 0,5 м со степенью принадлежности 0,85 получило оценку близко, а в ситуации обхода ямы со скользкими краями примерно с той же степенью принадлежности это расстояние было оценено как «не далекое, не близкое». Такой линейный сдвиг, наблюдавшийся в описанном выше примере, позволяет выдвинуть весьма важную гипотезу о том, что изменение семантики ситуаций, в которых производится оценка расстояний, приводит к гомоморфному отображению функции принадлежности. Другими словами, если шкалы, на которых заданы наши функции принадлежности или нечеткие интервалы, преобразовать линейно с помощью функции у=ах^Ь, то функции принадлежности не меняются, а меняется лишь семантика той ситуации, к которой они относятся. Высказанная гипотеза должна найти подтверждение в экспериментах с людьми для различных по интерпретации отношений моделирования (пока она проверялась лишь для отношения расстояния). Если эксперименты подтвердят ее, то работа с качественными описаниями существенно упростится. Перечислим в заключение параграфа те задачи, в решении которых нечеткое отношение моделирования может сыграть важную роль. 1. Вычисление функций принадлежности не полностью заданных нечетких лингвистических шкал с помощью вычисления неполного или полного транзитивного замыкания отношения моделирования, задаваемого матрицей типа рассмотренной нами в примере 2.17. 2. Проведение классификации нечетких понятий для уменьшения размерности пространства модели. 3. Возможность аппроксимации новых нечетких понятий, заданных в виде функций распределения или нечетких интервалов. 4. Построение иерархической системы отношений моделирования, что соответствует построению иерархической системы шкал для определения нечетких понятий с различной степенью обобщения. 5. Построение универсальных шкал, учитывающих конкретную семантику тех или иных ситуаций.
г л А в А 3 ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ До того как что-нибудь было, ничего не было. И. Шток §3.1. Постановка задачи Когда человек воспринимает сообндение в виде текста на естественном языке, то имеет место феномен настолько нам привычный, что мы его просто не замечаем. Он состоит в том, что при восприятии сообщения мы воспринимаем гораздо больший объем информации, чем непосредственно в сообщении содержится. И это обогащение происходит за счет трех причин. Во-первых, само сообщение принимается нами в рамках некой ситуации, которая и обогащает его, ибо воспринимается вместе с языковым сообщением. Например, когда вам говорят: «Включите вон тот рубильник», то вы видите, на какой рубильник указывает говорящий, и правильно выполняете указание. Если бы это сообщение не сопровождалось жестом, то сообщение не было бы понято. В вопросе: «Как же это получилось? Посмотри!» текст остается полностью непонятным вне рамок той реальной ситуации, в которой он был произнесен. Итак, к информации, которая содержалась в тексте, как правило, необходимо еще добавлять информацию о той ситуации, в рамках которой возник данный текст. Во-вторых, автор может использовать текст для достижения каких-то своих целей, которые в тексте явно не выражены. Известное определение понятия «зануда» как человека, который на вопрос: «Как поживаешь?» начинает подробно рассказывать о своей жизни за последнее десятилетие, основывается именно на этом. Целью спрашивающего было вовсе не желание получить подобную информацию. Он использовал текст своего вопроса лишь как специальную метку-сигнал для выражения своего внимания к личности слушающего. К тому же типу дополнительной информации относится интонация говорящего, мимика его лица и многое другое. В-третьих, к информации, которая непосредственно выражена в тексте сообщения, немедленно добавляется информация, связанная с ним и хранящаяся в памяти слушающего. Пусть вы услышали сообщение «Прежде чем мы сели, самолет сделал пять кругов над аэродромом. Потом резко снизился и сел. Только на земле я почувствовал, как дрожат у меня ноги». В этом сообщении между фактами, выраженными первыми двумя предложениями, которые непосредственно следуют друг за другом во времени, и последним фактом имеется логический разрыв. Для слушающего он не имеет большого значения. Всякий человек, знакомый с полетами на ca^юлeтax, по-
§3.1. ПОСТАНОВКА ЗАДАЧИ 97 нимает, что после того как самолет сел, произошел еш,е ряд обязательных для данной ситуации фактов: самолет доехал до стояночной плош.адки, выключил двигатель (или двигатели), дверь открыли, был подан трап или спуш,ена лестница, пассажиры, и среди них говоряш,ий, спустились на землю. И только после этого имел место факт «дрожи в ногах» у говоряш,его. И вся эта дополнительная информация помогает слушающему правильно понимать то, что было сообщено ему непосредственно в тексте. Если речь идет о системе управления, то дополнительная информация, возникающая при общении людей в силу первых двух причин, ей недоступна, если система не снабжена, подобно роботу, специальными рецепторными каналами: зрением, слухом и т. п. Поэтому если для управляющей системы подобная информация необходима, то она должна быть сообщена ей вместе с тем основным сообщением, которое передается. Что же касается обогащения информации за счет сведений, хранящихся в памяти системы, то эта функция может быть возложена на саму систему управления. Такую задачу мы будем называть пополнением описания. В рамках данной книги будет рассматриваться лишь задача пополнения описаний за счет специальных семиотических систем. Другими словами, основная задача, которую мы будем обсуждать, это построение специальной системы, обеспечивающей пополнение описания, поступающего на вход. В самом общем виде нужная нам система может быть задана в виде системы продукций вида У\ а=:>р; б. Здесь у означает некоторое условие, выполнение которого позволяет использовать продукцию. Через а обозначен фрагмент той структуры (описания), которая подвергается преобразованию. Само преобразование заключается в замене фрагмента а на новый фрагмент |5. В рамках решения задачи пополнения описаний фрагмент р должен быть в како1\ьто смысле богаче фрагмента а. Наконец, б есть некоторый модификатор условия- у. После применения продукции этот модификатор меняет условие применимости данного правила или оставляет его неизменным. Разные системы пополнения описаний отличаются друг от друга тем, как организованы продукции и как выглядит стратегия их применения к исходному описанию и получающимся в процессе пополнения промежуточным описаниям. Система продукций, в частности, ^южeт образовывать некоторую логическую систему. Такая система должна отражать закономерности, присущие данной проблемной области и способам построения решений на основании описания ситуаций в ней. При этом можно разделить продукции на три типа: дедуктивные, индуктивные и традуктивные. В продукциях первого типа факт р — частный, вытекающий из выполнения условия у и одновременного наличия факта а в преобразуемом описании. Для индуктивных продукций факт р — более общий чем факт а, 4 д. л. Поспелов
98 гл. 3. ПОГЮЛПГНИЕ ОППСЛППИ СИТУАЦИП удовлетворяющш"! условию Y- Наконец, при традуктнвной продукции факты Р и а имеют одинаковую степень общности. Пример 3.1. Рассмотрим три продукции, в которых модификатор б отсутствует. 1. Накопитель деталей станка пуст. Если накопитель деталей станка пуст, то станок простаивает. 2. Станок простаивает. Если станок простаивает, то накопитель пуст. 3. Накопитель деталей станка пуст. Если станок простаивает, то нeoбxoди^ю принять меры по наполнению накопителя. Эти три продукции иллюстрируют соответственно продукции дедуктивного, индуктивного и традуктивного типов. Системы продукций обладают рядом свойств, делающих их весьма удобным средством описания системы пополнения описаний и ее программной реализации. Во-первых, система продукций обладает свойством автономности. Любая продукция мол^ет быть изъята из нее или добавлена в нее, причем все остальные продукции остаются неизменными. Это свойство делает систему продукций гибкой и легко адаптируемой к любым изменениям проблемной области. Заметим, что адаптация продукций может происходить и за счет изменения у и б, что позволяет, сохраняя продукцию в системе, менять ее действие. Каждая продукция есть некоторый законченный фрагмент сведений о проблемной области, и в этом смысле она не зависит от других продукций. Но при необходимости можно устанавливать связи между отдельными продукциями за счет системы взаимных ссылок. Правда, тогда автономность, которую мы описываем, исчезает. Во-вторых, система продукций представляет процедуры преобразования описаний в асинхронном виде. Продукции естественным способом задают возможность параллельной обработки. Каждая из них может выполняться независимо от других, что, правда^ может привести к неоднозначности результата преобразования. Но либо это несущественно (возможны различные варианты пополнения описания), либо имеются специальные процедуры, разрешающие лишь такие параллелизмы, которые не приводят к нежелательным результатам. В-третьих, системы продукций легко отображаются в системы операторов языков программирования. А некоторые языки программирования (например, отечественный язык РЕФАЛ или такой распространенный язык как ПРОЛОГ) имеют продукции в качестве своих основных операторов. Наконец, модели в виде систем продукций охватывают широкий класс различных порождающих моделей, в который входят такие известные модели, как формальные грамматики, исчисления высказываний и предикатов, сетевые модели и многие другие. Во всех известных на сегодня моделях ситуационного управления для решения задачи пополнения использовались именно продукционные системы.
§ 3.2. СЦЕНАРИИ 99 § 3.2. Сценарии Наиболее часто для пополнения используются сетевые модели получившие в последнее время название сценариев. Сценарий представляется некоторой сетью, вершинам которой соответствуют фак ты, а дугам — связи, описываюш,ие отношения специального типа Эти отношения обладают следующим свойством: если между вер шинами X и у существует множество путей Я1, яз, и наличест вуют оба факта а и /?, отвечающие вершинам х и у, то имеет место по крайней мере, совокупность фактов, соответствующих вершинам на одном из путей, соединяющих х и у. Примерами отношений, обладающих указанным свойством, могут служить отношения типа: причина — следствие, часть — под- часть, цель — подцель и т. п. Пример 3.2. На рис. 3.1 показан сценарий, в котором в качестве отношения выступает отношение причина — следствие. Вершинам в этом сценарии соответствуют следующие факты: / — станок простаивает, 2 — на рабочем месте нет рабочего, 3 — станок неисправен, 4 — нет заготовок, 5 — обеденный перерыв, 6 — рабочий отошел от станка во время работы, 7 — внешний поставщик не обеспечил предприятие заготовками, 8 — вышел из строя станок, производящий заготовки для данного станка. Если в памяти системы хранится подобный сценарий и на вход системы поступил текст «Обеденный перерыв», то система с помощью сценария способна пополнить это описание, добавив к нему факты: «На рабочем месте нет рабочего» и «Станок простаивает». Заметим, что nani сценарий говорит о станке вообще, т. е. применим к любому станку. Пример 3.3. На рис. 3.2 показан еще один пример сценария, в котором вершинам соответствуют следующие факты: / — самолет приближается к аэродрому, 2 — самолет запрашивает разрешение на посадку, 3 — ca^юлeт отправляется на круг ожидания, 4 — ca^ю- лет выполняет полет по кругу ожидания, 5 — самолет получает разрешение на посадку, 6 — самолет совершает посадку, 7 — самолет выруливает на стоянку, 5 — к самолету подается пассажирский трап, 9 — пассажиры сходят на землю, 10 — пассажиры находятся у места выдачи багажа. В этом сценарии, в отличие от того, что мы рассматривали в примере 3.2, дуги характеризуют не причинно-следственное отношение, а операциональное отношение. Порядок реализации состояний, характеризуемых вершинами, это порядок во времени. Строгая Рис. 3.1
100 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИП СИТ^^'лциа упорядоченность нарушается лишь альтернативным переходом после вершины 2. В зависимости от реальной ситуации может либо сразу возникнуть состояние, характеризуемое вepuJинoй 5, либо один Рис. 3.2 или несколько раз появятся состояния, характеризуемые последовательностью вершин 2 — 3 — 4 — 2 — 3 — 4 — 2 — . . . — 2, после чего будет осуш.ествлен переход к вершине 5. Если на вход системы поступил факт — самолет совершил посадку, пассажиры ожидают багаж, то сценарий пo^южeт пополнить это описание за счет тех фактов, которые присутствуют в нем и должны были обязательно произойти до появления фактов, соответствуюш.их вершинам 6 и 10. И лишь относительно фактов, соответствуюш,их вершинам 3 и 4, система не может сказать ничего определенного. Пример 3.4. Рассмотрим, наконец, еи;е один сценарий, структура которого показана на рис. 3.3. Дуги на этом сценарии отображают отношение цеуго^ — часть, а вершины интерпретируются следуюш.им образом; / — электропылесос, 2 — верхняя часть, 3 — уплотнитель- ное кольцо с фильтром, 4— нижняя часть, 5 — электродвигатель с вентиляторным устройством, 6 — выключатель, 7 — рассеиватель, 8 — шнур. Сценарий с отношением целое — часть используется при пополнении описаний иначе, чем ранее рассмотренные нами сценарии. Пусть, например, на вход системы поступило описание: «В комнате работал пылесос». За счет имеюш,егося у нас сценария это описание может быть пополнено целой группой фактов типа «Выключатель пылесоса находился в комнате» (имеется в виду та же кo^шaтa, которая упомянута во входном описании), «Шнур пылесоса существовал в момент времени t» (имеется в виду тот момент времени, который соответствовал существованию факта, отраженного в исходном описании). Другими словами, в ряде случаев можно переносить утверждения о нахождении в пространстве и времени, высказанные о некотором предмете, на его составные части. Конечно, это удается не во всех случаях. Если, например, утверждение «Поезд проходит через туннель» перенести на некоторый вагон поезда, то такое перенесение может оказаться и неверным. Данный вагон в этот \юмент времени может еще и не находиться в туннеле. Рис. 3.3
5 3.2. СЦЕНАРИИ [01 Пусть теперь на вход системы поступило описание «Поток воздуха из рассеивателя сдувает бумаги, лежащие на столике». Пользуясь нашим сценарием, можно было бы пополнить описание, например, таким фактом: «Пылесос находится в том же помещении, что и столик с бумагалш в момент времени t» (имеется в виду момент времени, которому соответствует факт, указанный в исходном описании). Как и в предыдущем случае, механическое перенесение пространственных и временных утверждений с части предмета на него целиком, конечно, не всегда возможно. Пополнение с помощью сценария, опирающегося на отношение целое — часть, может касаться не только положения в пространстве и времени. Если, например, входное описание имеет вид «Электродвигатель пылесоса стоит более ста рублей», то в качестве пополняющего факта может быть введен в описание факт: «Пылесос стоит более ста рублей». Этот новый факт может быть сформирован на основании сценария, показанного на рис. 3.3, и дополнительного правила о суммировании цен при переходе от части к целому (более точно, не о суммировании цен, а о сохранении отношения стоить больше). Те дополнительные правила, о которых мы говорили в последнем примере, являются правилалш продукционного типа. Их применимость в том или ином случае связана с выполнением условия применимости продукции. В условие применимости продукции входит также та необходимая связь между объектами, которая фиксируется в сценарии. Таким образом, мы приходим к выводу, что возможны два пути пополнения описаний: за счет формальных свойств используемых в сценариях отношений и за счет семантики последних. Так, в первых двух примерах мы рассмотрели отношения «причина— следствие» и «порядковое отношение». Эти отношения транзитивны. А это значит, что без всякого учета семантики фактов а, наличие в исходном описании фрагментов [а-^га.^ и (аггад) позволяет пополнить описание фрагментом {а^га^). Например, из того, что «Цилиндр есть часть двигателя» и того, что «Двигатель есть часть автолюбиля», следует, что «Цилиндр есть часть автолюбиля». Аналогичным образом происходит пополнение описания, если в не.м используется симметричное отношение. Если, например, на вход системы поступило описание «Сверлильный станок включен одновременно с токарным станком», то оно пополняется фактом «Токарный станок был включен одновременно со сверлильным станком». Другими словами, при наличии фрагмента (aira^) с симметричным отношением г можно автоматически пополнить описание за счет фрагмента (azmi). Но пополнения такого типа, использующие лишь алгебраические свойства отношений, входящих в них, не столь интересны. Более важны правила, учитывающие семантику caNuix отношений и семантику той ситуации, в которой фop^шpyeтcя пополнение.
102 I Л. 3. ПОГЮЛНЕНИЕ ОПИ.САНИП СИТУАЦИИ Пример 3.5. Возьмем из табл. 2.2 отношения л^х— иметь объектом действия и Г74 — действие — место. Пусть а — самолет, U— борт 1244, d — полет, b — город, /о— Одесса. Отношение /-40, взятое нами из табл. 2.1, означает быть сверху. Пусть на вход системы поступила следуюш^ая информация; «Самолет борт 1244 пролетает над Одессой». Запись этого описания на ЯС^' имеет вид {(api,) r.^d) ((арч) Г40 (ЬрЧ))- Между большими скобками опуидено отношение одновременно. Семантика Г71 и Г40 такова, что исходное описание можно пополнить фактом следующего вида: {dr^o (bpi-z)). что соответствует утверждению о том, что полет происходит над Одессой. Приведенные примеры показывают, что сами по себе сценарии еще не решают проблемы пополнения описаний. На самом деле для решения задачи пополнения нужно создавать продукционные системы, в которых правила учитывают семантику отношений, входящих в пополняемое описание. В последующих параграфах (начиная с § 3.4) мы покажем, как строятся такие системы для выделенных групп отношений. В ближайшем же параграфе мы обсудим связь между сценариями и фреймовыми представлениями, которыми мы занимались в гл. 2. § 3.3. Сценарии и фреймы ** Цель данного параграфа — показать, что сценарии легко отображаются в те фреймовые структуры, которые мы описали в § 2.9. Для наглядности здесь мы воспользуемся графическим изображением фрейма в том виде, как показано на рис. 3.4. Каждый прямоугольник соответствует фрейму с определенным именем. Фрейм состоит Имя слота\ Имя cjromg | ... | Имя слота [ Имя сорейма Имя слота\ \ймясуюпю\ Имя дйреОма \ Имя слстпа ... \Имя слогла\ Рис. 3.4 из слотов, имена которых указаны в прямоугольниках меньшего размера. Слоты могут быть тepминaльны^ш или нетерминальными. В последнем случае их имена служат именами др\тих фреймов, составляющих содержание данного слота. TepNninaibHbie слоты задают
104 ГЛ. 3. П0П0ЛНЕЕ1ИЕ ОПИСАНИП СИТУАЦИИ нальные связи и связи типа часть — целое. Покажем, что сценарии такого типа легко отображаются в структуры рассматриваемых нами фреймов. причинно - следственное отношение ^ ... Ш Т Т W Т- Рис. 3.7 Пример 3.6. Вернемся к сценарию, описанному в примере 3.2. Рассмотрим сеть фреймов, изображенную на рис. 3.6 (терминальные слоты заштрихованы). Легко видеть, что эта сеть эквивалентна сценарию, показанному на рис. 3.1. I Проявление : \ • •. \ Проя^и/е/шв л [ Механизм 19оО//ечия Цепочка 1С-отнпч/ечиц \;<c-i\ \пг:--?\ \nF\ о строя кродопотвпя /)ь/зь/бает падение артериального дадле^/ия Причин^ ]^лсдст<^ие Закономерность^ У'ченьшвние объема ц иркулирутщеи /\ро6'и Уменьшение объема плазмы мпови Уменьшение од ь ем а плазмы циркулирующей крови ведет к CHumenuw артераального давления Рис. 3.8 На рис, 3.7 фрейм причинно-следственного отношения показан в общ.ем виде. На нем, кроме слотов ПРИЧИНА и СЛЕДСТВИЕ, имеются еще слоты МЕХАНИЗМ, ВОЗДЕЙСТВУЮЩИЕ ФАКТОРЫ и ЗАКОНОМЕРНОСТЬ. Фреймы, соответствующие слоту МЕХАНИЗ.М, описывают причинно-следственные цепочки (на
106 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СНТУЛЦНГ! конечные тексты. Слоты ВОЗДЕЙСТВУЮЩИЕ ФАКТОРЫ (буквы ВФ с paзличны^иi индексами) отсылают нас к фреймам, в которых описываются факторы, служащие причиной возникновения явления, описанного во фрейме с именем X. Наконец, слоты, соответствующие ЗАКОНОМЕРНОСТЯМ (буквы 3 с различными индек- ca^иI), всегда терминальны. Их содержание отражает характер закономерности, существующей между причинами и следствиями, опи- caнны^иI во фрейме с именем X. Пример 3.7. На рис. 3.8 показано отображение в систему фрей- ^юв причинно-следственного сценария для объяснения факта острой кровопотери. Значение слота СЛЕДСТВИЕ в исходном фрейме ОСТРАЯ КРОВОПОТЕРЯ — имя этого фрейма. Рассмотрим теперь представление сценариев, опирающихся на операциональные отношения, в виде сети фреймов. Пример 3.8. В примере 3.3 мы рассмотрели сценарий, показанный на рис. 3.2 и относящийся к операции посадки самолета в аэропорту. На рис. 3.9 показана сеть фреймов, соответствующая, как легко видеть, сценарию на рис. 3.2. Движение по сети фреймов происходит за счет слотов УСЛОВИЕ. Они позволяют совершать те или иные операции, связанные с данным фреймом. Результаты проведенных операций влияют на значение слотов УСЛОВИЕ в других фреймах, связанных с данным фреймом операционально. В нижней части рисунка показан результирующий фрейм, реализация которого соответствует полному выполнению сценария. Мы не будем увеличивать число примеров. Поясним только на последнем из них, как производится пополнение описания ситуации. Пусть, как и ранее, на вход системы поступил текст: «Самолет совершил посадку, пассажиры ожидают багаж». Эти два факта свидетельствуют о том, что имеются результаты, локализованные во фреймах ПОСАДКА и ПЕРЕХОД В БАГАЖНОЕ ОТДЕЛЕНИЕ. Это позволяет, пользуясь сетью фреймов, показанной на рис. 3.9, двигаясь от имеющихся результатов к условиям последующих фреймов, узнать, что имелись условия для операций, связанных с высадкой пассажиров, а также для реализации всего сценария. Если теперь двигаться по сети фреймов от конца к началу, от условий к результатам, которые определяли данные условия, то мы получим всю нужную нам совокупность фактов. Итак, сети фpeй^юв не только удобны для представления знаний, о чем подробно говорили в § 2.9, но и оказывают важную услугу при решении задачи пополнения описаний. § 3.4. Псевдофизические логики * Мы уже говорили о том, что было бы желательно для определенных классов отношений построить дедуктивные продукционные системы, которые позволяли бы производить необходимое пополнение описаний без хранения в памяти системы совокупности боль-
§3.4. ПСЕВДОФИЗИЧЕСКИЕ ЛОГИКИ 107 шого числа сценариев. Одним из классов таких дедуктивных систем являются псевдо(ризические логики. Название «псевдсфизическпе логики» они получили из-за тсго, что в их правилах вывода использованы свойства восприятия человеком окружающего Nnipa, которое обладает рялом субъективных особенностей. Поэтому они описывают не объективный фпзическш! мир, а его субъективнее госприятие человеком. В отличие от формальных систем, о которых шла речь в § 1.5, псевдофизические логики обладают рядом важных особенисстей. Отметим основные из них. 1. Псевдофизические лсгики суть логики отношений. Именно отношения выполняют в них роль переменных. Поэтому псевдсфизическпе vioTHKH классифицируются в зависи.\юсти от типов используемых отношений. Логика времени изучает взаимосвязь временных отношений, логика пространства — пространственных, логика действий — отношен1и1 типа субъект — действие или действие — место, каузальная логика — взаи>юсвязь отношений типа причина — следствие, частотная логика — отношений типа повторяемость — частота и т. д. Объекты же, связанные oтнoшeния^ni, выступают в этих логиках лишь в качестве неизменной части опг^саний. Поясним это следующим примером. Пусть в нашем распоряжении имеются два факта (аг-.Ф) и (cr^M- них при любой интерпретации объектов а, b п с можно вывести факт (аг22с). Правило вывода такого рода должно входить в систему правил временной псевдофизической логики. 2. Псевдофизические логики суть логики на шкалах. Шкалы бывают двух типов: метрические и топологические. Метрические шкалы в свою очередь делятся на абсолютные и относительные. Топологические шкалы задают между факта.\и1, проецируемылп! на них, отношения нестрогого порядка, или размытые отнои1ения, о которых говорилось в §2.11. Пусть, например, мы рассуждаем о пространственном расположении трех объектов а, b и с на прямой. Если в нашем распоряжении имеется абсолютная метрическая шкала, то на ней задан некоторый масштаб и зафиксировано начало отсчета. Предположим для простоты, что масштаб шкалы выбран так, что объекты, о которых идет речь, люжно считать точечны1\и1, расположенными на делениях шкалы. Ситуация такого типа показана на рис. 3.10,67. При наличии абсолютной метрической шкалы все пространственные отношения на прялюй легко вычисляются и не вызывают никаких проблем. Одна абсолютная илкала отличается от другой лишь расположением начальной точки и масштабом, что дает простые соотношения для перехода от одной шкалы к другой. На рис. 3.10,6 показана относительная шкала, а точка начального отсчета фиксируется только в салн1Х описа}И1ях, например: «В двух километрах за селом находится река, подо села мне еще идти три километра». Относительная метрическая шкала легко переводится в абсолютную. Формулы для такого преобразования тривиальны.
108 гл. 3. ПОПОЛИСНИЕ ОПИСАНИИ СИТ^АЦ[1П Более интересны топологические шкалы. Они тесно связаны с нечеткими словесными оценками, активно используемыми человеком для описания ситуаций (в том числе и технологических, например). Эти словесные оценки определяют лишь некоторый порядок расположения фактов на шкалах. На рис. 3.10, в показан / 5 2 3 5 6 7 8 Наиоло omct/ema Ю 11 12 -i Село Река б Расстояние, км расстояние, км Начало ожчета Рис. 3.10 Поррдкобая шкала пример отображения на топологическую шкалу времен трех фактов: а — скоро наступит момент, когда сталь будет готова, Ь — после разлива стали бригада закончит смену, с — через небольшое время после окончания работы специалисты выйдут с территории предприятия. Топологические шкалы связаны с проблемой формализации качественных описаний и понимания таких описаний. Об этом мы говорили в § 2.11. Различие шкал определяет и различие логик, которые могут быть метрическими и топологическими. 3. Не только факты располагаются на шкалах, но и сам вывод (конструкция продукционных правил) должен учитывать упорядоченность, присущую рассуждениям в рамках псевдофизических логик. Для иллюстрации этого положения рассмотрим следующую схему рассуждений. Пусть нарушение технологии а приводит к ухудшению качества продукции степени |3. Пусть нарушение технологии Y более серьезно, чем а (расположено на шкале серьезности нарушений технологии дальше от начала координат, чем а). Тогда, если а соответствует (5, то ^ должно соответствовать такому ухудшению продукции, которое по шкале оценки ухудшения качества должно находиться дальше (во всяком случае не ближе), чем |i. Рассуждения такого типа весьма важны при создании правил вывода для псевдофизических логик. 4. Псевдофизические логики в качестве своих аксиом содержат некоторые утверждения, вытекающие из восприятия мира человеком. Эти утверждения должны быть обоснованы результатами соответствующих психологических экспериментов. Аксиомы связывают между собой отношения различной природы, что позволяет челове-
§ 3.4. ПСЕВДОФИЗИЧЕСКИЕ ЛОГИКИ 109 Могила целей 1 Логина деистбцй —Г Логика оценок Г Логика каузальная Логике г/ростринс/п^б'ннс/я 1— ——1 Логина npocpipancmtfo - dducwdue ку производить замену одних отношений другими. Примером может служить замена пространственных отношений временными «Далеко ли магазин? — Минут пятнадцать-двадцать ходу.». Здесь замена оказалась возможной благодаря аксиоматическому соотношению, связывающему путь, время и среднюю скорость передвижения пешком. 5. Система псевдофизических логик характеризуется связями, существующими между отдельными логиками. Одни из типов связей проиллюстрирован выше. Аксиому s^vt, где s — путь, i — время, V — скорость, можно рассматривать в качестве связи временной, пространственной псевдофизических логик и псевдофизической логики действия. Примерами связей иного рода могут служить отношения, существующие между каузальной (причинно-следственной) логикой и логикой действий. При построении псевдофизических логик следует учитывать три типа задач, для решения которых они предназначены: а) пополнение поступающих в память системы описаний ситуаций с помощью тех знаний, которые уже хранятся в системе об объекте управления, предыстории управления и законов управления объектом; б) проверка достоверности поступающего описания ситуации, выявление противоречий в этом описании и совместимости его с той информацией, которая уже хранится в системе; в) участие в формировании решений по управлению и проверке возможностей реализации выбранного управляющего воздействия. Однако здесь мы будем обсуждать псевдофизические логики лишь для задач первых двух типов. В последующих главах, посвященных Логики иаостра^стбс - брб^ш Логика дрем&ииая 1 i \ Логика бремя - дайстдие Рис. ЗЛ1
110 гл. 3. ПОПОЛНЕНИЕ ОПИСЛРПШ СИТУАЦИП проблемам обобщения и классификации ситуаций и выработке решений по управлению, мы вновь вернемся к псевдофизическим логикам. Обычно та или иная псевдофизическая логика охватывает круг представлений человека о тех или иных явлениях окружающего мира. Так возникают временная логика, отражающая закономерности, присущие человеку при восприятии времени и рассуждений о нем, пространственная логика, каузальная (причинно-следственная) логика, логика действий, логика целей, логика оценок и т. п. Для задач управления сложными объектами наиболее интересны, именно те шесть логик, которые мы только что перечислили. Эти логики не независимы. На рис. 3.11 показана взаимосвязь между ними, к сожалению, пока в ситуационном управлении использовались лишь отдельные фрагменты псевдофизических логик, что объясняется их неразработанностью. За последние годы в этой области сделаны большие успехи. В настоящее время можно считать, что завершено создание временной логики и статической пространственной логики, созданы фрагменты для логики время — действие и для логики целей. Однако для каузальной логики, логики пространство — действие и, как следствие этого, полной логики действий ситуация пока еще остается не слишком хорошей. Что касается логики оценок, то она в настоящее время проходит в своем развитии этап философского осмысления тех понятий, которые должны быть использованы в ней при построении этой логики, нацеленной на решение задач управления. Более подробные сведения о путях развития псевдофизических логик можно найти в работах; обсуждающихся в комментарии к -гполиеннь/е данной главе. В трех по- ' списания- ^, следующих параграфах мы в качестве примера построения таких логик и использования их для целей пополнения описаний затронем лишь временную, пространственную и каузальную логики. Каждая псевдофизическая логика может рассматриваться как система, имеющая структ}'ру, показанную на рис. 3.12. На нем показано, что сначала из исходного описания выделяется некоторая структура фактов или событий, характерная для данной псевдофизической логики (временная структура, пространственная стру- Модель предстидлений Рис. 3.12
§3.5, ВРЕЛ\ЕННЛЯ ЛОГИКА щ М Это значит, что между ti^s^^h + s^ i ^Р" любом s от О до /г—1 нельзя вста- вить никакого элемента из Т без нарушения порядка. ктура и т. д.). в ней выделены некоторые единицы типа явлений, событий, процессов, фактов и определены отношения между ни^ш из рассматриваемой группы отношений. Эта часть, по сути, не относится к собственно псевдофизической логике и ее функционирование основано на процедурах, описанных в §2.10. В модели представлений отражены те основные закономерности восприятия, которые характерны для системы управления (или человека, если происходит имитация его восприятия). Для конкретных псевдофизических логик эта модель превраихается в модель времени, модель пространства и т. д. Наконец, модель вывода содержит правила, с помоидью которых происходит пополнение описания ситуаций. Функционирование модели представления и модели вывода, а также методика их построения будут ясны из материала следуюш.их трех параграфов. § 3,5. Временная логика ** Мы начнем с рассмотрения наиболее простой псевдофизической логики — временной. Как следует из рис. 3.12, нам нужно построить модель представления времени и модель вывода новых фактов о времени, которые могли бы вытекать из уже имеющихся фактов. Начнем с первой компоненты. Сформулируем сначала некоторые общие свойства времени, которые удобно принять при построении временной логики, ориентированной на использование в системах управления, причем мы не будем учитывать здесь возможных философских возражений, связанных с временем как философской категорией. В комментарии к данной главе об этом говорится более полно. Pacc^ютpим множество Г, элементы которого мы будем называть моментами времени. Зададим на Т полный строгий порядок. Отношение строгого порядка на Г задает порядковую шкалу для моментов времени tt. Рассмотрим другое множество элементы которого ej мы будем называть событиями. Рассмотрим отношение {e^xti), смысл которого сводится к приписыванию событию некого момента времени ti. Мы будем говорить, что событие^; происходит в люмеит времени ti. Если для Cj существует лишь один момент времени tt, в котором оно происходит, то событие е^ в данной шкале называется точечным. Кроме точечных событий, могут быть еще интервальные события и цепочечные событи.я: интервальные события обладают тем свойством, что им с помощью отношения проектирования на шкалу сопоставляются моменты времени tu ti+i, . • ii-^-u^ образующие непрерывную последовательность^) на этой шкале (т.е. имеет место: <^;^1<. . .<ti^k). Для цепочечных событий отображение, осуществляемое с помощью т, произвольно. Ясно, что цепочечные события
112 гл. 3, ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЯ -Декабрь -1985 -Январь 1935 распадаются на совокупность интервальных и точечных, а интервальные события могут заменяться совокупностью точечных событий. Введем теперь специальную операцию дискретизации D^. Если эту операцию применить к множеству Т с заданным на не.м отношением строгого порядка, то с ее пo^юш,ью между любой парой соседних элементов из Т таких, что ti<^ti+^, вставляется ровно п новых элементов t] и ti<t[<t2<. . .<t;,<ti^^. Введем еш,е операцию редискретизации 7?д. Она устроена сле- дуюш,им образом. Если Rn применяется к ^шoжecтвy Т с введенным на нем отношением строгого порядка, то для любой совокупности из п-\-2 элементов 7, образующих непрерывную последовательность tt < t^+i < <. . .<^;+„+i, исключаются п ^сред- них элементов, которые тем самым исключаются и из множества Т. При этом Rn применяется последовательно, начиная с салюго левого элемента из Г, образующего шкалу. После выбрасывания первых п элементов рассматривается новая последовательность из (п+2) элементов, левым элементом которой является сохраненный на -ХХве^ предшествующем шаге правый элемент предшествующей последовательности. Суть введенных операций дискретизации и редискретизации поясним на следующем примере. Пример 3.9. На рис. 3.13, а показана исходная порядковая шкала. На ней моменты времени — годы. На рис. 3.13, б показан результат применения к этой шкале операции D^. Новая шкала устроена так, что между двумя старыми элементами Т появились 11 новых элементов для каждой пары. Для различения элементов введены новые названия. На рис. 3.13, в показан результат применения к исходной шкале операции R^^. С ее помощью каждая непрерывная последователь- ^ ность из 101 элемента преобразована в последовательность из двух элементов, которым присвоены новые имена (XX век, XXI век). Таким образом, с помощью операций и Rn порождается для множества Т бесконечное ^шoжecтвo шкал. Вместо введенных нами операций дискретизации и редискретизации можно для формирова- -/т -19В7 -Февраль -Март -Апрель -Маа -Июль -Июль -Авзуст -Сентябрь -Ошябрь -Ноябрь -Декабрь -Январь -Февраль -Март -Апрель -Май -Июнь -Июль -Август -Сентябрь -Октябрь -Ноябрь -Декабрь -Яндарь 1987 - Февраль Ь 6 Рис. 3.13
§3.5. БРЕ.МЕННАЯ ЛОГИКА 113 1357 год ння новых шкал использовать любую монотонную функцию, так как все такие функции обладают свойством сохранять строгий порядок, заданный на элементах множества Г. Все шкалы такого вида мы в дальнейшем будем называть абсолютными. Если для некоторой шкалы с номером i (нумерация шкал может быть задана произвольным образом, например, с помош,ью ряда натуральных чисел) было произведено отображение элементов множества Е на эту шкалу, то при переходе к новой шкале т^ изменится. Если Cj было точечным событием, то при операциях точечные события сохраняются и отображаются в тот момент времени, который сохраняется в новой шкале в качестве левого момента в обрабатываемой последовательности. Если ej было интервальным событием, то после преобразова- ^ ния оно либо сжимается, стягиваясь ^ к левому концу старого интервала, либо (в пределе) превраш^ается в точечное событие. Цепочечное событие при операциях редискретизации превра- ш^ается либо в цепочечное событие с е,^ меньшими интервалами, либо в интервальное событие, либо стягивается в точечное событие. Пример 3.10. На рис. 3.14, а показано точечное событие соответст- вуюш,ее высказыванию «Константин Циолковский родился 17 сентября 1857 г.». На рис. 3.14, б показано, как преобразовалось это событие в отображение на шкале, в которой совершен переход от дней к месяцам. Теперь точечное событие е[ соответствует высказыванию: «Константин Циолковский родился в сентябре 1857 г.». Интервальное событие е^, показанное на рис. 3.14, а, соответствует в данном случае высказыванию «Весь сентябрь 1857 г. лил, не переставая, проливной дождь». На рис. 3.14, б это же событие показано как точечное (^о)- Если над шкалами производится операция дискретизации, то отображения событий на шкалах могут претерпевать следуюш.ие изменения: точечные события могут превраш^аться в интервальные 1 ;8о7год zQ/Vlli '301VIII 211Vill 2/'/ У 5//X 6/IX 7/lX 8//Л 91/Л 10//X Ill/A /2//Х /J//X Idh'X WIIX /7//Х /8//Х fOjIK 20llX 2//fX 22//X 25/fX 2^//X 25//X 26//X 27//X 2o/,iK 29//X JO//X h'x- 2/X - Опгордрь Рис. 3.14
114 ГЛ. 3. ПОПОЛ£{ЕН11Е 0ПИСу\НИГ1 СИТУАЦИ1Г или цепочечные, интервальные события могут растягиваться или превращаться в цепочечные, а цепочечные события могут приобретать большую длину отдельных своих участков или увеличивать число отдельных интервальных участков. При этом возможны различные комбинации из указанных типов изменений. Пример 3.11. Если использовать рис. 3.14, б и сделать переход к шкале, типа показанной на рис. 3.14, а, то в качестве результата для е[ мы получим интервальное событие ^i', изображенное пунктиром на рис. 3.14, а. Таким образом, сравнение отображения этого события с тем, что было на рис. 3.14, а, показывает, что может возникнуть потеря информации, и операции и Rn не могут рассматриваться по отношению к отображаемым событиям как взаимно обратные. Название, которое мы присваиваем каждому моменту времени ti на той или иной шкале, отражает наше представление о порядке следования этих моментов времени. За точку начального отсчета обычно выбирается некоторое событие, относительно которого имеется всеобщая договоренность. В человеческом обществе существовали самые разнообразные начальные точки отсчета. В допетровское время в нашей стране счет годам велся от сотворения мира, со времен Петра I мы ведем счет от рождества Христова, жители мусульманских стран ведут счет от вхождения Пророка в Мекку и т. п. Важно, что эта начальная точка отсчета для моментов времени раз и навсегда зафиксирована, имеет абсолютное значение. Именно поэтому подобный тип шкал мы назвали абсолютными шкалами. Но кроме абсолютных шкал возможны еще шкалы относительные. В них за начало отсчета принимается тот момент времени, когда происходит некоторое событие, называемое в высказывании, или когда актуализируется само высказывание. В последнем случае обычно говорят о «точке говорения», которую и принимают за начало отсчета для моментов времени. Следующие два примера иллюстрируют высказывания, в которых упоминаемые события отображаются на относительные шкалы: «За два года до начала Великой Отечественной войны Германия захватила Чехословакию» и «Через пять минут обед будет готов». В первом из них за начальную точку отсчета взят момент начала Великой Отечественной войны, а во втором — тот момент, когда актуализируется (например произносится) само высказывание. Абсолютные шкалы и относительные шкалы являются метрическими (в качестве единицы измерения расстояния между ti и tj можно брать увеличенное на единицу число моментов времени, которые образуют от ti до tj непрерывную последовательность) и могут иметь одинаковую (по наименованию) единицу измерения. Однако между hiinm не всегда можно установить прямую связь. Так, для первого из двух приведенных выше высказываний за счет знания факта, что Великая Отечественная война началась в 1941 г.,можно связать относительную шкалу с абсолютной, в которой в качестве наименовании
§3.5. ВРЕМЕННАЯ ЛОГИКА 115 моментов времени используются годы. Если начало отсчета рассматриваемой относительной шкалы совместить с моментом времени с именем 1941 на абсолютной шкале, то событие «Германия захватила Чехословакию» получит точное место с именем 1939 на этой абсолютной шкале. Но для второго высказывания такое отобрал^ение вoз^южнo только в том случае, если в люмент его произнесения посмотреть на часы, которые показывают точное время и календарь, отмечающий текущее число, месяц и год. Без такой информации отображение в абсолютную шкалу окажется невозможным. Таким образом, в любом случае переход от относительных шкал к абсолютным требует привлечения специальных дополнительных знаний, которые должны храниться в памяти системы или наблюдаться ею. Отметим еще, что к относительным шкалам можно применять те же операции и Rn, которые мы рассматривали для абсолютных шкал. Преобразование отображений событий на относительных шкалах в результате применения и Rn происходит по тем же правилам, что и описанные ранее преобразования для абсолютных шкал. Отметим важное для нас обстоятельство, а именно то, что для метрических шкал любое интервальное событие можно полностью определить двумя точечными событиями, соответствующими моментам времени, когда интервальное событие начинается и когда оно заканчивается. Эти точечные события называются маркерами начала и конца и обозначаются как ix^ и ^{^, где / — индекс интервального события ej. Цепочечные события можно заменить на последовательность интервальных событий с разными индексалш, а каждое такое интервальное событие можно задать парой своих маркеров. Кроме метрических шкал, как уже упоминалось в § 3.4, существуют еще топологические шкалы. В таких шкалах люментам времени нельзя сопоставить никаких имен и нельзя ввести расстояния между этими моментами. Таким образом, на топологической шкале можно отразить только порядок некоторых моментов времени. Поэтому при отображении событий на топологические шкалы фиксируется лишь их взаимное расположение во времени. Необходимость в топологических шкалах >южет возникнуть по разным причинам. Примерами их могут служить нечеткое отображение событий на шкалу или нечеткие временные отношения, устанавливаемые между событиями. Первый случай иллюстрируется высказыванием «В начале мая подул свежий ветер». Второму случаю соответствует, например, высказывание «Незадолго до выстрела сосед вышел из комнаты преступника». Разница между этими двумя типами неопределенностей состоит в том, что при переходе от абсолютной шкалы, единицами которой служат дни месяца, к другой, тоже абсолютной шкале, eдиницa^UI которой служат сами месяцы, можно «спрятать» нечеткость первого высказывания. Для высказывания второго типа это принципиально невозможно. Между введенными нами топологическими шкaлa^пI и рассматривавшимся в §2.11 нечетким отношением ;Моделирования сущест-
116 rv. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИИ вует прямая связь. Матрица, задающая это отношение, по сути, является способом перехода от четких шкал (абсолютных и относительных) к нечетким шкалам, которые входят в состав топологических шкал. Поэтому часто топологические шкалы называют размытыми или нечеткими. Л\ы, однако, в нашей книге будем придерживаться введенного термина, так какие всегда топологическую шкалу можно интерпретировать в виде набора функций принадлежности, характеризующих значения лингвистических переменных, как было в §2.11. Отметим также, что матрица, задающая нечеткое отношение моделирования, позволяет преобразовывать и топологические шкалы в некоторые метрические. С помощью преобразования матрицы нечеткого отношения моделирования, сохраняющего порядок, можно вводить классы топологических шкал (по аналогии со шкалами, получающимися для метрических шкал с помощью операций и Rj^ или монотонных преобразований). Для завершения модели представлений во временной логике мы должны еще зафиксировать тот набор временных отношений, который будет использоваться для описания временной структуры ситуаций. Начнем с точечных событий. Одно базовое отношение (б^т^/^), где т — номер шкалы, мы уже ввели. Введем еще четыре отношения: Г21 — одновременно, г^^—быть раньше, Газ—быть позже и г26— непосредственно примыкать слева}) Ясно, что с помощью введенных отношений можно описать любую временную структуру, Е которую входят ЛИШЬ точечные события. Пример 3.12. Рассмотрим следующий текст: «В 9 часов Павел садится, как обычно, на лошадь и в сопровождении наследника отправляется осматривать войска. 10 часов. Обычный плац-парад, развод караула в присутствии императора... С 11 часов их величества изволили прогуливаться по городу верхом: его императорское величество с графом Кутайсовым, а ее императорское величество с фрейлиной Протасовой 2-й». Город, как обычно, пустеет до часу дня, все боятся встречи с Павлом... После обеда «В 4 часа ее императорское величество с фрейлиной Протасовой 2-й изволила выезд иметь в карете в Новодевичий Смольный монастырь и возвратилась обратно в 6 часов. Потом их императорские величества изволили в сей вечер препроводить время с их и.мператорскими высочествами и знатными особами в гостинной комнате...» ^). На рис. 3.15 показано отображение событий, перечисленных в нашем тексте, на абсолютную шкалу. То, что эти события происходили 11 марта 1801 г., указано в источнике, откуда взят текст для примера. Как мы видим, на осях лет, месяцев и дней все события, перечисленные в тексте, отображаются все вместе в одно событие ^) Номера отношений Го1, Ло-2, ^23 и г.,^ совпадают с прпсвоенньрми им номерами в табл. 2.1. 2) Э й д е л ь м а н Н. Я- Грань веков.— М.: Мысль, 1982, с. 268, 274, 275
§ 3.: ВРЕМЕННАЯ ЛОГИКА 117 на каждой из них. На оси часов события разводятся. Эти события являются либо точечными (например, Павел садится на лошадь и отправляется осматривать войска), либо представляют собой некоторое множество событий на оси часов, образуюш.их непрерывную последовательность (например, город пустеет). Некоторые Январь 6 7 3 9 10 ;/ Февраль Март Дни •Повел садится на лошадь ■Плац-параду развод napayjia -На1^ало прогулка по городу Город пустеет -Возвращение с прогулу -На^^ало поездки 6 монастырь Поездка в монастырь ■Возбраш,ение из монастыря Вечер с детьми Месяцы Годы Рис. 3.15 события не привязаны в тексте к точным часам (например, возвращение с прогулки). Наконец, событие, связанное с вечерним препровождением времени императорской четы с детьми, на шкале часов не отмечено, так как в тексте не указаны ни начало, ни конец этого события. Ясно только, что оно началось позже шести вечера. Такие события связаны с топологическими, а не с абсолютными шкалами.
jjg гл. 3. ПОПОЛНЕНИЕ ОППСАНИП СИТУАЦИЙ Для систем управления важно еще ввести функцию p{ei,ej), с помощью которой можно определять расстояние между coбытия^пI ei и на метрической шкале, а также обычные арифметические операции над расстояниями. Это позволит системе управления, например, получить ответ на вопросы типа «Насколько событие е-^ случилось раньше события ер», «Сколько времени прошло между событиями et и ер», «Если ei случилось через т единиц после Cj, ^2 е. \.пп-х ■ ^1 к ■'г -Н'2 Рис. 3.16 а ej было на п единиц раньше г,^, то сколько времени прошло между событиями ei п е^?» Легко видеть, что выбранная нами базовая система отношении для точечных событий не единственно возможная и не минимальная. При наличии функции р можно считать, что события е^ и е^ находятся в отношении г^г. если р(^ь ^;)=0, и в отношении Гге, если эта функция принимает значение 1. Отношения Г22 и можно выразить друг через друга с использованием операций конъюнкции и отрицания: (eir^2ei) = (e7^) i^iriiej). Но стремление к минимальности
§3.5. временная логикл П9 базового набора отношении не всегда оправдано. Чем меньи]е допустимый для системы набор отношений, тем более громоздкими будут представления в ней ситуаций. Правда, уменьшение числа отношений может привести к уменьшению количества правил вывода в модели ввода, но длина вывода в среднем все равно будет возрастать. Поэтому ни здесь, ни в дальнейшем мы не будем решать задачу минимизации базового множества отношений в той или иной псевдофизической логике. Для топологических шкал отношение т не реализуется. Вместо него появляется отношение т, аналогичное нечеткому отношению моделирования. Отношения Г22, ^2з и Ггв сохраняются. Они задаются с помощ.ью специальных размытых квантификаторов вида незадолго до этого, вскоре, сейчас же после этого и т. п. Следовательно, эти отношения также связаны с функциями принадлежности и нечетким отношением моделирования. Наконец, отношение Гц может задаваться либо как точное, либо опять-таки как нечеткое отношение моделирования (например, с помощью квантификатора вида почти одновременно). При работе с топологическими шкалами используется также идея универсальной шкалы, которая обсуждалась в §2.11. Все события, для которых в систему управления люжно ввести сведения о частотных гистограммах этих событий, переводятся на универсальную шкалу. Перейдем теперь к интервальным событиям. Введем для них восемь отношений, семантика которых проиллюстрирована на рис. 3.16. Эти отношения имеют следующие названия: Г22—быть раньше, — быть позже, г^х— начинаться одновременно, г^.^— кончаться одновременно, г^^— примыкать по времени слева, Гг-— пересекаться во времени, г2%— совпадать во времени, г^^— быть внутри по времени. (Названия всех отношений заимствованы из табл. 2.1.) Если для всех интервальных событий указаны маркеры их начала и конца или длина события и один из его концевых маркеров, то отношения между интервальными событиями ^южнo заменить совокупностью отношений между маркерами, т. е. между точечными событиями. Если, например, события е-^ и ^2 находятся в отношении /'25, то для их маркеров выполняются следующие отношения: Другими словами, для маркеров начала событий и ^2 ^югyт реализоваться произвольные отношения, а для маркеров концов этих событий всегда выполняется отношение Г21- Аналогичным образом можно записать отношения между маркерами событий е^ и во, когда между ними реализованы другие отношения для интервальных событий. Однако, к сожалению, это не всегда удается. Весьма часто в текстах содержится неполная информация о моментах начала и окон-
120 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИИ чания интервальных событий. В таком случае отноиленпя между ними задаются фактически на топологическо!! шкале. Пример 3.13. Пусть имеется следуюш,ий текст: «Барон Мюнхгаузен, как был в спальном колпаке и длинной ночной сорочке, спустил ноги в туфли и в следуюш,ую секунду уже сидел в карете и торопил фельдъегеря, хотя тот и сам отчаянно торопился, от нетерпения время от времени соскакивал с козел и, подавая лошадям пример, несколько раз их обгонял. Досадная задержка произошла, когда уже подъехали к Потсдаму. Лошади так разгорячились, что не было никакой возлюжности их остановить. Пришлось объехать Потсдам тринадцать раз, пока удалось, наконец, сдержать тридцать шесть ог- недышаш,их змиев,— на это ушло по крайней мере три минуты. У лошадей затлелись постромки, удила и подпруги, а дуги и дышла охватило огнем, и они сгорели прежде, чем подоспели пожарные.» ^). Приведенный текст можно различным образом преобразовать во временную структуру. Это зависит от способа выделения из него событий. Предположим, что выделение событий таково, что мы имеем следуюш.ие события, верхний индекс у которых показывает, относятся ли они к Мюнхгаузену, фельдъегерю, лошадям или пожарным. ^м — Мюнхгаузен спускает ноги в туфли, — Мюнхгаузен садится в карету и сидит в ней; — Мюнхгаузен торопит фельдъегеря; — Мюнхгаузен покидает карету; — фельдъегерь садится ^ ^ N е? '3 ^3 1 i [У:Ш:^-.^т^:^^^^^^^^^^^^ Рис. 3.17 на козлы; —фельдъегерь соскакивает с козел и некоторое время бежит рядом с лошадьми; — фельдъегерь пытается остановить лошадей; е'1 — лошади несутся; — лошади объезжают вокруг Потсдама; — лошади останавливаются; е2 — у лошадей тлеют постромки, удила и подпруги, а дуги и дышла горят; — подъехали пожарные. Соответствуюш.ая структура показана на рис. 3.17. Для боль- шей наглядности на этом рисунке события, относяш.иеся к разным ^) Г л о б а А. П. Сказки дня и ночи. —М.: Современник, 1976, с. 72.
§35 ВРЕЛ\ЕННЛЯ ЛОГИКА 121 персонажам, показаны на различных временных осях. Разные события выделены штриховкой, зачернены или заполнены точками. Между отдельными осями времени имеется временное соответствие — события, лежащие на одной вертикали, происходят одновременно. На каждой из осей совмещены те события, которые происходят одновременно для данного персонажа. Дадим некоторые дополнительные пояснения. Мы не знаем из текста, когда именно наступают моменты времени, в которые барон Мюнхгаузен торопит фельдъегеря. По-видимому, это происходит неоднократно. Поэтому внутри события е^^ появляется некоторое число событий е^. Оно в реальной системе может, например, породиться случайным образом. Длины событий для Мюнхгаузена не определены анализируемым тексто.м. Однако ясно, что длина значительно превосходит длины остальных событий, события и по длине близки между собой. О событии в тексте вообще ничего не говорится. Его можно было бы и не показывать на рис. 3.17. Но если бы оно не произошло, то базой, наверное, сгорел бы, что противоречит дальнейшему тексту ^лобы. Для фельдъегеря число событий и из текста не определяется, ясно лишь, что общее число событий должно быть на единицу больше числа событий е^. Кроме того, и должны чередоваться и последовательность начинается и заканчивается событием е^. Последнее событие совмещается во времени с началом попытки остановить лошадей. Длина последнего события в тексте определена словами «На это ушло по крайней мере три минуты». Можно предположить, что события и имеют меньшую длительность, хотя для это может оказаться и неверным, если фельдъегерь способен долго бежать в темпе лошадей. Наконец, для лошадей до события продолжается их скачка, часть которой («по крайней мере три минуты») совпадает с событием е?. Когда начинает загораться сбруя — из текста неясно, поэтому начало события не определено. Более или менее ясно, что загорание должно было бы произойти еще во время скачки. Что касается пожарных, то относительно местоположения события их прибытия на место происшествия вряд ли могут быть разногласия. ■ Отметим, что при переходе от текста к временной структуре мы использовали не только те сведения, которые прямо содержатся в тексте, но и некоторую дополнительную информацию, вытекающую из сценариев, связанных с тe^ПI или иными действиями. Подобное положение возникает весьма часто. Именно сценарии играют большую роль при фор1\и1ровании временной структуры и пополнения описаний. Ниже мы будем говорить об этом более подробно. Для цепочечных событий мы не будем вводить собственную систему отношений. Их мы будем сводить к последовательности интервальных и точечных событий, что на самом деле не всегда возможно на топологических шкалах, но этот тонкий вопрос мы здесь рассматривать не будем.
122 гл. 3. ГЮПОЛИЕНПГ ОППСАНИП СИТУАЦИЙ Мы закончили построение модели представлений для временной логики. Эта модель состоит из набора шкал, отношений проекциро- вания Xi или Ti событий на шкалы, системы отношений во времени между событиялп!, связываюш,их отношения для интервальных событии с точечными через маркеры, и функций р для различных шкал вместе с набором необходимых арифметических процедур. Теперь можно перейти к модели вывода новых утверждений о времени на основе тех правил вывода, которые мы заложим в нашу логику, и знаний, храняш,ихся в системе управления. Все правила вывода можно разбить в любой псевдофизической логике на две группы: синтаксические и семантические. К первой группе относятся правила вывода, вытекающие из алгебраических свойств тех отношений, к которым они применяются. Правила второй группы вытекают из некоторой внешней семантической интерпретации этих отно[пений и сценариев, используемых при выводе новых фактов и отношен[1Й. Общее число используемых нами во временной логике отношений равно восьми. Правила первой группы для них строятся следующим образом. Рассматривается некоторое отношение. Выявляются его алгебраические свойства и выписываются соответствующие правила. Например, рассматривая отношение г22, мы убеждаемся, что оно антирефлексивно, антисимметрично и транзитивно. Это позволяет нам написать следую ие три утверждения: (ег22^); (ei/'22^2)=>(^2/'22^i); (^i/'-22^2) (^2^22^3)—>(^1/'22^з). Среди этих утверждений основной интерес представляет третье, которое имеет вид классического правила вывода в виде продукции. Второе утверждение также имеет продукционный вид, но его использование для получения новых фактов сомнительно. Скорее оно может оказаться полезным при проверке содержимого памяти системы на непротиворечивость. В качестве другого примера можно рассмотреть правило типа (^i/*2o^2) (^2^26^3) =>(^ЛбО. Его смысл сводится к тому, что если события ei и Cz заканчиваются одновременно и событие ^2 непосредственно слева примыкает к событию ^3, то и событие ^1 непосредственно слева примыкает к событию е^. Проиллюстрируем работу правил первой группы на примере. Пример 3.14. Вернемся к ситуации, описанной в тексте, приведенном в примере 3.13. Выпишем из этого текста набор ядерных конструкций (троек вида (arb)), который в нем непосредственно содержится. Анализируя текст последовательно, мы получаем следующий набор: {е^г,^е^)1 (e^-,,^f); (^^,,^2''); (^'^22^:^; (^2^22^); (^?^2.э^4). Посмотрим, какую дополнительную информацию можно получить из этого набора. Сравнивая первую тройку со второй и третьей, мы .люжем вывести новую информацию, используя правило вывода {егг^,е^)(е,г,,е^)^>(е,г,,е,).
§3.5. ВРЕМЕННАЯ ЛОГИКА 123 Применяя его, мы находим еще две тройки: {e^^'r^oef) и {efr^ie^). Из четвертой и пятой тройки с помощью соответствующего правила (мы их не выписываем, чтобы не загромождать изложение) получается тройка (^1^22^^). Четвертая и шестая тройки порождают (е?^22^?)^ пятая и шестая — (et'^s2^3). Наконец, две последние тройки порождают новый факт вида {е^Гг^Т}- Интересно сравнить полученный результат с временной структурой, показанной на рис. 3.17. Становится ясным, что правила вывода первой группы дают недостаточно информации для пополнения. События и вообще не возникли, и, следовательно, не возникли временные отношения, связывающие их с остальными событиями. Осталось полностью не определенным, как соотносятся между собой события el и ej, а также события и е^. Всю эту информацию нельзя получить с помощью правил вывода первой группы. Она возникает лишь при обращении к знаниям, хранящимся в виде сценариев в памяти системы. Правила вывода, работающие с этими сценариями, относятся ко второй группе правил. Их работу мы проиллюстрируем на двух примерах пополнения описаний. Пример 3.15. Рассмотрим текст, который уже использовался в примере 3.3: «Самолет совершил посадку. Пассажиры ожидают багаж». При попытке построить временную структуру этого текста, используя только сам текст, нас ожидает полная неудача. Мы выделяем два события: е^—- самолет совершил посадку; е^— пассажиры ожидают багаж. Но мы не можем установить никакого временного отношения между ними. Однако, если в памяти системы хранится сценарий, подобный показанному на рис. 3.2, то с его помощью легко устанавливается нужное отношение, а именно (^1^22^2). Пример 3.16. Предположим, что на вход системы поступил текст «В пятницу на балу Вельчковский публично оскорбил За- ренина, и Заренин, немедля ни секунды, вызвал его на дуэль. После бала Заренин заехал к своему старому другу генералу Мурашёву и попросил его быть секундантом. Был составлен письменный вызови утром в субботу он был вручен Вельчковскому. Сейчас Заренин и Мурашёв писали протокол об отказе от дуэли, ибо срок ответа, даже при наличии веских причин, уже прошел». После анализа этого текста система может выделить следующие события: е^— оскорбление Заренина, е^— вызов Вельчковского на дуэль, ^3— просьба Заренина, обращенная к Мурашёву, и согласие последнего, ^4— составление письменного вызова, в-— вручение вызова, (?б— составление протокола об отказе. Из текста молшо установить следующие тройки: {е^г^^е^)', (^2^22^3); (^3^22^4); {е^^^е-Х (^5^22^.0; {е{^!)\ (e.Tf): (e.xs). Здесь f и S означают соответственно дни недели: пятницу и субботу. Пользуясь oбычны^и^ правилами, связанными с транзитивностью отношений Гос и Го2, система ^южeт вывести еще ряд соотношений типа (eir^iCi). Но из текста она не ^южeт вывести никаких троек, П03В0ЛЯЮ1ЦИХ отобразить с по1\ющью т на шкалу дней недели
124 -'Л. 3. ПОПОЛНЕНИЕ ОПИСЛНИП СИТУЛЦИП события t?3, и с^б. Это можно сделать только в том случае, если в памяти системы имеется сценарий, описывающий принятый порядок проведения дуэлей. Если такой сценарий имеется i), то ясно, что событие ^6 не ^юглo произойти ранее утра понедельника (т), так как ответ на письменный вызов на дуэль должен быть получен от обидчика не позднее, чем через 24 часа после вручения ему письменного вызова. Упомянутые в тексте «веские причины» позволили отдалить ответ еще на 24 часа. После этого, если ответ обидчика не поступал, то составлялся унизительный для него протокол об отказе от дуэли. Так что могло происходить только в понедельник, что позволяет вывести тройку (^етт). В тексте сказано, что Заренин заехал к Мурашёву после бала. Это означает, что скорее всего событие ез произошло в пятницу, так как в XIX веке балы, как правило, кончались к полуночи. Поэтому с большой долей вероятности события бз и ei произошли в пятницу, что позволяет системе вывести еще две тройки: {е.^г[) и (e^rf). Нам остается обсудить проблемы, -связанные с выводом на топологических шкалах. Для возможности отображения событий на таких шкалах обычно используются методы, подобные описанным в §2.11. Прежде всего выбирается список квантификаторов, который мог бы образовать некоторую порядковую шкалу размытых моментов времени. Примером такого списка для временных размытых квантификаторов может служить последовательность: очень давно, давно, недавно, совсем недавно, только что, сейчас, вскоре после этого, очень скоро, скоро, в недсигеком будущем, в будущем. Более или менее ясно, что такая последовательность способна порождать некоторую порядковую шкалу. Для того чтобы последняя .\югла служить для целей вывода и пополнения описаний, необходимо перейти к более точному шкалированию. Для этого используется аппарат функций принадлежности, о которых шла речь в том же § 2.11. Для каждого элемента из заданного списка строится с помощью эксперимента с людьми функция принадлежности этого элемента к отрезку [О, 1]. Затем выбирается такой уровнь отсечки а, который >юг бы образовать хорошую шкалу на данном отрезке. Как уже говорилось выше (см. §2.11), это приводит к тому, что отрезок [О, 1] разбивается на непересекающиеся интервалы, каждый из которых соответствует с гарантированным уровнем функции принадлежности, равным 0<«<:1, некоторому элементу из списка, образующего словесную шкалу. Этот процесс показан на рис. 2.17 для размытых частотных квантификаторов. Для временных квантификаторов он реализуется аналогичным образом. После получения топологической шкалы оказывается возможным строить систему правил вывода на ней. Мы не будем специальна ^) Например, дуэльный кодекс, описанный в книге: Д у р а с о в, Дуэльный кодекс— Град Святого Петра, 1908.
§ 3.g. прострлнствнпная логика 125 останавливаться на этом во временной логике, так как в следующем параграфе опишем всю методику достаточно подробно. Перенесение ее на случай более простой временной логики не вызывает затруднений. § 3.6. Пространственная логика ** Как и для временной логики, начнем построение пространственной статической логики с ^юдeли представлений. Учитывая достаточно полное изложение методики построения псевдофизических логик на примере временной логики, мы ограничимся для пространственной логики более фрагментарным изложением. Наибольший интерес в пространственной логике представляет та ее часть, которая связана с получением выводов на топологической шкале расстояний между объектами. Именно эту часть логики мы и рассмотрим здесь. Наше изложение должно пополнить общее представление о тех проблемах, которые встают перед разработчиками псевдофизических логик. Другие же разделы, относящиеся к пространственной статической логике (работа с метрическими шкалами и отображение высказываний на них, работа с отношениями взаимного расположения предметов, отношениями ориентации их в пространстве и многое другое), фактически строятся аналогично тому,, как это делалось для временной логики. Начнем с формирования списка размытых квантификаторов, которые могут использоваться для оценки расстояния на топологической шкале расстояний. Конечно, этот список может быть более или менее обширным. В качестве примера рассмотрим список из 25 квантификаторов, перечисленных в левом столбце табл. 3.1. В ней показаны результаты экспериментов, проведенных на основе данного списка квантификаторов расстоятя, для большой группы испытуемых. В столбцах указано число испытуемых, положивших карточку с соответствующим квантификатором в позицию, номер которой указан вверху. Какие выводы >южно сделать из данных табл. 3.1? Таких выводов ^южнo сделать несколько. Испытуемые плохо различают между собой некоторые квантификаторы: вплотную и очень-очень близко, довольно близко и совсем близко^ близко, вблизи, рядом, возле, около и другие. Два квантификатора: недалеко и неблизко испытуемые понимают неодинаково. При построении хорошей порядковой шкалы это надо учесть. Поэтому вместо исходного списка квантификаторов для построения шкалы нужно оставлять только те, которые указаны в левом столбце в табл. 3.2. Здесь уже произведено отображение результатов из табл. 3.1 в соответствии с процедурой, описанной в §2.il, в значения функции принадлежности. Наверху с шагом 0,1 перечислены значения переменной из отрезка [0,1], на котором определены семь функций принадлежности (строки табл. 3.2) для всех оставшихся в списке квантификаторов.
12G гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИП Из таблицы ясно видно, что оставшиеся семь квантификаторов образуют хорошую порядковую шкалу для отношений расстояния. В рамках настояндего параграфа мы будем рассматривать лишь двумерную пространственную логику расстояний. Перенос излагае- Таблица 3.1 Лексемы н сочетания лексем 0 1 2 3 4 5 6 7 8 9 Ю 1. Вплотную 27 2. Очень-очень близко 20 7 3. Очень близко 2 21 4 4. Довольно близко 1 13 13 5. Совсем близко 2 20 4 1 G. Совсем рядом 15 7 4 1 7. Близко 4 21 2 8. Вблизи 3 18 6 9. Рядом 3 19 3 2 10. Возле 2 15 8 2 И. Около 5 18 2 2 12. Неблизко 3 И 9 4 13. Не очень близко 4 12 8 3 14. Недалеко 1 2 11 10 3 15. Не далеко, но и не очень 12 12 3 близко 16. Не далеко у не близко 27 17. Не очень далеко^ но и 9 14 3 1 не близко 18. Не очень далеко 3 8 14 2 19. Вдали 2 12 10 2 1 20. Совсем далеко 4 20 3 21. Довольно далеко 6 18 3 22. Очень-Очень далеко 7 20 23. Очень далеко 4 21 2 24. Далеко 1 19 7 25. В бесконечности 27 Таблица 3.2 Локсемы и сочетание 0,1 О,5 0.3 0.4 0,5 0,6 0,7 0,8 0.9 1,0 1. Вплотную 2. Очень близко 3. Близко 4. Не далеко у не близко 5. Далеко 6. 0'/е?нь далеко 1. Очень-очень далеко 0,966 0,2 0.033 0,606 0,133 0,133 0,733 0,133 о, 0,666 0,066 0,133 0,266 0.666
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА J 27 мых ниже результатов на случаи трех или больи]его числа измерений происходит чисто техническим путем. Для интерпретации квантификаторов расстояний нам понадобится рассмотреть еще синеок нечетких квантификаторов, оценивающих размеры предметов. Связь между оценками расстояний на топологической шкале и оценками размеров предметов, между которыми определяются расстояния, довольно хорошо прослеживается с помощью примеров. Рассмотрим два высказывания: «Человек находится далеко от города» и «Человек находится далеко от автомобиля». Ясно, что в первом случае далеко оценивает большее расстояние, чем во втором. Еще два высказывания — «Книга находится близко от стола» и «Лес находится близко от деревни» — также характеризуют зависимость оценки фактического расстояния, передаваемого квантификатором близко, от размеров предметов, о которых здесь идет речь. Введем список квантификаторов размеров, который образует порядковую шкалу для оценок размеров. Эта шкала получена в результате такого же эксперимента, который для расстояний отражен в табл. 3.1 и табл. 3.2. Список квантификаторов размеров имеет следующий вид: нулевой, очень маленький, средний, большой, очень большой и очень-очень большой. При этом в класс средних предметов попадает человек, что делает его как бы модулем, относительно которого происходит деление окружающих предметов на классы, К классу очень маленьких предметов относятся, например, булавка Таблица 3.3 Расстояние Размер 1 -о ?^ at =1 о а: ?2 1| о.§ Вплотную 0,933 0,033 Очень близко 0,2 0,6G6 0.133 0,133 Близко 0,333 0,733 0.266 Не далеко, не близко 1,0 Далеко 0.933 0,066 Очень далеко 0.266 0,733 Очень-очень далеко 0,066 0,933 ИЛИ пуговица. Чашка или книга могут выступать представителями маленьких предметов, а город в зависимости от своего размера попадает либо в класс очень больших, либо очень-очень больших объектов.
128 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИП СИТУАЦИИ Размер Расстояние 1. Нулевой 2. Очень маленький 3. Маленький 4. Средний 5. Большой 6. Очень большой 7. Очень-очень большой Вплотную Очень близко Близко Не далеко, не близко Далеко Очень далеко Очень-очень далеко Будем в дальнейшем обозначать через а]^ некоторый объект с именем i и раз.мером q. Размеры будем задавать порядковыми но- мepa^иI в соответствии с нумерацией размеров в табл. 3.4. Через Rj будем обозначать отношение расстояния на топологической шкале. Индекс / совпадает с порядковым номером соответствуюш,его отношения в тон же табл. 3.4. Запись {al'Rja^-) означает, что кратчайшее расстояние между границами объектов и аа с размера>и[ q\ и ^2 оценивается как Rj. На рис. 3.18 показа- но графическое изображение этой ситуации. ^2J Выскажем еще две гипотезы по поводу оцен- ки расстояний на топологической шкале. Рас- c^ютpим рис. 3.19. На этом рисунке объект аг остается неиз.менным, а вместо объекта а%~ подставляются объекты различного размера, но так, что истинное расстояние между границали! объектов не меняется. Гипотеза 3.2. Оценка расстояния на топологической шкале для тройки (aVRjCiV') не меняется при изменении размеров объекта a-i и сохранении истинного расстояния мэжду границами объектов. Проведем теперь психологический эксперимент, в ходе которого испытуемые должны оценивать по некоторой условной десятибалльной системе оценок степень близости пар квантификаторов, один из которых относится к размерам, а другой — к расстояниям. Результат одного из таких экспериментов приведен в табл. 3.3. Из анализа этой таблицы явно вытекает наличие связи между оценками расстояний и размерами на топологических шкалах. Между списками тех и других квантификаторов суш.ествует определенное соответствие. Оно может быть выражено в виде некоторого гипотетического утверждения. Гипоте 3 а 3.1. Для оценки расстояний между двумя объектами можно использовать третий объект, помеш,аемый между ними вплотную. Размер этого объекта однозначно определяет расстояние между исходными объектами в соответствии с табл. 3.4. Таблица 3.4
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА 129 Как и гипотеза 3.1, данная гипотеза может приниматься или не приниматься, так как ее истинность нельзя строго доказать. Оправданием ее служит лишь то (как и для других гипотез), что с ее помощью получаются результаты, не противоречащие интуиции человека. Заметим, что при изменении размеров предмета а^, от которого оценивается расстояние (лучше сказать «с точки зрения» которого), оценка расстояния даже при сохранении истинного расстояния может изменяться. Если, например, некоторый человек находится близко от дома, то для булавочной головки это расстояние может оказаться весьма далеким. Отсюда вытекает еще одна гипотеза, говорящая о несимметричности оценок расстояний. Г и п о т е 3 а 3.3. При различных размерах объектов и Да в тройках (aVRjul^) я {al*Rf^aV) значения Rj и Rf^ могут отличаться друг от друга. Нетранзитивность Rj очевидна. Ясно, что если ai близко от ^2, а2 близко от аз и т. д., то между ai и последним объектом в такой V N \ \ \ \ I / / У Рис. 3.19 Таблица 3.5 Вплотную- вплотную о.м ? ом м ? м с ? с б ? б об ? об ооб ? ооб 1. ОМ обл обл обл обл обл обл 2. М бл обл обл обл обл обл 3. С нд, нбл бл обл обл обл обл 4. б д нд, нбл бл обл обл обл 5. об од д нд, нбл бл обл о^л 6. ооб оод ^д д нд, нбл бл оэт последовательности может зафиксироваться практически любое отношение от близко до очень-очень далеко. Это зависит от числа элементов в рассматриваемой последовательности. Сформулируем последнюю гипотезу, обоснованием которой могут служить результаты многочисленных психологических экспериментов, а также интуиция человека. Гипотеза 3.4. Для любых трех объектов одинакового размера, расположенных вплотную друг к другу на одной прямой, расстояние между крайними объектами в тройке оценивается квантификатором очень близко. 5 д. А. Поспелов
130 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Все сформулированные гипотезы (если они принимаются, конечно) использованы при построении базовой матрицы оценок расстояний на топологической шкале (табл. 3.6). В этой матрице использованы следуюш,ие обозначения: ом — очень маленький, м — маленький, с — средний, б — большой, об — очень большой, ооб — очень-очень большой, обл — очень близко, бл — близко, нд, нбл — не далеко, не близко, д — далеко, од — очень далеко, оод — очень-очень далеко. Запись q7 q, где д — указание некоторого размера, соответствует тому, что вместо среднего объекта вплотную к двум крайним указанного размера можно вставить третий объект, размер которого указан в левом столбце матрицы. При этом расстояние между крайними объектами можно оценить путем оценки расстояния, указанной в соответствующей клетке матрицы. Например, если между двумя объектами среднего размера вплотную к ним поместить маленький объект, то расстояние между крайними объектами будет очень близким, а при помещении между объектами среднего размера вплотную к ним очень большого объекта получится расстояние между исходными объектами, которое оценивается квантификатором не далеко, не близко. Пример 3.17. Расстояние между двумя блюдцами оценено как очень далеко. Какова бы была оценка того же расстояния, если бы вместо блюдец мы имели людей? Будем считать, что блюдца — маленькие объекты. В столбце м?м табл. 3.5 ищем квантификатор од и находим, что он соответствует помещению между блюдцами вплотную очень-очень большого объекта (ооб). Теперь в строке, соответствующей этому объекту на пересечении со столбцом с?с (считаем, как говорилось ранее, что человек относится к классу средних по размеру объектов) находим оценку расстояния в виде квантификатора далеко. Таким образом, если вместо блюдец на их места поставить людей, то между ними будет расстояние, оцениваемое квантификатором далеко. Пример 3.18. Пусть два человека находятся на одной прямой по обе стороны современного городского дома, имеющего форму замкнутого квадрата или прямоугольника, близкого к квадрату (в идеале — форму цилиндра, как некоторые экспериментальные дома в Ереване или Братиславе, например). И мы хотим оценить расстояние между этими людьми. Так как человек относится к классу средних по размеру объектов, а дом, по-видимому, следует относить к классу больших объектов, то на пересечении столбца с?с и строки для больших объектов в табл. 3.5 мы находим интересующий нас квантификатор расстояния. Как следует из базовой матрицы, этим квантификатором является квантификатор близко. Теперь можно перейти к обсуждению правил вывода, характерных для топологической шкалы расстояний в статической простран-
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА 131 ственной логике. Сначала рассмотрим ситуацию, иллюстрируемую рис. 3.20. На этом рисунке имеются три объекта с заданными размерами (размер объекта аз не играет роли, как следует из нашей гипотезы 3.2), расположенные на одной прямой. Известны оценки расстояний между объектами aV и а2\ а также между объектом а2* и аз. Требуется найти оценку расстояния между объектом а?* и лз. Другими словами, требуется построить систему правил в виде таких продукций: {aVRfiV) {а',%аз)=^{оГЯ?аз), с помош,ью которых можно было бы задать полную систему выводов о расстояниях на топологической шкале для объектов, расположенных на одной прямой. Рассмотрим последовательно четыре возможных случая. 1. Объекты ai и az имеют одинаковые размеры, а Rt и Rj совпа- дают^ Тогда правило вывода записывается следующим образом: (aiRaj) {aiRa3)=>(aiR,a3), В этом случае /?? определяется с помощью операции R-^=R. Смысл этой операции поясняется с помощью табл. 3.6. -1. Таблица 3.6 R R - i Вплотную Очень близко Близко Не далеко, не близко Далеко Очень далеко Очень-очень далеко Очень близко Близко Не далеко, не близко Далеко Очень далеко Очень-очень далеко Очень-очень далеко Вплотную Вплотную Очень близко Близко Не далеко, не близко Далеко Очень далеко Пример ЗЛ9. Пусть ai и аг — маленькие объекты и оценка расстояний между ними, а также между аз и аз есть близко. Тогда оценка расстояния между ai и не далеко, не близко. 2. Объекты а^ и а^ имеют одинаковые размеры, wo Ri w Rj различны. В этом случае правила вывода имеют вид (aiRtal) [alRj-a^) =Ф (а?/?, аз). Значение определяется на основании следующего соотношения: ^1 тах(/?^, Rj), если |i —/|>1, ■ ^ \ max(i?;, Rj)-[-\, если |i —/| = 1. Если U'—/1=0, то этот случай сводится к предшествующему. 5*
132 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Пример 3.20. Пусть для маленьких и аг расстояние от до аз оценивается квантификатором близко, а от до as — квантификатором далеко. Тогда расстояние от ai до аз будет оцениваться квантификатором очень далеко, так как в нашем случае = = 13-5 =2. 3. Оценки Ri и Rj совпадают, но размеры объектов ai и ag различны, В этом случае правила вывода имеют вид {aVRal') {al^Ras)=>{aVR,as). В этом случае сначала необходимо «уравнять» размеры ai и ag. Для этой цели воспользуемся гипотезой 3.2 и базовой матрицей, отраженной в табл. 3.5. В первой тройке приписываем аз размер qi, что не сказывается на квантификаторе R. Во второй тройке приписываем тот же размер аз, что не сказывается на R, если не менять размера аг. Но так как мы его меняем, то необходимо найти новое значение квантификатора. Для этого и служит табл. 3.5. Если новое значение R' во второй скобке сохранит то же значение R, то данный случай сводится к первому из рассмотренных ранее случаев. Если же это не произойдет, то наш случай сводится ко второму из ранее рассмотренных случаев. Пример 3.21. Пусть от чашки (маленький объект) до дома (большой объект) расстояние оценивается квантификатором близко, а от дома до некоторого третьего объекта аз — квантификатором не далеко, не близко. Для перехода от класса больших объектов к маленьким объектам используем базовую матрицу (табл. 3.5). Находим в этой матрице столбец б?б и иш,ем в нем квантификатор не далеко, не близко. Ему соответствует последняя строка таблицы, т. е. объект, относящийся к классу очень-очень больших. Помещая такой объект между маленькими объектами (т. е. заменяя большой а^^ на маленький), мы находим в столбце м?м на пересечении с последней строкой значение R\ Как видно из табл. 3.5, это значение есть очень далеко. Так как оно не совпадает с квантификатором близко, то имеет место второй случай. Учитывая, что U*—^;J = I3—6|=3, получаем окончательно, что расстояние от чашки до объекта аз должно оцениваться квантификатором очень-очень далеко, 4. Пусть не совпадают ни размеры Ui и а^, ни квантификаторы Ri и Rj. Тогда можно с помощью базовой матрицы сначала уравнять размеры объектов, а затем получить ту же ситуацию, что и в предшествующем случае. Приведенные правила вывода, хорошо работающие для случая трех объектов, расположенных на одной прямой, удовлетворяют в этом случае человеческой интуиции, но при перенесении на случай произвольного числа объектов на одной прямой могут привести к нежелательным эффектам. Пример 3.22. Пусть имеется шеренга посаженных вдоль дороги деревьев. Между соседними деревьями такое расстояние, которое оценивается квантификатором близко. Если ai, аа, а^ суть
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА 133 деревья, то от ах до аа близко, от ai до аз на основании первого случая правил вывода не далеко, не близко, от до на основании того же правила далеко, а для расстояний от до ag и всех последующих деревьев в шеренге будет сохраняться отношение далеко. Это происходит в результате поглощения одним квантификатором других, которые отстоят от него более чем на единицу. В настоящее время для устранения эффекта поглощения нет сколько-нибудь эффективных приемов. Один из частных приемов, к сожалению, применимый не всегда,— способ разбиения на каждом шаге объектов на пары, внутри которых квантификаторы отличаются на единицу по своему индексу, и правила вывода применяются именно к таким парам. Если таких квантификаторов нет, то используются пары с одинаковыми расстояниями между объектами. Подобный подход неприменим, если все попарные расстояния отличаются по индексам квантификаторов более чем на единицу. Пример 3.23. В условиях примера 3.22 после нахождения расстояния от ai до аз имеет смысл искать расстояние от аз до а^, которое будет оцениваться в результате как не далеко, не близко. Применяя теперь правило вывода к объектам а^, а^ и аз, а-, мы получим, что расстояние от а^ до оценивается квантификатором далеко. Аналогично расстояние от а^ до оценивается также квантификатором далеко. Если теперь использовать правило вывода для объектов Ui, ag и ад, то расстояние от ai до будет оцениваться уже квантификатором очень далеко. Продолжая процедуру подобным же образом, можно оценивать расстояния по все более увеличивающимся по индексу квантификаторам (в предположении, что за квантификатором о^^яб- очень далеко находится бесконечная их последовательность: очень-очень-очень далеко, очень- очень-очень-очень далеко и т. д.). Перейдем теперь к построению правил вывода для пространственной логики расстояний на плоскости. Базовая матрица (табл. 3.5) дает возможность преобразования любых произвольных по размерам объектов в очень маленькие объекты, которые в дальнейшем мы будем для краткости называть точечными. Поэтому при построении правил вывода на плоскости будем рассматривать лишь точечные объекты. На рис. 3.21 показаны три объекта ai, аг и аз, произвольно расположенные на плоскости. Пусть расстояния Ri и Rj нам известны (т. е. мы знаем их словесную оценку), а расстояние R^ требуется определить. Построим два вспомогательных объекта а^ и так, как / \ / >f \ Рис. 3.21
134 гл. 3. ПОПОЛНЕНИЕ 0ПИСАН[1И СИТУАЦИП показано на рисунке. Ясно, что для индексов квантификаторов выполняются неравенства /?тш^^Ф^^тах- определения R^^in и /?гпзх используются следующис специальные операции: Вплотную, если если если i = i + U Ri, если i—j>2, если если i если i = ■ R, + l, если / = t + l, Rt^ если i если / —1>2. Ограничимся для простоты не любыми угловыми направлениями Ф на плоскости, а некоторым числом фиксированных направлений. При достаточно большом их числе можно получить сколь угодно близкое приближение к модели с непрерывным значением ф. Для наглядности возьмем небольшое число направлений, показанное на рис. 3.21. Другими словами, будем считать, что объект а.э может находиться только на этих фиксированных пяти направлениях. Построим специальную таблицу (табл. 3.7), которая по местонахождению объекта аз и вычисленным значениям R^^-^^ и jRj^a^ определяет Таблица 3.7 S T2 Фз ф. 0 ^max ^max ^max ^тах ^тах 1 ^max ^min 2 ^max ^min 3 ^max ^min 4 ^max ^Фз-1 ^rain 5 ^max (^,.-^1)^1 ^min 6 ^max ^min 7 ^max значение /?ф. При увеличении числа направлений характер таблицы не меняется. Здесь S означает разность индексов для квантификаторов, соответствующих R^^^ и Д-^^ случая s=l предполагается, что
§ З.б. ПРОСТРАНСТВЕННАЯ ЛОГИКА 135 ^min не является квантификатором вплотную. Если это так, то ^Ф1=^Ф2=^Ф. =^Ф4= очень близко. При 5=-0 Rm^^-=Rm\n- Операция специального вычитания, используемая в этой таблице, определена в правом столбце табл. 3.6. Для полного завершения логики на плоскости необходимо еще построить правила вывода направлений по заданным направлениям для двух объектов относительно третьего. Другими словами, необходимо еще ввести правила вывода следующего типа: Приведем примеры подобных правил, ограничившись лишь четырьмя фиксированными направлениями впереди, слева, сзади, справа. Эти правила сведены в табл. 3.8. Таблица 3.8 Впереди Слева Сзади Справа Впереди Впереди Впереди, если Слева, если Rj > Ri Впереди, если R/<:Ri Сзади, если Rj>Ri Впереди, если Rj < Ri Справа, если Rj > Ri Слева Слева, если Rj<Ri Впереди, если ^/>^/ Слева Слева, если Rj^Ri Сзади, если Rj > Ri Слева, если Rj^Ri Справа, если Rj>Ri Сзади Сзади, если Rj < Ri Впереди, если Rj > R( Сзади, если Rj^Ri Слева, если Rj > Ri Сзади Сзади, если Rj < Ri Справа, если Rj > Ri Справа Справа, если Rj^Ri Впереди, если Rj > Ri Справа, если Rj<.Ri Слева, если Rj > Ri Справа, если R/^Ri Сзади, если Rj > Ri Справа Пример 3.24. Пусть впереди дома далеко имеется лес, а справа от леса близко находится ветряная мельница. Определим направление от дома к ветряной мельнице. В нашем случае Rj>Ri и, согласно табл. 3.8, мы получаем, что мельница находится впереди дома. При увеличении числа допустимых направлений таблица для определения направлений быстро растет, увеличивается и число
136 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИП СИТУАЦИИ условий, связанных с соотношением Ri и Rj для выбора того или иного ответа. Но суть дела от этого не меняется. Как и во временной логике, в пространственной логике не всегда удается получить пополнение описания, используя лишь те правила вывода, которые мы здесь описали. Часто возникает необходимость в использовании дополнительной информации, храняи;ейся в памяти системы в виде сценариев или в каком-либо ином виде. Пример 3.25. В примере 3.4 мы обсуждали сценарий, в котором отражено строение пылесоса из ряда деталей. Пусть на вход системы поступило следующее описание ситуации: «В комнате рядом со столом работает пылесос». Если непосредственно по этому описанию построить пространственную структуру ситуации, то она будет иметь следующий вид: (аг^^Ь) (aR^c), где а — пылесос, b — комната, с —стол, Гз8 — быть внутри, ^3 — близко. Ничего другого из исходного описания впрямую получить нельзя. Однако используя сценарий, приведенный на рис. 3.3, можно это описание пополнить, например, фактом {drs^b) или фактом (dRac), где d.— шнур от пылесоса. §3.7. Каузальная логика* Выше уже говорилось, что в настоящее время не существует сколько-нибудь завершенного фрагмента этой логики, которая должна работать с отношениями, связывающими между собой причины и следствия. Вообще говоря, если каузальную логику трактовать достаточно широко, то ее можно расширить почти до теории вывода, в которой рассматриваются не только традиционные дедуктивные системы вывода, но и выводы индуктивного типа или выводы типа «от частного к частному» (традуктивные). Но мы не будем заниматься таким расширением, а рассмотрим в рамках данного параграфа несколько фрагментов каузальной логики в узком смысле, которые уже сейчас можно применять в системах управления семиотического типа. Прежде всего необходимо отметить, что до последнего времени даже в философском плане не проведено достаточного анализа сути отношения причина — следствие. Большинство авторов склоняется к тому, что существует по крайней мере пять основных видов таких отношений. 1. Энергетическая причина. Причина изменения w, наблюдаемого в некотором явлении или процессе Па, есть передача некоторой энергии V от явления или процесса Hi. В этом случае можно говорить, что V — есть причина w, aw — следствие v. 2. Причина изменения w в есть не само воздействие v. Оно скорее играет роль «последнего толчка», после которого в Пз начинает развиваться процесс, приводящий к w. Однако и в этом случае можно считать v причиной (первопричиной) для w, sl w — следствием V.
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 137 3. Причина изменения w есть информация и, в которой содержится указание для Па о характере необходимого изменения. В таком случае также можно считать, что между этим указанием v и изменением W есть отношение причина — следствие, 4. Изменение w возникает за счет того, что в Из имеются два подпроцесса, или системы, которые взаимодействуют между собой и порождают само изменение w. Такие причины изменений могут возникать и как вторичные после появления первичных причин, указанных в предшествуюш,их пунктах. Отметим, что взаимодействие внутри процесса может определять развитие самого процесса, которое выражается в цепи его изменений Wi, Wz, Wn, ... 5. В качестве причины может выступать некий «фундаментальный» закон, согласно которому всякий процесс стремится к некоторым устойчивым состояниям (например, всякое тело, находящееся под влиянием гравитационного поля, стремится «упасть»). Существует довольно устойчивое представление о причине некоторого явления, как об его единственной, необходимой и достаточной причине. Даже при создании методов вывода на основании индукции (мы с ними столкнемся в гл. 4) это заблуждение будет играть роль некоего весьма важного предположения, при выполнении которого тот или иной метод эффективно реализуется. На самом же деле связь причин и следствий может оказаться значительно более тонкой. С этой точки зрения можно дать следующую классификацию причинно-следственных отношений. 1. Необходимая и достаточная причина. Причина V при своей актуализации всегда вызывает следствие w, И, наоборот, появление w всегда свидетельствует о предшествующей актуализации и. Это довольно редкий для реальной ситуации случай. Примером его может служить связь между лишением некоторого тела опоры и его падением. 2. Достаточная причина. Это наиболее часто встречающийся в реальной практике случай, когда причина v всегда вызывает следствие w, а из появления w не всегда следует v. Примером такого положения может служить связь между невыполнением плана и отсутствием премирования. Однако из отсутствия премирования не люжет следовать вывод о невыполнении плана. 3. Дополнительные с о п р и ч и н ы. Ни t^i, ни ^2 не являются причинами w. Лишь их совместное действие вызывает W. Возможен случай не пары дополнительных сопричин, а некоторого множества их. Например, если Vi есть наличие пневмококка, а W — заболевание пневмонией, то для возникновения w кроме Vi необходима актуализация еще какой-либо сопричины, например, переохлаждения, простуды или травмы. 4. Необходимые сопричины. В списке сопричин, каждая из которых к w т приводит, могут быть сопричины, наличие которых для вызывания w необходимы. Для предшествующего примера такая необходимая сопричина — наличие пневмококка.
138 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИИ 5. Возможные сопричины. Причинами аварии на улице могут быть неисправность некоторого транспортного средства, нарушение правил дорожного движения, состояние опьянения у водителя и т. д. Ни одна из этих сопричин не обязательно приводит к аварии. Но возрастание множества подобных одноврехменно актуализированных сопричин увеличивает шансы на появление w. В нашу классификацию причин можно было бы включить и различные псевдопричины, нередко игравшие на первых порах развития мышления определяющую роль. Примером такой псевдопричины может служить правило «После этого,— значит вследствие этого». При рассмотрении не одной причинно-следственной связи, а цепочки таких связей может оказаться, что воздействие тех или иных последовательностей причин куммулирует или ослабляет эффект, связанный с необходимостью появления Вообще, в причинно- следственных сетях могут возникать различные тонкие эффекты, часть которых мы обсудим чуть ниже, когда будем анализировать сценарии, связанные с каузальными отношениями. Вернемся к примеру 3.2 и связанным с ним рис. 3.1 и рис. 3.6. Основным свойством причинно-следственных отношений является их антисимметричность и транзитивность, что позволяет для любого явления, которое может выступать в роли следствия, строить дерево причин или сопричин, способных его породить. Как можно использовать это дерево? Если, например, в тексте, поступившем на вход системы, явно содержится информация о том, что внешний поставщик сорвал план поставки заготовок, то текст может быть пополнен фактами о том, что заготовок нет и станок простаивает (см. рис. ЗЛ). Наличие причинно-следственного сценария, таким образом, позволяет при наличии сведений о любой его вершине достраивать цепочки фактов, ведущих от нее к следствиям. Единственная тонкость тут заключается в необходимости учета времен наступления событий. Если факт «Поставщик сорвал план поставки заготовок» поступил в момент времени t, то факты «Заготовок нет» и «Станок простаивает», которые являются одномоментными, сами могут возникнуть не в момент ^, а в некоторый момент t+x, ибо производство может располагать определенным запасом заготовок. И величина т может быть достаточной для того, чтобы факты-следствия вообще не возникли, если за время т запас не израсходуется, а поставщик исправит свою оплошность. Именно здесь смыкаются временная и каузальная логики. Мы уже говорили, что рассуждения о будущем носят модальный характер. В будущем может реализоваться не одна последовательность событий, а целый веер таких последовательностей. И при выводе от причин к следствиям это необходимо учитывать. Поэтому причинно-следственные сценарии нужно снабжать дополнительной информацией (весами) о временных задержках в наступлении следствий после непосредственных причин. Этими весами можно помечать
§ 3.7. КАУЗАЛЬНАЯ ЛОГИКА 139 дуги, показанные в сценарии, что дает возможность делать выводы в каузальной логике более богатыми. Пример 3.26. На рис. 3.22 показан тот же сценарий, что и на рис. 3.1. К нему лишь добавлена информация о времени возникновения следствий после наступления непосредственных их причин. Пусть в момент t в системе имеется информация о том, что станок простаивает, а в момент t—т поступила информация о том, что поставщик прекратил поставлять заготовки. Если т меньше чем 48 ч, то вывод о том, что заготовок нет и станок простаивает, еще не реализуется. Вывод от причин к следствиям всегда использует свойство транзитивности. Если имеется информация о двух событиях, одно из которых может рассматриваться как причина, а другое — как следствие, то легко выводятся и все промежуточные события. Вывод же от следствий к причинам более сложен, ибо он не однозначен. При формировании та- _ ких правил каузальной логики большую роль р^^^, 3 22 играет вся информация, имеющаяся в распоряжении системы на данный момент времени. Если, например, системе известно, что станок простаивает, то еще нельзя восстановить причину. Но если при этом имеется дополнительная информация о том, что станок исправен, а заготовки имеются, то из факта простоя станка немедленно будет следовать факт, что на рабочем месте нет рабочего. При построении причинно-следственных сценариев часто возможно указать ряд отношений, связывающих между собой причины. Например, может оказаться, что некоторые причины не могут одновременно существовать. Например, следствие «Магнитофон не воспроизводит запись» может возникать в результате двух фактов: «В магнитофоне нет пленки» и «Произошел обрыв пленки». Эти два факта-причины между собой взаимосвязаны. Они не могут существовать одновременно. Поэтому при выводе причины для следствия «Магнитофон не воспроизводит запись» и наличии дополнительной информации о реализации факта «Пленка вынута из магнитофона» система должна сделать однозначный вывод о том, что причина интересующего нас факта состоит в отсутствии пленки в магнитофоне. Сценарий, показанный на рис. 3.6, довольно прост. Но сценарий, который приведен на рис. 3.8, содержит много дополнительной информации, которую вполне хможно использовать в процессе получения выводов как от причин к следствиям, так и от следствий к причинам. Кроме указания на прямую связь причин и следствий, в этом сценарии содержится еще информация о тех воздействующих факто-
140 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ рах, которые вызывают или стимулируют причины. Вместе с тем в этом сценарии могут быть указаны и тормозящие факторы, которые препятствуют возникновению причин. И, наконец, в сценарии могут быть указаны некоторые наблюдаемые закономерности в появлении и непоявлении фактов, что позволяет устанавливать причины и прогнозировать развитие процесса от причин к следствиям. Таким образом, в каузальной логике больше вопросов и нерешенных проблем, чем ответов на них. И один из наиболее трудных вопросов — проблема получения в каузальной логике нечетких выводов, когда наличие причин известно лишь с некоторой оценкой достоверности, а иногда и нет полной уверенности, что именно данные факты служат причинами интересующего нас факта. Именно этой проблемой, играющей во всех системах управления объектами сложной природы большую роль, мы будем заниматься в оставшейся части настоящего параграфа, причем будем считать, что уже выработана гипотеза о том, что Ui, Уг, Vm могут быть причинами W. О методах формирования таких гипотез будет говориться в гл. 4. Мы же обсудим, как строятся специальные правила вывода, позволяющие осуществлять переход от Vi, Ua, к ьу, и сосредоточим свое внимание на том случае, когда все причины непосредственно приводят к W. Для простоты изложения ограничимся случаем, когда между Vt нет никаких связей, которые запрещали бы появление одной из причин при наличии другой. В списке литературы к данной главе указаны источники, в которых это ограничение снято. И, наконец, будем считать, что w наступает, если все Vt реализованы. Случай, когда достаточно хотя бы одной причины для реализации W, не вносит ничего принципиально нового и также рассмотрен в работах, указанных в списке литературы. В логических системах вывода широко используются схемы вида A^j {Л^, Лд, —^В В Смысл их интерпретируется следующим образом: если Л2, Лу1 уже выведены и из совокупности выведенных формул Лх, Л а, Лт1 следует выводимость В, то В считается выведенным. Эта схема обобщает знаменитое правило «модус поненс», принадлежащее классической логике: Л, А^В В Здесь знак трактуется как обычная импликация. Пусть теперь наши знания о том, что Л^ действительно выведены, неполно. Другими словами, вместо той части схемы вывода, которая стоит над чертой, мы имеем
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 14| Здесь yii — некоторые квантификаторы, например, квантификаторы частотного типа почти никогда, очень редко, редко, не часто, не редко, часто, очень часто, почти всегда ^). В этой записи причины, вызывающие выводимость В, заданы с некоторой долей уверенности. Что в этих условиях можно сказать о выводимости 5? Неполным может быть и наше знание не о причинах Л ^ а о самом факте выводимости из этих причин. В таком случае верхняя часть схемы дедуктивного вывода выглядит следующим образом: А„ А^, Л„; >|[{Л1, Ла, А^\:=^>В1 Как и ранее, квантификатор >| можно трактовать здесь по-разному. Лишь бы он отражал каким-то образом степень уверенности в том, что вывод из {Аi} в В реализуется. Конечно, возможен и такой случай, когда имеет место и та, и другая неопределенность. Описанная ситуация на практике возникает весьма часто. В условиях ситуационного управления она оказывается скорее правилом, чем исключением. Знания об объекте управления и способах управления им накапливаются постепенно, и необходимость использования нечетких схем вывода, примеры которых мы только что рассмотрели, остается почти на всем периоде функционирования системы управления, построенной на основе семиотических моделей. Возможны различные способы работы с такими нечеткими правилами вывода. Проиллюстрируем это на нескольких подходах, причем для большей наглядности изложения мы будем анализировать лишь тот случай, когда схема вывода имеет вид такой продукции >|аЛ, >|[Л—>S], где >|а и >| — квантификаторы некоторого типа, отражающие сомнение в истинности посылки А и самой продукции. Нас интересует значение квантификатора >|д, с которым надо записать факт В в память системы или использовать его в дальнейшем выводе или при принятии окончательного решения. Рассмотрим вначале случай, когда вместо квантификаторов стоят некоторые вероятности, отражающие наши знания о влиянии Л на появление В и появление самого Л. Такие вероятности могут быть либо априорными, либо апостериорными, накопленными после некоторого опыта работы системы. В таком случае можно предложить две схемы приписывания вероятностной оценки для В, которые более или менее соответствуют интуиции человека: Ра>С1 Ра >а Рл^Ув>Ь . Рл^>в>Ь Рд>шах(0, а + Ь —1) ' ^аЬ ' В приведенных соотношениях указаны лишь оценки снизу. Насколько их можно превышать, остается неясным. Некоторая информация об этом может быть извлечена из оценок для правила ^) Возможны и иные квантификаторы. Например: почти уверенно, с некоторой долей уверенности, фифти-фифти, сомнительно и т. п.
142 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ P^<min(l, 1—а + Ь)' < min(l, Ь/а), афО' Буквами Р в этих схемах всюду обозначены соответствуюидие вероятности. Однако, как уже говорилось, в семиотических системах управления и, в частности, в системах ситуационного управления накопление статистических данных идет слишком медленно, а априорные знания о вероятностных оценках отсутствуют. Поэтому представляется интересным формировать оценку достоверности В, оставаясь в рамках использования квантификаторов, оценивающих достоверности Л, Az=^>B и В. Зафиксируем в качестве таких квантификаторов частотные квантификаторы, которые мы только что привели, добавив к их списку еще два квантификатора никогда и всегда, ограничивающие его слева и справа. Для этих квантификаторов мы и будем строить правила оценки В. Пример 3.27. Рассмотрим следующую схему рассуждений: При швартовке судно «А. Пушкин» изредка теряет 20—30 мин времени; если потеряно более 20 мин времени, то план погрузки очень часто приходится переделывать. Обозначим через А высказывание «Швартовка судна «А. Пушкин» приводит к потерям 20— 30 мин времени», через >^ — квантификатор редко, через В — высказывание «План погрузки переделывается», а через > — квантификатор очень часто. Тогда приведенный текст можно представить схемой >А^1 >[Л=^>5]. Что можно сказать об оценке истинности В, если известно, что в данный момент судно «А. Пушкин» готовится начать швартовку? Более или менее опытный диспетчер при наличии такой информации скорее всего станет готовиться к процедуре изменения плана погрузки. В § 2.11 и в предшествующем параграфе мы уже говорили о том, что квантификаторам можно сопоставить функции принадлежности или интервалы на отрезке [0,1]. В частности, на рис. 2.16 и 2.17 были показаны эти интервалы и вид функций принадлежности как раз для случая частотных квантификаторов. Тогда задачу можно поставить следующим образом. По известным квантификаторам >^ и >| строим (или используем ранее построенные) функции принадлежности (или интервалы) на отрезке [0,1] и ищем отображение пары этих функций (или интервалов) в функцию принадлежности (или интервал) для квантифика- «модус толленс», также хорошо известного в классической логике: А Вероятностные аналоги этого правила имеют вид РА^ув>а РА^>в>а
§ 3.7. КАУЗАЛЬНАЯ ЛОГИКА 143 тора Таким образом, нас интересует вид функции F, задающей соотношение \^в^^{\^ау М-)- Здесь р.^, \i и — функции принадлежности, соответствующие >|а, >| и Прежде чем определять вид функции F, сформулируем некоторые достаточно очевидные свойства, которым она должна удовлетворять. Если в качестве квантификаторов взять квантификаторы всегда, то верхняя часть схемы вывода будет иметь вид Л; Л=>5. Другими словами, правило вывода превратится в «модус поненс». Это означает, что и квантификатор >д должен стать квантификатором всегда. Для функций принадлежности это эквивалентно требованию выполнения равенства F{\i\, \^^) = \^ву где (l^ \1в — функции принадлежности, соответствующие квантификатору всегда. Для случая, когда есть квантификатор всегда, а у( — никогда, очевидно, что >|д должен также принимать значение/iw/co2(3a. Другими словами, должно выполняться равенство = где и \i% — функции принадлежности, соответствующие квантификатору никогда. Два сформулированных нами требования к функциям принадлежности и [х^ ограничивают вид этих функций. Их можно определить лишь двумя способами: 1. \i4x) = 0, х€[0, 1), о i\i'(x)=^x, хе[0, 1], li'{x)=^\, х=1, • \^о{х)=^1-х, д:6[0, 1]. li'{x) = 0, х€(0, 1], Рассмотрим один из возможных способов определения F, при котором удовлетворяются сформулированные нами требования Этот способ сводится к тому, что (1д получается из (Ла и [х с помощью суперпозиции \^в{х)^ = (iAtlx(-^)l. Такая операция Г\/^а корректна, так как для функций принадлежности областью определения и областью значений является отрезок [О, 1]. Легко проверить, что при любом из двух возможных способов определения функций принадлежности для квантификаторов всегда и никогда в случае суперпозиции выполнены наши два требования. Пусть теперь р.^ и р. — произвольные функции, соответствующие каким-то значениям квантификаторов частоты. На рис. 3.23 показаны две одногорбые кривые, отвечающие этим функциям. Результат их суперпозиции — двугорбая кривая, показанная штриховой линией. Каков ее смысл? Если, например, (Лл есть редко, ар. — часто. Рис. 3.23 ^) Он предложен И. В. Ежковой.
144 ГЛ. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ 0,1 0,г 0,3 0,^ 0,5 0,6 0,7 0,8 0,9 I X Рис. 3.24 то максимумы их суперпозиции характеризуют те значения из отрезка [О, и, которые редко встречаются в нечетком подмножестве функции принадлежности часто. Если же, например, и |.i отвечают квантификатору часто, то максимумы соответствуют тем значениям, которые часто встречаются в нечетком подмножестве функции принадлежности часто. Поскольку >| характеризует множество возможных значений частоты появления факта В, обусловленных всевозлюжными значениями частоты появления факта Л, то суперпозиция выделяет из этого множества лишь те значения частоты появления факта В, принадлежность которых этому лшожеству характеризуется квантификатором ^j^. Иными словами, оценка, задаваемая квантификатором выделяет из множества значений, выделяемых квантификатором ^, те значения, которые встречались в множестве, характеризуемом >|, с частотой, характеризуемой Такая интерпретация операции суперпозиции является достаточно «человеческой», что может служить аргументом в пользу принятия подобного способа определения функции F. Единственный недостаток предлагаемого подхода к определению функции F состоит в том, что суперпозиция порождает функции принадлежности, число горбов в которых может при повторном применении этой операции возрастать. Но, как мы показали еще в § 2.11, а затем и в § 3.6, функции принадлежности, соответствующие различным квантификаторам, которыми пользуются люди, либо монотонны на отрезке [О, 1], либо унимодальны. Появление многогорбых функций делает словесную интерпретацию результатов достаточно сложной. В естественном языке просто нельзя найти соответствующих им лексем или сочетаний лексем. Однако это не так уж и страшно, если все результаты, связанные с оценкой >|д при многошаговом выводе с помощью нечетких схем вывода, будут лишь внутрисистемными. При выдаче окончательного результата пользователю системы или для принятия решений по управлению можно использовать специальную процедуру «аппроксимации»- лшогогорбых функций теми же словами, которылш характеризуются исходные частотные квантификаторы с некоторыми словесными добавками (например, близко и часто или между редко и не редко, не часто). Пример 3.28. Вернемся к примеру 3.27. На рис. 3.24 показан в виде штрих-пунктирной кривой результат суперпозиции двух функций принадлежности, соответствующих тем квантификаторам, которые имеются в этом примере. С помощью уровня отсечки со значением 0,7 получены нечеткие интервалы на оси абсцисс. Теперь мы люжем сказать, что диспетчер должен ожидать изменения плана
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 145 погрузки С уверенностью не менее 0,7 со значениями внутри интервалов (0,62; 0,67) и (0,95; 1). Если же взять уровень отсечки, равный единице, то диспетчер может ожидать изменения плана на интервалах (0,6; 0,7) и (0,9; 1) с теми показателями уверенности, которые задаются функцией [Iq, И в том, и в другом случае мы получаем, что при наличии факта (сведений) о начале швартовки судна «А. Пушкин» опытный диспетчер, начинающий готовиться (по крайней мере морально) к изменению плана погрузки, поступает разумно. Мы рассмотрели лишь простейший случай правила вывода в случае нечетких частотных кванторов. В литературе по этой проблеме, указанной в комментарии к настоящей главе, сформулированы требования к построению >|д в случае наличия п посылок Л^-, из которых следует утверждение В (зависимых между собой или независимых в смысле влияния на появление друг друга), а также получение оценок типа х в.в^^ли ^b.vb^^ когда из группы посылок выводится конъюнкция двух фактов или их дизъюнкция. Рассмотрение таких достаточно громоздких конструкций выходит за рамки данной книги. Другой способ определения функции F, отличный от способа суперпозиции, состоит в том, что при применении какого-либо квантификатора к другому квантификатору происходит некое монотонное преобразование исходной функции принадлежности, сводящееся к растяжению и сдвигу максимума функции в ту или другую сторону. Преимущество такого способа определения F состоит в том, что при монотонных преобразованиях вид функции принадлежности меняется не кардинально. Ее унимодальность или монотонность сохраняется, и переход от нового вида функции к словесной оценке, соответствующей некоторому квантификатору, происходит куда проще, чем от многогорбых функций, возникающих в результате операции суперпозиции. Пример 3.29. На рис. 3.25 показаны два результата, полученные с помощью суперпозиции и сдвига с растяжением, для случая, когда >|а и >| соответствуют квантификатору часто. Разница состоит, по-видимому, в том, что суперпозиция вычленяет в функции принадлежности часто те значения, которые часто встречаются. В случае же сдвига и растяжения мы можем интерпретировать результат как появление нового квантификатора со значением часто- часто, который можно при желании аппроксимировать, например, значением очень часто. Недостаток второго подхода к определению вида функции F заключается в том, что ни сдвиг функции принадлежности для >|, ни характер ее растяжения, определяемые функцией принадлежности, соответствующей >|а, никак не определены. Нужны какие- то специальные соображения по поводу этих параметров. Но в настоящее время такие соображения отсутствуют.
146 ГЛ. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Рис. 3.25 в заключение настоящего параграфа рассмотрим некоторый новый подход к получению нечетких выводов, успешно развиваемый в последнее время С. В. Чесноковым. Приводимые ниже результаты, возможно, за исключением их интерпретации, заимствованы из работ этого автора, указанных в списке литературы к данной главе. На рис. 3.26 показана некоторая ситуация, исходя из которой можно утверждать, что некоторые щ суть Ь, где i = l, 2, п. Рассмотрим запись вида а^и^б, которую мы будем называть детерминацией. Введем два важных понятия. Точностью детерминации будем называть величину условной вероятности P{blai). Полнотой детерминации aiv^b будем называть величину условной вероятности Р {ajb). Если точность детерминации оценивает степень уверенности в том, что появление некоторого элемента из А ведет к появлению 6, то полнота детерминации оценивает верность утверждения о том, что появление b свидетельствует о наличии хотя бы одного элемента из А. Далее мы всюду будем вместо множества причин, стоящих в левой части детерминации, рассматривать только одну причину, которую и будем обозначать через а. Пример 3.30. Пусть, например, на основании некоторых наблюдений получена табл. 3.9. Каждая ее клетка в соответствии с определением точности и полноты детерминации, которые мы будем соответственно обозначать буквами / и С, позволяет определить эти характеристики детерми- лации. Для нашего примера имеем Рис. 3.26
§ 3.7. КАУЗАЛЬНАЯ ЛОГИКА 147 Для обратной детерминации Ь\^а точность и полнота получаются перестановкой значений точности и полноты для прялюй детерминации. Другими словами: /(feh^a)=0,4, а C{b\^a)=OJ, Таблица 3.9 Таблица 3.10 Есть а Нет а Есть b Нет b 60 140 590 210 Есть а Нет а Есть b Нет b 100 100 100 100 Таблица 3.11 Таблица 3.12 Есть ас Есть ас Есть ас Есть' ас Есть b Нет b 100 0 40 60 0 100 60 40 Есть с Нет с Есть b Нет b 140 60 60 140 Пример 3.31. Пусть а означает наличие в данном месте известняка, с — наличие карстовых воронок и пещер в том же месте, 6 — наличие подземных рек и озер. Отрицание этих пропозициональных переменных соответствует отсутствию соответствующего явления. Рассмотрим табл. 3.10—3.12. Что показывают эти таблицы? Табл. 3.10 показывает, что на основании некоторой статистики, отраженной в ней, можно утверждать, что в половине случаев в тех местах, где имеется известняк, имеются подземные реки и озера. Табл. 3.11 говорит о том, что при наличии в известняке карстовых явлений всегда есть уверенность в существовании в этом месте подземных рек и озер. Даже в том случае, когда карстовые явления (более точно, их аналоги) имеются не на чистом известняке, то в 40 случаях из 400 есть и подземные реки и озера. Однако в известняковом слое, в котором не обнаружено карстовых являений, подземные реки и озера искать бесполезно. Вот если их нет в тех местах, где вместо известняка наблюдаются другие породы, то в 40 случаях из 400 можно дать положительный ответ и на вопрос о наличии здесь подземных рук и озер. Как следует из этих таблиц, /(ah^fe)=0,5, а 1{ас\^Ь) = 1. Таким образом, наличие карстовых явлений для известняковых пород уточняет детерминацию, с помощью которой утверждается наличие в данном месте, подземных рек или озер. Если рассмотреть ach^b, то, как следует из табл. 3.11, точность ухудшается до нуля. Поэтому
148 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ дополнительная конъюнктивная посылка в детерминации может как увеличивать ее точность, так и уменьшать ее. Аналогичным образом можно рассмотреть и случай, когда при переходе от а кЬ используется не конъюнкция, а дизъюнкция, т. е. осуществляется переход к детерминации вида {а\/с)\^Ь. Интуитивно ясно, что детерминации тесно связаны с нечеткими выводами, когда квантификаторы частоты оцениваются статистическими вероятностями. Это действительно так. Мы проиллюстрируем их связь на примере обобщения понятия силлогизма, являющегося классическим объектом в логике. Как известно, Аристотель предложил 19 основных модусов силлогизмов, которые дают всегда верные результаты. Кроме того, имеется еще пять модусов, которые представляют собой ослабленные основные модусы. Например, для модуса (все а суть 6; все 6 суть с)=:>(все а суть с) ослабленный модус имеет вид (все а суть Ь)\ (все b суть с)=^(некоторые а суть с). Остальные модусы четырех возможных фигур Аристотеля, кроме этих 24, не являются в строгом смысле истинными. Детерминации позволяют расширить множество модусов, оперирование которыми становится возможным за счет введения в них частотных квантификаторов. Пусть мы имеем детерминации а\-^Ь и Ь\-^с. Эти детерминации характеризуются своими точностями и полнотой. Обозначим их для простоты записи следующим образом: / {a\-^b)=i g L^; C{a\-^b)^ =k^M^\ I{b^c) = leL^\C{b^c)=m^M^. Здесь L\ M\ и M^ — какие-то конкретные значения интервалов из отрезка [О, 1]. Нас будет интересовать, что можно сказать при известных 1, k, 1 и т о точности и полноте детерминации с\-^а. Эти характеристики детерминации с ь^а будем обозначать соответственно как г и s, а интервалы, в которых лежат эти значения,— как и М^. Если вернуться к рассмотрению силлогизмов Аристотеля и взять тот модус, который мы только что рассмотрели, то для него L^ = =L^=L^=^l. Относительно Л1\ и ничего сказать нельзя. •Они могут быть любыми интервалами в полуинтервале (0,1]. Таблица 3.13 а Х2 •^'4 а Хб b ъ b ь с с
§3.7. КАУЗАЛЬНАЯ ЛОГИКЛ 149 ^ Xi + X2 + Xb + Xf • Аналогично определяются и остальные характеристики детерминаций, образующих силлогизм. Поставим теперь перед собой задачу поиска силлогизмов, в которых участвовали бы частотные квантификаторы, и пусть последние соответствуют соотношениям, связанным с точностью и полнотой детерминаций, входящих в силлогизм. Пример 3.32. В качестве примера такого силлогизма рассмотрим рассуждение Среди водителей автобусов мало нарушителей уличного движения Среди женщин мало нарушителей движения Почти все водители автобуса — женщины. По-видимому, читатели не согласятся с верностью полученного вывода. Но если предположить, что эти рассуждения относятся к военному времени, то в ситуации, когда класс водителей автобусов почти включался в класс женщин, такое утверждение могло бы оказаться верным. Значит, все дело в том, как связаны друг с другом эти классы, что определяется введенными нами характеристиками детерминаций, образующих модус силлогизма. Задачу построения силлогизмов, удовлетворяющих некоторым заранее заданным требованиям, учитывающим их обоснованность, можно сформулировать во вполне строгой форме. Вернемся к табл. 3.13. Будем считать Xt неизвестными. Выпишем набор ограничений, которым эти неизвестные должны удовлетворять. Первое ограничение тривиально: (1) х,+Х2 + Хз + х, + х,-гх, + х, + х^=\. Следующие шесть ограничений, которые можно назвать ограничениями на «контекст» силлогизма, вытекают из того, что частоты, с которыми встречаются а, b и с, должны лежать в некоторых заданных пределах: (2,3) 0<g,^x, + x, + x,^x,^h,^\, (4, 5) 0<йг^<х, + л:з + х,+д:,</1^<1, (6, 7) О < < X, + X, + X, Ч- -v'e < Л, < 1. И, наконец, имеется еще восемь ограничений, связанных с требованиями удовлетворения определенным ограничениям точности Введенные нами характеристики трех детерминаций, определяющих силлогизм, вычисляются по стандартным формулам на основании табл. 3.13. В соответствии с этой таблицей величина /, например, равна Xi + Xs
150 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ ' Xi + X2 + X3 + X^' Тогда при заданных ограничениях и таких Xt, что все 15 ограничений удовлетворяются, можно утверждать, что точность и полнота детерминации ска, которые мы можем обозначить через г и удовлетворяют ограничениям Го<г^Г1 и So^s^Si. Решение сформулированной задачи можно свести к задаче дробно-линейного программирования. Результатом ее решения будет нахождение таких областей в пространстве Xi, в которых будет реализовываться вывод с помощью силлогизма с заданными фиксированными значениями квантификаторов. Для этого только еще нужно сопоставить словесным оценкам этих квантификаторов некоторые отрезки или интервалы на отрезке [О, 1]. Нашу постановку задачи можно упростить. Так как из ограничений 2, 4, 6 следует строгая положительность знаменателей в ограничениях 8—15, то все ограничения можно переписать в линейной форме. Кроме того, если еще учесть, что Р{uv)=^Р{u/v)P(v) и перейти от условных частот к частотам Р{аЬ), Р{ас) и Р{сЬ), то и целевые функции в нашей задаче можно выразить в линейной форме (для этого нужно будет изменить значение ограничений). Тогда задача поиска обобщенного (детерминационного) силлогизма будет сведена к стандартной задаче линейного программирования. Для качественного анализа того, что получается при решении подобной задачи, рассмотрим случай, когда нас инетересует лишь точность соответствующих детерминаций. Кроме того, предположим, и ПОЛНОТЫ детерминаций, входящих в посылки силлогизма. («■9) (12, 13) /о< </i, (14, 15) то<— Ограничения (8,9) и (10, 11) задают условия, налагаемые на точность И полноту детерминации ан^б, а остальные ограничения — на точность И полноту детерминации Ь\-^с. Четырнадцать параметров в этих ограничениях (верхние и нижние границы в неравенствах) дают весьма широкие возможности. Их задание определяет вид тех частотных квантификаторов, которые используются в посылках силлогизма. Нас же интересуют значения четырех ограничений для точности и полноты детерминации с\^а^ которая является заключением силлогизма г < ^1 + ^2 ^ ^'^х, + х, + х, + х,^'^'^
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 151 ЧТО имеют место следующие однородные ограничения на точности детерминаций (они обозначены соответствующими условными вероятностями) и на контекст силлогизма: у.<Я(Ь/аХ1, X < Я (с/Ь) < 1, 0<v<P(aXl, О < V < Р (ЬХ 1, 0<v<P(cXl, где X и V — неизвестные пока ограничения на частоты. С учетом этих неравенств и равенства (1) можно свести исходную задачу к задаче вида: найти Xi, лгз, х^, х^, х^, х^, х^ и х^, которые удовлетворяют ограничению (1) и системе ограничений (1—X) a:i + X2 + (1—х) л:з + л',>0, (1—х)л:1 + л:з + (1—л:5 + х->0, ^1 + ^2 + ^'з + ^'4>^. a:i + a:3 + x.+a:,>v, Xi-fA:2 + A:5 + ^e>v. Кроме того, все Xi должны быть равны или больше нуля (это условие вместе с соотношением (1) гарантирует выполнение верхних ограничений для всех пяти вероятностей), а Р{с1о) должно лежать в заданных пределах [б, 1]. Если найти решение поставленной задачи, считая х и v некоторыми параметрами, то оно будет иметь вид, различный для трех областей, на которые разбивается единичный квадрат, задаваемый соотношениями O^x^l и 0<v^l: 6 = О для области 2 — 1/v для области 2, 1—(1—x)(x+l/v) для области 5. Перенумерованные области показаны на рис. 3.27. Их границы определяются следующими соотношениями: Область I Область 2 Оотасть 3 Г v<0,5 1-х ; f V > 0,5 v< 1+х- X 1+х —Х2 1—X
152 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Рассмотрим эти области В области / выполняется неравенство 0<Р(с/аХ1. Оно тавтологично, так как выполняется всегда и никак не зависит от точности детерминаций, образующих посылки. Для этого достаточно лишь факта существования самой частоты Р{с1а), что в нашем квадрате всегда имеет место. Значит, область 1 нам ничего интересного не дает. В области 2 выполняется неравенство 2— l/v<P(c/a)<l. Рассмотрим лишь те свойства, которые мы обозначили через аи Cj г про b не будем иметь никакой информации. Тогда неравенство для Р{с/а) в данной области все равно будет иметь место только потому, что для Р{а) и Р{с) величина v превышает 0,5. Таким образом, область 2, хотя и не тавтологична, как область но не содержит собственно силлогизмов. Утверждения из этой области можно было бы назвать, например, тривиальными истинами. Для области 3 выполняется неравенство 1 —(1 —к) (к +1 /v)< Р {с/а) < 1. Наличие к в данном неравенстве связывает точность заключительной детерминации с точностями детерминаций, входящих в посылки. Это область обобщенных силлогизмов. Если, например, то Р{Ь/а) = \, Р{с1Ь)=\ и Р{с1а)=\, Мы получаем известный аристотелевский силлогизм, называемый обычно Barbara, Интересно, что при х=1 оказываются незначимыми значения v, т. е. характер контекста силлогизма. Это означает, что то условие v=2, которое всегда подразумевается в классическом истолковании силлогизмов Аристотеля, не является обязательным для модусов типа Barbara. Если отказаться от одинаковости ограничений v в контексте, то можно получать и другие расширения силлогизмов. Отметим, что значение v легко связывается с квантификаторами оценки частоты типа часто, очень часто, почти всегда, А если правые ограничения в контексте также сделать различными и отличными от единицы, то контекст будет определять частотные квантификаторы, с которыми входят в схему вывода посылки силлогизма. Пример 3.33. Пусть 0<х<е и 0<v<e, где е — малое число. Тогда, согласно Аристотелю, такие параметры будут давать ложные силлогизмы. На рис. 3.28 показаны области, построенные в квадрате (х, V), аналогичные приведенным на рис. 3.27. Область / есть область ложности силлогизма. Область 2, показанная жирной линией, есть область тривиальной истины, подобная области 2 на рис. 3.27. 1) Штриховка показывает открытую границу,
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 153 В областях 3 и 4 силлогизм существует, а в области 5 не существует. Открытые границы областей показаны штриховкой. Вот пример силлогизма, содержащегося в области существования силлогизма, показанной на рис. 3.28. Среди любителей сигар редко встречаются женщины Среди женщин редко встречаются политические деятели Среди любителей сигар политические деятели встречаются нередко В заключение остановимся еще на одном классе правил вывода нечеткого типа. Такие правила, по-видимому, не имеют прямого отношения именно к каузальной логике, но по своей идеологии они тесно связаны с рассмотренными нами здесь правилами. Эта группа правил связана с рассуждениями по аяа- лог/^/^, играющими огромную роль для человека и находящими широкое применение при полуформальном объяснении технологии управления и способов принятия решений в условиях альтернативного выбора. Прежде всего возникает вопрос о том, что именно следует считать аналогией . Рассмотрим следующий примере). Пример 3.34. Пусть имеются два текста, описывающих две ситуации. Первый текст: «Ромео любит Джульетту. Джульетта любит Ромео. Ромео — мужчина. Он итальянец. Джульетта — женщина. Она красива. Она незамужняя». Второй текст: «Тристан любит Изольду. Тристан — мужчина. Он бретонец. Изольда — женщина. Она красива. Она замужем за королем Марком». На рис. 3.29 показаны графы, соответствующие приведенным текстам. Из самих текстов и из рис. 3.29 вытекает (с точки зрения человеческой интуиции), что между обеими ситуациями много общего. Но в чем это проявляется? Что важно в описаниях для установления аналогии и что не столь уж важно? Важно ли то, что Ромео и Тристан мужчины? Играет ли роль их национальность? Весомо ли различие в том, что у Изольды есть муж, а у Джульетты его нет? Ответы на эти вопросы зависят от того, как будет определено само понятие аналогии. В настоящий момент все исследователи согласны, что одной из моделей, которые могут использоваться при выявлении сути рассуждений по аналогии и построении соответствующих правил вывода. 0.5 Рис. 3.28 1) Этот пример был рассмотрен в докладе А. Фарренн и А. Праде на Европейской конференции по искусственному интеллекту, проходившей в Орсее в 1982 г.
154 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИЙ может служить введенный еще Лейбницем предикат аналогии. Этот предикат описывается диаграммой, весьма похожей на диаграмму моделирования, о которой упоминалось в §2.11: А' в' Рассмотрим класс объектов X, в котором реализуется вывод из объекта А в объект А\ другой класс объектов где реализуется вывод из объекта В в объект В\ и пусть, наконец, между объектами, входящими в X и установлено некое соответствие (например, существует взаимно однозначное соответствие между X и F). Тогда, Мужчина Женщищ 'Итальянец Незамужняя Мужчина Женш,ина Люди/г? If. му>на оретомец *^ Рис. 3.29 если согласно этому соответствию А отображается в В, то должно выполняться требование коммутативности диаграммы. Другими словами, должно существовать отображение W, которое устроено так, что В'ютображается в тот же элемент А\ который выводится с помощью 7 из Л, если В' получен за счет вывода Q из В. Напомним, что и для диаграммы моделирования требование коммутативности было необходимым. И такое совпадение не случайно. Как приведенная нами диаграмма, иллюстрирующая суть аналогии по Лейбницу, так и диаграмма, характеризующая отношение моделирования, по сути одинаковы. Введение нечеткого отношения моделирования
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 155 есть один из возможных способов введения аналогий. Но их можно вводить и без аппарата функций принадлежности, оставаясь в рамках обычных алгебраических систем. Эта возможность иллюстрируется следующим простым примером i). Пример 3.35. На рис. 3.30 показаны три элемента Л, Л' и В, которые входят в диаграмму для предиката аналогии. Возникает вопрос, какая картинка должна стоять на месте В' для сохранения коммутативности диаграммы? Для ответа на него необходимо построить отображения V и W. Но прежде чем делать это, необходимо описать сами картинки, выбрав подходящий язык. Для нас естественно выбрать в качестве такого языка язык ситуационного управления, описанный в гл. 2. Позаимствовав из табл. 2.1 обозначения для отношений, введем следующие обозначения: — маленький незакрашенный кружок, аа — большой кружок, аз — прямоугольник, fei —крестик, fea — треугольник, — маленький черненький кружок, г^о — быть сверху, — быть снизу, г^з — находиться в. Опишем в этих терминах картинки, соответствующие А, Л' и В. Л': (a3^43a2)(a2^4iai); В: {Ь.гМФггМ- Введем теперь соответствие V; зададим его как изоморфизм: ai<->fei, a2<r^b2, аз<->^з' Так как мы установили отношение изоморфизма, то вместе с V однозначно определено и W, Тогда для перехода от описания Л' к описанию В' достаточно произвести нужную замену, вытекающую из заданного изоморфизма. Проделав это, получим В': (йз^зйг) (^2^1^!). Такому описанию соответствует картинка, показанная в правом нижнем углу на рис. 3.30. Она и должна быть помещена в качестве В' в основной рисунок. д 1 /+\ > ? 1 • 1 11 + А Рис. 3.30 1) Этот пример приводится в докладе Д. Пётчке, представленном в материалах той же Европейской конференции по искусственному интеллекту, проходившей в Орсее в 1982 г.
156 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИИ §3.8. Неполнота и «абсурдность» знаний Проблему противоречивости знаний, хранящихся в системе управления, мы уже затрагивали в § 1.6. При работе системы пополнения знаний, особенно при использовании правил вывода, которые не имеют абсолютного характера истинности получаемых утверждений, появление в памяти системы управления противоречивых описаний объекта управления протекающих в нем процессов или самой Сделаем несколько важных замечаний. Процедура установления соответствий V п W зависит от выбранного способа описаний Л, Л' и Б. Представим себе, например, что Л' описано не так, как мы сделали, а в следующем виде: А': {а1Г^оа2){с1зГ^з^2)- Тогда сравнительный анализ описаний не дает возможности найти какой-либо гомоморфизм между тремя заданными описаниями. В качестве второго замечания укажем на то, что для описания нужно выбирать такие отношения, для которых существовали бы правила вывода, переводящие комбинации одних отношений в комбинации других отношений. В нашем случае это оказалось возможным из-за наличия правила вывода, относящегося к пространственной логике взаимного расположения предметов, которое имеет вид И последнее замечание. Если Т и V установлены и являются отношениями изоморфизма, то Q и всегда существуют и также являются отношениями изоморфизма. Анализ приведенного примера и высказанные после него замечания показывают, что на пути практического использования правил, отражающих рассуждения по аналогии, имеются пока большие трудности. Особенно это касается выбора подходящего языка описания множеств объектов, входящих в диаграмму аналогии, и разработки мощных средств преобразований описаний друг в друга. В гл. 4 мы еще раз вернемся к правилам рассуждений по аналогии в связи с описанием специального метода, позволяющего генерировать гипотезы о наличии или отсутствии причршно-следственных связей между.явлениями и распространять эти гипотезы на ранее неизвестные случаи. Завершая параграф, посвященный каузальным логикам, надо отметить, что по сравнению с временными и пространственными логиками эти логики пока еще разработаны весьма поверхностно. Требуются еще большие усилия для их завершения. Особенно мало сделано в области анализа взаимного влияния выводов в каузальных логиках на выводы во временной и пространственной логиках (на рис. З.П эти. связи отмечены прямыми стрелками, идущими между соответствующими логиками), а также в области влияния каузальных логик на принятие решений в логиках действий. Об этом последнем влгшнни мы еще поговорим в последующих главах, где будут обсуждаться логики действий.
§3.8. НЕПОЛНОТА И сАБСУРДНОСТЬ» ЗНАНИЙ 157" процедуры управлер1ия не столь уж маловероятно. Поэтому здесь мы обсудим некоторые из причин появления «абсурдных» знаний и методы их устранения. Источник неприятностей, которые могут возникнуть в памяти системы^ кроется в неполноте информации, хранящейся в базе знаний. Если в базе отсутствует некая информация, то совершенно неясно, является ли отсутствующий факт истинным (и, например, противоречащим какому-либо факту, который уже имеется в памяти) или ложным. В силу неполноты заполнения памяти отсутствие в ней какого-либо утверждения ничего не говорит об его истинности или ложности, возможности или невозможности его появления в памяти. В известной логической системе средневековой Индии Навья-ньяя различаются четыре вида отсутствия: отсутствие из-за непоявления этого до настоящего момента времени, отсутствие- чего-либо, так как к настоящему моменту времени оно уже исчезло, отсутствие- в силу невозможности появления этого никогда ни в прошлом, ни в настоящем и отсутствие из-за того, что в настоящий момент присутствует нечто, с чем несовместимо появление интересующего нас. Все четыре вида отсутствия в Навье-ньяя. строго различаются; и оперирование с ними происходит различным образом. Нечто подобное наблюдается и в современных базах знаний как в семиотических: системах управления, так и в других интеллектуальных системах, опирающихся в своей работе на базу знаний. Поэтому мы здесь попробуем обсудить некоторые фрагменты еще не созданной теории работы с неполными базами знаний. Начнем с того, что неполнота, о которой идет речь, многолика. Существует несколько видов неполноты, по-разному сказывающихся на возможности появления противоречивой информации в памяти системы. Во-первых, значения данных, начиная с числовых, могут быть точно не определены. Вместо точного значения q, о котором известно, что оно принимает некоторое числовое значение, в памяти системы имеется лишь указание на некий интервал, в котором находится это значение. Пусть, например, мы имеем q, значение которого фиксировано где-то в интервале (О, 10) и g, значение которого фиксировано где-то в интервале (5, 12).. И пусть нам известно, что g<q> Тогда информация, хранимая в памяти системы, в некотором смысле противоречива, так как при значениях g из интервала (10, 12) будет нарушаться условие g<q> Для устранения этого противоречия можно произвести уточнение информации для g и считать, что g приписывается значение из интервала (5, 10), а q — значение также из интервала (5, 10). С такими интервальными значениями можно совершать все необходимые операции. В настоящее время арифметика, работающая с интервальными представлениями, хорошо развита. Две такие системы описаны в работах, указанных в комментарии к данной главе. Можно предполагать, что конкретные значения, которые на самом деле соответствуют q, не просто фиксированы где-то на интервале (а, Ь), а имеется дополнительная информация о выборе истинного значения q на этом интервале. Такая информация может иметь характер вероятностного распределения для поиска истинного значения или задаваться, например, в виде функции принадлежности того типа, который мы ввели в § 2.11 и уже неоднократно использовали. В подобных случаях также могут возникать противоречивые ситуации, связанные, например, с несовместимостью таких утверждений; «С вероятностью, большей 0,99, значение q находится в интервале (О, 1)» и «С вероятностью, большей 0,95, значение q находится в интервале (10, 60)». Арифметика таких интервальных величин развита чрезвычайно слабо и еще ждет своих исследователей. Таким же образом можно определить неопределенное множество, неопределенную переменную, неопределенный предикат и неопределенное отношение. Несколько сложнее вводится понятие неопределенной функции. Весь этот набор не-объек- тов требует создания для оперирования с ним специального математического аппарата. Только в этом случае появляется надежда справиться с теорией баз знаний, в которых представлены неопределенные объекты. В рамках этой теории должны быть, в частности, разработаны методы уточнения границ интервалов и описания множеств, предикатов, отношений и функций, которые позволили бы системе максимально устранять в содержимом памяти возможные в будущем противоречия из-за поступления новой информации.
i5S гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Другим видом некорректности, грозящим «спокойствию» содержимого базы знаний, является так называемая переопределенность. При переопределенности одним и тем же интервальным константам, переменным и прочим не-объектам приписываются одновременно и с равным основанием противоречащие друг другу значения. Например, некоторой пропозициональной переменной одновременно приписывается значение истины и лжи. Для работы с подобными переопределенными (абсурдными) объектами также строятся специальные процедуры. Примером такой процедуры может служить четырехзначная логика, в которой каждой пропозициональной переменной приписывается одно из четырех значений: истина, ложь, полная неопределенность и истина —ложь (абсурд). В последние годы исследования в области логик такого типа активно развиваются, и есть надежда, что в ближайшем будущем необходимый аппарат будет создан. В заключение настоящего параграфа напомним о том, о чем уже говорилось в § 1.6. В ряде случаев противоречащие друг другу утверждения возникают в памяти системы и из-за того, что для каждого достаточно жизненного (не чисто математического) понятия всегда возможно его рассмотрение в различных аспектах или различных возможных мирах. И это противоречие устраняется фиксацией того аспекта или мира, к которому данный объект относится.
ГЛАВА 4 ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Интервью с пожарником в консерватории: — Вы проработали здесь 20 лет и теперь, наверное, хорошо знаете разницу между контрабасом и скрипкой? — Конечно. Контрабас горит значительно дольше. Из музыкального фольклора- §4.1. Суть проблемы Вернемся на минуту к рис. 1.7, на котором мы привели общую схему, характерную для систем ситуационного управления; центральной ее частью был КЛАССИФИКАТОР. С его помощью решается основная задача — получение классов ситуаций, каждый из которых однозначно или с определенными приоритетами соответствует тем или иным решениям по управлению. Отсюда становится очевидной важная роль процесса обобщения описаний и их классификации. На первый взгляд может показаться, что подобная проблема активно решается в других науках, например, в теории распознавания образов или в кластерном анализе. Это так и не так. Конечно, многие методы, развитые в данных разделах дискретной математики, используются (и не безуспешно) и здесь. Но кардинальное отличие проблемы обобщения и классификации в ситуационном управлении и вообще в семиотических моделях состоит в том, что, кроме самой задачи формирования обобщенных понятий и классификации по множеству заданных признаков, требуется еще решать задачу определения прагматически важных признаков, которая, как правило, заменяется в теории распознавания образов поиском информативных признаков. Различие в этих подходах можно проиллюстрировать цитатой ^) «...можно увидеть в логарифмической линейке предмет для забивания гвоздей. Логарифмической линейкой можно забить гвоздь, в ней есть протяженность и известная масса. Но это тот самый вариант, при котором видишь десятую, двадцатую функцию предмета, между тем как с помощью линейки можно считать, а не только забивать гвозди». Можно сформировать много различных понятий, которые будут опираться на четкие логические соображения, но они не будут играть никакой роли при решении задачи управления. Ведь недаром среди специалистов, занимающихся диагностикой психических заболеваний, бытует такое определение «Он рассуждает абсолютно логично, но неверно». Что это значит? Хорошо известен тест, с ^) С е м е н о в Ю. Семнадцать мгновений весны.— Баку, 1981, с. 17.
160 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИП 1) Асмус В. Ф. Логика.—М., 1947, с. 70. ПОМОЩЬЮ которого проверяется способность к «правильной» классификации. Из заданных на карточках изображений предметов надо сформировать некоторые группы — классы. В этой задаче проверяются те основания, которые будет использовать человек при образовании понятий. Классическим примером является тот, в котором испытуемьи"! в один класс объединяет изображения человека, дерева, карандаша, а в другой — изображения шкафа, водосточной трубы и надувного шара. На вопрос о причинах такой классификации испытуемый отвечает, что он выбрал информативный признак — наличие пустоты внутри объекта. Такая классификация, конечно, логически безупречна. Но ее ли Мы априорно ожидали, начиная испытания? Очевидно, нет. Итак, первая особенность задач формирования понятий и классификации в ситуационном управлении — поиск прагматических признаков классификации, способных обеспечить нахождение таких обобщенных описаний ситуаций, которые позволяли бы успешно решать задачу поиска решения по управлению объектом. В традиционной теории распознавания образов и в кластерном анализе центральную роль играет понятие признака. Именно признаки выступают в качестве параметров, на основании которых происходит выделение обобщенных понятий и строится та или иная классификация. В языках описания ситуаций, типичных для всех методов управления, опирающихся на семиотические модели, огромную роль играют не признаки, а структуры отношений между объектами. Во многих случаях, конечно, комплексы отношений можно было бы рассматривать как своеобразные признаки. Поэтому мешают два обстоятельства. Прежде всего, отметим резкое возрастание числа признаков, так как число возможных комплексов отношений стремительно возрастает с ростом числа отношений и увеличением их типового разнообразия, а большинство их комбинаций не имеет никакого значения для решения задачи обобщения. Кроме того, признаки приписываются определенным объектам и использование комплексов отношений в качестве признаков приведет к необходимости введения огромного числа лишних объектов. Понятия, связанные с этими объектами, также будут лишними, ибо «понятие, которое мы не можем развернуть в суждение, не имеет для нас никакого логического смысла». ^) И, наконец, зачастую практически невозможно вычленить тот признак, который используется для формирования понятия. Примерами таких псевдопонятий (в рамках призначного подхода) могут служить: ручка управления, нос корабля, очередь на обслуживание и т. п. Вторая особенность задачи формирования понятий и обобщения ситуаций в рассматриваемой области — наличие процедур обобщения, основанных яа структуре отношений, присутствующей в описании ситуаций.
§4.1. СУТЬ проблемы 161 И, наконец, третья особенность обсуждаемых процедур, характерных для всех систем, работающих со знаниями,— возможность работы с именами, присваиваемыми отдельным понятиям и ситуациям. Имена—это, конечно, не признаки. Во всяком случае, это признаки особого рода. И использование их при классификации отличает описываемый подход от традиционных процедур. Для человека в его модели мира имена, по-видимому, играют особую роль. Как писал В. Катаев, «Я заметил, что человека втрое больше мучает вид предмета, если он не знает его названия. Давать имя окружающим вещам — быть может, это одно и отличает человека от другого существа. Но у меня нет такого запаса слов, чтобы назвать миллионы существ, понятий, вещей, окружающих меня. Это мучит. Но еще большее мучение, вероятно, испытывает вещь, лишенная имени: ее существование неполноценно. Сонмы неназванных предметов терзаются вокруг меня и в свою очередь терзают меня самого страшным сознанием того, что я не бог. Не имеющие имен вещи и понятия стоят в стеклянных шкафах вечности, как новенькие золоченые игуры еще не воплотившихся будд в темных приделах храма... ни ждут своего воплощения, а это может произойти лишь тогда, когда в мире появится какое-нибудь совершенно новое понятие, требующее пластического выражения» Эти три особенности задачи обобщения понятий и классификации заставляют разрабатывать специфические процедуры формирования понятий и их классификации, ориентированные на решение задач ситуационного управления и других методов управления аналогичного типа. Общая постановка этих задач в нашем случае имеет следующий вид (обозначения взяты из § 1.4). На множестве конкретных ситуаций {Qi} найти такое разбиение их на классы, при котором каждый класс имел бы в рамках данной модели управления некоторую «разумную» интерпретацию процесса управления ситуацией. На множестве полных ситуаций {Si} необходимо выделить такое множество классов S'\ что каждый из них допускал бы «разумную» интерпретацию для процедуры поиска решения по управлению объектом. В частности, классификация S' по некоторому основанию должна быть согласована с классификацией на множестве воздействий (управлений) {6^^}. Сделаем некоторые пояснения в связи с подобной постановкой задач. Как мы видим, задача разбивается на два этапа: обобщение текущих ситуаций и обобщение полных ситуаций. Такая этапность не обязательна. Но в большинстве практически интересных случаев она оправдана. Текущие ситуации связаны только с самим объектом управления, с особенностями протекающих в нем процессов. Поэтому классам Q'* отвечают обобщенные описания данного объекта. Они базируются на признаках и структурах отношений, характерных для объекта управления и важных для сжатия информации об ^) Катаев В. Трава забвения,— М.: Детская литература, 1967, с. 31. 6 д. а, поспелов
152 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИП объекте и протекающих в нем процессов. Классы же формируются в основном на базе тех признаков и структур отношений, которые связаны с процессом управления объектом, они используют как априорные знания об объекте и методах управления им, так и реальную предысторию, накопленную в процессе функционирования системы управления. При постановке задачи обобщения для текущих ситуаций речь шла о поиске разбиения множества {Q^}. Другими словами, классы Q' удовлетворяли двум требованиям, обязательным для разбиений: Q'nQ^ = 0 если i^j и и —Q, где Q—полное множество всех текущих ситуаций. То или иное решение этой задачи всегда возможно. При решении же задачи об обобщении и классификации полных ситуаций, как правило, найти разбиение их множества на классы не удается. Это связано с тем, что для поиска классов S^ используется весьма неполная информация, получаемая от технологов-управленцев, имеющих по многим вопросам управления свое личное мнение, не совпадающее с мнениями других экспертов. Поэтому вместо разбиения {5^} на классы в этом случае решается задача о нахождении покрытия множества 5. При этом 5' П S^' не обязательно пусты при /=7^у, но и 5'=5. t И последнее пояснение. В процессе обобщения ситуаций St и появления классов ситуаций возникает естественная иерархия, определяемая вхождением одних классов в другие. Так как прагматическая классификация основана на стремлении так сформировать классы, чтобы облегчить поиск решения по управлению объектом, то иерархия классов полных ситуаций должна быть согласована с иерархией воздействий (управлений) следующим образом: если S'czS^' и для 5' характерны управления из множества U'\ а для 5^' — из множества t/^, то должно иметь место вхождение Ниже мы укажем пути решения поставленных задач. В ближайшем же параграфе мы сообщим некоторые сведения их психологии мышления, которые оказываются важными при решении задач формирования понятий и классификации в системах семиотического управления. § 4.2, Обобщение понятий и классификация у человека Здесь мы достаточно бегло и конспективно коснемся данных, накопленных в области психологии мышления и важных для решения проблем, обсуждаемых в данной главе. Прежде всего привлекают внимание современные представления о том, каким образом у ребенка возникают понятия, каким образом он из потока собственных ош,ущ,ений вычленяет тот или иной их комплекс, который впоследствии выступает для него как единое обобщенное целое, как понятие или типовая ситуация. Если суммировать эти представления, то они сводятся к следующему. В начальный период (так называемый период бормотания) ребенок, еще не овладевший словом, а вместе с тем и способностью к декомпозиции ощущений и представлений, воспри-
§ 4.2. ОБОБЩЕНИЕ ПОНЯТИЙ И КЛАССИФИКАЦИЯ У ЧЕЛОВЕКА 163 нимает конкретные ситуации в нерасчлененном виде. При этом зрите.1ьные, акустические и другие ощущения оказываются у него тесно связанными с данной ситуацией. Поэтому на первом этапе овладения языком именно звуковые образы начинают играть роль имени некоторого объекта (например, би-би для обозначения автомашины или кис-кис для кошки). Характерным примером важности «интонационного бормотания» для понимания ситуации могут служить многочисленные в последнее время мультфильмы для детей, герои которых не произносят никаких слов, а только интонационно бормочут «по-английски», «по-польски» или «по-русски». И тем не менее такое неязыковое бормотание вполне однозначно интерпретируется зрителями фильмов. В этот период ребенок объединяет в единые комплексы случайно оказавшиеся в ситуации факты и явления. Для него в роли понятий выступают такие конкретные ситуации, в которых как определяющие, так и случайные факторы оказываются равноправными. На следующем этапе формирования своей модели окружающего мира ребенок использует то, что психологи называют «псевдопонятиями». Эти образования в отличие от комплексов уже не случайны. Основную роль в них играют ассоциативные связи между отдельными явлениями и фактами, подкрепляемые той деятельностью, которую реализует ребенок в окружающей его среде. В этот период он уже овладевает морфологией и приобретает возможность разделять между собой объекты, процессы и явления (от би-би образует бибика, бибикать, бибиканье). Чуть позже возникает стремление к классификации накопленных знаний. В этот период, когда ребенок еще не может оперировать с абстрактными понятиями, а пользуется лишь понятиями-комплексами, состоящими из конечного числа включаемых в данное понятие его конкретных представителей, детская классификация конкретна. Отсюда возникают такие классифицирующие «определения» как «Собака — она меня вот сюда укусила» или «Завод — это где папа работает». Но в этом возрасте (4—6 лет) уже идет активное развитие способности к вычленению понятий-классов из окружающего мира. Конкретное уступает место общему. И если раньше на вопрос «Кто водит поезда?, ребенок отвечал «Машинист», а на вопрос «Кто ломает игрушки?» — «Петька», то теперь на второй вопрос он вполне может дать ответ «Ломатель». Если проследить, как ребенок структурирует окружающую его действительность, то можно выделить следующие этапы: нерасчлененные гештальты ситуаций, выделение и называние некоторых элементов таких ситуаций (присвоение им имен по KaKOi'i-нибудь составляющей данной ситуации), присвоение самостоятельного имени ситуации, присвоение имен отдельным объектам и фактам, образование понятий-комплексов, называние истинных понятий и формирование (как правило, четко не формулируемое) функций классификации, обеспечивающих отнесение тех или иных единичных с\'Щностей к тем или иным понятиям, вычленение признаков как самостоятельных атрибутов, связанных с понятиями, ситуативная классификация понятий, логическая классификация понятий. Многое из сказанного требует пояснений. Мы их дадим постепенно, использовав для этой цели не только наблюдения за развитием способности детей к классификации и образованию понятий, но и соответствующие наблюдения над взрослыми людьми. Прежде всего еще раз обратим внимание на то, что при формировании истинных понятий (которыми оперируют и взрослые люди) основания, служащие для их выделения, появляются генетически раньше возникновения четкого'осозна- ния признаков предметов, процессов и явлений как специальных, особых сущностей. Поэтому у взрослого человека, как и у ребенка, огромные трудности вызывает задача определения через призначную структуру тех понятий, которые носят для него само-собой разумеющийся характер (так называемые бытовые понятия в отличие от научных, вводимых с помощью строгих научных определений). В Одной из своих популярных книг известный специалист в области языка и культуры А. М. Кондратов приводит результаты эксперимента, который проводился со школьниками старших классов и взрослыми испытуемыми. Требовалось дать определение понятия, «дверь». Оказалось, что задача эта чрезвычайно трудна. Вот образцы полученных в ходе эксперимента ответов. — Дверь... На нее табличку можно повесить, дермантином обить, ручку красивую сделать.
164 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ — Ну, дверь... Это когда входить в квартиру. Она открывается. Еще запереть ее можно, чтобы не обокрали. — Дверь, она деревянная. Хотя не всегда — бывают и стеклянные двери, в гостиницах, например. Она поворачивается, дверь. Хотя есть и раздвижные — в купе поезда. При чтении таких «определений» хорошо всем известного класса предметов охватывает какое-то чувство неловкости за человека. Но не следует спешить с выводами об уровне развития тех, кто давал эти ответы. Попробуйте сами дать определения таких простых понятий, как «окно», «стол», «ложка» и многое другое А вот как понятие «дверь» определяется в «Кратком толковом словаре русского языка для иностранцев»: «Дверь — отверстие в стене для входа и выхода, а также то, чем закрывают это отверстие». Теперь трудность задачи очевидна. Ибо даже толковый словарь дает явно неточное определение (или толкование) понятия «дверь». Согласно ему, например, штора, закрывающая «отверстие в стене для входа и выхода», также является дверью. Итак, большинство понятий, с которыми оперируют люди в повседневной жизни, не имеют для них строго выделенной призначной структуры. Что же тогда служит для объединения конкретных сущностей в некоторый класс, которому присваивается специальное имя? Ответ на поставленный вопрос с виду несложен. В подавляющем большинстве случаев это объединение происходит по принципу одинаковой прагматической функции, реализуемой всеми сущностями, входящими в данный класс. В ответах по поводу двери у испытуемых несколько раз встречались попытки выявления этой функции. В толковом словаре сделана попытка также использовать для определения двери ее функциональное назначение. Поэтому столь часто встречаются определения типа «Стул — это на чем сидят», «Ложка — это то, чем едят кашу и жидкую пищр и т. п. Однако наряду с этим встречаются понятия, которые сформированы по другому принципу. Интересно, что классифицирующие возможности естественных языков отражают именно другую возможность выделения понятий. Характерное для ряда языков деление по родам основано на вычленении в живом сложного признака — пола. Правда, род мы распространяем и на неодушевленные объекты, хотя говорить о неграмматической основе отнесения стола к мужскому роду, а табуретки — к женскому не приходится. Но для одушевленных предметов этот признак выделяет вполне определенные классы сущностей. А в папуасском языке асмат с помощью грамматики выделяется шесть классов: предметы узкие и высокие, покоящиеся на малом основании (люди, деревья), одинаково высокие и широкие (дом, собака), широкие и низкие, покоящиеся на большом основании (лежащие стволы, змея), плавающие (рыба, лодка), летающие (птица, бабочка), лежащие наверху так, что для того, чтобы увидеть их, надо подняться па что-нибудь (лук, лежащий под крышей хижины на полке и не видный с пола хижины). И для каждого такого класса имеются свои специальные способы обозначения с помощью грамматических форм. Язык позволяет вводить и такие абстрактные понятия, которые вычленяются прямым указанием на классифицирующий признак. Таково, например, понятие синев, вычленяющее из всего окружения все, что имеет синий цвет. Классические опыты Лурия, проведенные в тридцатые годы, в глухих кишлаках Средней Азии (особенно, когда испытуемыми были женщины) выявили ряд особенностей формирования понятий, которые у людей, подвергшихся влиянию науки и обучения научному мышлению, становятся мало заметными. Основной особенностью, отмечаемой исследователем, является доминанта различения над сходством. Гипотезу о том, что исторически сначала возникла операция различения и выделения различия, а лишь потом операция объединения и выделения сходства выдвинул еще А. Бинэ. Он основывался на том, что факт различия непосредственно наблюдается в сравниваемых объектах или явлениях, а факт сходства есть результат проведения некоторой логической, абстрактной операции. Гипотеза Бинэ ^) По слухам, известному ленинградскому писателю-фантасту принадлежит следующее замечательное определение ложки. «Ложка, по военной терминологии, делится на хлебало, держало и соединительную планку».
§ 4.2. ОБОБЩЕНИЕ ПОНЯТИИ И КЛАССИФИКАЦИЯ У ЧЕЛОВЕКА 165 подтвердилась в опытах Лурии. Испытуемые, например, никак не могли сформировать класс «домашние животные», когда им показывали изображение на карточках домашних животных, растений, диких животных, предметов домашнего обихода. И даже на прямой вопрос экспериментатора «Что общего между курицей и собакой?»,— следовал ответ «Ничего общего. У собаки четыре ноги, а у курицы две». Подобно детям, жители глухих кишлаков Памира в эти годы так давали «определения» понятий: «Дерево — это яблоня, карагач, тополь», «Автобус силой огня движется и его человек двигает... Если масла туда не наливать, и народа не будет, он не будет двигаться». Весьма характерно, что многие вещи, которые в эксперименте предлагалось определить, не определялись потому, что «это и так видно». В ответ на просьбу дать определение понятию «горы» был получен ответ «Если горы ты никогда не видел, как тебе это можно объяснить?» Аналогично на вопрос, как можно объяснить человеку, который никогда не видел автобуса, что это такое, был получен ответ «Буду так рассказывать: ходят автобусы, у них четыре ноги, передние стулья, чтобы сидеть, крыша для тени и машина... А вообще, я скажу: если сядешь, увидешь, что это такое». • Приведенные эксперименты еще раз подчеркивают важную для нас мысль о том, что не призначная структура, находящаяся в центре внимания специалистов по распознаванию образов, а ситуативное положение того или иного факта или объекта определяют его интерпретацию у человека, не имеющего дело с научными определениями и теориями. Перейдем теперь к проблеме классификации. И здесь научный стиль мышления сыграл значительную роль в нашей оценке этой процедуры. Начиная с Линнея, давшего блестящую структуру классификации растений, в науке возобладал принцип родо-видовых классификаций. Такие деревообразные классификации стали повсеместным явлением. Получение классификации подобного типа представляется заманчивым и абсолютно необходимым. Возрастает роль отношений типа часть — целое, род — вид, мношство — подмножество, элемент — класс и т. п. Однако те же психологические эксперименты показывают, что естественная для человека классификация основана на других принципах. При раскладывании карточек испытуемые А. Р. Лурии никогда не клали в одну группу изображение овцы и волка, ибо «волк загрызет овцу, а это нехорошо», но помещали в одну группу карточки с изображением овцы, котла, ножа, скатерти, говоря «Будет праздник, расстелим скатерть, овцу зарежем, сварим хороший плов». Таким образом, ситуативная классификация играет в мышлении человека доминирующую роль, а категориальная классификация (в частности, родо-видовая) —куда менее значительную. Заметим, что среди категориальных классификаций использованле прямых наблюдаемых признаков также встречается весьма нечасто. Многие классифицирующие системы основаны на прагматических признаках, о которых мы уже упоминали. Так, например, образованы понятия орудия труда или растения. Особый класс понятий составляют социальные понятия: семья, школьный класс, нумизматы нашего города и т. п. Основанные на них классификации также весьма характерны для человека. Остановимся еще на одном тоже важном для построения систем классификации свойстве человеческого мышления. Известно, что при образовании понятий значительную роль играют ассоциации, возникающие у всех нас при работе с языковыми и внеязыковыми текстами. Упомянем о результатах, относящихся к семантическому пространству Ч. Осгуда. Идея, которую много лет развивал этот ученый и его многочисленные ученики и последователи, заключалась в том, что все понятия, которыми оперирует человек, занимают определенное местоположение в специальном субъективном семантическом пространстве, метрика которого отражает ассоциативную близость тех или иных понятий. Само это пространство строится следующим образом. Для естественного языка берутся антонимичные пары типа: большой — маленький, острый — тупой, быстрый — медленный, добрый — злой и т. п. Для каждой такой пары (обычно в языке их 300—400) строится шкала, в которой сами эти слова занимают концевые позиции, а середину шкалы—нейтральное выражение (например, не большой, не маленький и т. п.). Кроме того на шкале имеется еще некоторое число делений, которые могут и не обозначаться
156 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЯ ^) Имеется немало критических замечаний по поводу методики Осгуда и результатов, получающихся с ее помощью. Но главные идеи, о которых мы говорим, по-видимому, находятся вне этой критики. никакими словами. Для заданного списка слов испытуемые должны на каждой из шкал отметить местоположение каждого слова. Подчеркнем, что, как правило, признак, которым характеризуется шкала, никак не связан с понятием, выражаемым данным словом. Тем не менее по требованию эксперимента испытуемый все равно должен (пусть случайным способом) поставить слово из списка на какое-то деление каждой из шкал. Статистическая обработка результатов подобного эксперимента весьма интересна. Оказывается, что наблюдаются определенные статистически значимые закономерности расстановки слов на шкалах. После соответст- вуюш,ей обработки (например, по методу выделения факторов дисперсионного анализа) мы получаем возможность выделения трех главных факторов, «съедающих» в сумме почти всю дисперсию. Эти факторы Осгуд назвал: шкала оценок, шкала силы и шкала активности. Они и образуют оси семантического пространства М- На них проецируются практически все исходные шкалы. Так шкалы добрый—злой, полезный — бесполезный, хороший — плохой и т. п. проецируются на шкалу оценок; шкалы типа большой — маленький, тяжелый — легкий, сильньг-1 — слабый и т. п.— на шкалу силы, а шкалы типа: острый — тупой, быстрый — медленный, спокойный—беспокойный и т.п.— на шкалу активности . Теперь каждое понятие может рассматриваться как точка семантического пространства. Наиболее интересный для нас результат Осгуда состоит в том, что при использовании кластерного анализа в этом пространстве мы получаем в отдельных кластерах понятия, связанные между собой либо ситуативными, либо ассоцнат:1Бнымн связями. Примерами кластеров, которые выделяются в семантическом пространстве Осгуда, могут служить (рыцарь, роза, турнир, перчатка, поцелуй) НЛП (отец, мать, сын, дочь, собака). Таким образом, мы приходим к чрезвычайно важному для нас выводу, что в обычной жизни человек формирует понятия и организует системы классификации, кпК правило, на основе тех ситуаций, с которыми он сталкивается в своей повселневноп деятельрюсти и на основании тех прагматических признаков, учет которых важен для успешной ее реализации. Этот факт необходимо учитывать при nocTpofhiMi классифицирующих систем в системах управления. И еще одно, последнее в данном параграфе, замечание. При проведении психологических экспериментов на «мгновенный отклик», в ходе которых испытуемый должен - не раздумывая» отвечать каким-либо словом на слово, произносимое экс- пер^1ментатором, был обнаружен устойчивый факт вероятгюстцого предпочтения типового ответа. Характер ответа зависел от того социума, к которому принадлежит испытуемый, но в пределах этого социума ответ на многие слева прогнозируется правильно с вероятностью, близкой к единице. Если, например, просить испытуемых быстро ответить на задание типа «Назовите поэта», «Назовите плод», «Назовите предмет, относящийся к мебели», то в подавляющем большинстве случаев в качестве ответов мы получим «Пушкин, яблоко и стол». Это происходит потому, что в системе классификации реалий окружающего мира у человека имеется еще некая оценка типичности тон или иной ситуации, того или иного контекста, в котором встречается данное понятие. Это как бы готовый отклик на ситуацию, в которой надо принимать мгновенное решение, когда нет времени на анализ задачи и поиск решения. По-видимому, именно эта способность (а также априорное проигрывание абсурдных ситуаций, о котором мы говорили в §3.8) позволяет человеку довольно успешно реагировать на встречающиеся ему непредвиденные и незнакомые по прошитому опыту ситуации. Во всяком случае, подобная тактика во многих случаях оказывается успешной. Отметим, что идея шкалированности, которая следует из приведенных нами рассуждении, во многом похожа иа выводы и положения, изложенные в § 2.4, посвященном общим свойствам псевдофизических логик.
§ 4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 167 § 4.3. Обобщение по признакам * Начнем с самого простого и хорошо изученного случая обобщения по признакам. Обшая постановка задачи имеет следующий вид. Имеется множество объектов A = {ai} и множество признаков П = {я^}, каждый из которых может принимать какое-либо значение из соответствующего множества значений признаков (П'}. Здесь верхний индекс показывает тот признак, к которому относится это множество значений. Все множества, кроме Л, предполагаются конечными. Обобщенным объектом называется некоторое подмножество множества А. Если удается построить такую функцию \|:(Я1, JX2,...,^7i)» что она определяет принадлежность или непринадлежность любого at к интересующему нас подмножеству, то эта функция называется решающей функцией (вместо нее может быть сформулировано некоторое решающее правило, использующее значения этой функции или некую процедуру, которую трудно выразить в виде аналитической функциональной записи, но мы не будем акцентировать пока на этом внимание). В самом простейшем случае функция ij} может быть булевой функцией, если для определения принадлежности элемента at к подмножеству Л'^Л требуется ответить на вопрос, какими признаками или значениями признаков он обладает или не обладает. Какие у нас имеются возможности для построения решающей функции? Пример 4.1. На рис. 4Л показана гистограмма распределения значений некоторого признака среди множества объектов. Какие мо- 2 3 ^ 7 Рис. 4.1 7^ Л' гут быть основания для его разбиения на классы? По-видимому, единственный способ — такое разбиение, при котором в один класс попадают объекты с достаточно часто встречающимся значением признака, а один класс от другого отделен «провалами». На рис. 4.1 таким способом можно выделить три класса; им соответствуют три
168 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ обобщенных понятия, которым можно присвоить новые имена. Для задания понятий можно использовать задание отрезков, из которых берутся значения признака: [2, 3], [4, 7] и [9, 12]. iMeTOA, проиллюстрированный в примере 4.1, в свое время М.М. Бонгард назвал «развал на кучи». В методах такого типа предполагается, что структура признаков выбрана столь удачно,что в пространстве признаков объекты, образующие некоторое понятие, группируются компактным образом. Они как бы «сгущаются» около некоторого «ядра», характеризующего наиболее существенные для данного признака комбинации их значений. На этом принципе построено довольно много методов обобщения понятий, которые можно было бы назвать методами разделения в пространстве признаков, В простейшем случае ситуация, показанная на рис. 4.1, обобщается на пространство произвольной размерности и строятся методы выделения наиболее крупных скоплений объектов, для которых расстояния между признаками значительно меньше расстояний между отдельными скоплениями. На этой идее основано большинство методов, развиваемых в рамках кластерного анализа. Обобщением такого подхода к образованию понятий служит идея использования специальной функции для выделения «ядер» из заданного множества объектов. Эта функция может быть построена различными способами. Например, она может принимать на объектах, входящих в ядро, значения, значительно превосходящие значения той же функции в некоторой окрестности пространства признаков, окружающей ядро. Эти функции как бы задают распределение потенциалов в пространстве признаков, почему и сам метод работы с такими функциями получил название метода потенциальных функций. Однако подобные методы, основанные на использовании лишь сведений о пространстве признаков и некоторых его свойствах, многократно исследованные в теории распознавания образов, почти ни чего не дают для решения задачи формирования понятий, возни кающей в теории ситуационного управления и родственных ей под ходов к решению проблемы целесообразного управления объектом И связано это с тем, что в таких условиях мы всегда имеем некото рую априорную информацию о конкретных представителях, входя щих в формируемое понятие. Иными словами, мы заранее знаем что некоторые объекты должны входить в формируемое понятие {положительные примеры), а другие не должно входить в него {отрицательные примеры). Это приводит к постановке задачи обобщения по признакам на основе обучающей выборки, состоящей из положительных и отрицательных примеров. Именно такие задачи мы и будем изучать ниже в данной главе. Существует большое число методов, занимающих пограничное положение между методами типа выделения ядер и методами, основанными на привлечении дополнительной содержательной инфор-
§ 4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 169 W 9 8 7 6 6 ^ 3 2 ■7 ^1 --f £ в С ог 1 I - - _J__ 1 1 I 1 3^5 Рис. 4.2 7ti мации об объекте управления и методах организации управления им. Опишем кратко наиболее широко распространенный метод такого пограничного типа, который обычно называют методом гиперплоскостей. Поясним его на примере двух признаков, приписываемых объектам а^. Это позволит нам проиллюстрировать идею метода геометрически, что обеспечивает необходимую наглядность. При реализации метода гиперплоскостей для произвольного числа признаков нужно произвести прямой перенос всех процедур с двумерного случая на п-мерный. Итак, пусть мы имеем некоторое множество объектов Л={а;}, элементы которого обладают двумя признаками и Я2, принимающими значения из некоторых множеств П1 и П^. Для простоты будем считать, что Ш и — определенные отрезки на оси действительных чисел. Тогда все объекты Ui в пространстве признаков находятся внутри некоторого прямоугольника. Одну из его вершин мы примем за начало координат. Рассмотрим ситуацию, показанную на рис. 4.2. На нем показаны объекты, имеющиеся в обучающей выборке. Зачерненные кружки соответствуют положительным примерам, светлые — отрицательным. Таким образом, в нашем конкретном случае имеется четыре положительных примера и два отрицательных. Будем формировать обобщенное понятие последовательно. Возьмем один из положительных примеров (пусть это будет и проведем прямую, которая отделила бы его от некоторого отрицательного примера (пусть это будет а^). Для построения разделяющей прямой тя1+/^2+9=0, воспользуемся следующим приемом. Будем подбирать q таким образом, чтобы точки, соответствующие и лежали по разным сторонам от нашей прямой. Подставляя в уравнение прямой координаты точек, соответствующих и получаем ш+8/+д=0 и 5m+3/+g=0. Так как для определения трех неизвестных мы имеем два уравнения, то можно разделяющую прямую построить различным способом. Положив, например, /=0 и взяв т=1 и q~—2, мы получим разделяющую прямую в виде: —2=0, которая на рис. 4.2 помечена буквой Л. Но эта прямая плоха тем, что отделяет всего одну точку из формируемого множества и сложность оставшейся задачи почти сравнима со сложностью исходной. Куда более разумным было бы в качестве разделяющей прямой взять прямую Я1—4=0. Она на рис. 4.2 помечена буквой В, Эта прямая отделяет от объектов, не принадлежащих фор-
170 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ мируемому множеству, все нужные точки, кроме а^. Теперь наша задача состоит в отделении этого объекта от и а^. Для этого можно, например, воспользоваться прямыми С и D на рис. 4.2. Жирным контуром выделена получившаяся граница между сформированным множеством объектов (зачерненные кружки) и остальными объектами. Для проверки того, принадлежит ли произвольный объект а* (я^, п1) сформированному множеству, надо подставить его координаты в уравнения прямых В, С и D и проверить знаки отклонения. Если знаки отклонения составляют комбинацию (—, +, —), то проверяемый объект принадлежит к сформированному понятию, если эта комбинация иная, то проверяемый объект к нашему понятию не принадлежит. Такое разделение не всегда получается. На рис. 4.3 показана ситуация, в которой положительные и отрицательные примеры сгруппированы таким образом, что при проведении разделяющих прямых возникают области, не содержащие ни положительных, ни отрицательных примеров из обучающей выборки. Эти области отмечены на рисунке знаком вопроса. Относительно объектов из них мы не можем ничего сказать об их принадлежности или непринадлежности к построенному понятию. Поэтому в методах, опирающихся на разделение в пространстве признаков, применяют специальные приемы для повыше- py^f, 4 3 ния эффективности отделения (например, проводят гиперплоскости посредине между двумя разделяемыми объектами перпендикулярно соединяющему их отрезку) и для уменьшения объема областей, в которых объекты не классифицируются. В списке литературы, указанном к данной главе, эти приемы описаны весьма подробно. Видоизменением метода разделяющих гиперплоскостей являются методы, в которых разделение происходит за счет криволинейных поверхностей. Однако в силу трудностей формирования удачных разделяющих поверхностей второго и более высоких порядков эти методы на практике применения фактически не нашли. Имеется еще группа методов, в которых вместо простого разделения в пространстве признаков используются метрические функции этого пространства. Например, группировка объектов в новое понятие происходит таким образом, что расстояния между парами объектов, попавших в одно понятие, существенно превосходят расстояние от них до объектов, лежащих вне его (разделение по потенциальной функции). Недостаток описанного метода и тех методов, которые подобно
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 171 методу гиперплоскостей используют лишь гипотезу об образовании в пространстве выбранных признаков компактного множества объектов, входящих в одно обобщенное понятие, состоит в том, что языки, на которых задано как описание объектов at (т. е. язык набора выбранных признаков и их значений), так и описание самого сформированного понятия, различны. В нашем конкретном методе понятие задается перечислением разделяющих гиперплоскостей с указанием знаков отклонений от них. Такой способ описания понятий не позволяет производить процедуру обобщения на последующем шаге, т. е, получать понятия второго уровня общности, а, следовательно, не дает основ и для построения классификации понятий. Указанный недостаток, несмотря на простоту процедур формирования понятий по методу разделения в пространстве признаков, делает эти методы мало пригодными для задач ситуационного управления. Именно поэтому в системах ситуационного управления, как правило, используются другие принципы формирования понятий и организации классификации. Прежде всего, необходимо указать группу методов, в основе которых лежит предложенная Бонгардом схема формирования решающего правила для оценки принадлежности объектов к фop^пI- руемому понятию. Эта схема устроена следующим образом. Заданы некоторые логические функции от признаков, которые могут характеризовать объекты. Для осуществления такой возможности предполагается, что признаки принимают двоичные значения (типа есть — нет). Подобный переход от произвольных признаков к двоичным Теоретически всегда возможен. Для этого достаточно считать, что каждое допустимое значение признака выступает как самостоятельный признак или что на множестве его значений введены какие-то предикаты, превращающие их значения в двоичные переменные. Набор этих логических функций должен быть достаточно богатым, чтобы охватить как можно больше отношений между признаками. В методе Бонгарда в зависимости от специфик задачи набор предикатов выбирается каждый раз заново. Если нужно различать арифметические выражения, то в качестве таких предикатов выступают предикаты, связанные с арифметикой, если речь идет о сравнении некоторых программ и формировании классов программ, то в качестве предикатов выступают предикаты-процедуры, оценивающие истинность или ложность утверждений, касающихся, например, длины программы, необходимого объема памяти для ее размещения или времени ее выполнения. Если же в качестве предметной области, где производится обобщение, выбираются задачи, связанные с ситуационным управлением, то предикаты, превращающие наборы признаков в двоичные переменные, полностью определяются семантикой той проблемной области, в которой используется ситуационное управление. Важно лишь выделить достаточно полный набор таких предикатов, а применение их к объектам можно организовать и с помощью случайной процедуры.
172 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Когда всем объектам сопоставлены наборы двоичных признаков, наступает второй этан. На нем случайным образом генерируются функции от получившихся двоичных аргументов, принимающие также двоичные значения. Число аргументов у этих функций может быть либо фиксированным, либо меняться от 1 до т, где т — число различных двоичных признаков, получившихся после применения предикатов к исходному множеству признаков. Каждая такая функция рассматривается как потенциальное элементарное разделяющее правило. Для обеспечения разделения нужно, чтобы для всех объектов, входящих в число отрицательных примеров в обучающей выборке, эта функция обращалась в нуль, а для всех объектов, входящих в число положительных примеров в той же обучающей выборке, принимала значение 1 хотя бы один раз (но чем больше, тем разделяющее правило лучше). Тогда дизъюнкция таких элементарных разделяющих правил может рассматриваться как окончательное разделяющее правило при условии правильной классификации всех объектов, образующих обучающую выборку. Возможны и другие способы организации общего решающего правила, а также отбора для включения в него элементарных разделяющих правил. Но суть метода от этого не меняется. Проиллюстрируем выполнение описанной процедуры сначала на очень простом примере, в котором исходное множество признаков таково, что они уже являются двоичными. В этом случае первый этап, связанный с применением подходящих предикатов к исходным признакам, отсутствует. Пример 4.2. На рис. 4.4 показана обучающая выборка, состоящая из пяти положительных и четырех отрицательных примеров. Положительные приперы Огприцотельные примеры Рис. В качестве признаков выступают четыре независимых признака, которые нам для простоты записи удобно обозначить через а, Ь, с и d. Все признаки принимают двоичные значения, и эти значения приписываются им следующим образом: а=1 (шляпа есть), а=0 (шляпы нет), Ь = 1 (глаза круглые), Ь=0 (глаза-щелочки), с=1 (нос широкий книзу), с=0 (нос узкий книзу), d=l (рот «веселый») d =
§4.3- ОБОБЩЕНИЕ ПО ПРИЗНАКАМ I73 = 0(рот «печальный»). Метод Бонгарда состоит из многократного повторения процедуры случайного формирования элементарного разделяющего правила в виде некой логической функции, проверке этого правила на эффективность разделения на обучающей выборке и накопления таких эффективных разделяющих правил, которые после объединения их через дизъюнкцию дадут глобальное разделяющее правило. Пусть в результате работы некоторого случайного механизма были выработаны следующие функции от признаков: fed, с\/а, аЬСу abed. Что можно сказать об эффективности порожденных правил? Стоит ли их сохранять для дальнейшего? Функция bd соответствует набору признаков глаза круглые и рот «веселый». На отрицательных примерах обучающей выборки соответствующая функция принимает на всех примерах значение 0. Для положительных примеров функция bd принимает значение 1 на трех примерах из пяти. Это позволяет оценить элементарное правило разделения М=1 как весьма эффективное. Функции cVfl^ соответствует нос широкий книзу или шляпы нет. На множестве отрицательных примеров эта функция трижды обращается в 1, а на множестве положительных примеров — все пять раз. Однако правило с\^а=1 не обеспечивает высокую эффективность разделения и его не оставляют для дальнейшей работы. Функция аЬс требует, чтобы у персонажа была шляпа, глаза-щелочки и нос, широкий книзу. Среди положительных примеров есть два таких персонажа. Среди отрицательных примеров подобных персонажей нет. Значит, элементарное разделяющее правило аЬс=1 эффективно. Наконец, функция abed обращается в 1 только для тех персонажей, у которых есть шляпа, круглые глаза, нос, широкий книзу, и «веселый» рот. Среди положительных примеров в обучающей выборке есть один такой персонаж, а среди отрицательных примеров таковых вообще нет. Это значит, что правило разделения abcd^l можно сохранить для дальнейшей работы. Таким образом, мы решили сохранить три правила разделения. Если считать, что процедура поиска элементарных правил разделения завершена, то можно образовать глобальное правило, которое будет иметь вид bd\/abc\/abcd=^\. Для того чтобы данное правило можно было считать окончательным, оно должно абсолютно правильно классифицировать персонажей, входящих в обучающую выборку. Это требование выполняется. Но само правило получилось у нас избыточным. Элементарное разделяющее правило abcd=l явно лишнее, потому что правило bd\fabc~ \ уже правильно классифицирует всех персонажей, входящих в обучающую выборку. Формально это можно было бы обнаружить, проведя известные из теории функций алгебры логики преобразования: bdyаЬсуobcd^bd{\\/ос)\/abc=bd\/оЬс, На вопрос о том, насколько правильно построено разделяющее правило можно ответить лишь на основе экзаменационной выборки,
174 ГЛ. 4. ОБОБЩЕНИЕ Н КЛАССИФИКАЦИЯ СИТУАЦИЙ ^) По своему функционированию этот элемент есть элемент типа И, но мы сохраняем его название, данное ему авторами РПС-метода. Обычно под ассоциативным элементом понимают элемент, реализующий некоторую пороговую функцию. которая не пересекается с обучающей выборкой. Если и на экзаменационной выборке правило разделения работает эффективно, то значит мы удачно его построили. В противном случае эта выборка рассматривается как дополнительная часть обучающей выборки и процедура поиска решающего правила повторяется заново. В заключение опишем еще один метод формирования понятий на основе призначной структуры, отличающийся по своей идее от ранее рассмотренных. Этот метод носит название метода растущих пирамидальных сетей (РПС-метод). Для нас он интересен не только в качестве еще одного метода обобщения по признакам, но и потому, что он может использоваться при планировании многошаговых решений, И в соответствующей главе книги мы об этом будем говорить. Растущая пирамидальная сеть — динамический объект, ее конфигурация меняется в процессе функционирования. Она состоит из вершин двух типов, показанных на рис. 4.5 квадратиками и кружками. Вершины первого типа называются рецепторами, вершины второго типа — ассоциативными элементами Каждый рецептор соответствует некоторому фиксированному значению определенного признака. Таким образом, число рецепторов в РПС равно произведению числа признаков на суммарное число принимаемых ими значений. Любой элемент РПС может быть в двух состояниях — возбужденном и невозбужденном. Для всех элементов РПС зафиксировано некоторое определенное число тактов Tj, характеризующее период, в течение которого возбужденные элементы сохраняют свое возбуждение и передают его через свои выходные дуги. Для возбуждения рецепторов требуется специальный внешний сигнал, а ассоциативные элементы переходят в возбужденное состояние, если на всех их входах в течение определенного числа тактов сохраняется возбуждающий сигнал. Таким образом, хотя передача возбуждения по дугам РПС происходит мгновенно, каждый ассоциативный элемент выступает еще и в виде задержки, величина которой зависит от длины пути, проходимого сигналом возбуждения. Во всяком случае величина должна быть мала по сравнению с Xj. Набор возбужденных рецепторов в некоторый момент времени образуется в результате подачи на вход РПС в данный момент описания некоторого объекта через значения его признаков. Интервал между сменами описаний объектов, подаваемых на вход РПС, всег-
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 175 да превосходит интервал, в течение которого РПС возбуждена. Это означает, что при подаче любого описания на рецепторы РПС лаходится в невозбужденном состоянии. Если имеется некоторый ассоциативный элемент, то субмножество этого элемента образуют все те элементы, от которых имеются пути, ведущие ко входам данного элемента. Субмножество определяется вполне корректно, если учесть, что в РПС запрещены связи, которые могут привести к возникновению петель и циклов; иными словами, ни один ассоциативный элемент не может быть соединен своим выходом со входом самого себя или входами каких-либо элементов, входящих в его субмножество. Нулевой слой субмножества некоторого элемента образуют те элементы, выходы от которых непосредственно поступают на входы данного элемента. Аналогично люжно определить и супермножество данного ассоциативного элемента, как множество тех элементов, к которым имеется путь, ведущий от выхода данного элемента. Те элементы, для которых этот выход непосредственно является входом, образуют нулевой слой супермножества. Динамика изменения (роста) РПС задается с помощью специальных правил. 1. Пусть при возбуждении некоторой комбинации рецепторов в существовавшей до этого РПС имелись ассоциативные элементы, у которых в нулевом слое субмножества возбудилось не менее двух элементов. Для всех таких элементов происходит следующее. Выходы всех возбужденных в нулевом слое субмножества элементов Рис. 4.6 становятся входами нового ассоциативного элемента, вошедшего в РПС; выход нового элемента становится входом исходного ассоциативного элемента; все непосредственные связи, существовавшие у него до этого с возбужденными элементами из нулевого слоя субмножества ликвидируются.
176 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Выполнение этого правила иллюстрирует рис. 4.6. Те рецепторы, которые возбудились, зачернены. На рис. 4.6, а показана РПС до применения правила, а на рис. 4.6, б — после его применения. После того, как в соответствии с правилом 1, введены все новые элементы, проверяются условия для применения правила 2 и если они удовлетворяются, то это правило реализуется. 2. Пусть при возбуждении некоторой комбинации рецепторов произошло возбуждение определенной части элементов в РПС. Если множество возбужденных элементов, в котором остались невозбужденными все элементы, входящие в нулевой слой их супермножества, состоит более чем из одного элемента, то вводится новый элемент, входами которого служат выходы всех упомянутых возбужденных элементов. Выполнение этого правила иллюстрируется ситуацией, изображенной на рис, 4.7. На рис. 4.7, а показаны два возбужденных элемента: ассоциативный элемент 2 и рецептор 5, для которых в нулевом слое их супермножеств нет возбужденных элементов. Тогда вводится новый ассоциативный элемент 4 и РПС приобретает вид, показанный на рис. 4.7, б. Перейдем теперь к процедуре формирования понятий с помощью РПС. В обучающей выборке с двоично кодированными значениями признаков рецептор РПС, соответствующий данному значению некоторого признака, возбуждается, если это значение актуализируется, и не возбуждается в противном случае. На вход РПС последовательно подаются все значения признаков объектов из обучающей выборки как из группы положительных примеров, так и из группы отрицательных примеров. При подаче каждого значения происходит переформирование РПС в соответствии с описанными правнлами. Каждому ассоциативному элементу будем приписывать два параметра m и /, значения которых могут меняться в процессе работы
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 177 РПС. Параметр т есть суммарное число возбуждений ассоциативного элемента при подаче на рецепторы РПС последовательности примеров. Параметр / характеризует число рецепторов, входящих в субмножество данного ассоциативного элемента. В процессе преобразования РПС в множестве ее ассоциативных элементов выделяются специальные элементы, носящие название положительных и отрицательных контрольных элементов для данного понятия. Формирование понятий происходит за счет выполнения трех специальных процедур. 1. Если на рецепторы подается описание объекта обучающей выборки, который является положительным примером, и в РПС не выделен положительный контрольный элемент понятия, то находится ассоциативный элемент, у которого максимальны т и L Такой элемент становится положительным контрольным элементом понятия. Если в группе элементов с одинаковым максимальным значением пг ил1еется несколько элементов с одинаковым максимальным значением /, то в качестве положительного контрольного элемента понятия берется любой из них. 2. Если на рецепторы подается описание объекта обучающей выборки, который является отрицательным примером, и в РПС имеются положительные контрольные элементы понятия, не содержащие в своих супермножествах других возбужденных контрольных элементов, то в каждом из этих супермножеств в качестве отрицательных контрольных элементов выбираются элементы, имеющие минимальное значение /. Если таких элементов несколько, то выбирается любой из них. 3. Если на рецепторы подается описание объекта обучающей выборки, который является положительным примером, и в РПС имеются отрицательные контрольные элементы, не содержащие в своих супермножествах других возбужденных контрольных элементов, то в каждом из этих супермножеств в качестве положительных контрольных элементов выбираются элементы, имеющие минимальное значение /. Если таких элементов несколько, то выбирается любой из них. Выполнение всех трех процедур иллюстрируется ситуациями, показанными на рис. 4.8. На рис. 4.8, а показана РПС, в которой около всех ассоциативных элементов проставлено значение т, накопленное до этого такта. На вход РПС подан положительный пример. В соответствии с первой процедурой на рис. 4.8, б отмечен элемент 2, который будет на следующем такте играть роль положительного контрольного элемента понятия. На рис. 4.8, в показана РПС, на вход которой поступает отрицательный пример. На рис. 4.8, г показан результат применения второй процедуры. Если теперь для РПС, приведенной на этом рисунке, на рецепторы поступит описание положительного примера, то за счет срабатывания третьей процедуры получится РПС, изображенная на рис. 4.8, д.
It 78 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Контрольные элементы играют важную роль в процессе формирования ПОНЯТИЙ. С помощью положительных контрольных элементов выделяются те сочетания рецепторов (значений признаков), которые с частотой т встречались в обучающей выборке на положительных примерах. С помощью отрицательных контрольных элементов выделяются сочетания значений признаков объектов, входящих в группу отрицательных примеров обучающей выборки. Но не для всех таких объектов, а только для тех, в которых сочетание значений признаков возбуждает положительные контрольные элементы, что соответствует наличию у отрицательного примера такого сочетания значений признаков, которое до этого было выделено в качестве важного (контролируемого) для формирования правила отнесения объектов к формируемому понятию. При формировании РПС обучающая выборка используется многократно. Как только в РПС в соответствии с одной из описанных выше процедур происходит появление нового контрольного элемента, начинается новый просмотр примеров из обучающей выборки, начиная с первого. Обучение считается завершенным, если они-
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ I79. сания всех объектов, входящих в обучающую выборку, при подаче их на рецепторы РПС не вызывают появления новых контрольных элементов. Когда понятие сформировано, то РПС дает возможность пользоваться следующим правилом отнесения объектов к сформированному понятию. Объект ai входит в понятие, если при введении его они* сания в рецепторы РПС в ней нет возбужденных отрицательных контрольных элементов понятия, в супермножестве которых не имелся бы хотя бы один возбужденный положительный контрольный элемент. Объект at не входит в данное понятие, если при введении его описания в рецепторы РПС в ней нет возбужденных положительных контрольных элементов, которые не содержали бы в своих супермножествах хотя бы одного возбужденного отрицательного контрольного элемента. Если ни одно из условий, сформулированных выше, не выполняется, то относительно объекта не высказывается окончательных утверждений. Можно показать, что три процедуры перестройки РПС, которые используются в процессе работы с обучающей выборкой, всегда за конечное число шагов приводят к завершению формирования понятия. При этом все положительные и отрицательные примеры из обучающей выборки распознаются РПС правильно. Описанный нами способ формирования понятий обладает несколькими достоинствами. Все понятия, формируемые с его помощью, допускают содержательную интерпретацию, так как задаются через логическую функцию, в которую в явном виде входят значения исходных признаков. Метод хорошо автоматизируется при работе на ЭВМ. После сформирования окончательной РПС ту ее часть, которая не содержит контрольных элементов и не оказывает влияния на их возбуждение, можно ликвидировать, что во многих случаях позволяет использовать память ЭВМ весьма экономно. Для задач типа, характерного для систем ситуационного управления, весьма часто встречается ситуация, при которой из-за неполноты знаний об объекте управления и методов управления обучающая выборка может быть противоречивой. В этом случае одни и те же описания в ней могут входить и в группу положительных примеров и в группу отрицательных примеров. Этот важный для нас случай может быть реализован в методе РПС с помощью некото- рой модификации процедур ее построения, В силу противоречивости обучающей выборки решение о включении или невключении объекта в сформированный класс должно быть недетерминированным. Эта недетерминированность должна отражать те частоты, с которыми в обучающей выборке объект относится к множеству положительных и множеству отрицательных примеров. В РПС сформированные пирамиды могут быть теперь трех типов: П 1, соответствующие положительному объекту, т. е. объекту, сформированному на основании тех примеров обучающей выборки.
180 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ которые входят только в класс положительных примеров; П 2, соответствующие отрицательному объекту, т. е. объекту, сформированному на основании тех примеров обучающей выборки, которые входят только в класс отрицательных примеров; П 3, соответствующие бивалентному объекту, сформированному на основании примеров из обучающей выборки, которые одновременно входят в оба класса примеров. Опишем теперь процедуры, характерные для этого случая. Процедура 1 не изменяется. Процедуры 2 и 3 имеют теперь следующий вид. 2. Если на рецепторы подается описание объекта обучающей выборки, относящегося к отрицательным примерам, пирамида не отлична от пирамиды типа П 3 и среди возбужденных положительных и бивалентных контрольных элементов есть такие, что в их супермножествах нет других возбужденных контрольных элементов, то в каждом из этих супермножеств выбирается элемент с наименьшим значением / (или любой из них, если их несколько), который становится отрицательным контрольным элементом понятия. 3. Если на рецепторы подается описание объекта обучающей выборки, относящегося к положительным примерам, пирамида отлична от пирамиды П 3 и среди возбужденных отрицательных или бивалентных контрольных элементов есть такие, что в их супермножествах нет других возбужденных контрольных элементов понятий, то в каждом из этих супермножеств выбирается элемент с наименьшим значением / (или любой из них, если их несколько), который становится положительным контрольным элементом. Кроме того, добавляются новые процедуры, связанные с появлением бивалентных понятий. 4. Если на рецепторы подается описание объекта обучающей выборки, относящегося к положительным или отрицательным примерам, пирамида есть пирамида типа П 3 и среди возбужденных контрольных элементов есть такие, которые не содержат в своих супермножествах других возбужденных контрольных понятий (кроме, может быть, самой вершины пирамиды), то в пересечении этих супермножеств находится элемент с минимальным значением / (или любой из них, если их несколько), который становится двузначным 'контрольным элементом. 5. Если при восприятии некоторого объекта в вершинный элемент пирамиды, образованной возбужденными элементами, вносится признак П 3 (это происходит тогда, когда эта вершина соответствовала П 1, и поступил отрицательный пример, либо когда она соответствовала П 2, и поступил положительный пример), то эта вершина становится бивалентным контрольным элементом. При работе с бивалентными понятиями возникает возможность выделять в РПС отдельные пирамиды, которые соответствуют положительным подпонятиям, отрицательным подпонятиям и бивалентным подпонятиям. Эти пирамиды могут вкладываться друг в друга
; 4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 181 произвольным образом. Для двузначных элементов надо запоминать пару параметров т+ и т'' вместо одного т. Они отражают число положительных и отрицательных примеров обучающей выборки, при которых данный элемент возбуждался. Правила отнесения объектов at к сформированному понятию или их исключение из него остается прежним. Но к решающему правилу добавляются еще два случая. Объект ai включается в сформированное понятие, если бивалентный контрольный элемент, возбужден, не имеет в своих супермножествах других возбужденных контрольных элементов и если выполняется неравенство: /1+ 2 (^')у / = 1 > 1. /1- 2 ^- /=1 Рис. 4.9 Здесь /г+ и /г" — цены ошибки нераспознавания соответствующего объекта как положительного или как отрицательного, as — число бивалентных контрольных возбужденных элементов, в супермножествах которых нет других возбужденных контрольных элементов. Если ap<l, то элемент at не включается в сформированное понятие. Можно доказать, что с ростом объема обучающей выборки решающее правило в пределе дает известное правило Байеса, минимизирующее риск ошибки при классификации объектов. В заключение рассмотрения РПС отметим, что на практике часто встречаются случаи, когда необходимо формировать понятия, имеющие динамическую природу. Для таких понятий значения определяющих их признаков появляются с определенной закономерностью во времени. Для формирования подобных понятий, по-видимому, можно использовать РПС с несколько видоизмененными условиями возбуждения ассоциативных элементов. А именно, будем считать, что элемент возбуждается, если сигналы на его входах появляются в определенной временной последовательности. Для этого на множестве входов таких элементов можно установить отношение строгого порядка, например, перенумеровав их. На рис. 4.9 показана некоторая РПС. Если рецепторы этой сети возбуждаются последовательно, то возбуждение ассоциативных элементов зависит от последовательности возбуждения рецепторов. Например, элемент 3 возбудится только в том случае, если сначала на его вход придет возбуждение от элемента 1, затем от рецептора 4, а после этого от элемента 2. Это произойдет, если последовательность возбуждения рецепторов будет иметь вид 1—2—3—4—5 или
182 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ 1—2-^4^3—5. При других последовательностях возбуждения рецепторов элемент 3 не возбудится. В языке ситуационного управления призначные структуры объектов в описаниях задаются с помощью отношений г? — иметь признаку Tg — признак — значение, — признак — мера и Гю — мера — значение. Эти отношения позволяют описывать все необходимые знания о признаках и их значениях. После проведения обобщения по признакам можно переформировать исходные описания в описания, оперирующие с вновь сформированными пoнятия^ш. Возможны процедуры обобщения по признакам, которые ориентированы непосредственно на язык ситуационного управления. Здесь мы не будем о них говорить, так как ниже мы рассмотрим эту проблему с более общих позиций. Теперь перейдем к другому виду обобщения, учитывающего не только признаки, присущие объектам, но и те отношения, которые между этими объектами существуют. § 4.4. Обобщение по структурам * Этот вид обобщения для ситуационного управления наиболее важен. Так как в задачах ситуационного управления для описания ситуаций используется язык отношений, именно в структуре последних чаще всего и кроется то, что объединяет в один класс описания ситуаций, в которых для объекта управления принимается одно и то же решение. Задача обобщения по структурам тесно связана с активно развивающимися в последнее время методами поиска закономерностей, опирающихся на аппарат логики, а не на традиционный для этого класса задач аппарат математической статистики и теории вероятностей. При наличии хорошо собранных сведений об интересующем исследователя или систему управления процессе, удовлетворяющих известным статистическим требованиям, можно применить много хороших методов, позволяющих описать все те закономерности, ко- торые можно из этой статистики извлечь. Но, как уже неоднократно говорилось, «бедой» тех объектов, для которых строятся системы управления, опирающиеся на семиотические ^юдeли, является либо полное отсутствие наблюдений, которые были бы статистически достоверны, либо наличие лишь косвенных наблюдений, из которых нужную информацию можно извлечь лишь после проведения логического вывода. Эти обстоятельства привели к тому, что в последнее десятилетие- активно развиваются работы в области построения закономерностей, опирающихся лишь на небольшое число подтверждающих и опровергающих примеров. По своим постановкам такие задачи похожи, с одной стороны, на традиционные задачи распознавания образов на обучающих выборках, а, с другой стороны,— на задачи, возникающие в индуктивной логике.
<5 4.4. OBOBUIEI-IHE ПО СТРУКТУРАМ 183 В начале настоящего параграфа мы опишем процедуру выдви« жения гипотез и построения закономерностей, в основе которой ле* жат схемы индуктивной логики, предложенные еще в прошлом веке С. Миллем. Эти схемы, названные у него методами индуктивных рассуждений, имеют следующий вид. i. Метод сходства. Рассмотрим следующий вывод: а, Ь, с =:>d, а, е, f =^dy а, g-, h:=^d. а, /, m=^dy a=^>d ' Число посылок тут не определено. Во всяком случае их достаточно для того, чтобы лицо, реализующее индуктивный вывод, убедилось в том, что именно а есть посылка, в результате которой реализуется следствие d. Конечно, этот вывод не бесспорен. На самом деле может оказаться, что d возникает вовсе не из-за а. Причинами d могут быть, например, Ь, е, g",. . Но вывод о том, что именно а есть причина d, кажется куда более обоснованным, чем любые другие предположения. 2. Метод различия. Он характеризуется следующей схемой вывода (знак ^ трактуется как «не выводится»): а, Ь, с—> а, е, f=^d. а, /, mz=pd, е. f~>d, /, m^d a=^d Этот метод как бы включает в себя предшествующий, усиливает его. В более простом варианте схема метода различий может содержать совсем немного строк, используемых в методе сходства. Например, всего одну такую строку. 3. М е т о д «о с т а т к о в». В данном методе используется следующая схема вывода: а, 6, c=zyd, е, /, b =:>е, '
184 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ ^) Это название образовано из инициалов Джона Стюарта Милля. 2) Заметим, что в ДСМ-методе оценки обоснованности довольно грубые (они выражаются рациональными числами). Можно, конечно, вместо рациональных чисел использовать нечеткие интервалы или функции принадлежности. Как и предшествующие схемы, данную схему нельзя считать абсолютно достоверной. На самом деле / может возникать вовсе не из-за с, а определяться, например, совместным появлением а и с. 4. Метод сопутствующих изменений. Пусть имеются два множества А и В. Тогда схему вывода можно записать так: ai,c=zyb^, а^еА, i = l,2, ...,т, Аз, с=^Ь^, Ь^^В, ^ёл, ат^с^Ь^, сев, А=уВ С помощью этого метода делается привычный индуктивный шаг. От подтверждающих примеров мы переходим к обобщенному утверждению, касающемуся всех объектов некоторого класса. Опишем теперь специальный метод формирования гипотез на основе имеющихся в распоряжении системы наборов примеров, подтверждающих и отрицающих формируемую гипотезу (положительные и отрицательные примеры). Этотметолбыл назван его авторами ДСМ'методом Введем два множества — множество причин C={ci, С2, ... . . ., Сп, ...} и множество следствий А = {аи ^2, . .., ат» • • Гипотезой будем называть выражение вида Jmici'^^'^^i)^ где — специальный квантификатор оценки обоснованности (достоверности) гипотезы о том, что Ct есть причина ai. Одновременно с положительной гипотезой J;i[{ci^^ai) будем рассматривать отрицательные гипотезы Jm{ci=^'~cLi)y В которых С обоснованностью считается, что Ci не является причиной а^. Эти две гипотезы формируются в ДСМ- методе независимо. Поэтому оценки У+ и J~ могут быть, например, одновременно высокими, или одновременно низкими, или одна из них может быть высокой, а другая — низкой. В ДСМ-методе оценки обоснованности принимают рациональные числовые значения. Для удобства интерпретации будем считать, что некоторая гипотеза имеет оценку обоснованности, равную т. Верхний индекс у оценок обоснованности опускаем, поскольку для положительных и отрицательных гипотез оценки берутся из одного и того же множества 2). Значения и образуют две прямоугольных матрицы У + и J", На пересечении i-и строки и /-го столбца первой матрицы стоит оценка обоснованности гипотезы Ci-=^"'aj, а на том же месте во второй матрице — оценка обоснованности гипотезы с^=Ф~а;.
§4.4. обобщение по структурам 185 Основная процедура ДСМ-метода заключается в нахождении на основе работы с положительными и отрицательными примерами новых гипотез, т. е. элементов указанных нами матриц и размерность которых в процессе работы метода увеличивается, а также в пересчете элементов этих матриц на основании анализа подтверждения или отвергания соответствующей гипотезы. Кроме того, в ДСМ-методе имеются правила для перенесения найденных правилами первой группы гипотез на другие «аналогичные» случаи. Таким образом, правила в ДСМ-методе бывают двух типов: правила выделения закономерностей, построенные по типу индуктивных правил Милля, и правила распространения найденных закономерностей на те случаи, для которых пока подобные примеры не найдены. Важно подчеркнуть, что как правила первого типа, так и правила второго типа являются правилами не точного, а правдоподобного вывода. Пусть J принимают значения (О, 1/(п—1), 2/(п—2)/ {п—1), 1}. Тем самым множество ^ = {co^j} = {c^=^a;} разбивается на (п+1) подмножество. В подмножество Qq входят те элементы Q, для которых оценка обоснованности равна 0. Относительно этих гипотез точно известно, что они неверны. В подмножество Qi входят абсолютно достоверные гипотезы, так как их оценка обоснованности равна 1. В подмножества Qr/(„_i), где f=2, 3,...,п—2 входят соответственно гипотезы, для которых степень обоснованности равна числу, равному индексу у подмножества. Подмножество с индексом \1{п—1) — особое. Входящие в него гипотезы считаются неисследованными и оценка соответствует значению недоопре- делено. Используем правило вывода первого типа. Оно могло породить новые положительные или отрицательные гипотезы, которым на основании некоторого правила приписаны оценки обоснованности. Кроме того, выясняем, подтвердился или не подтвердился ряд ранее найденных гипотез (положительных и отрицательных). Для этих гипотез пересчитываются оценки обоснованности. Если правило подтвердило некоторые гипотезы, то пересчет происходит следующим образом. Множества Qg и Qi сохраняются. Всем подтвердившимся гипотезам, входящим в подмножества где г=2, 3,..., п—2, присваиваются оценки {i^\)ln, С помощью правил аналогии (см. ниже) часть элементов h3,Qi/(;i_i) получает некоторые оценки обоснованности. Те элементы из подмножества которые не получили таких оценок, переходят в подмножество Qi/^ и считаются на следующем шаге снова недоопределенным. Если некоторые гипотезы не подтвердились, то их оценку обоснованности следует уменьшить. Пересчет происходит следующим образом. Множества Qq и Qi сохраняются. Всем неподтвердившимся гипотезам, входящим в множества Qi:^n-\)y где г=2, 3,..., п—2, присваиваются оценки (г—1)/п. С помощью правил аналогии часть оценок переносится на гипотезы, которые входили в множество Те из них, для которых новая информация не возникла, образуют множество fii/n.
186 ГЛ, 4. ОБОБЩЕНИЕ и КЛАССИФИКАЦИЯ СИТУАЦИЙ Процедура ДСМ-метода завершается в двух случаях: если новые гипотезы не порождаются и если не происходит изменения оценок обоснованности ранее найденных гипотез. Заметим, что в рамках логики на каждом шаге ДСМ-метода происходит переход от логики одной значности к логике другой знач- ности (значность логики увеличивается). Наименьшая значность логики, с которой ДСМ-метод начинает свою работу,— троичная логика. В этом случае значения 1 и О трактуются как абсолютная оценка истинности гипотезы (она приписана положительным примерам) и абсолютная оценка ложности гипотезы (она приписана отрицательным примерам), а значение V2 приписывается всем тем (если они уже есть) гипотезам (или примерам), относительно которых нужная информация отсутствует. Последнее, что нам еще нужно рассмотреть, это как устроены правила порождения новых гипотез и приписывания им некоторой оценки обоснованности и правила аналогии. Будем считать, что в качестве исходных объектов выступают описания ситуаций на некотором реляционном языке, например, на языке ситуационного управления. Пусть S* — некий фрагмент описания ситуации. Если известно, что для какой-то ситуации S надо принимать решение U, а фрагмент S* входит в описание ситуации S, то гипотеза имеет право на существование. Если на основании анализа положительных примеров мы убеждаемся, что фрагмент S"" имеется в большинстве описаний ситуаций, для которых принимается решение то достоверность гипотезы S*=:>+f/ должна увеличиваться. Она растет особенно сильно, если этот фрагмент отсутствует в отрицательных примерах, соответствующих случаю принятия других решений по управлению, отличных от U. Если же это не так, то можно считать, что принятие других решений, отличных от и у при наличии фрагмента S*, влияет на некоторый фрагмент S**, играющий роль «тормоза» для S*, Идеология такого типа может распространяться на тормоз второго и более высоких уровней (тормоз тормоза и т. д.). Тормозы порождают отрицательные гипотезы S**=>"f/. Таким образом, в рассматриваемой нами предметной области и при выбранном языке описания объектов и гипотез правила выработки гипотез связаны с нахождением фрагментов в описании ситуаций, которые могут оказаться причиной выработки тех или иных решений. Общая схема для правила сходства, используемого в ДСМ-мето- де, имеет следующий вид: (r^iz:>"fly); У^М {с^.а^) ^ J,;n(s^i-=>^ aj) Jj ^n-~i){Ci=>^aj)\ JiM {c^, aj) hi^D.n (c,--=>+ay)
§ 4,4. ОБОБЩЕНИЕ ПО СТРУКТУРЛ\\ 187 Здесь M{Ci, aj) есть предикат сходства, а его оценка показывает, что его истинность абсолютна. Сам предикат сходства определяется следующим образом: Параметрический предикат сходства а^, k) становится истинным при определенном значении параметра k, который определяет необходимое число примеров, используемых для выявления сходства. Этот параметрический предикат сходства определяется следующим образом: // ^ \ / / k \ , V,, , [((/ ^ 9) (1 < /, 9 < k)) (х, = Л',) (у^ = У,)] {{J, (z и) (с. ^ г)) ((а,. ^ ц) (ау = 0)) Для тех, кто не привык к символике математической логики, сделаем необходимые пояснения, связанные с интерпретацией этого предиката. Первая часть выражения, стоящего справа от знака равенства, говорит о том, что по прошлым наблюдениям связь Xi=>yi реализовалась/г раз. При этом Jb означает, что эта связь действительно существовала, так как индекс b выделяет на множестве значений логической переменной какое-либо, выделенное для фиксации истинных значений значение (в эти выделенные значения могут не входить, как у нас например, значение О, трактуемое как ложь, и значение 1/(/г—1), которое мы трактуем, как неопределенность). Скобка, в которой имеется знак пересечения, соответствует утверждению, что во всех наблюдавшихся случаях связи Xi—>yi в левых ее частях имелось нечто общее, некий фрагмент описания Ct и этот фрагмент не пуст. Выражение в первых квадратных скобках интерпретируется как утверждение о том, что среди наблюдавшихся k интересующих нас случаев взаимосвязи Xi с yi^e было абсолютно одинаковых. Наконец, последняя квадратная скобка выделяет само утверждение о наличии связи между Ci и ау, полученное на основе наблюдений. Условие V (г = л',)есть условие полного исчерпывания всего множества примеров. Если к описанному нами предикату добавить еще одно условие, присоединенное к M(q, ay, k) с помощью операции конъюнкции^ V,^, ((^„ {г, => и,) (ау ^ и,)) {с, ^2,)),
188 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ '^и,Ш^я){^<и q<k))~^{x,^х^){у,=у,)] У,,„[((У,(г=>/.)(с,^г))-. ^{{aj^u){^;^)(\J {z = x,))) = V^~C.) (t^2 = Xl)^Jb {^2 => "2)] ^гз, «3, v, [((^3 = V,~Q) ( {Vs = X,) ) Jb{^s=>Us))~^{aj^u,)] (k^2), В записи этого предиката его начальная часть совпадает с предикатом сходства. Пояснения требует лишь последняя часть записи, начиная со скобки (zg^fz—Cf). Знак минус, который здесь и далее используется, это знак теоретико-множественной операции, порождающей разность двух соответствующих множеств. Вся эта часть записи формализует утверждение о том, что, при исключении из ^) М и л л ь Д. С, Система логики силлогистической и индуктивной,—М.: Книжное дело, 1900, с, 313. ^) М и л л ь Д. С. Система логики силлогистической и индуктивной,— М.: Книжное дело, 1900, с. 314. ТО МЫ получим предикат, отражающий сильное положительное сходство между Ci и а_/. В этой записи У„ означает, что г^^и^ имеет невыделенную оценку. Метод сходства был предложен Миллем в следующей словесной формулировке: «Если два или более случая подлежащего исследованию явления имеют общим лишь одно обстоятельство, то это обстоятельство, в котором только и согласуются все эти случаи, есть причина (или следствие) данного явления» i). Метод сильного положительного сходства, который мы получили из простого метода сходства, у Милля отсутствует. Второй основной метод, который вытекает из схем индуктивных рассуждений Милля,— метод различия. Сам автор так сформулировал его суть: «Если случай, в котором исследуемое явление наступает, и случай, в котором оно не наступает, сходны во всех обстоятельствах, кроме одного, встречающегося лишь в первом случае, то это обстоятельство, в котором они только и разнятся, есть следствие, или причина, или необходимая часть причины» 2). Схема правила вывода по методу различия такая же, как и для вывода по методу сходства. Разница состоит только в том, что вместо предиката M{ci, aj, k) используется предикат различия N, имеющий следующий вид: Л^(с;, aj, ife)-3,^^^^3,^,^^...3,^,^
§ 4.4, ОБОБЩЕНИЕ ПО СТРУКТУРАМ 189» рассмотрения общего, содержащегося в левых частях Xf^tji в исследуемых примерах, корреляция между Xi и tji исчезает. Так как предикат различия N{ci, aj, k) содержит предикат сходства уЙ (сь /г), то метод различия оказывается более сильным, чем метод сходства. Факты, устанавливаемые по методу различия, более обоснованы, чем те, которые были найдены лишь на основании выделения сходства. Подобно предикату сильного положительного сходства можно построить предикат сильного положительного различия. Наконец, можно ввести еще методы сходства и различия не для множества положительных примеров, а для множества отрицательных примеров. Вид соответствующих правил вывода и предикатов отрицательного сходства и различий как в слабой, так и в сильной форме, имеет вид, подобный тем записям, которые мы уже привели. Поэтому не будем утомлять читателей. Отметим только явную связь приемов, используемых в ДСМ-методе, с теми приемами, которые встречались нам при использовании пирамидальных растущих сетей. Как уже говорилось, ДСМ-метод состоит не только из уже рассмотренных правил поиска закономерностей, но и из правил распространения найденных результатов по аналогии на другие случаи. Возможны два типа выводов по аналогии: с помощью положительной аналогии и с помощью отрицательной аналогии. Правило вывода по методу положительной аналогии имеет вид Здесь Л+—предикат положительной аналогии, Ji означает, что истинность этого предиката установлена, а 6' — характеризует оценку из множества выделенных истинных значений, в которое не входит единица, т. е. вывод о связи C|=>aj не носит абсолютного характера. Предикат А'^ задается в следующем виде: Л + (С;, aj) =4,^^iJb^ (г =yu)J^ {с^ =ф Uj) {2 ^ с,) {и ^ aj)) V,, ^ [((г ^ X) {{у ^и)\у \/{u^y)))-^J,^ {{х^г)=^у)1 Сделаем некоторые пояснения. В качестве исходных посылок в методе полол^ительной аналогии выступает утверждение о том, что с некоторой достоверностью, характеризуемой оценкой истинности из Ь\ имеется связь г=>гг, а относительно связи Cj=>ay пока ничего не известно (значение т есть значение недоопределенности, которое, например, может быть 1/(/г—1), как в нашем случае).Известно также, что Z входит в Ci как подструктура, а и есть подструктура для aj. Тогда утверждается, что при исключении z иЗ посылки вывод [х— —г)=>у будет оцениваться как недостоверный. Множество невыделенных оценок истинности н' может определяться тремя различными
190 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ способами, что дает три версии предиката положительной аналогии и, следовательно, три версии правила вывода по положительной аналогии. В первой версии в качестве н' берется множество, состоящее лишь из значения 0. Во второй версии это множество расширяется на все невыделенные истинные значения, кроме значения т. В третьей версии в н' включается и т. Ясно, что эти три версии упорядочены по своей силе. Вывод, сделанный, например, по первой из них, влечет за собой и два остальных вывода. Предикат отрицательной аналогии, входящий в правило вывода по отрицательной аналогии (вид того, что осталось, совпадает с правилом положительной аналогии) записывается следующим образом: А - (с^, ау) = 3,, „ (У„ (г u)J, aj) (г ^ с,) {и ^ а,.)) V,, ^ [((г ^ х) {{у ^ и) \/ \/{u^y)))~.Jb^^{{x-z)=.yy)l Как видно из записи предиката отрицательной аналогии, внешне он почти ничем не отличается от предиката Л"^. Только вместо множества Ь' взято множество н, состоящее из всех невыделенных элементов, кроме О и т, а вместо множества н' — множество 1У\ Если в качестве fc" взять 1, то мы получим первую, наиболее сильную версию вывода по отрицательной аналогии, при отождествлении Ь" с множеством всех выделенных элементов получается вторая версия, а при добавлении еще элемента т — третья версия. В заключении самого правила вывода по аналогии с помощью предиката А~ вместо Jb' стоит /„, где н—множество невыделенных оценок истинности, в которое не входят значения О и т, Л\ы ввели, следуя авторам ДСМ-метода, несколько правил вывода, формирующих гипотезы и ряд правил вывода, распространяющих по аналогии накопленную информацию на пары (с^-, ау), для которых гипотеза непосредственно не выведена. Поскольку порядок применения правил первой группы не фиксирован, то вполне воз- \южно, что на некотором шаге в памяти системы возникнет противоречивая информация. Например, относительно некоторой гипотезы Ci=>aj будут существовать два утверждения, одно из которых «голосует» за наличие связи Ct с aj, а другое отрицает ее. Однако можно показать, что непротиворечивости можно добиться, если избегать комбинации пар правил вывода первой группы, относительно которых известно, что хотя бы одно из них является сильным, если одновременно применяются правила по сходству и по различию. Можно вообще не заботиться о противоречиях, тем более, что относительно комбинаций правил вывода по аналогии с правилами первого и второго типов проблема порождения противоречивых утверждений не исследована. Практическим выходом из той ситуации, когда возникает противоречие, является исключение этой пары (ct, aj) из множества выработанных гипотез и присваивания Ci^yaj значения оценки т.
§4.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 191 При практическом применении ДСМ-метода появляются два важных вопроса. Как оценивать достоверность той или иной полученной гипотезы? Как организовать последовательность применения правил вывода новых гипотез и правил аналогии для достижения наиболее эффективных гипотез при условии принятой оценки их достоверности? Ответ на эти вопросы весьма важен. Но, к сожалению, сегодня его получить еще не удается. Авторы ДСМ-метода в качестве оценки достоверности гипотез предлагают векторную оценку вида v = <n, т, 1у, где п — число шагов ДСМ-метода, которое потребовалось для вывода данной гипотезы, т — характеристика ъ.то- жества правил, использованных при данном выводе; / — характеристика, зависящая от того, какие именно множества использовались при выводе (т. е. каковы были индексы у / в предикатах, использованных при выводе). В оценке v учтены, по-видимому, все необходимые сведения, способные повлиять на достоверность окончательной гипотезы. Но беда заключается в том, что сейчас нет соображений о процедурах, позволяющих вычислять m и /, а также нет никаких методов (что, впрочем, общая беда всех задач с векторной оптимизацией) сравнения между собой оценок v в области множеств Парето. Для решения проблем, связанных со вторым вопросом, можно использовать некоторые частные соображения, полученные авторами ДСМ-метода. Обозначим через Rf некоторое правило вывода^ причем R^j — положительное правило, г Rj — отрицательное правило, /?сс» Rail) — соответственно правила сильного и слабого сходства и правила аналогии версии i (г = 1, 2, 3). Их суперпозиция означает последовательное применение правил вывода. Доказываемые в рамках ДСМ-метода соотношения, связывающие между собой правила вывода, имеют вид (1) Rt{Rt{Qi)) = Rtm. (2) Rtc{R'^cm) = Rtcm^ (3) ^?г(^г(^/))=-^?J(^£), (4) Я7с{Я7сШ = ^сЛ^1У Эти четыре свойства отражают то обстоятельство, что последовательное применение двух одинаковых методов сходства не приводит к появлению новой информации. Поэтому такие последовательности правил вывода нерациональны. Кроме того, используются еще шесть соотношений (5) ^^.{{Яи{Я1{й^))фЯ1{^,))), (6) Rl{Qi)^Rl,,,{Rl{Qi)), (7) 1^.т{Я1{^1))фЯ^{^,))), (8) RtiSid^^t (9) (10) 3^.iRi{Qi)^RtaARii^t))-
192 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ В ЭТИХ соотношениях индекс р означает сильное или слабое сходство, а индекс h — сильное или слабое различие. Последние соотношения показывают, что применение правил аналогии приводит к расширению множества гипотез, которые, таким образом, считаются доопределенными. Использование приведенных отношений между Выбор гипоп?езь(\^ Поиск пар у для которых Проверка условия с X Поиск: остатка Поиск поры Hpoch'omp и выдор (z^u), для которых 1 Вь/дача результатов оывода JL Есть ли ещё гипотезы ^ Т Конец процедуры Рис, 4,10 правилами вывода, по-видимому, в будущем сможет помочь при построении более эффективной процедуры нахождения гипотез, чем та которая выполняется в существующей сейчас программной реализации ДСМ-метода. То, что есть сейчас, требует многократного просмотра совокупностей из k пар, поиска пересечений в левых и правых элементах этих пар и выделения описаний, входящих в эти пересечения. Непустые пересечения будут соответствовать и и образовывать гипотезу с^^а^. В методах, основанных на различии, кроме этой процедуры, требуется еще найти контрпример, воз-
§4.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 193 7 д. А. Поспело» никающий при отсутствии в пересечении левых частей гипотезы с^. Для устранения факториальной сложности по^, которая появляется при прямом поиске всевозможных пересечений описаний по k штук (величина k меняется от 2 до п, где п — число описаний, хранящееся в исходном множестве), можно применять различные приемы уменьшения числа реализаций пересечения одного и того же описания с другими. Но мы на этом останавливаться не будем. При реализации правил аналогии также требуется перебор, но не по k элементов, как для правил формирования гипотез, а лишь по k=2. Однако и в таком случае при большом объеме исходного множества и множества порожденных гипотез прямой перебор по парам для выявления условий применимости того или иного метода аналогий также имеет полиномиальную сложность высокого порядка. Поэтому и здесь нужны специальные приемы, уменьшающие число сравниваемых пар описаний. Хотя сущность процедуры, реализуемой на ЭВМ, достаточно ясна из вида записей предикатов сходства, различия и аналогий, проиллюстрируем одну из этих процедур блок-схемой программы, показанной на рис. 4.10. На нем приведена блок-схема для правила положительной аналогии версии 3. На рис. 4.11 в весьма схематической форме показана общая блок- схема программы, работающей в соответствии с ДСМ-методом. Прежде чем завершить рассказ о ДСМ-методе, сделаем одно важное замечание, имеющее большое значение для использования методов структурного обобщения в системах типа систем ситуационного управления. Как следует из описаний основных предикатов, входящих в правила и процедуры ДСМ-метода, этот метод успешно работает лишь при наличии непустых пересечений Ci и aj. Другими словами, предполагается, что причина, порождающая связи вида Xi^tji, Х2^У2, Хг^^Ути единственна. На самом деле такое допущение слишком жестко. Оно может часто приводить к появлению пустого пересечения из-за того, что причина не единственна. В других случаях оно может приводить и к неверным выводам относительно истинных причин. Например, обобщая подобным образом два высказывания «Сегодня прекрасная погода, я в отпуске — поеду на дачу» и «Сегодня прекрасная погода, воскресенье — поеду на дачу», система придет к выводу, что причина поездки на дачу — наличие хорошей погоды, т. е. будет считать достоверной гипотезу: «Сегодня хорошая погода — поеду на дачу». На самом деле причиной может быть некоторая логическая функция от фрагментов описаний, входящих в xj, т. е. вместо простой гипотезы С1=Фа^ введена гипотеза вида f{c}, с], cT)^aj, Вид этой функции может быть произволен. Например, функция вида f=c]c] говорит о том, что связь fz^aj имеет место лишь тогда, когда в описании присутствует с\ и отсутствует фрагмент с]. Таким образом, с] играет здесь роль тормоза, запрещающего появление следствия aj даже при наличии
194 гл. 4. обобщение и классификация ситулцип причины с\. В случае же f=c\{c\\^c^d фрагмент может рассмат- риваться как тормоз для тормоза с?, так как наличие с} даже при начичии с? создает условия для возникновения связи /=:>ау. 1 ввод исходной троичной матрицы С мноместЗами й^, Й,. 1 Выбор правило ^ поромиьния гипотез Rj Применение бь/бранного прибила * — dbfdop прибила бывода по иналоеии a(L) Припенение выдранного пробила Возможно ли дальнейшге применение поло?нител!зНЬ/;( пробил? ' \нет ' Выбор правила поро}ндеиия гипотез Rj -JL Применение выбранного правила Выбор прадила вывода по аналогии X Применение выдранного пробила Возможно У7и далы/ейшее применение отрис^ательных правил^ ' I \Иет Сроднете полученной матрицы с предшестЗующеи матрицей 1 1 Вдод новой матрии^ы 1^ б каиеслпбе исходной Конец процедуры Рис. 4.11 Переход от принципа единственной причины к рассмотрению совокупности причин вместе с тормозами и тормозами на тормозы резко расширяет возможности метода формирования гипотез. В этом
§ 4.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 195 • ] 1 1 I •■5 ^5 Рис. 4.12 случае можно рассматривать обобщенные правила вывода типа правил положительных и отрицательных сходств и различий и модифицированные правила вывода по аналогии. В настоящее время в ДСМ-методе нет реально действующих процедур такого типа, но создание их не представляется слишком сложным. Интересна и не решена пока еще и задача установления соответствия между правилами вывода по аналогии, применяемыми в обсуждаемом нами методе обобщения по структурам, и методами вывода по аналогии, о которых шла речь в § 3.7. Кроме того подхода к обобщению понятий по структуре, который основан на идеях, высказанных еще Ф. Бэконом и С. Миллем, можно построить и другие процедуры, не опирающиеся в явной форме на идею индукции. Рассмотрим в связи с этим ряд примеров. Пример 4.3. На рис. 4.12 показана некоторая структура, состоящая из однотипных объектов с именами ii, 1*2, Ее можно рассматривать, например, как игровое поле для известной всем с детских лет игры в крестики-нолики. Сплошным стрелкам на этом рисунке соответствует отношение г^^ — быть справа, а пунктирным стрелкам — отношение г^^ — быть снизу. Всю показанную структуру можно описать на языке ситуационного управления следующим образом: ШРЧ) ^32 (^РЧ)) ((^Р^'з) ^32 (^РЧ)))' (((^РЬ) ^32 Шх)) ((^Pifi) ^32 (^Pi's))). ((Ms) ^32 Wh)) iim^) ^32 M'g))). r,, (api,)) {{api,) r,, (api,))). (((^Pi'e) ^41 (^Р^з)) ((^Pig) ^41 (^Pi'e)))' Тройными скобками в этой записи выделены однотипные структуры. Первые три и соответственно последние три структуры отличаются друг от друга лишь использованными в атомарных формулах именами. Установим между первыми тремя фрагментами отношение изоморфизма: i2^ib^h\ h'^h'^h', h^h^h- Если для изоморфных троек ввести обозначение ^2, li и то все три первых фрагмента станут одинаковыми и примут вид (i2^32?i) (?з^з2?2)- Это описание можно считать новым понятием — горизонтальный ряд из трех элементов. Его черезвычайно легко обобщить на случай, когда в ряду имеется п элементов. Описание этого понятия записывается следующим образом: (^.''32^1) (?з^32У-- - (^л^зг?»-!)- 7*
196 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИП Рассмотрим теперь три последних фрагмента в исходном описании. Введем следующий изоморфизм для имен: i4<->i5<->ie; ii<->i2<-> ч->/з; i\<->ig<->i9. Если для изоморфных имен ввести обозначения i^ia, 111 и г]з, то все три последних фрагмента примут вид (г]2 r^i r\i) [ц^ Г41'П2)- Это описание можно считать новым понятием — вертикальный ряд из трех элементов. Его также нетрудно обобщить на случай, когда в вертикальном ряду имеется п элементов: Установим теперь изоморфизм Hi<->r|i; ^^^-^Лг; ^:з^г|з; ^з2<->^41 и обозначим отношение, характеризующее последний изо.\юрфизм, через со. Тогда получим запись, в которой есть обозначения изоморфных h и r]i: (V2COV1) (Vgcovg). Смысл этого понятия — ряд иЗ трех элементов. Для произвольного п — ряд из п элементов вида Для более полного определения последнего понятия надо в изоморфизм между отношениями включить еще отношение быть слева и быть сверху. Сделаем некоторые замечания в связи с только что приведенным примером. С помощью операции изоморфизма мы ввели в описание • ^/ • с) • 4 • • hi • h • • Рис. 4.13 некоторые новые элементы; их можно считать классами, в которые входят все элементы, изоморфные между собой. Такие классы принято называть классами эквивалентности. В ходе формирования окончательного описания мы последовательно увеличивали мощность этих классов. На рис. 4.13 показана получившаяся иерархия.
§4.4. ОБОБЩЕНИЕ по СТРУКТУРАМ 197 Это типичная родо-видовая иерархия, которая упоминалась в §4.2. Пример 4.4. Пусть дано следующее описание ситуации на языке ситуационного управления: {{api,)r,,d){(apQ r^^{api,)), ((ар/О г, {vr,0)) {{api,)rAvr,0))... Здесь приняты следующие обозначения: а — автомобиль, ij{j = = 1,2,...,40) — различные государственные номерные знаки, d — заправка автомобиля, v — скорость, г^^ — совершать действие, Гз4 — быть сзади, — иметь признак, — признак — значение. После пояснений обозначений ситуация, описанная выше, становится ясной. В некотором месте на заправку имеется очередь из 40 автомобилей с конкретными государственными номерными знаками. Автомобиль с номерным знаком ii в данный момент заправляется топливом. Будем постепенно проводить обобщение нашего описания. Прежде всего введем свободные номера Hi, ^2,...,?4о, которые будут соответствовать любым попарно различным государственным номерным знакам. Автомобиль {apli) имеет некоторый, точно не названный номер. Кроме того, не будем фиксировать число автомобилей в очереди. Для этого введем кроме свободных имен еще и свободный порядковый номер б. Значениями б могут быть любые элементы натурального ряда. После этого находим ((apli) r,,d) ((арУ r,,{apl^))... iiaph) Г34 {aph-i)) {{apli) r, {vr,0))... ((apSfi) r, {vr,0)). Это описание может рассматриваться, как структура понятия «очередь автомобилей на заправку». Если теперь исключить из описания первую скобку, то оставшуюся часть можно считать структурой понятия «стоящая колонна автомобилей». Если же вместо значения скорости О в описании присутствует некоторое ненулевое свободное значение Я, то полученная структура может интерпретироваться как «движущаяся колонна автомобилей». Если, наконец, вместо а в описание подставить свободную переменную г], интерпретируемую на множестве объектов, способных к движению, то находим ((ЛР^г) ^Я4 (ЛР^О). • . ((ЛРЫ ^34 (ЛР^в-О) ((ЛР^О г, {vr,X))... ((лр^б) г, {vr,X)). Это описание отражает структуру понятия «движущаяся колонна объектов». Если из него исключить информацию о скорости, заменить атомарные тройки с именами {^pli) на Vj, а отношение г..^
198 гл. 1. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУЛЦИП заменить на со, то мы получим (V2COVJ (VgCOV,). . .(VfiCOVfi^O- Если это описание сравнить с тем, которое мы получили в предшествующем примере, то при отождествлении б с п мы увидим их полное совпадение. И действительно колонна неподвижных объектов вполне может трактоваться, как ряд из п элементов. Пример 4.5. Рассмотрим следующее описание ситуации: ИМ) г,,с),.Л{М) г,,с). Здесь — сокращенная запись атомарного описания вида (ёРЧ)^ где g — станок, ij — индивидуальные номера станков, / — фрезерный станок, с — состояние быть свободным, г.^ — быть элементом класса, Гг,д — находиться в состоянии. Напомним еще раз, что между всеми скобками имеется отношение быть одновременно. Таким образом, здесь описана ситуация, что в некоторый момент времени б фрезерных станков свободны. Обобщим это описание с помощью квантификатора >|, интерпретируемого как некоторые из. Новое описание будет иметь вид {(у{ёУ4)г^^^с. Смысл этой записи такой же, как и исходной, ибо значение б не определено. Если же, например, мы располагаем априорной информацией о количестве фрезерных станков на данном предприятии и значение б указано конкретно, то в зависимости от б и общего числа фрезерных станков квантификатор >| может принимать значения: лииль нюольилая часть, примерно половина, почти все и т. п. Обсудим еще два небольших примера. Пример 4.6. Рассмотрим описание ((/ip/J г, {сг,Ь,)) {{hpU) г, (сгЛ)) ((/ip/з) ^ (сг,Ь,)), где Л —кран, 1^, 1^, /^j —индивидуальные номера кранов, с —цвет, &ь b-z, &.3 — конкретные значения цветов. Отношения имеют тот же смысл, что и в примере 4.4, Заменим это описание описанием, в котором ^юдификaтop т имеет значение цветной: {{mh)pii) ((m/Op/2) ((m/i)p/;i). Смысл его состоит в утверждении о существовании трех кранов, окрашенных в некоторые цвета. Пример 4.7. Пусть а —молоток, /; — пила, с —клещи, d —стамеска, ^—рубанок, Г47 —бь/ть инструментом для, pi — забивание гвоздей в дерево, рз —разрезание дерева на части, рз — вытаскивание гвоздей из дерева, Ра — создание углублений в дереве, рг, — выравнивание поверхности дерева. Рассмотрим описание, в котором точки с запятой, стоящие между скобками, соответствуют отсутствию между ними отношения быть одновременно, (ari-^pi); фг^-р^У, {cr^-jp^)\ (^^47/^4); {егх-!Р:У Введем понятие z — инструмент и понятие р — процесс обработки дерева. Тогда описание (zr^-^p), которое заменяет предшествующее, можно интерпретировать, как понятие столярный инструмент.
§ -1.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 199 О чем говорят приведенные нами примеры? Скорее всего о том, что способов обобщения по структуре довольно много. В примере 4.3 обобщались объекты, участвующие в описании, их имена и от- ногиения. И это обобщение происходило за счет установления некоторого-изоморфизма. В примере 4.4 кроме обобщения по именам использовалось еще обобщение по значению признака у, а также за счет введения неопределенного количественного показателя б, В примере 4,6 обобщающим фактором было введение модификатора цветной вместо конкретного указания на цвет. Наконец, в последнем примере использовано обобщение по процессам с обобщением по объектам. Для каждого вида обобщений нул<но иметь специальные средства. Однако для многих из них существует общая модель, связанная с моделью представления описаний в виде семантического графа. Каждый семантический граф (СГ) представляет собой взвешенный мультиграф, причем веса могут приписываться как вершинам СГ, так и его дугам. Будем рассматривать СГ, в которых используется пять типов вершин. Вершины первого типа носят название объектных. Вес объектных вершин имеет вид </г, т>. Здесь п — число однотипных объектов, приписываемых данной вершине или некоторый квантификатор, оценивающий это число, т — тип объекта (некоторый класс, к которому принадлежат объекты, соответствующие данной вершине). Вершины второго типа называются призначными. Вес таких вершин имеет вид <(л;1, ПО, (Яг, П2)...(л^^, П;,)>, где л,- — имена признаков, а П^^ — значения признаков. Вершины третьего типа называются предикатными. В качестве их веса выступает имя некоторого предиката Pi с указанием его местности. Функциональные вершины составляют четвертый тип вершин в СГ. В качестве их веса выступает тот функциональный символ, который определяет суть этой вершины. Для функционального символа указывается его местность. Наконец, последний тип вершин вСГ — именные вершины; их вес выражается через некоторые символы из множества имен. Опишем теперь правила проведения дуг в СГ. Начнем с при- значных вершин. В них могут входить дуги, помеченные весами, которые соответствуют именам признаков, имеющимся в весе данной вершины. Из призначной вершины всегда исходит лишь одна дуга, которая ведет к некоторой объектной вершине. Для предикатных вершин число входных дуг должно соответствовать местности данного предиката. Эти дуги идут от объектных вершин и имеют веса, определяющие положение соответствующих значений в структуре предиката. Их можно рассматривать как определенные указания на те роли, которые они играют в предикатном выражении. Выходные дуги для этих вершин могут идти к объектным или функциональным вершинам. Для функциональных веришн входными дугами могут служить дуги, идущие от объектных, предикатных и функциональных вершин. Веса дуг определяют либо значения со-
200 ГЛ, 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ ответствующих аргументов, либо возможность или невозможность выполнения той или иной последовательности операций в зависимости от значений, выдаваемых предикатными вершинами. Но для каждой функциональной вершины заведомо существует хотя бы один путь, ведущий от некоторой объектной вершины к другой объектной вершине. Наконец, именные вершины не имеют входных дуг, а единственная их выходная дуга связана с некоторой объектной вершиной. Для объектных вершин единственным ограничением на входные дуги является то, что у нее может быть только одна дуга, идущая от призначной вершины. Между СГ и описаниями на языке ситуационного управления существует прямая связь. Проиллюстрируем ее на примере. Пример 4.8. На рис. 4.14 показан СГ, который соответствует описанию, приведенному в примере 4,4, На нем объектные вершины □ ? 1^ Г Р <иХ'У L Г 4 1' Рис. 4.14 обозначены двойными кружками, предикатные — обычными кружками, именные — маленькими зачерненными кружками, признач- ные — квадратиками. Роли R' и R" — соответственно получатель и отправитель. Роли Q' и определяют соответственно тех, кто стоит слева неправа в отношениях Г34. На рис. 4.14, б показан один из этапов обобщения, когда произошло обобщение всех автомобилей с номерами от 2 до б в одну объектную вершину. Такое обобщение вызывает много вопросов, связанных с однозначной интерпрета-
§4.-1. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 201 цией тех знаний, которые содержатся в обобщенном СГ, в частности, знаний о выборе аргументов для предикатной вершины, связанной с обобщенной объектной вершиной, знаний о приписывании имен объектам, входящим в обобщенную вершину и т. п. Для ответа на подобные вопросы необходимо сначала сформулировать более точно понятие обобщенной вершины того или иного типа. Начнем с объектных вершин. Будем говорить, что объектная вершина Vi является более общей чем объектная вершина Кг, если выполнены следующие условия. 1. Составляющая веса п для Vi больше, чем для l/g- Это соответствует тому, что объект, сопоставляемый вершине Vu содержит больше однотипных элементов, чем такой же объект, сопоставляемый вершине l/g. На рис. 4.14, б вершина с весом ,6, а} играет в частности именно такую роль по отношению к вершине с весом ч1, 2. Составляющая веса т для Vi включает в себя как подлшоже- ство составляющую т для V^- Примером такого обобщения ^южeт служить переход от вершины, для которой т — класс aвтo^юбплeй, к вершине, для которой т — класс с именем «транспортные средства». Это обобщение есть по сути приписывание данной объектной вершине другого имени, хотя имя, сопоставляемое ей именной вершиной, может и сохраниться. 3. Призначная вершина, приписываемая Vi, включает в себл весь набор значений признаков в прнзначной вершине, приписываемой Т/'г, причем все области значений признаков для Vi не меньше, чем области значений признаков для и содержат в перечне признаков в своей призначной вершине еще хотя бы один признак. Если же наборы признаков для Vi и одинаковы, то область значений хотя бы для одного признака для Vi включает в себя область значений этого признака для Эти три условия отражают различные способы обобщения, которые мы рассмотрели в примерах 4.3—4.7. Так, первое условие есть обобщение по квантификатору. В частности, при объединении в одну вершину неопределенного количества объектов (примером этого служит СГ на рис. 4.14, б) вместо количественного значения для составляющей веса п дюжно использовать качественный квантификатор количества. Второе условие есть обобщение по имени, так как т связаны некоторой иерархической связью родо-видового типа. В § 2.9 мы уже говорили о иерархиях типа АКО-связи, которая как раз и задает условия для обобщения, выполняемого по такому принципу. Наконец, третье условие есть условие обобщения по модификаторам, проиллюстрированное нами в примере 4.6. Рассмотрим теперь вершины других типов. Для именных вершин Vi и V2 вершина l-'i будет более общей, если имя, представляемое V2, входит в имя, представляемое Vi. Вхождение имен надо понимать двояко, с одной стороны, Vi может соответствовать множество имен, а V2 — подмножество имен (в частности, одно имя), входящее в множество имен \\. Пример такой ситуации демонстрирует нам
202 ГЛ. 4. ОБОБЩЕНИЕ п кллссиФИклш:я cит^-лцип рис. 4.14; так, на рис. 4.14, б соответствующая обобщенная объектная вершина более общая, чем любая из именных вершин на рис. 4.14, а, приписываемых тем объектным вершинам, которые потом вошли в состав обобщенной вершины на рис. 4.14, б. С другой стороны, ^юж■eт существовать естественная иерархия имен. Примером могут служить мужские и женские имена, характерные для каждого языка и в частности русского. С их помощью образуются два обобщенных имени — мужское имя и женское имя, относительно мощности которых информации может п не быть. Другой пример — класс детское имя, элементы которого в русском языке получаются за счет использования уменьшительных суффиксов от многих мужских и женских имен. Аналогично существует определенная традиция в выборе имен для футбольных команд, пароходов, гор, кошек, собак и т. п. Для призначных вершин, обобщение уже описано условием 3 для объектных вершин. Для предикатных вершин обобщение достигается за счет перехода от одного веса вершины к другому. Предикатная вершина Vi является более общей, чем l/g, если из истинности предиката, приписываемого всегда следует истинность предиката, приписываемого V^. Наконец, функциональная вершина Vi является более общей, чем функциональная вершина Уг, если при реализации функции, соответствующей реализуется и функция, соответствующая l/g. Будем считать, что Cfi есть обобщение СГг, если в CFi есть хотя бы одна вершина, являющаяся обобщением одной или нескольких вершин из СГ2, а в СГг нет таких вершин. Будем также говорить, что в этом случае СГ2 наложим на Cfi. Теперь можно связать описанный нами аппарат обобщения, опирающийся на представление информации с помощью семантических графов, составляющих определенный подкласс семантических сетей, с аппаратом, развитым в ДСМ-методе. Пусть имеется некоторая обучающая выборка, содержащая как положительные, так и отрицательные примеры. Пусть в множество положительных примеров, характеризующих формируемое понятие, входят описания в виде семантических графов СГ^, CFg, СГ/,. Тогда задача обобщения может быть сформулирована следующим образом. Найти такую совокупность семантических графов СГ\ CГ^ СГ'", которая была бы наложима на СГ^, СГг, СГ^ и не была бы наложима на семантические графы, входящие в множество контрпримеров. В простейшем случае, эквивалентном случаю существования единственной причины для гипотезы >ау в ДСМ-методе, требуется найти один СГ *, который был бы наложим на любой из семантических графов, представляющих класс положительных примеров обучающей выборки, и не был бы наложим ни на один граф, характеризующий класс отрицательных примеров обучающей выборки. В более общем случае, когда множество покрывающих СГ для всех положительных примеров содержит более одного элемента, возникает ситуация, по-
§4.3. «СЛОЕНЫЙ ПИРОГ» 203 добная той, которая в ДСМ-методе привела к появлению обобщенных правил. Не желая утомлять читателей изложением соответствующих процедур поиска СГ * или некоторого дизъюнктивного представления из покрывающих СГ, которые во многом аналогичны процедурам ДСМ-метода, отсылаем читателя к работам Н. П. Викторовой, указанным в списке литературы к данной главе. В этих работах описан весь спектр необходимых процедур работы с семантическими графами. § 4.5. «Слоеный пирог» Мы рассмотрели методы, позволяющие формировать обобщенные описания ситуаций в соответствии с теми решениями, которые были приписаны ситуациям, входившим в обучающую выборку. В процессе функционирования системы ситуационного управления работа по формированию классов ситуаций и уточнению ранее сформированных классов происходит постоянно, так как обучающая выборка может не исчерпывать всего богатства возможных ситуаций, складывающихся на объекте управления. Обобщение может происходить на многих этапах, и поэтому исходные описания ситуаций и обобщенные их описания образуют иерархическую структуру, в каждом слое которой находятся описания, полученные из исходных с помощью тех или иных процедур обобщения. Если исходные описания принять за нулевой уровень, то на первом уровне будут находиться описания, полученные непосредственно из описаний ситуаций, лежащих на нулевом уровне. На второй уровень попадут описания, которые возникнут за счет применения процедур обобщения к описаниям первого уровня и т. д. Так возникает «слоеный пирог», показанный на рис. 4.15. Ситуации на всех уровнях обобщения соответствуют некоторым решениям по управлению. В идеальном случае на самом верхнем Рис. 4.15
204 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ уровне системы классификации возникают описания, каждому из которых соответствует определенное решение по управлению. В более частых случаях при недостаточной обучающей выборке окончательное разделение классов может и не произойти. Оно никогда не наступает при недетерминированном процессе формирования обобщенных ситуаций. Если решения по управлению сами обладают некоторой структурой, то при формировании «слоеного пирога» требуется соотнести уровни управления в структуре принимаемого управленческого решения с уровнями классификатора. Для осуществления этого мол<но использовать следующий прием. Пусть в некоторой ситуации необходимо принять решение U, которое само распадается на три самостоятельных решения по управлению Uu О2 и [/3, связанные с решением U следующим образом. Прежде всего принимается решение Uu а затем по результату его реализации необходимо выбрать либо решение t/2, либо решение f/з. При классификации ситуаций это означает, что имеется некий класс ситуаций, которому соответствует решение f/2. другой класс ситуаций, которому соответствует решение U3 и, наконец, класс ситуаций, которому соответствует решение и. Именно и, а не Uu так как Ui может определять совершенно другой класс ситуаций, для которых одношаговое решение Ui окончательно. Это приводит к необходимости разнесения описаний обобщенных ситуаций для U и для f/2 и U3 на разные уровни обобщения, так как для С/гИ t/g обучение формированию обобщенных ситуаций должно происходить лишь на множестве ситуаций, относящихся к решению U, Кроме того, на том же уровне, что и для и, могут существовать классы ситуаций, для которых одно- шаговые решения U2 и U3 окончательны. Если имеется управление (решение) U, которое состоит из п последовательных управлений, то в «слоеном пироге» возникает п уровней классификации. Иерархичность управления позволяет формировать обобщенные описания за существенно меньшее число шагов, чем в общем случае. Рис. 4Л6
§ 4.5. «СЛОЕНЫЙ ПИРОГ» 205 Столь же полезны и иерархические описания ситуаций на объекте управления, что определяется структурой самого объекта. Иерархические описания помогают каждый раз выделять общие части сравниваемых описаний (и именно эта процедура является центральной во всех методах обобщения в ситуационном управлении) за меньшее число операций, так как граф описания естественным образом распадается на графы меньшей размерности. Во многих-задачах, важных в теории ситуационного управления, все эти иерархии имеют специальный вид /-графа. Общий вид /- графа показан на рис. 4.16. Такие иерархические графы обладают следующими свойствами. 1. /-граф состоит из некоторого числа подграфов Gj, которые не пересекаются между собой. На рис. 4.16 показано три таких подграфа. 2. Подграфы Gi могут быть упорядочены по уровням при усло- ьии выполнения следующего условия: любая вершина подграфа Gi связана дугой с какой-то одной вершиной G,-^i. Подграф Gi всегда состоит из одной вершины, с которой связана одна или несколько вершин подграфа Gg. Направление дуг, связывающих вершины разных подграфов, всегда таково, что дуга направлена из подграфа с большим номером в подграф с меньшим номером. 3. Если в некотором подграфе Gi две вершины связаны дугой, то они соединены с одной и той же вершиной подграфа Gi_^i. Пример 4.9. На рис. 4.17 показана структура семантического графа, описывающая знания о некотором участке энергосистемы, где приняты следующие обозначения: П — потребите