/
Текст
ПРОБЛЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
J
Е. И. ЕФИМОВ
РЕШАТЕЛИ
ИНТЕЛЛЕКТУАЛЬНЫХ
ЗАДАЧ
It
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1982
32.81
Е 91
УДК 62-50
Решатели интеллектуальных задач. Ефимов Е. И.— М.: Наука,
Главная редакция физико-математической литературы, 1982.— 320 с.
Книга посвящена рассмотрению элементов теории интеллектуальных
решателей и ее практических приложений. Книга состоит из трех частей.
В первой части дается концептуальное описание интеллектуального
решателя. В связи с этим предлагается семиотическая модель мыслительной
Деятельности человека, решающего задачи, вводится определение мира
задач как иерархического пространства одноуровневых задач различного
уровня общности.
Во второй части изучаются различные методы автоматических
доказательств и индуктивных выводов, в традициях математической логики и
теории моделей строится и исследуется проблемно ориентированная теория
решений — семиотическая система знаний решателя. Рассматриваются
возможные стратегии поиска доказательств, интерпретируемых как решения
соответствующих задач.
В третьей, заключительной части на примерах созданных
отечественных и зарубежных решателей анализируются практические реализации
системы знаний и поиска решений, а также системы обучения.
Табл. 6, илл. 58, библ. 109 назв.
,,1502000000 — 086 (А< QO Г© Издательство «Наука»»
пго/аоч qo А01-5А w r.iaиная редакция
УОО{у)б)-ол физико-математической
литературы» 1982
ОГЛАВЛЕНИЕ
Предисловие 5
ЧАСТЬ 1. ПРЕДМЕТ ТЕОРИИ РЕШАТЕЛЕЙ ИНТЕЛЛЕКТУАЛЬНЫХ
ЗАДАЧ 7
Глава 1. Организационные системы и решение задач .... 7
§ 1.1. Что такое целенаправленный решатель? 7
§ 1.2. Проблемы исследования целенаправленных решателей !)
§ 1.3. Чем интересуется теория интеллектуальных решателей? 13
Глава 2. Мыслительная деятельность человека 15
§ 2.1. Вводные замечания 15
§ 2.2. Проблемная ситуация 19
§ 2.3. Описание мыслительной деятельности 21
§ 2.4. Анализ мыслительной деятельности 3£)
§ 2.5. Семиотическая модель мыслительной деятельности ... 34
§ 2.6. Эвристическое программирование 3(5
Глава 3. Интеллектуальные задачи 41
§ 3.1. Классификация типов задач 41
§ 3.2. Модель мира операций 43
§ 3.3. Модель мира задач "... 49
Глава 4. Решатели интеллектуальных задач 54
§ 4.1. Подсистемы решателя и их назначение ...... 54
§ 4.2. Элементы алгебраической теории бинарных отношений 58
§ 4.3. Иерархические структуры решателя задач 61
i 4.4. Комплексная стратегия поиска решений 65
§ 4.5. Теоретико-множественные модели решателя задач ... 75
& 4.6. Система формального интеллекта комплексных стратегий
поиска решений (СФИНКС) 78
ЧАСТЬ И. ТЕОРИЯ АВТОМАТИЧЕСКИХ РЕШЕНИИ , . , . . 81
Глава 5. Логические системы 81
§ 5.1. Проблема автоматизации 81
§ 5.2. Принцип резолюций 84
§ 5.3. Исчислепие секвенций 95
§ 5.4. Логика решений 100
Глава 6. Построение теории решении 103
§ 6.1. Аксиоматическая теория решепий 103
§ 6.2. Синтаксис 107
§ 6.3. Интерпретация 110
§ 6.4. Аксиоматика , 112
1*
4
ОГЛАВЛЕНИЕ
§ 6.5. Правила вывода
§ 6.6. Семантика
Глава 7. Полпота и непротиворечивость теории решении
§ 7.1. Истиппость
§ 7.2. Непротиворечивость
§ 7.3. Метатсорсма о редукции
§ 7.4. Полнота
Глава 8. Разрешимость теории решении
§ 8.1. Диаграмма двухуровневого доказательства
§ 8.2. Алгоритм поиска вертикальных доказательств .
§ 8.3. Алгоритм поиска горизонтальных доказательств
§ 8.4. Доказательство разрешимости
Глава 9. Автоматическое формирование понятии в решателе задач
§ 9.1. Введение
§ 9.2. Постановка задачи автоматического обучения формированию
понятий
§ 9.3. Основные положения и определения
§ 9.4. Некоторые теоретические обоснования алгоритма обучения
§ 9.5. Описание алгоритма обучения
§ 9.6. Иллюстративный пример ,
ЧАСТЬ III. ПРАКТИЧЕСКИЕ РЕАЛИЗАЦИИ ,
Глава 10. Зарубежные решатели .
§ 10.1. Сравнительный апализ зарубежпых систем
§ 10.2, Решатель GPS
§ 10.3. Дедуктивпая вопроспо-ответпая система QA3 .
§ 10.4. Планирующая система STRIPS
§ 10.5. Планирующая система ABSTRIPS .
§ 10.6. Вопросно-ответная система QA4
Глава 11. Отечественные решатели ,
§ 11.1. Сравнительный апализ отечественных систем .
§ 11.2. Система АЛПЕВ-ЛОМИ
§ 11.3. Система ПРИЗ
§ 11.4. Программа принятия решений
§ 11.5. Система принятия решений интегрального робота .
§ 11.6. Интеллектуальный решатель СФИНКС
Послесловие
Литература
Предметный указатель
«Исторический опыт учит нас тому, что там, где
старые понятия, старые содержания формулируются
по-новому, в рамках новой, более широкой теории, мы
всегда получаем нечто большее, чем просто новое
повторение старого. Само старое получает в рамках
новой понятийной системы новое содержание».
Г. Клаус. Кибернетика и философия, стр 29, 1963.
ПРЕДИСЛОВИЕ
В 70-е годы в отечественной и зарубежной литературе
появилось и продолжает появляться много публикаций, связанных с
попытками автоматизировать процедуры решения человеком
задач в сфере его научно-технической деятельности: планирование
поведения в сложных средах, проектирование и
конструирование, синтез машинных программ, доказательство теорем, игры
и другие задачи, которые принято считать интеллектуальными.
В подобных публикациях проблема автоматических решений
рассматривается либо слишком конкретно и потому представляет
частный интерес, либо, напротив, слишком абстрактно, что
затрудняет техническую реализацию таких результатов. К тому
же результаты в указанной области представляют довольно
разрозненный материал, не имеющий единой теоретической базы.
Таким образом, с одной стороны, образовался известный
разрыв между теорией и практикой интеллектуальных решающих
систем, с другой стороны, большое многообразие. работ по
данной проблеме вызвало острую необходимость их осмысливания
на единой методологической основе.
В 1976 году вышла книга Э. В. Попова и Г. Р. Фирдмана
«Алгоритмические основы интеллектуальных роботов и
искусственного интеллекта», которая в известной степени сократила
этот разрыв и обозначила основные направления дальнейшего
развития работ в области искусственного интеллекта. Однако
авторы книги, стремясь рассмотреть как можно более широкий
круг вопросов искусственного интеллекта, естественно, не
смогли в рамках одной книги достаточно полно развить отдельные
проблемы, в частности проблему автоматизации решений.
Предлагаемая вниманию читателей книга имеет целью более
углубленпо рассмотреть один из интересных классов систем
искусственного интеллекта — решатели интеллектуальных задач.
Эти системы интереспы тем, что именно в них находят свое
отражение такие основные проблемы искусственного интеллекта,
как 1) построение семиотических моделей мыслительной
деятельности человека; 2) адекватное представление знаний и
организация эффективных процедур их обработки; 3) разработка
б
ПРЕДИСЛОВИЕ
эвристических процедур поиска решений в иерархическом
пространстве задач; 4) использование в качестве языка реализации
процедуральных языков высокого уровня; 5) автоматическое
обучение решателя с целью пополнения его знаний.
В настоящее время уже не вызывает сомнения, что
эффективная машинная реализация интеллектуальных систем
невозможна без процедуральных языков высокого уровня. Однако
системы, описанные с помощью таких языков, плохо поддаются
теоретическому исследованию; для этого необходимы более
лаконичные и понятные читателю описательные средства/В качестве
таких средств в книге рассматриваются
машинно-ориентированные логики. Выбор логистического подхода, несколько
дискредитированного в последнее время чрезмерной универсализацией
принципа резолюций как метода автоматических доказательств,
не случаен и, как можно надеяться по прочтении этой книги,
вполне оправдан. Дапный подход предопределил и характер
отбора материала для книги.
При рассмотрении тех или иных вопросов автор стремился
уделять основное внимание принципам, а не деталям, поэтому
взыскательный читатель скорее нацдет для себя схему, а не
готовое решение проблемы.
Автор вполне сознает, что действительное содержание и
качество книги могут не в полной мере соответствовать его
замыслу, и заранее благодарен тем читателям, которые укажут ему
на замеченные недостатки и недоработки.
В заключение автор приносит искренние извинения всем тем
лицам, работы которых в области решателей интеллектуальных
задач не нашли отражения в книге в силу ограниченности ее
объема.
Автор
ЧАСТЬ I
ПРЕДМЕТ ТЕОРИИ РЕШАТЕЛЕЙ
ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
ГЛАВА I
ОРГАНИЗАЦИОННЫЕ СИСТЕМЫ II РЕШЕНИЕ ЗАДАЧ
§ 1.1. Что такое целенаправленный решатель?
Исследованию больших * систем уделялось и уделяется много
внимания [Вир, 1961; Квейд, 1969; Акофф, 1970; Н. П. Буслен-
ко, В. В. Калашников и И. Н. Коваленко, 1973, и т. д.]. Нас
в первую очередь будут интересовать законы поведения этих
систем. С этой точки зрения мы будем выделять классы
организационных и технологических систем [Г.С.Поспелов и В.А.Ири-
ков, 1976].
Если под технологией в широком смысле слова понимать
программу, т. е. определенную упорядоченность совокупности
работ (операций, действий, мероприятий), связанную с
достижением требуемого результата из определенной исходной
ситуации, то к технологическим мы будем относить системы с
априори заданной технологией. Примерами таких систем могут
служить предприятия с налаженным крупносерийным
производством, транспортные узлы, системы обслуживания и многие
другие.
Само собой разумеется, что технология — это прежде всего,
известная схема деятельности системы. Схема превращается в
конкретный план деятельности путем уточнения характеристик
отдельных (или всех) плановых работ,
В силу сказанного задача управления технологическими
системами сводится, как правило, к задаче обеспечения и
регламентации технологического процесса, т. е., по существу, к задаче
уточнения плана деятельности системы.
О технологических системах можно сказать и иначе.
Технологическая система может выполнять только такие задачи, схемы
решения которых уже найдены человеком, и необходимо только
кое-что уточнить. В этом смысле технологические системы
можно отнести к решателям априори схематизированных задач.
Совершенно иначе обстоит дело с организационными
системами. Они как раз и предназначены решать такие задачи, схемы
8 ГЛ. 1. ОРГАНИЗАЦИОННЫЕ СИСТЕМЫ И РЕШЕНИЯ ЗАДАЧ
решения для которых априори отсутствуют ввиду новизны,
проблемности задач.
Примерами организационных систем могут служить
различного рода управленческие, проектные, конструкторские и другие
подобные организации, коллективы людей и даже отдельный
человек или интеллектуальный робот, решающий какие-либо
интеллектуальные задачи, скажем, шахматные.
Для организационной системы типичный акт поведения
состоит в нахождении ею решений новых задач, с тем чтобы в
дальнейшем обобщить их и в качестве схемы внедрить в
технологическую систему для решения аналогичных задач. В этом
смысле организационную систему следует отнести к решателям
более сложного типа, а именно к решателям проблемных,
априори несхематизированных задач.
Предметом нашего изучения являются системы, включающие
в себя в качестве подсистем организационную и
технологические системы. Примерами таких интегральных систем могут
служить производственные объединения, научные центры,
интегральные роботы и другие.
В дальнейшем мы всегда будем иметь в виду эти спермы и
предполагать, что в каждой из них организационная система
играет роль решающей подсистемы, а реальные технологические
системы — роль исполнительных подсистем, и будем
рассматривать их как некоторые решатели, предназначенные для поиска
решений комплексных задач.
Существуют два направления, характеризуемые
принципиально различным отношением исследователя к изучаемой
системе. При первом, классическом подходе система изучается
как механический объект извне, с точки зрения только
исследователя; система не имеет, собственных целей поведения (эти
цели ставит исследователь), ее поведение описывается в рамках
причинно-следственных связей, например, по схеме
«воздействие — реакция» или по схеме «воздействие — состояние —
реакция». Такой подход известен в литературе как терминальный
подход [Месарович, 1964; Эшби, 1961а].
При втором подходе предполагается, что исследователю
известны некоторые инвариантные аспекты поведения системы,
определяемые ее целями, т. е. исследователь объясняет
поведение системы с точки зрения самой системы. Такой подход
получил название целенаправленного подхода [Рапопорт, 1969].
В соответствии с ним системы, деятельность которых, связанная
о принятием решений, определяется достижением собственных
целей, будем называть целенаправленными решателями.
Качеством, не позволяющим аппроксимировать поведение
целенаправленных решателей в рамках терминального подхода,
является свойственная им внутренняя активность. Наличие соб-
§ i.2. ИССЛЕДОВАНИЕ ЦЕЛЕНАПРАВЛЕННЫХ РЕШАТЕЛЕЙ 9
ственных целей у целенаправленных решателей не
укладывалось в привычные причинно-следственные схемы терминального
подхода; более того, это противоречило, по мнению некоторых
сторонников терминального подхода, материалистической основе
поведения. «Цель, которая должна осуществиться в будущем,
после некоторого действия системы, является причиной этого
действия? — вопрошали они. — Причина позднее, чем следствие?!
Абсурд! Поэтому никакой нели не может быть!»
Но, оставаясь на позициях механистического терминального
подхода, как можно объяснить полную зависимость поведения
целенаправленного решателя от его состоянии и действий
внешней среды, коль скоро его внутренняя, целенаправленная
активность могла подавлять эти воздействия или даже
противодействовать им и, таким образом, приводить к его
непредсказуемому поведению?
Итак, если не фиксировать целенаправленность системы как
некоторого мотиватора ее поведения, то последнее становится
необъяснимым в рамках терминального подхода. «Активность —
важнейшая черта всех живых систем — стала уясняться позже
других, несмотря на то, что, по-видимому, именно эта черта
является самой главной, определяющей. Последнее утверждение
подкрепляется и тем, что активность является наиболее общей,
характерной чертой живых систем и организмов, и еще больше
тем, что постановка понятия биологической активности в
качестве отправной точки ведет к наиболее далеко идущему и
глубокому переосмысливанию тех понятий, которые отживают и
уходят в прошлое вместе со всей платформой старого,
механистического материализма». Так писал об активности известный
советский ученый Н. А. Бернштейн [1968].
Активность целенаправленных систем проявляется прежде
всего в предвидении, в предвосхищении будущих состояний
внешней среды, что позволяет им определять требуемое
поведение более эффективным способом, чем это возможно,
например, на основе использования только принципа обратной связи.
В целенаправленном поведении решателя можно выделить
два аспекта: мыслительную деятельность его решающих органов
и реальную, наблюдаемую деятельность его исполнительных
органов. Первая направлена на поиск решений задач, вторая — на
реализацию этих решений.
§ 1.2. Проблемы исследования целенаправленных решателей
Исследование целенаправленного поведения решателя
ставит ряд проблем. Рассмотрим основные из них и попутно
проследим, как решение этих проблем позволило бы снять
некоторые классические проблемы терминального подхода.
Ю ГЛ. 1. ОРГАНИЗАЦИОННЫЕ СИСТЕМЫ И РЕШЕНИЕ ЗАДАЧ
Уровень описания. Исследователь, вооружепный
аппаратом терминального подхода и стремящийся описать поведение
решателя, вынужден был бы иметь дело с дилеммой: 1) либо
описать поведение решателя достаточно полно па элементарном
уровне, что сделало бы такое описание громоздким, но позволило
бы использовать исходную информацию в простой и доступной
форме — так называемый микроподход; 2) либо описать
поведение решателя на достаточно абстрактном уровне, что
упростило бы описание, но потребовало бы задания исходной
информации в агрегированной, подчас интуитивно неясной форме — так
называемый макроподход.
Однако и микро- и макроописаиия, взятые сами по себе, в
равной степени неудовлетворительны. Первые приводят к
необозримому многообразию линий поведения решателя, к утрате его
структурных черт и целенаправленности, вторые не позволяют
учесть существенные детали, непредвиденно возникающие в
ходе поведения и в корне меняющие его характер. Описание
поведения решателя должно производиться одновременно и
взаимосвязанно на обоих уровнях, точнее, на каждом требуемом
уровне детализации ->- так называемый системный подход.
Природа решений. Существует убеждение, что только
на количественной основе возможно объективное изучение того
или иного явления, факта, события. Однако количественные
описания предъявляют довольно ограничительные требования
к форме и методологии получения числепных решений и в этом,
по-видимому, корень существующих в настоящее время
трудностей терминального подхода, например, проблема
многокритериальной численн-оц оценки.
Однако, коль скоро поведение целенаправленного решателя
весьма существенно зависит от мыслительной деятельности его
решающих органов, то это обстоятельство должно внести нечто
новое в упоминаемые численные решения. На основании
изучения многочисленных результатов по принятию решений
человеком [В. Н. Пушкин, 1965; О. К. Тихомиров, 1969; Г. С.
Поспелов и В. А. Ириков, 1976, и др.] можно утверждать, что
человеку несвойственно мыслить и принимать решения только в
«количествах». Оп мыслит прежде всего в «качествах», для
него поиск решения — это, прежде всего, поиск замысла реше-
пия, и здесь количественные оценки играют вспомогательную
роль.
В ходе решепия задачи решающий орган оценивает ситуации,
при этом их конкретные количественные характеристики
переходят в обобщенные качественные — фаза осмысливания
ситуаций, а при реализации выработанных замыслов решений,
напротив, обобщенные качественные характеристики переходят в
конкретные количественные — фаза выявления и осуществлен
§ 1.2. ИССЛЕДОВАНИЕ ЦЕЛЕНАПРАВЛЕННЫХ РЕШАТЕЛЕЙ Ц
ния требуемых количественных преобразований ситуаций. И в
этом единстве разумно сочетаются преимущества общего и
конкретного. Первые имеют место при выработке рациональных
решений и выражаются в значительном сокращении пространства
поиска возможных решений, вторые имеют место при
реализации решений и выражаются в точной, однозначной их оценке.
Целенаправленность. Математическая теория
оптимального управления имеет дело с задачами следующих двух
типов. Первый тип задач, так называемые задачи с одним
закрепленным концом, характеризуются либо заданием
конкретных исходных данных и требованием получить оптимальный
конечный результат (прямые задачи), либо заданием
конкретного конечного результата и требованием использовать для этого
оптимальные исходные данные (обратные задачи). Для задач
этого типа существование допустимых решений обычно следует
из формулировки самой задачи (неважно, какой результат или
какие исходные данные, лишь бы они были оптимальными).
Поэтому поиск оптимальных решений в таких задачах является
единственной проблемой.
Второй тип задач, так называемые задачи с двумя
закрепленными концами, характеризуются заданием и конкретных
исходных данных, и конкретного требуемого конечного результата.
К этому типу задач можно отнести задачи на перемещение
объекта из одной точки пространства в другую (например,
задача вывода космического корабля в заданную точку). Задачи
второго типа становятся объектом математической теории
оптимального управления только после того, как для них
доказывается существование хотя бы одного допустимого решения.
Таким образом, в теории оптимального управления внимание
акцентируется на оптимальных решениях, при этом проблемы
поиска допустимых решений либо не существует, либо она
считается вспомогательной. Однако при исследовании поведения
целенаправленного решателя для задач второго типа проблема
поиска допустимых решений часто является основной и именно
эти задачи являются типичными для решателя. Если задача
новая, то суть проблемы для решающего органа заключается в
том, чтобы найти хотя бы одно ее допустимое решение. И
только тогда, когда основная проблема решаема и имеется
возможность выбора, решающий орган может ставить задачу
оптимизации по заданному критерию.
Одной из важнейших задач для целенаправленного решателя
должна быть следующая. Заданы цель и средства, необходимо
найти хотя бы одно решение, приводящее к цели с помощью
заданных средств. При такой постановке акцент переносится
с оптимальных решений на допустимые, считая оптимальные
решения проблемой номер два.
12 ГЛ. 1. ОРГАНИЗАЦИОННЫЕ СИСТЕМЫ И РЕШЕНИЕ ЗАДАЧ
Выбор. При терминальном подходе довольно часто выбор
решения носит многокритериальный и поэтому противоречивый
характер. Особенно это характерно для случая, когда
исследователь имеет дело с целенаправленным решателем, а использует
(иначе он и не может) терминальный подход. Вместо того
чтобы найти схему решения для данного класса задач, а затем,
руководствуясь ею, решать конкретные задачи этого класса, он,
возможно, не очень сознавая это, растворяет неизвестную ему
схему решения задачи в пространстве возможных решений
конкретных задач и, вследствие утраты структуры решения,
приходит к многомерному и противоречивому критериальному
пространству.
Многокритериальный выбор при терминальном подходе
возникает тогда, когда, с одной стороны, поведение реального
решателя ради полноты описывается на элементарном уровне и,
о другой стороны, отсутствует конструктивная оценка,
связанная с выявляемой при целенаправленном подходе структурой
(схемой) получаемых конкретных решений.
Традиционная для терминального подхода одноуровневая
процедура выбора решения (и только детального решения)
неэффективна, и ее необходимо расширить. Применительно к
решателю выбор Должен быть связан не с одной, а с целой
системой взаимосвязанных процедур разного уровня. Эта процедура
должна быть прЪдставлена_ как комплексная целенаправленная
стратегия, сбалансированная по критериям и развернутая сверху
вниз по всем решающим органам решателя, а также во времени
[Г. С. Поспелов и В. А. Ириков, 1976]. В такой комплексной
стратегии каждое получаемое одноуровневое решение должно
представлять схему решения для нижележащей задачи.
Поиск. Проблема поиска непосредственно связана с
проблемой описания. Применительно к решателю эту связь можно
характеризовать следующим образом: чем полнее описание
поведения решателя, тем труднее организовать эффективную
процедуру поиска требуемых решений.
Мы уже отмечали, что одиоуровневый выбор решения при
одноуровневом описании поведения реального решателя
неизбежно приводит к многомерному пространству детальных
решений и малой эффективности самого выбора. Попытки же
реализовать эффективные процедуры выбора обычно решаются за
счет упрощения описания, что незамедлительно приводит к
утрате адекватности такого описания.
Выход из порочного круга состоит в замене одноуровневого
поиска решений па многоуровневую комплексную стратегию
поиска. Действительно, приближение к искомому решению путем
построения иерархии одноуровневых решений различной
степени общности позволяет наметить конструктивный метод его по-
§ 1.3. ЧЕМ ИНТЕРЕСУЕТСЯ ТЕОРИЯ?
13
иска: представляется перспективным организовать процедуру
поиска как последовательное построение одноуровневых
решений со все возрастающей степенью детализации. При этом
каждое одноуровневое решение ищется в своем подпространстве,
высекаемом предшествующим, более общим решением.
§ L3* Чем интересуется теория интеллектуальных решателей?
Наличие в решателе людей и их мыслительная деятельность
дают нам основания считать такой решатель интеллектуальной
системой. Построение теории интеллектуальных решателей
предполагает решение двух проблем: 1) описание решателя, . его
знаний и деятельности и 2) построение теории
интеллектуальных решений. Рассмотрим более подробно сущность указанных
проблем.
Если попытаться описать решатель с позиций терминального
подхода, при котором его решающие органы — люди и их
деятельность, связанная со структуризацией знаний и процедур
поиска решений, исключается из рассмотрения и сохраняется
лишь механизм детального описания реальной действительности,
то возникают исключительно сложные, порой принципиально
неразрешимые математические задачи управления. И тем не
менее человек в подобной ситуации находит решения. Очевидно,
он пользуется своим внутренним языком представления знаний,
своими специфичными механизмами поиска решений, что
позволяет ему упрощать модель своего внутреннего мира и
осуществлять с ее помощью эффективный поиск требуемых решений
в тесном взаимодействии с достаточно полно описанной моделью
внешнего мира.
Таким образом, руководствуясь целенаправленным подходом,
исследователь должен предположить наличие в сознании
решающих органов моделей решателя и его среды. «Самый плохой
архитектор от наилучшей пчелы с самого начала отличается
тем,— отмечал К. Маркс,— что прежде чем строить ячейку из
воска, он уже построил ее в своей голове» [К. Маркс и Ф.
Энгельс, соч., т. 23, стр. 189]. Исследователь должен уметь
описывать не только модели решателя и его среды, но и модели этих
моделей, имеющиеся у входящих в решатель решающих
органов — людей.
Если это так, то описание решателя — это в первую очередь
описание закономерностей мыслительной деятельности его
решающих органов при решении ими сложных проблемных задач.
Эта деятельность должна включать процессы осознания
решающими органами ситуаций внешнего мира и совершаемых в
нем действий, а также процессы поиска решепий задач. Таким
14 ГЛ. 1. ОРГАНИЗАЦИОННЫЕ СИСТЕМЫ И РЕШЕНИЕ ЗАДАЧ
образом, описание решателя, его знаний и деятельности должно
включать:
1) описание исполнительных органов решателя;
2) описание внешней среды;
3) описание знаний решающих органов, отражающих их
понимание деятельности исполнительных органов, окружающей
среды решателя и знаний других решающих органов;
4) описание процессов поиска решений предложенных задач.
Отсюда следует, что проблема описания интеллектуальных
решателей требует создания более мощного описательного
аппарата по сравнению с описательными средствами классической
математики. Этот описательный аппарат должен обеспечивать:
1) представление знаний на языке, близком к естественному
языку (т. е. с учетом семантических и прагматических аспектов);
2) возможность описания мыслительной деятельности
решающих органов решателя;
3) возможность органического сочетания количественных и
качественных аспектов в стратегиях поиска решений;
4) системность, т. е. возможность описания деятельности
решателя одновременно на всех уровнях фиксированной иерархии;
5) целенаправленность, т. е. привязку деятельности
решателя к конечному результату — цели деятельности;
6) возможность пЬиска допустимых решений;
7) обучаемость и адаптацию^ решателя в ходе деятельности;
8) эффективный переход к машинно-ориентированным
языкам высокого уровня.
Однако разработка языка, удовлетворяющего вышеуказанным
требованиям, является лишь средством для построения
объектов теории интеллектуальных решателей. В рамках этой теории
необходимо еще исследовать принципы организации
интеллектуальных решателей, фундаментальные свойства их систем
знаний, принципы построения и свойства стратегий и алгоритмов
поиска решений.
Таким образом, в теории интеллектуальных решателей
рассматривается определенный класс интеллектуальных систем,
способных к решению априори несхематизированных задач,
деятельность которых основана на представлении и использовании
знаний этими системами для эффективного поиска решений.
ГЛАВА 2
МЫСЛПТЕЛЬПАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
§ 2.1. Вводные замечания
В нашу задачу не входит обстоятельный анализ различных
концепций психологии мышления. Интересующимся этой
стороной дела мы рекомендуем прочитать соответствующую
литературу, например, [О. К. Тихомиров, 1969]. Для нас более важно
выявить наиболее конструктивные идеи таких представлений, с
тем чтобы в дальнейшем использовать их при построении
модели мыслительной деятельности человека, решающего задачи.
Мыслительная деятельность человека весьма многообразна,
но нас она будет интересовать только в определенном разрезе.
Во-первых, нас не будут интересовать психологические аспекты
мыслительной деятельности, присущие человеку как личности.
Указанные аспекты слишком индивидуальны, и теорий личности,
.как известно, пока не существует. Мы сосредоточим наше
внимание на логических, осознанных аспектах, отражающих общие
закономерности мышления. Во-вторых, нас будет интересовать
-логическое мышление не вообще, а лишь присущее человеку,
решающему задачи.
В первой трети XX века в мировой психологии, особенно в
США, получила широкое распространение чисто поведенческая
концепция мышления. В основе этой концепции лежало
положение о невозможности научного познания внутренних
механизмов процесса мышления человека. Поэтому единственным
объектом исследования для сторонников этой концепции — бихевио-
ристов — являлось внешнее поведение человека. «Никакой
структуры мышления нет, кроме структуры поведения человека,—
заявляли бихевиористы.—... Если нам удается создать
программу, которая моделирует поведение человека достаточно точно
в широком диапазоне ситуаций по решению задач, тогда мы
можем рассматривать эту программу как теорию поведения»
[Ныоэлл, Саймон, 1961].
Такая теория, по мнению сторонников бихевиористического
подхода, будет выполнять относительно мыслительных процес-
16 ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
сов ту же роль, что, например, дифференциальные уравнения
относительно физических процессов. Наиболее яркое отражение
поведенческая модель мыслительной деятельности нашла в
работе [Миллер, Галантер, Прибрам, I960], в которой в качестве
элементарного механизма (поведенческого акта) предлагалась
схема Т-О-Т-Е (Test-Operate-Test-Exit), а все поведение
представлялось как определенным образом организованная иерархическая
структура схем Т-О-Т-Е.
Поведенческая модель мыслительной деятельности породила
и так называемую лабиринтную схему поиска решений.
Согласно этой схеме процесс поиска начинается с порождения (или
задания) лабиринта возможностей, для избирательного перебора
которых используются эвристики*). Лабиринтная схема такова:
исходная ситуация — порождение (возможно, по частям) полного
лабиринта возможностей — усечение лабиринта — выбор
решения.
Существует большой класс задач, решение которых может
быть описанр лабиринтной схемой (часто потому, что мы иначе
и не умеем). Это, например, доказательство теорем в формальных-
системах, сетевое и другие комбинаторные задачи. В
подавляющем большинстве" задачиг практической сложности, если
придерживаться бихевиористического подхода, представляются огром-
пым лабиринтом, исследование которого не под силу не только
человеку, но и современным ЭВМ. К таким задачам можно
отнести, например, шахматные задачи.
Таким образом, если придерживаться лабиринтной схемы, то
получалось, что (при наличии искомого, но априори
неизвестного решения задачи) все творчество человека, весь его разум
сводился, как указывал еще Эшби [Эшби, 1952, 1961 б], к умению
отбирать. Такое представление мыслительной деятельности в
60-е годы стало подвергаться критике, особенно со стороны
советских психологов [В.Н.Пушкин, 1965; О.К.Тихомиров, 1969].
Анализ психологических экспериментов, проведенных ими,
показал, что для человека, решающего задачу, часто не существует
огромного лабиринта, как не существует и четкого задания
искомой, целевой его площадки. Человек оказывается не в
состоянии решать задачи, если поиск цели приводит к анализу
сложных лабиринтов. Такие задачи он либо передает ЭВМ (она с
ними лучше справляется), либо ищет другие пути решения этой
вадачи.
Поведенческая модель мыслительной деятельности едва ли
вызывала бы сомнения, если бы речь шла о том, чтобы
построить теорию чисто внешнего поведения человека. Однако
*) Понятие эвристики и ее роль в мыслительной деятельности
рассмотрены ниже в § 2.3.
§2.1. ВВОДНЫЕ ЗАМЕЧАНИЯ
17
этого оказалось явно недостаточно для объяснения
целенаправленного, мотивированного поведения, которое в значительной
степени определяется именно внутренними отражательными
процессами человека. Поэтому эвристические программы, бази-
рующдеся на поведенческой модели мыслительной деятельности
и претендующие на роль основы теории мыслительпой
деятельности, как будет показано в § 2.6, еще далеки от
действительных процессов мышления.
Неудовлетворительность поведенческой модели усилила
внимание ученых к изучению внутренних механизмов мыслительной
деятельности, другими словами, к изучению ее внутренней
структуры. Здесь в первую очередь следует отметить
физиологический подход, основанный на моделях нейронного типа.
Дальнейшее развитие этого подхода привело к возникновению целого
научного направления, получившего наименование нейрокибер-
нетики [С. Н. Брайнес, А. В. Напалков, В. Б. Свечинский, 1962;
Розенблатт, 1962].
Однако нейрокибернетические модели мыслительной
деятельности создали большие проблемы, связанные с недостаточным
знанием сложной природы нейронов и со сложностью их
экспериментального изучения. С другой стороны, такие привычные
для человека понятия, как «смысл», «цель», «внутренний мир»
и другие, плохо интерпретировались в виде каких-то особых
физиологических состояний нейронной сети" Поэтому многими
сторонниками физиологического подхода были сделаны
пессимистические выводы о невозможности в ближайшем будущеж
подойти к моделированию сложных психологических функций
человека вообще и мыслительной деятельности в частности.
В конце 50-х годов возник другой, так называемый
информационный подход к исследованию мыслительной деятельности
[Фейгенбаум и Фельдман, 1963]. Сторонники информационных
моделей мыслительной деятельности утверждали возможность
разложения сложных форм мышления на элементарные
информационные структурные единицы и тем самым возможность
синтеза различных сложных форм из этих единиц.
Информационный подход оказался более плодотворным. Его
преимущества перед физиологическим подходом заключались в
том, что апализ механизмов мышления базировался па
элементарных информационных процессах, в то время как нейроны
представлялись композицией автоматов разных типов с разными,,
часто неясными алгоритмами работы. В настоящее время
информационный подход получил широкое распространение и
представляет собой одну из фундаментальных основ
программирования мыслительной деятельности.
Представляет интерес отметить еще один подход к изучению
мыслительной деятельности, свойственный гештальт-психологии*
2 Е. И. Ефимов
18 ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
Сторонники этого направления утверждали, что в основе
мышления лежат не какие-то элементарные процессы, а некоторые
структуры, некоторые целостные образы (гештальты), что эти
образы как целое не могут быть разложены на части и
обладают своими качественно специфичными свойствами, не
сводимыми к свойствам их частей.
Нетрудно заметить, что в современном понимании это
системный подход к исследованию мышления, но совершенно
исключающий возможности анализа. Процесс мышления
представляется гештальт-психологами как скачкообразный переход от
одного образа к другому. Безусловно, целостные структуры
играют большую роль в мыслительной деятельности (см. §§ 2.3,
2.4), но слабость гештальт-психологии заключалась в том, что
она не смогла объяснить, как меняется образ, как из частей
складывается целое и как целое распадается на части.
Возвращаясь к лабиринтной схеме и учитывая важность
образования целостных образов в мыслительной деятельности,
можно считать, что человек в первую очередь стремится создать
целостный образ 'исходной ситуации и тем самым ограничить
полный лабиринт \ возможностей, а уж затем найти, требуемое
решение в полученном таким образом небольшом лабиринте.
Итак, в проблеме разумного усечения полного лабиринта осг
новное внимание надо сосредоточить не на эвристиках, как
утверждают сторонники лабиринтной схемы, а • на механизмах
структуризации, целостного описания исходных и текущих-
ситуаций. Указанные механизмы, как утверждают противники
лабиринтной схемы, к числу которых принадлежит и аатор,
человек реализует с помощью некоторой внутренней модели,
позволяющей человеку структурировать окружающий его мир,
выявлять существенные отношения между фактами и событиями.
Это дает возможность человеку ограничиваться каждый раз
анализом не всех находящихся в поле его зрения объектов, а*
только тех, которые имеют непосредственное отношение к
данной задаче. В результате зона поиска требуемых решений
сокращается, подчас буквально до единственного варианта решения.
Так возникла семиотическая концепция мышления [Д. А.
Поспелов, В. Н. Пушкин, В. Н. Садовский, 1967]. Согласно этой
концепции поиск решения осуществляется по следующей схеме:
исходная ситуация — структурирование ситуации (создание
целостного образа) — порождение усеченного лабиринта — выбор
решения» По семиотической кониепиии мышления вначале
путем структуризации исключаются несущественные детали
исходной ситуапии, а затем строится лабиринт небольшой
размерности, в то время как по поведенческой концепции мышления
вначале строится полпый лабирипт, учитывающий
несущественные детали, а затем он сокращается с помощью эвристик.
§ 2.2. ПРОБЛЕМНАЯ СИТУАЦИЯ
1$
§ 2.2. Проблемная ситуация
В психологической литературе мыслительную деятельность,
связанную с творческим решением задач, называют эвристической,
а обстановку, в которой развертывается эвристическая
деятельность, называют проблемной ситуацией. Вот как, например,
характеризовал эвристическую деятельность известный советский
психолог В. Н. Пушкин [1965]: «Перед человеком нередко
возникают такие ситуации, когда обнаруживается конфликт между
условиями и требованиями какой-нибудь деятельности...
Наличные условия не подсказывают ему способа решения и весь
арсенал прошлого опыта не содержит никакой готовой схемы.
Необходимо 'создать новую, не имевшуюся у него ранее
стратегию деятельности, т. е. совершить акт творчества. Такую
ситуацию называют проблемной ситуацией, а психологический
процесс принятия решения — эвристической деятельностью.
Эвристическую деятельность следует рассматривать как такую
разновидность, человеческого мышления, которая создает новую
систему действий или открывает некоторые неизвестные ранее
закономерности окружающих человека объектов».
Довольно обстоятельный анализ основных психологических
моделей цроблемных ситуаций и механизмов регуляции действийг
в них мы находим в материалах симпозиума «Основные
подходы к моделированию психики и эвристическому
программированию [А. Н. Матюшкин, 1968]. Суть этого анализа сводится к
следующему:
1. Поведенческая модель является одной из'первых и
наиболее распространенных моделей проблемных ситуаций. Эта
модель возникла в рамках бихевиористической психологии. Главное
в этой поведенческой модели состоит в том, что проблемная
ситуация возникает тогда,, когда субъект не может
непосредственно достигнуть поставленную перед ним цель из-за наличия
препятствия между ним и целью. Решение проблемы
заключается в преодолении препятствия или в обнаружении обходного
пути. Наиболее очевидной экспериментальной моделью понятия
«препятствие» может служить лабиринт.
2. Гештальт-модель также является достаточно
распространенной моделью проблемной ситуации. По этой модели
проблемная ситуация возникает из-за «неструктурированности»
предмета мышления. Типичными ситуациями этого типа являются
ситуации на понимание, в которых человек должен найти
некоторое отношение, определяющее нужную структуру. Если в
проблемных ситуациях первого типа решение заключается в
том, чтобы найти новый способ действия, то в проблемной
ситуации второго типа человек должен найти свойство, отношение,
8акон, составляющие принцип действия. Нахождение нового^
2*
20 ГЛ. 2 МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
принципа действия и составляет собственно «структурирование»;
предмета мысли.
3. Вероятностная модель проблемной ситуации исходит из
понимания мышления как некоторого вероятностного процесса,
осуществляющего выбор нужного действия из числа заданных
по вероятностному закону. Вероятностная модель проблемной
ситуации является своего рода развитием, а вместе с тем и
вырождением поведенческой модели. В качестве препятствия
здесь выступает альтернатива между возможными способами
действий. Дальнейшее развитие поведенческой модели
заключается в конкретизации отмеченного ранее препятствия, в
приведении лабиринта к специальной форме манипулятивно-логиче-
ских головоломок. Вырождение же заключается в том, что теперь
модель по существу не предполагает участия в данной
проблемной ситуации человека, который заменяется устройством,
выполняющим преобразования по заранее заданному закону.
Важнейшее значение этой модели состоит в том, что она доведена до
уровня технической модели, реализующей многие современные
сложные акть!( управления, осуществляемые «думающими»
устройствами.
4. Информационно-семантическая модель предполагает, что
проблемная ситуация возникает в результате потребности в
новой информации, необходимой для выполнения действий.
Центральным отношением в информационной модели является
отношение между известной (наличной) информацией и требуемой
новой информацией.
В ходе разрешения проблемной ситуации возникают
различного типа рассогласования и нарушается взаимодействие
отдельных механизмов. В этой связи можно выделить следующие
механизмы регуляции действий [А. Н. Матюшкин, 1968].
Первый, наиболее известный механизм регуляции связан с
проблемной ситуацией, возникающей в результате
рассогласования между реально достигаемым и требуемым, прогнозируемым
результатом действия. Этот тип рассогласования возникает на
конечном этапе решения. Для управления в таких проблемпых
ситуациях используется механизм обратной связи.
Второй механизм регуляции связан с рассогласованием,
которое возникает до достижения человеком необходимого результат
та и выявляется путем прогнозирования возможного ошибочного
результата действия. На основе прогноза самим субъектом
обнаруживается несоответствие используемого и требуемого в данной
ситуации способа действий. Довольно часто именно в ситуациях
данного типа возникает стремление субъекта к поиску другого
способа действий, необходимого для достижения нужного
результата. Перебор способов решения задачи как путь ее решения —
наиболее типичный случай для дапного механизма регуляции.
§ 2 3. ОПИСАНИЕ МЫСЛИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ 21
Этот механизм регуляции достаточно широко используется в
современном эвристическом программировании.
Третий механизм регуляции возникает в результате
выявления несоответствия между принципом действия п новыми
условиями его выполнения.
В самом общем случае разрешение проблемной ситуации
включает все три отмеченных типа регуляции: от обнаружения
несоответствия результата действия до последующего
обнаружения несоответствия способа достижения этого результата.
§ 2.3. Описание мыслительной деятельности
Если мы собираемся построить модель мыслительной
деятельности человека, решающего задачи, нам необходимо иметь
описание этой деятельности как некой объективной реальности. Для
большей объективности хотелось бы иметь описание
мыслительной деятельности при решении задач различной природы. Для
этого мы вновь обратимся к литературным источникам. В какой-
то мере изложение существа мыслительной деятельности на
примере шахматных задач дано в работе О. К. Тихомирова [1969].
Существо мыслительной деятельности в абстрактной среде
излагается известным математиком и педагогом Пойа [1962].
Ниже с несущественными изменениями приводится описание
мыслительной деятельности по О. К. Тихомирову.
Шахматы есть частный случай мыслительной деятельности,
связанной с необходимостью выбора конкретного практического
действия в конкретной ситуации на основе изучения
особенностей этой ситуации. Практически подобный выбор включен во
все. виды человеческой деятельности. Оказалось, что наиболее
типичным случаем является «проигрывание» испытуемым
определенных действий в данной ситуации. Это еще не практические
действия (не они, возмояшо, войдут в искомое решение), это
не есть в то же самое время чисто внутренние («умственные»)
действия. Это есть исследовательские действия, осуществляемые
не только по отношению к наличной ситуации, но и по
отношению к возможной в будущем ситуации. Посредством
исследовательских действий устанавливаются взаимодействия между
элементами ситуации, в ходе которых выявляются признаки
элементов, недоступные непосредственному чувственному отображению,
что дает нам основания рассматривать такие действия как
выражение собственно интеллектуального поведения испытуемого,
решающего определенную задачу.
Все виды исследовательской деятельности — проигрывание
определенных возможностей элементов на разную глубину,
выявление взаимодействий между элементами имеющейся и
возможной в будущем ситуации, объединение элементов в комплек-
22
ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
сы или системы, сопоставление различных элементов по
выявленным характеристикам — совершаются на разных этапах
деятельности по решению задачи. Они зависят от стоящей перед
испытуемым задачи, отражают природу этой задачи и
выполняют функцию поиска решения задачи. Анализ этого
исследовательского поведения и есть собственно анализ интеллектуальной
деятельности по решению задачи.
Важным обобщенным показателем этой работы является зона
ориентации в данной конкретной ситуации. Объем зоны
выражается числом ее элементов, обычно меньшим общего числа
элементов ситуации, и меняется при переходе от одной
ситуации к другой.
Как показал анализ, формирующиеся гипотезы о
предстоящих изменениях ситуации составляют важнейший .механизм,
функционирование которого осуществляет регуляцию степени
развернутости поискового процесса в целом: при совпадении
очередного^ изменения ситуации с гипотезой об этом изменении
поиск сильно сокращается, а при несовпадении сильно
развертывается. Следовательно, сравнение фактического изменения
ситуации с ожидаемым играет роль конкретного психологического
механизма регуляции объема зоны ориентации.
Вторым важным механизмом является деренос результатов
исследовательской деятельности из одной ситуации • в другую.
Группы ситуаций начинают оцениваться исследователем как
нечто единое целое, а реально развертывающаяся
исследовательская деятельность относится фактически сразу к этой группе
ситуаций.
Применяется тактика неоднократного переобследования
одних и тех же элементов ситуации, осуществляемого путем
включения одного и того же элемента в различные системы
взаимодействий. В результате многочисленных исследовательских
действий один и тот же элемент ситуации оценивается по-разному
исследователем на разных этапах периода, предшествующего
выбору одного практического действия.
Остановимся на вопросе о том, что же представляет из себя
та особая форма отражения объекта, которая является
результатом различных исследовательских действий субъекта и которая
меняется по ходу решения одной и той же задачи. Это не есть
перцептивный образ, ограниченный отражением чувственных
признаков; это не есть понятие об элементе, фиксирующее
устойчивые, внеситуационные признаки элемента, например его
абсолютную ценность; это не есть объективное ситуационное
(меняющееся в зависимости от ситуации) значение элемента,
так как из «поля» объективных значений поисковыми актами
выделяются лишь некоторые характеристики этого значения
элемента.
§ 2.3. ОПИСАНИЕ МЫСЛИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ 23
Объем анализируемой зоны (зоны ориентации) в ходе
решения одной задачи может неоднократно меняться. Резкое
уменьшение количества элементов, являющихся объектами
деятельности испытуемого, сопровождается и качественным изменением
характера устанавливаемых взаимодействий: они становятся
более определенными, направленными и избирательными. В
деятельности появляется определенное доминирующее
взаимодействие элементов. Анализируя такие доминирующие
взаимодействия, можно выяснить, что они представляют собой
осуществление некоторых реальных возможностей определенных
элементов ситуации, которые затем могут быть приняты в
качестве реального практического действия. Имеет место как бы
предрешение задачи, которое можно назвать по-разному:
возникновение гипотезы о решении, нахождение принципа решения
или формирование цели дальнейших действий.
Такую специфичную форму отражения объекта субъектом
называют операциональным смыслом объекта. На основе
анализа операционального смысла объекта может быть найден
объективный признак появления у исследователя гипотезы
относительно возможного решения задачи, а именно установление
взаимодействия между элементами, носящего характер проигрывания
возможного в данной ситуации действия, и сокращающего поиск,
придающего ему направленный, избирательный характер.
До возникновения гипотезы и после ее установления сначала
проигрываются взаимодействия, связанные с преобразованием
возможных в будущем ситуаций, и только затем намечаются
преобразования наличной ситуации. Выявляется наличие в
ситуации элементов, обладающих определенным свойством. Такого
рода функциональные взаимодействия создают необходимость в
элементах г с определенными свойствами, что в свою очередь
порождает поисковую потребность.
Механизм' создания поисковых потребностей и последующее
нахождение элементов и их действий, удовлетворяющих эту
потребность, являются важнейшим звеном всего процесса решения
задачи. Процесс решения задачи протекает по крайпей мере
в три этапа: формирование поисковой потребности, нахождение
действий, удовлетворяющих эту потребность («предрешение») или
гипотеза решения задачи), и, наконец, окончательное решение,
представляемое в виде совокупности выбранных действий. На
каждом этапе возникают и меняются конкретные цели
исследовательской деятельности: то, что на определенном этапе
рассматривалось в качестве средства деятельности по достижению
некоторой цели, в дальнейшем может выполнять функцию новой
цели. Таким образом, один из путей формирования целей
состоит в преобразовании средств в цели. Формируемость конкретных
целей, динамические преобразования средств в цели, поиск
24 ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
конкретных действий через механизм создания поисковых
потребностей — все это и составляет «человеческое» в эвристике
«анализа отношений средств к цели».
Одним из основных механизмов регуляции поисковой
деятельности является механизм сравнения очередных изменений
ситуации с ранее сформированными гипотезами об этих
изменениях. При совпадении поиск сильно сокращается, при
несовпадении значительно развертывается.
Кроме относительно самостоятельных механизмов сравнения
изменений ситуации с соответствующими гипотезами и
прогнозирования будущих изменений в мыслительной деятельности
может быть также выделен специальный механизм планирования
собственных действий. Сформированный из этих действий план
собственных действий в игре является одним из существенных
факторов сокращения поиска возможных действий противника.
Механизмы сравнения, прогнозирования изменений ситуации
и планирования собственных действий выступают как' такие
функциональные механизмы (эвристики), которые регулируют
протекание поиска/решения задачи.
Эвристики — эт(о специальные функциональные механизмы, с
помощью которых шроисходит сокращение'перебора при поиске.
Они могут быть сформированы субъектом до начала решения
конкретной задачи или формироваться по ходу ее решения. Для
решения достаточно сложных задач характерно не только
образование, но и смена (иногда неоднократная) эвристик. Смена
эвристик составляет одну из характерных черт наиболее
сложных форм творческого мышления.
Отмеченные ранее этапы процесса решения задачи сами по
себе имевдт довольно сложную структуру. Так, например, этап
нахождения гипотезы решения может включать обследование
ситуации, формирование конкретных попыток решения,
переобследование ситуации при недостижении цели, новые
попытки и т. д.
Первичное обследование ситуации включает в себя две фазы:
ознакомление с конкретным составом элементов в ситуации и
их пространственным расположением — собственно пе[ цептивная
деятельность и установление функциональных взаимодействий
между определенными элементами ситуации. В результате
наряду с объективным значением ситуации (множество
различных функциональных взаимодействий) выделяется
операциональный смысл этой ситуации для испытуемого, который
определяет область, направление последующих попыток решения
задачи.
Конкретная попытка решения вадачи характеризуется
четкой последовательностью проигрываемых возможных
преобразований ситуации для достижения заданного результата. Каждая
§ 2.3. ОПИСАНИЕ МЫСЛИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ 23
попытка приводит к определенному результату — к
определенным взаимодействиям в конечной ситуации, что и определяет
ее предназначение. Последующая деятельность испытуемого
оказывается фактически связанной именно с этим взаимодействием
элементов, осуществляется ради его реализации. Именно поэтому
взаимодействие элементов рассматривается как операпиональныи
смысл или замьГсел данной попытки.
Выявленный при проигрывании попытки непредусмотренный
ранее результат начинает выполнять функцию замысла по
отношению к последующей попытке. Замысел очередной попытки
может формироваться в процессе осуществления предыдущей
попытки и являться основой взаимосвязи отдельных попыток
решения задачи.
Таким образом, каждая структурная единица анализа —
элемент ситуации, конкретная попытка решения, обследование
ситуации в целом — характеризуется не только через их
объективное значение, но и через тот операциональный смысл, который
они приобрели для испытуемого, т. е. имеет место целая
иерархия смысловых образований.
После серии попыток отмечается особый период
переобследования, имеющий свой замысел и свой результат — новый
обогащенный смысл ситуации, который определяет последующую
серию попыток. В ходе решения конкретной задачи происходит не
только развитие смыслов отдельных элементов, но и развитие
смысла ситуации в целом.
Исследования О. К. Тихомирова относятся к мыслительной
деятельности человека, решающего задачи в некотором
физическом мире, в данном случае — шахматном. А как человек решает
математические задачи? На этот вопрос дает ответ Пойа,
который мы и приводим ниже на примере доказательства
геометрической теоремы.
Формулировка задачи (теоремы). Если прямая
проходит через точку пересечения двух данных прямых,
расположенных в одной плоскости, и перпендикулярна им обепм, то
она перпендикулярна и любой третьей прямой, расположенной
в. той же плоскости и проходящей через указанную точку
пересечения.
При решении этой задачи (доказательство теоремы) нас
будет интересовать мыслительная деятельность человека,
доказывающего теорему. Ход его размышлений мы будем фиксировать,
с одной стороны, геометрическими построениями и, с другой
стороны, соответствующими этим построениям графами,
отображающими ход доказательства.
Процесс доказательства. Итак, нам дано: (2) P0-L'
-J- ОА, (3) РО -L ОВ и (4) О А и ОБ лежат в одной плоскости.
Необходимо доказать, что (1) PO-LOC (см. рис. 2.1, а).
26
ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
Рис. 2.1, б надо понимать следующим образом. Верхняя
вершина 1 графа выражает утверждение (1), которое надо
доказать; нижние вершины 2—4 выражают исходные данные (2) —
(4) для доказательства. Между отмеченными вершинами
существует разрыв, ваполпение которого и будет отражать процесс
доказательства. Таким образом, процесс доказательства будет
1oPOlOff
г*
WLOA
Л
ОАаОВ
в'одной,
плоскости.
V
POLOB
б)
Рис. 2.1. Исходные данвые геометрической задачи на доказательство.
представляться как последовательное сближение имеющихся
данных путем преобразования исходных данных и искомого
утверждения.
Рассмотрим этапы доказательства.
1. Д в и ж е н и е от конца к началу. В чем состоит
заключение? В том, что РО JL ОС, т. е. угол РОС — прямой.
Какой угол называется прямым? Прямой угол — это такой уголт
который равен своему смежному. Воспользуемся этим
обстоятельством и продолжим отрезок ОР за точку О до точки Р' такг
чтобы (7) ОР=ОР'. Итак, (5) ^РОС - ^ Р'ОС*). Чтобы
доказать (1), нам надо доказать (5). Но доказательство равенства
углов часто основывается на доказательстве равенства
треугольников. В нашем случае мы могли бы доказать требуемое
заключение (5), если бы нам удалось доказать, что (6) &РОС =
г= АР'ОС. Для доказательства (6) можно воспользоваться
равенством соответствующих сторон треугольников. Стороны РО и
Р'О равны по построению (7), равенство (9) ОС— ОС очевидно.
Следовательно, для завершении доказательства достаточно было
бы доказать (см. рис. 2.2), что (8) РС^Р'Сщ
*) Вершины графа, соответствующие равенствам, па рисунках
помечены символами левых частей этих равенств.
§2 3. ОПИСАНИЕ МЫСЛИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ 27
2. Изменение формулировки задачи. Обратим
теперь внимание на исходные данные теоремы. Нам нужно
придать им такую форму, которая лучше гармонировала бы с
измененным заключением (5). Аналогично переходу от (1) к (5)
перейдем от (2) и (4) к (10) *-РОА = l-Р'ОА и (И) ^РОВ =
-= г-Р'ОВ.
3<
О А и О В
в одной,
плоскости
а)
Ф
V
*4
РОШ
Рис. 2.2. Движение от конца к началу.
Теперь пам нужно добавить к измененным исходным данным
еще один существенный пункт, а именно, что три несовпадающих
отрезка ОА, О В и ОС лежат в одной плоскости. Кроме того,
его нужно в дальнейшем как-то связать с заключением. Точки
А, В и С можно расположить на одной прямой, не проходящей
через точку О — утверждение (12), и это может оказаться
полезным (здесь возникает догадка, проявляется
изобретательность).
Таким образом мы получаем рис. 2.3.
3. Движение от начала к концу. Так щк (10)
4-РОА = £-Р'ОА по предположению, (7) РО =Р'0 по
построению и (13) ОА=ОА само собой разумеется, то (14) &РОА =
= АР'ОЛ, откуда следует, что (15) РА=Р'А. Рассуждая
аналогично, находим (16) ОВ = ОВ, (17) &РОВ = &Р'ОВ и (18)
РВ = Р'В (см. рис. 2.4).
4. Движение в обоих направлениях. Искомое
утверждение (8) РС^Р'С (см. рис. 2.3) можно вывести на
28
ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
/QP010O
s\lpoc
бк^РОС
POST SOPC ^оОС
L РОА oW 12 Q А, В, С ш Щ1_Р0В
\ на одной I
J о прямой о 4
2<
Р010А
ОАиОВ
в одной,
плоскости,
в)
Рис. 2.3. Переформулировка задачи.
POIOB
1oP0L0d
s\lpoc
oLaPOO
Рост ЗЬрс ^о0О
15 ' 18
РАО орв
АРОЩ£ ро ? jAAPOB
lpoavo ~Ц£%Ь ftktm
2Ь зъцрялюй Ъ4.
РОШ ОАиОВ Р010В
водной
плоскости
Рис. 2.4. Движение от начала.
§ 2.3. ОПИСАНИЕ МЫСЛИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ 29
основании равенства треугольников (эта часть решепия связана с
продвижением от конца к началу). В самом деле, из ранее
найденных соотношений (15) РА =Р'А и (18) РВ^Р'В и
очевидного равенства (19) АВ =АВ легко установить (20) &РАВ =
= &Р'АВ (см. рис. 2.5). Здесь мы продвигаемся от начала к
к концу. Однако это не та пара треугольников, которая нам
нужна. Чтобы получить (8) (которым заканчивается
доказательство), мы могли бы исходить, папример, из равенства
треугольников (21) &РАС = &Р'АС, которое было бы справедливо в
POLOA OAuOB POL Olf
в одной
-плоскости.
Рис. 2.5. План решепия геометрической задачи на доказательство.
силу доказанного утверждения (15) РА =Р'А и очевидного
равенства (22) АС=АС, если бы только дополнительно мы
доказали, что (23) £.РАС = <£-Р'АС. Пока же, учитывая (20)
ДРА5=ДР'А5, в справедливости которого мы уже убедились,
мы можем быть уверены лишь в том, что (24) *-РАВ = Р'АВ
(см. рис. 2.5). Но так как по предположению (12) точки Л, В
и С лежат на одной прямой, то ^РАВ^^РАС и (23) *-РАС=*
«= £-Р АС. Этим замечанием мы окончательно ликвидируем
разрыв между доказанным и доказуемым (см. рис. 2.5).
На этом можно закончить описание мыслительной
деятельности человека, решающего различные задачи, и перейти к
анализу этой деятельности»
30 ГЛ 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
§ 2.4. Анализ мыслительной деятельности
Рассмотрим описанную в § 2.3 мыслительную деятельность
со следующей точки зрения. Во-первых, нам необходимо
выяснить, что представляет из себя задача и ее решение. Во-вторых,
нам необходимо выделить основные механизмы мыслительной
деятельности и характерные ее особенности. Если нам это
удастся, то тем самым будут созданы предпосылки для
разработки конструктивной модели мыслительной деятельности
человека, решающего задачи.
Итак, проблемная ситуация — новая, несхематизированная
задача, т. е. задача с априори неизвестной схемой решения.
Согласно определению В. Н. Пушкина (см. § 2.2) всякая такая
задача характеризуется «наличными условиями и требованием
какой-нибудь деятельности». Сопоставляя это определение с
математическим понятием «задача», можно установить, что
«наличные условия» представляют собой исходные данпые и
требуемый результат, а «требование какой-нибудь деятельности»
выражает, во-первых, потребность в решении задачи
(проблемная ситуация потому и (является задачей, что ее надо решать)
if, во-вторых, указывает щ* отсутствие известной схемы решения.
Так, в рассмотренной вышё^ геометрической задаче исходные
данные — это утверждения (2\— (4), а требуемый результат —
истинность утверждения (1).
Что же представляет собой решение задачи? Очевидно,
мыслительная, эвристическая деятельность человека, решающего
задачу, является лишь инструментом, используя который, он
получает решение, присущее самой задаче. Здесь необходимо лишь
отметить два существенно различных понятия: решение как
результат и решение как упорядоченная совокупность действий,
умозаключений и т. п.
Решение как результат является понятием, соотнесенным с
определенным моментом времени. В шахматной игре такое
решение может представлять матовую позицию, в геометрической
задаче Пойа — истинность доказываемого утверждения.
Указанное толкование понятия решения задачи ничего не добавляет
нового к описанию задач, так как результат сопоставляет лишь
часть наличных условий, о которых речь шла выше.
Гораздо больший интерес представляет решение как
совокупность действий. С одной стороны, такое решение показывает
яак человек приходит к требуемому результату, используя
исходные данные. С другой стороны, такое решение приобретает
и самостоятельное значение как основа для получения в
будущем схемы решения класса аналогичных задач. Именно в этом
последнем смысле и следует понимать «новую систему
действий» в определении В. Н. Пушкина. В дальнейшем мы всегда
§ 2.4. АНАЛИЗ МЫСЛИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ 31
будем понимать иод решением задачи искомую упорядоченную
совокупность действий, умозаключений.
Итак, решение новой задачи — это априори неизвестная
система действий, которая позволяет перейти от исходных данных
к требуемому результату. В шахматной задаче это
последовательность ходов противников, приводящая к мату; в геометрической
задаче Пойа это последовательность умозаключений, т. е.
доказательство, сопровождаемое для наглядности геометрическими
построениями.
Таким образом, мы установили, что задача полностью
определяется тремя компонентами: исходными данными, требуемым
результатом и решением.
Из вышеприведенных описаний мыслительной деятельности
(см. § 2.3) сйедует, что это есть исследовательская деятельность,
направленная на выбор конкретного действия в конкретной
ситуации. Эта деятельность, что особенно важно, включена во все
виды человеческой деятельности. Отметим, что в ходе поиска
решения задачи человек оперирует со знаками, в которые
вкладывает определенную семантику (например, знак А — это
треугольник, а знак (группа символов) ПЕРЕДВИЖЕНИЕ — эта
действие) и которые приобретают тот или иной прагматический
или операционный смысл в зависимости от целевой
направленности деятельности.
Мыслительная деятельность опирается на знания и поискг
Структурными единицами знаний являются понятия,
доказательные (теоремы) и правдоподобные (интуитивно истинные,
истинные по жизненному опыту) рассуждения, утверждения иг
стереотипные процедуры. Стереотипы обычно относят к
актуальным знаниям, остальное — к факту ал ьным знаниям. Эти
структурные единицы мы будем называть фреймами [Минский, 1974].
Примерами фреймов являются понятие «треугольник»,
доказательное утверждение о равенстве треугольников по двум
сторонам и углу между ними, правдоподобное утверждение «дети
наследуют характер родителей», стереотипная процедура заказа
авиабилета.
Важными составляющими целенаправленной поисковой
деятельности являются эвристики *). Примерами эвристик могут
служить эвристика стратегии «цель — средства», эвристика
сравнения планируемых и реальных результатов, эвристика переноса
результатов исследовательской деятельности из одной ситуации
в Другую и т. д.
Особое место в знаниях занимают стереотипные процедуры.
По сути дела, это элементарные задачи, т. е. задачи с известной
*} Понятие эвристик было дапо на стр. 24.
32 ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
схемой решения. Поиск решения неизвестной задачи в конце
концов сводится к попытке представить искомое решение в виде
упорядоченной совокупности элементарных задач. Однако
указанное решение находится не сразу, а с помощью своеобразного
мостика — типовых задач, обычно используемых в для решения
задач из данного класса. Конкретное решение (в виде
последовательности элементарных задач) типовых задач априори не
фиксировано, так как оно каждый раз свое и определяется
конкретной ситуацией. Так, типовой задачей в шахматах можно
считать образование проходной пешки, однако конкретное
решение этой задачи может быть разным.
Итак, мы приходим к следующему варианту схемы поиска
решения исходной задачи: 1) формирование ее решения в виде
упорядоченной совокупности типовых задач (подзадач), 2)
формирование конкретного решения каждой типовой подзадачи в
виде последовательности/Элементарных задач. Первая фаза,
очевидно, представляет нахождение гипотезы или схемы решепия,
вторая фаза — подтверждение этой гипотезы.
Наличие подзадач и ^элементарных задач свидетельствует
об иерархической структуре поиска. Подзадачи могут быть
отнесены к стратегическому уровню, элементарные задачи— к
тактическому уровню. В соответствии с этой иерархией
вкладывается различный смысл в поисковую потребность, в оценку
ситуации, в попытку решения и т. д. Так, на стратегическом
уровне поисковая потребность инициируется требуемым
результатом очередной рассматриваемой подзадачи, а ее
удовлетворение представляет нахождение требуемых исходных данных этой
подзадачи в исходной ситуации.
Как требуемый результат, так и исходные данные подзадачи
обычно представляются совокупностями элементов ситуации,
связанными определенными отношениями. Эти элементы
составляют зону ориентации, а отношения между ними обычпо
выявляются в результате осмысливания ситуации и недоступны
непосредственному чувственному восприятию. Такие
совокупности определенным образом связанных элементов мы будем
называть смысловыми структурами. На стратегическом уровне
каждая ситуация оценивается с точки зрения содержания в ней
известных смысловых структур элементов. Например, в
шахматной игре такие смысловые структуры выражаются понятиями
«мат», «изолированная пешка», «вилка» и т. д.
Попытка решения на стратегическом уровне представляет
гипотезу решения. Так, в шахматах гипотеза решения задачи
выигрыша может выглядеть следующим образом: «образовать
проходную пешку, провести пешку в ферзи, осуществить
стереотипную процедуру постановки королем и ферзем мата
королю противника».
§ 2.4. АНАЛИЗ МЫСЛИТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ
33
На тактическом уровне решается заданная (с помощью
гипотезы решения) отдельная подзадача. Поэтому здесь поисковая
потребность инициируется требуемым результатом
соответствующей элементарной задачи, а ее удовлетворение представляет
собой нахождение требуемых исходных данных этой
элементарной задачи. И то и другое обычно связано с одним элементом и
с определенными его свойствами (перцептивный образ элемента).
Следовательно, на тактическом уровне каждая ситуация
оценивается с точки зрения содержания в ней элемента с
необходимыми свойствами (само собой разумеется, что этот элемент
находится в зоне ориентации, связанной с заданной подзадачей и
меняющейся в ходе ее решепия). Так, при решении подзадачи
«образовать йроходную пешку» может потребоваться решить
элементарную задачу «напасть на противостоящую пешку
противника», которая может в свою очередь инициировать поиск
подходящей для этой цели фигуры. Попытка решения на
тактическом уровне есть конкретный вариант решения
соответствующей подзадачи. Успешность всех попыток представляет
подтверждение правильности ранее найденной гипотезы решения,
а последовательность элементарных задач, полученная по всем
типовым подзадачам, представляет решение исходной задачи в
целом.
В заключение данного параграфа отметим еще одну
характерную черту мыслительной деятельности: необходимость
оценки различия между исходными данными и требуемым
результатом. Как было указано ранее, поиск решения может
осуществляться в обоих направлениях: в обратном, от результата к
требуемым исходным данным, и в прямом, от исходных данных
к требуемому результату (см. ход решения геометрической
задачи в § 2.3). Продолжительность поиска в каждом конкретном
направлении и его смена регулируются механизмом оценки
различия между исходными данными и требуемым результатом.
Потребность уменьшить это различие может приводить к
переформулировке задачи, инициировать возникновение догадок и
т. д. и т. п. Механизм оценки различия между «что дано?» и
«что требуется получить?» представляет важнейшую эвристику
целенаправленного поиска.
Итак, основу мыслительной деятельности составляют
структурированные знания и направленный поиск. Эти две стороны
мыслительной деятельности будут существенным образом
использованы при построении ее модели. Пренебрежение одной из
этих сторон неизбежно обеднило бы такую модель:
использование недостаточно выразительных средств представления знаний,
равно как и отсутствие эффективных средств поиска решений,
свело бы на нет мыслительную деятельность человека в средах
практической сложности.
3 Е. И. Ефимов
34 ГЛ. 2 МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
§ 2.5. Семиотическая модель мыслительной деятельности*
Обобщая отмеченные особенности мыслительной
деятельности человека, решающего задачи в различных сферах, а также
некоторые результаты, полученные, в частности, в области
военного искусства [В. В. Дружинин, Д. С. Контор^в, 1972],
педагогики 1С. И. Шапиро, 1973] и другие, попытаемся построить
развитую семиотическую модель мыслительной деятельности. Здесь
необходимо сделать несколько предварительных замечаний. Во-
первых, нам необходима правдоподобная модель, которая
подтверждается практикой. Во-вторых, под словами «модель
мыслительной деятельности» мы подразумеваем некую
систематизацию (пока неформальную) знаний и процедур поиска, т. е.
двух основных сторон мыслительной деятельности. В-третьих,
словами «семиотическая модель» мы хотим подчеркнуть, что
речь идет об информационной модели, в которой всякая
информация наряду с внешней формой представления —
синтаксисом — имеет также свою семантику (интерпретацию на
определенную предметную область) и прагматику
(целенаправленность).
Итак, рассмотрим основные этапы мыслительной
деятельности, представляющие, на наш взгляд, существо поиска
человеком решения задач любой природы *).
Прогноз развития внешней среды.
Мыслительная деятельность человека осуществляется в некоторой внешней
среде. Это либо реально существующая физическая среда, либо
мир абстракций (например, при решении геометрических задач).
Внешняя среда изменяется во времени, и это изменение
вызывается либо законами развития «природы», либо активными
действиями других людей. В обоих случаях указанное
изменение определяет динамику объективных внешних воздействий и
ограничений (материальных, энергетических, информационных),
а такя^е состояние среды на конец прогнозируемого периода.
Цель прогноза состоит в том, чтобы выявить динамику
(распределение во времени) внешних воздействий и «естественную»
ситуацию на конец прогнозируемого периода**). Другими
словами, на основе прогноза формируется внешний фон, на который
будет проецироваться мыслительная деятельность человека.
Формирование задачи. В результате прогноза
определяется конечная ситуация. Рассматривая ее как возможную,
*)В зависимости от конкретного класса задач некоторые этапы могут
отсутствовать.
**) Естественное поведение, как и его результат,— естественная-
ситуация — выявляется путем переноса в будущее тех же законов развития,
которые наблюдались в прошлом и настоящем времени в окружающей
среде.
§ 2.5. СЕМИОТИЧЕСКАЯ МОДЕЛЬ
35
человек фиксирует желаемый результат своей деятельности.
Обычно этот результат не имеет места в конечной ситуации,
поэтому желаемая (не совпадающая с прогнозом полностью или
частично) ситуация на конец прогнозируемого периода
рассматривается в качестве требуемого результата, а исходная ситуация
и динамика внешних воздействий играют роль исходных данных
в деятельности человека. Так возникает задача или проблемная
ситуация, характеризуемая отсутствием готовых схем решения
(известные схемы решения не годятся).
Нахождение замысла решения задачи.
Решение сформированной (или заданной) задачи в конечном итоге
должно быть представлено в виде упорядоченной совокупности
элементарных задач. Но на начальном этапе необходима какая-
то общая принципиальная схема, которую назовем замыслом
решения. Замысел решения ищется в пространстве типовых
задач и представляет совокупность этих задач, выражающую «что
и в каком порядке надо сделать, чтобы получить искомый
результат».
При построении замысла используются эвристики
«средства — цель» и оценки различия между исходными данными и
требуемым результатом. В ходе построения замысла
производится неоднократная смысловая оценка ситуаций: при обратном
поиске оценивается исходная ситуация с точки зрения
содержания требуемых исходных данных, при прямом поиске
оценивается результирующая ситуация с точки зрения содержания
требуемых результатов. И требуемые исходные данные и требуемый
результат обычно представляют собой вышеупомянутые
смысловые структуры элементов.
Назначение замысла — выявить на достаточно общем уровне
гипотезу решения задачи и определить, с чего начать. Если
данный йариант замысла не приводит к успеху, то тем самым
обнаруживается ошибочность схемы решения. Здесь должен
срабатывать механизм стратегической регуляции действий.
Декомпозиция подзадачи. Замысел решения
ограничивает область дальнейшего поиска рамками сформированных
подзадач. Для того чтобы приступить к нахождению
конкретного решения той или иной подзадачи, предварительно
необходимо уточнить ее компоненты.
На стратегическом уровне исходные данные и требуемый
результат каждой подзадачи представляют, как уже отмечалось,
смысловые структуры элементов. Эти смысловые структуры по
существу те требования, которым должна удовлетворять
конкретная структура элементов ситуации. Так, например, смысловая
структура «белая проходная» утверждает существование (в
смысле «уже есть» или в смысле «должно быть») в шахматной
позиции такой белой пешки, перед которой напротив или па смежных
36 ГЛ. 2. МЫСЛИТЕЛЬНАЯ .ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
вертикалях шахматной доски нет ни одной черной пешки.
Такой смысловой структуре пешек в позиции может соответствовать
одна или несколько белых пешек и различное число черных
пешек при различном их расположении на доске, лишь бы это
расположение удовлетворяло исходному утверждению.
Таким образом, смысловая структура — ото обобщенное
описание класса конкретных структур и в этом описании
допускается определенная свобода как на количество элементов, так и
на их свойства и связи. Все это приводит к тому, что переход
от смысловой структуры к конкретной структуре элементов в
ситуации не является однозначным и означает конкретизацию
смысла структуры.
Указанный переход мы назовем декомпозицией подзадачи,
В результате докомпозиции каждая подзадача стратегического
уровня предстает на тактическом уровне как типовая задача
с конкретными исходными данными и конкретным требуемым
результатом.
Нахождение варианта решения подзадачи.
Механизмы построения конкретного решения очередной
подзадачи аналогичны механизмам, рассмотренным при формировании
замысла решения. Подзадача может и не иметь решения, или
ее решение может привести к результату, отличному от
планируемого (результат выходит за пределы смысловой структуры).
В этом случае должен срабатывать механизм обратной связи и
должна осуществляться либо корректировка построенного
замысла решения, либо формирование нового замысла.
В итоге всех перечисленных этапов в случае успеха
формируется окончательное решение исходной задачи.
Систематизированное описание основных этапов и их
взаимосвязей составляет основу семиотической модели мыслительной
деятельности человека, решающего задачи. Эта модель
представляет исходный объект для дальнейшего построения более
общей иерархической системы искусственного интеллекта —
решателя интеллектуальных задач (см. гл. 4).
§ 2.6. Эвристическое программирование
Попытки использовать опыт человека в решении задач нашли
свое отражение в эвристическом программировании. Последнее
получило широкое распространение в комбинаторных задачах,
организация поиска решений в которых не поддается
современному аппарату математической теории оптимизации. К
настоящему времени у нас в стране и за рубежом разработано много
эвристических программ различной степени общности и
назначения: шахматная программа «ПИОНЕР» [М. М. Ботвинник,
§ 2.6. ЭВРИСТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
37
1968, 1975J, серия решателей ГШР — программ поиска
решений 1В. П. Гладун, 1977J, общий решатель задач GPS Шыоэлл,
Шоу и Саймон, 1960; Эрнст и Ньюэлл, 1967а, 19676, 1969],
программа MULTIPLE [Слэйгл, 1965; Слэйгл и Барский, 1968;
Слэйгл и Конайвер, 1970], программа АРГУС [Рейтман, 1965]
и другие.
Указанные и многие другие эвристические программы
отражают в себе основные особенности эвристического
программирования, которые мы и рассмотрим. В основе эвристического
программирования лежит эвристический поиск, который авторы
таких программ отличают от систематического поиска,
связанного с- полным перебором вариантов. Систематический поиск
трудоемок и дорог; опасность еще и в том, что объекта поиска
может и не существовать. Эвристический поиск характеризуется
избирательностью, но связан с определенным риском не найти
в действительности существующее решение.
Как указывает Рейтман [1965], отличие эвристических
методов, как не гарантирующих решение, от алгоритмических
процедур, которые его гарантируют, неправомерно. «Если
говорить точно, то в реальном мире вы не найдете того, что мы
называем абсолютной гарантией. Только формальная система
может гарантировать абсолютное безразличие ко всему, кроме
некоторого определенного числа источников отклонений, но
даже эта гарантия нрнложима только к формализму, а не к их
эмпирическим реализациям.»
Специальные психологические исследования показали, что
существуют принципиальные различия между структурой
эвристических программ и мыслительной деятельностью человека
[В. Н. Пушкин, 1965; О. К. Тихомиров, 1969]. Большинство
эвристических программ использует лабиринтную схему поиска
решений. По этой причине основное внимание в таких
программах уделялось построению эффективных эвристик, которые
позволяли бы избегать порождения огромного лабиринта
возможностей. Однако психологические эксперименты показали, что
человеку несвойственна поведенческая концепция мышления,
что проблема усечения лабиринта решается не только с помощью
эвристик, но и в значительной степени с помощью
структуризации знаний. Лабиринтная схема больше отражает
возможности ЭВМ, чем человека! Эвристическая программа без
структуризации знаний — это попытка решать интеллектуальные
задачи не «по-человечески», а «машиноподобно». Здесь
сказалось влияние бихевиористического подхода: не важно «как»,
важно «что».
Тем не менее поведенческий подход сыграл определенную
положительную роль, так как привел к созданию эффективных
переборных алгоритмов типа а-, £- процедур [Нильсон, 1971] и
38 ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
метода граней и оценок [А. Л. Брудно, 1963; Г. М. Адельсоп-
Вельский, В. Л. Арлазаров и др., 1970].
Сравнивая эвристические программы и мыслительную
деятельность человека, решающего задачи, можно отметить
следующие между ними различия. У большинства созданных
эвристических программ в поиске решения * задачи отсутствует этап
нахождения гипотезы решения, позволяющей значительно
сужать область дальнейшего поиска. Как результат этого, в.
эвристических программах доминируют действия, связанные с
достижением ближайших возможных целей, никак или почти
никак не увязанных с конечной целью; тактические приемы
относительно элементарны. В таких эвристических программах
нет и аналогов механизмов, реализующих динамику смысловых
структур элементов ситуации и смысла ситуации в целом,
недостаточно развит прагматический аспект мыслительной
деятельности. Эвристическое программирование оперирует
абсолютными, а не относительными, меняющимися от ситуации к
ситуации оценками. Однако ситуация для человека значима не
столько в ее абсолютной оценке, сколько в относительной,
определяемой местом, которое занимает эта ситуация в
сформированных замыслах и планах. В аспекте отражения, осознания
ситуации и совершаемых в ней действий процессы решения
задачи человеком и машиной еще в значительной степени
отличаются друг от друга.
Существующие эвристические программы можно разделить
на два класса. К первому классу относятся программы, в основе
которых лежит определенная гипотеза об общих механизмах
мыслительной деятельности. Преимущество таких универсальных
программ заключено в потенциальной возможности решения
широкого класса задач, однако таких программ немного и они не
лишены недостатков, отмеченных выше. Можно даже сказать,
что к настоящему времени эффективных универсальных
эвристических программ нет. Так, наиболее известный решатель GPS
как общий решатель задач оказался несостоятельным для
решения задач, требующих более эффективного представления
знаний, например таких, как шахматные.
Ко второму классу относятся программы, созданные на
основе анализа конкретной сферы деятельности человека и учета
особенностей и специфических свойств именно этой сферы
деятельности. Примерами таких программ могут служить
многочисленные программы, рассмотренные в сборнике «Вычислительные
машины и мышление» [под ред. Фейгенбаума и Фельдмана,
1963].
Строго говоря, эвристическими можно называть лишь
программы первого класса. Именно эти программы представляют
попытки смоделировать мыслительную деятельность человека,
§ 2.6. ЭВРИСТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
39
решающего задачи. Программы второго класса воссоздают лишь
результаты этой деятельности. Все творчество здесь проявил
человек, составляя программу подобного рода.
Эвристические программы второго класса отличаются узкой
направленностью решаемых ими задач, что заставляет для
каждой новой практической задачи разрабатывать новую
эвристическую программу. Здесь уместно привести слова Минского:
«Известно, сколь легко „глубокая" теорема может оказаться
несущественной в какой-либо новомодной теории в математике, да мало
ли что с ней может статься в дальнейшем! А более глубокое
понимание способов доказательств теоремы сохранит свою
ценность при любом развитии математики» [Минский, 1962].
В период становления эвристического программирования в
мировой литературе широко комментировалось мнение, что
эвристическое программирование дает исследователю проблем
искусственного интеллекта более эффективные описательные
средства по сравнению с классической математикой, предоставляя
ему более широкие возможности для изучения сложных форм
человеческой деятельности. Этому совершенно неверному
предположению отчасти способствовало то обстоятельство, что
сложившиеся к тому времени математические методы мало
подходили для изучения высших форм движения материи. Еще
Колмогоров отмечал: «На сегодня мы еще очень далеки от
осуществления анализа и описания высших форм человеческой
деятельности, мы даже не научились в объективных терминах
давать определение многих встречающихся здесь категорий и
понятий» [А. Н. Колмогоров, 1968].
Очевидно, что для описания сложных форм мыслительной
деятельности более подходят процедуральные языки
программирования, чем декларативные языки. Программы легче строить,
они значительно более выразительны и менее чувствительны
к тому, является ли изучаемая функция элементарной. Эти
языки более удобны для описания ветвящихся процессов.
Однако программы трудно исследовать как некие системы,
подобно тому, как исследуются формальные системы в
математической логике. Программы также труднее воспринимаются.
Например, описание главных деталей программы GPS занимает
более сотни страниц и, несмотря на это, требует
предварительного знакомства читателя с языком IPL-5 и более ранними
работами авторов. Если такая сложная программа предлагается
в качестве какой-нибудь теории, то возможность ее строгого
исследования и понимания является сомнительной. Понимание
такой программы-теории находилось бы в полной зависимости
от ее создателя.
Аналогично обстоит дело и при изменении программы. Если
при изменении математической теории мы можем непосредствен-
40 ГЛ. 2. МЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
но сравнивать обе ее формы- и делать выводы о размерах п
существе изменений, то при изменении программы, подобной
GPS, мы практически полностью лишены этого. Создатель
программы постарается указать большинство изменений и их
сущность, но вряд ли его замечания создадут надлежащую основу
для строгого понимапия читателем существа изменения
программы в целом.
Таким образом, программа-теория гораздо менее доступна
для строгого понимания и исследований, чем математическая
теория.
Однако было бы неправильно педооценивать возможности
математических средств при исследовании мыслительпой
деятельности. Теория мыслительной деятельности человека, если
таковая будет создана, должна будет иметь доказательную силу,
что свойственно только математике, и одновременно обладать
мощными описательными средствами, что свойственно языкам
эвристического программирования. Возможно, подобный симбиоз
приведет к расширению языка и понятий современной
прикладной математики. Так, например, возможно, надо будет
пересмотреть наше увлечение математической оптимизацией
получаемого решения. Дело в том, что точные решения нам дорого
обходятся и практически часто нецелесообразны. В погоне за
строго оптимальным решением часто выхолащивается
физическая сущность решаемой задачи. В то же время нас практически
часто устраивает допустимое, рациональное решение. Возникает
парадокс, заключающийся «в строгом решении нестрого
поставленных задач».
Одним словом, только на основе развитой прикладпой
математики, обогащенной эвристическими средствами, возможно
создание теории интеллектуальных систем.
ГЛАВА 3
ИНТЕЛЛЕКТУАЛЬНЫЕ ЗАДАЧИ
§3.1. Классификация типов задач
В § 2.4 было рассмотрено понятие «решение задачи». Здесь
мы еще раз вернемся к этому вопросу и приведем дополнительные
аргументы в пользу понимания решения задачи как
преобразующей программы действий.
В монографии «Математическое открытие» [Пойа, 1962] автор
определяет задачу следующим образом: «Задача предполагает
необходимость сознательного поиска соответствующего средства
для достижения непосредственно недоступной цели». В этом
определении нас интересует, какой смысл необходимо вкладывать в
слова «средство» и «поиск». Для ответа на этот вопрос опять
обратимся к Пойа, согласно которому существует два весьма общих
типа задач: задачи на нахождение и задачи на -доказательство.
Первая задача состоит в нахождении неизвестного заранее
объекта, удовлетворяющего ее условиям, связывающим его с
исходными данными. Этот объект может принадлежать к самым
разнообразным категориям; так, для геометрических задач на
построение это фигура, например треугольник. Категория
неизвестного объекта определяет множество конкретных объектов, а
условие задачи выделяет их подмножество. Каждый объект,
принадлежащий этому подмножеству, называется решением. Таким
•образом, в задачах первого типа мы имеем дело с определением
решения задачи как результата.
Совершенно иначе обстоит дело с задачами второго типа —
задачами на доказательство. В этих задачах неизвестного объекта
нет; объект определен и задан в виде заключения. Решить
задачу на доказательство — это найти подтверждение истинности (или
ложности) того, что заключение следует из исходных посылок
(исходных данных).
Таким образом, в задачах на доказательство решение можно
понимать только как последовательность умозаключений,
позволяющих перейти от посылок к заключению, а поиск решения —
42
ГЛ. 3. ИНТЕЛЛЕКТУАЛЬНЫЕ ЗАДАЧИ
как процесс, заканчивающийся нахождением этой последователь^»
ности.
Если теперь в задачах первого типа понимать под решением
не искомый объект, как раньше, а программу действий,
преобразующую исходные данные в этот объект, то толкование решения
как преобразующей программы будет применимо к обоим типам
задач и именно такое толкование необходимо придать слову
«средство» в вышеупомянутом определении Пойа. Что же
касается слова «поиск», то под ним мы всегда будем подразумевать
процедуру, приводящую к нахождению требуемой программы
действий. Мы надеемся, что из контекста читатель легко каждый
раз сможет сам установить, идет ли речь о решении задачи или
о поиске этого решения. Так, например, под алгоритмом решения
мы будем понимать поиск, хотя само решение как программу
операций можно было бы также считать некоторым алгоритмом
преобразования исходных дапных в требуемый результат.
Нас интересуют интеллектуальные задачи. Что же касается
термина «интеллектуальность», то существует много определений
на этот счет. По утверждению Минского: «Интеллектуальность
можно определить лишь относительно степени непонимания
задачи наблюдателем... Трудно сохранить ощущение того, что теорема
«глубока», когда ее доказательство понятно До конца. Вместе с
пониманием приходит и ощущение потери» (1966). Из
определения Минского следует, что интеллектуальность — понятие
относительное и что оно (применительно к области решения задач)
свойственно субъекту в том случае, если он способен решать
задачи с неизвестными ему априори схемами решений.
Рассмотрим следующие возможные классы задач:
Класс I. Задачи, для которых существует формальпая схема
решений, представленная на неком формальном языке. Решение
задач осуществляется по имеющейся схеме (детерминированной
или вероятностной).
Представителями этого класса являются математические
задачи на нахождение решений известными формальными методами.
Например, задача решения системы обыкновенных
дифференциальных уравнений вида у\ = f\ (#, у{, ..., уп) методом Рунге —
Кутта или экстремальная задача, решаемая определенным
методом случайного поиска.
Задачи этого класса не являются интеллектуальными. Они
могут решаться человеком или машиной. Машинный поиск решения
таких задач обычно не представляет проблемы.
Класс П. Задачи, для которых не существует заранее
готовой схемы решения. Для построения схемы решения задач этого
класса привлекаются знания о предметной области. Обычно в
этом случае человек сам формирует схему решения и в этом
состоит его творческая деятельность.
§ 3.2. МОДЕЛЬ МИРА ОПЕРАЦИЙ
43
К такого рода деятельности можно отнести создание
эвристических программ второго класса (см. § 2.6). После того как
человек построил схему решения, задачи перестают быть
интеллектуальными, и дальнейший поиск их решений человеком или
с помощью машины не представляет проблемы.
Класс III. Задачи этого класса отличаются от ранее
указанных тем, что схема их решения априори неизвестна, несмотря на
привлечение знаний о предметной области. Поэтому алгоритмы
поиска решений таких задач реализуются сложными
иерархическими программами, имитирующими мыслительную деятельность
человека.
К задачам этого класса в сфере научно-технической
деятельности- человека относятся задачи планирования поведения в
сложных средах, задачи проектирования и конструирования, игры,
задачи на доказательство теорем и другие. Подобные задачи мы
будем называть интеллектуальными.
Теория автоматического поиска решений интеллектуальных
задач в настоящее время активно развивается. Ее становление
связано с решением многих проблем. Именно интеллектуальные
задачи нас и будут интересовать в дальнейшем.
§ 3.2. Модель мира операций
Пусть решение задач реализуется в той или иной предметной
области в виде упорядоченной совокупности операций (действий).
Назовем модель этой области моделью мира операций. При
построении моделей различных миров будем использовать
следующие категории данных: А— имена предметов, В — имена
операций, С — имена значений свойств и бФ — имена отношений.
•Природа этих категорий может быть самая различная. Для
иллюстрации рассмотрим миры операций бытового робота,
технолога, программиста и конструктора, в которых должны решаться
соответственно задачи ведения домашнего хозяйства,
проектирования технологических процессов, составления машинпых
программ и разработка конструкций.
Мир бытового робота: А — имена предметов интерьера
•квартиры (СТУЛ, СТОЛ, ПЫЛЕСОС); 5 —имена различного
рода действий робота (ПЕРЕМЕЩЕНИЕ, ВЗЯТИЕ, ОСМОТР);
С — имена значений таких свойств, как величина, вес, форма
(20 м, 10 кг, КВАДРАТ), экономичность, надежность, скорость
450 руб., 0,999, 0,5 КМ в час); st> — имена различного рода
пространственных отношений (ВПЕРЕДИ, НАД), временных
отношений (РАНЬШЕ, ОДНОВРЕМЕННО) и т. п.
Мир технолога: А — имена станков, рабочих,
инструмента (СТАНОК № 25, ФРЕЗА, СВЕРЛО); В -имена
производственных операций (СВЕРЛЕНИЕ, РЕЗАНИЕ, ЗАКРЕПЛЕНИЕ);
4'*
ГЛ. 3. ИНТЕЛЛЕКТУАЛЬНЫЕ ЗАДАЧИ
С — имена значений таких свойств, как стоимость оборудования
или операции, разряд рабочего и т. д.; s& — имена отношений
СОВМЕСТИМОСТЬ (станка и инструмента);
ПРЕДШЕСТВОВАТЬ (для операций) и т. п.
Мир программиста: А—имена файлов данных; Z?-—
имена стандартных программ, встроенных функций
(алгоритмического языка); С—имена значений таких свойств, как объем,
место файлов, эффективность, быстродействие программ или
встроенных функций; зФ — имена отношений СМЕЖНОСТЬ
(файлов), СООТВЕТСТВИЕ (данных и операций).
Мир конструктора: А — имена деталей, узлов, агрега-
тоз (ВАЛ, РЕДУКТОР); В — имена умозаключений, приемов,
расчетов; С — имена значений таких свойств, как материал,
форма деталей, точность расчетов; $$> — имена отношений ВНУТРИ,
НЕПОДВИЖН-СОЧЛЕИЕИИЕ и т. п.
Назовем четверку М0 = <Л, Я, С, $$>> моделью мира операций.
В этой модели s& — множество отношений, а Л, В и С —
множества подмножеств А\ Bi и Ск соответственно. В свою очередь
А\ Bi и Ch представляют множества имен конкретных предметов
а\ операций W и значений ск соответственно 1-го, ;-го и &-го
сортов. Например, Ai может представлять множество имен
предметов а1 сорта «стол», В2 — множество имен операций Ь2 сорта
«перемещение», С3 — множество имей значений с3 сорта «размер».
Предметы, операции и значения назовем индивидами
соответствующих сортов. Например, индивиды сорта «стол», категории
«предмет» или индивиды сорта «размер», категории «свойство».
Чтобы выделить любой индивид среди прочих в мире М0 в
общем случае ему необходимо приписать имя, сортность п
категорию. Например, ДУБ сорта «дерево», категории «предмет»
и ДУБ сорта «материал», категории «свойство». Однако для
полного описапия индивидов категории «предмет» или «операция»
необходимо с их именами связать имепа значений.
Пусть а{ и Ъ5 являются именами элементарных предметов и
элементарных операций, которыми на самом деле могут быть
названы довольно сложные структуры предметов и довольно
сложные вычислительные программы. Слово «элементарный»
означает лишь то, что мы не интересуемся внутренней структурой
этих предметов и операций; для нас они представляют нечто
целое, неделимое в мире М0.
В этом мире У обозначает конкретную операцию, т. е.
конкретный вычислительный процесс по соответствующей
программе. В принятой нами терминологии У — это имя элементарной
операции сорта «/-я программа», категории «операция». Тогда В*
как множество имен всевозможных элементарных операций
сорта «;-я программа» определит саму эту программу как схему
соответствующих элементарных операций.
§ 3.2. МОДЕЛЬ МИРА ОПЕРАЦИЙ
45
Таким образом, схема с именем В? превращается в операцию
с именем Ь5 путем присваивания конкретных значений всем ее
составляющим. Аналогичным образом предмет с именем Ai
превращается в конкретный предмет с именем а\
Отношения a^s& определены на индивидах М0 согласно их
сортности. Составим из указанных индивидов всевозможные пары
и укажем, какие отношения на каких парах могут быть
определены. Получим следующие результаты (см. табл. 3-1).
Таблица 3-1
Типы пар
(я, с); <ях, а2)
(6, с), {bv Ъ2)
1 (», о) 1
Имена классов отношении
! СВОЙСТВО, МЕСТО, РЕСУРС
БОЛЬШЕ, МЕНЬШЕ, РАВНО
МЕСТО, СРЕДСТВО, ВРЕМЯ, ХАРАКТЕР,
МЕРА, ФУНК-ЗАКОИ
СУБЪЕКТ, ОБЪЕКТ 1
Табл. 3-1 по существу представляет собой классификацию
бинарных отношений, используемых для описания связей предметов
и операций любой предметной области. Поясним некоторые из
этих отношений.
Отношение СРЕДСТВО указывает на предмет, используемый
в операции в качестве средства, например, СРЕДСТВО (КОПАТЬ,
ЛОПАТА).
Отношения класса ВРЕМЯ указывают на начало, окончание,
длительность операций, а также на времеппые соотношения
между ними (РАНЬШЕ, ОДНОВРЕМЕННО и т. д.).
Отпошение ХАРАКТЕР указывает, как, каким образом
совершается операция, например, ХАРАКТЕР (ПЕРЕМЕЩЕНИЕ,
БЫСТРО).
Отношение МЕРА указывает меру действия, например,
МЕРА (ПЕРЕМЕЩЕНИЕ, ЭФФЕКТИВНО).
Наконец, отношение ФУНК-ЗАКОИ указывает па
функциональный закон, которым характеризуется данная операция,
например, ФУНК-ЗАКОН (ПЕРЕМЕЩЕНИЕ, ПРЯМ-РАВН-УСК).
Из табл. 3-1 также видно, что предметы и операции связаны
ДРУГ с другом через отношения СУБЪЕКТ и ОБЪЕКТ. Можно
считать, что в мире М0 заданы предметы, которые выполняют
определенные операции и испытывают на себе их действия —
предметный подход. Можпо полагать, что в мире М0 задапы
операции, которые используют предметы в качестве субъектов и
объектов — операциональный подход.
46
ГЛ. 3. ИНТЕЛЛЕКТУАЛЬНЫЕ ЗАДАЧИ
Мы будем использовать и тот и другой подход, отдавая
предпочтение операциональному. Итак, пусть в мире М0 задано
множество конкретных операций с именами Ь^В, связываемых
через отношения а ^ s& друг с другом, а также с конкретными
предметами, носящими имена а^Л, и значениями свойств,
носящими имена с^С.
В мире М0 имеют место ситуации. Задать ситуацию s в М0 —
это значит зафиксировать некоторый момент времени %&Тс:С
и указать, какие индивиды и какими отношениями были связаны,
связаны или должны быть связаны в момент т. Обычно нас
будут интересовать ситуации, в которых отношения задаются
только на предметах и значениях свойств. Что же касается
отношений между операциями и операций с индивидами других
категорий, составляющих описания динамических ситуации, то они
будут использоваться для описания искомых решений
интеллектуальных задач. Эти решения представляют собой программы,
к рассмотрению которых мы и переходим.
Будем представлять упорядоченные совокупности действий,
переводящие исходную ситуацию мира в некоторую целевую*
программами операций. Содержание программы зависит от
используемых операций при решешш различного рода задач. В
физическом мире таковыми могут быть задачи планирования
целенаправленного поведения. В технологическом мире — задачи
проектирования технологических процессов. Мы можем иметь
дело с задачами синтеза машинных программ, с
конструкторскими задачами, логическими задачами и т. д. На основе программ
в вышеуказанном смысле можно строить схемы решения для
достаточно широкого класса практических задач.
Задача составления программы с использованием модели
мира М0 формулируется следующим образом. Заданы исходная
s(t0) и конечная s(xK) ситуации. Необходимо построить из
конкретных операций b ^ В программу у, которая, будучи
применена к s(t0), позволила бы достичь s(tk). При решении этой задачи
человек сталкивается по меньшей мере с двумя проблемами. Во-
первых, он, как правило, не может точно предсказать и,
следовательно, описать целевую ситуацию s(tk). Обычно его устраивает
достижение не какой-то коикретпой, а любой ситуации из
некоторого класса Ытк)}, удовлетворяющей вполне определенным
требованиям. Например, любая выигрышная позиция из класса
матовых позиций в шахматной игре. Однако описание класса
ситуаций Ытк)} требует использования языка более высокого
уровня, чем язык описания конкретных ситуаций.
Во-вторых, если даже допустить, что существует
единственная s(tk), то и в этом случае в моделях мира практической
сложности возникает проблема^ эффективного поиска программ в
пространстве огромной размерности. Поэтому и в этом случае зада-
§ 3.2. МОДЕЛЬ МИРА ОПЕРАЦИЙ
47
ча построения программы должна решаться с применением языка
более высокого уровня, а модели М0 при этом надо отвести роль
лишь некоторого объективного источника информации,
используемого для корректировки и оценки, предлагаемых программ.
Программа как РЕШЕНИЕ интеллектуальной задачи
напоминает машинную программу. В задачах синтеза машинных
программ указанные программы просто совпадают. Рассмотрим
частный, довольно распространенный тип программ, свойственный
задачам планирования поведения целенаправленных систем и
называемый планом действий.
Как известно, машинная программа допускает условные
переходы и циклы. Применительно к плану действий условный
переход означал бы включение в его структуру альтерпативных
ветвей, определяемых предполагаемыми («планируемыми»)
неопределенностями. Это по существу означало бы в конечном итоге
попытку построить множество вероятностно взвешенных планов.
Однако такая вероятностная трактовка плана не всегда
оправдывает себя. Не говоря уже об априори задаваемых вероятностных
исходах операций, которые часто бывают неизвестными, при
такой трактовке само множество возможных исходов остается
неопределенным. Поэтому в Дальнейшем будем придерживаться
детерминированной трактовки плана, при которой (при
необходимости) будем допускать корректировку плана через механизм
обратной связи.
Возможно ветвление плана и за счет различных способов
достижения цели. Мы также отказываемся от такого подхода,
считая, что план должен однозначно указывать, кто, что и в каком
порядке должен делать. Другими словами, мы будем
рассматривать планы как частично упорядоченные совокупности,
состоящие из линейно упорядоченных последовательностей операций,
выполняемых (в общем случае параллельно) различными
субъектами.
Удобной формой представления линейного плана операций
является треугольная таблица (ТТ) [Файкс, Харт, Нильсон, 1971].
Пусть i — номер столбца U = 0, 1, ..., тг), / — номер строки
(7 = 1, ..., п) и (i, 7") — номер ячейки ТТ (см. рис. 3.1). Каждый
столбец i > 1 помечается операцией bt и заполняется
результатами: в ячейку U, i+1) помещается результат st операции Ъи
в ячейку U, i+m) (яг = 2, 3, ..., п+1 — г) помещаются те
результаты из su которые сохраняются после последовательности
операций bi+u bi+2, ..., bi+m-i. Обозначим эти результаты через
Sf/f+i-H+m-t. Рассмотрим строку j (/ =* 1, ..., w+1). Эта строка,
исключая ячейку (0, /), содержит результат применения
последовательности fct, b2, ..., b}-i. Назовем эту строку (/— 1)-м срезом
плана v. В частности, /г-й срез содержит окончательный
результат применения v.
48
ГЛ. 3. ИНТЕЛЛЕКТУАЛЬНЫЕ ЗАДАЧИ
Очевидно, для каждой операции Ъ$ (/=1, ..., п) часть
исходных данных войдет в (/— 1)-й срез, а оставшаяся часть —в
ячейку (0, /), которая содержит начальные исходные данные soh
сохранившиеся к моменту ;. Заметим, что не обязательно (у — 1)-й
среэ содержит только исходные данные для bh т. е. в этом
смысле он может быть избыточным (на рис. 3.1 исходные данные для
каждой операции помечены звездочкой).
ведро
наполу
/гран
закрыт
s02
\ ведро
пусто
s03
0
0
0
ty-nocM
ведро в
раковине
ведро в
рашине
Sl/2
ведро в
раковине
Sf/2+3
ведро в
раковине
Sf/2+4
0
шить eedpi
о2 - откр
*
кран
открыт
S2
кран
открыт
S?3
0
0
7 в раковину
ь/ть кран
Ь3-пополнить ведро
ведра
полно
*з
ведро
полно
S3/4
if И
fy-закрыть кран
кран
закрыт
*4
кран
закрыт
S4/5
bs-снять i
ведро
на полу
s5
О 12 3 4 5
Рис. 3.1. План решения задачи наполнения ведра водой.
Заполненная ТТ указывает: 1) исходную ситуацию s0 = (J s0f
п.
и конечную ситуацию sK *= |J *ш+1+п; 2) план операций v в виде
t=l
причинно-упорядоченной последовательности Ъи Ь2, ..., Ьп;
3) роль и место каждой операции bjt
На рис. 3.1 план v представлен в виде линейной
последовательности v = &i, &2, Ь3, Ь4, Ь5. Однако легко видеть, что v — это
частично упорядоченная последовательность, в которой
допустимы следующие перестановки операций:
I i J i
v = Ь1? Ь21 Ь3, Ь4, Ъъ.
I г I х
Отметим необходимые и достаточные условия подобных
перестановок. Пусть в плане v операция fc7n1 непосредственно пред-
§ 3.3. МОДЕЛЬ МИРА ЗАДАЧ
49s
шествует операции Ьтг Очевидно, ьт% и Ьт2 можно помепять
местами тогда и только тогда, когда 1) выход (результат) ЪШ1 не
пересекается со входом (исходные данные) Ьт2 и 2) при
перемене мест выход 6т2 не нарушает входа bmi. Отсюда
непосредственно следует возможность выполнения перестановок операций
плана, представленного на рис. 3.1.
§ 3.3. Модель мира задач
В предыдущем параграфе отмечалось, что в мире М0 решать
задачи составления программ человеку проблематично — слишком
велико пространство поиска. Чтобы уменьшить это пространство,
ему надо как-то упростить мир Л/0, построив более простую
модель Л/, модели М0.
В целях удобства пометим категории мира М0 индексом «0»*
т. е. представим этот мир следующей четверкой символов: М0 =»
= <Л0, Во, С0, «££0>. Пусть требуемое упрощение осуществляется
только за счет огрубления значений свойств с ^ С0 мира MQ.
Тогда Mi также можно представить в виде Mt = <AU Bt, Cu *$^i>,.
где Ai и s&i совпадают с множествами А0 и s&0 соответственно»
множество Bi ~ {64} изоморфно В0 = (й0), а С4 представляет собой
множество огрубленных значений свойств. Элементы множества
Bi являются именами элементарных задач. Таким образом, каж-,
дой элементарной операции в мире Л/0 с именем b0 должна при
этом соответствовать элементарная задача в мире Л/4 с
именем bi.
Благодаря указанному упрощению в мире Л/4 становятся
неразличимыми отдельпые конкретные предметы и операции, а тем
самым и отдельные ситуации и программы мира М0. Время и
пространство могут стать дискретными; например, вместо
непрерывных координат плоскости могут появиться дискретные
поименованные местоположения «УГОЛ КОМНАТЫ», «ПЛОЩАДКА»
и т. д.
Пусть человек — решающий орган, которому необходимо
вырабатывать программы в мире М0. Пусть для этого он должен:
уметь решать некие несхематизированпые задачи в наиболее
общем мире М, в который мы погружаем модели М0 и Mim Назовем
такие несхе?.татизированпые задачи локальными. В целях
сохранения общности нам необходимо формализовать понятие задачи.
Будем считать, что локальная задача есть некоторый объект,
характеризуемый следующими атрибутами: ИСХОДНЫЕ
ДАННЫЕ, УСЛОВИЯ и РЕШЕНИЕ.
Значениями атрибута ИСХОДНЫЕ ДАННЫЕ в мире М0
являются достаточно полные и точные описания того, что дано как
исходное, обозначаемое в дальнейшем как «описание
ИСХОДНЫЕ ДАННЫЕ». Значениями атрибута УСЛОВИЯ являются
4 Е. И. Ефимов
50
ГЛ. 3. ИНТЕЛЛЕКТУАЛЬНЫЕ ЗАДАЧИ
в мире М описания того, что требуется получить («описание
УСЛОВИЯ»). Часто при этом описания УСЛОВИЯ имеют более
общий характер, чем описания ИСХОДНЫЕ ДАННЫЕ.
Значениями атрибута РЕШЕНИЕ являются описания искомых
программ в мире М0 («описание РЕШЕНИЕ»).
Так, например, согласно рис. 3.1 (см. § 3.2) локальная
задача «наполнить ведро водой» имеет: «пустое ведро на полу, кран
закрыт» — описание ИСХОДНЫЕ ДАННЫЕ; «полное ведро» —
описание УСЛОВИЯ; «поставить ведро в раковину, открыть
кран, наполнить ведро, закрыть кран, снять ведро» — описание
РЕШЕНИЕ.
Наряду с локальными мир М содержит элементарные задачи
<5 известными схемами решений. Схема элементарной задачи —
это по существу огрубленная модель соответствующей схемы
элементарной операции. Она задается в импликативиой форме «если
ИСХОДНЫЕ ДАННЫЕ, то РЕЗУЛЬТАТ», где указанные
атрибуты играют роль переменных, значениями которых являются
соответствующие описания. Присваивание этим атрибутам
значений (определенных описаний) превращает схему в конкретную
элементарную задачу и тем самым, в отличие от локальной
задачи, однозначно определяет ее решение.
Например, схема «если исходное положение робота есть xv
в момент и, закон перемещения у, то результирующее положение
робота есть х2 в момент t2» после подстановки значений
превращается в элементарную задачу «если исходное положение робота
есть а в момент т4, закон перемещения прямолинейный с
постоянной скоростью F, то результирующее положение робота есть
Ъ в момент т2», где Ъ = а + V(x2 — ti).
Поставить задачу, локальную или элементарную,— это
значит присвоить определенные описания ее атрибутам ИСХОДНЫЕ
ДАННЫЕ и УСЛОВИЯ. Решить заданную локальную задачу —
это значит найти описание ее атрибута РЕШЕНИЕ, т. е. найти
программу, позволяющую получить из описания ИСХОДНЫЕ
ДАННЫЕ описание ТРЕБУЕМЫЕ РЕЗУЛЬТАТЫ,
удовлетворяющее описанию УСЛОВИЯ.
Если УСЛОВИЯ локальпой задачи описываются на уровио
описаний ИСХОДНЫЕ ДАННЫЕ, то такие УСЛОВИЯ будем
представлять как ТРЕБУЕМЫЕ РЕЗУЛЬТАТЫ, а саму задачу
называть одноуровневой. Примером одноуровневой задачи
является известпая игра в 15. В общем случае локальная задача
может быть многоуровневой. Как мы увидим в дальнейшем,
решение локальной задачи может быть сведено к решепию
одноуровневых задач, поэтому последние представляют определенный
интерес.
Элементарные задачи являются одноуровневыми и имеют
следующую особенность по сравнению со сложными одноуровневы-
§ 3.3. МОДЕЛЬ МИРА ЗАДАЧ
51
ми задачами: переменные описания атрибутов элементарных
задач связываются определенным законом. Поэтому достаточно
задать этот закон и значения некоторых переменных, чтобы
получить значения остальных переменных. Например, в вышерассмот-
ренном примере достаточно было задать закон «прямолинейное
перемещение с постоянной скоростью V» и значения a, ti и т2
соответствующих переменных, чтобы получить значение Ъ
переменной х2. Это обстоятельство существенным образом
учитывается при поиске решений одноуровневых задач и в итоге —
локальных.
При описании мира М{ как мира одноуровневых задач можно
повторить все то, что было сказано о мире операций М0 в § 3.2,
если только слова «элементарная операция», «исходная ситуация»
и «целевая ситуация» заменить словами «элементарная задача»,
ИСХОДНЫЕ ДАННЫЕ и ТРЕБУЕМЫЙ РЕЗУЛЬТАТ
соответственно. Конечно, при этом надо иметь в виду характер
перехода от мира М0 к миру Ми т. е. огрубление свойств.
Нам осталось теперь выяснить, что еще содержится в мире
М помимо Mi и М0. Для этого рассмотрим уровни решения
локальной задачи.
Пусть решающий орган имеет дело с поставленной локальной
задачей. Он не может приступить к ее непосредственному
решению, так как ИСХОДНЫЕ ДАННЫЕ и УСЛОВИЯ задачи в
общем случае описываются на разных уровнях. Так, в шахматной
задаче описание ИСХОДНЫЕ ДАННЫЕ представлено в виде
цопкретной исходной позиции, в то время как описание
УСЛОВИЯ может быть задано в виде описания класса матовых
позиций.
В общем случае описания ИСХОДНЫЕ ДАННЫЕ локальной
задачи представляют для решающего органа задаваемые
исходные ситуации мира Л/0, которые он вследствие этого должен
считать объективными. Назовем такой уровень описания и мир М0
в целом объективным, а описания ИСХОДНЫЕ ДАННЫЕ и
ТРЕБУЕМЫЙ РЕЗУЛЬТАТ на этом уровне будем считать
значениями атрибутов ОБ-ИСХ-ДАННЫЕ и ОБ-ТРЕБ-РЕЗ.
Таким образом, мы уточнили, что первым атрибутом
локальной задачи является ОБ-ИСХ-ДАННЫЕ. Объективные описания
ситуаций мира М0 воспринимаются решающим органом через
его органы чувств (рецепторы) и представляются ему при этом
как совокупность разрозненных огрубленных описаний
различных фрагментов ситуаций, например описаний размеров, формы
и местоположения препятствий на местности. Назовем такой
уровень описания перцептивным (чувственным), а описания
ИСХОДНЫЕ ДАННЫЕ и ТРЕБУЕМЫЙ РЕЗУЛЬТАТ на этом
уровне будем считать значениями атрибутов ПЕРЦ-ИСХ-ДАН-
НЫЕ п ПЕРЦ-ТРЕБ-РЕЗ.
4*
'52
ГЛ. 3. ИНТЕЛЛЕКТУАЛЬНЫЕ ЗАДАЧИ
Аналогичным образом представляются решающему органу п
перцептивные описания схем элементарных операций мира М0,
т. е. эти схемы описываются огрубление, раздельно и впе всякой
связи друг с другом, как, например, описания действий робота
на некоторой местности.
Напротив, описания УСЛОВИЯ локальной задачи
воспринимаются решающим органом лишь при наличии у него
определенных абстрактных понятий. Эти понятия возникли у него в
результате обобщения опыта решения перцептивных задач в
прошлом. Так возникает понятие матовой позиции у шахматиста.
Назовем такой уровень описания рефлексным (осознанным),
а описания ИСХОДНЫЕ ДАННЫЕ на этом уровне будем
считать значениями атрибута РЕФЛ-ИСХ-ДАННЫЕ. В целях
удобства мы будем также вместо атрибута УСЛОВИЯ использовать
в том же самом смысле атрибут РЕФЛ-ТРЕБ-РЕЗ.
Таким образом, чтобы начать решать локальную задачу,
решающему органу необходимо либо спроецировать описашш
ОБ-ИСХ-ДАННЫЕ и УСЛОВИЯ на перцептивный уровень, т. е.
по существу огрубить описание ОБ-ИСХ-ДАННЫЕ,
конкретизировать описание УСЛОВИЯ и тем самым с помощью получепных
описаний ПЕРЦ-ИСХ-ДАННЫЕ и ПЕРЦ-ТРЕБ-РЕЗ задать себе
некоторую одноуровневую перцептивную задачу, либо
обобщить, структурировать описание ПЕР-ИСХ-ДАННЫЕ и тем
самым с помошью полученных описаний РЕФЛ-ИСХ-ДАННЫЕ
и РЕФЛ-ТРЕБ-РЕЗ задать себе одноуровневую рефлексную
задачу.
Заметим, что постановка вышеуказанным способом
рефлексной задачи не позволит ее решить, если на этом уровне
отсутствуют аналоги перцептивных элементарных задач — рефлексные
элементарные задачи. Схемы рефлексных элементарных задач,
очевидно, должны представлять свертки решений типовых задач,
из которых можно было бы формировать описание РЕШЕНИЕ
рефлексной задачи (можно также сказать, формировать
описание РЕШЕНИЕ локальной задачи на рефлексном уровне).
Другими словами, схемы рефлексных элементарных задач
представляют собой структурные единицы знаний (фреймы), которые
должны строиться путем обобщения, структурирования типовых
перцептивных задач.
Попытка осуществить решение заданной локальпой задачи
только на одном из трех рассмотренных уровней не дает
нужного эффекта. Так, решение локальной задачи на объективном или
перцептивном уровнях приводит к поиску в пространстве
большой размерпости со всеми вытекающими отсюда последствиями.
Решение локальной задачи только на рефлексном уровне
приводит к утрате существенных деталей, порой самым решительным
образом сказывающихся на ее решении.
§3 3. МОДЕЛЬ МИРА ЗАДАЧ
53
При решении локальной задачи решающий орган должеи
ашеть дело по меньшей мере с тремя взаимосвязанными
уровнями представления задач. Использование наряду с объективным
перцептивного и рефлексного уровней требует от него умения
формулировать перцептивпые и рефлексные задачи и находить
их решения, а это в конечном итоге сводится к умению строить
описания схем перцептивных и рефлексных элементарных задач.
Итак, в мир задач М необходимо ввести еще одну модель —
модель мира рефлексных задач М2. Описание мира М2
совершенно аналогично описанию мира Ми поэтому мы его
рассматривать не будем. Назовем мир М, перцептивных задач внешним
миром решающего органа, а мир рефлексных задач М2 — его
внутренним миром. Если внешний мир предстает перед
решающим органом как совокупность огрубленных, разрозненных
описаний фрагментов ситуаций и схем элементарных операций
объективного мира, то внутренний мир предстает перед ним как уже
упорядоченное, структурированное описание фрагментов внеш-
дего мира.
В дальнейшем мы всегда будем предполагать наличие у
решающего органа этих трех миров и наличие определенного
взаимодействия между ними. Мы будем также под решением
локальной задачи подразумевать решепие соответствующей задачи
программирования в мире Л/0.
ГЛАВА 4
РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
§ 4.1. Подсистемы решателя и их назначение
Приступим к построению модели решателя как системы,
предназначенной для поиска решений предлагаемых ей задач.
Напомним, что задачи формулируются в мире задач М, а их решения
представляют собой программы в мире операций М0.
Проблема полного и точного описания знаний решателя о
реальном мире (адекватность знаний) и проблема организации
эффективного эвристического поиска решений в этом мире
противоречивы в том смысле, что чем полнее и точнее описывается
реальность, тем труднее организовать процедуры эффективного
поиска. Изучение различных решателей, созданных у нас в
стране и за рубежом, позволяет сделать вывод о том, что
причиной неудачных попыток «примирить» эти две проблемы и
получить удовлетворительное их совместное решение служит, как
правило, одностороннее представление фреймов знаний,
например, либо в декларативной, либо в процедуральной форме.
Так, адекватность не может быть достигнута с помощью
только процедурального представления, если необходимо оппсывать
фактуальные знания, выражающие определенные отношения
между предметами и действиями реального мира. Аналогичное
возражение возникает и против декларативных форм представления,
если необходимо описывать достаточно полно и точно актуальные
знания, например стереотипные процедуры.
При построении модели решателя, с одной стороны, можно
добиться, чтобы описание мира операций М0 на процедуральной
основе было адекватным, но, как уже отмечалось, при этом
затрудняется поиск решений из-за чрезмерного увеличения
размерности пространства поиска. С другой стороны, можно
добиться, чтобы описание мыслительной деятельности человека на
декларативной основе позволило организовать эффективный
поиск решений, но при этом утрачивается адекватность описания
актуальных знаний, определяемых в основном миром Д/0. Для
§ 4.1. ПОДСИСТЕМЫ РЕШАТЕЛЯ И ИХ НАЗНАЧЕНИЕ 55
построепия модели решателя, по-видимому, необходимы
смешанная, декларативно-процедуральная форма представления знаний
и соответствующее разделение функций между подсистемами
решателя.
В предыдущей главе были описапы миры операций и задач
и было указано, что переход от М0 к Mi осуществляется путем
огрубления Мо, а переход от М4 к М2 — путем структурирования
Mi. Таким образом, разными словами в разпых контекстах по
существу говорилось одно и то же, а именно, что совместимость
адекватпого описания знаний решателя и его эффективных
процедур поиска возможно только при раздельном решении этих
проблем в едином решателе.
Рис. 4.1. Структура иерархического решателя.
Итак, нас будут интересовать иерархические системы,
основное назначение которых состоит в нахождении решений новых,
несхематизироваыных задач. Такие системы* мы назвали
решателями интеллектуальных задач. Мы предполагаем, что решатель
состоит из двух взаимодействующих подсистем: иерархической
решающей системы и исполнительной системы (см. рис. 4.1).
56
ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
Исполнительная система представляет собой совокупность
исполнительных органов (ИО), роль которых играют элементарные
предметы (см. § 3.2) мира операций Д/0, принадлежащие
решателю и способные совершать активные элементарные операции в
этом мире. Оставшаяся часть мира М0 представляет собой среду
решателя.
Элементами решающей системы являются решающие органы
(РО) различного ранга. Ранг РО отсчитывается снизу вверх, как
показано на рис. 4.1. Таким образом, РО 1-го ранга подчиняет
себе только ИО, все остальные РО имеют дело с подчиненными
решающими органами.
Задачу, решаемую системой РО, назовем глобальной и будем
отличать от локальной задачи, решаемой отдельным РО. С
каждым РО г-го ранга (Ki<n) свяжем мир задач Мх = (М\, M\Y
Мг2), где Мо—объективный мир, М\— внешний мир и М\ —
внутренний мир этого РО. Так как элементарные задачи 1-го
ранга и нулевого уровня (операции) имеют известные решения
(их схемы описаны в виде базовых программ исполнительной
системы), то для РО 1-го ранга найти решение своей локальной
задачи — это значит найти такую программу операций в мире
Л/о для подчиненных ИО, применение которой к исходной
ситуации $£и позволило бы получить конечную, целевую ситуацию
5ок> удовлетворяющую условиям локальной задачи.
При решении глобальной задачи каждый РО имеет дело со<
своей локальной задачей на своем ранге и получаемое им при
этом решение рассматривается как предписание для
дальнейшего решения своих локальных задач подчиненными РО и так
вплоть до 1-го уровня 1-го ранга. Таким образом, решение
глобальной задачи решающей системой представляется как
упорядоченная совокупность перцептивных решений всех локальных
задач 1-го ранга, а сама процедура поиска этого решения — как
иерархия взаимоувязанных процедур поиска решений локальных
задач разных рангов. Такую процедуру мы назовем комплексной
стратегией, а получаемые решения глобальных задач — комплекс-
ними решениями. Упорядоченная совокупность операций
исполнительной системы, соответствующая комплексному решению,
представляет программу операций в мире М0, т. е.
окончательный результат решения глобальной задачи решателем.
Итак, при решении глобальпой задачи подсистемы решателя
взаимодействуют следующим образом: решающая система
формирует комплексные решения глобальных задач, исполнительная
сдстема оценивает и в случае необходимости корректирует эти
решения путем имитации соответствующих операций ИО.
Указанное выше разделение функций между решающей и
исполнительной системами и введение диалога между ними ста-
§ 4.1. ПОДСИСТЕМЫ РЕШАТЕЛЯ И ИХ НАЗНАЧЕНИЕ 57
тзят все на свои места. Действительно, при построении моделп
решающей системы нас теперь будет интересовать только
эффективное решение проблемы поиска. Для этого мы будем
использовать декларативпый язык как наиболее подходящую основу для
описания механизмов мыслительной деятельности. При
построении модели исполнительной системы и ее среды нас будет
интересовать только эффективное решение проблемы описания
реальной действительности. Для этого мы будем использовать
процедуральный язык как наиболее подходящую основу для
описания актуальных знаний. А в целом при наличии диалога
между решающей и исполнительной системами можно надеяться
ла получение удовлетворительного решения проблем поиска и
лредставлеыия знаний.
Разделение функций подсистем решателя дает еще и то
преимущество, что позволяет задавать знания индуктивно, а именпо:
задавать в удобном виде для процедурной обработки массивы
исходных и результирующих ситуаций мира Д/0, а также
задавать декларативно описанные базовые отношения мира MY в
виде предикатов, эффективно интерпретируемых (вычисляемых) на
указанных массивах. Например, задание предиката ВПЕРЕДИ
в виде некоторой вычислительной программы позволяет каждый
раз устанавливать его истипностные значения по координатам
соответствующих фигур на шахматной доске.
Это обстоятельство позволяет формировать только нужные
{для решения конкретной локальной задачи) декларативные
знания и формировать их только по мере надобности.
По существу, исполнительная система — это объективный
источник знаний для решающей системы: необходимые процеду-
ральные знания запрашиваются в нужный момент и
представляются в декларативной форме. Благодаря этому создается
возможность модельных экспериментов с целью оценки выработанного
комплексного решения, определения его побочных
нежелательных эффектов, с тем чтобы с учетом результатов этого
эксперимента внести временные (для данной локальной задачи)
изменения в знания решающей системы и построить новое, более
корректное комплексное решение, а с ним и окончательную
программу операций.
Заметим, что в случае, когда реальный мир достаточно прост
и пет иадобпости в модели М0, решатель задач может
представлять единственный РО, имеющий только миры М{ и М2.
Примером такого реального мира могут служить шахматы.
Таким образом, решатель как органическое единство
решающей и исполнительной системы дает нам возможность избежать
недостатков декларативных и процедуральных форм
представления знаний, используемых по отдельности, и одновременно с
•этим наиболее полно использовать их положительные стороны.
БЗ
ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
§ 4.2. Элементы алгебраической теории бинарных отношений
Для последующего изложения материала нам потребуется
некоторый достаточно универсальный описательный язык. В
качестве такого языка будем использовать аппарат алгебраической
теории бинарных отношений [Риге, 1963; 10. Е. Цензов, 1968;
10. А. Шрейдер, 1971].
Введем обозначения: А, В, С, ...— множества; х, у, z, ...—
элементы множества; {хМ&ЗГ} — множество, задаваемое
перечислением элементов хи •+-+• — символ эквивалентности (читается
«тогда и только тогда, когда»); А\В — разпость мпожеств; А' —
дополнение множества i; с, (1, U — операции включения,
пересечения и объединения множеств; &, "^-—логические связки,
читаемые как «и», «не»; 3 и V— кванторы, читаемые как
«существует хотя бы один» и «для всякого».
В алгебраической теории бинарных отношений имеют место
следующие понятия:
А1. Декартово произведение множеств At X Аг X,.. X Ап:
(#1, Хг-i • . ., Хп) S
€Е А, X Аг X ... X Ап ■«-* (xt е4Ди2 е Л,)&... &(хп е4.1.
А2. Бинарное отношение р^АХВ:
(#, у) е р -«-•- «между х&А и у efi имеет место отношение р».
Например, если А и В — множества имен мужчин и женщин
соответственно, то р может обозначать отношение «брак».
A3. Первая проекция ргф отношения р^ЛХВ:
(х €= ргф) ++(зуе=В) ((х, у) е= р).
Например, для отношения «брак» ргф — это множество всех
мужчин, состоящих в браке.
А4. Вторая проекция ргф отношения р^ЛХВ:
(У е рг2р) «-* (Э* е= А) ({х, у) е= р).
Например, для отношения «брак» рг2р — это множество всех
женщин, состоящих в браке.
А5. Произведение с ° р отношений р^АХВ п о^ВХС:
U, z) €=о°р -*-* (Зу^В)((х, у) ёр& (у, г) go),
Например, если р и а — соответственно отношения «сын» и
«брат», то о°р — отношение «племянник».
— 1
А6. Обращение р отношения р:
-1
(г/, ж)ер^ (я?, y)€S,,.
§ 4.2. АЛГЕБРАИЧЕСКАЯ ТЕОРИЯ БИНАРНЫХ ОТНОШЕНИЙ 59
-1
Например, если р — отношение «больше или равно», то р —
отношение «меньше».
А7. Отношение тождества ДА^4Х4:
(#, ^еДл"^ (х = у).
Например, если А — множество людских имен, то Да —
множество пар одинаковых имен.
А8. «р — рефлексивное отношение» -^ р э Да. Примерами
могут служить отношения «родственник», «равно».
А9. «р — симметричное отношение» •*-+ р s p. Примерами
могут служить отношения «брак», «родственник», «рядом» и др.
А10. «р — транзитивное отношение» -^рэр2, где р2 = р ° р.
Примерами могут служить отношения «больше», «впереди»,
«старше» и др.
All. «р — отношение эквивалентности» ■<->■ ДАер&р5р&p2s
^р. Примерами могут служить отпошения «родственник»,
«равно» и др.
А12. «Отношение f^AXB является отображением»*—
— (Vx<=~A)(-]3y, у'еВ) ((*, у) ^f&(x, у') ^}&(у Фу')).
Другими словами, отношение / — это однозначная функция.
Примерами могут служить отношения «человек — возраст»,
«предмет — вес» и др.
А13. Срез pjxj отношения р^ЛХВ через элемент х^А:
y€=p\x\+-+{x,y)efp*).
Например, если р — отношение «отец», то р|#|— множество
детей, имеющих одного отца х.
А14. Срез pjXj отношения psiXB через подмножество
Х^А: -~'
i/e= pJXj —1/(== U р\х\.
В теории бинарных отношений имеют место следующие
теоремы, которые мы приводим без доказательства, Пусть psiXB,
<js#XC и xsCX-D. Тогда имеем:
Т1.0|р|ХЦ = (а.р)|Х{.
Т2. pi U XI = U р|Х|, в частности, р|0}'==0.
ТЗ. [ U P\|XJ = U р|Х|, в частности, 0JXJ = 0,
(В, если X П Аф 0,
если X П А- = 0»
—1
Т5. ргг р =* рг2р.
(В, (
Т4.(ЛхВ)|Х| = Ц
*) Введенное понятие «срез отношения» не имеет никакой связи с
ранее введенным понятием «срез плана» (см. стр. 43),
60 ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
—1
Т6. ргг р = prtf.
—1 —1 ~1
Т7. /?rlP= р \В\= р о9\А] = р |рг,р|.
Т8. /w2p = p|,4j = p. p'i^J^piprjpj.
—l _ _
Т9. р, U p2 = PiU рг.
тю. р, л р2 = рг п р1.
ти. 7 = (рГ.
^ -, -г
Т12. а о р = р о а,
Т13. ~р = р.
Т14. о • (pi U р2) = о ° р, U о ° р2.
Т15. (о! U о2) °р = 0! °р U о2°р, в частности, а°0 = 0со = 0.
Т16. роД^Д^р^р.
Т17. т о (а ° р) = (т ° о) ° р.
Т18. ао(Лх5) = Лхо|В|,
Т19. (ВхС)*р=~р\В\хС.
(ЛхС, если В,ПЯ2=И=0,
Т20. (B2xC).{AxBJ = \„ о ^D ^
v 2 ; v i; 10, если Bxr\B2 = 0.
Если придать рассмотренным понятиям и теоремам теории
бипарных отношений матричную интерпретацию, то получим в
общепринятом виде реляционную алгебру. Пусть i4={ajl^
< i ^ п) и В = {fejl 1 < / < mh Поставим в соответствие бинарному
отношению р^АХВ прямоугольную матрицу из т строк и а
столбцов, записывая 1 на пересечении у-й строки и г-го столбца,,
если (аи Ь5) е р, и 0, если (aif fcj) & р.
Легко установить, что
1) матрица, соответствующая р', получается из матрицы, со-
ответствующей р, заменой 0 на 1 и 1 на 0;
2) матрица, соответствующая пустому отношению, имеет все
элементы 0;
3) матрица, соответствующая декартову произведению АХ В,
имеет все элементы 1;
-1
4) в случае А == В матрица р симметрична матрице р
относительно главпой диагонали; матрица тождественного отношенияг
Д составлена из 1, занимающих ее главную диагональ, и 0,
занимающих остальные места.
§ 4 3 ИЕРАРХИЧЕСКИЕ СТРУКТУРЫ РЕШАТЕЛЯ ЗАДАЧ Gt
Введем следующие операции над элементами матриц:
1) объединение, определяемое согласно
01)0 = О, 1U1 = 1U0 = 0U1==1;
2) пересечение, определяемое согласно
0П0=1П0 = 0П1 = 0, 1 П 1 = 1;
3) произведение, определяемое согласно
0о0 = 0о1 = 1о0 = 0, 1 • 1 — 1.
Поясним вышесказанное на примерах. Пусть
А = {аи а2, as, aj, В = {bu 62, b3),
С = {си с2) и X = {аи а2),
p = {(at, b3)y (а2, &i), («з, bi)y (a3, b2), U4, bj, (я4, W),
pi = {(ai, fei), (a4, Ь8)э U2, W, U3, W, (^4, fei), (^4, b2))f
S={(bu ct), (6., c2)>.
Тогда матрицы, соответствующие X, p, pt и 5, будут
0
0
Л
l
0
0
1 1\
1 0 ,
0 1/
/1 0
0 0
\1 1
0
0
1
1
1
0
/1 0 0\
Легко установить, что срезу pj^j, объединению р U ри
пересечению р П Pi и произведению S ° р соответствуют матрицы
§ 4.3. Иерархические структуры решателя задач
С интеллектуальным решателем мы будем связывать
несколько различных по смыслу структур, которые рассмотрим позже.
Здесь же только отметим, что формально они ничем не
отличаются друг от друга, поэтому все их можно считать изоморфными
$2
ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
некоторой абстрактной структуре R, к описанию свойств которой
мы и переходим.
Зададим указанную структуру в виде отношения flsXXX,
где (#, х') ^R означает, что элемент же! является
непосредственным предком элемента xf е X. Элемент х в этом случае мы
будем называть непосредственным потомком элемента х.
Обозначим через х* элемент i-ro ранга U = 0, 1, ..., п). Нас будут
интересовать древовидные структуры с ветвями одинаковой длины,
ранг элементов которых отсчитывается снизу вверх, от копцевых
элементов к корневому.
Эти структуры обладают следующими свойствами:
_ т .
1) структура R ациклична, т. е. R П Ах = 0, где R = (J # —
j=i
транзитивное замыкание R; R3 — /-я декартова степень; Ах —
диагональ множества X;
2) структура R имеет единственный элемент без предка, т. о.
(3п > 0) (3 \хп е X) (Я-11 хп j = 0), где 3! — квантор
единственности; этот корневой элемент хп структуры R мы будем
называть элементом наивысшего, ?г-го ранга;
3) каждый элемент ж'еХ имеет не более одного
непосредственного предка х" еХ, т. е.
(V^eX)[(flJ*/J = 0) У (3\x"€zX)(li\x'\ = x',)\
где знак V имеет смысл «разделительного или»;
4) копцевые элементы ж0 е Х° с X структуры R не имеют
потомков, т. е. (V#° е Х°) (R \х° \ = 0); такие элементы будем
называть элементами наименьшего, нулевого ранга;
5) каждый элемент х° имеет ровно п предков, т. е.
(Зп > 0) (Vx« €= Х°) (~Rn [ х» j = хп);
6) элемент xi имеет £-й ранг (г = 1, 2, ..., гс) тогда и только
тогда, когда (3*°е Xе) № |я°| = я').
На структуре /? нас будут интересовать два типа подструктур:
1) Ri^XiXXi является концевой подструктурой i-ro ранга
(i = 1, 2, ..., п) структуры R тогда и только тогда, когда
(3Xi^X)[(V^eXO№|o:j = ^l^)&(3!xeXi)Kla:i===0)];
2) Я* s F X Y является одноранговой подструктурой
структуры R тогда и только тогда, когда
(ЗУ с X) {(3!*е У)[(Дх)*1 = ^ ]х\) & (Vx1 е= ГИЙ}^^ J]}.
Композиция одноранговой и копцевых структур г-го ранга
позволяет получить концевую структуру (г+1)-го ранга, т. е. по-
§4 3. ИЕРАРХИЧЕСКИЕ СТРУКТУРЫ РЕШАТЕЛЯ ЗАДАЧ 6$
вволяет осуществлять синтез сложных структур из более простых.
На рис. 4.2 приведена абстрактная структура R.
Системное описание решателя и его деятельности
предполагает:
1) описание уровней управления, определяемых рангом
решающих органов в некоторой управляющей структуре Ду;
Рис. 4.2. Абстрактная четырехранговая структура R.
2) описание уровней организации, определяемых рангами
исполнительных подсистем решателя в пекоторои организационное
структуре R0;
3) описание уровней решений, определяемых рангами
соответствующих локальных задач в некоторой структуре решений Rp;
4) описание уровней знаний, определяемых рангами мира
задач в некоторой структуре миров Д3.
Рассмотрим указанные структуры более подробно.
Управляющая структура Ду. Эта структура выражает
управляющие связи в коллективе решающих и исполнительных
оргапов решателя, и ее можно задать как отношение Ry s W X
X Wy где W — множество РО и ИО решателя и выражение
(w, w') e Ду следует понимать как «орган w непосредственно
управляет органом w'». Так, директор предприятия
непосредственно управляет своими заместителями. Элементами нулевого w°
и гс-го wn рангов являются соответственно ИО (например,
токарный станок на производстве) и РО наивысшего ранга (например,
директор производства). Одноранговая подструктура Rw,
включающая в себя данный РО w и непосредственно подчиненные ему
органы, выражает структуру элементарного коллектива с
лидером. Такую структуру, например, составляют директор
предприятия и его заместители. Концевые подструктуры определяют
и
ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
структуру коллектива, способного самостоятельно разрабатывать
программы операций для соответствующих исполнительных
подсистем решателя. Примерами таких структур может служить
структура «начальник цеха завода — заместители — мастера —
рабочие».
Организационная структура R0. Эта структура
определяет организационные связи исполнительных подсистем
решателя и может быть задана как отношение /?0еЛХ4, где А —
множество исполнительных подсистем решателя и выражение
{а, а) е Но следует понимать как «а является наибольшей
подсистемой исполнительной системы а». Слово «наибольшая» надо
понимать в том смысле, что не существует подсистемы а" такой,
чтобы она включала а и одновременно была подсистемой
системы а. Так, например, механический цех завода может включать
линии токарных, фрезерных, строгальных и других станков.
Элементами нулевого а0 и га-го ап рангов являются
соответственно ИО и исполнительная система решателя в целом
(например, парк стапков завода). Одноранговая подструктура Ra
определяет осповные части данной исполнительной подсистемы
(например, цех — поточные линии). Концевые подструктуры
позволяют определять состав исполнительных органов и их структуру
в соответствующей исполнительной подсистеме (например,
завод — цехи — участки — станки).
Структура решений Др. Эта структура выражает
связи локальных задач и их решений и может быть представлена
как отношение Rp =* U X £7, где U — множество решений
локальных задач и выражение (щ ы/)<=Др следует понимать как
«решение и непосредственно предопределяет решение и'».
Например, месячная программа завода может предопределять декадную
программу его цехов.
Элементами нулевого и0, 1-го и1 и дг-го ип рангов являются
соответственно операции, программы операций и решение
локальной задачи наивысшего ранга (например, производственная
операция, технологический процесс, месячный план
производства).
Одноранговая подструктура Ru выражает связь данного
решения и со всеми непосредственно предопределенными им
решениями (например, связь месячной программы предприятия со
всеми декадными программами цехов). Концевые подструктуры
позволяют проследить, как сводится решение данной локальной
задачи к соответствующей программе операций, например
месячного плана завода к технологическим процессам производства
конкретной продукции.
Структура знаний Дя. Эта структура выражает связи
миров задач отдельных органов и может быть представлена как
отношение R3 s Jl X М, где Ж — множество миров задач и выра-
§ 4.4. КОМПЛЕКСНАЯ СТРАТЕГИЯ ПОИСКА РЕШЕНИЙ 65
жеыие Ш, M')^R3 следует попимать как «мир М является
обобщением мира Л/'». Так, например, мир директора предприятия
можно считать некоторым обобщением миров его заместителей.
Элементами нулевого М° и га-го Мп рангов являются
соответственно миры операций исполнительных цодсистем и их сред
(например, мир станочника и его окружения) и максимально
обобщенный мир исполнительной системы решателя и ее среды
в целом (например, мир завода и его окружения).
Одноранговая подструктура Дм выражает связь обобщенного
мира с непосредственно обобщаемыми мирами (например, мира
цеха с мирами производственных участков). Концевые
структуры позволяют проследить, как обобщаются (или
конкретизируются) соответствующие миры (например, мир директора завода —
миры заместителей — миры начальников цехов — миры
мастеров — миры станочников).
Следует заметить, что в работе [Месарович, Мако, Такахара,
1970] структуры /?3, Яр и R0 названы соответственно стратами,
слоями и эшелонами, которые не всегда совпадают. В нашем
случае все рассмотренные уровни описания решателя совпадают,
что в значительной степени позволяет унифицировать описания
таких интеллектуальных решателей.
В заключение данного параграфа заметим также,'что понятия
«исполнительный орган» и «решающий орган» являются
относительными — все зависит от «масштаба» исследуемых решателей.
Так, например, в одних решателях в качестве ИО могут
выступать предприятия, тогда РО все возрастающих рангов будут
соответственно руководители предприятий, руководители главков,
заместители министра и т. д. Если же в качестве ИО взять
производственные участки какого-нибудь цеха завода, то РО будут
мастера участков, начальники цехов, руководители
предприятий и т. д.
§ 4.4. Комплексная стратегия поиска решений
В § 2.5 была рассмотрена на содержательном уровне
семиотическая модель мыслительной деятельности человека,
решающего задачи. Теперь нам надо обобщить эту модель на случай
иерархии решающих органов. Кроме того, мы намереваемся
уточнить ее описание, придав этому описанию, по возможности, более
формальный характер.
В основе деятельности решателя лежит взаимосвязанная
динамика структур i?y, /?o, Л3 и jRp, определяющая его комплексную
стратегию поиска решений задач. В данио*м параграфе мы
рассмотрим только макроструктуру алгоритма, отражающего
комплексную стратегию, которую будем описывать на уровне «вход —
выход» соответствующих подалгоритмов. Другими словами, мы
5 Е. И. Ефимов
66 ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
пока ограничиваемся представлением подалгоритхмов в виде
«черных ящиков» с известными входом и выходом. Описание
внутренних механизмов этих черных ящиков будет произведено пол-
же, во второй части кпиги, когда будет введен соответствующий
язык и предложен аппарат теории автоматических доказательств.
Нас также не будут интересовать пока возможные переборные
алгоритмы, осуществляющие поиск в дереве возможностей [Икль-
сои, 1971].
Итак, пусть решатель располагает определенными знаниями,
т. е. каждый его РО i-ro ранга имеет в своей памяти мир задач
Мг = (Мг0,М\, Mj>, представляющий собой трехуровневую
систему описаний элементарных задач нулевого, первого и второго
уровней. Для РО 1-го рапга нулевой уровень М\ соответствует
описаниям элементарных операций ИО. Для РО более высокого
ранга {Ki<n) нулевой уровень М\ соответствует внутренним
мирам Мз^всех подчиненных органу 1-го ранга решающих
органов нижнего (I— 1)-го ранга. Первый и второй уровни миров РО
соответствуют описаниям соответственно перцептивных и
рефлексных элементарных задач i-то ранга.
Совокупность миров всех РО решателя составляет его мир.
В этом мире решателю задаются глобальные задачи р, при этом
исходные данные s1^ e Sj и условия s£K ^ ^2 каждой такой
задачи представляются па уровнях М0 и М\ соответственно.
Окончательными итогами деятельности решателя являются
программы операций v его исполнительной системы. Следовательно,
в целом комплексная стратегия может быть реализована
алгоритмом Q поиска решений yeF доставленных задач р^Р:
Q^PXV.
Рассмотрим основные этапы реализации комплексной
стратегии и соответствующие им подалгоритмы Q^
Этап 0. Постановка локальной задачи рп. Этот этап является
начальным и служит для преобразования заданной решателю
глобальной задачи р е Р в локальную задачу рп е Рп для РО wn.
Напомним, что исходные данные локальной задачи г-го ранга
И = /г, /г— 1, ..., 1) находятся на нулевом уровне, а условия —
на втором уровне этого ранга. Таким образом, условия s^H
локальной задачи гс-го ранга совпадают с условиями глобальной
8 а дачи р и необходимо лишь найти ее исходные данные $оп- Для
этого необходимо обобщить исходные данные sJH глобальной
задачи р до нулевого уровня тг-го ранга. Это и осуществляет под-
алгоритм (V
Итак, пусть Q0^ PX Рп, и пусть имеется глобальная задача
Р *= ($си> 4к)- Тогда локальная задача рп в мире Мп = <АГ0\
§ 4.4. КОМПЛЕКСНАЯ СТРАТЕГИЯ ПОИСКА РЕШЕНИЙ 67
М™, М?> РО wn есть результат работы Q0, если (р, рп) е QQ
имеет смысл выражения
[(Gr^Gr^^^G^G\\sU\^s^)&(pn^(s^sim^ (4.1)
где
GJsSjxSi. Gjs5}x5i, ^ = 5i и i = n, л — 1, ..., 1.
В выражении (4.1) отображение 0} осуществляет требуемое
огрубление при переходе от процедурных описаний мира
операций М\ к декларативным описаниям мира перцептивных вадач
М]. Отображения G[ осуществляют требуемое огрубление при
переходе от декларативных описаний мира М0 к декларативным
описаниям мира М}, а отображения G\ осуществляют
структуризацию и обобщение при переходе от декларативных описаний
М\ к декларативным описаниям М2.
Подчеркнем еще раз качественные различия переходов между
уровнями «0—1» и «1—2». При переходе к первому уровню
происходит обобщение только по значениям свойств, например, за
счет введения их дискретных значений или путем исключения
некоторых деталей описания, как это показано в работе [Сакер-
доти, 1974]. Поэтому мир задач М\ содержит те же самые
предметы и элементарные задачи, что и мир Ml) отличны лишь их
описания.
При переходе ко второму уровню определенные совокупности
указанных предметов и элементарных задач, образующие
укрупненные объекты, предстают в них в виде разнообразных
структур, обобщение которых в различных аспектах и порождает
многообразие свойств укрупненных объектов и отношений между
ними. Таким образом, на втором уровне обобщение происходит
одновременно по предметам, элементарным задачам (операциям),
их свойствам и отношепиям между ними. А отображения G*
имитируют осознание РО wl внешнего мира в привычных для
него понятиях, например осознание шахматной позиции в таких
понятиях, как «у.белых проходная пешка», «белые развиты»,
«черным мат» и т. д.
Этап 1. Постановка рефлексной задачи р**). Пусть РО w*
предложена локальная задача рг = (4и, *2к). Согласно
семиотической модели мыслительпой деятельности решение этой задачи
начинается с поиска замысла (схемы) решения задачи р* на
рефлексном уровне. Для этого необходимо поставить соответствуй
*) Здось п в дальнейшем мы ради удобства используем для
обозначения второго уровпя знак •ч сверху.
5*
68 ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
ющуго рефлексную задачу рг = (sj,, slK), т. е. обобщить исходные
данные 5о„ задачи р1 до уровня sla. Это и осуществляет подалго-
ритм Ql
Итак, 'грусть Qt ^ Р1 X Р\ и пусть имеется локальная задача
Р* = (^ои, sк). Тогда рефлекспая задача /?*ер в мире Л/1 РО и?*
есть результат работы Qu если (/?*, pl) e (>t имеет смысл
выражения
[(Gi.G{|eio-| = *i)&(p, = («i,«K))]
ДЛЯ I = ГС, 7t — 1, . . ., 1.
Этап 2. Формирование возможного решения и1 задачи р1-
Решеиие и* задачи рг представляет замысел решения
соответствующей локальной задачи р\ Это решепие есть упорядоченная
совокупность элементарных рефлексных задач, получаемых путем
присваивания определенных описаний атрибутам
соответствующих элементарных схем Ь*^В* i-ro ранга. Набор В* указанных
схем составляет рефлексные знания, которые wi приобретает в
результате обучения заранее, до решения лок'альных задач
определенного класса. Эти схемы по существу представляют собой
результат обобщения типовых перцептивных задач.
Нам необходимо формально различать элементарные и
сложные рефлексные задачи. Для этого представим элементарную
схему как fr'sS'XS' и введем с помощью отношения p'sP'XB''
понятие «элементарная рефлекспая задача». Принадлежность
Ср\1?{) es'p' указывает, что для задачи рг = (sj,, ЗД исходные
данные и требуемый результат связаны соотношениями &к = b%\hn\r
hli ^ ^и и $к ^ &к, т. е. задача pi имеет известное решение Ь* и
поэтому является элементарной.
Решение и* обычно ищется в обратном направлении, от
требуемого результата s^ к исходным данным slw. При этом каждая
найденная элементарная рефлексная задача пока не связана с
конкретными подчиненными РО (формируется поисковая
потребность в определенных исполнителях).
Уточним, что имеется в виду под решением и\ Пусть нам
задано множество схем В* и рефлексная задача р = ($и, $к)
такая, что рг|рг j = 0. Это означает, что данная р{ не
принадлежит к числу элементарных. Однако возможно построение т-ша-
говой цепочки элементарных задач
\501> $1/» \s02 U *1> s2/-> • • • > \,<?0; U h—li Sj/i • • • i V50m U *7n-l» 5m/
такой, что для каждой р) = (^oi U Jj-i> $}) с решением &} имеет
§ 4.4. КОМПЛЕКСНАЯ СТРАТЕГИЯ ПОИСКА РЕШЕНИЙ 60
место
si
где 1} = s) U s}_j^_|+i+j—сохранившиеся результаты o,,o.j
(4.2)
(4.3)
упорядоченная
j-*
1
2
3
SD1
ь02
л *
Ь03
А
ь1
Ъ
2п
Ь1/2
Ь1/2-3
Ь2
Л-
-Я
V
А
5»*
?;=5;ш/
# / Z 3
Рис. 4.3. Замысел решения локальной
задачи.
1=1
задач (см. рис. 4.3). Тогда частично
линейная последовательность
и = &i, &2i • • •» ^т*
соответствующая вышеуказанной га-
шаговой цепочке, и есть
решение исходной рефлексной
задачи £*==(** *£)•
На рис. 4.3 решение ип
при i = n представлено в
виде треугольной таблицы,
где звездочкой *,
находящейся в строке 7 (/ = 1, ...
..., 3), помечены
необходимые исходные данные для
fej\ и находящейся в строке 4,— конечные требуемые результаты.
Из (4.2) и (4.3) следует, что в общем случае исходные данные
$и и конечные получаемые результаты 1т могут быть
избыточными.
В общем случае р* может иметь множество решений, в
частном случае — ни одного или единственное.
Итак, пусть Q2— подалгоритм поиска и*/задаваемый как
и пусть задана рефлексная задача р1 = (^и,^н). Тогда решение
и ^17г есть результат работы (?2, если (р\ ul)^Q2 имеет смысл
выражения
1т = И* U Нз
li=i
Этап 3. Задание перцептивной задачи />'*). Замысел и1
представляет схему решения локальной задачи pi в виде
последовательности обобщенных типовых (Для данного w{) подзадач
*) Для удобства здесь и далее первый уровень обозначается знаком
v сверху
70
ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
bj (Kj<m), Для каждой Ь) необходимо получить конкретную
типовую подзадачу jp\ Рассмотрим, например, задачу Ь^.
Согласно рис. 4.4 bf = (^oi, s?)^ где исходным данным Sqi
соответствуют исходпые данные $и на перцептивном уровне,
полученные ранее при работе
алгоритма Qi.
^ Таким образом, для задания
р\ остается лишь
конкретизировать «Г» что и осуществляется с
помощью подалгоритма Qs.
Связь р{ с Ь{ может быть
формально выражена через
соотношение
1 А
1
1 v
8
0~4j)~L_!
G"z
1 > 1
* L Pf J s
ff Г *1 b*
1
G2
t
n I
Рис. 4.4. Конкретизация
обобщенной подзадачи.
G«о Ь о Go.
(4.4)
Из (4.4) следует, что если задать Ъ* как пару ($и> *к)> то можно
получить (неоднозначным способом) соответствующую задачу
р1 = (sin Sk)j а именно: 1) соотношение $и = G\\ $и| позволяет
по заданному $и подобрать требуемое «и» 2) соотношение sxK е
eG2 4 позволяет по заданному $к выбрать $к- Очевидно, по-
лучаемый таким образом результат sK представляет собой, в
отличие от $к> результат совместных действий всех или части
подчиненных органу w* других РО.
Итак, пусть
и пусть задан замысел и е U . Тогда перцептивная задача
рг = ($и> 5к) есть результат работы Qa, если (и'\ /?f) es @3 имеет
смысл выражения
Этап 4. Формирование возможного решения и1 задачи р1-
Заданная перцептивная задача р* увязана через замысел и1 с
условиями s к локальной задачи р\ а следовательно, и с
условиями S K глобальной задачи р. Теперь необходимо найти ее
решение и* в виде упорядоченной совокупности элементарных задач
Ь\ что и осуществляет подалгоритм ()4 *). При этом (так же,
*) Подалгоритмы Q4 и Q2 формально тождественны, но используют
содержательно разную информацию.
§ 4.4. КОМПЛЕКСНАЯ СТРАТЕГИЯ ПОИСКА РЕШЕНИЙ 71
HP
1 У
"in *
Ь03
l"
«Г
$1/2
V *
S1/2S
AT
S2
S2fl-4
S2fi-5
*7
Щ-5
s4
$4/5
5
как и при построении замысла и*) решение и1 ишется в обратном
направлении, используя эвристику «анализ пелей и средств».
Предпочтение обратного поиска прямому предопределяется, как
правило, избыточностью исходных данных решаемых задач.
Схема поиска решения и* следующая. Согласно @4
фиксируется некоторый требуемый результат Тк и по нему ищется
подходящая схема
элементарной задачи Ь), которая и
определяет необходимые
исходные данные s]n. Если эти
исходные данные не
содержатся в заданных исходных
данных «и задачи р\ то они
в свою очередь становятся
требуемым результатом и
так далее, пока не будет
получено искомое решение или
пока не будет установлено
его отсутствие.
Решение и1 уже
привязано к конкретным
подчиненным решающим органам и
определяет, кто, что и в
какой последовательности должен действовать, чтобы решить
задачу р* в целом для данного w\ На рис. 4.5, в отличие от рис. 4.3,
представлено решение локальной задачи на перцептивном
уровне (уровне 1).
Введем аналогичным образом с помощью отношения
понятие «элементарная перцептивная задача». Пусть
и пусть задана перцептивная задача р*==($иДк) такая, что
Р )Р 1 = 0. Тогда решение и = Ъи Ь2, ..., Ъгт есть результат
работы @4, если (р\ и*) е= (?4 имеет смысл выражения
где ^JijSei, *VKeVm.
Этап 5. Формирование локальных задач для подчиненных
решающих органов. Этот этап имеет место для всех РО, за
исключением РО первого ранга. Обозначим произведение QL «> Qz •
О
Рис. 4.5. Решенне локальной
5
задачи.
72 ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
°Q%°Qi через Q, и пусть с помощью подалгоритма Q ° Q0
получено возможное решение и* перцептивной задачи р\ Проверить это
решение путем реализации соответствующих программных
модулей операций не представляется возможным, так как эти
операции содержатся в миреЛ/J Вместо этого и* необходимо
декомпозировать на рефлексном уровне (i— 1)-го ранга таким образом,
чтобы каждый подчиненный РО получил свою локальную задачу.
Выделение локальных задач подчиненным РО согласно под-
алгоритму (?5 состоит в следующем. В полученном решении и1
задачи рг каждая элвхментарная задача V должна быть связана
с определенным подчиненным РО. Для каждого такого РО
выделяются конечные результаты соответствующих элементарных
задач, которые должны быть решены им самим. Эти результаты
упорядоченные, например, по времени и конкретизированные в
соответствии с понижением ранга составят условия его
локальной задачи. Кроме того, для этого же органа выделяются
конкретизированные и упорядоченные конечные результаты
элементарных задач, которые должны быть получены другими РО.
Последние составят исходные данные его локальной задачи. Таким
образом, при формировании локальных задач для каждого
подчиненного РО одновременно фиксируется и их взаимосвязь, чем
и осуществляется координация этих РО.
Пусть, например, некий подчиненный РО должен решать
задачи &з и ^5 (см. рис. 4.5). Тогда для него локальная задача
задается парой (5ой~\ ^к^1), где конкретизированные исходные
данные s0H e Gj о G2 <> 64 j [s03, s^, s 2/3_4, s4) j и
конкретизированный требуемый результат
sK e Gx jls3l s5|j.
Пусть P)"1 = (pj"1} — пространство локальных задач /-го
подчиненного органа w}"1. Обозначим объединение пространств U Р]~1
через &*~\ Таким образом, имеем р)"1 е PJ'1 с 9>х~х. Пусть
и пусть задано решение и е U и Д;И* <= и\ где Д,и* —
упорядоченная последовательность элементарных задач, решаемых
органом w]"1 (например, последовательность Ь3,ЪЪ; см. рис. 4.5).
Тогда локальная задача р]~х е $Р является результатом
работы Qby если (и1, р]~г) е Qb имеет смысл выражения
§ 4.4. КОМПЛЕКСНАЯ СТРАТЕГИЯ ПОИСКА РЕШЕНИЙ 73
-/,
Таким образом, каждый подчиненный у'-й РО получает свою
локальную задачу р]""1.
Алгоритмы, соответствующие рассмотренным этапам 1—5,
реализуются на каждом ранге иерархии согласно очередности
формируемых локальных задач и выбранному алгоритму перебора
элементов дерева возможностей вплоть до решающих органов 1-го
ранга. Для этих органов указанный цикл заканчивается этапом 4,
т. е. формированием решений и1. В итоге формируется
комплексное решеппе к1 глобальной задачи р.
Этап 6. Определение программы операций v. Этот этап
имеет место только для РО 1-го ранга. Он состоит, во-первых, в
проигрывании полученного
комплексного решения и1 с помощью
соответствующих операций
(имитационных программ)
исполнительной системы решателя, во-вторых,
в оценке их побочных эффектов,
возможных в результате
огрубления мира задач (например,
вызываемых неучетом решающей
системой препятствия в задачах
перемещения робота по
местности). В соответствии с оцепкой
осуществляется, если это
необходимо, корректировка или полная
замена снизу вверх ранее полученных локальных решений и,
следовательно, всего комплексного решения. В итоге
формируется координационная программа v = и0. Это осуществляет подал-
горитм <?в.
Пусть, например, рис. 4.5 представляет решение и1 для РО
1-го ранга, т. е. пусть п =» 1. Связь М\ с миром М0 осуществляет-
ся так, как показано на рис. 4.6 на примере Ъ^ Здесь исходные
данные h\ = {$1/2-^3» 5з! и требуемый результат h^ = {sl\.
Исходные данные hxl через соотношение hi;— G\\h^\ как бы
настраивают программу Ь\ на определенный вариант счета, т. е.
конкретизируют ее параметры и вход, а требуемый результат h\ через
"I
г
&
&
Рис. 4.6. Формирование операции
плапа.
ё!>
соотношения К^ G\\hl\ и К=*Ь1\}гн\ осуществляет контроль
правильности результатов работы программы Ъ\.
Таким образом, элементарная задача Ь1 связывается с
элементарной операцией Ь° (см. рис. 4.С) «следующим соотношением:
Ь° е= G \ о Ъ1 о G\.
74
ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
Аналогичным образом может быть истолковано и соотношение
wesGl.»1.*?}. (4.5)
Итак, пусть
и пусть задано решением е U . Тогда программа v&V есть
результат работы ()в, если (и\ и) &Q6 имеет смысл выражения (4.5).
Очевидно, комплексная стратегия в целом имеет
иерархическую структуру. В этой структуре полная ветвь представляет
рассмотренный алгоритм @ s JP X V, макроструктура которого мо-
жет быть представлена в виде цикла Qb° Q ° Qo по всем рангам
с выходом на подалгоритм (?в, т. е.
/ L
т I
При этом на 1-й ранге (К^^/г) некоторой ветви дерева R для
фиксированного РО будет реализована следующая схема
комплексной стратегии:
1) определение рефлексной задачи р* путем обобщения
исходных данных *ои с помощью подалгоритма Qt;
2) нахождение решения иг= bj, Ь2> • • • ^ рефлексной задачи
р с помощью подалгоритма Qz;
3) определение с помощью Qs перцептивной задачи р\
соответствующей Ь*е и1 и выражающей согласно р е G2 ° 6 ° Gl
требования к будущему решению и*;
4) нахождение решения и = 6lf Ьа, ..., Ьт перцептивной
задачи с помощью подалгоритма @4;
5) определение для подчиненного /-го РО с помощью
подалгоритма Qs локальпой задачи р1"1, соответствующей AjU1 е и* и
выражающей согласно р)"1 е Gx<> Д;и oGx требования к
будущему решению и}"1;
6) нахождение (только для РО 1-го ранга) с помощью
подалгоритма QQ программ операций v согласно ^gGi • и1 ° G[.
Относительно программ операций, получаемых на основе
рассмотренной комплексной стратегии, необходимо заметить
следующее. Согласно структурам Ду, Др и R0 каждой подсистеме РО
соответствует своя подпрограмма операций ИО и своя
исполнительная подсистема. Таким образом, всю программу (как и всю
§ 4.5. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ МОДЕЛИ РЕШАТЕЛЯ ЗАДАЧ 75
исполнительную систему) можно представить как иерархию
вложенных друг в друга подпрограмм. В этом смысле программа
операций охватывает все исполнительные органы и является
сбалансированной по ресурсам.
Кроме того, программа операций является «скользящей», т. е.
по мере выполнения первоочередных задач дальнейшие задачи
уточняются и наращиваются так, что условия глобальной задачи
как бы «скользят» по временной оси вместе с исходными
данными, оставаясь на фиксированном «расстоянии» друг от друга.
И, наконец, по мере удаления в будущее программа операций
становится тем менее достоверной, чем ниже расположение
по дереву R соответствующей локальной задачи. Поэтому «рав-
нодостоверное» комплексное решение имеет форму опрокинутой
прямоугольной трапеции.
Основное назначение программы операций состоит в том,
чтобы обоснованно выбрать (принимая во внимание скольжение)
начальные операции, увязанные с далеко идущими глобальными
целями.
§ 4.5. Теоретико-множественные модели решателя задач
В данном и следующем параграфах мы рассмотрим некоторые
теоретико-множественные модели решателя. Назначение таких
моделей — указать на основные компоненты того или иного типа
решателя и тем самым показать в чем их отличия.
В работе [Месарович, 1965] проблема теории решений задач
формулируется в самом общем виде следующим образом. Пусть
любая система описывается тройкой <W, У, Г>, где W^XXZ —
область определения отображения Т s W X У, X — множество
входных сигналов, Z — множество состояний и У — множество
выходных сигналов системы. Тогда проблема заключается в том,
чтобы по заданным множествам W и У найти требуемое
отображение Т.
Месарович приводит одну из возможных конкретизации
указанной проблемы, предлагая модель решателя в виде четверки
<И7, Я, У, F>, где II czW, У <= W и F — индуктивный класс
сложных преобразований f^WXW, строящихся из базисных
преобразований /о ^ FQ. В данной конкретизации проблема
формулируется так: задапы множества W, Н и У, необходимо построить
из f0&F0 функцию fe=F, удовлетворяющую условию: «w^II
тогда и только тогда, когда / J w \ о У»..
Примером такой конкретизации может служить система
доказательства теорем, в которой W — множество правильных
формул исчисления высказываний, У — множество выводимых
формул, w е // —. множество аксиом, используемых в доказательстве
76
ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
i/sF, F0 — множество схем базовых правил вывода, примером
которых может служить схема modus ponens, и F — множество
конкретных доказательств, представляемых в виде упорядоченной
совокупности базовых правил вывода (схема правила
превращается в конкретное правило при подстановке в схему конкретных
формул). Эта система служит для поиска доказательств j&F.
В вышеприведенной модели декартово произведение Н XY
задает множество решаемых задач с решениями f&F. Если
принять, что W—множество правильно описанных ситуаций и Р=»
•= W X W представляет расширенное множество задач, в том
числе, возможно, иерешаемых, F0*=M0 и F = V — множество
программ н мире М0, то вышеуказанная модель может быть
представлена в более привычном для нас виде, как
N = Ш0, Р, V>. (4.6)
Из (4.6) следует, что необходимыми компонентами решателя
являются: объективный мир операций М0, представляющий
первичные знания решателя, задачи р^Р, играющие роль входных
сигналов, и решения v e Vy играющие роль выходных сигналов.
Однако необходимо отметить, что конструктивность подобных
моделей, как, впрочем, и других, в первую очередь зависит от
эффективности описания соответствующих
теоретико-множественных компонент, на что обращалось внимание еще Бенерд-
жи [1969].
На дальнейших, более конструктивных моделях решателя мы
постараемся проследить, как модифицировались указанные
компоненты и какие формы их описаний при этом использовались.
Большой класс практически важных систем составляют системы,
характеризуемые большим числом ситуаций s e S и
сравнительно небольшим числом схем решений Ъ^В. Основное внимание
в этих системах уделялось эффективному описанию ситуаций
в декларативной форме. Так возникли ситуационные модели
решателя [Д. А. Поспелов, 1971; Ю. И. Клыков, 1974].
Так как применение известной схемы решения к исходной
ситуации однозначно приводит к необходимому результату, то
ситуационные модели имеют дело с вырожденными задачами,
определяемыми только множеством исходных ситуаций S.
В ситуационных моделях знания решателя имеют довольно
сложную и глубокую структуру. Во-первых, это объективный мир
MQ стереотипных решений, которые в нашей терминологии
следует принять за элементарные операции. Во-вторых, это внешний
мир М{ схем решений, т. е. решений, у которых описание
атрибутов ИСХ-ДАННЫЕ и ТРЕБ-РЕЗ не фиксировано.
Указанная специфика ситуационных систем — значительное
преобладание числа ситуаций над числом схем решений — позво-
§ 4.5. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ МОДЕЛИ РЕШАТЕЛЯ ЗАДАЧ 77
ляет сводить задачу управления объектом к задаче распознавания
класса ситуаций, априори соотнесенного с известной схемой
решения. Это осуществляет алгоритм Q = (?3 ° Q20 Qu где Qi ^ S0 X
X Si — алгоритм распознавания микроситуаций, Q2 ^ Si X Вх —
алгоритм выбора подходящих схем решений, Q3 ^ ВА X В0 —
алгоритм выбора стереотипных решений, 50 — множество
микроситуаций и В0 — множество операций мира М0, Si — множество
макроситуаций и Вх — множество схем решений мира Mit
Таким образом, ситуационную модель решателя можно
представить следующей пятеркой:
N = Ш0, Ми Q, S0, B0>.
Ситуационные модели решателя позволяют эффективно
описывать в декларативной форме стационарные среды,
характерные для технологических систем (см. § 1.1), однако в силу
практического предназначения они не располагали стратегиями,
которые позволяли бы вести эффективный поиск неэлементарных
решений в сложных динамических средах, характерных для
целенаправленных систем.
Попытки автоматизировать процессы решения задач
человеком привели к созданию одноранговых моделей типа
N=<MuQ,Pf V>,
в которых основное внимание обращалось на построение
эффективных стратегий поиска решений Q. Характерной особенностью
этих моделей являлось также то, что они описывали деятельность
решателя в простых средах, вследствие чего отпала необходимость
в компоненте М0, но зато возникла возможность построения
многошаговых решений v e V.
Моделями указанного типа обладают такие известные
решатели задач, как GPS [Ныоэлл, Шоу, Саймон, I960], STRIPS
[Файкс, Нильсон, 1971; Файкс, Харт, Нильсон, 1972], QA3 [Грин,
1969J, ПРИЗ 1Э. X. Тыугу, 1977J, ABSTRIPS [Сакердоти, 1974],
АЛПЕВ-ЛОМИ-2 [Н. А. Шанин, Г. В. Давыдов и др., 1965], ППР
[В. П. Гладун, 1977] и другие
Модели этих решателей использовали различные формы
описания и методы построения указанных компонент. Так,
например, общий решатель задач GPS имел процедуральную модель,
в которой мир Mi представлял процедуральпые описания схем
элементарных задач, пространство Р — одноуровневые задачи
преобразования исходных ситуаций в конечные, алгоритм Q —
стратегию, основанную на редукции (сведении) решаемых задач к
подзадачам, а множество V — линейные последовательности
элементарных задач. Более подробно эти и другие решатели будут
рассмотрены в третьей части книги.
78 ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
§ 4.6. Система формального интеллекта
комплексных стратегий поиска решений (СФИНКС)
В данном, заключительном параграфе мы завершим начатое
ранее рассмотрение моделей решателя построением его наиболее
общей концептуальной модели. Поскольку построение модели
решателя задач, способной автоматически находить решения
интеллектуальных задач с помощью комплексной стратегии поиска (см.
§ 4.4), по существу означало бы создание некоего «формального
интеллекта», то мы сочли возможным назвать такую модель
системой формального интеллекта комплексных стратегий —
СФИНКСом.
Рассмотрим СФИНКС как некоторую семиотическую модель.
В работе [Е. И. Ефимов, Д. А. Поспелов, 1977] Д. А. Поспелов
предложил определение семиотической модели в виде семерки:
\у= <Г, Н, W, в, X, 5, Q>, (4.7)
в которой подсистема А = <Г, //, *F, 0> является формальной
системой, а подсистемаN В = <Х, В, Ш представляет индуктивную
компоненту модели W, предназначенную для изменения
указанной формальной системы в режимах обучения и адаптации
применительно к конкретной предметной области. Таким образом,
система Л выражает синтаксический аспект модели W, а
система В — ее семантический и прагматический аспекты.
В системе Л множество Т есть множество базиспых символов;
Н — множество синтаксических правил, при помощи которых из
символов Т образуются синтаксически правильные выражения;
Ф — подмножество множества синтаксически правильных
выражений, определяемых как семантически правильные выражения,
т. е. как выражения, имеющие смысл.
Семантически правильные выражения в свою очередь можно
подразделить на посылки, следствия и аксиомы,
интерпретируемые соответственно как исходные факты, выводимые факты и
законы данной предметной области. В тех случаях, когда это
возможно, для исключения из рассмотрения бессмысленных
синтаксически правильных выражений правила из // строятся таким
образом, чтобы получать нз символов Т только семантически
правильные выражепия.
Множество © представляет правила, позволяющие получать
из элементов W новые семантически правильные выражепия.
Множество 4я может быть многосортным, и правила Я и О должны
учитывать это.
Система В отражает основную специфику семиотических
систем. Правила из X изменяют множество \Р путем модификации,
введения или удаления законов- предметной области. В отличие
от обычных формальных систем, в которых W может расширять*
§ 4.6. ФОРМАЛЬНЫЙ ИНТЕЛЛЕКТ КОМПЛЕКСНЫХ СТРАТЕГИЙ 79
ся только за счет применения к нему правил 0 (получение из
исходных посылок следствий), в семиотических системах
допускается в режиме обучения как добавление новых аксиом в Чг,
так и исключение устаревших. Правила в при этом могут
относиться как к содержащимся в данный момент в Т семантически
правильным выражениям, так и к отсутствующим. Таким
образом, правила X выражают семантический аспект модели W.
Правила 3 определяют изменение правил 0. В теории
целенаправленных систем проблема изменения правил 0 обычно
трактуется как задача адаптации системы к данной предметной
области. Правила S представляют прагматический аспект модели W.
Наконец, правила Q изменяют правила Я, т. е. синтаксис
модели W. Подобное изменение можно рассматривать, например,
как процедуру перекодировки фактов из одной системы знаний
решателя в другую его систему знаний.
В работе [Е. II. Ефимов, Д. А. Поспелов, 1977] также
отмечаются следующие основные особенности семиотических систем:
1) семиотические системы являются открытыми, поскольку
являются открытыми множества Тиб;
2) семиотические системы пригодны для реализации как ий-*
дуктивыых, так и дедуктивных процессов вывода, а также
процессов адаптации и обучения (последнее является следствием
открытости Тиб);
3) в семиотических системах правила 0 могут иметь
произвольный вид, в частности, быть размытыми правилами вывода,
аналогичное утверждение можно сделать и относительно правил
X, Е, Й.
Выражение (4.7) дает общее представление семиотической
модели, жизненный цикл которой включает все три вида
«деятельности»: решение задач, обучение и адаптация. Поскольку
нас в первую очередь интересует решение задач, рассмотрим
более конкретное (теоретико-множественное) представление
семиотической модели решателя.
Модель TV является семиотической моделью типа СФИНКС,
если она представима в виде следующей шестерки символов:
ЛГ-<Д, Д/0, М, Q,P, V>. (4.8)
Поясним смысл каждой компоненты модели N.
Символ R — иерархическая структура, изоморфная
управляющей Нуу организационной Л0, модельной R9 и решающей Rp
структурам решателя.
Символ М0 — мир операций, задаваемый программным
описанием элементарных операций ИО решателя и законов внешней
среды; входами и выходами этих программ служат фрагменты
ситуаций в мире М0.
80 ГЛ. 4. РЕШАТЕЛИ ИНТЕЛЛЕКТУАЛЬНЫХ ЗАДАЧ
Символ М — мир вадач решателя, который согласно
структуре R задает миры
мг « \мо J+ м[ +Х м\/-
Мир М\ представляет собой описания элементарных
рефлексных задач U—D-го ранга, соотнесенные с подчиненными
РО (для РО 1-го ранга этот мир включеп в М0). Мир М[
представляет собой описания элементарных перцептивных задач i-vo
ранга. Мир М\ представляет собой описания элементарных
рефлексных задач i-ro ранга. Отображение G\ проецирует
объективный мир Ml на внешний М\ путем огрубления значений
соответствующих свойств или путем исключения некоторых
деталей описаний (в частпости, G\ проецирует процедуральные
знания Мг0 на декларативные М\). Отображение G\ проецирует
внешний мир М\ на внутренний М\ путем структуризации и
обобщения соответствующих элементарных предметов и задач.
Символ Q — алгоритм комплексной стратегии поиска
программ операций исполнительной системы решателя, который
согласно структуре /?р осуществляет решение локальных задач
разного ранга.
Символ Р—пространство глобальных задач, играющих роль
входных сигналов решателя.
Символ V — пространство программ операций, играющих роль
выходных сигналов решателя.
Представление (4.8) рассматривает только один из
возможных видов «деятельности» модели решателя, а именно решение
задач. При этом предполагается, что модель уже обучена и
адаптирована к окружающей среде при помощи правил X и S и,
таким образом, в нее введены описания элементарных задач
различных рангов и уровней (элемепты множества 40 и правил
вывода 0. В модель введены также правила Q в виде
вышеуказанных отображений G\ и G2.
В соответствии с иерархией Л модель знаний <ЧГ, 0, Q>t
описанная в соответствии с синтаксисом Н при помощи базовых
символов Г, условно расчленена на процедуральные <М0, Q>
и декларативные <М> знания. Из множества *¥ выделены также
исходные и целевые факты и представлены в виде Р.
Таким образом, предметом нашего дальнейшего изучения
являются модели типа СФИНКС. Теория моделей такого типа
предполагает описание и изучение .системы знаний решателя и
построение и изучение процедур поиска искомых решений. Этим
проблемам и посвящена вторая часть книги.
ЧАСТЬ II
ТЕОРИЯ АВТОМАТИЧЕСКИХ РЕШЕНИЙ
ГЛАВА 5
ЛОГИЧЕСКИЕ СИСТЕМЫ
§ 5.1. Проблема автоматизации
При рассмотрении па содержательном уровне поведения
интеллектуального решателя отмечалось, что его основу составляет
мыслительная деятельность РО. В этой деятельности на первый
план выдвигаются качественные рассуждения, которые
предваряют и предопределяют количественные решения.
Для формального описания мыслительной деятельности
необходимо выбрать или построить подходящий аппарат. Исходя
из дедуктивного характера процедур решения задачи человеком,
в качестве такого аппарата можно попытаться использовать
логические исчисления. Продемонстрируем это на следующем
примере.
Пусть в некоторой предметной области имеют место аксиомы
Fi — «если робот располагает ресурсами (<?), то он
ориентируется в нужном направлении (Р)» и F2—«если робот
ориентируется в нужном направлении (Р) и располагает ресурсами {Q),
то он достигает нужного места Iff)», а также посылка F3 —
«робот располагает ресурсами (Q)».
Пусть также на языке некоторого прикладного исчисления
Т указанные аксиомы и посылку можно записать формально в
виде следующих истинных формул: Ft: Q=>P9 F2: P&Q^>R 11
F3: Q.
Интуитивно очевидно, что, когда формулы Fu F2 и F3
истинны, истинна формула F4: Д. Поэтому мы утверждаем, что в
интересующем нас непротиворечивом исчислении Т формула F3 :=> Fx
должна логически выводиться из аксиом Fi и F2. Формально это
записывается в виде
Fi9F2\-F>=>Fk.
Из теории доказательств (см., например, [Клиыи, 19671)
следует, что формула F3 =э Fk должна представлять теорему. Теперь
припишем следующую семантику выражениям рассмотренного
исчисления. Пусть FY и F2 описывают элементарные задачи
(действия), F3 и Fk — исходные данные и требуемый результат ре-
6 Е. И. Ефимов
82
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
шаемой неэлементарной задачи Fe=>F4. Тогда упорядоченная
последовательность аксиом Fu F2, используемых в доказательстве
формулы F3 => F4, интерпретируется как решение задачи F3 => Fk,
Подобный подход к проблеме поиска решений задач мы
находим у С. Ю. Маслова [1979J. С. Ю. Маслов предлагает для
заданного класса творческих задач строить подходящее исчисление
ТР таким образом, чтобы аксиомами этого исчисления являлись
задачи с априори известным решением, а правилами вывода
служили конструкции вида р{, р2, ..., рт Ь р0, гарантирующие
решаемость задачи р0 в случае решаемости задач ри р2, ..., рт.
При наличии такого исчисления ТР задача р&Р имеет решение
тогда и только тогда, когда она выводима в ТР. Найти решение
задачи —- это значит найти один из возможных ее выводов.
Таким образом, если представить элементарные задачи в виде
аксиом, решаемые задачи — в виде формул (теорем) некоторого
прикладного логического исчисления, то можно надеяться свести
проблему поиска решений задач к проблеме поиска доказательств
соответствующих теорем.
Однако па этом пути могут быть свои трудности. Если мы в
настоящее время достаточно преуспели в сфере прикладной
математики и автоматизации численных решений, то в сфере
прикладной математической логики и автоматизации умозрительных
рассуждений наши успехи пока еще весьма скромные.
Итак, проблема автоматизации решений задач выливается в
проблему автоматических доказательств теорем в пекоторой
прикладной системе математической логики. В свою очередь,
проблема автоматизации доказательств сталкивается с необходимостью
построения общей механической процедуры доказательства
теорем.
Здесь возможны два принципиально различных подхода.
Первый подход уже имеет свою давнюю историю и основывается на
попытках построить эффективные процедуры доказательств
применительно к существующим модификациям классических
формальных систем математической логики. Второй подход имеет
более короткую историю и основывается на попытках построить
эффективные процедуры доказательств, использующие те или
иные схемы мыслительной деятельности человека, решающего
задачи, и, вследствие этого, не ориентированные на указанные
модификации.
Второй подход, по-видимому, является более перспективным,
и ему в дальнейшем будет уделено основное внимание. В
данном параграфе мы рассмотрим в историческом плане лишь
первый подход.
Человеческая мысль издавна, еще со времен Лейбпица (1646—
1716), была направлена на то, чтобы найти общую механическую
процедуру доказательств. Однако первый успех в этом направ-
§5.1. ПРОБЛЕМА АВТОМАТИЗАЦИИ
83
лении обозначился лишь в 30-х годах напгаго столетия, когда
Эрбраном (1930) была доказана очень важная теорема,
послужившая основой для предложенного им механического метода
доказательства теорем.
Так как во всякой непротиворечивой логической системе
каждая теорема является общезначимой (истинной во всякой
интерпретации)*) и, следовательно, не общезначимая формула не
может быть теоремой, то Эрбран предложил алгоритм для
нахождения интерпретации, не удовлетворяющей данной формуле.
Если задапная формула в действительности была общезначимой,
то такой интерпретации не находилось и алгоритм Эрбрана
устанавливал этот факт за конечное (может быть, большое) число
шагов. Если же заданная формула в действительности не была
общезначимой, то алгоритм Эрбрана не мог установить этого
факта за конечное число шагов. Таким образом, при отсутствии
в то время вычислительных машин алгоритм Эрбрана оказался
чрезвычайно трудоемким для ручных вычислений и не получил
практического применения. К тому же Черчем и Тьюрингом,
независимо друг от друга, в '1936 г. была доказана
неразрешимость логик первого порядка относительно общезначимости, т. е.
было доказано отсутствие конечного алгоритма определения
общезначимости любой формулы логики первого порядка, что
окончательно погасило интерес к результатам Эрбрана.
С появлением вычислительных машин интерес к
механическому доказательству теорем вновь возрос. В 1960 г. впервые
эрбрановский алгоритм с небольшим изменением был реализован
на ЭВМ Гилмором. Поскольку отрицание общезначимой формулы
есть противоречивая формула, программа Гилмора осуществляла
поиск противоречивости отрицания данной формулы. Программа
оказалась неэффективной.
Дальнейшее усовершенствование эрбрановской процедуры,
внесенное Дэвисом и X. Путнэмом [I960], мало что изменило.
Значительный прогресс в автоматическом доказательстве теорем
связан с появлением принципа резолюций, разработанного
Дж. Робинсоном [1965].
Принцип резолюций неоднократно усовершенствовался за счет
разработок стратегий поиска доказательств: семантическая
резолюция [Мельцер, 1966; Слэйгл, 1967; Ковальский и Хэйес, 1969],
линейная резолюция [Лавленд, 1968; Лакхэм, 1969; Андерсон и
Бледсоу, 1970J, резолюция поддерживающего множества [Вое,
Робинсон и Карсон, 1965] и другие.
Рассмотрению принципа резолюций и посвящается
следующий параграф.
*) Если формула пститтна в некоторой интерпретации, то говорят, что
эта интерпретация удовлетворяет данпой формуле.
6*
84
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
§ 5.2. Принцип резолюций
Принцип резолюций мы рассмотрим в сокращенном варианте
применительно к односортовой логике первого порядка,
используя в основном работу [Чэнг и Ли, 1973].
5.2.1. Синтаксис логики предикатов. Предикатом называется
определенная на индивидных переменных хи ..., хп
пропозициональная функция Р(хи ..., хп), область значений которой
составляют утверждения: истинные (И) или ложные (Л).
Примером может служить предикат БОЛЬШЕ (я, i/), у которого х и
# —индивидные переменные сорта «числа», а одно из
возможных значений представляет утверждение БОЛЬШЕ (2, 3),
ложное в данном случае.
Символ Р является символом отношения, число п
переменных х{ (i = 1, 2, ..., п) определяет местность предиката,
значениями переменных Хг являются индивиды, например числа,
предметы и т. д. При /г = 1 символ Р выражает свойство индивида,
при п>2 — отношения между индивидами.
Синтаксис логики предикатов следующий: переменпые х, у,
zt ...; индивиды а, 6, с, ...; функциональные символы fu /2, .. .;
символы отношений Р, Q, R, ...; символы логических операторов
■°°, =э, &, V, —, V и 3. Далее вводится определение выражений
логики предикатов. Всякая переменная или индивид есть терм.
Термом является также выражение j№u • • •> *«)> где tu ..., tn
в свою очередь также термы. Например, пусть /—имя функции
«плюс», тогда (плюс (#, 1)) — терм, (плюс (плюс {х, 1)), х) —
также терм.
Предикат P(tu .. ., tn), где ti9 ..., tn — термы, является
атомарной формулой. Если А и В — правильно построенные
формулы (ППФ), то Л, Л со #, А^В, А&В и АЧВ-ППФ. Если
А — ППФ и х — переменная в А, то УхА и ЗхА — ППФ.
Примеры формул: Ух (Q{x) =>R(х)) — каждое рациональное
число Q(x) есть действительное число R(x); УхЗуР(х, у) —
для каждого х существует у такое, что х < у.
Переменная в формуле называется связанпой, если она
находится в пределах области действия квантора, примененного к
этой переменной. Переменная свободна, если она не связана.
Например, в формуле Ух Р('х, у) переменная х связана, а у
свободна.
5.2.2. Интерпретация. Интерпретация формулы Е логики
предикатов включает однородную предметную область М и
приписывания значений каждому индивиду, функциональному символу
и символу отношения в Е следующим образом: каждому
индивиду ставится в соответствие определенный объект в М,
каждому функциональному символу / — отображение Мп в Л/, каж-
§5 2. ПРИНЦИП РЕЗОЛЮЦИИ
85
дому символу отношения Р — отображение Мп в множество
{И, Л).
Атомарная формула Р(аи ..., ап) истинна в Л/, если между
ее объектами, соответствующими аи ..., ап, в М' имеет место
отношение, соответствующее Р. Если А истинна в М, то А
ложна. Формула А со В истинна в М тогда, когда А и В
одновременно истинны или ложны в М9 в остальных случаях она ложна.
Формула А"=>В ложна в М тогда, когда А истинна, а В ложна в
Л/, в остальпых случаях она истинна. Формула А & В истинна
в М тогда, когда А и В одновременно истинны в М, в остальных
случаях она ложна. Формула А V В ложна в М тогда, когда
одновременно ложны А и 5, в остальных случаях она истинна.
Формула Ух А(х) истинна в М тогда, когда А(х) истинна для
любого значения х из Л/, в остальных случаях она ложна.
Формула В х А(х) истипна в Л/ тогда, когда А(х) истинна хотя бы
для одного зпачения х из Л/, в остальных случаях она ложна.
Таким образом, в логике предикатов установление
истинностного значения формулы Е зависит от интерпретации. К чему
это приводит, мы рассмотрим на конкретном примере. Пусть
Е = Р(у) V V х(Р(х) =><?), и пусть М = {а, Ь). Тогда, учитывая
всевозможные приписывания, мы ус- Таблица 5-1
танавливаем, что предикат Р(х)
может иметь четыре истинностные
таблицы $i (см. табл. 5-1), каждая из
которых имеет равные права на свое
существование. Учитывая далее, что
i|), имеет четыре значения,
высказыванию Q можно приписать два
возможных значения (И или Л), и что
либо у = а, либо у = Ь, получим шестнадцать возможных
интерпретаций формулы Е.
Легко видеть, что в общем случае истинностных таблиц \|)*
будет 2т , где т — число объектов в Л/, а п — местность
атомарной формулы. Поэтому с ростом Е и М число возможных
интерпретаций формулы Е будет расти очень быстро. Так как для
установления общезначимости формулы Е необходимо иметь в
виду всевозможные ее интерпретации, то легко заметить, что их
перечисление не является эффективной процедурой, а при
бесконечной области М и конечной процедурой. Отсюда следует,
что логика предикатов первого порядка неразрешима
относительно общезначимости.
Будем считать, что формула Е общезначима, и обозначать
это как Pi?, если она остается истинной в любой области Л/.
Формула Е выполнима в Л/, если она истинна при одних
значениях переменных х и ложна при других. Формула Е противо-
X
а
Ь
р(х) j
*i
и
и
ф2
и
л
*■
л
и
4-4
л
л
86
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
речива, если она ложна в любой области М. Область Му
удовлетворяющая Е (т. е. Е истинно в М), называется моделью Е.
5.2.3. Логическое следование. Важным попятием в логике
предикатов является логическое следование. Формула G
логически следует из формул Fu ..., Fn тогда и только тогда, когда
всякая интерпретация /, удовлетворяющая F± & ... &Fn,
удовлетворяет также и G. Формулы Fif ..., Fn называются посылками^
G — заключением логического следования, и мы пишем Fu ...
..., FnEG.
Важность логического следования устанавливают следующие
теоремы.
Теорема дедукции. Пусть даны формулы Fu ..., Fn и
формула G. Формула G является логическим следствием Fti ..., Fnt
тогда и только тогда, когда формула Ft&. ..&Рп^э G
общезначима, т. е. 1= (Л &.. .&Fn => G).
Доказательство, (а) Пусть G является логическим
следствием .Fu ..., Fn, и пусть / — произвольная интерпретация.
Если Ft, ..., Fn истинны в /, то согласно определению логического
следования G также истинна в/и, следовательно, истинна в /
формула F± &.. .&Fn^ G. С другой стороны, если хотя бы одна
из формул Fu ..., Fn ложна в /, то формула Ft &.. .&Fn => G
истинна в /. Таким образом, первая часть теоремы доказана.
(б) Пусть формула Ft&.. .&Fn^=> G общезначима. Тогда для
любой /, если Е± &.. .&F„ истинна в /, то G также истинна,
т. е. G является логическим следствием Fu ..., Fn. Теорема
доказана.
Теорема о противоречивости. Пусть даны формулы Fu ..., Fn
и G. Формула G является логическим следствием Fu ..., Fn
тогда и только тогда, когда формула Ft & .., &Fn & U противоречива.
Доказательство. По теореме дедукции формула G
является логическим следствием Fu ..., Fn тогда и только тогда,
когда формула Fx & ... & Fn =э G общезначима или, что то же
самое, ее отрицапие противоречиво. Взяв указанное отрицание и
проведя соответствующие преобразования, получим
T~t&...&n^G « f1&...&f»v"g - Fi &... & Fn & a.
Обе теоремы важны в том смысле, что позволяют сводить
логическое следование некоторой формулы из конечного
множества формул к установлению общезначимости или
противоречивости определенных формул.
5.2.4. Процедура стандартизации. Для процедуры
доказательства методом резолюций используются препексные (или
предваренные) нормальные формы (ПНФ). Формула Е имеет ПНФ,
если она представлена в виде(>|1#1 ... >1?Ai) C\ где >h#i-. >У\п%п—
префикс, >jiS{V,3} и С —матрица в конъюнктивной нор-
§ 5.2. ПРИНЦИП РЕЗОЛЮЦИЙ
87
мальной форме (КНФ)*). Для преобразования произвольной
формулы в ПНФ используются следующие известные тождества
логики предикатов:
1. F«>G-(F=>G)&(G=>F).
2. F=>G^F\/G.
3. FV (G&II) **{FVG) & (F VЯ).
4. F^F.
5а. FVG^F&G. 56. F&G**FVG.
ба. y\xF(x) \JG*~y\x(F(x) \J G).
бб. y\xF (я) & G ss y\x (F (x) & G).
7a. VxF{z)mM3xF(x). 76. 3xF (x) a VxF (x).
8a. VxF (x) &V*#(x)z~Vx(F (x) & H(*)).
86. ZxF (x) V 3xH (x) = 3* (F (x) V H (x)).
9a. ^\1xF(x)\/y\2xH(x)^y\lxy\2y(F(x)\JH(y)).
96. y\xxF (x) & y\2xll (x) в y^tf (F (x) & Я (у)).
Устанавливается следующая процедура преобразования
формулы в ПНФ:
Шаг 1. Используя (1) и (2), устраняют операторы <*> и =>.
Шаг 2. Повторно используя (4), (5) и (7), уменьшают
область действия отрицания.
Шаг 3. Переобозначают переменные так, чтобы не было
одинаковых переменных.
Шаг 4. Используя (6), (8) и (9), получают префикс
формулы.
Шаг 5. Используя (3), получают матрицу в КНФ, а с нею
и ПНФ.
Применяя указанную процедуру к формуле
Vx {Р (х) =>{Уу{Р (у) =>P(f (х, y))}&Vy{Q (*, у)=>Р (у)}}),
получаем ее ПНФ в виде
yx3zVy{{P(x) V Р{У) V Р(/(*. У)}& {?{*) V Q(x, *)} &
&{P(x)yP(z)}}. (5.1)
Для дальнейшего упрощения ПНФ производят ее сколеми-
зацию, заключающуюся в следующем. Пусть F = (у\1х1 ...
С есть ПНФ, и пусть среди ^| первый слева будет
»г = 3, Если перед »г нет ни одного квантора V, то
вводится индивид а вместо всех хт и у^гхг вычеркивается. Пусть >Ц, .. •
"'^sm —все кванторы V, находящиеся впереди >|г. Тогда
выбирается новый m-местный символ / и все хт заменяются на
*) Под матрицей С здесь и далее подразумевается бескванторная
логическая формула.
88
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
j (xsX, ..., #sm), а У[гХт удаляется. Указанная процедура
повторяется для всех остальных кванторов д. В итоге получаем ско-
лемскую стандартную форму, где / — сколемская функция.
Например, из формулы (5.1) ранее рассмотренного примера
путем сколемизации получаем формулу
yxyy{{P(x)yP(y)yP(f(xiy))}&{P(x)\/Q(x4g(x))}&
&{(P(*)V^ (*<*))}>. (5.2)
Обычно смысл сколемской функции становится ясен при
фиксации конкретной области М. Так, например, формула УхЗу(х<С
<#), в которой х и у — числа, сколемизируется в формулу
Vx(x<Cf{x)), в которой fix) —- функция, ставящая, например,
каждому х в соответствие х + 1.
Таким образом, дальнейшее упрощение ПНФ состоит в
следующем:
Шаг 6. Используя сколемизацию, исключаем кванторы з •
Шаг 7. Опускаем кванторы \/.
Шаг 8. В матрице С опускаем операторы &.
В итоге получаем множество дизъюнктов, переменные в
которых являются универсальными, т. е. подразумеваются
связанными кванторами V. Так, вышерассмотренный пример
формулы (5.2) приводит к множеству дизъюнктов S = {P(x)V P(y)V
VP(/te, у)), F(x)VQ(x, g(x)), F(x)VF{g(x))L
Рассмотренная процедура из 8 шагов называется процедурой
стандартизации; каждую формулу Е она представляет в виде
мпожества дизъюнктов S.
5.2.5. Универсум Эрбрана и эрбрановская база. Если в
дизъюнкте заменить переменные индивидами, то получим
константно-частный случай дизъюнкта. Интерпретация / удовлетворяет
дизъюнкту, если она удовлетворяет каждому его
константно-частному случаю (вспомните, что переменные дизъюнкта являются
универсальными). Множество дизъюнктов S удовлетворяется
интерпретацией /, если удовлетворяется каждый дизъюнкт; в
противном случае множество S не удовлетворяется данной
интерпретацией /. Множество S невыполнимо, если не существует
удовлетворяющей ему интерпретации.
Очевидно, в общем случае невозможно указать все
интерпретации. Но можно построить такую область, что если не
существует удовлетворяющей интерпретации в этой области, то
вообще не существует удовлетворяющей интерпретации. Указанная
область для множества дизъюнктов S представляет собой
универсум Эрбрапа и обозначается H(S). Этот универсум строится
рекурсивно следующим образом:
1) множество всех индивидов в S принадлежит #(S); если
их нет, то H(S) приписывается произвольный индивид а;
5.2. ПРИНЦИП РЕЗОЛЮЦИЙ
89
2) если термы tu ..., tn принадлежат H(S), то H(S) содержит
также fi(tu ..., in)у где /< —любой функциональный символ в S;
3) никаких других термов в S нет.
Должно быть ясно, что при выборе любой интерпретации,
т, е. при произволыюм приписывании значений И и Л литерам
(атомарным формулам или их отрицаниям) в 5, никаких других
объектов предметной области помимо H(S) не потребуется. В этом
смысле H(S) — наиболее общая область, и если мы покажем,
что S невыполнимо в H{S), то тем самым мы покажем, что опо
невыполнимо и в любой другой области М. Универсум Эрбраиа,
вообще говоря, бесконечен, но счетен. Например, пусть нам
задано множество дизъюнктов
S = 1Р(х) V QU) V Р(/Ы), Q(b) VP(/U, »))>,
имеющее множество индивидов {а, Ь) я множество
функциональных символов {/, g). Тогда H(S) представляет собой
бесконечное множество
(а, Ь, /(а), /(b), g(ay а), g(a, 6), gib, 6), /(/(а)), ...}.
Когда мы задаем интерпретацию на H(S) для множества S,
мы приписываем его литерам значения И или Л. Пусть Р{хи ...
.. м хп) — «-местная литера в S. Очевидно, число ее константно-
частных случаев может быть бесконечным. Но хорошо то, что
если S невыполнимо, то, прежде чем будет закончено
формирование всех константно-частных случаев каждой литеры в S,
станет очевидным, что никакая интерпретация не может
удовлетворить S.
Эрбрановской базой для S называется множество всех
константно-частных случаев всех литер в S при условии, что для
наименования объектов предметной области использован упивер-
сум H(S). Элементы эрбрановской базы называются атомами.
Задание интерпретации на H(S) заканчивается для S тогда,
когда каждому атому эрбрановской базы приписано истинностное
значение.
5.2.6. Семантические деревья и теорема Эрбрана. Весьма
полезным понятием метода резолюций является понятие
семантического дерева. Пусть S — множество дизъюнктов и s& — эр-
браповская база для S. Семантическим деревом Т для S является
дерево, удовлетворяющее следующим условиям^ 1) для каждой
вершины TV имеются два ребра с атомами L и L; 2) для каждой
вершины N, если KN) — интерпретация, полученная
объединением всех литер, приписанных к ребрам ветви дерева 7\ идущей
от корня к iV, то 1Ш) не содержит отрицающих друг друга литер.
Например, для S = (Р(х) V Q{y), P(a), Q(b)}, H(S) = {a, b}
и s& = {P(a), Q(a), P(b)y Q{b)} семантическое дерево имеет вид,
представленный на рис. 5.1. Согласно рисунку для концевой вер-
90
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
шины 1 имеем 7(1) = {Р(а), Q(a), P(b\ Q(b)}. Очевидно, /(1)
не удовлетворяет дизъюнктам Р(а) и Q{b). Аналогично, /(2) =»
= {Р(а)1 Q{a), P{b)y Qib)} не удовлетворяет дизъюнкту P(x)V
V Q(y), так как его константно-частный случай Р(а) V Q{b)
ложен. Можно просмотреть все
16 ветвей дерева и
убедиться, что S невыполнимо.
Пусть s4> = Ши ..., stk) —
эрбраиовская база для S.
Тогда семантическое дерево
полно, если для каждой его
конечной вершины N
интерпретация KN) содержит
либо $t>u либо st>i (i = 1, 2, ...
..., ft).
Вершина N является
неблагоприятной, если НЮ не
удовлетворяет £, но I(N'),
где вершина N' —
непосредственный предок N, еще
удовлетворяет S. Например,
зачерненные вершины 3 и 4
на рис. 5.1 являются небла-
Рис. 5.1. Семантическое дерево. гоприятными. При получении
неблагоприятной вершины,
очевидно, нет смысла просматривать дерево дальше вниз.
Семантическое дерево замкнуто, если каждая его ветвь
оканчивается неблагоприятной вершиной. Интуитивно очевидно, что
если S невыполнимо, то даже при бесконечной эрбрановской ба-
ве каждая возможная ветвь дерева должна оборваться.
Итак, отметим ключевой момент: для каждого невыполнимого
множества дизъюнктов S имеем замкнутое семантическое дерево
(позднее это подтвердит теорема Эрбрана).
Вершина N замкнутого семантического дерева называется
вершиной вывода, если все ее непосредственные потомки
являются неблагоприятными вершинами. Вершины 5 и 6 на рис. 5.1
являются такими вершинами. Так, например, для вершипы 6
терпит неудачу па вершине 7 дизъюнкт Qib), а на вершине 8 —
дизъюнкт Р(х) V Q(y) *).
Важное значение для принципа резолюций имеет теорема
Эрбрана, которую мы приведем в двух вариантах: (1) и (2).
Теорема Эрбрана. (1) Множество дизъюнктов S невыполнимо
тогда и только тогда, когда каждому полному семантическому
*) Выражение «дизъюнкт терпит неудачу на вершине» здесь и далее
означает, что дизъюнкт не удовлетворяется интерпретацией,
соответствующей этой вершине.
§5 2. ПРИНЦИП РЕЗОЛЮЦИЙ
91
дереву для S соответствует замкнутое семантическое дерево.
(2) Множество дизъюнктов S невыполнимо тогда и только тогда,
когда имеется конечное невыполнимое множество S' константно-
частных случаев дизъюнктов в S.
Доказательство. Пусть S невыполнимо, и пусть Т —
полное семантическое дерево для S. Пусть также /в — множество
всех литер на ветви В дерева Т. Поскольку 5 невыполнимо, то
интерпретации /в должен пе удовлетворять копстантно-частный
случай С" некоторого дизъюнкта С в S. Так как С конечен
(содержит конечное множество литер), то должна существовать
неблагоприятная вершина iVB на конечном пути ветви В. И так для
каждой ветви. Таким образом, для S имеется замкнутое дерево
Т'. Поскольку с каждой вершиной связан конечный путь, то
дерево Т' конечно. На этом заканчивается доказательство первой
половины первого варианта теоремы.
Пусть теперь для полного дерева Т для S имеется замкнутое
семантическое дерево Т'. Таким образом, каждая ветвь Т
содержит неблагоприятную вершину. Это значит, что всякая
интерпретация не удовлетворяет S. Следовательно, S невыполнимо.
Доказательство второго варианта теоремы заключается в
следующем. Пусть S невыполнимо, и пусть Т — полное
семантическое дерево для S. Тогда по первому варианту теоремы Эрбрана
имеется конечное замкнутое семантическое дерево Г',
соответствующее Т. Пусть S' — множество всех константно-частных
случаев дизъюнктов, которые терпят неудачу на всех
неблагоприятных вершинах Дерева Т'. Множество S' конечно, так как
конечно число неблагоприятных вершин в Т'. Таким образом, S'
ложно в каждой интерпретапии для S\ т. е. множество S'
невыполнимо.
Пусть теперь имеется невыполнимое множество 5" копстант-
ио-частных случаев дизъюнктов для S. Поскольку каждая
интерпретация / для S содержит интерпретацию Г для S\ то, если /'
не удовлетворяет S', интерпретация / не удовлетворяет S'.
Однако S' не удовлетворяет каждой интерпретации /'.
Следовательно, S' не удовлетворяет никакая интерпретация / для S.
Следовательно, S невыполнимо.
5.2.7. Принцип резолюций. После введения необходимых
понятий и определений можно перейти к принципу резолюций.
Пусть заданы множество дизъюнктов S' и формула W. Пусть
S' t= W, т. е. любая интерпретация, удовлетворяющая S',
удовлетворяет и W. Однако эти интерпретации не удовлетворяют
отрицанию формулы W. Следовательно, никакая интерпретация не
удовлетворяет множеству S = S' UW. На .доказательстве
невыполнимости множества S и основывается принцип резолюций^ для
доказательства S' t= W достаточно показать, что 5 = S' U W
невыполнимо. Невыполнимость S, как мы увидим позже, означает
92
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
вывод из S пустого дизъюнкта, обозначаемого в дальнейшем
знаком П.
Принцип резолюций является процедурно описанным прави-
лом логического вывода, включающим в себя понятия
подстановки, унификации и резольвенты. Любую подстановку можно
представить в виде множества упорядоченных пар 0 = {(Л, i>t), ...
..., Un, vn))t Пара (tu v<) означает, что повсюду переменная i>«
заменяется термом tt, при этом из 1Ф) следует Vi^Vj. Пусть
Ре означает частный случай литеры Р, получеппый в
результате применения подстановки G к Р. Например, Р(г, /(u?), Ь) =
*=Р(х, /(*/), Ь)«, где a = {(z, х), (w, у)}.
Композицией оф (читается слева направо) двух подстановок
а и р называется результат применения Р к термам подстановки
а с последующим добавлением любых пар из р, содержащих
переменные, не входящие в число переменных а. Например,
{(#(#, у), z)}{(a, х), (Ь, у), (с, w), (d, z)} =
= {(g(a, b), z), (я, x)y (fe, у), (с, w)).
Очевидно, что (Pa)p = Pap. Композиция подстановок
ассоциативна, т. е. (оф)^ = ос(ру). Если подстановка 0 применяется к
каждому элементу множества литер {LJ, то соответствующий
результат обозначим как {Lf}e. Множество литер {LJ называется
унифицируемым, если существует такая подстановка в, что (LJe
состоит из единственного элемента. В этом случае в называется
унификатором для {LJ. Например, © = {(a, x), (b, у)}
унифицирует множество S = {P(x, /(г/), Ь), Р(х, /(6), Ь)}, так как S@ =
= {P(a,/Ш, ft».
Наиболее общим унификатором (НОУ) для {LJ является
такой унификатор Я, который невыразим через композицию других
унификаторов.
Существует теорема, приведенная в работе [Чэнг и Ли, 1973],
которая утверждает, что если W является непустым
унифицируемым множеством выражений, то существует алгоритм
унификации, который за конечное число шагов докажет этот факт и
получит соответствующий НОУ для W. Другими словами,
процедура унификации разрешима.
Рассмотрим схему алгоритма унификации. Алгоритм
начинает работу с пустой подстановки и шаг за шагом строит НОУ,
если он существует. Пусть, таким образом, на к-м. шаге получена
подстановка kh. Если множество {Ь{} при этом сжалось в одну
литеру, то НОУ найден. В противном случае каждая из литер
в {£|}хл рассматривается как цепочка символов и выделяется
лервая позиция, в которой не все из литер имеют одинаковый
§5 2. ПРИНЦИП РЕЗОЛЮЦИЙ
9а
символ. Выделенные таким образом различные символы
составляют множество рассогласований для рассматриваемой позиции.
Очевидно, множество {Ь{} неунифицируемо, если множество
рассогласований содержит символы отношений, поэтому интерес
представляет тот случай, когда множество рассогласований
содержит только термы. Так, множеством рассогласований для
множества литер {Р(а, /U, g(z)), Их)), Р(а, /(а, и), g(w))} будет
{#Ы, и).
Далее, с помощью алгоритма пытаются так изменить
подстановку Xki чтобы сделать равными два элемента из множества
рассогласований. Это можно сделать, если указанное множество
содержит переменную, которую можно положить равной одному
из его термов. Пусть sh — такая переменпая и th — такой терм,
который не содержит sh. Теперь можно образовать
модифицированную подстановку Л-6+i = ХА{(^ sh)} и выполнить следующий
шаг работы алгоритма.
Например, пусть
£ = {Р(/Ы, у, g(y)), P(f(x), z, giz))}.
Тогда на первом шаге имеем множество рассогласований МР4 =
*= {г/, z) и подстановку A,i = {(*/, 2)}. В итоге получим множество
литер
L4 ={P(f(x), */, g(y)), Р (/(*), у, g(x))}.
На втором и-последнем шаге МР2 = {у, х), ^2=1А.1{(^, х)} =»
= {(у, z), (г/, х)} и L%2 = iP(fiy), у, g(y))}.
Пусть теперь С{ и С2 — дизъюнкты, не имеющие общих
переменных. Пусть также Ь{ и L2 — литеры в Ct и С2 соответственно.
Если Li и L2 имеют НОУ а, то дизъюнкт (CioYLjo) U (C2a\L2o)
называется бинарной резольвентой дизъюнктов С\ и С2, а Ь{ и
L2 — разрешающими литерами. Например, пусть Oi — P(x)VQix)
и С2 = Р(а) V R(y). Тогда выделяем разрешающие литеры Lt =
= Р(х) и L2 = P(a), находим НОУ о = {(а, х)} и резольвируем
C = Q(a)VR(y).
Следующая теорема определяет дедуктивные свойства
принципа резолюций.
Теорема. Пусть даны два дизъюнкта Ct и С2, и пусть С —
их резольвента. Тогда С является логическим следствием из 6\
и С2, т\ е. d, C2t=C.
Доказательство. Пусть Сг = L\JC[, C2 = Z\JС'2 и С =
= Сх уС* Пусть С\ и С2 истинны в интерпретации /. Тогда либо
L, либо L ложна в /. Пусть это будет L. Тогда С[ истинна в /,
а следовательно, и С истинна в /. Аналогичный вывод получаем
и для случая ложности L в L Следовательно, Си С2t= С.
ы
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
Выводом {резолюцией) С из S является конечная
последовательность Си ..., Ch дизъюнктов такая, что каждый d является
либо дизъюнктом в S, либо резольвентой дизъюнктов,
предшествующих С{, и при этом Ск = С.
Пусть П — пустая резольвента дизъюнктов С{ и Сг. Очевидпо,
в этом случае С4 =■ L и С2 = Z и не найдется никакой
интерпретации /, которая одновременно удовлетворяла бы d и С2.
Следовательно, вывод пустой резольвенты П указывает на
невыполнимость исходного множества дизъюнктов S. В таком случае вывод
пустого дизъюнкта называется опровержением для S (см. далее
теорему о полноте).
Так, если применить принцип резолюций к примеру из § 5.1,
предварительно проведя необходимую стандартизацию, то имеем
следующий вывод:
1. D V Р — аксиома Ft.
2. PVQ V R — аксиома^.
3. Q — факт Fz.
4. Л — отрицание выводимой формулы.
5. Q V Д — резольвируем (1) и (2).
6. R — резольвируем (5) и (3).
7. □ — резольвируем (6) и (4). _ _ _
Таким образом, множество дизъюнктов S = {QV P, PVQVR,
ф, Ю неудовлетворимо и, следовательно, имеем (? =>Р, Р&Q^> R,
Q£R.
Принцип резолюций обладает полнотой, о чем свидетельствует
следующая теорема.
Теорема о полноте. Множество дизъюнктов S невыполнимо
тогда и только тогда, когда имеется вывод пустого дизъюнкта П
из S.
Доказательство. Пусть S невыполнимо. Пусть также
s£ = {$4>и ...} — эрбрановская база для S и Т — полное
семантическое дерево. По теореме Эрбрана (первый вариант) S имеет
конечное замкнутое семантическое дерево Г'. Если Т' состоит
из одной, корневой вершины, то П содержится в S, так как
никакой другой дизъюнкт не может не удовлетворяться в корне
семантического дерева. В этом случае теорема тривиальна.
Пусть Т' имеет по крайней мере одну вершину вывода N,
и пусть Ni и N2 — ее неблагоприятные вершины. Пусть также
I(N) = {mu ..., mj, 1Шх)***{ти ..., тп, тп+{) и 1Шг) = {ти ...
..., тп, m„+i}, где rrti представляет собой либо атом s&1n либо его
отрицание s£i. Поскольку N{ и /Va — неблагоприятные вершины,
а N не является таковой, то должны существовать константпо-
частные случаи Сг и С2 дизъюнктов Сх и Сг из S такие, что
Сг и С2 ложны в I(Ni) и 1Ш2) соответственно, но
удовлетворишь в KN). Поэтому Сх должеп содержать литеру £i = wn_|_1,
§ 5.3. ИСЧИСЛЕНИЕ СЕКВЕНЦИЙ
95
а С2 — литеру L2 = mn+i. А раз так, то Сх и С2 имеют резоль-
венту c = (c;\l;)u(c;\z,;).
Дизъюнкты Сх и С2 истинны в Is только благодаря
отсутствию интерпретаций тп+1 и mn+i соответственно, т. е. истинны
благодаря только литерам Lt и L2. Но именно эти литеры и
исключаются в резольвенте С. Следовательно, она ложна в IN.
В работе [Чэнг и Ли, 1973] доказана лемма о том, что если
Сх и С2 являются константно-частным случаем дизъюнктов Сх
и С2 соответственно и С" — резольвента для Сг и С2, то
существует резольвента С для СА и С2. Поскольку мы показали, что
С" терпит неудачу в вершине N, то там же терпит неудачу и
только что упомянутая резольвента С.
Пусть Т" — замкнутое семантическое дерево для множества
(S U {С}), полученное из Т' вычеркиванием любой вершины, на
которой С терпит неудачу. Очевидно, что число вершин ъ Т"
меньше, чем в Т\ Применяя вышеуказанный процесс к Г"
снова и снова, мы будем получать все меньшее замкнутое
семантическое дерево и так до тех пор, пока не останется только одна
корневая вершина. Это возможно только тогда, когда выводим
пустой дизъюнкт П. На этом заканчивается доказательство
первой части теоремы.
Пусть теперь имеется вывод пустого дизъюнкта П из £,
и пусть Ri9 ..., Rh — резольвенты в этом выводе. Предположим,
что S выполнимо.* Тогда имеется модель М для S. Однако, если
М удовлетворяет дизъюнктам С4 и С2, то она (согласно теореме
о дедуктивных свойствах резолюции) удовлетворяет
резольвентам Д,, ..., Rk. Последнее, однако, невозможно, так как одпа из
этнх резольвент есть пустой дизъюнкт О. Следовательно,
множество дизъюнктов S невыполнимо.
§ 5.3. Исчисление секвенций
Напомним основную проблему автоматизации доказательств
теорем, которую мы рассмотрели для исчисления предикатов
первого порядка. Заданы множество формул Д = {А{} и формула В.
Необходимо определить, следует ли логически В из Д, т. е. имеет
ли место Д1=#. В предыдущем параграфе мы рассмотрели, как
решается эта проблема в формализме принципа резолюций. В
данном параграфе мы рассмотрим другой формализм, в основе
которого лежит понятие секвенции [Клини, 1967].
Обобщим проблему автоматизации доказательств, а именно,
заменим формулу В на множество формул Л = {В5} и зададимся
целью определить, имеет ли место Д1= В} хотя бы для одной
В5 <= Л. Если да, то будет иметь место логический вывод Д 1= Л,
в котором Д и Л можно представить как Д = Л1&. ..&Ап и Л=*
36
ГЛ 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
-= Bi V.. .V Вт. В этом случае согласно теореме дедукции
получим, что формула
A&...&4^BlV...V5m (5.3)
общезначима.
Как известно, выражение (5.3) представляет формульный
образ некоторой конструкции Д -*- Л, называемой секвенцией. Здесь
-*■ — новый формальный символ, который мы будем
интерпретировать как «позволяет получить», левая часть Д называется
антецедентом, а правая Л — сукцедентом секвенции. Согласно (5.3)
секвенция Д -+- Л ложна в одном единственном случае: все
формулы из Д истинны, а из Л ложны.
Списки формул Д и Л могут быть неодновременно пустыми,
в этом случае возможны секвенции вида -*■ Л и Д -*-. Секвенция
-*- Л истинна, если истинна хотя бы одна формула из Л; в
противном случае она ложна. Секвенция Д -*- истинна, если ложна
хотя бы одпа формула из Д; в противном случае опа ложна.
Итак, проблему логического следования Д t= Л в исчислении
предикатов мы сводим к проблеме установления общезначимости
секвенции 2: Д -*■ iV в некотором исчислении секвенций.
Очевидно, секвенция 2 не является общезначимой, если она
опровержима, т. е. находится хотя бы одпа область М такая, что
интерпретация 2 на М ложна. Подобную интерпретацию
назовем контрпримером для 2.
Необходимо выяснить, нельзя ли систематизировать
процедуру поиска контрпримера для 2 таким образом, чтобы 1) если
существует контрпример для 2 (т. е. неверно, что 2 общезначимо),
то этот контрпример будет найден в процессе поиска; 2) если
контрпримера для 2 не существует (т. е. 2 общезначима), то этот
факт также будет обнаружен, когда все пути поиска
контрпримера окажутся исчерпанными.
Схема указанного поиска строится следующим образом. При
поиске контрпримера секвенции располагаются в порядке их
получения. Исходная секвенция 20 располагается в основании
схемы; выполняя каждый следующий шаг, мы проводим сверху
горизонтальную черту и пишем одну или (если имеются
альтернативы) две верхние секвенции, к которым приводит данный шаг
опровержения.
Шаг опровержения состоит в построении требуемой ложной
верхней (верхних) секвенции, исходя из ложности нижней
секвенции (при первом шаге ложность 20 предполагается). Таким
образом, полученная схема представляет собой секвенциальное
дерево. Если очередной шаг опровержения путем определения
подходящей интерпретации достоверно устанавливает на
определенной ветви секвенциального дерева ложность верхней
секвенции, то это означает наличие контрпримера и, следовательно,
§ 5.3. ИСЧИСЛЕНИЕ СЕКВЕНЦИЙ
97
опровержение исходной секвенции 20; если устанавливается
общезначимость верхней секвенции, то данная ветвь закрывается
(ветвь замкнута) и поиск переносится на другие
нерассмотренные ветви. Если все ветви дерева окажутся замкнутыми, т. е.
дерево окажется замкнутым, то это означает, что исходная
секвенция 20 общезначима.
Поясним вышесказанное следующим примером. Пусть нам
задана секвенция So (см. рис. 5.2). Необходимо найти некоторую
непустую область М, на которой интерпретация S0 была бы
ложной. Так как 20 имеет вид -*• Л и Л содержит единственную
формулу, то она и рассматривается в качестве главной формулы,
а ее внешняя связка =э рассматривается в качестве главного
оператора. Согласно интерпретации связки => (см. § 5.2) должна
быть истинна формула (1) 3# (PzdQ(x)) и ложна формула (2)
Pzd \/xQ(x),t. е. должна быть ложна секвенция 24.
V
* А ч
2/.
Ъ-
Ъ
z,-
X
P-+4xQ(x),P
:P,P ^Q(a,0)-*
Z5-P,Q(a0)+vXQ(w)
-VxQ(x)
: P, 3x(P ^Q(x)) -*- (Vx0(x))
:3x(Pzd()(x))
-*~(P=> Vxfffxj)
T,0 : -*- 3x(P => Q(x)) => (P ^>VxQ(x))
Рис. 5.2. Секвенциальное дерево опровержения.
Повторяя при рассмотрении 2t аналогичные рассуждения для
главной формулы (2) и главного оператора =>, устанавливаем,
что должна быть ложна секвенция 22, в которой в свою очередь
должна быть ложной формула (3) V х Q (х). В 22 в качестве
главной формулы и главного оператора рассматриваем
соответственно формулу (1) и квантор 3. Чтобы формула (1) была
истинной, необходимо и достаточно выбрать область М,
содержащую объект а0 такой, чтобы формула (4) P^Q{aQ) была
истинной.
Таким образом, получаем секвенцию 23. Однако ее ложность
в указанной области еще не доказана, поэтому продолжаем стро-
7 Е. И Ефимов
98
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
ить секвенциальное дерево. В Е3 выделяем формулу (4) и
связку =э. Истинность (4) имеет место либо при ложности
высказывания Р, либо при истинности Q(a0), т. е. на этом шаге
опровержения ветвь раздваивается и возникают секвенции 24 и 2а,
которые должны быть ложными.
Анализ 24 показывает, что эта секвенция не может быть
ложной ни при какой интерпретации, так как несовместимы
требования одновременной истинности и ложности Р. Поэтому
мы закрываем данную ветвь знаком X и анализируем
оставшуюся 25. Из ложности формулы (3) следует, что область М наряду
х с а0 должна содержать объ-
'(/(a0),P + 3xQ(x),Q(a0) ект *' ™кой> чтобы Форму-
V< ff/f VI /, «К ла q^j была ЛоЖной *^
х """ "*■ 3 Итак, мы приходим к
'р+Зх^х), Р Q(a0), P-+3xQ(x) секвенции 2в с областью
MiaQ, aj. Положив Q(a0>
=> -*- истинной, Q(at) ложной, мы
р9 р =э Q(a0) -*- 3xQ(x) получаем искомый контрпри-
мер (на рис. 5.2 он отмечен
3 ~*~ зпаком V), ас ним и оп~
Р, Зх(Р Р Q(x)) -+• ЗхQ(x) ровержение исходной
секвенции 20.
"*" :=) Случай доказательства об-
Зх(Р zd Q(x)) -*- Р ^=>3xQ(x) щезначимости исходной сек-
. венции приведен на рис. 5.3.
"*" В обоих приведенных при-
-*-3x(PzdQ@)) zd (P=>3xQ(x)) мерах на рисунках
символы -* =э указывают, что рас-
Рис. 5.3. Секвенциальпое дерево дока- сматриваемыи шаг происхо-
зательства. дит в результате анализа
импликации в сукцеденте,
символы 3 ~v — в результате анализа формулы с квантором 3
в антецеденте и т. д.
Итак, при построении секвенциального дерева на каждом
шаге опровержения мы переписывали список формул, которым
хотели приписать истинностные значения, с одним или двумя
изменениями. Эти изменения происходили в силу анализа условий
истинности одной из формул — главной формулы данного шага —
по отношению к внешней пропозициональной связке или
квантору — главному оператору. На основе этого анализа мы вводили
в наши списки одну или две новые формулы — боковые
формулы, после чего главная формула вычеркивалась (кроме случаев,
*) Ложность формулы (3) предполагает ложность Q{z) хотя бы для
одного значения х, которое пе обязательно должно совпадать с ранее
фиксированным объектом а0.
§53 ИСЧИСЛЕНИЕ СЕКВЕНЦИЙ
99
связанных с V->■ и ->-3). Остальные формулы переписывались
без изменений.
Отмеченные шаги опровержения при построении снизу вверх
секвенциального дерева можно автоматизировать путем
введения определенных правил. Пусть Г и 0 — списки соответственно
истинных и ложных формул (возможно, пустые), которые не
меняются при даппом шаге опровержения. Тогда можно ввести
следующие правила:
а. я _ . -~,~ ~, * - ~
&
v» Аув, г-*е v
Г->0, Л
Г
->0,
г-
А,
г-
, л
^0,
г
I1
Г->0,Л
*0, AZDB
Г-+В, В
А&В
-*е, л, в
- в, лу#
л, г->в
-V
Г-0, Л 5,
Л 3 #, Г -
Л, В,
л<#я,
Л, Г->9 Л,
Г-*0
>*0
Г->0
Г->0
г-*0, л
л, г-*е, в /?, г->0, л
Г->0, Л оо Б
г->е, л (6)
г -* 0, у.гл (#)
Г —0, зягЛ(а-), Л (г)
Г->0, з^Л(х)
-V V
* v »
_^.q
->- з,
Л, Г-»0
Л, В, Г-^0 Г->0, Л, Л
Л со 5, Г-*0
А (г), \/хА(х), Г-*0
у*Л(я), Г->0
Л(Ь), Г-»0
со —>-,
дяЛ (ж), _Г->0
В этих правилах А и В — произвольные формулы; х —- любая
переменная; Ь — любая «новая» переменная, не входящая в
нижнюю секвенцию; г — любая «старая» переменная, значениями
которой являются термы из нижней секвенции.
Как было показано (см. рис. 5.2 и 5.3), строя секвенциальпое
дерево, можпо закрыть его ветвь. Ветвь считается закрытой,
если мы получаем секвенцию вида С, Г -*• 0, С(Х), где С —
атомарная формула. Легко видеть, что секвенция вида (X)
общезначима, поэтому ее естественно назвать аксиомой.
Каждое построенное снизу вверх замкнутое дерево, т. е.
дерево с аксиомами (X) в копцевых вершинах, в котором каждый
шаг сверху вниз совершается по одному из 14 рассмотренных
правил, представляет собой доказательство исходной секвенции
20 в формальной системе G4 геыценовского типа [Клини, 1967].
Характерной чертой системы G4 как любой генценовской
системы является тот факт, что доказательства в ней представляют
конечные деревья, а не копечпые линейные последовательности
формул, как, например, в исчислении предикатов.
Итак, мы показали, что установление логического следования
А Р Л сводится к автоматическому построению в формализме
системы G4 замкнутого секвенциального дерева для секвенции
100
ГЛ. 5. ЛОГИЧЕСКИЕ СИСТЕМЫ
Д ->• Л, при этом указанное дерево строится путем поиска (и не-
обпаружения) опровергающего контрпримера. Таким образом,
исчисление секвенций по своей основной идее — опровержению —
напоминает принцип резолюций.
Более подробно решение указанной проблемы
автоматического доказательства теорем в формализме исчисления секвенций
будет рассмотрено несколько позже.
§ 5.4. Логика решений
Метод резолюций и метод опровержений в системе G4 близки
друг к другу. Метод резолюций^ сводит проблему установления
невыполнимости множества Д U F в исчислении резольвент.
Метод опровержений сводит указанную проблему ДЁ/'"7 к
установлению общезначимости секвенции Д -*- F в исчислении
секвенций.
Оба метода обладают свойством непротиворечивости и
полноты. Метод резолюций достаточно прост для автоматизации,
однако его практические реализации, например в системе QA3 [Грин,
1969], оказались малоэффективными по причине
неудовлетворительной организации на его основе поиска доказательств. Это
связано со следующими обстоятельствами:
1) В методе резолюций затруднено формальное введение
фреймов как содержательно связанных утверждений. При
образовании дизъюнктов эти фреймы дробятся, теряют цельность, а
получаемые при этом массивы исходных дизъюнктов плохо
структурированы, что значительно снижает эффективность вывода.
2) В приложениях метода резолюций к задачам
планирования, технологического проектирования и другим, требующим
включения в знания операторных схем, не удается сохранить
единый дедуктивный механизм. Введение же этих операторных
схем в формализм метода, во-первых, затрудняет использование
в рамках этого формализма специальных эвристик для
направленного поиска подходящих операторов и, во-вторых, требует
явного описания при помощи специальных аксиом тех
отношений, которые не меняются под воздействием оператора.
3) Метод резолюций дает слишком подробный вывод,
несвойственный человеку. Попытки представления метода резолюций
как некоторой системы многоуровневого иерархического
вывода, в основе которой лежала бы эвристическая процедура
принятия решений человеком, например комплексная стратегия
поиска решений, рассмотренная в § 4.4, бесперспективны. Дело в
том, что в силу абстрактности метода резолюций неясны
принципы построепия (без учета семантики) в его формализме
иерархии взаимосвязанных исчислений. Если бы такое удалось, то от
метода резолюций мало что осталось бы. Попытки ввести иерар-
5 4. ЛОГИКА РЕШЕНИЙ
101
хию типа Сакердоти [1974] не решают проблемы, так как
наряду с исключением несущественных деталей описаний предметов
и операций объективного мира необходима также
структуризация и обобщение таких описаний (ср. переходы от М0 к Mi и от
Mi к Мг в § 4/\
4) Метод резолюций является замкнутой системой
относительно правил вывода (резолюции и парамодуляции) и по этой
причине неспособен к расширению путем адаптации, например
путем введения допустимых правил, сокращающих вывод
[С. Ю. Маслов, 1972, 1979J *).
Эти и другие недостатки, например необходимость процедуры
стандартизации, не позволяют использовать метод резолюций в
качестве основного дедуктивного метода для решателей,
работающих в средах практической сложности.
Секвенциальные исчисления не связаны с предваренными
формами и стандартизацией, принципиально позволяют включить
в свой формализм фреймы, допустимые правила и
эвристические стратегии поиска. Однако существующие их реализации —
система АЛПЕВ-ЛОМИ-2 [Н. А. Шанин, Г. В. Давыдов и др.,
19651, машинный алгоритм исчисления предикатов первого
порядка [Г. В. Давыдов, С. Ю. Маслов и др., 19691 —не были
направлены на решение интеллектуальных задач.
Поэтому представляет интерес рассмотреть путь построения
теории автоматических доказательств, который прежде всего
связан с построением проблемно ориентированного языка,
называемого в дальнейшем логикой решений.
В логике решений мы вынуждены отойти от традиционного
для логики толкования терминов «предикат» и «терм». Для
этого в предложениях естественного языка выделяются такие
категории данных, как предметы, значения (наименование
свойства при этом может подразумеваться), действия и отношения.
Ориентировочно предметы — это то, о чем говорится в
предложении; значения — это то, что говорится в предложении о
предметах и действиях (папример, определения, обстоятельства,
выраженные наречиями, и т. д.); действия — это сказуемые,
выраженные глаголом; отношения -— это связи между предметами,
значениями и действиями (см. табл. 3-1 в § 3.2).
Таким образом, в логике решений под термами мы будем
подразумевать предметы, значения и действия, под
предикатами — отношения. Например, одноместный предикат
математической логики КРАСНЫЙ х (свойство ЦВЕТ здесь
подразумевается) в логике решений будет представлен как одноместный пре-
*) Допустимое правило вывода, в отличие от производного,
представляет произвольную последовательность (по порядку и числу) базовых
правил.
ш
ГЛ 5 ЛОГИЧЕСКИЕ СИСТЕМЫ
дикат ЦВЕТ (х, КРАСНЫЙ), полученный из двуместного
предиката ЦВЕТ (#, у), где у может пробегать все значения но
свойству ЦВЕТ. Предикат х ИДЕТ к у в логике решений будет
представлен как предложение СУБЪЕКТ (/, я)К(/, у), где /—имя
действия ИДТИ, х и у — некоторые предметы; при этом первый
предикат указывает па субъект х действия /, второй —па
направленность этого действия Кг/.
Такой нетрадиционный подход дает ряд преимуществ.
Во-первых, представление действия / термом позволяет формально
описать его в рамках логики первого порядка и тем самым
избежать необходимости иметь дело с весьма проблематичной
автоматизацией логик высших порядков [Робинсон, 1970J.
Во-вторых, естественным образом решается проблема декларативного
описания многозначных свойств. Пусть, например, по тем или
иным соображениям нас не устраивает описание предметов
только как КРАСНЫЙ или НЕ-КРАСИЫЙ, необходимо более
тонкое их цветовое различение. Идя традиционным путем,
пришлось бы вводить множество двузначных предикатов:
КРАСНЫЙ х, ОРАНЖЕВЫЙ х и т. д., что громоздко; введение
предиката ЦВЕТ U% у) упрощает проблему описания в рамках дву-
зпачной логики.
Логика решений строится как многосортовая логика. Это
означает, что мы вводим различные сорта термов. В связи с этим
и отношения определяются на таких термах с учетом их
сортности. Среди термов мы будем особо выделять время, играющее
роль определяющего параметра ситуации или, как будет
показано позже, роль параметра подструктур в некоторой динамической
структуре.
Логика решений — это язык с иерархической структурой,
отражающей уровни описания задач для каждого РО решателя.
Поскольку нулевой уровень задач г-го ранга (i > 1) совпадает
со вторым уровнем задач (i— 1)-го ранга подчиненного РО, то
для описания деятельности каждого РО достаточно ограничиться
представлением логики решений в виде трехкомпонентпой
системы L = <L1? L2, L12>, где L{ представляет собой перцептивный
язык, L2 — рефлексный язык и Ll2 — трансляциопный язык.
При построении логики решений мы сохраним двузначность,
свойственную классическим исчислениям. Другими словами,
всякое семантически правильное выражение логики решений при
любой интерпретации либо ложно, либо истинно, но ни то и
другое одновременно.
Мы пе будем использовать символы отпошений в качестве
переменных в каких-лнб() выражениях логики решений, т. е. мы
ограничиваемся рамками исчислений первого порядка.
Логика решепий является конечной, что следует из
конечности описываемых ею структур.
ГЛАВА 6
ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
§ 6.1. Аксиоматическая теория решений
В математической логике известны две тесно
взаимосвязанные методологии: теория доказательств (метаматематика)
[Клики, 1967] и теория моделей [Робинсон, 1963J. Метаматематика
восходит к Гильберту, который предложил ее для доказательства
непротиворечивости математики. Метаматематика сводит
проблему установления общезначимости формулы Е (в формальной
записи t=/£) и логического следования формулы В из А (в
формальной записи А Ё В) к проблеме доказуемости (в формальной
записи \~ Е) и выводимости В из А (в формальной записи А Ь В)
в некоторой формальной акскоматпко-дедуктивпоп системе. Этот
метод не решил поставленной Гильбертом задачи, но сыграл
большую роль в развитии, например, логики предикатов первого
порядка, где, как известно, установление общезначимости
формул перестает быть чисто механической процедурой, в отличие,
скажем, от логики высказываний.
В метаматематике формальная система (например,
классическое исчисление предикатов) изучается как система лишенных
смысла абстрактных объектов (разве только что одни объекты
объявляются аксиомами, другие правилами вывода и т. д.). Так,
формальное доказательство некоторой теоремы для
метаматематики представляет собой просто конечную последовательность
объектов. В метаматематике, как правило, пе рассматриваются
те или иные свойства модели, соответствующей изучаемой
формальной системе (достаточно, чтобы эта модель существовала).
Если же мы хотим утверждать нечто осмысленное о
лишенных смысла объектах формальной системы, то в этом случае
метаматематика пользуется неформальными рассуждениями на
метаязыке, отличном от языка формальной системы. При этом
метаматематика использует интуитивно очевидные (финитные)
методы ц теоретико-доказательные понятия («быть теоремой»,
«разрешимость» и т. д.).
Теория моделей изучает соответствия между свойствами
объектов или множества объектов в некотором формализованном
104
ГЛ. б. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
языке, с одной стороны, и их моделями, интерпретациями
применительно к предметной области, с другой стороны [Робинсон,
1963J. При этом теория моделей не ограничивается одними
финитными методами рассуждений: многие понятия
(«общезначимость», «выполнимость», «логическое следование» и другие)
являются трансцендентными, так как апеллируют к понятию
«бесконечность».
В целом теория доказательств и теория моделей в какой-то
части взаимно дополняют друг друга при решении ряда проблем,
а в какой-то части решают эквивалентные проблемы. Так,
например, для классического исчисления предикатов было
установлено, что вопрос в теории доказательств: «свободна ли теория,
выводимая из данных аксиом, от противоречий?» эквивалентен
вопросу в теории моделей: «существует ли для данпых аксиом
хотя бы одна модель?».
Мы будем опираться на идеологию обеих теорий при
построении аксиоматической теории решений, о чем будет сказано в
последующих главах. Здесь же мы остановимся более подробно
на формальных аксиоматико-дедуктивных системах, с тем
чтобы в дальнейшем отметить их сильные и слабые стороны.
Обычно формальная дедуктивная система строится
следующим образом:
1) Разрабатывается формальный язык, т. е. а) вводится
алфавит символов и б) вводится декларативно система операций
(правил образования), с помощью которой однозначно
определяются синтаксически правильные выражения; указанные
операции и их свойства одновременно определяют и тождественные
преобразования одних синтаксически правильных формул в
другие.
2) Из множества синтаксически правильных выражений
выделяется подмножество утверждений S, которое объявляется
теорией.
3) Теория аксиоматизируется, т. е. а) фиксируется базовое
подмножество К теории 5, которое объявляется множеством
аксиом; б) вводится декларативно система правил логического
вывода; в) утверждения, выводимые из К с помощью правил
вывода, объявляются теоремами теории 5, а получаемые при этом
цепочки выражений объявляются доказательствами.
Синтаксически правильные формулы, аксиомы, правила
вывода и теоремы являются эффективно распознаваемыми.
Таким образом, формальная дедуктивная система
представляет индуктивно заданное множество утверждений, описанных в
некотором формальном языке. Заметим, что в такой системе нет
места алгоритму поиска доказательств, в лучшем случае
доказывается его существование. Формальная дедуктивная система
считается разрешимой относительно доказательства, если существу-
§ 6.1. АКСИОМАТИЧЕСКАЯ ТЕОРИЯ РЕШЕНИЙ 105
ет алгоритм, который для каждого утверждения за конечное
число шагов позволяет ответить на вопрос: «доказуемо или пет
данное утверждение?».
Формальная дедуктивная система считается
непротиворечивой, если в ней одновременно недоказуемы какое-либо
утверждение и его отрицание. Заметим попутно, что уже здесь мы
вкладываем определенную семантику в символ «отрицание», т. е.
апеллируем к модели формальной системы.
Таким образом, уже здесь становится очевидной
взаимодополняемость теории доказательств и теории моделей. Она
проявляется еще в большей степени, когда мы рассматриваем полноту
формальной дедуктивной системы. Система считается полной, если
каждое общезначимое (т. е. истинное в любой структуре) ее
утверждение доказуемо.
Фиксируя модель, можно получить эквивалентное ранее
приведенному определение непротиворечивости. Формальная
система непротиворечива, если каждое доказуемое в ней утверждение
общезначимо. Теперь уже и аксиомы можно определить как
общезначимые утверждения.
Достоинство формальной системы — в абстрактности и
универсальности. Такая система корректна, строга, все ее объекты
четко обозначены и определены. Можно изучать свойства
системы, и при этом нет необходимости обращения к копкретной
предметной области. Результаты исследования формальных систем
могут переноситься на ее модели именно в силу их общности.
Но ничего не дается^ даром — в универсальности формальных
систем кроется и их слабость. Эти системы не в состоянии
учитывать специфику конкретных предметных областей. Поэтому
более гибкими являются проблемно ориентированные системы.
В таких системах уже можно пытаться аксиоматизировать
знания о предметной области и эффективно манипулировать ими в
дальнейшем как с формальными объектами.
Итак, формальные системы исследуются безотносительно к
какой-либо конкретной структуре и в этом смысле можно говорить
об общезначимости их утверждений. Однако мы собираемся
изучать конкретный класс структур — мир задач. Поэтому нас
должны интересовать проблемно ориентированные аксиоматические
сргстемы. Примерами подобных систем в математической логике
могут служить так называемые системы прикладного исчисления
предикатов первого порядка: формальная арифметика,
формальные алгебраические системы и т. д. Проблемная ориентация
таких систем выражается в том, что в них наряду с логическими
аксиомами классического исчисления предикатов присутствуют
так называемые собственные аксиомы, отражающие специфику
конкретных моделей, например аксиомы сложения и умпожения
в формальной арифметике.
106
ГЛ. б ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
В нашем случае дело обстоит гораздо сложнее. Действительно,
исторически математическая логика использовалась для нужд
математики, изучать математическую логику означало изучать
логику математического мышления. Мы же собираемся изучать
логику некоторой эмпирической области — области решения задач.
Эта область намного сложнее неформальных математических
теорий, да к тому же она как всякая эмпирика определена нечетко
и расплывчато, на содержательном уровне. Следовательно, эту
предметную область как модель некоторой аксиоматической
теории необходимо уметь достаточно четко определять и описывать.
Необходимо также уметь перестраивать соответствующую теорию
решения на тот или иной класс моделей путем смены
собственных аксиом и, быть может, смены правил логического вывода.
Аксиоматическую теорию решений S будем строить
следующим образом. Из множества выражений логики решений L
выделяется подмножество, называемое в дальнейшем фреймами (см.
§ 6.2), которое мы принимаем за множество К собственных
аксиом.
Множество К определяет проблемную ориентацию теории S.
Далее задается множество R правил вывода, с помощью которых
из К выводятся теоремы. Таким образом, аксиоматическая
теория решений S задается как множество истинных утверждений
индуктивно в виде пары S =* <К, Ю.
Отметим характерные особенности, которыми должна
обладать аксиоматическая теория решений S.
1) Теория должна строиться как система прикладного
исчисления секвенций, т. е. она наряду с логическими аксиомами и
правилами вывода «чистого» исчисления секвенций должна
содержать специальные, собственные аксиомы, например
аксиомы, описывающие элементарные задачи мира задач.
2) Теория должна строиться как открытая логическая
система, способная к обучению и адаптации. Таким образом, в S
допускаются открытые множества собственных аксиом и, возможно,
правил вывода, которые в процессе обучения и адаптации с
учетом новых фреймов и эвристик мира задач могут пополняться,
корректироваться и заменяться. Мы вынуждены ввести незамкну-.
тость 5 в силу принципиально неполного познапия, а
следовательно, и описания мира задач. Указанная специфика S,
безусловно, должна быть отражена в ее метатеории, например, при
исследовании свойства полпоты.
3) Теория должна строиться как динамическая логическая
система. В зависимости от того, меняется или нет в ходе
доказательства временной параметр £, указанное доказательство может
быть динамическим или статическим. Нас в основном будут
интересовать динамические доказательства, определяющие решение
соответствующих динамических задач»
§ 6.2. СИНТАКСИС
107
4) Теория должна представлять иерархическую систему
еканий. Если зафиксировать в решателе некоторый РО, то его
знания могут быть описаны теорией, представляющей триаду
S = <S2, St1 Sl2>. В этой триаде S2 —- рефлексная теория, в
рамках которой осуществляются макродоказательства
секвенциальных теорем 2-го уровня, определяющие замыслы решений
локальных задач; Si — перцептивная теория, в рамках которой
осуществляются микродоказательства секвенциальных теорем 1-го
уровня, определяющие решения локальных вадач; Si2 —
трансляционная теория, в рамках которой осуществляются вывод фактов
2-го уровня из вводимых в Sl2 фактов 1-го уровня и нахождение
фактов 1-го уровня, из которых следовал бы введенный в Si2
факт 2-го уровня.
5) При построении теории мы не должны стремиться к
абсолютной декларативности в духе классических логик и при
необходимости будем использовать и процедуральную форму
представления знаний, например* для описания некоторых аксиом и
правил вывода. К этому следует добавить, что к сам поиск дока-
вательства должен строиться как эвристический согласно
комплексной стратегии СФИНКСа.
Рассмотренные особенности аксиоматической теории решений
показывают, что она не является формальной аксиоматико-дедук-
тивной системой в ранее указанном смысле. Язык L
представляет множество не только синтаксических, но и семантически
правильных выражений, правила построения которых по этой
причине нечетки и во многом зависят от конкретной предметной
области, а собственные аксиомы теории, истинность которых
переносится извне, по этой причине пе являются эффективно
распознаваемыми. Все это вместе взятое дает нам основания отнести
аксиоматическую теорию решений к классу семиотических логик.
Перейдем теперь непосредственно к построению теории
решения 5.
§ 6.2. Синтаксис
Пусть задан некоторый РО решателя. Рассмотрим его «зык
L = <Llt L2, L,2>. Так как логики Z,t и L2 но формализму
совершенно идентичны, то ограничимся рассмотрением логик Lt и L12.
6.2.1. Логика LL.
Алфавит.
О 1- Знаки пунктуации, ( ) [ ] { }.
2. Предметные переменные w, wu • • • и константы а, аи ...
3. Процедурные переменные /, /i,' ... и константы Ь, Ъи ...
4. Призначные перемепные по ;-му признаку у\ у\, ... и
константы с , с{, .. .
б. Функциональные переменные ф, $it ... и константы d, dh .,,
108
ГЛ 6. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
6. Символы отношений g, gu .. #
7. Символы логических операторов —, =*•, -<t -«-, ->.
8. Ограниченные кванторы у и 3.
Семантически правильные выражения*).
1. Символы w, /, z/j и соответствующие константы а, Ъ и с5
есть термы определенного сорта.
2. Если ^, ..., £п — призначные термы соответствующих
сортов и я|> — соответствующий им символ функции, то i|>Ui, ..., tn) —
терм.
3. Никакие другие выражения не являются термами.
Атомы.
1. Если tu ..., tn — призначные термы соответствующих
сортов и g — соответствующий им символ отношения, то g(t{, ...
..., tn) — атом.
2. Если х — терм сорта w или /, tiy ..., tn — призначные
термы соответствующих сортов и g — символ соответствующего им
отношения, то g(x, tu ..., tn) — атом.
3. Если хи ♦.., хп — переменные сорта w или /, t — терм
сорта «время» и g — символ соответствующего им отношения, то
g(Xi, ..., хп, t) — атом.
4. Никакие другие выражения не являются атомами **).
Предложения.
1. Каждый атом есть предложение.
2. Если В — предложение, то В — предложение.
3. Если Z?d и Вг — предложения, то #i#2 — предложение ***).
4. Если А — предложение их — свободпая переменная в А
со значениями из некоторого множества X, то (Vx^X)A и
(3# s X) А — предложения.
5. Никакие другие выражения не являются предложениями.
Связки.
1. Если А и В — предложения, содержащие только
константы, то А -*■ А — связка.
2. Если А(хи ..., xh xl+u ..., хт) и B{xl+i1 ..., хт, хт+и ...
..., хп) — связанные друг с другом по смыслу предложения, не
содержащие кванторов и, возможно, имеющие общие свободные
переменные xl+u . ♦., хт, то выражение -> (>h#i e Xj ... ХА е
e=Xn)L4Ui, ..., хт) ® B(xl+U ..., хп)] — связка, где ® е= {=^, -<=*-,
<} и >ie{V,3}.
3. Никакие другие выражения не являются связками.
*) Недостаточность синтаксической правильности выражений очевидпа
из-за проблемной ориентации знака L, особенно проявляющейся при но-4
строении выражений типа «связка».
**) В атомах в ряде случаев допускается отсутствие терма сорта
«время», например, при описании статических миров.
***) Запись BiB2 предполагает конъюнктивную связь между Вх и В2.
§6 2. СИНТАКСИС
109
Согласпо ранее рассмотренным формулам (6)—(9)
тождественных преобразований выражений логики предикатов (см. § 5.2,
стр. 87) любое предложение логики Lu содержащее кванторы
можно представить в предваренной форме; что же касается
связок, то они представлены в ней по определению семантически
правильных формул. Производя в указанных выражениях сколе-
мизацию и опуская кванторы всеобщности, мы получаем
бескванторные выражения с ограниченно универсальными
(связанными) переменными. Далее мы всегда будем предполагать, что
в логике Li имеют место только бескванторные выражения.
Выражения, не содержащие свободных переменных, назовем
замкнутыми. Среди замкнутых выражений логики £4 мы будем
выделять факты и фреймы. Факты — это выражения
(высказывания), содержащие только константы. Фреймы — это
выражения, содержащие хотя бы одну универсальную переменную.
Примером факта может служить предложение
ЦВЕТ (ШАР, СЕРЫЙ) ВЕС (ШАР, ТЯЖЕЛЫЙ) МАТЕРИАЛ
(ШАР, СВИНЕЦ).
Примером фрейма может служить предложение
ЦВЕТ (ПРЕДМЕТ, ф (ПРЕДМЕТ)),
которое утверждает, что всякий предмет имеет цвет г|) (предмет),
где г|) (предмет) — сколемская функция, однозначно
сопоставляющая каждый предмет с его цветом.
6.2.2. Логика L12.
Алфавит.
1. Знаки пунктуации, ( ) [ 1 { }.
2. Символы перцептивных термов х1, х], ...
3. Символы перцептивных отношений g1, g{, ...
4. Символы рефлексных термов я2, х\, ...
5. Символы рефлексных отношений g2, g\, ...
6. Символы логических операторов —, &, V, :=>. -*=*-, -*.
7. Символы ограниченных кванторов V 3.
Семантически правильные выражения.
Формулы.
1. Каждый перцептивныйjitom g1 (#\ ...,^)есть формула.
2. Если А — формула, то Л — формула.
3. Если А и В — формулы, то А&В, Л V В и А^В —
формулы.
4. Если А(х^)— формула, содержащая свободную переменную
Xх такую, что х1 е= х\ то {Ух1 е= х2) А (х1) и (За;1 <= х2) АЫ)—
формулы.
5. Никакие другие выражения не являются формулами.
Формулы, не содержащие свободных переменных, назовем
замкнутыми.
110
ГЛ. 6. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
Связки.
1. Если А1 — перцептивное предложение-факт, А% —
рефлексное предложение-факт, В2 {х\л ... f #*) — рефлексный атом
g2 (х\, .. ., Хп) и А (х\у .. ♦, Хп) — замкнутая (по перцептивным
переменным х\) формула, то А* -► А2 и -*- (>U#i e X?) ... (»„^e
е Хп) [#2 (#?, . .., xl) 44 Л (#?, ..., xl)] — связки, где Л (#*, ...
. . о 4) « (yii^i бд;|),,. (»л € а?п) Л' (*}, ...,х\) задана в
предваренной форме.
2. Никакие другие выражения не являются связками.
В целях упрощения мы аналогичным образом будем
представлять связки -+■ В2 *<=►■ А как бескванторные (по рефлексным
переменным).
Связки вида -> В2 ■<=*- Л, содержащие хотя бы одну
ограниченную универсальную переменпую х2, представляют фреймы
логики Li2. Примером такого фрейма может служить связка -+- ВЫШЕ
(ДОМ-1, ДОМ-2) <* ( V ЭТАЖ-2 е ДОМ-2) ( Э ЭТАЖ-i в
еДОМ-1) ВЫШЕ (ЭТАЖ-1, ЭТАЖ-2), где ДОМ-1 и ДОМ-2 —
универсальные рефлексные переменные.
§ 6.3. Интерпретация
Рассмотрим интерпретацию выражений логики решений L.
Для этого введем понятие предметной структуры М, описываемой
посредством семантически правильных выражений L. Структура
М состоит из множества индивидов h различных сортов и
множества гс-местных отношений а; для каждого а из М и каждой
соответствующей га-ки индивидов hu ..., hn из М отношение а
либо истинно, либо ложно для hu ..., hn.
Среди индивидов М будем выделять следующие категории:
А = {at} — предметы, В = ibj) — элементарные задачи, С* = {ch} —
значения по А-му признаку. Среди признаков особо будем
выделять времена 71 = {xJ, играющие роль параметров ситуаций, и
функциональные законы D = ЫД, связывающие между собой (по
определенному закону) значения некоторых признаков.
Отношения а^^Ф из М определены на индивидах в соответствии с их
сортностью (см. табл. 3-1) и могут выражать определенные
одномоментные, разыомоментные и вневременные связи.
Примерами одномоментных связей могут служить: ПРАВЕЕ
(аи а21 т) — «предмет at находится правее предмета а2 в момент
т», РАЗМЕР (а, с, т) — «предмет а имеет размер с в момент т»\
СУБЪЕКТ (6, а, т) — «задача Ъ решается субъектом а в
момент т», СРЕДСТВО (&, с, т) — «задача Ъ имеет средства с в
момент т».
Примером разномоментиой связи может служить
БОЛЬШЕ (d, c2), взятое из контекста «РАЗМЕР (a, cu Ti), РАЗМЕР
§ G 3. ИНТЕРПРЕТАЦИЯ
111
(a, c2, т2) БОЛЬШЕ (d, c2)» и характеризующее уменьшение
размера предмета а во времени.
Наконец, примером вневременпой связи может служить
выражение ХАРАКТЕР (Ьу с) — «задача b имеет плановый (с)
характер».
Совокупность одномоментных связей, выражаемых
отношениями а из Л/, мы будем обозначать через ММ и называть
статической подструктурой структуры Мл а структуру М в этом случае
будем называть динамической.
Пусть р — взаимно однозначное соответствие, отображающее
индивиды из М на подмножество констант логики L (в частности,
функциональные законы из М на подмножество
функциональных констант логики 1/4) и отношения из М на множество
символов отношений из L. Пусть также А' есть константно-частный
случай фрейма А логики L. Тогда выражения логики L
определены в М посредством р следующим образом:
1) Атом А логики Lt истипен в Mi тогда, когда отношение а
из Ml9 соответствующее А при отображении р, истинно па
соответствующих индивидах из Мх\ в остальных случаях он ложен.
2) Предложение А логики L± истинно в Mi тогда, когда
истинно в Mi каждое А'\ в остальных случаях оно ложно.
3)., Предложение Б логики Lt истинно в Мх тогда, когда В
ложпо в М^
4) Предложение В = BiB2 логики Lt истинно в М{ тогда,
когда Bi и Вг оба истинны в Mi\ в остальных случаях оно ложно.
5) Связка -+■ А =►■ В логики Lt истинна в Mi тогда, когда
каждый раз истинность в Mi предложения А' влечет истинность в
Mi соответствующего предложения В'\ в остальных случаях она
ложна.
8) Связка -*■ А -*=»• В логики L{ истинна в ML тогда, когда
каждый раз соответствующие предложения 4' и В'
одновременно истинны или ложны в Mi\ в остальных случаях она ложна.
7) Связка -*■ A(ti) -< B(t2) истинна в Л/4 тогда, когда каждый
раз A'ixi) и В'(т2) одновременно истинны или ложны в Af.Cti)
и ММ) соответственно; в остальных случаях она ложна.
8) Формула А & В логики Ll2 истинна в М4 тогда, когда
обе формулы А и В истинны в Mi\ в остальных случаях она
ложна.
9) Формула А логики Li2 истинна в М{ тогда, когда А ложна.
10) Формула А V В логики Li2 истинна в Mt тогда, когда по
крайней мере одна из двух формул, А или В, истинна bIj; в
остальных случаях она ложна.
11) Формула А^в логики Li2 истинна в Mt тогда, когда
либо В истинна в Ми либо А ложна в М4; в остальпых случаях
112
ГЛ. 6. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
12) Формула (Vxl^h2) Aix1) логики Li2 истиппа, в Мг
тогда, когда в 71/4 истинна А при любом значении xx^h2; в
остальных случаях она ложна.
13) Формула (Эх1 ей2) А(х*) логики L12 истинна в Mi тогда,
когда в Mt истинна А хотя бы для одного значения xi ^ А.2; в
остальных случаях она ложна.
14) Связка -+• В2 -<=>- А логики Li2 истинна в <Ми М2У тогда,
когда каждый раз {В2)' и А' одновременно истинны или ложны
соответственно в М2 и Mt *).
§ 6.4. Аксиоматика
Аксиоматико-дедуктивный метод в математике приобрел
известность благодаря «Началам» Евклида. Евклидову
аксиоматическую систему можно охарактеризовать следующим образом.
Даются определения некоторых исходпых терминов (точка, прямая
II т. д.). Затем в качестве аксиом принимаются некоторые
интуитивно истинные утверждения об этих исходных терминах. Далее,
через первоначальные термины определяются новые термины, а
из аксиом логически выводятся новые утверждения о терминах,
называемые теоремами. Такую аксиоматику, где семантика
исходных терминов и аксиом, их описывающих, предполагается
заданной с самого начала, называют содержательной.
В дальнейшем аксиоматика становится более абстрактной:
семантика исходных терминов и аксиом априори не задается,
фиксируется только дедуктивная структура рассматриваемой
теории. Так возникла формальная аксиоматика, в рамках которой
мы вольны выбирать любую семантику, лишь бы при этом
аксиомы оставались истинными. Такой формальной аксиоматикой
обладает классическое исчисление предикатов первого порядка.
Мы строим теорию решений S как проблемно
ориентированное исчисление в языке L, поэтому мы вновь возвращаемся к
содержательной аксиоматике. Как уже отмечалось, прикладное
исчисление предикатов содержит два типа аксиом: логические
аксиомы «чистого» исчисления предикатов и так называемые
собственные аксиомы, характеризующие область приложения. При
переходе к теории S как прикладному исчислению секвенций
аксиомы первого типа преобразуются в правила вывода, которые
мы рассмотрим в следующем параграфе, а здесь мы сосредоточим
внимание на собственных аксиомах. Другими словами, мы
рассматриваем множество К теории S как аксиоматику этой теории.
Итак, множество К содержит два типа аксиом: логические и
собственные. Логические аксиомы — это общезначимые секвенции
вида А -+ В или Г', С, Г" -* в', С, в", где А и В — предложе-
*) Имеется в виду константпо-частный случай по рефлексным
переменным.
§ 6.4. АКСИОМАТИКА
на
пия одного уровня (первого или второго), В s А и С — атом
первого уровня. Эти аксиомы истинны в любом мире задач.
Гораздо больший интерес представляют собственные аксиомы,,
так как именно они выражают специфику конкретного мира
задач. Собственные аксиомы К, в отличие от логических, содержат,
как правило, конкретные отношения и представляют собой
конструкции из содержательно связанных утверждений. Введение в
исчисление конкретных отношений осуществляется либо путем
аксиоматизации их свойств, например, аксиомы равенства, либо
процедурными правилами вывода, например, парамодуляция в
методе резолюций (Робинсон, Вое, 1969].
Выбор одного из этих путей зависит от характера исчисления
и самого отношения. Так, в исчислении резольвент
парамодуляция дала определенные преимущества перед системой аксиом
равенства, так как позволяла: а) получать более сжатый вывод it
б) избегать порождения ненужных промежуточных
результатов—шумов вывода [Робинсон, Вое, 1969]. К этому следует
добавить, что зачастую легче ввести отношение процедурально,,
чем строить соответствующую декларативную систему аксиом.
По-видимому, в аксиоматике К целесообразно использовать
оба пути. Так, аксиомы теории 512, играющие роль определений
конкретных отношений, целесообразно описывать декларативно,
аксиомы теории St или 52, представляющие описания
элементарных задач и содержащие сколемские функции, выражающие
функциональную связь переменных, целесообразно описывать
декларативно-процедурально, а именно, описывать процедурально
указанные сколемские функции и декларативно — все остальное.
Мы не собираемся в данный момент строить конкретную
аксиоматику, так как она каждый раз своя для конкретного класса
задач. Мы будем считать, что такая аксиоматика при
необходимости может быть построена, и нам лишь остается описать ее в
достаточно общем виде и изучить свойства.
Итак, рассмотрим вначале аксиомы теории St (или теории Sz)*
6.4.1. Аксиоматика К\. В К{ будем различать два вида схем
аксиом: статические и динамические. Аксиомы первого типа
представляют собой высказывания (обычпо это фреймы) о
какой-нибудь одной ситуации либо о мире задач в целом; аксиомы
второго типа — высказывания (обычно это тоже фреймы) о
нескольких, как правило двух, различных ситуациях мира задач.
В дальнейшем мы ограничимся лишь рассмотрением аксиом Ки
представляющих собой связки языка L4. Пусть А и В — два
содержательно связапных предложения языка Lt. Тогда К%
формируется следующим образом:
1) Если каждый раз истинность А' влечет истинность В'
либо в любой, но одной и той же ситуации Д/(т), либо вообще
безотносительно к какой-либо ситуации, то в Kt вводится статиче-
8 Е. И. Ефимов
114
ГЛ. 8. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
екая аксиома -*• А -*- В. Примером первого случая может служить
аксиома
— НА (ЯЩИК, ПОЛ, t) НА (РОБОТ, ЯЩИК, t) ^
НАД (РОБОТ, ПОЛ, О.
примером второго — аксиома
-* ХАРАКТЕР (ПЕРЕМЕЩЕНИЕ, ПРЯМ-РАВИОМЕРНОЕ) =**
МЕРА (ПЕРЕМЕЩЕНИЕ, ЭФФЕКТИВНЫЙ).
2) Если каждый раз А' ж В' одновременно истинны или лож-
ны либо в любой, но одной и той же ситуации Л/(т), либо
безотносительно к какой-нибудь ситуации, то в Kt вводится
статическая аксиома -> А -*=► В. Примером первого случая может
служить аксиома
-* АТАКУЕТ (ФИГУРА, КОРОЛЬ, t) РАЗНОЦВЕТ (ФИГУРА,
КОРОЛЬ) ** 1ПАХ (ФИГУРА, КОРОЛЬ, *),
примером второго — аксиома
-+- СЫН (ЧЕЛ-1, ЧЕЛ-2) СЫН (ЧЕЛ-2, ЧЕЛ-3) «*
ВНУК (ЧЕЛ-1, ЧЕЛ-3).
3) Если А' выражает исходные данные элементарной задачи,
необходимые и достаточные для получения ее результата В\
и каждый раз А' ж В' одновременно истинны или ложны в любых
двух, но связанных определенной функциональной зависимостью
ситуациях M(ti) и М(т2), и при этом %i < т2, то в Kv вводится
динамическая аксиома ч-Л^ХВ^)*).
Указанный метод построения аксиоматики Ки как легко
видеть, зависит от задания конкретной структуры Af, чего мы в
целях сохранения общности всячески стараемся избежать. Таким
образом, априори мы не имеем эффективных правил
распознавания аксиом, и поэтому в дальнейшем нам часто придется взамен
интуитивной очевидности постулировать те или иные свойства
аксиоматики, например ее непротиворечивость.
Обсудим отмеченные типы аксиом более подробно. Наличие
аксиом типа -> А =>- В свидетельствует, что возможны миры
задач, в которых заключение В может являться следствием
различных посылок, играющих роль различных достаточных
условий. В таких случаях мы пишем -*Ai**-B4 где А{ — £-е
достаточное условие для В; при этом перечень А{ должен быть
полным, т. е. представлять в целом необходимые и достаточные
условия для В.
Если мир задач устроен так, что заключение В имеет
единственную возможную посылку А, т. е. в этом случае А играет
*) Примеры динамических аксиом и их более подробное описанпо
приведены ниже.
§ 6.4. АКСИОМАТИКА
115-
роль необходимого и достаточного условия для В, то
используются аксиомы типа -*■ А •<=>• В. В этих аксиомах А и В
содержательно и дедуктивно эквивалентны. Необходимость
аксиоматизации элементарных задач мира М приводит к аксиомам типа
-*■ А < В, в которых А и В дедуктивно эквивалентны, но
содержательно различны.
Дедуктивные особенности собственных аксиом, а также
аксиомы вида классической материальной импликации А => В, в
которой, как известно, А и В не предполагаются содержательно
связанными, иллюстрируются в табл. 6-1. В этой таблице
приведены результаты вывода заключения из исходных посылок и
соответствующей аксиомы; знак «?» указывает на
неопределенность заключения; выражения (>Иг)» »s{v»3| относятся.
к столбцу, помеченному аксиомой ->■ А{ =*■ В.
Таблица 6-1
| Посылки
^(aHi)
1 MviAi)
в
в
Аксиомы
->АЭВ
В
?
?
А
->А.^В
В
Т
эи,
vHi
-+А<В
В
Т
А
X
•+А&В J
В
F
А
3
Из табл. 6-1 следует, что собственные аксиомы Kt дедуктивно-
неразличимы, однако для случая задания V^ (или В) вывод.
с помощью аксиом А{=*-В заключения В (илиЭ^) может
оказаться неверным, если мир задач содержит еще некоторые,
неизвестные нам и, следовательно, неописанные достаточные условия
для В, Таким образом, избавление от известного парадокса
материальной импликации (ложность А влечет истинность В) в
нашем случае не избавляет нас от ошибок за счет неполноты
знаний о мире задач.
Рассмотрим теперь более подробно структуру схемы
динамической аксиомы -*• А -< В, служащей описанием схемы
элементарной задачи. Конкретизация схемы аксиомы путем
присваивания определенных значений всем ее переменным приводит
к определенной аксиоме, представляющей описание уже
конкретной элементарной задачи.
Как уже отмечалось, схема аксиомы в результате сколемиза-
ции содержит только ограниченно универсальные переменные,
к числу которых мы будем относить объект w0 и время начала
8*
i!6
ГЛ. 6. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
решения t{ (либо время конца решения t2) *). Таким образом,
динамическая схема представляет высказывание типа фрейма.
Однако в целях наглядности мы будем сохранять в написании
схемы аксиомы в явном виде и другие переменные, имея при
этом в виду, что они в конечном итоге являются значениями ско-
лемских функций от вышеуказанных универсальных переменных.
В самом общем случае динамическая схема должна включать
следующие структурные компоненты: Ba{wg, t) — описание
состояний субъекта w9 в моменты t% и t2, Bc(wc, t) — описание
состояний средств ш0 в моменты U и t2, B0(w0, t) — описание состояний
объекта w0 в моменты £, и t2, Sv(m;„ w0, и>с, /, U) — описание
условий использования задачи в момент tu выражающее
необходимые связи между wai w0J wc и /, £Д/, t) — описание состояний
собственно задачи / в моменты U и t2.
Таким образом, в общем виде схема динамической аксиомы
имеет следующую структуру:
-* В,ий)ВМВ0(и)Во(и)Вт{и) < Bf(t2)Batt2)BMB0(t2). (6.1)
В выражении (6.1) все компоненты, кроме Bfy специфичны и их
копкретный вид полностью определяется предметным миром.
Компонента Bf является универсальной и имеет следующий вид:
Я/(/, U) - СУБ (/, Ю.А) СРЕД (/, wC4 U) ОБ (/, w0, tt) ХАРАК-
ТЕР-ОБ (/, у1) ХАРАКТЕР-СУБ (/, у2) ХАРАКТЕР-СРЕД (/, у3)
МЕРА (/, у') НАЧАЛО (/, tt); _
В/(/, Ь)-СУБ (/, wt) t2) СРЕД (/, w99 U) ОБ (/, woy и)
КОНЕЦ (/, и).
Компонента Bf(f, t{) фиксирует на момент начала решения
ti в качестве субъекта, средства и объекта задачи / = if>/(i#o» t),
t^{tu t2), соответственно предметы wa = ф8(/), wc = г|)с(/) и w0>
где я]) — функции Сколема. Указанная компонента также
устанавливает закон изменения во времени: г/1 — состояний объекта,
например, «прямолинейное — равномерное», уг — состояний
субъекта, например, «равномерный расход ресурса», у3 — состояний
средств, например, «равномерный износ» для задачи
перемещения.
В общем случае характер г/1 зависит от задачи / и состояний
wa и wc на момент tu что может быть представлено в виде
г/1='ф1(/, Wsi wc, ti), например, прямолинейное перемещение на
местности возможно только, если субъект имеет малые ресурсы,
но зато располагает подручными средствами для задачи
переправы через водное препятствие. Характер у2 зависит от / и г/1, т. е.
У2 = \\h(f, У1), например, интенсивный расход ресурсов при
быстром движении. Аналогично, у3= \|)3(/, г/1)» например, медленный
•износ при равномерном движении.
*) Выбор в качестзе универсальной переменной t\ либо t2 определяет^
ся направлением поиска: при обратном поиске t2, при прямом tu
§6 4. АКСИОМАТИКА
117
Указанные характеры в свою очередь представляют
функциональные зависимости вида y4wc, wQ, tu t2) = 0, например, z =»
= .r H- Vitz — ti) для прямолинейного равномерного движения у1,
где z и х— координаты объекта w0 на момент t2 и £i
соответственно, a F — скорость, соответствующая средству wc;
y2(w„ tu t2)=0, например, z ~ x — k(t2 — t{)2, где z и я —запасы
ресурса субъекта на момент U и <* соответственно, а к —
положительный коэффициент (относительный расход в единицу
времени); #8(и?с, *и ^) = 0, например, zefe""''2"'1', где z — степень
износа средства м>0 на момент £2.
Наконец, последняя компонента В/(/, £,) — мера задачи #4
(например, надежное решение, дорогое решение и т. д.) в общем
случае зависит от задачи / и у\ т. е. ук *= *ф4(/, уК), например,
«недорогое решение» при равномерном движении.
Компонента ВД/, t2) устанавливает разрушение связей СУБ,
СРЕД и ОБ после окончания решения в момент t2.
Таким образом, выражение (6.1) представляет собой
контекст, переменные в котором связаны соответствующими сколем-
скими функциями и условиями By(ti).
Для пояснения сказанного приведем пример схемы аксиомы
«наполнить». В этой схеме ВД/, t{) и ВД/, t2) имеют ранее
приведенный вид, остальные компоненты представляют следующие
выражения:
вЛю.,*о«рес(ш., »?,*,);
Вс (wc,tt) = ИЗНОС (м;с, у\°ч О;
В0 К, *,) « МЕСТО (и>0, у?, О;
ВД/, юшч we, Wo, *.)-ХАРАКТЕР-СРЕД (/,
НЕИНТЕНСИВНЫЙ) СВОБ (и?., ]*ь t2[) СВОБ (шс, ]«lf t%[) МЕНЬШЕ (yl°
СИЛЬНЫЙ, tf) БОЛЬШЕ (у\ МАЛО, U) РЯДОМ (wa, wc, tx)
ЕМКОСТЬ (у\ч ПУСТО, U) СОСТОЯНИЕ^*, ОТКРЫТ, и) ОРИ-
EHTfoS, ВВЕРХ, *4> ПОД Q/lu>c, *i) РЯДОМ <м;0, yt ^)
СОСТОЯНИЕ (w0f ОТКРЫТ *,); здесь (например, СВОБ (шя, ]tu Ф
означает, что wt свободен ,от решения задачи в е-окрестности
интервала [tu У;
Ba{w94t2)~PEC{wt,ylt2);
Be (wG, h) = ИЗНОС(шс, y\\ t2);
#o (u>0, *a) = МЕСТО (w0, yl t2) ЕМКОСТЬ (у*, ПОЛНО, f2)-
Пусть в данной схеме имеют место следующие множества
значений переменных и зависимостей между ними:
iwt) - {РОБОТ-1, ..., РОБОТ-5}, ф. - выбор w8 e {и?.};
{и>0} - (ВОДА, ПЕСОК, ГОРЮЧЕЕ};
{wc} = {КРАН, ЧЕРПАЛКА, ЛОПАТА), фс - выбор wc е {шс>;
118
ГЛ. 6. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
МЕСТО - {РЕЗЕРВУАР-1, РЕЗЕРВУАР-2, ПРУД, БУНКЕР,
ВЕДРО, БАК, ЯЩИК), 1|>, - выбор у' е= {,,«};
РЕСУРС - {МНОГО, СРЕДНЕ, МАЛО), tf6-выбор у*«з
с {у5};
ХАРАКТЕР-ОБ ■= {БЫСТРО, МЕДЛЕННО}, tf, - выбор у1;
ХАРАКТЕР-СУБ = {ЭКОНОМНО, НЕЭКОНОМНО}, ^ -
выбор у2;
ХАРАКТЕР-СРЕД = {ИНТЕНСИВНЫЙ, НЕИНТЕПСИВ-
ИЫЙ}, -фз — выбор у3;
МЕРА - {ДОРОГО, ДЕШЕВО}, ^ - выбор ?/;
ЕМКОСТЬ = {ПУСТО, ПОЛНО), Ч>» - выбор у1;
ОРИЕНТАЦИЯ = {БВЕРХ, ВНИЗ, ВБОК), ц>, - выбор у';
СОСТОЯНИЕ = {ЗАКРЫТ, ОТКРЫТ}, ф, - выбор у';
ИЗНОС = {СИЛЬНЫЙ, СРЕДНИЙ, СЛАБЫЙ}, ц>„ -
выбор у";
[ СРЕДНИЙ (износ), МНОГО или СРЕДНЕ (ресурс) —
МЕДЛЕННО,
*,: СЛАБЫЙ (износ), МНОГО (ресурс) - БЫСТРО,
СЛАБЫЙ или СРЕДНИЙ (износ), СРЕДНЕ (ресурс) —
IМЕДЛЕННО:
,„ . f МЕДЛЕННО - ЭКОНОМНО,
^2' I БЫСТРО -- НЕЭКОНОМНО;
4ь . Г МЕДЛЕННО -*- НЕИНТЕНСИВНЫЙ,
^3' \ БЫСТРО -* ИНТЕНСИВНЫЙ;
БЫСТРО: »'-*,(*,-*,);
МЕДЛЕННО: у"1 — k2(fa — ti), где при слабом износе fej-пол-
нс/5, при среднем износе /с2-полно/10;
ЭКОНОМНО- ( МН0Г0 -+ СРЕДНЕ,
ститл . \ СРЕДНЕ -* МАЛО;
НЕЭКОНОМНО: МНОГО -+ МАЛО;
ИНТЕНСИВНЫЙ: СЛАБЫЙ -* СИЛЬНЫЙ;
„ЕИНТЕНСИВНЬШ^ЛАБЬШ^РЕДНИЯ^
,,. . / БЫСТРО -*■ ДЕШЕВО,
Чч-1 МЕДЛЕННО ч- ДОРОГО.
Поясним, как осуществляется означивание переменных
данной аксиомы. Пусть задано требуемое состояние на момент t2:
МЕСТО (ВОДА, ВЕДРО, *,) ЕМКОСТЬ (ВЕДРО, ПОЛНО, tz), по
которому мы выбираем данную схему и устанавливаем, что
ВОДА -*- w0 и ВЕДРО -*• у\. Первоначально используем
составляющие схемы, не зависящие от времени. Согласно условию
ХАРАКТЕР-СРЕД (/, НЕИНТЕНСИВНЫЙ) находим:
1) j/' = J1 НЕИНТЕНСИВНЫЙ J - МЕДЛЕННО, закон
наполнения ведра водой у' •= к2Цг — £t), tl = ti — 10, ИЗНОС (we,
СРЕДНИЙ, tj и ИЗНОС (и>с, СИЛЬНЫЙ, *,);
§ 8.4. АКСИОМАТИКА
119
2) % | МЕДЛЕННО | « СРЕДНИЙ (износ), СРЕДНЕ или
МНОГО (ресурс), т. е. PEC (w91 СРЕДНЕ, tt\ или РЕС Ы9,
МНОГО, U);
3) у* = ур2 \ МЕДЛЕННО | — ЭКОНОМНО, т. е. ХАРАКТЕР-
СУБ (/, ЭКОНОМНО);
4) z/4 = ^4! МЕДЛЕННО )= ДОРОГО, т. е. МЕРА (/,
ДОРОГО).
Пусть согласно условию СВОЕ (w„ ]tu t2l) имеем w, ^ (РО-
БОТ-1, РОБОТ-3}, при этом РОБОТ-3 уже решал следующую (по
возрастанию времени) задачу, и поэтому его ресурс известен,
пусть это будет РЕС (РОБОТ-3, СРЕДНЕ, fe), а РОБОТ-1 не
решал, поэтому РЕС (РОБОТ-1, МАЛО, h) (нет смысла экономить
ресурсы, если этот робот не будет решать дальнейшие задачи),
СОГЛАСНО УСЛОВИЮ СВОБ (шс, ]*ц Ш имеем wc &
€5 {КРАН, ЧЕРПАЛКА}, при этом оба средства не
использовались для дальнейшего решения задач, и поэтому, аналогично,
имеем ИЗНОС (КРАН, СИЛЬНЫЙ; и) и ИЗНОС (ЧЕРПАЛКА,
СИЛЬНЫЙ, fe).
Таким образом, сформулированы все возможные варианты
истинного сукцедента аксиомы и можно переходить к ее
антецеденту. Для дальнейшего означивания переменных нам
необходимо задать исходную ситуацию на момент tQ. Пусть она включает
МЕСТО (ВОДА, РЕЗЕРВУАР-1, *0) МЕСТО (ВОДА, ПРУД, *0)
РЯДОМ (РОБОТ-1, ПРУД, to) РЯДОМ (КРАН, РЕЗЕРВУАР-1,
to) РЯДОМ (КРАН, РЕЗЕРВУАР-2, *в).
Сопоставляя условия РЯДОМ (wt, y\,
*i)i требуемое исходное
состояние объекта МЕСТО (ВОДА, у\, tx), w, е {РОБОТ-1,
РОБОТ-3} и реальную исходную ситуацию, находим РОБОТ-1 ->- ш„
ПРУД -vj/5. Выбор РОБОТ-1 -* м\ уточняет МАЛО -+у\ и
согласно закону ЭКОНОМНО уточняет СРЕДНЕ -+у\.
Нам осталось уточнить только средство wc e (КРАН,
ЧЕРПАЛКА}. Сопоставление условия РЯДОМ (wci ВОДА, tt) с
реальным состоянием РЯДОМ (КРАН, РЕЗЕРВУАР-1, *0) РЯДОМ
(КРАН, РЕЗЕРВУАР-2, *в) исключает в качестве средства КРАН.
Следовательно, имеем ЧЕРПАЛКА -> we. Означивание
закончено, и в итоге мы получаем аксиому, описывающую конкретную
задачу Ъ со следующими параметрами:
субъект задачи — РОБОТ-1,
средство задачи — ЧЕРПАЛКА,
объект задачи — ВОДА,
характер наливания воды — МЕДЛЕННО,
характер затраты ресурсов робота — ЭКОНОМНО,
характер изнашивания черпака — НЕИНТЕНСИВНЫЯ,
мера решения задачи — ДОРОГО,
120
ГЛ. 6. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
начало решения задачи — tu
начальный ресурс робота — СРЕДНЕ,
начальное состояние черпака — СРЕДНИЙ (износ) и ОТ
КРЫТ,
начальное место воды — ПРУД,
начальное взаимоположение робота и пруда — РЯДОМ,
начальное взаимоположение робота и черпака —РЯДОМ,
начальное состояние ведра — ПУСТО, ОТКРЫТ, ВВЕРХ
(ориентировано) и ПОД (черпаком),
начальпое взаимоположение черпака и ведра — РЯДОМ,
конец решения задачи — t2,
конечный ресурс робота — МАЛО,
конечный износ черпака — СИЛЬНЫЙ,
конечное место воды — ВЕДРО,
конечное состояние ведра — ПОЛНО (воды).
Для физических миров требуемый результат задачи обычно
связан либо с изменением овойств, ресурсов и местоположения
объекта, либо с изменением его отношений с другими предмета-
ми, либо, наконец, с созданием или уничтожением самого
объекта; при этом могут попутно изменяться состояния субъекта
(в частности, расходоваться его ресурсы), а также изменяться
состояния средства (в частности, его изнашивание). Что же
касается таких характеристик элементарного решения, как МЕРА,
ХАРАКТЕР и другие, то они также могут изменяться во времени
и эти изменения могут выражаться аксиомами в декларативной
или процедуралыюй форме.
Аксиомы Ki можно разделить на универсальные (для всех
классов задач) и на специальные (для определенного класса
задач). Примером универсальных аксиом могут служить
следующие:
1. Аксиомы существования предметов или задач:
а) -* А(х, г/, t) -> БЫТЬ U, *);
б) -+А(хи хг, ОТБЫТЬ Grlf t) БЫТЬ U2, t), где А —
атом языка Lt;
в) «если предмет или задача никак не описаны в исходной
ситуации, то они не существуют» (вводится процедурально).
2. Аксиома единственности/ значения свойства А у предмета
или задачи: -+ A U, yu t) =*- А(х, у2, t), где у^Ф у2.
3. Аксиома сохранения: «если предмет w не является
объектом никакой элементарной задачи, то значения его свойств
сохраняются и он не может служить причиной изменения его
отношений с другими предметами» (вводится процедурально).
4. Аксиомы временных форм:
а) ->• БЫЛ(.г, t) *> БЫЛЬ, t + ДО;
б) -> БУДЕТи,_*) «* БУДЕТи, t - Л*);
в) ->- .4U, t) =>■ J3U, J),
§ 6.5. ПРАВИЛА ВЫВОДА
121
тде t — произвольное прошлое, пастоящее или будущее время,
БЫЛ(.г, t) — «х был до t и в t его нет», БЫТЬ(#, t) — «х есть
в £», БУДЕТЧа:, t) — «х будет после t и в t его нет», АФВ
одновременно и Л, В — одно из отношений БЫЛ, БЫТЬ,
БУДЕТ.
Специальные аксиомы К{ обычно связывают между собой
отношения мира (пространственные, временные и другие).
6.4.2. Аксиоматика Кп. В К 12 имеют место только статические
аксиомы вида -»- Вг •*=*■ Л, т. е. фреймы языка Li2. По существу,
эти аксиомы представляют собой определения рефлексных
предложений языка L2 через перцептивные предложения языка Lu
что позволяет содержательно связывать между собой аксиоматики
Ki и К2. Аксиомы К12 могут вводиться декларативно и проце-
дурально, быть универсальными и специальными. Специальные
аксиомы Ki2 обычно выражают обобщение — конкретизацию
пространственных, временных или атрибутивных отношеппй.
Примерами таких аксиом могут служить:
1. Пространственная аксиома:
-> СМЕЖНА (КОМН-1, КОМН-2) -^ ОДВ-1 е КОМН-1)
ОДВ-2 е КОМН-2) ОДНА-И-ТА-ЖЕ (ДВ-1, ДВ-2).
2. Временная аксиома:
- ПРЕДШ (/?, ft)M\ffl^fi) (v/^/22) [КОНЕЦ (fit,) НАЧАЛО
(/ПОБОЛЬШЕ (tu t2)].
3. Атрибутивная аксиома: «ресурс предмета w2 объединяет
ресурсы всех входящих в него предметов и>4» (вводится
процедура льно).
§ 6.5. Правила вывода
Правила вывода в теории S будем представлять в виде
некоторой фигуры, включающей верхнюю (верхние) и нижнюю
секвепции, разделенные горизонтальной чертой, которая, если
смотреть сверху вниз, выполняет роль отношения «посылки —
заключение». Рассмотрим правила для каждой компоненты
теории S.
6.5.1. Правила теории S1 (или 52). Применительно к Si
будем использовать секвенции двух типов: 1) В{ -*- Вг и 2) ->■ Я, ®
® В2, где Bi и В2 — предложения логики >Lt и символ ®
принадлежит множеству знаков {=>, ■<=*, -<}. Секвенция 1-го типа
выражает факт, что В{ позволяет получить Вг, секвенция 2-го типа
представляет собой собственную аксиому К± в виде фрейма, за-
122 ГЛ. в. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
данную изначально *). Среди секвенций 1-го типа выделим
общезначимые секвенции вида А-+ В, где ВеЛ, которые в отличие
от собственных аксиом назовем логическими; остальные
секвенции этого типа будут являться доказываемыми теоремами.
Пусть вались предложения в виде CQ (в может быть пусто)
означает, что нам необходимо выделить подиредложения С.
Пусть также запись Л означает либо предложение Л, либо его
отрицание А. Тогда в St могут иметь место следующие правилам
р-+в'п_1с'в'п_1с'-+вп ^e^cX-i^^
где все предложения, кроме входящих в собственные аксиомы,
представляют факты; <|>акт D предполагается всегда истинным,
GnsD; 0n £ 0n_iC"; B{ s Gnen-i, 1 < i < rn, и та — число
условий В{, достаточных для заключения С; факты В{ и С'
одного знака ~; вп-.! = вп-1 U ©п-г
Каждое из указанных правил можно рассматривать как
сверху вниз, так и снизу вверх и в зависимости от этого толковать
по-разному. Если представить эти правила как отношения,
определенные в пространстве выражений логики Lu и
воспользоваться языком алгебраической теории бинарных отношений (см. § 4.2)v
то R и R будут представлять правила, рассматриваемые
соответственно снизу вверх и сверху вниз. Поясним введенные правила
теории iS\. -1
Правило jRi служит для доказательства исходной я-шаговой
теоремы D -+- 0П, используя в качестве посылок логическую
аксиому en_iC->-0n и расширенную (за счет сукцедента)
/г-шаговую теорему D->Qn-iCr; правило Л4 позволяет входить
в собственные аксиомы путем требуемого расширения исходной
теоремы D -*• вп.
Правило R2 служит для доказательства расширенной
«-шаговой теоремы D-+Qn-\C'i используя в качестве посылок
ранее доказанные (п— 1)-шаговую D -*■ 0n_i и одношаговую
Gn®n-i->&' теоремы; правило R2 по существу использует
разложение сукцедента en-iC" доказываемой* теоремы па более
простые, в общем случае дедуктивно связанные факты @n-i и С'.
*) Возможны также собственные аксиомы вида-*/?, где
предложение В представляет фрейм, но мы такие секвенции рассматривать не
будем.
§ 6 5. ПРАВИЛА ВЫВОДА 123
— i
Правило Rs служит для доказательства одношаговой теоремы,
используя в качестве посылок логическую Gn0n_1->fii и
собственную -* 5<(g) С аксиомы. При этом, если знак ~ не является
отрицательным, т. е. имеем Gn®n^-*~BU то правило использует
только одну соответствующую аксиому -* Д< ® С; если знак ~
отрицателен, т. е. имеем Gn®n-i~+Bb то правило использует
все аксиомы -^В^С. Правило Д3 устанавливает необходимые и
достаточные условия для применения собственных аксиом в
доказательстве одношаговых теорем. Правила Д3 и R3 включают
процедуру означивания переменных собственных аксиом.
Наконец, правило Д4 имеет вспомогательное значение и
служит для введения логической связки ® следующим образом:
(<(,если при доказательстве D ->- 6П использовалась хотя бы
одна аксиома типа -+ В -< С;
*,если при доказательстве D ->- вп не использовалось пи
0 ==| одной аксиомы типа -*- В -< С, но использовалась хотя
бы одна аксиома типа -*• В =>• С\
4Ф,если при доказательстве D -*■ вп использовались только
аксиомы типа -*• 5 -<=*- С.
Для сокращения поиска вывода в Sv необходимо вводить
производные многопосылочные правила 52. Продолжая использовать
язык алгебраической теории бинарных отношений, можно
представлять производные правила в виде соответствующих
произведений (см. § 4.2). Например, введем правило 3iit n = Дз ° Дг ° /?i,
имеющее вид
тде все обозначения сохраняют прежний смысл.
Процедурное правило 5?1(П как будет показано в дальнейшем,
по существу представляет правило редуцирования исходной п-ша-
говой теоремы D -> вп на две подтеоремы, из которых D -*- Огг-i
является (п — 1)-шаговой, a C?n0n-i->C" (доказывается с
помощью акйиом Gn@^i -+В[ и ->■ В{ ® С) — одношаговой.
-1 -1 -1 -1
Смысл производного правила 5?lf п = Rx° R2° R$ состоит в
следующем: если существует собственная аксиома -+Bi<g)C такая,
что имеют место соответствующие логические аксиомы при
одинаковых знаках б{ и С, и если найден (процедурно) факт
e„_t и доказана теорема D -*- 0n-i, то за один шаг доказывается
теорема D -*• в«.
124
ГЛ 6. ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
Правило 5?i, п не является единственно возможным в теории
S,. Покажем это. Пусть в St имеют место только следующие
основные правила:
, z>-»c'ew-i с'вп_к->вп , р-*с'.р„-+еп_к
где Д G*, i о знак ~ имеют прежний смысл, вп^С'Оп-*,
BiClGbfdk-\ и DA — исходные данные после ft-ro шага. Правила
Ru R22 и /?g аналогичны по смыслу правилам /?i, R2 и й8
соответственно, а именно: Ri сводит заданную теорему к
расширенной, #22редуцирует ft-шаговую теорему D -*■ С на (Л — 1)-
шаговую D -> 0ft-t и одношаговую Gfc6A-i -*- С подтеоремы, /?3
сводит одыошаговую теорему к аксиомам. Специфика имеется
лишь в правиле #2i» которое редуцирует исходную дг-шаговую
теорему D ->■ С'вп-л на ft-шаговую D -+■ С7 и (л — /е)-шаговую D* -*-
-*■ Gn-* подтеоремы.
Из указанных правил можно построить производное правило
91к%п = В3«> /?22 • #2i ° #i> имеющее вид
л D -» e»-i Gk%~, -» Щ Dh -+ en_fe с'еп_к -»еп-+в.®с
Лкп D ^ e^
Таким образом, правило SlK n также представляет правило
редуцирования исходной /г-шаговой теоремы D -* ©п на две
подтеоремы, из которых D -*■ С (доказывается с помощью (ft — 1)-
шаговой теоремы D -*■ 6ft-i и аксиом б^в/^->-£^ и ->#i®C)
является ft-шаговой, a Dh -*- 0Л_А — (/г — й;)-тнаговой.
По существу, процедурные правила i%lt Л и $?л, п отражают
две стратегии поиска доказательств, в частности, 52й) п выражает
стратегию системы STRIPS [Файкс, Нильсон, 19711. Однако,
как будет показано в гл. 8, стратегия ЗйК п является частным
случаем стратегии 5?i, n.
Помимо указанных основных правил, в St могут иметь место
и такие вспомогательные, технические правила, как
в^в%в3в% V1£A
5 *,-*А aIi«Bl-»B3B2-
6.5.2. Правила теории S12. Применительно к S12 также будем
использовать секвенции двух типов: Г -* 0 и -*■ В2 -**- А, где Г
ив — списки формул, а секвенция -+ Bz <=> А — связка логики
£12. Среди секвенций первого типа также будем выделять ло-
§ 6.5. ПРАВИЛА ВЫВОДА
12£
гические аксиомы вида Г', С, Г" -*• в', С, в", где С —
перцептивный атом; остальные секвенции этого типа будут являться
доказываемыми теоремами. Секвенции второго типа
представляют собой собственные аксиомы Ki2 в виде фреймов, заданные
изначально.
Пусть Г и в — списки соответственно истинных и ложных
формул логики /-^2) которые не меняются в данном правиле»
Пусть также А и В — произвольные формулы ЛОГИКИ biz] % —
перцептивная переменная и хг — рефлексный терм такие, что х*
принимает значения из а;2, хх ^ ж2; b^f- «новая»
перцептивная переменная того же сорта, что и х\ не входящая в нижнюю
секвенцию; ref- «старая» перцептивная переменная,
значениями которой являются термы того же сорта из нижней
секвенции. Тогда в 5i2 имеют место следующие правила:
г -> а, е -+ в2, о a R г, л->е -+в2^а .
р г-*е, лг-^е, в / . р л, д, г-*е , 0 .
il3« —г->е, а&в Н*^Ь %лргГГ0^"*'•
д л, г->е, в , ^ _ч ^ г-*е,лв, г-»е ,_
6а г->е, (у*1^*2)^*1)1 V)'
66 Mv*1^*2)^*1)-^ (v~^'
Г -> А (г), (3*1 g Д?'2\0 А (д:1), в
д 1 -» ^ (Г), \^Х~ C=X\r)A \X~U & ( -,
Легко видеть, что правила R2 — Я5 являются
соответствующими правилами ранее описанной системы G4 (см. § 5.3).
Правда, вследствие априори фиксированной конечной области
индивидов М (область задается значением перемепной хг) в теории
Si2 приобретают иной смысл правила RQ и Д7. Дело в том, что
в этом случае для построения доказательства в теории Si2
отпадает надобность в поиске контрпримера, как в G4 (нет смысла
искать опровергающую интерпретацию, коль скоро априори
задана предметная область М). Однако поиск доказательства в
oi2 можно представить как проверку заданной М на свойство
«быть контрпримером».
128
ГЛ 6 ПОСТРОЕНИЕ ТЕОРИИ РЕШЕНИЙ
Новое, по сравнению с G4, правило Ri, связаипое с собствен-»
иыми аксиомами 512, всегда используется на первом шаге
опровержения очередной элементарной секвенции*). Все сказанное
позволяет считать теорию Si2 некоторой модификацией
системы G4.
§ 6.6. Семантика
В § 6.2 приводилась истинностная интерпретация выражепий
логики L, в том числе и выражений аксиоматической теории
S = (К, /?>. Под семантикой теории S мы будем подразумевать
содержательный смысл ее отдельных выражений и их
определенных последовательностей, а также правил вывода. Выражения
S представляют собой аксиомы и теоремы, последовательности
выражений —- доказательства, правила вывода — производные
правила (например, $tlt n или 91к п) и правила введения и
удаления логических операторов 512.
Все выражения теории S состоят из атомов трех видов, в
которые вкладывается следующая семантика:
атом g(tu ..., tn), где U — призначныи терм, определяет
отношение между значениями свойств (одного или нескольких
предметов или элементарных задач), например, БОЛЬШЕ (tu t2);
атом g(x, tu ..., О, где х — терм сорта «предмет» или
«элементарная задача» и U — призначныи терм, определяет свойство
предметов или элементарных задач, например, ЦВЕТЧПРЕДМЕТ,
КРАСНЫЙ) или ХАРАКТЕР (ПЕРЕМЕЩЕНИЕ, t);
атом g(xu ..., хП1 £), где хх — термы сорта «предмет» или
«элемептарная задача», a t — терм сорта «время», определяет
отношение между предметами или элементарными задачами в
момент t, например, ПРАВЕЕ (хи х2, t) или РАНЬШЕ (/,, /2).
Собственные аксиомы теории S представляют либо фреймы,
либо факты, а теоремы — только факты. Фреймы теории Si (или
S2) описывают схемы элементарных задач, а соответствующие
факты — конкретные элементарные задачи. Теоремы D -*■ Е
теории Si (или S2) описывают решенные одноуровневые задачи,
в которых факты D и Е в свою очередь определяют
соответственно исходные данные и требуемые результаты этих задач.
Доказательства теорем D -*- Е содержат решения
соответствующих задач. Наконец, производные правила теории S\ (илч
S2) описывают стратегии поиска требуемых решений, например,
правило 5?lt „ описывает стратегию редукции исходной
одноуровневой задачи на две подзадачи, из которых одна является
элементарной (одношаговой), а правило 32ft, n описывает стратегию
редукции той же исходной задачи на две сложные подзадачи.
*) Определение элементарпой секвенции см. в § 7.4.
§ G б. СЕМАНТИКА
127
Фреймы теории Si2 задают определения обобщенных (с
универсальными переменными) рефлексных атомов или рефлексных
атомарных фактов через обобщенные структуры более простых
обобщенных (с переменными) перцептивных атомов, а
соответствующие аксиомы-факты задают определения атомарных рефлекс-
пых фактов через конкретные структуры атомарных
перцептивных фактов.
Теоремы В1 -*■ В2 теории 512 задают: а) при наличии
перцептивного факта В* задачу структуризации В\ итогом решения
которой является рефлексный атомарный факт В2; б) при
наличии рефлексного атомарного факта В2 задачу деструктуризации
В2у итогом решения которой является перцептивный факт В1
(при этом В* определяет исходные данные или требуемый
результат перцептивной задачи, а В2 представляет собой, как
правило, фрагмент исходных данных или требуемого результата
соответствующей рефлексной элементарной задачи).
Доказательства теории Si2 в соответствии с вышеуказанными
вариантами а и б описывают решения задач структуризации и
деструктуризации. Наконец, правила Rn теории & 12 путем
введения или удаления логических операторов осуществляют
структуризацию или деструктуризацию соответствующих фактов.
ГЛАВА 7
ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
Во всякой аксиоматической теории помимо описапия языка
представляет интерес рассмотрение ее основных свойств. Мы
будем различать теорию решений S как объект изучения и
метатеорию, с помощью которой изучается теория S. Соответственно
будем различать объективный язык L и метаязык. Свойства
теории S, а также ее строго формальных выражений и
доказательств мы будем изучать на основе содержательных
доказательств метатеорем, проводимых на метаязыке.
§ 7.1 Истинность
Пусть нам задано множество аксиом К теории S. В § 6.2 было
введено понятие одноуровневой структуры М как множества
индивидов различных сортов и множества n-местных отношений,
определенных на этих индивидах. Эта структура служила
моделью одноуровневого мира (операций или задач) и поэтому
(см. §§ 3.2, 3.3) могла быть представлена в виде четверки: М =
=* <А, В, С, st-У, где А — множество имен предметов, В —
множество имен элементарных задач (или операций), С —
множество значений свойств и S& — множество отношений. С большей
степенью детализации в § 3.3 мир РО решателя был
представлен в виде трехуровневой системы <М0, Ми М2>. Таким образом,
мы приходим к трехуровневой структуре, которую и обсудим
более подробно.
Предварительно рассмотрим возможные соответствия между
структурами. Взаимно однозначное соответствие, приписывающее
каждому индивиду и каждому отношению из структуры М
индивид и отношение (того же порядка) из структуры М\
называется изоморфизмом, если всякий раз, когда рассматриваемое
отношение истинно в М, соответствующее отношение для
соответствующих индивидов истипно в М' и наоборот. Две структуры
изоморфны, если между ними можно установить изоморфизм.
Соответствие между отношениями структур М и М\ а также
между индивидами структуры М и некоторыми индивидами
структуры М' называется гомоморфизмом, если это соответствие
§7 1. ИСТИННОСТЬ
129
взаимно однозначно па отношениях и каждый ипдивид из М
отображается в М' таким образом, что для любого отношения,
истинного для индивидов из М, соответствующее отношение для
соответствующих индивидов истинно в М'. Структура М'
называется гомоморфным образом М, если данный гомоморфизм есть
отображение М в М\ т. е. всякому индивиду из М соответствует
индивид из М'.
Пусть Ж = <М0, Ми М2> — трехуровневая структура,
состоящая из одноуровневых структур Д/0, М{ и Мг. Согласно
определению этих структур (см. §§ 3.2, 3.3) и специфике перехода от
структуры к структуре (см. § 4.4) можно считать, что в целом
М{ является гомоморфным образом MQ (точнее, имеет место
изоморфизм по именам предметов и элементарных задач и
гомоморфизм по значениям свойств). Что же касается структур Mv
и М2, то, как следует из ранее сказанного, между ними имеет
место соответствие Mt -*■ Мг типа одновременного обобщепия по
индивидам и отношениям, однозначное в одну сторону.
Таким образом, под структурой Ж мы будем подразумевать
трехуровневую структуру <М0, Miy М2>, в которой структура М{
является гомоморфным образом структуры Л/0, а структура Мг
является в свою очередь обобщением структуры 71/, по ее
индивидам и отношениям. Из всех возможных структур Ж нас будут
интересовать только модели. Согласно общему определению
структура Ж является моделью /£, если каждая аксиома из К
истинна в структуре Ж,
Модель Ж называется подмоделью Жг, а модель Ж' —
расширением *#, если все индивиды и отношения Ж лежат в Ж'
и если для любого отношения а и соответствующих индивидов
&1, ..., hn из Ж отношение aihu ..., hn) одновременно истинно
или ложно в Ж и Ж'. Очевидно, одноуровневые модели М0, Mi
и М2 являются подмоделями Ж. Обозначим через Mix)
временной срез по х одноуровневой модели М. Тогда Mixt) и М(хг)
также являются подмоделями модели М. Более того, это
подобные модели, так как они содержат одни и те же отношения.
Будем пазывать такие подмодели статическими, а модель М и
соответственно Ж будем называть динамическими моделями.
Многообразие статических моделей Mix) <= М есть
аксиоматизируемый класс статических задач, т. е. любая Mix) есть модель
множества статических аксиом #ст <= К. Среди Mix) будем
выделять Л/(ти) и MixK) и называть их соответственно исходной и
конечной статической моделью.
Назовем положительной диаграммой D+iЖ) модели Ж
множество всех истинных в Ж атомарных фактов а,-(Л4, ..., АД где
а< е $& и Аь .. 4j \in __ соответственно отношения и индивиды из
Ж. Отрицательной диаграммой D'iJt) назовем множество всех
истинных в Ж атомарных фактов а{А,, ..., А„). Тогда объединен
9 Е. И. Ефимов
130 ГЛ 7. ПОЛНОТА П НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
нце DU)=/)+(«l>UD"(ir) есть диаграмма модели Ж. Таким
образом, 0{Ж) полностью описывает всевозможные
элементарные задачи в терминах атомарных фактов (две задачи считаются
разными, если они отличаются хотя бы по одному признаку,
например по пачалу решения). Так как решение любой сложной
задачи состоит из элементарпых задач, модель Ж с диаграммой
О(Ж) в неявном виде содержит все решения аксиоматизируемого
класса сложных задач.
Легко заметить, что ситуации, введенные в § 3.2, есть не что
иное, как статические модели Ж(т), описываемые
соответствующими поддиаграммами D(MM). Пас, как правило, будут
интересовать не полные диаграммы D(j^), а ее отдельные
поддиаграммы 0{ЖР), соответствующие локальным задачам р е Р.
Поддиаграмма 0(ЖР) строится следующим образом. Вначале
задается поддиаграмма в виде пары <£КЖ0(т„)), /ХЛ/2(т„))>,
которая затем расширяется за счет формируемого решения
локальной задачи (определяются новые атомарные факты, связанные
с новыми элементарными задачами разных уровней), и, таким
образом, находится искомая поддиаграмма 0(ЖР).
Как известно, в модельной теории классической логики
предикатов наибольший интерес представляют общезначимые
выражения, т. е. выражения, истинные в любой структуре. К таким
общезначимым выражениям обычно относятся аксиомы и
теоремы. Теория решений S является проблемно ориентированной
аксиоматической теорией, поэтому для ее аксиом и теорем
попятив общезначимости теряет свой универсальный смысл: та или
иная собственная аксиома, например, может быть истинной в
одной структуре и ложной в другой. Таким образом, в нашем
случае представляется уместным заменить понятие
«общезначимость» на понятие «истинность».
Напомним, что в языке L аксиомы и теоремы S являются
высказываниями, т. е. они не содержат свободных переменных.
Пусть некоторое высказывание С определено и истинно в
структуре Ж, Это утверждение на метаязыке мы будем представлять
в виде Ё С, или, опуская символ Ж, в виде Ё С.
Ж
В классическом исчислении предикатов [Клнни, 1967]
приведен ряд результатов, касающихся общезначимости, которые
путем замены общезначимости на истинность могут быть
перенесены в теорию S. В нашем случае эти результаты
представляют следующие метатеоремы.
Метатеорема 1*) (о подстановке отношений вместо символов).
Пусть С — высказывание в S, в которое входит некоторый сим-
*) Здесь и в дальнейшем знак * означает, что формулировка и
доказательство соответствующей метатеоремы или металеммы взяты с
несущественными изменениями у Клинц [1907].
§7 1. ИСТИННОСТЬ
131
вол отношения g определенного сорта, а С — высказывание,
полученное из С подстановкой конкретного отношения g' того же
сорта вместо g. Тогда, если 1= С, то t= С".
Метатеорема 2* (о подстановке термов вместо индивидных
переменных). Пусть Xi, ..., хп— различные индивидные {огра-
ниченно универсальные) переменные определенных сортов, *
С{хх, ..., хп) — высказывание в S, хх, ..., хп —термы, не
обязательно отличные друг от друга или от переменных хи ..., хп
в пределах своего сорта, и, наконец, С (хи ...,хп)—результат
одновременной подстановки в пределах сорта и области
значений термов хи . .., хп вместо вхождений переменных хи ..., хп
в С(хх, ..., хп). Если 1= С(хь ..., #„), то \=-С (хъ ..., хп).
Метатеорема 3* (об эквивалентности). Для заданной
структуры М имеем t= А <*>■ В (знак эквивалентности •<=>• используется
в качестве метазнака) тогда и только тогда, когда высказывания
А и В одновременно принимают одинаковые истинностные
значения в Ж.
Метатеорема 4* (о замене подвыражений). Пусть СА —
высказывание в S, содержащее как часть выражение А, и пусть Св —
высказывание, получаемое из СА заменой А на выражение В.
Тогда, если 1= А <=>• В, то t= СА ^ Св.
Следующая метатеорема использует понятие истинности
секвенции D -*- Е в теории S{ (или S2), поэтому необходимо
выяснить, как понимать эту истинность. Напомним, что в секвенции
D -*■ Е факт D выражает исходные данные задачи и,
следовательно, он всегда истинен. Факт Е выражает требуемый результат,
достижимость которого из D в смысле «D позволяет получить 2?»
априори до получения решения соответствующей задачи не
установлена. Таким образом, истинностное значение Е априори
неизвестно.
Мы примем, что секвенция D -*- Е истинна, т. е. Е достижимо
из D тогда и только тогда, когда в мире Md (или М2)
существует хотя бы одно решение соответствующей задачи и оно
найдено.
Другими словами, если найдено решение, то факт Е
становится истинным, а следовательно, истинна формально и
секвенция D -*- Е, и наоборот.
Подобным же_образом ложность D -*■ Е или, что то же самое,
истинность D -*- Е (читается как «факт D не позволяет
получить факт Е») означает отсутствие в мире Afi решения
соответствующей задачи.
Метатеорема 5. В теории 5j (или S2) t=Z) -+■ Е тогда и только
тогда, когда t= ->- D ® Е, где ® — одна из связок =*», ***-, < в
языке LL.
9*
132 ГЛ. 7. ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
Доказательство, а) Из t= -*• D ® Е следует \^D®E,
откуда согласно определению истинностной интерпретации связки
® (см. § 6.2) следует невозможность одновременной истинности
D и ложности £, т. е. секвенция D -*- Е истинна.
б) Из \^D-+E следует, что факт Е достижим из D, откуда
согласно правилу введения связки ® (см. § 6.5) и ее
интерпретации непосредственно следует 1= -*- D ® Е,
Утверждение метатеоремы 5 дает основу для пополнения
множества схем собственных аксиом теории 54 путем обобщения
ее теорем.
Пусть Л и В — высказывания, описанные в словаре
множества аксиом К теории 5, и пусть Ж — модель К. Примем, что В
моделыю следует из А (формально А ЁВ), если В истинно в Ж
тогда, когда А истинно в Ж. Легко видеть, что введенное нами
понятие модельного следования есть не что иное, как аналог
понятия логического следования, введенного в § 5.2. В
дальнейшем мы будем отличать указанное модельное следование от
выводимости (формально ЛЬ В), а последнее — от доказуемости
(формально Ь А -»- В).
Относительно следования ДЕЛ в классическом исчислении
предикатов [Клини, 1967] известен результат, который может
быть распространен на теорию S.
Метатеорема 6*. Если А и В — предложения в S,
представляющие собой высказывания, и Ж — модель множества аксиом Ку
то Л 1= В тогда и только тогда, когда t= A ->- В.
Эта метатеорема есть аналог известной теоремы о дедукции
(см. § 5.2).
В заключение следует отметить, что вышерассмотренные
метатеоремы модельной метатеории имеют аналоги в метатеории
доказательств. Так, например, метатеореме 6* в метатеории
доказательств соответствует следующая метатеорема.
Метатеорема 6'. Формула В выводится из формулы А{А\-В)
тогда и только тогда, когда доказуема формула А -*■ В (Ь Л ->- В).
Имея в виду эти аналоги, мы опустим метатеорию
доказательств теории S. Желающих восполнить этот пробел мы
отсылаем к Илшш [1967].
§ 7.2. Непротиворечивость
В данном параграфе мы исследуем теорию S на одно из
основных необходимых свойств любой теории —
непротиворечивость. Дело в том, что в противоречивой теории выводима любая,
наперед заданная формула, поэтому такая теория неспособна
отделять истинные утверждения от ложных и в силу этого
является бессодержательной. Непротиворечивая теория содержатель-
§ 7.2. НЕПРОТИВОРЕЧИВОСТЬ
133
па, так как в ней только определенные утверждения являются
теоремамп, например те, которые утверждают наличие каких-
либо желательных или отсутствие каких-либо нежелательных
свойств и отношений у индивидов предметной области. В свете
вышесказанного исследуем па непротиворечивость правила и
аксиомы теории S.
Лемма 1*. а) Для каждого правила Ri — R7 теории Sl2 сек-
венция, записанная под чертой дерева, опровержима тогда и
только тогда, когда секвенция (или по крайней мере одна из
секвенций), записанная выше данной черты, опровержима.
б) Для каждого правила Rt — /?7 теории Si2 секвенция,
записанная под чертой, истинна тогда и только тогда, когда секвенция
(или каждая секвенция), записанная над данной чертой, истинна.
Лемма 2. Для каждого секвенциального правила Д4 — Л4
теории Si (или S2) секвенция, записанная под чертой, истинна
тогда, когда секвенция (или каждая из секвенций), записанная
над чертой, истинна*).
Доказательство. Схема доказательства для каждого из
указаппых правил одна и та же. Возьмем, например, правило R3.
Рассмотрим случай GnQn-1-*JBi. Утверждение леммы 2
приобретает вид: если t=Gn6n_i-^#i и t=-^Z?i=^C для любого г (1<
^ i < m), то \= GnQn-i ->• С'. __
Проведем доказательство от противного. Пусть %=Grfin_1-*C/
не имеет места, т. е. Сп§п-~г и С истинны. Так как -+Bi^C
истиппа как собственная аксиома, то согласно ее определению
(см. § 6.4, табл. 6-1) и истинности С найдется хотя бы одно
значение i (пусть это будет iQ) такое, при котором BiQ истинно и,
следовательно, BiQ ложно. Ложность Bi() в свою очередь
приводит к ложности Gn6n-i->fii0, что противоречит условию
леммы. Следовательно, ^GA^-vC.
Проводя подобные рассуждения для каждого из оставшихся
правил теории Su получим доказательство леммы. Очевидно,
лемма 2 справедлива и для производных правил 9lit п и &£h n (см.
§ 6.5).
Необходимо отметить, что правила теории Si2 в зависимости
от характера их использования (вывод истинных или
опровержение ложных секвенций) можно назвать соответственно прави-
*) Для правила /?3 теории S{ необходимо дополнить лемму 2 словами:
«при ^любом / (i^i^m)», если секвенция над чертой имеет вид
't^iAi-i ""*#., или словами «хотя бы при одном i (1 ^ i < m)», если
секвенция над чертой имеет вид *= ^Х-х "* Bv
134 ГЛ. 7. ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
лами вывода пли правилами опровержения. Из леммы 1 также
Следует, что правила S12, рассматриваемые либо как правила
вывода, либо как правила опровержения, имеют двусторонний
характер, т. е. вывод с их помощью истиипых или ложпых
секвенций не зависит от направления вывода (сверху вниз или
снизу вверх).
В отличие от правил теории 512, не все правила теории St
являются двусторонними. Так, Rt является односторонним
(сверху вниз) правилом вывода и вовсе не может быть использовано
как правпло опровержения. Указаппая специфика правил
теории Si накладывает определенный отпечаток на характер
алгоритма поиска доказательств теорем Slt о чем будет сказано
в дальнейшем.
Таким образом, в целом из лемм 1 и 2 следует, что правила
вывода теории S непротиворечивы, т. е. из истинных секвенций
они выводят истинные секвенции.
Для установления непротиворечивости теории S в целом нам
осталось установить непротиворечивость ее аксиоматики.
Лемма 3*. Пусть задана секвенция вида 5,, С-+В2<, С (X),
где С — атомарный факт. Тогда секвенция (X) неопровержима и
общезначима.
Следствие леммы 3*. Секвенции вида: а) Ви С, С -»- и 5t -*■
-*- С, С и б) А -*ВЛ где В^А, являются неопровержимыми и
общезначимыми.
Доказательство. Так как секвенция вида б) является
частным случаем секвенции (X), то утверждение б)
непосредственно следует из леммы 3. Для доказательства утверждения
а) заметим, что от секвенции вида (X) легко перейти к
секвенциям вида а) с помощью правила R2 теории 512. Следовательно,
согласно лемме 1 любая из таких секвенций неопровержима и
общезначима.
В силу утвержденийлеммы 3 и ее следствия секвенции S,
С-*-С, В, С, С~+, В->С9 С и А -*- В, где В^А, представляют
в теории S логические аксиомы, истинные в любой структуре Л.
Следующая лемма устанавливает необходимые и достаточные
условия сохранения общезначимости секвенций в теории St при
введепии отрицания.
Лемма 4. Пусть QC -*■ Е — логическая аксиома теории S{
такая, что Еs 8C, С$\ЕФ@ (знак ~ означает наличие либо
отсутствие отрицания). Тогда можно построить логическую аксиому
QC -*■ Е, в которой G и С имеют противотложные знаки.
Доказательство. Рассмотрим возможные случаи С.
Пусть С = С Возьмем произвольную литеру А е= С П Е и
изменим ее знак на противоположный. Тогда факты С_и £ также
изменят свой знак па противоположный, и так как А ^ С П Е, то
Е £ 6С. Следовательно, QC -»• Е — логическая аксиома.
§ 7.2. НЕПРОТИВОРЕЧИВОСТЬ
135
Пусть теперь С = С Возьмем все литеры Ai такие, что Л< ^
€= С П Е и каждая из них является причиной отрицания С.
Изменим в каждой литере Ai знак на противоположный, тогда можно
изменить зпаки С и /?, и получить С_и £ *). Так как А{&
<=С ОЕ, то Е £ 8С. Следовательно, QC -+ Е — логическая аксиома.
Доказательство леммы 4 завершено.
Рассмотрим теперь собственные аксиомы теории £. В
классической теории моделей [Робинсон, 1963] проблема
непротиворечивости ставится следующим образом: задается некоторое
множество высказываний К и утверждается, что теория К
непротиворечива, если она имеет модель. Таким образом,
непротиворечивость теории устанавливается, исходя из ее свойств, путем
нахождения хотя бы одной модели этой теории.
В нашем случае возникает нечто обратное. Вначале задается
некоторая структура Ж и затем строится аксиоматика К, для
которой Ж является моделью. Таким образом, исходным
моментом в нашем случае является существование структуры, а
конечным — построение множества высказываний /£, истинных в Ж.
Другими словами, проблема непротиворечивости К в нашем
случае заменяется проблемой корректпости А", т. е. проблемой
построения адекватного описания задаваемой структуры Ж.
Очевидно, проблема корректности аксиоматики К лежит вне
метатеории теории S и полностью определяется знаниями
соответствующего эксперта о конкретном мире задач Ж, Итак, нам
ничего другого не остается, как постулировать истинность
аксиоматики К в структуре Ж.
Теперь мы можем перейти к непротиворечивости теории S
в целом. Пусть запись \~С означает доказуемость в теории S
некоторой секвенции С, т. е. что С — теорема.
Метатеорема 7. Если hD1-^ Е\ то t= D1 — Е\ где D* и Е2 —
факты соответственно 1-го и 2-го уровней.
Доказательство. Все аксиомы К теории «5 истинны.
Согласно леммам 1 и 2 все правила теории S выводят истинные
секвенции из истинных секвенций. Следовательно, все секвенции
в доказательствах теории S истинны, в том числе и последняя
секвенция, являющаяся теоремой.
Следствие метатеоремы 7 (непротиворечивость). В теории S
недоказуемы одновременно контрарные секвенции D1 -> Ег и
U —* Ё .
Доказательство. Предположим обратное: пусть имеет
место Ь Z)1 -> Е2 и Ь D1 -*■ Е2. Тогда в силу метатеоремы 7 имеет
*) Заметим, что в нашем случае не всегда изменение знака у Ai e £
меняе_т _з?шк С. Пусть, например, С «= AiA2, где А\ и А2 — атомы, и пусть
<■> —- AiA2. Тогда снятие отрицания у А2 не меняет знака у С.
136 ГЛ. 7. ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
место W)1 -* Е2 и W)1 ->■ Е2. Последпее невозможно,
следовательно, наше исходное предположение ошибочно.
Таким образом, аксиоматическая теория решений S = <SU «S12,
S2> непротиворечива, если корректно построена ее аксиоматика
К=<Ки Я12, Кг>.
§ 7.3. Метатеорема о редукции
Теорему D -> 6П в £t назовем гс-шаговой, если ее
доказательство содержит ровно п (п > 1) собственных аксиом -+ Вп® С^.
В дальнейшем будем считать, что п определяет сложность
соответствующей теоремы.
Метатеорема 8 (о редукции). Секвенция D -*• 0П является
п-шаговой теоремой в St (или S2) тогда, когда в St имеют место:
(1) собственная аксиома -*■ ВЦп(х)С<цп и (2) (п— 1)-шаговая
теорема D -*- Qn-i такие, что (3) В'Пп г Gn0^-i, (4) 6n s 0n-iC\in*
(5) вп—! = Вп-1 U Вп-и (6) Gn^ D и (7) j§V,n и Сводного знака ~.
Доказательство. Пусть имеют место условия (1)—(7).
Тогда из условий (3) и (4) следует, что секвенция Gn0n_1->-i9Tin
(3') и бп-хСт^-^бп (4Г) являются логическими аксиомами; из
(30, (7) и (1) следует, что Gn6n-i-*C% (8) есть одношаговая
теорема в S\. Из (8),Д5) и (40 в свою очередь следует, что
6?n0n_i ->- 0П (9) также есть одношаговая теорема в Sit Наконец,
из (9), (2) и (G) следует, что
D -*• 0П есть гс-шаговая
теорема, что и требовалось
доказать.
Смысл метатеоремы 8
заключается в том, что если
доказаны (п — 1)-шаговая
теорема D -*- 0П_4 и
одношаговая теорема GnQn-i -*• 0П,
то этим самым в S\
доказывается тг-шаговая теорема
D-*0n. Условия (1) —(7)
Рис. 7.1. Дерево редуцирования
теоремы.
метатеоремы 8 определяют смысл правила ffiit п,
рассмотренного в § 6.5. Таким образом, правило 02it „ представляет правило
редуцирования исходной гс-шаговой теоремы на две подтеоре-
мы, из которых одна — Ы — 1)-шаговая, а другая —
одношаговая (см. рис. 7.1).
На рис. 7.1 показано (с помощью связанных дуг), что
доказательство тг-шаговой теоремы D -*- 0П сводится (редуцируется)
к доказательству Ы — 1)-шаговой теоремы D -*■ 0n_t и одыошаго-
§ 7.3. МЕТАТЕОРЕМЛ О РЕДУКЦИИ
137
вой теоремы G»0n-i "*" 0« С помощью собственной аксиомы
Tl: -+B®C.
Заметим, что в общем случае пространство редукций теорем
теории Si может быть представлено И/ИЛИ графом (деревом)
[Цильсоп, 1971]. Заметим также, что посылки (1) —(7) мета-
теоремы 8 не являются необходимыми для осуществления
редукции. Чтобы убедиться в этом, достаточно напомнить о
существовании другого возможного производного правила теории Su
а именно правила 3lht n.
Назовем факт А пустым (Л = П), если он не содержит ни
одной литеры, т. е. ни одного атомарного факта или его
отрицания. Очевидно, для пустого факта имеет место D5 = ВО = В.
Будем считать, что секвенция D -*■ О (точнее, □£-»-□) является
тривиальной логической аксиомой, представляющей собой нуль-
шаговую теорему.
Следствие 1 метатеоремы 8. Секвенция D -* 0П является одно-
шаговой теоремой тогда и только тогда, когда факт вп^х является
пустым.
Доказательство. Докажем вначале достаточность
посылки следствия. Пусть 6n-i = а. В этом случае (п— 1)-шаговая тео-
.рема превращается в тривиальную логическую аксиому и
доказательство исходной теоремы D -*- 0„ с помощью правила < „
содержит только одну собственную аксиому -*~ВЦ1 g) Cx\v т. е.
D -*• B't является одношаговой теоремой. Попутно отметим, что
при 0„_i = О условия (3) и (4) метатеоремы 8 приобретают
очевидный смысл: Вщ ^GX^D и 0Х s Сщ.
Докажем теперь необходимость посылки следствия. Пусть
D ->- 0П — одношаговая теорема. Тогда доказательство теоремы
D ->■ Gn-4 не должно содержать пи одной собственной аксиомы,
т. е. D -> 0n-i — логическая аксиома. Но так как пересечение
D с 0п-4 всегда пусто (это следует из алгоритма построения 0W-i,
см. § 8.2), то D ->• 0n_t — тривиальная логическая аксиома.
Следовательно, 0„-t == О,
Назовем теорему в Sv канонической, если она имеет вид
G\ •.. Gt ... Gn ->- Cti1 ... C\]l .• - Сг\п, где GL^D —
минимально необходимый заданный факт, используемый на Z-м шаге для
доказательства максимально возможного факта Сщу
представляющего (с учетом знака ~) константно-частный случай сукце-
дента соответствующей собственной аксиомы -*- ВщО&С^ (1 ^
<4i<*i, 1<*<л).
Следствие 2 метатеоремы 8. Всякое п-шаговое доказательство
в St теоремы D -*■ 0П одновременно сопровождается доказателъ*
ством п-шаговой канонической теоремы Gx ... Gt ... Gn->- C^ ...
. - • Cr]l ... С^п, где Gb^D и 0n s C^ ... C'^ ... C^n«
138 ГЛ. 7. ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
Доказательство. Пусть Д -*- 0< — /-шаговые теоремы,
линейно упорядоченные по номеру I (l^l^n) и входящие в
доказательство теоремы D -*• 0П. Для доказательства воспользуемся
индукцией по шагу /.
Пусть / = 1. Так как Dt -*• 0А — одношаговая теорема, то
согласно следствию и правилу 3tln ее доказательство содержит
аксиомы D0-*O, G^-vS,^, Сгц-*^ и -^В^^Сц^ Отсюда
непосредственно следует, что С1-^СЛ1—также одношаговая теорема,
которая доказывается одновременно с Z>t -+- 9t.
Введем обозначения IIt = Gt .., G( и 2j = С'т ... Cx\v Пусть
теперь на 1-й шаге доказательства D -> 0П одновременно
доказаны /-шаговые теоремы Dt -*- 0, и Я/ -+■ 2f (1</<я). Тогда
доказательство (/+1)-шаговрй теоремы Д+1-> 0/+1 содержит теорему
D[-+Qi и аксиомы 6^0/->-5Л/fl, в*Слж->0и-1 и -^Ятц+i®
® ^?+1. Так как Gi+fii-*- ВЦ1, г является логической аксиомой,
6< содержит только необходимые новые факты (следует из
алгоритма построения 0*; см. § 8.2), а 2? — все новые факты и
поэтому 0/ s 2,, то "^_|-i ^i^Z^i^i также является логической
аксиомой. Отсюда согласно правилу 5?i,n» аксиомам G/_j_12i->-
-*■ 2K,J+1, 2Z ?я/+1 -* 2/ Сл,+1 и -*- #л4+1 ® ^Ч-м из ^-шаговой
теоремы Ht -*■ 2f следует (/ + 1)-шаговая теорема Hfii^-^ 2j оЧ/, х.
Таким образом, (/+ 1)-шаговая теорема Hfii+i-^^i CVj/+1
выводится одновременно с теоремой Z>/+1 -*■ 0/+1. Итак, мы показали,
что утверждение следствия 2 истинно при / = 1, и если оно
истинно при / < п, то оно истинно и для / + 1. Отсюда по индукции
получаем, что оно истинно для любого /(!</< га) и, в
частности, для / = п. Следствие 2 доказано.
Метатеорема 8 и ее следствия свидетельствуют о том, что
пространство теорем теории 5, частично упорядочено но
сложности теорем (имеет древовидную структуру).
Каноническая теорема описывает структуру доказательства
исходной секвенции D -* 0„ и поэтому удобна для исследования.
Так, например, возьмем ее сукцедент. В общем случае он
отражает дедуктивную упорядоченность фактов Сщ по шагам
доказательства. Рассмотрим это обстоятельство более подробно.
Как было показано, при доказательстве /г-шаговой
канонической теоремы на 1-м шаге доказательства в качестве
промежуточных результатов доказывается одношаговая теорема GiOi-i-^Сщ
(см. доказательство метатеоремы 8) и соответствующая
каноническая /-шаговая теорема H^fii-^Hi^iC^ (см. следствие 2).
§ 7.4 ПОЛНОТА
139
Здесь возможны следующие случаи дедуктивной зависимости СЦ[
от 2/_i: ^
Случай дедуктивной независимости Сщ. В этом
случае S/_± не содержит фактов, необходимых для вывода Ст],,
т. е. 0f-i = D, и так как G^D, то Сцг непосредственно
выводится из В с помощью соответствующей собственной аксиомы
Случай полпой дедуктивной зависимости
Ст1Г В этом случае 2f_i содержит все факты, необходимые для
вывода Сщ, т. е. Gx = □.
Случай частичной дедуктивной зависимости
Сг\г В этом случае 2^ содержит только часть необходимых
фактов, а остальную их часть содержит Gh т. е. имеем Э;—i ^ П и
у* ft
Пусть в двух последних случаях в 0/_4 входят факты Ctiv S
^ Ct\v (v<Z—1). Рассуждая относительно каждого Cnv
аналогичным образом, в конце концов можно для данного Сщ
выделить причинно-следствепное дерево, состоящее из С^еИн.
В итоге для каждого I (l^l^n) можно выделить указанные
деревья и тем самым определить структуру доказательства
исходной канонической теоремы, а следовательно, и теоремы D -*■ 0».
§ 7.4. Полнота
Проблема полноты обычно ставится следующим образом.
Задан некоторый класс А выражений, описанных в словаре
множества аксиом К теории Г. Необходимо установить, доказуемо ли
в Т (т. е. выводимо ли из К) любое выражение Аг^А. Если да,
то теория Т является полной относительно формул класса А.
Если иод классом А подразумевать общезначимые формулы,
то мы будем иметь дело с полнотой в смысле Геделя: логическое
исчисление называется полным, если в нем доказуема всякая его
общезначимая формула. Так, исчисление предикатов 1-го
порядка является полным.
Если под классом А подразумевать замкнутые формулы,
определенные в словаре К теории Г, то получим полноту в смысле
Робинсона [1963J: аксиоматическая теория Т полна, если для
любой замкнутой формулы А{&А, определенной в словаре
множества аксиом К теории Г. имеет место либо К\-Аи либо
К\~Аи
440 ГЛ. 7. ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
Теория S в силу своей проблемной ориентации
принципиально должна быть и является открытой теорией. Это объясняется
тем, что мир задач Ж непознаваем до конца и, следовательно,
имеет место незамкиутость множества аксиом К теории S. По
мере все более глубокого познавания мира Л, т. е. по мере
обучения, теория S наращивает и уточняет свою аксиоматику.
Из вышесказанного следует, что по отношению к теории
решений S допустимы неопределенные и, следовательно,
невыводимые в S утверждения, являющиеся истинными в мире JI. Эти
утверждения в качестве новых аксиом должны пополнять
аксиоматику К и тем самым расширять теорию S.
Таким образом, по отношению к теории S имеет смысл
говорить только о полноте на фиксированном этапе обучения и
только о полноте в смысле Робинсона [1963].
Пусть К — аксиоматика теории S. Каждая аксиома в К
состоит из литер. Назовем литеру базовой, если она невыразима
через другие литеры того же уровня. Литеры, не являющиеся
базовыми, назовем производными. Примем, что в теории St (или
Sz) базовые литеры входят только в антецеденты аксиом, а их
сукцеденты содержат только производные литеры *). Другими
словами, базовая литера не должна входить в сукцедент никакой
аксиомы, в то время как производная литера может входить в
антецедент какой-либо аксиомы только тогда, когда она
одновременно входит в сукцедент другой аксиомы.
Таким образом, в заданной аксиоматике Я4 (или К2) каждая
производная литера (для избежания самовыражения) должна
быть выразима (возможно, сложным образом) через базовые
литеры. Последнее в свою очередь означает, что среди аксиом Кк
(или К2) всегда должны быть такие, у которых антецедент
состоит только из базовых литер, т. е. представляет базовое
предложение. Назовем такие аксиомы базовыми.
Пусть множества конкретных отношений и констант,
имеющих место в аксиоматике К, составляет словарь W=*(WU Wi2,
Wz> теории S. Выделим из W базовый словарь WB, включающий
отношения и константы базовых литер. Остальные отношения и
константы отнесем к производному словарю Wn. Таким образом,
W - WB U Wn и W* П Wn Ф 0 (см. сноску на стр. 140).
Пусть предложение А определено в словаре множества аксп-
ом К теории S тогда и только тогда, когда его отношения и
константы содержатся в словаре W множества К, т. е. WA s W.
В этом случае будем для краткости говорить, что А определено
в теории 5.
*) В теории Si (или S2) возможны аксиомы, которые содержат одну
и ту же базовую литеру одновременно в антецеденте и сукцедепте. В этом
случае литеру в сукцеденте будем условно относить к производной.
§ 7.4 ПОЛНОТА
141
В дальнейшем нам придется иметь дело с различными
секвенциями, представляющими собой факты. Введем следующие
определения. Секвенция D1 -+ D* называется вертикальной, если
г, /е{1, 2), i^U и Di и Dj соотнесены с одним и тем же
моментом времени. Вертикальную секвенцию назовем элементарной,
если в ней либо D\ либо D* представляет атомарный факт $2 2-го
уровня.
Секвенция Di -*- Ej называется горизонтальной, если i, / ^ И, 2},
i = /t и № и 2£j соотнесены с разными моментами времени.
Секвенция D*-+ Ej называется диагональной, если i, j^ {l, 2), i < /,
и #' и Z?j соотнесены с разными моментами времени.
Будем считать, что элементарная секвенция D1 ->■ ,$2' (или
JP ->- D1) определена в теории SI2 тогда и только тогда, когда в
#12 найдется аксиома -*- R\i=>Ai такая, что (1) ™ gf- == ^в?,
(2) Wdi = VFAi, (3) множества индивидов 1-го уровня,
задаваемые с помощью Z)1 и ^2, изоморфпы. Свойство (3) будем
называть изоморфизмом но индивидам между D1 и Ж\
Лемма 5. Для любой элементарной вертикальной секвенции
D1 -*• J?2 (или ffi-^E1), определенной в теории 512, имеет место
либо KnhD1-*^2 (ХиНД8-^), либо Я12 Ь D1-^ J2 (Ki2h
Доказательство. Пусть нам задана элементарная
вертикальная секвенция Z)1 -> J?2. Она выражает факт, поэтому
индивиды в Ш2, задают конкретные множества индивидов 1-го уровня.
Согласно условию леммы пайдется такая аксиома —>В\ 4=*Л,-,
•что {1)W 2 = W 2 и, таким образом, $1 представляет констант-
до-частпып случай В{ и тем самым задает область определения
префикса в At. Поскольку по условию леммы имеем И/£)1=И/д. и
изоморфизм по индивидам между D1 и J?2, формула А{
определена на D\ откуда непосредственно следует, что (2) \-Dl—>Ai*),
■а иМ2) п (1) в свою очередь следует D1-* Л,-, -^ В\ «=» Ak \- Dx ->•
— ®\
Рассуждая аналогично для случая &2-+Е\ получим ЬЛ*-*-
-* Ех и затем Л^£\ ->#?«=фЛ*н- ЯР-В1.
Следствие 1 леммы 5. Пусть нам задана элементарная
вертикальная секвенция П]-+3$*(или $\-*Е]), определенная в
словаре Sl2, и пусть D\ г D1 (Я\ ^ £2)- ГогЯа вертикальная
секвенция D1 ->- l?i (или Е2 ->- А1}) является теоремой Sl2, где
знак ~ означает наличие либо отсутствие отрицания.
*) Напомним, что АВ[-Л<£В; А или В\-А\/В\ Я или B\-AzdBi
А (*') Ь (э*1 s h2) A U1); Л (Л{) ... A (hi) ... Л (Aj) f- (v*1 е /*2) Л (я1).
142 ГЛ. 7. ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
Будем считать, что неэлементарная вертикальная секвенция
D1 -*■ D2 (Е2 -*- Е1) определена в Si2 тогда и только тогда, когда
Z?i= ц d\[FJ- U Я)\ Z>2- U Я?(Я1«= U £П и £>[->
-> &i ($*—>-Е}) представляют элементарные вертикальные
секвенции, определенные в 512. Очевидно, что Di ->■ D2 (Е2 ~> Е1)
имеет место изоморфизм по индивидам между Di и D2 (Е2 и Я1).
Следствие 2 леммы 5 (о полноте Si2). Для любой
вертикальной секвенции D1 ->■ Z)2 (E2 -+■ /£1), определенной в 512, имеет
место либо K^hD'-^D2 (#12Ь£2-+£'), либо Ki2h D1-+Bz
{Ki2\-E2-+m.
Доказательство. Согласно следствию 1 леммы 5
секвенции являются' теоремами Si2.
Следовательно, секвенция D1 -+- В2 (Е2 -> Ех) также представляет теорему Si2.
Пусть горизонтальная секвенция Z)j -+■ Ej (/е{1? 2})
определена в теории Sj тогда и только тогда, когда Wj s WDj ^ H7j и
Лемма 6 (о полноте S{ или S2). Для любой горизонтальной
секвенции D-+E, определенной в теории Si4 имеет место либо
K^D^ E, либо K.V-D-* E.
Доказательство. Пусть N — процесс формирования
фактов fy-i (Z«=n, rc—1, ..., 1). Согласно определимости D-+Е
имеем: (1) WfsWDsW1 и (2) WEczW?. Согласно правилу Siit n
на Z-м шаге (1 ^ I < п) должны иметь место соотношения:
(3) 8,£в4.Ди (4) Й^дС,вм, где при l=*n Qn = E. Из (3)
и (4) видно, что факт вг_± должен включать в себя: (5) подфакг
0/_ь получаемый путем удаления из 0Z общей с СЧ/ части, и (6)
иодфакт Э/_!, получаемый путем удаления из ВЦ[ исходных
данных Gh т. е. (7) 0/-! - ej-x U 0j-i.
Из (6) и (1) следует, что 0f_i не содержит базовых литер, т.'е.
(8) Wf^sW?, а из (5), (2), (8) и (7) следует W^ s Wf t
т. е. (9) W^e^! ^ W^' Соотношение (9) указывает, что в процессе N,
исходящем из секвенции D -*■ Е, обрыв на 1-м шаге из-за
вхождения базовых литер в антецеденты используемых при
доказательстве аксиом невозможен: любая такая литера будет
исключена из 6/-! согласно (4) и (1). Но так как всякая производная
литера, входящая в Ки выводима из базовых литер, входящих
в Ки то любая литера из 0*_i выводима из D и поэтому в конце
концов в N должен наступить момент, когда Wbq~0, т. е.
станет пустым 0О и, следовательно, завершится указанный процесс
N. При этом будут иметь место соотношения: (30 ©х^Ст^ и (4')
§ 7.4. ПОЛНОТА
143
#пг — G\^D ив целом доказательство либо Kt Ь D ->- Е, либо
Последнее произойдет, если потребуется одновременно менять
знак у Сг\х и В^ для обеспечения (4') и затем менять знаки
у всех ВЦр С>ы и 0/ в ранее сформированных логических
аксиомах Qi-iC^-^Qi и G/G;-!-> Br)гтаким образом, чтобы получаемые
при этом новые секвенции оставались логическими аксиомами.
Согласно лемме 4 это всегда можно сделать*).
Будем считать, что диагональная секвенция D1 -> Е2
определена в теории S тогда и только тогда, когда Z)1 = (J D] и /£2 =
Ч
/2 г да; з
1г — непустые множества индексов аксиом->Bi <=$Ai и ->Z?j4=r-4j
соответственно.
Пусть ->• 5f <Н> <А*— i-я (1 ^ £<! тп) аксиома теории S12, пусть
первые mi (ттг,. < га) из указанных аксиом являются базовыми.
Будем называть теорию S компактной, если имеют место
следующие соотношения:
U1 WB* = Wf, U TF , = IF2n,
If wAj = <, и wAl = и?.
Из данного определения можно сделать следующие выводы:
W в2 s W7f тогда и только тогда, когда ТУЛ| ^ ТУг; ТУВ2 ^ ТУ2 тог-
да и только тогда, когда TFA. S ТУ?; так как ТУ12 = (J ТУ 2
и И\пя=3 (J WB*mAl,ToW^ = WT[)W? nW^^UWf,
откуда следует, что литера определена в Sx или в 52 тогда и
только тогда, когда она определена в S12.
Лемма 7. Пусть диагональная секвенция D1 -*■ £2 определена
в компактной теории S. Тогда всегда найдутся такие факты D2
и Е1У что будут определены:
в теории SiZ — вертикальные секвенции D* -+ D2, и Е2 -*■ 2?1;
в теории S2 и Si — горизонтальные секвенции D2, -+• Е2 и
*) Подробнее о процедуре формирования окончательного знака у Е
£м. § 8.3.
144 ГЛ. 7. ПОЛНОТА И НЕПРОТИВОРЕЧИВОСТЬ ТЕОРИИ РЕШЕНИЙ
Доказательство. Из определимости D1 -*- Е2 в S имеем:
(1) Z)1 = \JDl где W, == И^.; (2) Я2 = U Я|, где W & = W>
ix £4 г /2 > ^
Построим D2 и is1 следующим образом. Для каждого Z)| из (1)
через соответствующие Л{ найдем такие ^ь чтобы D}-*-&\
представляли элементарные вертикальные секвенции,
определенные в Si2. Это всегда можно сделать однозначным способом. Если
теперь положить D2 = U ^?> то легко видеть, что вертикальная
секвенция D1 -* Z)2 будет определена в Si2 и что при этом
существует только один такой факт D2.
Аналогичным образом для каждого Щ из (2) через
соответствующие Bf найдем такие А3 и затем Е), чтобы Щ -*■ Е)
представляли элементарные вертикальные секвенции,
определенные в Si2. Это также всегда можно сделать, но неоднозначным
способом. Если теперь положить Е1 = U Е), то вертикальная
секвенция Е2 ->■ Ei будет определена в Si2 и, вследствие
неоднозначности построения Е\ таких секвенций может быть много.
Для доказательства определимости горизонтальных секвенций;
еще раз напомним, что мы имеем:
(1) Z)1 = U Dl Где (2) W, = WAi и (3) W? £ WDi;
(4)Z)2-U^?, где (5) Wat~W .;
(6) £2 = U Я|, где (7) WEi e W? и (8) И^? « JFB?;
(9) Я* = U^l, где (10) Wv. - PFAj.
J2 J
Нам необходимо доказать, что (11) Wf ^WDl^Wly (12)
Wtfi e VF? (определимость горизонтальной секвенции Dl -+ E1 в
теории Si) и (lSJPrfsWjDisHV (14) WE2 ^^(определимость
D2 -+ E2 в теории S2). Левое включение условия (11) имеет
место согласно (3). Так как согласно (1) и (2) имеемWDl = (JW^,
то, используя два последних соотношения компактности теории
S, получим WD1sWi. Следовательно, условие (И) имеет место.
Из (6), (8) и (7) имеем We2 - [}W 2 s W%, откуда, исполь-
j2 ^
зуя соотношениеW^.sWj1 компактности, получаем U WAj^W™
72
и далее иэ (10) и (9) получаем WEisWx. Итак, мы, дока*-
зали, что секвенция Dx -*- Ei определена в Su
§ 7.4. ПОЛНОТА
145-
Далее, согласно (4) и (5) имеем WD2= (J W 2. Используя пер-
вые два соотношения компактности теории 5, получим правое
включение WD*^ W2 условия (13). Из (1), (2) и (3) имеем Wf S
S U Ч^Аг» откуда, используя соотношение W7B2 s И^2 компактио-
сти, получаем W2 £U^fla и далее из (5) и (4) получаем W2 S
'i *
сй^оа* Следовательно, условие (13) имеет место. Условие (14)
имеет место согласно (7). Доказательство закончено.
Пусть в теории S определена диагональная секвенция D1 -> Е27
и пусть {Е2 -> Е1} — множество теорем теории Si2*). Будем
считать, что диагональная секвепция D* -*■ Е2 является теоремой
теории 5 тогда и только тогда, когда среди секвенций множества
{D1 ->- Е1} окажется хотя бы одна теорема теории Sl9
Метатеорема 9 (о полноте теории S). Для любой диагональ^
ной секвенции Di ->- Е2, определенной в компактной теории Sr
имеет место либо Kh Di -> Е2, либо KY- D1 -> Е2.
Доказательство. Согласно лемме 7 определены: в теории
Stz — множество вертикальных секвенций {Е2 -*- Е1}, в теории
Si — множество горизонтальных секвенций Ш1 -*■ Е1}. Используя
следствие 2 леммы 5, устанавливаем, что множество {Е2 -> Е1}
представляет собой теоремы теории 512. С помощью множества
U?1} построим множество горизонтальных секвенций Ш1 -*- Ё1}.
Согласно лемме 6 каждая секвенция из Ш1 -*■ Е1} либо является,^
либо не является теоремой теории St.
Рассмотрим возможные случаи. Пусть хотя бы одна секвен-*
ция из {D1 -> Ё1} окажется теоремой. Тогда по свойству
диагональной секвенции «быть теоремой» имеем KV- Z)1 ->■ Е2. Пусть,
теперь ни одна секвенция из {D1 -> Е1} не окажется теоремой.
Тогда, исходя из того же свойства, устанавливаем, что D1 -*• Е2 не
является теоремой, т. е. имеем Kh D1 -> Е2.
Таким образом, компактная теория S полна в смысле Робин-,
сопа [1963].
В заключение необходимо заметить, что принятая нами
определимость диагональной секвенции D1 -»- Е2 в теории S дает
нижнюю границу числа доказуемых замкнутых формул At^A.
В действительности, для того чтобы секвенция D1 -*- Е2 была
теоремой, достаточно, чтобы WDl содержал словарь только тех
базовых аксиом, которые вошли в доказательство этой секвенции.
*) Множества {Е2-+Е]} и {Dl-*E1} появляются в результате неодпо--
зпачного построения факта Е1 (см. лемму 7).
ГЛАВА 8
РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
В данной главе нас будет интересовать разрешимость теории
S относительно доказуемости. Теория S разрешима, если
существует и построен алгоритм, который для любой наперед
заданной диагональной секвенции Di ->- Ег за конечное число шагов
дает ответ на вопрос: «имеет ли в теории место K\r- D1 ->■ /?2, либо
В качестве такого алгоритма мы будем использовать
комплексный алгоритм двухуровневого поиска доказательств. Его
существование уже предполагалось при исследовании полноты
теории S (см. § 7.4). Поэтому нам остается описать комплексный
алгоритм и исследовать его свойства.
§ 8.1. Диаграмма двухуровневого доказательства
Пусть пит — положительные целые числа такие, что т > п.
Поставим каждому числу £^{1, 2, ..., п) во взаимно
однозначное соответствие I некоторое число Z*^{1, 2, ..., т) так, чтобы
если £t > £2, то hl>h2y а если £ = гг, то 1п = т. Таким образом,
/ задает разбиение последовательности чисел 1, 2, ..., т па п
групп, непрерывно следующих друг за другом и состоящих из
Cl\ — l^i) чисел, где 10 = 0.
Введем обозначения Н\ = G\ ... G\\ 2| = С{ ... С|, F^ =
= Н\ ... Я|; iV}s= 2{ .. .2|, Я^С^^... G}&, 2^=С}6-1+1...
Пусть диагональная секвенция /'\л ->■ £п представляет собой
соответствующую каноническую теорему для теоремы D1 -> £'
теории 5 такую, что F)n с^и £2 s 2». Пусть также
вертикальная секвенция F}n-+Н\, горизонтальная секвенция Я„—>-
--*- 2п, вертикальная секвенция Zn->./V}n и горизонтальная
секвенция ^/n-*N/n представляют собой канонические теоремы
.соответствующих подтеорий теории S. Обозначим доказательства
§ 8.1. ДИАГРАММА ДВУХУРОВНЕВОГО ДОКАЗАТЕЛЬСТВА 147
этих теорем через и\2, и2, и\2 и и1 соответственно и будем их
рассматривать как некоторые преобразующие операторы. Так,
например, и2 — оператор, преобразующий Н\ в Е^. Тогда
указанные доказательства можно представить в виде диаграммы и,
как показано на рис. 8.1.
Рассмотрим компоненты этой
диаграммы. Пусть и2Ы{) является га-
шаговым (яг-шаговым)
доказательством секвенции Н\ -> 2* (f}n-^
-> N)ny Антецедент этой теоремы
содержит только такие исходные
факты "!("^-i-hJ» которые
обязательно используются каждый на
своем шаге доказательства, а его сукце-
дент содержит все результирующие факты С| (С^__1+Л,
получаемые каждый на соответствующем шаге этого доказательства.
Таким образом, сукцедент теоремы представляет полный результат,
включая и промежуточные (в дальнейшем, возможно, несохраня-
емые) факты, получаемые по ходу доказательства.
Рис. 8.1. Диаграмма
двухуровневого доказательства.
а) 6)
Рис. 8.2. Дерево редуцирования канопических теорем.
Согласно следствию 2 метатеоремы 8 (см. § 7.3)
доказательство и2 в начале |-го шага (он же является концом (£ —1)-го
шага) содержит (£ — 1)-шаговую Н\-\ -> 2f-i и одпошаговуто
^l^l-i -*-^1 теоремы, а в конце £-го шага — ^-шаговую
теорему Я| ->- 2| (см> рИСв з.2, а). Этому £-му шагу, учитывая
соответствие Z, в доказательстве и1 соответствует <ZS — Z6_±> шагов,
начиная с U6_t 4- 1)-го и кончая /гм шагом. Таким образом, |-муч
10*
448
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
шагу в и2 соответствует доказательство ^-шаговой теоремы Р^-*-
—*N}^ исходя из Z$-i-niaroBoii /?1-_1~>Лг1|-1и (Zs — /^-шаговой
UlN^^-^Ni^ теорем (см. рис. 8.2, б).
Рассмотрим связь между теоремами G\ Ъ\„х -v 2§ и H\N\^-\-*-
~+ Nlr Так как имеет место 2| = 2|.,С| и N1^ = N)^x 2|, то
лас будут интересовать связи только в парах (Gf, Н\) и (Cf, 2|)*
Переход от и1 к иг и обратно осуществляется путем
доказательств и12, которые согласно комплексной стратегии
представляют собой доказательства секвенций H\-*G\ и С|->2|.
Обозначим эти доказательства через u%\ и иЦ и исследуем их
характер.
Как уже отмечалось, антецедент FI\ содержит необходимые
исходные факты, которые хотя и используются на разных шагах
доказательства и1, но в действительности относятся к одному и
тому же моменту реального времепи. Поэтому и\\ представляет
структуризацию и обобщение необходимых одномоментных
исходных данных Н\ в виде G\.
Иначе обстоит дело с секвенцией С\ -> 2|. С одной стороны,
ее сукцедент 2| содержит результаты, соотнесенные с
различными моментами времени в интервале U*-!, ZJ. С другой
стороны, антецедент С\ выражает одномоментный результат,
соотнесенный с концом £-го шага, т. е. с моментом Z5. Для устранения
возникшего временного несоответствия, очевидно, необходимо из
2| исключить все то, что не сохранилось к моменту Z$.
Обозначим полученный таким образом остаток через Е\ s
S 2|. Итак, U|2 представляет на самом деле доказательство
секвенции С\-*Е\, где Е\ содержит только конечные
результаты. Высказанное соображение иллюстрируется конкретным
примером, представленным в виде треугольной таблицы на
рис. 8.3.
Данный пример дает следующее конкретное представление
ранее введенных обозначений и понятий: |<^{1, 2), /&^И, ..., 6),
Zl==3,J^=6, F\ = H\II\, ffl^GtG^^
22 = CfC2, Ев = ЕХЕЪ Ег = С1/2-з^2/з^з» Еъ ^ W/e-eCft/eCV
Аналогичным образом, N\ = 2х22, 2, = CiC2C^ 22 = С^СЬС^ F% ->
->- 22 — диагональная теорема, которой соответствует локальная
задача; F\-*H\— вертикальная теорема с доказательством м}2*
которая распадается на две вертикальные теоремы H\-+G\ и Н\-*~
гл*1 12 12 гг2 v2
.-^Gjc доказательствами Мц и ич\ соответственно; //2—*2j2—
горизонтальная теорема с доказательством м2, которому соответ-
§8 1. ДИАГРАММА ДВУХУРОВНЕВОГО ДОКАЗАТЕЛЬСТВА 149
ствует замысел решения локальной задачи v2 = V1Y2I 22-v /?e —
12
вертикальная теорема с доказательством щ , которая
распадается на две вертикальные теоремы С\-+ Е\ ъ С\-+ Е\ с
доказательствами иЦ и иЦ соответственно; #J->2j —
горизонтальная теорема с доказательством и\ которому соответствует
решение локальной задачи Vх = у\у у^ у\, yl, yl, у\.
fff
1 1
'/
<>;
е/
el
Gi
с!
oj
ri -
с!
Г1
L1/2
Ч/г-з
N. - ?
г}4
щ
г1
L2/J
ч
г^
%
с?
р1
4/2-4
р1
4/2-5
4/2-6
С2/3-4
р1
(•2/3-6
С3/4
Г1 ■
L3/4-5
р1
h/4-S
р2
4/2
ц*'\
74
С4/5
Г1
b4/5-6
%
г1
h/s
rh
&
ci
Рис. 8.3. Пример двухраигового решения.
Указанная иллюстрация может служить также для пояснепия
механизма построения и роли собственных аксиом теории S2.
В аксиоме ->- В2 ® С2 антецедент В2 должен содержать в
обобщенном виде на начальный момент только то, что необходимо для
решения соответствующей типовой задачи, а сукцедепт С2
должен содержать в обобщенном виде только то, что составляет
конечный результат этой задачи. За счет исключения (включения)
^сохраняющихся промежуточных результатов происходит
свертывание (развертывание) многошаговых доказательств теории St
(элементарных доказательств теории S2). Другими словами,
можно сказать, что рефлексный уровень инвариантен к иесохрапяю-
щимся промежуточным результатам, что и позволяет порождать
пространство решений одной и той же перцептивной задачи.
Нетрудно заметить, что аксиомы -»- В2 ® С2 выполняют роль
допустимых правил, эффективность использования которых
отмечает С. Ю. Маслов [1972, 1979].
150 ГЛ 8 РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
Итак, доказательство диагональной секвенции Di -*- Е2 в
теории 5 представляет собой диаграмму и = <и2, [и\\, и\1\1^.%^
<!/г}, и1), где и2 является доказательством горизонтальной
секвенции Нп->-2*, в которой Е2 s 2*; и1 является доказательством
горизонтальной секвенции F}n ->- 7VJn, в которой #| £/^ cz Z?1 и
£| £ JV]n; {u|J, м-Ц} является множеством доказательств
вертикальных секвенций i/j-*Gf и С§->£|, в которых G| £//* и
§ 8.2. Алгоритм поиска вертикальных доказательств
Доказательство истинности определенной в теории Si2
вертикальной секвенции D1 -*■ D2 (Е2 -+■ Е*) сводится к
последовательности доказательств истинности элементарных секвенций D] ->-
~> 9i\ {$)-> Е))\ при этом используется модификация
принципа опровержения, рассмотренного в § 5.3. Согласно этой
модификации исходная элементарная секвенция Di -»■ 0§2 {$) ->■ £})
считается ложной, если заданная с помощью D] (или щ)
интерпретация представляет контрпример; в противном случае эта
секвенция истинна, т. е. является теоремой. Очевидно, исходная
секвенция Z)1 -*- D2 (Е2-+■ Е*) ложна, если ложна хотя бы одна
элементарная секвенция, и истинна, если истинны все
элементарные секвенции. Таким образом, в теории SiZ поиск
доказательств аналогичен поиску в секвенциальном исчислении (см.
конец §§ 5.3 и 6.5).
При построении алгоритма автоматического доказательства
теорем обычно стараются использовать те или иные свойства
исчислений. Такими свойствами в системах генценовского типа
являются свойства подформульности и знакосохраняющее свойство
иодформульности (ЗСП) правил вывода.
Свойство подформульности исчисления состоит в том, что
каждая формула секвенции, входящей в доказательство,
непременно является подформулой доказываемой секвенции. Таким
образом, доказательство в таком исчислении состоит только из
частей доказываемой секвенции, что значительно облегчает
автоматический поиск такого доказательства.
ЗСП использует понятие знака части секвенции. Часть А
считается положительной (отрицательной), если она четное
(нечетное) число раз входит в секвенцию под знаком — (отрицание) и
непосредственно перед зпаками => (импликация), ® (связка в
собственных аксиомах) и -> (знак секвенции).
Например, в секвенции
-> Зх {Р id Q (х)) zd{Pzd3xQ {x)) (8.1)
§ 8.2. АЛГОРИТМ ПОИСКА ВЕРТИКАЛЬНЫХ ДОКАЗАТЕЛЬСТВ 151
формула Зх (Р zd Q (х)) zd (Р zd 3xQ (х)) положительна; форму-
лы 3x(PzdQ (х)) и PzdQ(x) отрицательны, а формулы Р =э
zd 3xQ (x) и 3xQ (x) положительны; первое вхождение =>
отрицательно, остальные два положительны; первое вхождение Р
положительно, второе отрицательно; первое вхождение Q(x)
отрицательно, второе положительно.
Исчисление обладает ЗСП, если любая часть любой
секвенции сохраняет свой знак на протяжении всего дерева
доказательства. Обычно свойство подформульности предопределяет ЗСП,
что позволяет по знаку каждой части (в том числе атома или
<*>
<*>
Qi(*th ?г -+b*Qz(*h Q*(<4h Qz(*)
3-^3
Pt+Pn *2xQz(x)> Qi(a)i f!t(at)>Pz-~h*<?*(*)f Ш
Pf ^Qifa)* pz -*• ^z* h(*)> Qz(o)
Ъ,х(Р1
Э,х(Р,
Ь*Ю
_
^Ш)>
*=>Qt(*)),
*=>QiW)
Pz-
Pz-
^2xQ2(x)t Q2(a)
+ +
-*- ^2xQ2(x)
■ i + \
•(fi^hxQzW)
- +
+
3 ч*,-*- 3
3->•,-*- 3
3/Х(Р,=>0,(x)) з (P2 zpj2xQ2(x))
l—. ZL I i + »
Рис. 8.4. Использование зпакосохрапяющего свойства аодформульпости при
доказательстве.
логического оператора) сразу определять ее расположение в
дереве доказательства относительно знака ->. Так, например,
определение знака логических операторов в исходной секвенции
позволяет определять необходимые (из двух возможных для
данной связки) правила вывода при построении доказательства.
Проиллюстрируем использование этих свойств для
автоматического построения доказательств на примере секвепции (8.1).
На рис. 8.4 знаки + и — отмечают- все положительные и
отрицательные части исходной секвенции, нижние индексы
отмечают номер вхождения символа. Из рис. 8.4 видно, как на
каждом шаге доказательства априори определенные знаки главного
152
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
оператора и связываемых им частей главной формулы дозволяют
непосредственно выбирать (из двух возможных) правила вывода
и размещать слева или справа от знака -> боковые формулы.
Так, если главный оператор ®е={=э, д} имеет знак +, то
выбирается правило -*- ®, если —, то выбирается правило ® -*; при
этом положительные боковые формулы размещаются справа от
-*, а отрицательные — слева.
Правила вывода теории Si2 обладают обоими указанными
свойствами, и это может быть использовано при разработке
алгоритма поиска вертикальных доказательств. Рассмотрим
основные процедуры этого алгоритма.
8.2.1. Процедура формирования переменных. В ходе
опровержения исходной секвенции наряду с другими используются кван-
торные правила RQ и й7, связанные с формированием «новых»
Ъ и «старых» г переменных. Рассмотрим эту процедуру более
подробно *).
Пусть задан список ии .♦., ut\zu ..., zq. В этом списке левый
подсписок (слева от вертикальной черты) содержит все
разносортные индивиды, которые входят в антецедент опровергаемой
секвенции и тем самым в статическую модель М(т). Правый
подсписок содержит переменные различных сортов, которые
используются в качестве новых переменных Ъ в соответствующих
правилах Si2.
Поскольку оценка М(т) как контрпримера проводится по всем
конкретным путям секвенциального дерева (так называемый
поиск вширь [Нильсон, 1971]), то на каждом шаге отмечается,
какие из термов уже были активированы. Для этого используется
вертикальная черта между термами вышеуказанного списка.
Первоначально она поставлена так, как показано выше, откуда
следует, что первоначально активированы все индивиды,
входящие в антецедент, и не активирована пи одна переменная.
На каждом шаге применения правил опровержения -> V и
3 -> в качестве новой переменной Ъ используется первая, еще не
активированная переменная zt из правого подсписка и, чтобы
отметить это, вертикальная черта передвигается на одну позицию
вправо. При применении правил у~*" и *"*■ 3 любой терм
соответствующего сорта tu ..., tp левого подсписка допускается в
качестве значения старой переменной г, если он раньше не
использовался в этом качестве.
8.2.2. Цикл опровержения. Шаги по любому конкретному
пути дерева разбиваются на циклы. Предположим, что в начале
цикла d рассматривается секвенция Аи ..., Ат-+Ви ..., Вп (при
d =* 1 мы рассматриваем исходную секвенцию, при d > 1 рассмат-
*) Процедура несущественно отличается от алгоритма, описанного в
книге [Клини, 1967].
§ 8.2. АЛГОРИТМ ПОИСКА ВЕРТИКАЛЬНЫХ ДОКАЗАТЕЛЬСТВ 153
ривается секвенция, полученная в конце цикла d — 1). Выполняя
цикл d, мы рассматриваем по очереди в качестве главпой
формулы каждое из выражений Аи .,., Лт, Ви ..., Вц и выполняем,
если это возможно, один или несколько шагов применения
соответствующего правила опровержения (если только, выполняя
цикл, мы не закрываем путь).
Если выражение, выбранное из списка Аи ..., Ат, Bif ..., Вп,
является атомарным фактом первого уровня, шаг не
выполняется. В случае, когда выражение в качестве главного оператора
(внешней связки) не содержит квантор, выполняется один шаг
цикла, полностью определяемый главпой формулой и
соответствующим правилом опровержения. В случае, когда эта формула
содержит в качестве главного оператора квантор и применяется
одно из правил, -> у или 3 —>-, выполняется один шаг цикла по
соответствующему правилу с вводом zx — первой, еще не
активированной переменной из правого подсписка zh ..., zq в качество
новой перемеппой Ь.
В случае, когда главная формула содержит в качестве
главного оператора квантор и применяется одно из правил, у "*" илп
—>-Э, шаги цикла выполняются по соответствующим правилам
с использованием в качестве старой переменной г каждого из
уже активированных термов соответствующего сорта tiy ..., tPy
ранее неиспользуемых в качестве г для применяемого правила
с подобной же главной формулой*). Таким образом, выполняется
р шагов цикла.
Конкретный путь оборвется и будет закрыт, когда мы
впервые получим логическую аксиому вида (X). Путь оборвется, не
будучи закрыт, в том случае, когда получена секвенция, исходя
из которой невозможно сделать ни один из описанных шагов.
Это происходит, если рассматриваемая секвенция (при ранее
активированных термах tu ..., tp) содержит только атомарные
факты первого уровня. В этом случае исходная секвенция
опровергается.
Очевидно, любой путь в дереве (закрытый или открытый)
является конечным вследствие конечности области определения
квантифицируемых переменных. Следовательно, алгоритм поиска
вертикальных доказательств также является конечным.
8.2.3. Пример. Для пояснения алгоритма поиска рассмотрим
иллюстративный пример из области шахмат. Пусть нам
необходимо доказать истинность секвенции Рх ->- ПРОХОДНАЯ
(БЕЛЫЕ, ЧЕРНЫЕ), в которой факт !>' = ВПЕРЕДИ (Ч-ПЕШКА-1,
Б-ПЕШКА) ВПЕРЕДИ (Ч-ПЕШКА-2, Б-ПЕШКА) ВПЕРЕДИ
*) Формула (^я1 €= *2\Д2) А (х1) подобна формуле (М*1 s s2\A,) A {a1),
«ели первая получается из второй путем применения к пей правила
V -> или -*з и разность A2\At есть список из р активированных термов.
154
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
(Ч-ПЕШКА-3, Б-ПЕШКА) СМЕЖ-ВЕРТ (Ч-ИЕШКА-3, Б-ЛЕШ-
КА) означает, что первая и вторая черные пешки не находятся
впереди белой пешки, а третья черная пешка хотя и впереди
белой, но не на смежных с ней вертикалях; факт ПРОХОДНАЯ
(БЕЛЫЕ, ЧЕРНЫЕ) означает, что белые имеют проходную
пешку против черных.
Пусть нам задана единственная собственная аксиома -*-
ПРОХОДНАЯ (X, Y)**A(X, У), в которой формула Л(Х, У)-
= (3«ЕХ)(укеУ) [ВПЕРЕДИ (*/, х) V ВПЕРЕДИ (,у, х) &
& СМЕЖ-ВЕРТ U, у)]. Начальный список имеет вид: Б-НЕШКА,
<&
ВП(Ч-3, Б), ВП(г,,Б), СМ(Б, г,)
'*,
В1
В1
л1
я1
в1
<5>
ВП(ги Б) -*-ВЛ(г„ Б);
+ в77(г„Б;, ВП(г},Б);
-+ВЛ(1„Б), ВП(ж„Б)
■*■ ВП(жи Б) v вп(г„ Б)
Л
-^ВЛ(Ч-1, Б), ВП(Ч-2, Б), СМ(5, Ч-З)
Я1,ВЛ(2иБ), СМ (Б, z,) -*-
J)1+ffl(zu Б), СТщ z7)
L СМ (Б, zf)
&. СМ (Б, zf)
-*■ (У у е ЧЕРНЫЕ)[ВП(у, Б) V ВП(у, Б) &. Ш(Б, у)]
-*■ А (БЕЛЫЕ, ЧЕРНЫЕ); -
(х)
* ПРОХОДНАЯ (X, У)<=>А(Х, У J
D1'-*■ ПРОХОДНАЯ (БЕЛБ/Е, ЧЕРНЫЕ)
Рис. 8.5. Пример поиска вертикальных доказательств: ВП — впереди, СМ —
смежная вертикаль, Б — белые, Ч — черные.
Ч-ПЕШКА-1, Ч-ПЕШКА-2, Ч-ПЕШКА-3, \zu z2, ..., zq, где
термы разбиты по сортам следующим образом: {Б-ПЕШКА, х)и
{Ч-ПЕШКА-1, Ч-ПЕШКА-2, Ч-ПЕШКА-3, i/, st}2, {БЕЛЫЕ, Х}3,
{ЧЕРНЫЕ, У}4. Соответствующее секвенциальное дерево
приведено на рис. 8.5.
На рис. 8.5 символом (X) замкнуты вершины путей дерева,
на которых отсутствует опровергающий контрпример. Заметим,
что введепная новая переменная zL принимает значения из мпо-
§ 8.3. АЛГОРИТМ ПОИСКА ГОРИЗОНТАЛЬНЫХ ДОКАЗАТЕЛЬСТВ 155
ткества {Ч-ПЕШКА-1, Ч-ПЕШКА-2, Ч-ПЕШКА-3) и любое ео
означивание приводит к (X).
Таким образом, в этом* примере мы получили замкнутое
дерево, т. е. дерево доказательства. Однако, если изменить исходные
данные на Z)1 = ВПЕРЕДИ (Ч-ПЕШКА-1, Б-ПЕШКА)
ВПЕРЕДИ (Ч-ПЕШКА-2, Б- - ПЕШКА) ВПЕРЕДИ (Ч-ИЕШКА-3,
Б-ПЕШКА) СМЕЖ-ВЕРТ (Ч-ПЕШКА-3, Б—ПЕШКА), то легко
показать, что D1 представляет собой опровергающий контрпример
и в этом случае исходная секвенция -> ПРОХОДНАЯ (БЕЛЫЕ,
ЧЕРНЫЕ) будет ложной.
Итак, поиск вертикальных доказательств теории *S12
организуется следующим образом. В предположении ложности исходной
секвенции строится снизу вверх вывод ложных секвенций (при
этом правила 512 работают как правила опровержения). Далее,
в зависимости от результата предыдущего этапа получаем: либо
при наличии контрпримера доказательство сверху вниз
ложности исходной секвенции (при этом правила Si2 работают как
правила опровержения), либо при отсутствии контрпримера
доказательство сверху вниз истинности исходной секвенции (при этом
правила Si2 работают как правила вывода).
§ 8.3., Алгоритм поиска горизонтальных доказательств
При построении алгоритма поиска вертикальных доказательств
отмечались такие свойства правил теории Si2, как двусторонний
характер, подформулыюсть и знакосохраняющее свойство под-
формулыюстп. Наличие первого из указапных свойств позволяет
организовать автоматический поиск доказательства как
построение снизу вверх опровержения исходной секвенции, наличие
остальных свойств позволяет эффективно управлять указанным
поиском.
Иначе обстоит дело с теорией St (или S2). Рассмотрим в этой
связи ее производные правила Й?1|П и 4п, которые (см. § 6.5)
имеют вид
Эти правила выражают свои стратегии редукции исходной
л-шаговой теоремы D -> &л. Для правила 9tit „ это разложение
исходной л-шаговой теоремы на (тг — 1)-Шаговую D -> 0n-t и одно-
шаговую Cn0n-i ->- 0n теоремы. Для правила 3lK n это разложение
исходной и-шаговой теоремы па /с-шаговую D -> С" и (п —й;)-ша-
говую Dh -+ 0n_fe теоремы.
156
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
Анализ правил &21>п и 52ftn показывает, что они не обладают
свойством подформульности и не могут рассматриваться снизу
вверх как правила опровержения или вывода. Поэтому и поиск
горизонтальных доказательств нельзя представить как построение
снизу вверх соответствующих опровержений. Однако сверху вниз
$2lf п и 01к п согласно лемме 2 (см. § 7.2) представляют собой
правила вывода. Указанная специфика предопределяет
одностороннюю направленность горизонтальных доказательств, а именно
сверху вниз.
Тем не менее горизонтальные доказательства можно строить
снизу вверх, рассматривая при этом @tit йи^,п не как правила
вывода математической логики, а как правила редукции
стратегии поиска. Рассматривая снизу вверх &Ut п и §2h> n как правила
редукции, мы устанавливаем, какие подтеоремы необходимы для
доказательства исходной теоремы. Рассматривая &£it „ и &lK n
сверху вниз как правила вывода, мы устанавливаем, какая
теорема следует из данных подтеорем. Если в процессе редукции
выясняется, что очередпые подтеоремы являются аксиомами, то тем
самым мы находим горизонтальное доказательство исходной
секвенции.
Любой алгоритм поиска горизонтальных доказательств
включает следующие процедуры: редукцию исходной теоремы на
подтеоремы, означивание переменных в схемах собственных аксиом
и определение знаков сукцедентов теорем. Рассмотрим эти
процедуры.
8.3.1. Формирование подтеорем. Пусть пам на Z-м шаге (1 <
z^l^n) заданы исходная теорема D ->- 0* и подходящая (для
вывода) собственная аксиома -+В®С. Согласно стратегии ^21п для
формирования требуемых подтеорем D -*■ Qi-t и GA-t ->■ 0*
необходимо определить сукцедент 0j_i=0?_i U в^-хтаким образом,
чтобы секвенции Gfii^ -> В' и O^C'-vO^ представляли собой
логические аксиомы при одинаковых и известных знаках В' и С. Для
этого используются соотношения: (1) 0/ S 0/-iC' и (2) B' = Gfil-v
Пусть, например, исходная теорема представляет секвенцию
dxb2 -*- CiC2e3, а подходящая собственная аксиома — секвенцию ->•
-*■ ЪхЬг ® CiC2e3. Тогда соотношения (1) и (2) приобретут вид: (1')
схс2е3 S Bj-j^CgCg, где с^сгсг — отрицательный сукцедент аксиомы,
и (2') Ь1Ь2=Ь20/-1, где b2 = Gt и 5i&2 — Ьтрицательньш антецедент
аксиомы. Из (1') и (2') получаем 0j_i = e3, 0/_i= Ьг и в^_1= btes.
Рассмотрим теперь стратегию t%kt n. Согласно этой стратегии
для формирования требуемых подтеорем D -+ Qh^i и Dh -+■ Qt-h
необходимо определить их сукцеденты 0W—± и 9^ таким образом,
чтобы имели место соотношения: (3) В' = Gh%-X и (4) 0Z s C'§i-h.
Из сравнения (3) и (4) с (2) и (1) соответственно следует, что
сукцеденты 0^ и Qi-h стратегии Й?А>П соответствуют сукцедентам
§ 8 3 АЛГОРИТМ ПОИСКА ГОРИЗОНТАЛЬНЫХ ДОКАЗАТЕЛЬСТВ 157
в"_! и 0/_i стратегии $21( „. Более того, если в стратегии 3£it » на
/-м шаге (1^/^д) выбирать подходящую собственную аксиому
--*■ В ® С только из условия пересечения С с 0*, то получим, как
частный случай, стратегию Stkt n. Таким образом, нет надобности
и особом выделении стратегии $R,hy „; достаточно ограничиться
стратегией $?,,„, подчеркивая при необходимости отдельные
особенности стратегии 52ft>,»*).
8.3.2. Означивание переменных. Пусть в ходе поиска
доказательства и а 1-м шаге нами выбрана подходящая схема
собственных аксиом -> В ® С. Если дальнейший поиск закончится
успешно и искомое доказательство будет найдено, то вышеупомянутая
схема должна превратиться в конкретную аксиому -> В' ® С",
где В' и С — константно-частные случаи предложений В и С
соответственно.
Однако на данном Л-м шаге поиска вовсе не обязательно
присваивать всем переменным схемы -* В ® С определенные
значения, это присвоение может состояться в дальнейшем. Более того,
необходимо, по возможности, стремиться к как можно позднему
означиванию, которое в этом случае будет производиться в
условиях наименьшей неопределенности, а следовательно, наиболее
правильно.
Пусть, например, антецедент и сукцедепт схемы ->• В ® С
включает литеры МЕСТО (РОБОТ, yt, tj и МЕСТО (РОБОТ, у2,
t2) соответственно, где переменные г/i и у2 связаны во времени
зависимостью ^(z/i, у2, tu £2)=0, переменным уг и t2 присвоены
определенные значения и, наконец, исходные данные D содержат
литеру МЕСТО (РОБОТ, ОТСЕК-1, *0). Можно было бы на
данном шаге произвести полное означивание, присвоив перемепыои
t/i значение ОТСЕК-1 и определив, таким образом, значение
последней перемепной tt в соответствии с зависимостью г|). Однако,
если решаемая задача для достижения заданного у2 в момент t2
в действительности требует каких-то предварительных действий
робота, меняющих его местоположение, то становится ясно, что
указанное означивание г/i неверно. В этом случае более
правильным было бы иа данном шаге присвоить */4 неопределенное
значение.
Соотношения (1) и (2), используемые для означивания
переменных, отражают влияние иа этот процесс соответственно
исходных данных и конечной цели. Отсюда возможны конфликтные
ситуации. Пусть, например, использование включения (1)
привело к e'j.i, которое содержит литеру МЕСТО (РОБОТ, ОТСЕК-2),
*) Указанный способ сведения стратегии Я\, п к стратегии &h, n
позволяет эффективно комбинировать эти стратегии в каждом конкретном
мире задач.
158
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
антецедент В соответствующей схемы аксиом содержит литеру
МЕСТО (РОБОТ, у) и исходные данные D включают литеру
МЕСТО (РОБОТ, ОТСЕК-1). Если теперь использовать соотношение
Bf = Gt0j_i, то# можно поступить двояко: либо отдать
предпочтение исходным данным, положив ^ = МЕСТО (РОБОТ, ОТСЕК-1),
и, таким образом, присвоить переменной у значение ОТСЕК-1,
либо отдать предпочтение цели, положив Gt = 0, и, таким
образом, присвоить переменной у значение ОТСЕК-2.
Наличие указанных конфликтных ситуаций позволяет путем
введения приоритетов на исходные данные и цели управлять
процессом означивания переменных. Заметим, что в стратегии 9lh> n
это невозможно, так как она вовсе не учитывает влияние цели.
Таким образом, стратегия i%lt n представляется более гибкой.
Наконец, необходим определенный порядок означивания
переменных схем аксиом (см. § 6.4).
Рассмотренные аспекты процедуры означивания переменных
в сильной степени зависят от семантики и прагматики
соответствующих схем, поэтому в целом эта процедура связана с
конкретной предметной областью и должна описываться вместе с
соответствующими схемами аксиом. Примеры подобных описаний
будут приведены в гл. 10 при рассмотрении особого типа данных
систем знаний — закономерностей.
8.3.3. Определение знаков сукцедентов. Пусть в процессе
редукций мы установили, что очередная подтеорема (хотя бы одна
из двух) в действительности ложна. Означает ли это, что
исходная секвенция не является теоремой? Можно ли для проверки
этого использовать ранее полученные редукции, если учесть, что
сверху вниз стратегия #2i,n «не работает» как правило
опровержения? Ответы на заданные вопросы мы получим, рассмотрев
процедуру определения знаков сукцедентов подтеорем.
Пусть в ходе редукции нами сформирована
последовательность секвенций D ->■ 8i (l<Z<n), которые должны быть
теоремами искомого доказательства. Рассмотрим секвенцию D -*- 0,,
которая должна быть одношаговой теоремой. Согласно метатео-
реме 8 для этого мы должны иметь 0-шаговую теорему D->D и
аксиомы Gl-+Br{v СЛ1->- Эх и -^В^ ® C^v где 0Х s СЦ1, Дщ =
= GX^D и Вх\х и СЛ1 одного знака ~.
Требуемый знак ~ у 5<п1 на данном шаге определялся
следующим образом: по ранее сформированому (па 2-м шаге) 8i сог-
ласно0! S Сг\х определялся знак у Ст^, который затем
автоматически присваивался B^v После этого требовалось выполнение
соотношения Вцх = Gv Пусть это соотношение не выполняется.
Обсудим подробнее, что это означает.
§ 8.3. АЛГОРИТМ ПОИСКА ГОРИЗОНТАЛЬНЫХ ДОКАЗАТЕЛЬСТВ 159'
Рассмотрим два возможных случая. Пусть ВЦ1 = В^* Тогда
Вп фОг означает, что Gt содержит хотя бы одну литеру, про-
тивоположпую по знаку соответствующей литере в В^. Пусть
теперь В^ = Вг\г- Тогда B^X=^GX означает, что G4 содержит такую
комбинацию литер со своими знаками,^которая не отрицает Ящ-
Например, пусть G, = dids и В'ц === didim В этом случае имеем
Вх\1 = ^1» так как ^А отрицает ВЦг Однако, если взять G1 = dld3f
то В^ = Gt пе имеет места, потому что dtd3 не отрицает B^v
Так как для обеспечения требуемого соотношения мы не
можем изменить знак у Сг^ (G, представляет исходные данные), та
это необходршо сделать за счет изменения знака у Вщ и,
следовательно, у Cx\v При этом, чтобы экономно строить доказательство,,
необходимо преобразовать логические аксиомы С^ -*~&i и Gr^ ВПх
в новые логические аксиомы, используя ранее полученный:
факт 6,.
Согласно лемме 4 (см. § 7.2) это всегда можно сделать за счет
изменения знака у 9i. Изменение знака у 6i может привести или
не привести к изменению знака у 82 и т. д. вплоть до Эп. В общем
случае можно показать, что изменение знака у 0^-i не приводит
к изменению знака у 8/ (2<^Кп) тогда и только тогда, когда
отрицание вг_t имеет место только за счет отрицания Э^ и
литеры, ранее явившиеся причиной отрицания сукцедента аксиомы
Сг\г не принадлежат пересечению 0j f| Сцг
Действительно, пусть на (Z— 1)-м шаге (2<Z<ti) получено
отрицание 0г-1 = 0г~1 U 6* -j и, следовательно, утратило смысл имев-
шее место соотношение 5Tlz=Gi0f_1. Изменением знака у ^п^ мож-
по согласно лемме 4 обеспечить требуемое ВП1 = С^0/-1э но так
как СЦ1 при этом также должно менять свой знак, требуемое
включение 0* ^ 0j_iGnj возможно лишь тогда, когда сменившие
свой знак литеры в Сщ не принадлежат пересечению Qi{]Cx\r
Принципиальная блок-схема алгоритма стратегии Stit „ вклю-*
чает следующие шаги:
1) Анализ исходной секвенции D -* 0„. Определяются
пересечение D П 0П и разность 0n\D П 0П. Если разность оказывается
пустой, то секвенция D -*• 0П представляет собой логическую
аксиому и к доказательству пе принимается. В противном случае
переход к шагу 2.
-J 60
ГЛ. 8 РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
2) Анализ антецедента D. Если пет пи одной собственной
аксиомы, для антецедента которой было бы справедливо включение
Нц ^ D, то секвенция D -*■ 6П отвергается но антецеденту как
недоказуемая. В противном случае фиксируется сложность
исходной секвенции и осуществляется переход к шагу 3.
3. Определение подходящей собственной аксиомы. На 1-м
шаге (l^Z^n), начиная с 1 = п, выделяется подмножество аксиом
Г/ s Ki таких, чтобы их сукцедеиты Сч (если надо, то с
отрицательным знаком) пересекались с сукцедептом 0/. Если при этом
Ti пусто, то D -+• 0, отвергается по сукцеденту как
недоказуемая*). В противном случае выбирается (возможно, с помощью
подходящей оценочной функции) аксиома 7л/ е Г/ и
осуществляется переход к шагу 4.
4) Формирование сукцедеита 0/_i и означивание переменных.
По заданным фактам D и 0* и из условий OfSC^Of-i, B^^
= G;0/_t, 0;_! = 0Z_1 |J Э^ и Gt s D определяются сукцедент
0/_, и значения переменных, а также исходный подфакт Gx.
В итоге формируются требуемые посылки правила &tit n и затем
осуществляется переход к шагу 5.
5) Анализ па одношаговость. Устанавливается, является ли
секвенция D ->- Qt одношаговой теоремой, т. е. пусто ли 0/_ь Если
да, то переход к шагу 6. В противном случае формируется новая
секвенция D -+• 0/_4 со сложностью (1—1) и выполняется переход
к шагу 3.
6) Анализ знака сукцедента 0Ь Определяется действительный
знак у 0i. Если он положительный, то исходная секвенция D -*■ 0П
является n-шаговой теоремой, а полученное дерево редукций —
ее доказательством. В противном случае переход к шагу 7.
7) Преобразование дерева редукций в доказательство. Исходя
из 0Ь сверху вниз осуществляется процедура определения знака
всех фактов в дереве редукций и в итоге знака сукцедента 0П
исходной секвепции. Если знак 0П становится отрицательным, т. е.
доказывается теорема D -*- 0П, то при необходимости выдаются
причины такого результата.
Таким образом, допускается, что, пытаясь доказать теорему
D -+■ 0П, мы в действительности, докажем контрарную теорему
D -*■ 0П. Здесь проявляется свойство полноты теории S{ (или S2).
8.3.4. Иллюстративный пример. Пусть задана система схем
собственных аксиом:
ъ: МЕСТО (РОБОТ, у) МЕСТО (ЯЩИК, уМ ИЛ (РОБОТ,
ЯЩИК);
*) Следует заметить, что для секвепции D-*0n, определенной в
теории 5i, отказ от доказательства на шагах 2 и 3 невозможен. В данном
алгоритме речь идет о произвольной секвенции, не обязательно
определенной в S\.
§ 8.3. АЛГОРИТМ ПОИСКА ГОРИЗОНТАЛЬНЫХ ДОКАЗАТЕЛЬСТВ 161
v2: МЕСТО (РОБОТ, yt) -< МЕСТО (РОБОТ, у2);
Ъ: МЕСТО (РОБОТ, у,) МЕСТО (ЯЩИК, у,) ВМЕСТО
(РОБОТ, у2) МЕСТО (ЯЩИК, i/2);
Т4: НА (РОБОТ, ЯЩИК) МЕСТО (ЯЩИК, ПОД-ЛАМПА)
ВКЛЮЧЕНА (ЛАМПА) -< ВКЛЮЧЕНА (ЛАМПА)
ц теорема D ->- Е, где
Р = МЕСТО (РОБОТ, УГОЛ-1) МЕСТО (ЯЩИК, УГОЛ-2)
ВКЛЮЧЕНА (ЛАМПА) и Я = ВКЛЮЧЕНА (ЛАМПА).
Доказательство истинности секвенции D -> Е (Е = 04)
приведено на рис. 8.6, где кружками выделены вершины типа ИЛИ.
В этом доказательстве,
представленном снизу вверх, Gt и Qt имеют
следующие значения:
1) £,= МЕСТО (РОБОТ, УГОЛ-
1), е'о = 0, е;-0;
2) G2 « МЕСТО (ЯЩИК, УГОЛ-
2)7 е; = 0, е;'« место (робот,
УГОЛ-2);
3) G3 = ^, 6^ = 0, в! fc МЕСТО
(ЯЩИК, ПОД-ЛАМПА) МЕСТО
(РОБОТ, ПОД-ЛАМПА);
4) G4 = ВКЛЮЧЕНА (ЛАМПА),
ei=0, е,* = нА (робот, ящию
МЕСТО (ЯЩИК,
ПОД-ЛАМПА);
5) 94-ВКЛЮЧЕНА (ЛАМПА).
На 3-м шаге имела место
конфликтная ситуация: присвоить уг в 62
значение ПОД-ЛАМПА из 03 либо
значение УГОЛ-2 из £>, которая
разрешилась в пользу значения ПОД-
ЛАМПА. Стратегия fftht n в этом случае привела бы к неудаче.
На рис. 8.7 решение задачи представлено в форме
треугольной таблицы. В данном примере была доказана исходная
секвенция D-+E. Одпако, если несколько изменить аксиоматику, а
именно, ввести в антецедент v2 дополнительно литеры РЕСУРС
(РОБОТ, j/1) БОЛЬШЕ (т/\ с\)у а в D включить РЕСУРС (РОБОТ, с\)
БОЛЬШЕ {с\, cl), то легко видеть, что будет доказана
секвенция D ->- Е.
8.3.5. Организация поиска. Как уже отмечалось, редукция
теории St на основе правила &i>n связана с выбором на 1-й шаге
(l^l^n) собственной аксиомы *f из множества Ti^Ki
подходящих аксиом. Таким образом, возникают альтернативные вариан-
j *-п + о0
Ъ
[ у-л+ег
1¥-Gi0o + *t\
7з*-0*Ъ + Ъ\
^J^^
1 *-я+е2
°ч^ гу
| *-в+в3
У-В-+
?1*-£зв2*вз\
| fjt-fy 03 ~*~ fy \
/?4
-o4
Рис. 8.6. Дерево
доказательства задачи «включить
лампу».
11
^ И Ефимов
162
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
ты редукций, порождающие пространство редукций, в котором
при наличии большого числа аксиом был бы необходим
направленный поиск оптимальных доказательств.
При организации иерархического поиска указанная проблема
не представляется такой острой, как при одноуровневом поиске,
поэтому мы вправе ограничиться в данном вопросе наиболее
простыми схемами направленного поиска. Желающих изучить
проблему эвристического поиска более основательно мы отсылаем к
работам Нильсона [1971], Ханта [1975], Э. В. Попова и Г. Р. Фирд-
мапа [19761.
МЕС(РОБ,УН)
\МЕС(Щ,УГ-2)
}'2 -ПОдDШ7Ш
МЕС(Р0Б,УГ-2)
у3 -перетащи
МЕС(Щ, П-Л)
МЕС(РОБ, П~Л)
МЕС(ЯЩ,П-Л)
МЕС(ЯЩ,Л-Л)
'№
% -бзфатся
НА(РОБ,ЯЩ)
Ш(РЩЯЩ)
ft -сшп/рть
ВКЛЮЧЕНА (ЯГ
О 1 2 " J 4
Рис. 8.7. Решение задачи «включить лампу»: РОБ —робот, УГ — угол,
ЯЩ — ящик, П-Л — под лампой, Л — лампа.
а) ф
Рис. 8.8. Деревья И/ИЛИ,
Итак, поиск горизонтальных доказательств мы будем
представлять как некий паправлепный поиск на дереве редукций. Пусть
теорейа А представляется следующим деревом (см. *рис. 8.8, а),
т. е. доказательство А может быть произведено либо путем
доказательства теорем В и С, либо путем доказательства теорем D
и Е, либо, наконец, путем доказательства теоремы F. На рис. 8.8
§83 АЛГОРИТМ ПОИСКА ГОРИЗОНТАЛЬНЫХ ДОКАЗАТЕЛЬСТВ 163
связки дуг обозначают логическое И, а несвязанные дуги —
логическое ИЛИ. Однако такое представление не совсем удобно для
перебора, поэтому для множества И-теорем мы вводим дополни-
аельные вершины, как показано на рис. 8.8, б. В таком виде на
каждом уровне дерева находятся теоремы одного типа (И-теоре-
ма или ИЛИ-теорема).
Указанная па рис. 8.8, б структура И/ИЛИ дерева и будет
использоваться в дальнейшем. Исходная вершина называется
начальной, заключительные вершины соответствуют элементарным
теоремам. Цель поиска на И/ИЛИ дереве — показать, что
начальная вершина разрешима. Понятие разрешимости вершины
формулируется рекурсивно следующим образом: 1) заключительные
вершины разрешимы; 2) если у вершины, не являющейся
заключительной, дочерние вершины представляют ИЛИ-теоремы, то
она разрешима тогда и только тогда, когда разрешима хотя бы
одна дочерняя вершина; 3) если у вершины, не являющейся
заключительной, дочерние вершины представляют И-теоремы, то
она разрешима тогда и только тогда, когда разрешима каждая из
дочерних вершин. Тогда решающее дерево, т. е. дерево
доказательства, определяется как поддерево из разрешимых вершин,
которое показывает, что начальная вершина разрешима.
Наряду с условиями разрешимости вершины нам потребуется
внать, когда она неразрешима. Определение неразрешимости
вершины также задается рекурсивно: 1) вершина, не являющаяся
заключительной и не имеющая дочерних вершин, неразрешима;
2) если у вершины, не являющейся заключительной, дочерние
вершины представляют ИЛИ-теоремы, то она неразрешима тогда
и только тогда, когда неразрешима каждая из дочерних вершин;
3) если у вершины, не являющейся заключительной, дочерние
вершины представляют И-теоремы, то она неразрешима тогда п
только тогда, когда неразрешима хотя бы одна дочерняя
вершина.
Обычно дерево редукций не задается в готовом виде, а
генерируется по мере надобности. Обозначим механизм
редуцирования через Р и назовем его оператором редуцирования. Примером
оператора Р может служить правило &и „ в теории 5Ь Тогда
процесс доказательства теоремы состопт в том, чтобы, построив
достаточную часть И/ИЛИ дерева, убедиться в разрешимости его
начальной вершины.
Нас в первую очередь интересуют алгоритмы направленного
перебора па дереве редукций. Для их построения необходимо
вводить оценочные фукции. Как правило, эти функции имеют
эвристический характер, учитывающий специфику конкретного ми-
Ра задач. Обычно уменьшение перебора при использовании
эвристик достигается ценой отказа от гарантии найти наилучшее
решение. Но в большинстве практических задач мы заинтересован
11*
164
ГЛ 8 РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
ны в минимизации некоторой комбинации из стоимости
доказательства и стоимости перебора.
Итак, оценочная функция должна направлять процесс
редуцирования (мы будем говорить, процесс раскрытия вершин) с
помощью оператора Р. Оценочную функцию можно строить на
основе различных соображений. Рассмотрим одни наиболее
распространенный ее тип.
В И/ИЛИ дереве стоимость доказательства теоремы связана
с оценкой стоимости дерева доказательства (поддерева II/ИЛ И
дерева) с исходной теоремой в корне. Под стоимостью дерева
доказательства будем подразумевать суммарную стоимость всех его
дуг. Внутри всего неявно заданного И/ИЛИ дерева нам
необходимо найти дерево доказательства с минимальной стоимостью.
Назовем его оптимальным.
Обозначим через А(б) стоимость оптимального дерева с
корнем 9. Пусть с(б, 60 — стоимость дуги между 9 и ее дочерней
вершиной 0*. Тогда рекурсивное определение стоимости Мб)
через стоимость Мб') имеет вид: 1) если б — заключительная
вершина, то М0) = 0; 2) если 0 не является заключительной
вершиной и имеет дочерние вершины типа ИЛИ б1, ..., 6\ то Мб) =
= minLc(6, 60 + M60J; 3) если б не является заключительной
i
вершиной и имеет дочерние вершины типа И б1, ..., б\ то Мб) =*
к
г=2 [с (б, б1) + ft (б1)]. Стоимость Мб) не определена, если вер-
г=1
шина б1 неразрешима.
Обычно функция ft(6) неизвестна, поэтому для упорядочения
процесса раскрытия вершин используется ее оценка Мб\
которая называется эвристической функцией. Для ft(6) справедливы
все те соотношения, которые приводились ранее при рекурсивном
определении ft(6) через ft(60.
В ходе поиска доказательства по дереву поиска па каждом
шаге мы имеем дело с множеством поддеревьев с корнем в 0О,
каждое из которых могло бы в зависимости от результатов
дальнейшего раскрытия вершин стать верхней частью полного
дерева доказательства. Назовем эти деревья потенциальными
деревьями доказательства для б0.
На каждом шаге в процессе перебора можно извлечь из
дерева поиска в качестве кандидата на включение в дерево
доказательства потенциальное дерево т0. Процедура указанного
извлечения основана на следующем определении:
1) начальная вершина входит в т0;
2) если у вершины б, входящей в т0, в дереве поиска есть:
а) дочерние вершины типа ИЛИ б1, ..., 6\ то в т0 входит та из
них, для которой [с(б, 60 +Мб*)] миинмальпа; б) дочерние
вершины типа И, то все они входят в т0.
§ 8 3. АЛГОРИТМ ПОИСКА ГОРИЗОНТАЛЬНЫХ ДОКАЗАТЕЛЬСТВ Ю 5
С учетом вышесказанного имеем следующий алгоритм
направленного перебора на И/ИЛИ деревьях:
1) поместить начальную вершину 80 в список ОТКРЫТ и
вычислить Ы9о);
2) получить потенциальное дерево т0;
3) выбрать некоторую концевую вершину т0 из списка
ОТКРЫТ и поместить ее в список ЗАКРЫТ, обозначить эту
вершину через 9;
4) если 8 — заключительная вершина, то пометить 9 как
разрешимую и перейти к следующему шагу, в противном случае
перейти к шагу 8;
5) применить к т0 процедуру разрешимых вершин;
6) если начальная вершина помечена как разрешимая, то
То — дерево доказательства (конец работы алгоритма), в
противном случае перейти к следующему шагу;
7) изъять из списка ОТКРЫТ все вершины, имеющие
разрешимые родительские вершины, перейти к шагу 2;
8) применить к 9 оператор Р и построить все дочерние вер-
шпны для 9; если таковых нет, то пометить 9 как неразрешимую
и перейти к следующему шагу, в противном случае перейти к
шагу 12;
9) применить к т0 процедуру разметки неразрешимых вершин;
10) если начальная вершина неразрешима, то
доказательства нет (конец работы алгоритма), в противном случае перейти
к следующему шагу;
11) изъять из списка ОТКРЫТ все вершины, имеющие
неразрешимые родительские вершины, перейти к шагу 2;
12) поместить дочерние вершины в список ОТКРЫТ и
провести от них указатели назад к вершине 9, вычислить h для этих
вершин, пересчитать h для вершины 9 и ее родительских вершин,
перейти к шагу 2.
Назовем алгоритм поиска на И/ИЛИ дереве допустимым, если
его применение всегда приводит к доказательству минимальной
стоимости, при условии, что доказательство существует. Пильсо-
пом [1971] доказано, что если Ы9) ^ М9) для любой открытой
вершины 9, то ранее рассмотренный алгоритм направленного
перебора на И/ИЛИ деревьях является допустимым.
8.3.6. Иллюстративный пример. Рассмотрим задачу,
состоящую в том, что роботу необходимо собрать ящики в одно место,
в качестве которого выбирается местоположение одного пз них.
Для этого робот должеп: ^ — подходить к ящикам и f2 —
переносить их. Пусть стоимость перемещения робота на расстояние
# равно х, а стоимость переноса любого ящика па расстояние х
равна 2л\
166
ГЛ 8 РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
Пусть /0 — множество ящиков с номерами ^ = 1, 2, ..., т%
/, — номер ящика, служащего местом сборки остальных (т-~\)
ящиков, и imy ..., it, ..., ^ — последовательность их сборки*).
Пусть также 1\ = /$-| — i\ — множество ящиков, перетаскиваемых
ранее irro ящика. Очевидно, /m-i = im и /m e #.
Стоимость дерева доказательства зависит, во-первых, от
выбора ящика U и, во-вторых, от выбора ящика im. Легко видеть,
что порядок перетаскивания остальных ящиков значения не
имеет, так как робот собирает их, перемещаясь по радиусу от U к
1\ и обратно.
Обозначим корневую вершину дерева доказательства через 80 —•
сукцедент исходной теоремы D -*• 60, ее дочерние вершины — че-
рез 1>0 , дочерние вершины последних — через tin • t> основу
построения эвристических функций положим следующие
соображения. Выбор ящика ii должен определяться «кучностью»
расположения вокруг него остальных ящиков. Поэтому примем, что
Л = 'о - *i и
V
h(%) = mmlh (eMl где Тг (б01) = 3 2 *, <
Xi\H ~~ расстояние между ящиками it и i\.
Выбор ящика im зависит от длины пути xir]
пройтп робот, чтобы подойти к ящику tm.
= min [&(<£'")], где %№*")-*,м + 3 2
который должен
Поэтому h[6oA=*
Легко видеть, что если
задача состоит в сборке т
ящиков, то исходная теорема
D -+■ 0О является 2(m~D-
шаговой. При построении
дерева редукций с корнем
Уп ооозначим через (V
вершину, которая
формируется на 1-м шаге редукции
(/=1, ..., 2*1-2).
Таким образом, сукцедент
фиксирует сборку /,
ящиков, начинающуюся с
im-vo ящика. Сукцедент 6^i*m
фиксирует сборку /2
ящиков и требуемое положение робота для перехода к *2-му ящику.
Продолжая далее, получим, что 6?j,™, и 02& т (& — lt 2, ♦ .., т— 1)
*) Напомним, что направление доказательства противоположно
направлению редукции, т. е. сборка начинается с fm-ro ящика, а ее
формирование — с i2ro ящика.
ah1™
Рис. 8.9, Представление задачи
«сборка ящиков роботом».
§83 АЛГОРИТМ ПОИСКА ГОРИЗОНТАЛЬНЫХ ДОКАЗАТЕЛЬСТВ
167
фиксируют сборку lk+i ящиков и требуемое положение робота
соответственно для переноса 1*+гГо ящика или перехода к нему.
Так, например, при m = 3, ti = 2 и гт = 3 (см. рис. 8.9) Bj23 ==
^ МЕСТО (ЯЩ-3, В) МЕСТО (РОБОТ, Я), где /2 = {ЯЩ-3), и
66^
450 44Ъ
54Ь 72Л
а)
в
61° еа
0
640 в0
Iff-перетащить
Щ-1хЩ-2
О
20-перетащить
Щ-ЗкЩ-2
отЯЩ-2
W-перетащить Щ-t
/г Щ-2
ff-тШт /гЩ-7
V
Рис. 8.10. Поиск оптимального доказательства: а) предварительная оценка
места сборки; б) предварительная оценка выбора последнего ящика;
в) предварительная оценка последовательности действий робота; е)
оптимальное решепие (последовательность действий робота).
МЕСТО (РОБОТ, В) задает требуемое положение робота для
перехода к ящику 1г = ЯЩ-1.
Для оценки вершины 0j введем эвристические функции
£(el&)-3 S *чч+ *«i«*+l.
4SIk+i
где к= 1, ..., те- 1.
Для данной задачи сборки т ящиков можно получить точную
оценочную функцию h в следующем виде:
А(80) = т1п [*(#)],
1G8
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
где
йВД^М^ + З 2 Xift и &($!)= min (лг1да —o;il4TO);
*(#) = min[A(eJ,,",)]1
где
л(во1т)в(*1т-*м«) + 3 2 *<л;
А(в11'ж)-(*,„-*,,,„,)+ 3, | *iA,
где t=l, 2, .,., т~1,
Принимая, что для рассматриваемых задач xim — а^^^О,
получим А(0)<А(О). Следовательно, алгоритм направленного
перебора в нашем примере является допустимым.
На рис. 8.10 отражен процесс и результат поиска
оптимального доказательства с помощью допустимого алгоритма
направленного перебора, рассмотренного ранее. Цифры при вершинах
указывают значения соответствующих эвристических функции.
То, что получено оптимальное доказательство, легко проверить,
используя точную оценочную функцию h.
§ 8.4. Доказательство разрешимости
Рассмотрим леммы, следующие из алгоритмов поиска
доказательств в теории S.
Лемма 8. Пусть горизонтальная секвенция Di ->- Ei (/е{1, 2})
определена в теории Sh Рассмотрим любой путь в
секвенциальном дереве, полученном из секвенции D3 -*• Е> с помощью правила
52i, п и описанного алгоритма поиска горизонтальных
доказательств. Каждая собственная аксиома, полученная при
означивании переменных соответствующей схемы аксиом, входит в этот
путь только один раз, и число таких аксиом конечно.
Лемма 9 *. Пусть вертикальная секвенция DH -> D1'2 (jh j2 s
е{1, 2}, ]хФ]г) определена в теории 512. Рассмотрим любой
незамкнутый путь в секвенциальном дереве, полученном в 512
снизу вверх из исходной секвенции D31 ->■ D*2 с помощью правил
Rx— /?7 (см. стр. 125) и описанного алгоритма поиска
вертикальных доказательств. Список tt, ..., tP термов, активированных на
этом пути, конечен и содержит все индивиды первого порядка
антецедента D4 теоремы D3l->Dl2-> все новые переменные 6,
§ 8.4. ДОКАЗАТЕЛЬСТВО РАЗРЕШИМОСТИ
1G9
введенные с помощью правил Л6а и R1Q и, следовательно, все
термы каждой секвенции данного пути, и только их. Каждое выра-
oicenue любой секвенции данного пути используется при этом как
главная формула только один раз.
Лемма 10*. Пусть вертикальная секвенция D^-^D4
определена в теории Si2. В секвенциальном дереве, построенном из
секвенции Dn~-*D32 с помощью правил /?4—/?7 и описанного
алгоритма поиска вертикальных доказательств, любому
незамкнутому пути соответствует контрпример для Dn->D12, задаваемый
антецедентом D4.
Доказательство. Пусть па данном незамкнутом пути
встречаются секвенции А0 -*- А0, ..., А* -** Л/, где А0 -* Л0 —
исходная, нижняя секвенция D3l-+D72. Пусть UA и UA —
объединения соответственно всех антецедентов и сукцедентов секвенций
До -+ Л0, ..., At -* Ль Покажем, что выражения из иД должны
иметь значепия «истина», а все выражения из 1)Л — значения
«ложь».
Поскольку данный путь не замкнут, логические аксиомы
вида Ви А -> Вг, А на нем отсутствуют, т. е. никакое
выражение А не входит одновременно в 1)Д и 11Л. Отсюда следует, что
при задапыой (с помощью DiJ интерпретации все атомы из 11Л
ложпы, а из иД истинны, другими словами, имеют нужное
значение. Мы покажем, что при этой интерпретации все выражения
из UA будут истинны, а из UA ложны, т. е. тоже примут
нужные значения.
Предположим обратное. Тогда мы можем выбрать среди ложных
выражений из UА и истинных из UA выражение G, не имеющее,
таким образом, нужного значения и содержащее наименьшее
число (не менее одпого) вхождений логических операторов. В силу
леммы 9 * выражение G используется в качестве главной
формулы. Если G не связано с правилами V -> или -^3, то
рассмотрим боковую формулу Я (или боковые формулы 77 и /),
соответствующую G,
Ввиду нашего выбора правил (см. лемму 1 *), если формула
И (или Н и /) имеет нужное значение, то этого достаточно, чтобы
и G имела нужное значение. Но так как G является выражением
с минимальным числом операторов среди выражений, не имеющих
нужного значения, а Н (или // и /) содержит меньшее число
операторов, чем G, то II (или Н и /) имеет нужное значение.
Поэтому такого выражения G не существует, если только оно не
связано с правилами V -> или -> 3.
В последнем случае в силу леммы 9* выражение А(г)
встречается как боковая формула для каждого из tu ..., tP в качестве
г« Но эти термы являются именами ипдивидов, задаваемых в D3K
170
ГЛ. 8. РАЗРЕШИМОСТЬ ТЕОРИИ РЕШЕНИЙ
Поэтому G должна получить нужное значение в силу того, что
нужные значения имеют все боковые формулы A(tl)1 ..., A(tp)f
что также противоречит исходному выбору G. Доказательство
окончено.
Пусть теперь с помощью правил R{—-/?7 мы начинаем строить
из D7l->D^2 секвенциальное дерево. Последовательность шагов
вдоль любого пути указывается алгоритмом поиска в 512.
Поступим так: если дерево имеет ветвление, то различные пути
достраиваются до одного и того же уровня одновременно. Возможны
следующие случаи.
Случай 1. Для некоторого п каждый пут> обрывается и
закрывается после построения не более чем п вершин. Тогда
дерево замкнуто и конечно (имеет максимум 2п~1 вершин).
Интерпретация, задаваемая D7i, не представляет контрпримера, т. е.
|- jyi _> £)h9
Случай 2. Для некоторого п существует открытый путь,
обрывающийся в д-й вершине. Тогда по лемме 10 * интерпретация,
задаваемая DJi, представляет контрпример для Z)?1->D?2.
Только конечное число термов £lf . ♦., tP активировано на
обрывающемся пути.
Лемма И*. Для вертикальной секвенции Z>u->jD?2,
определенной в теории 512, интерпретация, задаваемая D31, либо
представляет, либо не представляет контрпример. В последнем случае
существует конечное -замкнутое секвенциальное дерево.
Доказательство леммы следует непосредственно из лемм 1 *,
9 * и 10 *. Теперь мы в состояпии сформулировать и доказать
основную теорему.
Теорема 10. Теория решений S разрешима.
Доказательство. Для теорий S} (/=1, 2) алгоритм
поиска доказательства георем для каждой наперед заданной и
определенной в Si горизонтальной секвенции D* -+■ Z?j всегда дает одно-
значпый результат: либо она доказуема, либо недоказуема.
Согласно лемме 8 этот алгоритм поиска конечен. Отсюда следует, что
теории Sj разрешимы.
Для теории Sx2 согласно лемме И* алгоритм поиска
доказательств теорем для каждойнаперед заданной и определенной в S,2
кертикальиой секвенции Du-* D'2 всегда дает однозначный
результат: либо она доказуема, либо недоказуема. Согласно лемме
9 * и конечности замкнутого дерева этот алгоритм конечен.
Отсюда следует, что теория Si2 разрешима.
Из разрешимости теорий Si, S2 и Si2 следует разрешимость
теории S. Таким образом, в теории S всегда разрешим вопрос:
«доказуема или пет определенная в S диагональная секвенция
ГЛАВА О
АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ
В РЕШАТЕЛЕ ЗАДАЧ
§ 9.1. Введение
Мыслительная деятельность РО интеллектуального решателя
виждется, как уже отмечалось, на двух китах: знаниях и
комплексных стратегиях поиска решений. Знапия включают
фреймы, стратегии — эвристики. В свою очередь, в свете теории
решений S фреймы составляют основу ее аксиоматики, а эвристики —
основу соответствующих правил вывода и алгоритмов
направленного поиска горизонтальных и вертикальных доказательств.
Теория S* *= (S\t Si2,S\y РО *-го ранга рассматривается
как теория аксиоматизируемого мира вадач Мг = <A/J, M\, Ml).
Прагматическая направленность деятельности РО состоит в том,
чтобы эффективно решать задачи в мире МJ, используя для
этого знания о мирах Мх и М\ и алгоритмы поиска решений в них.
Обычно для хорошо изученных или сравнительно простых
миров построение соответствующих аксиоматических теорий S*
не представляет проблемы. Она возникает, когда РО оказывается
в новом для себя мире. В этом случае прежние знапия
(аксиоматика) и локальные принципы стратегии поведения (правила
вывода) могут оказаться непригодными, что незамедлительно
потребует формирования новой аксиоматики и новых правил
вывода РО применительно к новому миру.
В дальнейшем приобретение новых знаний (формирование
повых аксиом) мы будем связывать с обучением РО, а
построение новых форм целенаправленного поведения с использованием
приобретенных знаний (формирование повых правил вывода) —
с адаптацией РО.
В настоящее время нет достаточно стройной теории
автоматизированного обучения и адаптации интеллектуальных
решателей. Ограничимся рассмотрением проблемы автоматизированного
обучения интеллектуальных решателей применительно к одному
классу задач, а именно задач автоматического формирования по-
J 72 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
нятий, представляющих замкнутые формулы логики L^ (см.
§ 6.1).
Учение о понятиях является разделом математической
логики [Е. К. Войшвилло, 1967]. Понятие обычно определяют как
одну из основных форм мышления, приобретаемую в результате
перехода от чувственной ступени познания к абстрактному
знанию. В теории решений S понятие А выражает некое
утверждение о статической структуре, представляющей некоторую
абстракцию реального мира и понимаемой в духе теории моделей
[Робинсон, 1963]. Примерами подобных понятий могут служить
такие утверждения, как «у белых матовая позиция»
применительно к шахматам, «имеет место аварийная ситуация»
применительно к энергосистемам и другие.
Необходимо напомнить, что формула А логики Li2 замкнута
относительно своих перцептивных переменных и одновременно
с этим свободна относительно своих рефлексных переменных х%
например ситуаций. Это позволяет поппмать А (х) как
пропозициональную функцию от х.
Всякое" понятие имеет содержание и объем. Содержание
понятия А — это совокупность базовых отношений, используемых для
синтаксического описания формулы А. Объем понятия А—это
множество всевозможных ситуаций, обобщенных с помощью
данного понятия.
Чтобы различать формулу А как пропозициональную функцию
А(х) от А как понятия, введем для последнего обозначения хА(х),
а для объема понятия — обозначение WxA(x). Понятие в
некотором смысле обратно пропозициональной функции. Для функции
А (х) областью определения является множество значений х, а
областью значений — множество утверждений. Иначе говоря, эта
функция соотносит каждому значению х утверждение А{х),
истинное или ложное. Понятие хА(х) соотносит каждому
истинному утверждению А(х) соответствующую ситуацию х. Областью
определения понятия является множество истинных утверждений
А(х), а областью значений — множество ситуаций х, для которых
истинна А(х).
Одним из основных законов в теории понятий является закон
обратного отношения [Е. К. Войшвилло, 1967]. Согласно этому
закону, если объем одного понятия составляет часть объема
другого, то для содержания этих понятий имеет место обратное
соотношение, т. е.
WxA (x) a WxB (х) & У/х {А (х) zd В {х)), (9.1)
где => — знак импликации.
Этот закон необходимо понимать следующим образом. Объем
WxA{x) понятия хА{х) считается меньше объема WxB(x)
понятия хВ(х), если всякий элемент WxA(x) есть одновременно эле-
§ 9 1 ВВЕДЕНИЕ
173
мент WxB(x), no не наоборот. Отпошепия между содержаниями
понятии, такие как «часть», «шире», «уже» и другие, связываются
с количеством содержащейся в понятиях информации. Исходя из
интуитивных представлений, естественно считать, что если
утверждение В следует из утверждения 4, то информация в В
составляет часть информации в Л. Это и означает, что содержание
понятия хВ{х) составляет часть содержания понятия хА(х).
Над объемами понятий как над множествами определены
теоретико-множественные операции пересечения, объединения,
дополнения н разности:
WxA(x) П WxB(x) = Wx(A(x)&B(x)), (9.2)
WxA(x) U WxBix) = Wx(A(x)V B(x))y (9.3)
(WxA(x))' ~Wx(A(x)),
WxA(x)\WxB(x) = Wx(A(x)&B(x)).
Из выражений (9.2) и (9.3), используя закон (9.1), легко
получить соответствующие соотношения для содержания понятий:
Vx(A(x)&B(x)=>A(x)),
Vx(A(x)zd(A(x) \/ B(x))),
т. е. содержание понятия х(А(х) &В{х)) больше содержания
понятий xAix) или xBix), а содержание последних в свою очередь
больше содержания понятия х{А(х) VВ(х)).
Построение общего понятия путем исследования его частных
примеров представляет индуктивный вывод, который
существенным образом отличается от дедуктивного вывода. Остановимся
на этом различии более подробно, используя работу Пойа [1954].
Индукция есть выведение общего закона из частных случаев,
дедукция, напротив, есть выведение частных случаев из общего
закона. Индуктивный подход имеет целью согласовать наши
знания с нашим опытом, дедуктивный подход имеет целью
использовать наши знания для объяснения нашего опыта, наших
наблюдений.
Лежащее в основе дедуктивного вывода доказательное
рассуждение надежно, неоспоримо и окончательно. Лежащее в основе
индуктивного вывода правдоподобное рассуждение рискованно,
спорно и условно. Доказательные рассуждения сами по себе
неспособны давать существенно новые знания об окружающем
мире, это прерогатива правдоподобных рассуждений. Накопец,
дедуктивный вывод в аксиоматической теории формализован в
высшей степени: четко определены и заданы аксиомы и правила
вывода. Индуктивный вывод в лучшем случае можпо представить
в виде процедуры. Возможность построения каких бы то ни бы-
174 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
ло универсальных правил индукции в настоящее время
представляет проблему.
Схема индуктивного вывода обычно следующая: вначале мы
подмечаем сходство в нескольких примерах, затем обобщаем его
на все такие примеры. Таким образом, обобщепие есть переход
от рассмотрения данного множества объектов к рассмотрению
большего множества, содержащего данное. Сформулированное
предположение (понятие) ни в коей мере не является доказанным,
оно является лишь попыткой подойти к истине. Поэтому
полученное предположение необходимо испытать. Для этого
используются контрольные примеры. Если они не подтверждают
предположения, последнее отвергается. Если же подтверждают, то это
еще не доказательство, а лишь благоприятный признак, делающий
предположение более правдоподобным.
В дальнейшем мы рассмотрим класс задач обучения,
характеризуемых автоматическим формированием понятий,
описываемых замкнутыми формулами исчисления предикатов первого
порядка [Е. И. Ефимов, 1979]. Некоторые другие возможные
подходы и постановки задач обучения будут рассмотрены в третьей
части книги на примерах конкретных решателей.
§ 9.2. Постановка задачи автоматического обучения
формированию понятий
Остановимся на проблеме автоматического формирования схем
аксиом теории Si2 вида ->■ В2 ■<=*■ А, представляющих собой
фреймы. В этих схемах рефлексный атом В2 но существу является
наименованием понятия А, представляющего собой замкнутую (по
перцептивным перемештым) формулу исчисления предикатов
первого порядка. Таким образом, проблема автоматического
формирования аксиоматики теории Si2 сводится к проблеме
автоматического формирования вышеуказанпых понятий А.
Эти понятия могут быть представлены в предваренпой форме
А (Х41, .. ., Xin) « (Игх1х €= Хч) . .. (Цд*ц €= Xin) С (xiv .. ., xin)f
где ( Н1^{1 е Xix) .. . (НнЯц е Xiu) — тг-местный префикс и Щ
является либо квантором всеобщности V, либо квантором
существования 3, Х^ — рефлексные переменные, обозначающие
укрупненные объекты, и С — матрица (бескванторная логическая
функция) в копъюнктивно нормальной форме (КНФ).
Ранее (см. § 6.1) упоминалось, что выражение А в схеме
аксиом -*• В2 <=*• А теории S12 представляет собой формулу логики
L12, которая строится из литер логики L{ с помощью таких
логических операторов, как кванторы V и 3, отрицание —,
конъюнкция &, дизъюнкция V и импликация =>. Мы всегда будем иметь
дело с Л, записанной в виде предваренной формулы, матрица ко-
§ 9 2. ПОСТАНОВКА ЗАДАЧИ АВТОМАТИЧЕСКОГО ОБУЧЕНИЯ 175
торой имеет КЫФ. Подобное допущение не является
ограничительным, так как всякую формулу исчисления предикатов
первого порядка всегда можно привести к предваренной форме, а
всякую пропозициональную функцию представить в КЫФ.
Весьма типичным приемом формирования понятия является
обучение на наглядных примерах и контрпримерах.
Действительно, во многих случаях учитель не может передать ученику
понятие хА(х) в виде готового, четкого описания А(х), которое
позволило бы ученику эффективно обобщать ситуации. Поэтому ему
ничего другого пе остается, как привести ученику множество
примеров и контрпримеров для этого понятия.
Ученик, используя эти данные, строит, оставаясь, так же как
и учитель, на интуитивном уровне, свое собственное понятие
хА'(х), которое по эффективности может оказаться хуже, таким
же или даже лучше, чем понятие хА(х) учителя.
Если в роли ученика выступает решатель, т. е. машина,
которой задается формализованный язык и обучающая выборка, то
теперь уже он должен построить формальное описание понятия
хА(х), с которым может ознакомиться и которое может при
желании позаимствовать любой человек. Таким образом, в данном
случае знания решателя приобретают более общую, абстрактную
ступень познапия.
В мировой литературе вопросам обучения распознаванию
образов посвящено много работ (см., папример, библиографии
Минского и Пейперта [1969] и Ханта [1975]). Однако большинство
из них использует так называемый статистический подход, в
основу которого кладутся различные методы формирования
эффективных статистических критериев классификации
распознаваемых объектов [Бут, 1962; Розенблатт, 1962; В. Л. Браиловский,
1964; Ю. Л. Барабаш, Б. В. Барский и др., 1967]. Гораздо
меньшее число работ можно отнести к интеллектуальному обучению:
[Хаит, Марин и Стоун, 1966; Амарел, 1966; М. М. Бопгард, 1967;
В. П. Гладун, 1977]. '
Следует отметить, что в нашем случае речь идет пе о
классификации ситуаций — одна и та же ситуация может входить в
объем различных понятий, а скорее об оценке ситуаций в
определенном аспекте, выражаемым данным понятием.
Построение понятия A (Xiv ..., Xin) будем осуществлять путем
задания его примеров и контрпримеров. Эти примеры и
контрпримеры будем представлять в виде ситуаций s1 и 5° соответственно,
в которых укрупненные объекты Х<£ и отношение А между ними
заданы неявно через объекты Xj+ e Х-* и отношения между
ними, т. е. через подструктуры ситуаций..
Пусть решателю для некоторого понятия А задана
обучающая выборка с помощью множеств М{ = U1} и М° = U0} примеров
176 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
и контрпримеров соответственно. Пусть также для каждого п
{п = 1, 2, ..., N) в решатель вводится множество $Фп базовых п-
местных отношений ап, представленных в виде логических
сопрограмм и определенных па объектах х^ в ситуациях s е= M, где
М = М1 U М°. Последнее означает, что для каждой сопрограммы
в любой ситуации s&M найдется хотя бы одна тг-ка х\{. ..#1пиз
объектов соответствующего сорта, связанная или не связанная
отношением ап.
В процессе обучения решателю необходимо, используя
вышеуказанные логические операторы, построить из сопрограмм
такую сложную Л-программу, которая, будучи примененной к
любой ситуации s<^M, давала бы результат ИСТИНА, если s ^ М\
и результат ЛОЖЬ, если s&M0. Легко видеть, что указанную
задачу обучения равно успешно можно трактовать и как задачу
структурного обобщения ситуаций, и как задачу выявления в
заданных ситуациях определенных подструктур, и как, наконец,
задачу оценки ситуаций по наличию в них определенных
подструктур.
Следует также добавить, что решение поставленной задачи
обучения усложняется еще и тем, что в ходе ее решения
необходимо в каждой ситуации s& M выделять объекты х^ и
содержащие их укрупненные объекты Х^. В этом смысле ситуации
s & М несут «шумы».
§ 9.3. Основные положения и определения
Обозначим n-меетный префикс (Hi^ ^ ^ч2) •. • (^n^in ^ ^Чп),
где U ¥* ^ при v Ф ц, через Пп и рассмотрим его свойства *).
Каждый /г-местиый префикс П характеризуется определенным
распределением по его п местам переменных Х\^ и кванторов Н|.
Всевозможные сочетания указанных двух распределений
порождают пространство префиксов Легко подсчитать, что мощность
такого пространства равна гс!2п, где п — местность префиксов.
Пространство префиксов будем представлять как множество
подпространств, каждое из которых характеризуется
определенным /г-местиым распределением переменных х^ и содержит 2п
тг-мсстг.ых префиксов. Это пространство удобно представлять в
виде несвязанного графа, состоящего из п\ компонент связности,
а каждую компоненту — в виде двухполюсного подграфа G,
вершины которого отождествляются с определенными префиксами,
а дуги характеризуют их смежность. Каждый такой подграф
характеризуется заданием фиксированной строки (заданием после-
*) В дальнейшем для удобства будем использовать запись П =
§ 9.3. ОСНОВНЫЕ ПОЛОЖЕНИЯ II ОПРЕДЕЛЕНИЯ 177
дователытости п переменных)^, ...yain и одним из двух (либо
V#ix ... V#in, либо 3xin .. ♦ 3xix) полюсов, остальные его
вершины порождаются процедурно. Для этого с каждой вершиной П
подграфа G свяжем вес р, определяемый согласно формуле р ^
п
*= 2 Pii где
J1, если на £-м месте стоит квантор V|t
^ "" [О, если на £-м месте стоит квантор 3^.
Например, для П = ЗхУ/уУ/z вес рж5. Очевидно, полюс,
содержащий только кванторы V, имеет максимальный вес рта**^
— w(n+l)/2, а полюс, содержащий только квапторы Э, имеет
минимальный вес /Wn = 0. Таким образом, все промежуточные
вершины подграфа G имеют веса р в интервале [pmim /wl.
Величина веса р не зависит от последовательности переменных
строки #ij_ .. • Хгп и в общем случае неоднозначно связана с
распределением Hfc no n местам. Например, 3#3*/Vzh \lxiz3y,
принадлежащие, как будет показано в дальнейшем, одному
подграфу, имеют одинаковый вес р = 3.
Чтобы увеличить (уменьшить) р на единицу с помощью одного
преобразования, необходимо либо на первом месте заменить 3
на V (V на 3), либо поменять местами V|_i и 3| (3| и V|+i),
т. е. сдвинуть V на одно место вправо (сдвинуть V на одно
место влево).
Преобразования, связанные с единичным изменением р,
назовем элементарными преобразованиями префиксов. Будем
считать, что П4 и П2 представляют собой смежные вершины
подграфа, если они могут быть преобразованы друг в друга с помощью
одного элементарного преобразования, а префиксы П4 и П2
принадлежат одному пути подграфа, если между ними существует
хотя бы одна однонаправленная цепочка из смежных вершин,
вдоль которой вес р изменяется монотопно. Очевидпо, любой путь
подграфа G проходит через его полюсы.
Вышеуказанные определения подграфа, его смежных вершин
и путей позволяют однозначно характеризовать принадлежность
любой пары вершин lit и П2 к одному подграфу. Например,
Пх = V,7/3^3^Vz и П2 = Vz^V*/Vz3£ могут быть одионаправ-
лентто преобразованы в любую (из двух) полюсную вершину,
например, в V-rV^Vf/Vz, т. е. принадлежат одному подграфу
G, но не могут быть одпопаправлептто преобразованы друг в
друга, т. е. не лежат на одпом пути G. Аналогичные рассуждения
показывают, что префиксы П, = \fy3u3xVz и П2 = >tu4z\fy3x
не принадлежат одному подграфу: Hi преобразуется в VtfVuVi/Vz,
а П2 — в VzVuVzVi/. Введение веса р задает строгий порядок
на пути подграфа, что позволяет с помощью алгоритма элемеи-
*2 Е. И. Ефимов
478 ГЛ 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
тарных преобразований построить по заданному полюсу
подграф G и организовать направленный перебор его вершин.
Каждому варианту выбора значений переменных х^,
входящих в П под знаком 3|, в s1 e M1 будет соответствовать своя
область г\ на n-ках которой матрица С должна быть истинной.
Если префикс П вообще пе содержит кванторов 3, то указанная
область г1 является единственной в каждой ситуации s1 e Л/1.
Назовем г1 единичной областью матрицы С, а их множество в sl
обозначим через {гг}51-
Для получения аналогичных областей в ситуациях s° <= M°
поступим следующим_образом.__Возьмем отрицание предваренной
формулы ПС, т. е. (M1^il ... Hn*in) c (xi±* • • • * xin)- Так же как и
П, префикс П определяет множество {г°}*о областе11, на тг-ках
которых С должна быть истинной, а С— ложной*). Назовем г°
нулевой областью С. Таким образом, каждому префиксу П в
каждой ситуации sl <= Л/1 и 5° ^ М° соответствуют единичные
{rx}sl и нулевые {г0}" области.
Пусть нам задана предваренная формула ПС, и пусть в
каждой ситуации sl е МА и s° ^ М° выделены множества п-ок Z1 и
Z0, на которых матрица С соответственно истинна и ложпа.
Легко видеть, что для каждого s1 и s° имеет место г1 ^ Z1 и г° s Z°
соответственно, т. е. префикс П играет роль ограничения,
накладываемого на множества Z1 и Z0. Отсюда, в частности, следует,
что построение понятия ПС необходимо начинать с построения
префикса П.
Пусть нам предъявлено обучающее множество ситуаций М =
« Л/1 U М°, и пусть для каждой гс-ки z из М определены в виде
двоичных слов истинностные значения каждой подходящей
базовой сопрограммы (базового предиката). Назовем полученное
таким образом слово кодом гс-ки z. Если z e ЛГ, то это
единичный код, в противном случае нулевой. Пусть коды двух n-ок z4
и z2 совпадают. Будем считать, что Zj и z2 релевантны, если это
единичные либо пулевые коды, иначе zv и z2 противоречивы.
Назовем ситуации sl и s° противоречивыми, если они
содержат противоречивые га-ки. Для каждой sv обозначим через [sf]
(v, |i ^ {0, 1} и v Ф jli) множество противоречивых ситуаций и
назовем пару <sv, Uj1]) критической.
Пусть нам задан префикс П и связанные с ним области
{rv}nv и {г^}Пц, где sv и sj1 принадлежат некоторой критической
*) В дальнейшем в обозначения {г°}п0 мы опустим знак отрицания,
-т. е. будем писать {?'°}п01 подразумевая вышесказанное об образовании
<областей г°. s
§ 9.3 ОСНОВНЫЕ ПОЛОЖЕНИЯ И ОПРЕДЕЛЕНИЯ
17Ф
паре. Выделим области r^={rv}sV и г* & {г*} ц- Назовем г" и i*
противоречивыми, если они содержат противоречивые л-ки, в
противном случае это допустимые области. Область rv назовем
запретной по префиксу П, если в данной критической паре
найдется ситуация sf такая, что любая ее область г** противоречива
7,v, в противном случае f допустима. Пусть также множество
{rv}sv запретно по префиксу П, если запретна любая его
область rv, в противном случае это множество допустимо. Наконец,
будем считать, что префикс П запретен на критической паре
<sv, U^l) тогда и только тогда, когда множество {rv}s\ будет
запретно, в противном случае указанный префикс является
допустимым на этой критической паре. Префикс, запретный на
какой-либо критической паре, вообще является запретным.
Назовем переменные, входящие в префикс П под знаком
квантора 3, управляемыми, а под знаком V — неуправляемыми.
Очевидно, что. каждая область г1 (г°) образуется путем задания
фиксированной комбинации значений управляемых
(неуправляемых) переменных.
Пусть задапы префикс П и тем самым {гх}8\ и {r°}s0 для
каждой sA е М1 и s° & М°. Из каждого {г1}^ Гили {г0}^)
выберем по одной области и обозначим их объединение через Я1
(или /?°). Очевидно, Я1 е {Rl)u и R0 е* {/?°}п представляют собой
множества соответственно единичных и нулевых я-ок. Другими
словами, при фиксированной паре СД1, Д°> матрица С должна
быть истинной на каждой z'eff и ложной на каждой z° <з Д\
Если это так, то соответствующая формула ПС является
решением задачи обучения. Очевидно, префикс П запретен, если для
него запретна любая пара <R\ Д°>. Назовем R* и R0 для
соответствующего допустимого префикса соответственно единичным
и нулевым кодами матрицы С.
Множества кодовых вариантов {/?!>п и {R°)u удобно
представлять в виде кодовых графов #2Г и 52°, строящихся следующим
образом. Берется очередная ситуация si ($°) и в ней фиксируется
очередная £-я комбинация значений неуправляемых
(управляемых) переменных. Для каждой такой комбинации составляются
всевозможные комбинации значений управляемых
(неуправляемых) переменных. Полученные таким образом /i-ки составляют
Ни ярус ситуации s4 (s°). Область г1 & {r1}1^ (r°e{r°}*i)
определяется следующим образом: необходимо составить путь,
проходящий через одну гс-ку каждого яруса s1 (s°), таким образом,
чтобы сохранялась последовательность значений управляемых
(неуправляемых) переменных. Так, например, если П начинается
12*
180 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
с 3xlv то указанная последовательность для sl должна
содержать только одно значение переменной xiv Выполнив подобные
операции для каждой s\ (s°) и соединив каждую вершину
последнего яруса данной ситуации с каждой вершиной первого
яруса следующей ситуации, получим m-яруспый граф ЯР Ш°)
допустимых кодовых вариантов Д1 (Д°).
Ярусы, имеющие п-ку z с одинаковым кодом, образуют по z
класс релевантности. Если принять, что каждая гс-ка' релевантна
самой себе и по этой причине класс релевантности может
содержать единственный ярус, то один и тот же ярус может входить
в несколько классов релевантности. Каждой z однозначно
соответствует свой класс релевантности, обратное в общем случае
неверно.
Будем измерять длину пути в графе 521 Ш°) числом его
вершин. Назовем путь Ду в графе $? полным, если он пересекает
все его ярусы, т. е. имеет длину т. Назовем путь Дтт в графе
$i минимальным по длине, если он проходит через один ярус
каждого класса релевантности. Любой путь Д cz Rm in назовем
тупиковым. Кодовый граф i%min> содержащий только
минимальные пути, назовем минимальным.
Матрицу С мы будем представлять в КНФ, содержащей
множество коыъюнктивно связанных дизъюнктов (d), число которых
определяет длину С. Будем считать, что матрица С при
заданном П разрешима на паре <Д\ Д°>, если имеет место
(\fz1^R1)(y/d^C)[d{z1) есть ИСТИНА] &
& (Vz° е= Д°) (3d €= С) \d (а0) есть ЛОЖЬ ].
Как видно, такое определение, пе исключая избыточности С,
тем не менее указывает на то, что мощность |ДМ ограничивает
длину \С\ сверху, а |Д°| —- снизу. Под неразрешимостью С при
задапиом П будем всегда иметь в виду случай, когда
(V*1 е= Д1) (Vd e= С) [d (z1) есть ИСТИНА] &
&(3zQ<z=>R°)(\fd<=EC){d(z0) есть ИСТИНА].
Пусть D = {dt} —- полное множество дизъюнктов, из которых
формируются всевозможные матрицы. Пусть также для
некоторого допустимого префикса задан код <Д\ Д°>. С этим кодом
свяжем: CmQX — матрицу максимальной длины, истинную на
любой з'^Д'; Cmln — матрицу минимальной длины, ложную на
любой z° ^ Д°. Заметим, что ^тах? в отличие от (•ипп) всегда
единственная для каждого кода <R\ Д°>.
Из определения Стах и Сгат следует, что любая матрица С s
s Cmax истинна на любой z1 e Д1 и любая матрица С, для
которой имеет место Cmln s С, ложна на любой z° e Д°.
§ 9.4. ТЕОРЕТИЧЕСКИЕ ОБОСНОВАНИЯ АЛГОРИТМА ОБУЧЕНИЯ 181
Рассмотрим возможные случаи.
1) Ст1п с: Сгаах. В этом случае существует множество
разрешимых на <R\ Я°> матриц С, удовлетворяющих условию Cmm —
sCs Cmax. Оптимальной является матрица Crain.
2) Cmin = Cmax. В этом случае существует единственная, она
же и оптимальная, матрица С, разрешимая на </?*, /?°>.
3) Cmin ^ Сгаах. В этом случае не существует разрешимой
матрицы С.
Если теперь изменять код <Я\ Л°> путем включения или
исключения соответствующих и-ок, то возможны следующие
случаи:
увеличение 7?1 (Д°) уменьшает Стах (повышает Cmm), что
чревато возникновением CmlnS£Cmax;
уменьшение Д1 (Я0) увеличивает Стах (уменьшает Сга1п), что
благОПрИЯТСТВуеТ ВОЗНИКНОВеНИЮ Cmin s Cmax-
Каждая se Л/ содержит объекты определенного сорта. Будем
тип п-ки определять сортностью ее объектов. Очевидно, Я1 и /?°
должны содержать га-ки одного и того же типа. Это
обстоятельство позволяет ограничить пространство поиска решении задач
обучения.
Пусть Ti — множество сортов в ситуации s< е М. Назовем
Т = П Т{ ядром. Для каждой Si & М определим тгт,,- как число
цеМ
объектов сорта т^Ги введем соотношение
N = 2 пт, (9.4)
т<=г
где пт = min wx,j. Назовем N верхней грапицен местпости
ИСКОмого префикса.
Рассмотренные выше основные положения и определения в
следующем параграфе будут существенным образом
использованы при доказательствах теорем, па основании которых будет
построен алгоритм обучения решателя формированию понятий.
§ 9.4. Некоторые теоретические обоснования
алгоритма обучения
Связь веса р префиксу П с его областями г1 и г°
устанавливает следующая лемма.
Лемма 12, Пусть П, и П2 принадлежат одному пути подграфа
и p{T\z) > p(lli). Пусть также Ylt и Г12 образуют для
произвольной ситуации sl e M1 (s° е М°) множества (г}}а1 и {гЦ ^
(i^ilsO1 u ir2}s02)' Тогда для любой ситуации sx (s°) имеем
Vrl3rl[rjsr?] (Vr?3r2°[rSsr?]).
182 ГЛ 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
Доказательство. Воспользуемся индукцией по длипе
пути подграфа. Рассмотрим вначале случай ситуации s* & Л/1.
Пусть П, и П2 образуют смежные вершины подграфа. Тогда
возможны лишь два случая:
а) П, = 3^,11 и П2= Vx4Il;
б) н^н'у^Зх^гг и nf»n'3*u+1v*4rr.
Рассмотрим случай а). Пусть подирефикс П содержит
кванторы V|t, V|2, ..., Vfcm, неуправляемые неременные которых
имеют соответственно пи n2t ..., пт значений. Тогда любая область
rje(rj|<4l2 порождается определенным вариантом распределения
по п9 X пх X пг X ... X Пт л-кам значений управляемых
переменных, где щ — число значений переменной xiv С другой стороны,
для каждой Гг всегда найдется область г] ge (г}}а1\ порождаемая
определенным, одним значением переменной x{l и тем же
самым вариантом распределения значений остальных управляемых
переменных по nt X п% X ... X пт и-кам. Так как всякая область
г\ содержит /1-ки с каждым значением переменной xiv а
соответствующая ей область г\ содержит я-ки только с одним зпа-
чением этой переменной, то r\ ^ г\.
Рассмотрим случай б). Префиксы Hi и П2 содержат
одинаковое число кванторов V с одними и теми же переменными,
следовательно, любые Г] и г2 имеют одинаковую мощность.
Сопоставляя с каждой областью г2 область ги характеризуемую
одним и тем же значением а^£+1для каждого значения ач, получим
г1 — г1
Таким образом, утверждение леммы 12 справедливо для
любой пары смежных префиксов. Сделаем индуктивный шаг: пусть
утверждение леммы справедливо для таких (П4, П2) и (П2, П8),
что имеет место р(П2) — pilli) в т (т>1), т. е. (1)
Уг1Эг] [r\ S г21]. Покажем, что лемма справедлива и для пары
(П,, Па) такой, что имеет место pffi*) — р(И{) = т + 1.
Поскольку /?(П8) — р(П2) *= 1, имеем: (2) Vrj3rl[ri<=rS].
Из (2) и (1) непосредственно следует VrJSr] [r\ sr£].
Нам осталось доказать лемму для случая ситуации s° e Л/\
Рассмотрим отрицание П. Очевидно, для II ситуация^ 8° играет
ту же роль, что и ситуация $* для П. Но при этом р{Л{) >p(U2)»
Меняя местами нижние индексы 2 и 1 в первом утверждении
леммы, получим ее второе утверждение.
Лемма 12 показывает, что при движении вдоль пути
подграфа G направление изменения р совпадает с направлением
изменения |г4| и противоположно направлению изменения |г°|.
§9 4. ТЕОРЕТИЧЕСКИЕ ОБОСНОВАНИЯ АЛГОРИТМА ОБУЧЕНИЯ 183
Для разбиепия подграфа G на области допустимых и
запретных префиксов служит следующая теорема.
Теорема 11. Пусть на некотором пути подграфа G заданы
префиксы Hi и П2 такие, что р(П,) > р{Иг). Пусть также
<51, Uj]> (<s°, {s}}}) —- критическая пара, и пусть, наконец,
(а) либо [r\}8i ({^1во2) допустимо по отношению к множеству
{И)"о2} ({Wl*!1)). (б) либо {г}}? (И)"1) запретно по
отношению к множеству | iri'8o | ljir2l5i м« Тогда любой пре~
фикс П с весои* в интервале [/?(П2), pdii)] является для^1, [s]}}
(<s°, fsj)>) соответственно: (а) лггбо допустимым, (б) дабо за-
Доказательство. Пусть префикс П принадлежит тому
же пути, что и П4 и П2, и его вес p(U) e= lp(U2), p{Ui)], т. е.
p(Ui) — p(U) >0 и p(U) — p(U2) >0. Тогда согласно лемме 12
и двум последним выражениям имеем: для случая (а) гг^г\ и
г° £ г£ (1), для случая (б) г? £ г0 и rj г г1 (2).
Рассмотрим случай (а). Так как по условию для любого /
множества {r\)8i и М) о* (И Ко* и W} ij содержат хотя бы
одну пару непротиворечивых областей, то с учетом (1)
множества ir /81 и {г ',? (v '«° и {г hi) будут допустимыми
для любого /'. Следовательно, допустим префикс П.
Рассмотрим случай (б). Так как согласно условию для любой
области rl^{r!2)sl2 (rj e {rj}^1) найдется хотя бы одно
множество {г°}} о1 \{г\} Л» каждая область rj (г£) которого про-
тиворечит г\ (г\), то с учетом (2) указанная взаимосвязь
сохранится и для^миожеств {г1}" и {r0}^ ({r°}f0 и {г1}1^) с тем
же значением /. Следовательно, префикс П запретен, что и
требовалось доказать.
Иллюстрацией смысла теоремы 11 служит рис. 9.1. Назовем
изменения р вдоль пути подграфа G полезными, если они при
анализе допустимости префиксов не увеличивают, а при анализе
заиретности не уменьшают соответствующие области г1 и г°. Так,
согласно рис. 9.1 полезными оказываются изменения р «против
часовой стрелки» в случае (а) и «по часовой стрелке» в случае
(б) (полужирные стрелки).
Следствие теоремы И. Пусть префикс П либо допустим (а),
либо запретен (б) на критической паре <s\ (sj}> (<s°, (5]})),
184 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
и пусть либо в sl U0), либо в каждой $j (s]) k переменных Xw
имеют единственное значение. Тогда существуют полезные
изменения р вдоль пути подграфа G, которому . принадлежит П.
Доказательство. Пусть Н^ — элементарные
префиксы из П, включающие указанные переменные #|Ь Всякое
элементарное преобразование II путем изменения или перемещения
этих элементарных префиксов, очевидно, пе меняет области
определения П в ситуациях, содержащих единственное значение х\ь.
Остается только выбрать направление этих преобразований TaKt
чтобы области определения И в ситуациях, содержащих не
единственное значение х^, изменялись в нужную сторону.
г°уменьшается р(П2)
I |
I Область
1 допустимых
1 префиксов |
1 »
< А > !
p(/7f) r1 уменьшается
а)
р(П}) 7*°увеличиваемся
Н < у—*» |
J Область !
запретных !
I префиксов ,
Г1 увеличивается р(П2)
ф
р'
Рис. 9.1. Иллюстрация мнемонических правил определения полезных
изменений весов р.
Рассмотрим все возможные альтернативы ситуаций,
содержащих к переменных х^ с единственным значением. Для
альтернатив «51», «каждая s) » вес р необходимо увеличивать для
случая (а) и уменьшать для случая (б); для альтернатив «s°»,
«каждая s°j» необходимо вес р уменьшать для случая (а) и
увеличивать для случая (б).
Докажем это. Например, для альтернативы «каждая s®» при
апализе противоречивости префиксов указанное изменение р не
меняет |{^0} о) и одновременно с этим увеличивает области
г1 е (г1)^, что сохраняет противоречивость этих множеств.
Аналогичным образом доказывается полезность вышеуказанных
изменений р и для остальных альтернатив.
Таким образом, следствие теоремы И рекомендует проводить
апализ подграфа G на противоречивость, начиная с тех
критических пар, которые содержат переменные х^ с единственным
значением.
Довольно часто в задаче обучения для одпого и того же
допустимого префикса имеют место альтернативные коды </?i, ^i>
§ 9.4. ТЕОРЕТИЧЕСКИЕ ОБОСНОВАНИЯ АЛГОРИТМА ОБУЧЕНИЯ 183
ц </?.J, #2>- Отсюда возникает проблема их упорядоченного
выбора. Для этого используются следующие результаты.
Лемма 13. Пусть для некоторого допустимого префикса П
получены кодовые варианты <Л{, /??> и </?2, ЩУ такие, что
/?2 ^ #! и Rl^: /?J. Тогда, если матрица С разрешима для
кода </?{, Д?>, то она разрешима и для кода (R\, R{1}.
Доказательство. Поскольку матрица С по условию
истинна на каждой w-ке z1 e R[ и ложна на каждой тг-ке
z° <=/??, то с учетом /?" S/?? и R\^R\ непосредственно
получаем утверждение леммы.
Теорема 12. Пусть для некоторого допустимого префикса II
имеют место кодовые варианты (R\, /??> и (R\, R?z} такие, что
R\ ^ R] и R°i^ R%. Тогда (а) если некоторая матрица С
разрешима на <Л1,/?2>, то существует оптимальная матрица Сопт^
<=■ С; (б) если матрица С неразрешима на (R^ R°i}> то она
неразрешима для кодов </?}, R4) и </?£, Л5>.
Доказательство. Рассмотрим случай (а). Согласно
условию теоремы и лемме 13 матрица С разрешима на кодах
<Д}, Я?) и <Я* Я°2>, т. е. (1) CUs С s CLx и (2) C^inSCs CLx.
Переход от (R\, Rl) к коду (R\, #J> связан (см. § 9.3) с
одновременным уменьшением C'max и Cmin Д0 ^тах И Cjnin, Из (1) И
(2) следует, что Cmin <= С s Стах, т. е. Сопт с: С.
Рассмотрим теперь случай (б). Согласно условию имеем
Так Как Стах ~ Стах И CminS Cmin» TO Cm\n ^£- Стпч
и CminSSCmax» откуда непосредственно следует утверждение
теоремы.
Следующая теорема устанавливает верхнюю границу
местности искомого префикса.
Теорема 13. Пусть задана обучающая выборка М с ядром
Т = {%}. Тогда, если существует решение задачи обучения в виде
ПС, то местность п префикса 11 не превышает величины N,
определяемой согласно выражению (9.4).
Доказательство. Покажем, что код <Я\ Я°>,
соответствующий решению ПС, не может содержать индивидов сорта
т' & Т. Действительно, согласно выражению Т = f| Tx сущест-
вует ситуация su которая не содержит* индивидов сорта т', а
следовательно, не содержит таких индивидов и ее область, входящая
в код решения </?*, /?°>. Так как все области в <R\ R°> должны
состоять из однотипных п-ок, то отсюда следует, что этот код но
содержит индивидов сорта т'
186 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
Аналогичным образом установим, что код <Д!, Д°> не может
содержать индивидов сорта т^Г больше чем Ят = пип rcT|i, где
nXt i — число индивидов сорта т в $<. Действительно, из
определения пх следует, что существует ситуания sv e Л/, которая
содержит число индивидов nXtV = nx. Не более пх индивидов содержит
и ее область, входящая в <Д4, Д°>. Следовательно, искомая
матрица С может связывать не более пх индивидов сорта т, а с
учетом всех теТ — не более 2 ^т ипдивидов. Если определить N
TG71
согласно (9.4), то отсюда непосредственно следует, что местность
п матрицы С и префикса II не превышает N.
§ 9.5. Описание алгоритма обучения
В основу алгоритма положена гипотеза о том, что всякое
понятие для поставленной задачи обучения имеет почти
единственную сиптаксическую форму описания. Поэтому решение задачи
обучения должно быть связано с построением единственного
(в крайнем случае нескольких) подграфа и, следовательно, «почти
все» подграфы являются запретными. Алгоритм включает
следующие подалгоритмы:
1) фильтрация и анализ обучающей выборки М\
2) разбиение и разметка префиксных подграфов G;
3) построение минимальных кодовых графов Йтт и 5Zmin"»
4) формирование искомой матрицы С.
Рассмотрим основные принципы их построения.
9.5.1. Фильтрация и анализ выборки. Как правило, реальная
выборка М является избыточной и содержит индивиды, не
имеющие никакого отношения к искомому понятию. Подобные
индивиды необходимо исключать. С этой целью для каждой ситуации
Si& M определяется множество сортов 7\ ее индивидов, а затем
ядро Т. Согласно теореме 13 только индивиды сорта т ^ Т
должны входить в интересующие нас подструктуры ситуаций.
Поэтому все индивиды сорта г' ^ Т являются лишними и могут быть
исключены из дальнейшего рассмотрения. Если окажется, что
Т = 0у То это свидетельствует о некорректности М. Другими
словами, некорректность выборки М проявляется в том, что в
некоторых ее ситуациях отсутствует определенный сортовой
набор индивидов, выявление связей между которыми и составляет
суть задачи обучения. В этом случае необходимо либо
скорректировать некоторые s, e M, либо отказаться от решения задачи
обучения.
Одновременно с ограничением сортности цддивидов
находится согласно теореме 13 и верхняя граница возможных
изменений местности префикса искомого понятия, определяемая вы-
ft 9S ОПИСАНИЕ АЛГОРИТМА ОБУЧЕНИЯ
187
ражеиием N = ^J «т, где пх ==»minnTii и гцл — число индиви-
тег <ц<5М
до в сорта т в «<.
Анализ выборки М состоит в выявлении ее релевантных и
противоречивых мок z, заданного типа и местности. Для этого
согласно заданному набору s4n т (а11) базовых n-местных преди-
катов, где ап либо а", либо ап определяются коды каждой zs M
и затем для каждой ситуации sx & Мх («" s J/1') находится
множество противоречивых ситуаций U?l(Ujl), которое может
быть и пустым для некоторых или для всех sx (s'J). Таким
образом, находятся все критические пары <s\ (s!}|>(<.9°, |s!|>).
Путем анализа этих пар становится возможным выявление
запретных префиксов и подграфов.
9.5.2. Разбиение и разметка подграфов. Выявление запрет-
ности подграфов G является основой алгоритма обучения. Этапу
разбиения подграфа на области допустимых и запретных вершин
предшествует его выбор, направляемый с помощью процедуры
разметки подграфов, о чем будет сказано ниже.
Итак, пусть задан (или выбран) некоторый подграф G,
характеризуемый определенным «-местным распределением
я\х, xi2i • -i**,, переменных щ (h = 1, 2, . .. *п\ и^ФЬц при
£i ^ |2). Необходимо на каждом пути G получить разбиение на
классы запретных и допустимых префиксов. Очевидио,
запретный подграф содержит только класс запретных префиксов с
весами в интервале (pmm, PmaJ. Так как для заданного пути G вес
р однозначно определяет префикс, то требуемое разбиение
изоморфно разбиению интервала [рюии Pmaxh
Для иллюстрации алгоритма разбиения удобно
воспользоваться следующим приемом. Проведем две оси р* и р\ па которых
будем откладывать веса рд и р* испытуемых префиксов П0 и П»
соответственно. При фиксировапиоп критической паре <sl> U?|)
(<5°, Uj)>) вес pQ 8адает (через П§) множество |{г0} ?°1
г°}а00]], а вес р% задает (через П,) множество {{г1},!1}
{г1} НУ Выбирая (в порядке возрастания числа га-ок в sx)
очередную критическую иару <**, \$*}\У(чфи, И v» H-s{0, 1}),
мы фиксируем для скользящей точки Рок начальное положение
Рек = Ртах/2. Если критическая пара в качестве первого элемента
содержит s1, т. е. v « 1, то начальное положение опорной точки
pSh устанавливается согласно Роп= Ртах; затем в ходе поиска
скользящая точка pJK движется по дихотомическому закону влево
по оси р\ сближаясь с опорной точкой plu (см. рис. 9.2, а).
(
«
188 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
Если критическая пара в качестве своего первого элемента
содержит 5°, т. е. v = 0, то plu = ртш; затем в ходе поиска
скользящая точка Реи движется по дихотомическому закону вправо по
осп /?°, сближаясь с опорной точкой р1п (см. рис. 9.2, б). Так как
р° == р(П0) и /?i = jt?(ITi), то при вышеописанном поиске
соблюдается соотношение р(П0) — p(IIi) > 0.
п Рт
1
1
1
1
(
1
п1 < i
р * и
Ртах
«ж о
Рек
4
Рт/п
„ Ртах
рО-^г^
I
I
I
•|
I
I
/7 <
Рек
»■■■->
Ртт
i
I
I
I
I
I
i
Роп
а) б)
Рис. 9.2. Схема выбора р*к и р£п.
При фиксации каждой очередной пары точек <р°, /?*>, т. е.
фиксации испытуемых префиксов П0 и Ili, для критической пары
<«\ Ufl>(*°, Ujl>)определяются множества {г1}"1 и J{r0}JU{r0}^0
П гг'«* (Г которые проверяются на запретность. Если
запретное™ нет, то сближение точек продолжается до тех пор,
пока либо р° = /?\ т. е. П0 = П4 = П, либо возникнет запрет на
паре <р°, р1); В первом случае устанавливается характер
префикса П (запретен или допустим), во втором случае интервал
[/?°, /?1] согласно теореме 11 объявляется запретным классом.
В обоих случаях опорная точка Роп перемещается по своей оси
на середину еще не рассмотренного интервала, а начальное
положение скользящей точки Рек выбирается при этом так, чтобы
получаемая разность рСП.0) — р(П4) была максимальной. Затем
все повторяется уже с новой опорпой точкой *).
Если в результате построения разбиения дапный подграф
окажется запретным, то осуществляется следующая процедура
разметки остальных подграфов. Впачале по запретному подграфу
G с полюсом V^ix .. . V#in и весу р е [/?mm, jwl
восстанавливается префикс П е G. В кванторпом ряде этого префикса
выбирается первый справа квантор: если это V, то под ним
помещается самая правая переменная полюса подграфа; если это 3,
*) Более подробпо указанный мехаппзм разбиепия будет
продемонстрирован на иллюстративном примере в § 9.6,
§ 95 ОПИСАНИЕ АЛГОРИТМА ОБУЧЕНИЯ 180
то — самая левая переменная полюса. Затем эта переменная
исключается из рассмотрения п выбирается опять первый справа
квантор и т. д.
Например, для полюса V^Vj/Vz и р = 3 имеем VV3 или
33V, затем Vi/Vzdx или 3y3x\fz. Если в найденном
таким образом префиксе Пеб хотя бы два одинаковых квантора
оказываются рядом, то П имеет эквивалентные (в смысле*
тождественных формул логики предикатов) префиксы, полумаемые
путем перестановки выявленных одинаковых кванторов. Пусть
такие эквиваленты префикса П составляют класс Эп. Для
каждого П' е Эп способом, обратным к только что рассмотренному,
находится полюс соответствующего подграфа. Например, по
II = \fx3u3z\fy легко находится эквивалентный префикс
IT = \fx3z3u\fy и затем полюс V иУ/zV x\f у. Нее ]Ге=Эп
помечаются в соответствующих подграфах как запретные.
Указанная процедура разметки осуществляется для каждого р е
^ L/?miin Ртах ]. После произведения разметки выбирается в
качестве очередного для анализа подграф с минимальным числом
запретных префиксов.
9.5.3. Построение минимальных кодовых графов. Для
допустимого префикса П ранее описанным образом (см. § 9.3) строятся
полные кодовые графы $?\ из которых формируются
минимальные кодовые графы ^?min следующим образом:
1. Если гс-ка z лежит на всяком (в частности, единственном)
пути /?v e ^?v, то из @t удаляются все /г-ки, противоречивые z.
2. Если после операции 1 в йу возникают туники, то они
отсекаются.
Отмеченные два правила могут использоваться в любой
последовательности и неоднократно до тех пор, пока это будет
возможно. Далее, для каждой z, области г и ситуации s с учетом
вычеркнутых п-ок определяется класс релевантности таким
образом, чтобы в него входили только ярусы, содержащие п-кп
релевантные z, которые принадлежат либо той же самой области
г, либо соответствуют другим ситуациям.
3. Вычеркиваются все, кроме одной, релевантные между
собой /г-кй с одинаковыми классами релевантности.
4. Если Zi и zz лежат на всяком пути Rv ^ 3V и zx поглощает
z2, т. е. класс релевантности по z2 входит в класс релевантности
но z,, то z2 вычеркивается.
В итоге формируются минимально допустимые кодовые
графы 52min» па которых уже возможен систематический перебор
допустимых кодовых вариантов вследствие значительного
сокращения размерности исходных графов $v.
9.5.4. Формирование матрицы С. После определения
допустимого кода <R\ R°> необходимо сформировать в КНФ по
возможности минимальную матрицу С = di & dz & ... & dm, где дизъюнк-
190 ГЛ 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
1Ы di в свою очередь имеют вид di = а4| V ^^ V • •. V се^ и
«t?e j^„ представляют собой базовые n-местные предикаты <х\.у
либо OL\y Рассмотрим основные требования, которым должны
удовлетворять a, d и С.
1. Предикат af (дизъюнкт dx) допускается в качестве
кандидата на включение в дизъюнкт d (матрицу С), если не найдется
других a» (da), которые по объему га-ок на </?\ /?°> включали бы
a* (di).
2. Допустимый предикат ос (допустимый дизъюнкт d) по
возможности должен иметь «свою» n-ку гх ^ Rl (z° е Д°), на которой
он одип принимает значение ИСТИНА (ЛОЖЬ).
3. Каждый допустимый дизъюнкт должен удовлетворять
следующему условию:
(Vz1 €= Я1) (3a €= d) [a (z1) есть ИСТИНА) &
<&(3z»<=zR0)(Va€5d)\a(z(>) есть ЛОЖЬ].
Из 3, очевидно, следует условие для допустимого дизъюнкта:
(З^е- Я1) [а (г1) есть ИСТИНА] £ (3z°€~ #°)|a(z°) есть ЛОЖЬ],
отрицание которого указывает, что предикат а исключается из
рассмотрения, если он ложен на всех zx е Я1 или истинен на всех
2° 6Е Д°.
4. Искомая матрица С должна удовлетворять условию:
(V^sffJlvrfeC) ^(z1) есть ИСТИНАМ
с£ (Vz°€= Я0) (grf s С) fd(*°) есть ЛОЖЬ].
Из 4 следует очевидпое условие:
{Vz]<~Rl)\d(zl) есть HCTHHA]c6f3z0e Я0) |d(a°) есть ЛОЖЬ],
отрицание которого указывает, что дизъюнкт d исключается из
рассмотрения, если он ложен хотя бы на одной z1 e R1 либо
истинен на каждой z° е Я0.
Алгоритм построения матрицы С следующий:
Шаг 1. Согласно требованию 1 и следствию из требования3
исключаются недопустимые предикаты asin.
Шаг 2. Выбирается очередной предикат a е s^n,
удовлетворяющий требованию 2, и присоединяется к ранее полученному
дизъюнкту d (первоначально пустому); если таких а нет, то
задача не имеет решения, конец работы алгоритма.
Шаг 3. Полученный дизъюнкт d проверяется на
удовлетворение требованию 3: если d не удовлетворяет этому требованию,
то переход к шагу 2,
§9.6 ИЛЛЮСТРАТИВНЫЙ ПРИМЕР
191
Шаг 4. Область Д° сокращается путем исключения из нее
тех z° ^ /?°, на которых полученный дизъюнкт d ложей, a d
присоединяется к матрице С (первоначально пустой).
Шаг 5. Если сокращаемая область пуста, Д° = 0
(удовлетворяется требование 4), то С является искомой матрицей (конец
работы алгоритма), иначе переход к шагу 2.
В итоге формируется требуемая матрица С и, следовательно,
решение ПС задачи обучения. Если такой матрицы не
существует, то выбирается, если это возможно, другой возможный код
</?*, /?°> или другой допустимый префикс.
Следует заметить, что приведенная схема построения
матрицы обеспечивает лишь локальную оптимальность дизъюнктов
d и включающей их матрицы С, которая зависит от порядка
выбора and соответственно. В пользу указанной схемы можно
привести тот кажущийся интуитивно верным довод, что обычно
каждое понятие, в нашем случае аксиомы теории Sl2, которым
оперирует человек в процессе решения своих интеллектуальных
задач, должно иметь единственное синтаксическое описание и
что при корректном задании обучающей выборки М можно
получать единственные решения, вообще минуя оптимизацию.
§ 9.6. Иллюстративный пример
Для иллюстрации метода автоматического обучения
решателя рассмотрим пример формирования им формального описания
понятия «белые имеют проходную пешку» из области шахмат.
Пусть нам заданы обучающая выборка, представленная в форме
табл. 9-1, где шахматные позиции описаны в общепринятой
Таблица о 1
JW1
•I
,1
42
4
•1
Целые
Г4
еЗ, 14
1 сЗ
с4, d2
Черные
Ь6
Л£5, е4
Кс5, ЬЗ
d3, е7
1 i J
ЛЯ
4
•?
*°8
4
*10
Ьелые
е4
е4, g4
cb
g3
сб, d2, g3
Черные
Фс17, еб, 15
(16, g(5
ла7, ьв
Kg7, h6
d5, d7, f5
192 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ*
шахматной нотации, и множество базовых бинарных предикатов
зФ = {а4 -*- а5}:
<Xi(wn Щ) = (У»х < Уи2) — объект wx сзади объекта w2\
а2 (wx, w2) = (j xvx — xW21 > 1) — объекты wx и w2 не на
смежной вертикали;
а3 (^i> м>2) — (xwx < ^u;2) — объект wx левее объекта и?2;
а4 (wXl w2) = (j xwx — %w2 f = | yWl — #u?2 |) — объекты wx и
i/;2 па одной диагонали;
a5(u?l9 w2) = (#Wl = yu-2) — объекты wx и м>а на одной
горизонтали.
Рассмотрим решение примера согласно вышеописанному
алгоритму.
9.6.1. Фильтрация выборки. Для каждой s{ e M имеем
следующие множества сортов объектов: 7\ = {белая пешка, черпая
пешка}, Г2== {белая пешка, черпая ладья, черная пешка}, Тв =
= {белая пешка, черный копь, черная пешка}, Тк = {белая
пешка, черная пешка}, TQ = {белая пешка, черный ферзь, черная
пешка}, Г7 == {белая пешка, черная пешка}, Ts = {белая пешка,
черная ладья, черная пешка}, 7\> = {белая пешка, черный конь,
черная пешка}, Ti0 = {белая пешка, черная пешка}.
Используя соотношение Т=* П Тх, получаем Т = {белая- пеш-
ка, черная пешка}. Таким образом, из М удаляются черные
ладьи, черные кони и черный ферзь.
Обозначим сорт «белая пешка» через Ti, а сорт «черпая
пешка» — через т2, и определим верхпюю границу местности N. Для
каждой st^ М имеем n%ll = 1, /гХз1 = 1, п1г2 = 2, гсТ22 =» 1, ?гТ1з =
== 1^ лт2з — 1> лт14==2, дгТ24 = 2, wTl(5= 1, тгТ2б = 2, Ит27— ^» ?гт27:=::*
== 2, ^xl8 = 1, /2Т28 = 1,/2Т19 = 1» Ят29 = 1» ^т^Ю == ^» ^210 ~
Согласно (9.4) получаем гсХ] = 1, /гТз = 1 h!V = 2.
9.6.2. Анализ выборки. Задаем первое (оно же и
единственное) значение п = 2 и определяем релевантные и
противоречивые тг-ки. Для этого обозначим белые пешки через х, а
черные — через у. Результат кодирования каждой тг-ки <белая
пешка, черпая пешка) последовательностью предикатов а4 -ь а5
представим в виде табл. 9-2.
В этой таблице, например, z\ e s\ означает, что белая пешка
х2 сзади, на смежпой вертикали, левее, не на одной диагонали,
не на одной горизонтали с черной пешкой г/2.
Далее находим:
релевантные n-ки: UJ, z[], {zj, zj), {z°3l z?, Zg, zj2, zj3, zj7|, (z4t
Z° ] I 7° 7° 7° b
10b lz7> z15i z16b
§ 9 6. ИЛЛЮСТРАТИВНЫЙ ПРИМЕР 193
противоречивые и-кн: {z[, z°e], {[zj, z)], [z!J, z£, z?, z?2, z?3, z?7]},
{Z5, Zol, {z6, Z?4}, (zj, Z°}.
Определяем критические пары: <sj, s?), <^, US, 5?, *?0}>, <sj>
US, *?, *?<и *!)>, <U *i>, <*e, W, *J}>, <*? k\ 4 *J},><4, Ul s\}>.
9.6.3. Разбиение и разметка подграфов.
Разбиение подграфа Gu Так как ртах = /г(/г + 1)/2,
то имеем интервал весов [0, 3]. Выбираем первый из двух
возможных подграфов, пусть это будет подграф Gt с полюсом
Таблица 9-2
•8
z10
„0
*11
z\2
4s
4,
4ь
Z16
4,
х1Уг
«1^2
*108
*2У1
^2^2
х2Уз
хзУ1
Х'дУ2
хзУз
00110
10110
01100
10000
10000
11100
11000
110001
10000
У/уЧх. Фиксируем в качестве первой критическую пару <$i, s?>,
так как она содержит единственную тг-ку z\.
В общем случае для фиксированной пары </?\ р°>, где р° > р\
необходимо было бы определить множества {г1} i1 и {г0} 0°, про-
si «7
верить их па запретность и затем воспользоваться теоремой 11.
Но так как в данном случае s\ содержит единственную я-ку, то
в этом нет необходимости и поэтому сразу находим запретный
префикс П. = ЭхЗу с весом р = 0 (см. рис. 9.3, а). Таким
образом, остается исследовать интервал [1, 3].
13 Е. И. Ефимов
4
4
4
4
4
4
4
4
4
4
4
4
«101
*i!/i
*i#i
хъУ\
Х\У\
хгУ2
Х2У1
Х2У2
11110
00001
10000
00001
00110
11100
10000
10100
4
4
4
4
4
4
4
4
4
4
4
4
хгУг
Х1У1
х1Уг
хгУ2
Х\У\
Х1У2
ЧУг
x2lJ2
10010
10100
10000
10110
10000
11110
11000
10000
194 ГЛ. 9 АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
Далее используется общая процедура поиска запретных
префиксов. Так как в зафиксированной критической паре первый
элемент представляет s{ e ЛЯ, то согласно алгоритму выбирается
опорная точка р™ = Ртах и скользящая точка Рек на середине
еще не рассмотренного интервала [1, 31. В результате получаем
Рсл<= 2 (округление в большую
сторону) и PoD = 3, т. е. получаем
П, = ЭуУ/х и П0 в= \fy\fx.
Соответственно определяем {г1} * = \z[] и
р1
3
< •
2
—•—
/
—0
0
Щ
а)
2
6)
H>e0=iU!KUSI,U;),U!)K4ToyKa-
зывает на отсутствие запрета (не
всякое г° противоречит г1). Так как
в данном случае выбор скользящей
точки рсн оказался
несущественным (при изменении рС;? множество
\ri/ 1 не меняется и остается рав-
Puc. 9.3. Иллюстрация к
разбиению подграфов.
ным U}}), то изменение рек при
Рои = 3 не меняет результата — за-
претность отсутствует. Поэтому
осуществляется переход к рои = 2
(середина интервала [1, 2] с округле-
пием в большую сторону) и pL = *
(разность р° — р1 наибольшая), что
также не меняет вывода. В итоге
находим, что критическая пара (s[, $?> дает разбиение Gt на за-
иретпый tp = 0] и допустимый [р^О] классы (см. рис. 9.3, а).
Выбираем следующую критическую пару <4\ 4> и, поступая
аналогично, паходим запретный префикс V#V.t с р = 3 (см.
рис. 9.3, б). Итак, с учетом предыдущих результатов получаем
разбиение Gi на запретный 1р = 0, 3] и допустимый 10 < р < 31
классы.
Выбираем <*i, |*2, *?, s?0}>» фиксируем начальные р&< = 1 и
р°п *= 2, что соответствует IIj = \fx3y и П0 = 3</V.z, и находим
{ri}"1 = {{ZJ, z\)\ и {г°}П0° = {{zjj, z*}\ (выбор s° в критической
паре производится в порядке возрастания числа гс-ок, в s6 их
наименьшее число), что указывает па их запретность (z8
противоречит Zg)- Следовательно, согласно теореме 11 интервал [1, 2]
ванретен, т. е. запретны префиксы \/хЗу и ЗуУх{ рас. 9.3, в).
8 9.6. ИЛЛЮСТРАТИВНЫЙ ПРИМЕР 195
Итак, с учетом предыдущих результатов получаем, что
подграф G, запретен.
Разметка подграфа G2. Поскольку остается
рассмотреть единственный подграф G2 с полюсом V#V#, процедура
разметки используется лишь для фиксации начального разбиения
d на запретный I/? = 0t 3] и допустимый [0<р<3] классы
(см. рис. 9.3, б).
Разбиение подграфа G2. Аналогичным образом
фиксируем весовую пару <1, 2>, что соответствует Пг = \/уЗх и
П0 = ЗхЧу, и критическую пару <4t isl *?t $iol>- Далее
находим и так как {z\} вообще не имеет про-
тиворечивых дг-ок, то запрета на <1, 2> не получаем.
Фиксируем новую весовую пару <2, 2> и находим {г1} / =»
= ({^зЬ Uilh что не дает запрета на <2, 2> по той же
причине, что и на <1, 2>. Фиксируем новую пару <lt 1> за счет
изменения Pont что опять ничего нового не дает. Поэтому выбираем
новую критическую пару <«в» W» si}>» фиксируем <lt 2> и
находим {г0} 0° = \{z%\, UJ}}, что не приводит к запрету по при-
чипе допустимости UJ}. Изменения скользящей точки р%< и затем
опорной Роа ничего не меняет. Перебирая последующие
критические пары, убеждаемся в неизменности первоначального
разбиения подграфа G2. Итак, согласно допустимости [0 < р < 3]
получаем класс допустимых префиксов \3x\fy, \fy3x].
9.6.4. Построение минимальных графов <52min и 32min« Строим
исходные графы Й1 и $2° для П = Зх\/у (см. рис. 9.4) и
уменьшаем размерность SP и 52°, используя следующие обстоятельства:
поскольку г} и z? лежат на едипственпом пути в своих
графах, то удаляем противоречивые им ъ\ и z8 соответственно;
удаляем г\ как лежащую па тупиковом пути;
поскольку теперь z\ и z\ лежат на единственном пути, то
удаляем противоречивые им zj| и zj4 соответственно;
так как z£ лежит па каждом пути, то удаляем zj;
определяем в виде списка СП классы релевантности для
оставшихся гс-ок, т. е. СП: (z\: (и\), z\: (u\f и\), z\ : (wJ, и\), z\:
: ("i), z\: (ul) z\: (tt?), z!j: {u% z%: (ul u°u ul ul ul), z» : (uj. u%
*"l (ul ul ul ul ul), z?: (ul ul), z°8: (ul ul ul ul ul), z?0: (ul
"j), *?,:(*!), z?2: (ul ul ul ul u§, z%: (ul ul ul ul ul), z°15: (ul
Щ), zL:iu°- IIQ) 7° '(n() ;/° ;/° 7/° h°\Y
«/i -IG • Va5> ^87» «17 ♦ ^U3, M4l M5, Щ, Щ)),
13*
196 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
из СП вычеркиваем, кроме одной (если тг-ка лежит на
каждом пути, то именно она и оставляется), релевантные тг-ки с
одинаковыми классами релевантности, т. е. вычеркиваем z\, Zg, zjj, z?2,
^13» z17»
поскольку теперь z\ и z% остались единственными в своих
ярусах, то из СП вычеркиваются s^, z?6 и z% соответственно;
из СП вычеркиваются поглощаемые я-ки, т. е. 2? и z^
(либо zl).
Л1 Я0
Рис. 9.4 Иллюстрация к построению минимальных графов: вершины с
зачерненным верхним сектором исключаются из исходных графов.
Далее формируем все пути миштмальпых графов, т. е. Я1 =
= {z\, 4 4, *5), R} = I*!, 4, zl zt\ и д° = к *», *°,*?,}. из
рис. 9.4 видно, что размерность полученных минимальпых
графов существенно сократилась по сравнению с исходными.
9.6.5. Формирование матрицы. Составляем кодовую таблицу
(см. табл. 9-3). Для этого фиксируем кодовый вариант <Д1, Я°г}
§ 9.6. ИЛЛЮСТРАТИВНЫЙ ПРИМЕР
197
р заполняем клетки. Пустые клетки соответствуют в М1 ложным,
а в М° истинным значениям а.
Фильтруем базовые предикаты:
согласую следствию требования 3 и табл. 9-3 исключаются
аи о*г и а5; _
согласно требованию 1 исключаются сс3 и а5 как
поглощаемые «1.
Таблица 9-3
mv
М1
М°
V
г
«1
4
4
4
А
4
«2
4
а,
1
1
а,
1
1
0
0
0
0
а,
1
1
0
0
0
0
а.
1
1
а3
1
1
1
0
0
а3
1
0
! 0
а4
1
1
°
0
а*
1
1
0
0
а*
1
0
0
о
0
а*
1
1
1
Формируем дизъюнкты:
поскольку однолитерыого решения не существует^ (см.
табл. 9-3), перебираются по^очереди все возмояшые пары аи о^е
^ d, в итоге получаем d = ai V a2;
так как полученное d удовлетворяет требованию 3 и при
этом сокращение R\ (путем __ исключения тг-ок, на которых
d{z°) — ЛОЖЬ) пусто, то d = at V a2 является одновременно и
искомой матрицей С.
Итак, получаем решение задачи обучения:
ПРОХОДНАЯ (X, Y)^(3xe=X)(\fye=Y)&l(x,y)\/cc2(x,y)},
т. е. БЕЛЫЕ X имеют ПРОХОДНУЮ пешку против ЧЕРНЫХ Г
тогда и только тогда, когда существует белая пешка х, которая
по отношению к любой черной пешке у находится или не сзади,
или не па смежной вертикали.
_9.6.6. Замечания к примеру 1. Дегко убедиться, что d =
*= ах V а2 дает единственное решение, так как другие ^возможные
варианты дизъюнктов dx = ах V а3 и d2 = a2 V a3 V a; хотя и
198 ГЛ. 9. АВТОМАТИЧЕСКОЕ ФОРМИРОВАНИЕ ПОНЯТИЙ В РЕШАТЕЛЕ
удовлетворяют требованию 3, но построенная на них матрица
С =*= ch & d2 не удовлетворяет требованию 4 (на z\ и z\ матрица С
становится истинной).
2. Если рассмотреть второй вариант кода </?', R\y, то, во-
первых, получаются другие решения, зо-вторых, их много
больше, например, d = (ai V аг) & (ai V a2), C2 = (ai V a& V a5) & (a2 V
Va4 Va5) & (a2 Va3 Va5) и другие. Присутствие в указанном ре-
шепии С{ лишпего дизъюнкта (а4 V а2) по сравнению с первым
вариантом кода R*} объясняется наличием в Я1 шума «если
белая пешка не находится сзади черной, то она смежна с ней»,
что вовсе не обязательно.
3. Если рассмотреть второй допустимый префикс УуЗх и
проделать те же операции согласно алгоритму, то получим
единственный кодовый вариант <R\ fl°>, где R1 = [z\> z\i zl' zl)
и i?° — [z°ly zl, zj, zl, zj6}, т. е. по сравнению с вариантом Л?
появилась гг-ка 2°в. Далее получается единственное решение
Наличие разных решений опять же можно объяснить
некорректностью выборки М. Действительно, в данном случае С =
= (ocj V a2) & (ai V a3) и лишний дизъюнкт ai V a3 = с^ ^ a3
обязан наличием в R1 шума «еслп белая пешка сзади черной, то
она и слева» и в ff° шума «если белая пешка сзади черной, то
она не слева», что вовсе не обязательно.
Таким образом, результат решения задачи обучения, как
и следовало ожидать, во многом зависит от представительности
обучающей выборки Д/. Очевидно, чем больше выборка, тем
более нивелируется влияние отдельных шумов и тем ближе мы
будем к единственно правильному решению.
ЧАСТЬ III
ПРАКТИЧЕСКИЕ РЕАЛИЗАЦИИ
ГЛАВА 10
ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
§ 10.1. Сравнительный анализ зарубежных систем
Первой, наиболее интересной моделью решателя явился общий
решатель задач GPS (General Problem-Solver), созданный
американскими учеными Ньюэллом, Шоу и Саймоном. GPS с момента
создания [Ныоэлл, Шоу, Саймон, I960] до последнего варианта
[Эрнст и Ныоэлл, 1967а, б] претерпел ряд изменений. Система
интересна в историческом плане тем, что многие ее идеи в той
или ипой форме были воплощепы в последующих решателях.
При разработке первых версий GPS авторов в основном
интересовали вопросы, связанные с поисковой деятельностью
человека, решающего задачи. Это привело к созданию известной
эвристической стратегии поиска решений, используемой в различных
дальнейших модификациях решателей.
Однако, стремясь создать теорию мышления на подобной
основе, авторы не уделили должного внимания другому важному
аспекту теории — представлению знаний. В результате GPS не
оказался универсальным решателем задач, на что падеялись
его создатели. Решатель по существу имел процедурный язык
низкого уровня, на котором, как показали, например, шахматы,
далеко пе всегда оказалось возможным эффективное описание
сложных сред в терминах априори упорядоченных различий,
таблиц связей, операторов и других элементов проблемной среды
GPS. Поэтому, несмотря па довольно эффективную саму по себе
стратегию поиска (анализ целей и средств, планирование и др.),
система решала задачи медленно. Здесь сказалась перешепиость
проблемы совмещения эффективной стратегии поиска с
эффективным представлением знаний!
Попытка более эффективного представления знаний, с одной
сторопы, и успехи в области автоматических доказательств
теорем — с другой, привели к созданию вопросно-ответной
дедуктивной системы QA3 [Грии, 1969]. Система QA3 является
дальнейшим развитием системы QA2 [Грин и Рафаэль, 1968], запрограм-
200
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
мирована на языке LISP для ЭВМ SDS-940, работающей в
режиме разделения времени.
Вопросно-ответная система QA3 в равпой степени может быть
также названа многоцелевой системой решения задач или
общим решателем задач. Она рассчитана на произвольную
предметную область и произвольные вопросы, ее действие основано
на автоматическом доказательстве теорем с использованием
принципа резолюций [Робинсон, 1965]. Но так как в рамках
формализма метода резолюций оказалось затруднительным описание
эвристик, то это обстоятельство заставило отказаться в QA3 от
эвристического поиска.
Таким образом, попытка построить дедуктивный решатель,
используя в полной степени формализм принципа резолюций,
оказалась, как показала система QA3, также неуспешной. При
разработке последующих версий решателей представлялось бы
целесообразным отказаться от такого полного формализма,
например, отказаться от поиска подходящих операторов на основе
дедуктивного вывода и вернуться к их процедурному поиску, как
это было сделано в системе GPS. Это позволило бы в ходе
построения плана действий использовать для выбора операторов
эффективную стратегию GPS, а для оценки достижимости целей
и применимости операторов — метод резолюций.
Так возникла планирующая система STRIPS (Stanford
Research Institute Problem Solver), использующая декларативно-
процедуральное представление знаний в сочетании с
эвристическим поиском [Файкс, Нвгльсон, 1971; Файкс, Харт, Пильсон,
1972а, б]. Эта особенность в сочетании с использованием
макрооператоров, формируемых на основе обучения решателя STRIPS,
позволила повысить его эффективность по сравнению с
системой QA3.
Улучшив таким образом стратегию поиска решений, авторы
STRIPSa тем не менее не сумели решить ряд возникших на их
пути проблем. Наиболее серьезной иаГ них оказалась проблема
так называемых побочных эффектов. Суть этой проблемы в
следующем. Проблемная среда системы STRIPS включает описание
действий (список условий применения, список вычеркиваний и
список добавлений) в виде правильно построенных формул
логики предикатов первого порядка. Оказалось, что принципиально
невозможно, оставаясь в рамках подобного описания действий,
априори предусмотреть и описать полный эффект действий, т. е.
что действительно меняется в результате применения данного
оператора к конкретной ситуации.
Для пояснения возьмем, к примеру, действие «перемещение
робота Л». Его основной эффект — изменение местоположения
робота — априори известно и поэтому может быть введено в
описание действия в виде списков вычеркивания и добавления. Те-
§ 10.1. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЗАРУБЕЖНЫХ СИСТЕМ 201
перь допустим, что в планирующую систему STRIPS, в памяти
которой содержится описание указанного действия, введено
описание исходной ситуации, в частности местоположение с
некоторого предмета а. И пусть в ходе решения задачи выработанный
роботом план действий требует такого перемещения, при котором
он оказывается в окрестности места с. Сразу появляется зарапее
непредусмотренный эффект действия — факт РЯДОМ (R, а), не
введенный заранее в знания планировщика при описании
результата действия перемещения, по который тем не менее может
оказаться существенным для дальнейшего поведения робота.
Нетрудно догадаться, что подсистема логического вывода в подобной
системе быстро накапливает противоречивые факты и сама
становится противоречивой. Не решало проблемы и предложение
Хайеса [1971] аксиоматизировать причинно-следственные связи
предметного мира и снять таким образом негативный аспект
проблемы побочных эффектов, т. е. автоматически выводить все
то, что не меняется в результате применения действия.
В итоге STRIPS оказался работоспособным лишь для реше-
пия задач в весьма простых проблемных средах типа мира
игрушечных кубиков.
Авторы решателей задач, таких, например, как STRIPS или
GPS, предполагали получить удовлетворительное решение
проблемы поиска глобальных целей, основываясь лишь на
использовании эффективных поисковых эвристик. Однако это не решило
проблемы — пространство поиска оставалось чрезмерно большим.
Использование в системе STRIPS обобщенных планов,
несомненно, представляло определенный шаг вперед в решении
проблемы эффективного поиска, но, к сожалению, лишь только шаг.
Главный недостаток процедуры обобщения планов
(формирования макрооператоров) в системе STRIPS заключался в том, что
опа не включала в себя процедуру обобщения моделей мира.
Вследствие этого макрооператор, представляя семантически
связанную последовательность элементарных операторов, сохранял
каждую деталь условий применения и списков добавлений этих
операторов. Метод обобщения планов приводил к настолько
большим конъюнкциям условий применения и настолько большим
спискам добавлений, что эффективность решения практически
сложных задач оказалась при этом невысокой.
Для дальнейшего повышения эффективности поиска
целесообразно использовать более структурированное представление,
описание моделей мира, например, па основе отделения
существенной информации от несущественной и построения на этой основе
иерархии моделей мира. Так возникла система ABSTRIPS [Са-
кердоти, 1974]. Эта система представляет собой модификацию
решателя STRIPS, использующую иерархию описаний мира
задач.
202
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
Используемый в ABSTRIPS метод иерархического
планирования хотя и увеличил эффективность поиска по сравнению с
системой STRIPS, однако, не основываясь па достаточно полном
обобщении, все еще желал много лучшего. В этой системе
обобщение операторов и моделей мира производилось путем
исключения деталей, в то время как человеку в его мыслительной
деятельности свойственно обобщать путем укруппения, свертывания
как моделей, так и операторов (см. § 4.4). Только такое
обобщение могло бы позволить значительно повысить эффективность
поиска.
Опыт разработок систем STRIPS и ABSTRIPS показал, что
автоматическое доказательство теорем на основе метода
резолюций недостаточно эффективно по причине неструктурированности
знаний. Любая теорема в методе резолюций представляется
отдельным утверждением без каких-либо ссылок на другие
вспомогательные теоремы, которые можно было бы использовать для
доказательства данной теоремы. В действительности каждая
теорема должна по возможности задаваться как фрейм, содержащий
в себе всю полезную информацию, необходимую для
направленного поиска доказательства данной теоремы. Другими словами,
теорему желательно задавать в процедуральной форме,
указывающей, что и в какой последовательности необходимо сделать
предварительно, прежде чем доказать данную теорему.
Эта идея легла в основу разработок современных процеду-
ральных языков высокого уровня, таких как PLANNER, QA4,
QLISP, CONNIVER и др., ориентированных на машинное
решение интеллектуальных задач. В них удобио реализуется
представление знаний с помощью специального вида базы данных и
процедур. Эти языки ориентируются на автоматическое
доказательство теорем, автоматическую проверку и синтез машинных
программ, па планирование деятельности робота и многое другое.
Построение решателей на базе подобных языков представляется
перспективным направлением.
В оставшейся части главы мы рассмотрим более подробно
вышеупомянутые зарубежные решатели в трех аспектах:
представление знаний, поиск решений и обучение.
§ 10.2. Решатель GPS
Решатель GPS использовался для решения задач
интегрального исчисления, для логического вывода, для решения
различных игровых задач, например известной задачи о ханойской
башне, для грамматического разбора и других задач. Мы
рассмотрим наиболее подробно последнюю версию GPS образца
1967 г.
§ 10.2. РЕШАТЕЛЬ GPS
203
10.2.1. Представление знаний. Мир задач решателя включает
процедуральное описание объектов, операторных схем и
некоторой вспомогательной информации. Объекты обычно представляют
собой наборы значений свойств, описывающие самые различные
состояния сущности — от математических выражений до
физических предметов. Таким образом, одна и та же сущность,
например физический предмет, соотносится с различными объектами,
описывающими его различные состояния. В этом смысле каждая
пара объектов характеризует два различных состояния сущности.
Другими словами, каждая пара объектов имеет различия, число
которых определяется числом отличающихся свойств в двух
состояниях соответствующей сущности. В частном случае пара
объектов может составлять исходную и целевую ситуации.
Всевозможные различия между парами объектов априори
упорядочены по степени трудности их устранения и составляют
перечень различий. Эти различия могут устраняться только с
помощью операторов, получаемых путем означивания параметров
операторных схем. Процедуральное описание операторных схем
включает проверку условий применения оператора и результат
его применения, выражаемых в общем случае через переменные.
Связь операторов с различиями устанавливается с помощью таб^
лицы связей.
10.2.2. Поиск решений. Система GPS решает три типа задач:
преобразовать объект А в объект 5, уменьшить различие D в А
и применить оператор / к объекту А.
Для нахождения решения GPS применяет обратный поиск,
для чего использует эвристику «анализ средств и целей»,
позволяющую сводить задачу к подзадачам, т. е. GPS применяет
стратегию редукций. Стратегия эта состоит в следующем. Исходная
задача (конкретная пара объектов А и В) рассматривается как
задача «преобразовать объект А в желаемый объект В». С этой
целью GPS выявляет (по упорядоченному списку различий)
наиболее трудно устранимое различие D и ставит подзадачу
«уменьшить различие D в Л»*), решение которой состоит в выборе и
применении («мысленном» на стадии планирования)
подходящего оператора /.
Если выбранный оператор / не применяется непосредственно
к объекту А, то GPS ставит задачу «применить оператор / к
объекту Л». Решение последней приводит к формированию
желаемого объекта С, к которому может быть применен оператор /
Для уменьшения различия D. Теперь возникает задача
«преобразовать А в С» и т. д. (см. рис. 10.1)..
Рассмотрим схему поиска в GPS. Пусть р — задача, ад —
метод ее решения. Пусть также в дереве подзадач р —- родитель-
*) Имеется в виду отличие А от В.
204
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
екая вершина, а /?' и /' - ее дочерние вершины. Назовем р
суперзадачей для р' п р", а р' — вспомогательной задачей для
р" (// решается раньше р"). Так, на рис. 10.2 р3 представляет
собой суперзадачу для /?4 и р9ь а р4 в свою очередь является
вспомогательной задачей для р9.
А С f В Тогда поиск решения в GPS
осуществляется согласно блок-схеме,
приведенной на рис. 10.3.
10.2.3. Пример. Работу каждо-
Рис. 10.1. Иллюстрация к стра- го блока лучше всего пояснить
тегии GPS. па конкретном примере решения
задачи «обезьяна и бананы». Эта
задача была предложена профессором Эддинбургского
университета Дж. Маккарти в 1963 г. и до сих пор рассматривается как
тестовая задача для многих интеллектуальных программ.
Задача состоит в следующем. Обезьяна вместе с ящиком
находится в комнате, па потолке которой подвешены бананы.
Исх. задача рj
«Преобраз. исх.
off. sf в желаем. sn»
I «Применить /г s2f3
с я=хЗ»
«Применить /f Sj/*f»
Р?
«Применить /г s7P2
с z=x2»
Рис. 10.2. Дерево редукций GrS.
Обезьяна может подойти к ящику, передвинуть его п залезть на
ящик. Обезьяна может достать бананы только в том случае, если
она будет стоять па ящике под бананами. Как это сделать
обезьяне?
§ 10.2. РЕШАТЕЛЬ GPS
205
Проблемная среда. 1) Вспомогательная информация:
множество положений на полу X = {#1, х2, хЪ — под бананами}.
2) Операторы:
Обозначения
/г— залезть
/2— идти
/я— передвинуть ящик
/4— взять бананы
Условия применения
положение обезьяны
совпадает с положением ящика
отсутствуют
положения ящика и
обезьяны совпадают
ящик под бананами (яЗ),
обезьяна на ящике
Результат применения
обезьяна на ящике
положение обезьяны
х£Х
положевие обезьяны и
ящика х£Х
бананы у обезьяны в
лапах
3) Различия: D1 — положение обезьяны, D2 — положение
ящика, D3 — содержимое лап обезьяны.
4) Упорядочение различий (по трудности устранения): D3 >
>D2>£1.
5) Таблица связей: все операторы желательны для
уменьшения всех различий, т. е. по существу связей нет.
Решение задачи. 1) Исходная задача — «преобразовать
исходный объект Si в желаемый sn».
2) Объекты: исходный st — положение обезьяны xl,
положение ящика х2, лапы обезьяны пусты; желаемый sn — бананы у
обезьяны в лапах.
Решение данной задачи с помощью блок-схемы (см. рис. 10.3)
представлено в виде дерева подзадач на рис. 10.2.
Поясним кратко ход решения. По заданному рх на шаге Е
выбирается метод преобразований, при котором исходный объект
sx сравнивается с желаемым sn (шаг F). Так как с помощью q
задача р{ не решается (в лапах обезьяны нет бананов), то в
соответствии с этим методом формируется подзадача р2 —
«уменьшить различие D3 в s{» (шаг /). Поскольку р2 не труднее
суперзадачи р{ и не имеет вспомогательной задачи, то опа и
выбирается для дальнейшей редукции (шаги I + D).
На шаге Е выбирается метод уменьшения различия, который
приводит к выбору подзадачи р3 — «примепить к st оператор /4».
По рг выбирается метод применения оператора. Так как /4 не
может быть непосредственно примеиеп к s{ (необходимо, чтобы
ящик находился под бананами, а обезьяна —- на ящике), то
формируется и затем выбирается подзадача /?4 — «уменьшить
наиболее трудно устранимое различие D2» (положение ящика).
Совершенно аналогично формируются п выбираются далее
подзадачи Рь, Ро и /?7.
206
ГЛ 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
pf-ucx. задат
d
Ест метод \
для р?
\Т
Выбрать \
метод у \
т
\7
Применить g-1
* Р 1
т
(L
С ПОМОЩЬ/О (f\
решается р?)
Г р -исх. задмаруО»*- От/газ-
l/fem
Определение
р'-сулерзадауи
Успех
Рис. 10.3. Поисковая программа GPS.
Рис, 10.4 Дерево моделей миров s} -4- s5 (прямые стрелки указывают надрав
ление поиска, волнистые •**• реальные преобразования).
§ 10.3. ДЕДУКТИВНАЯ ВОПРОСНО-ОТВЕТНАЯ СИСТЕМА QA3 207
На шаге Е для р7 выбирается метод применения, который ее
решает. В итоге формируется объект s2 (обезьяна и яшик рядом),
который играет роль нового исходного состояния, и
осуществляется переход к суперзадаче pQ. Вновь выбранный метод
оказывается успешным для решения р6, поэтому осуществляется
переход к суперзадаче рь. Для р5 подбирается метод применения при
условии, что уже решена подзадача уменьшения различий (от
st перешли к s2). Этот метод приводит к формированию и
выбору подзадачи р% — «применить к s2 оператор /8».
Аналогичным образом формируются и выбираются подзадачи
р? ~=" Р13. В итоге формируется план действий /2, /3, Л, Д,
которому соответствует последовательность объектов Si, s2, s3, $4, s* —
= sn (см. рис. 10.4).
§ 10.3. Дедуктивная вопросно-ответная система QA3
Действие вопросно-ответной системы (ВОС) основано па
автоматическом доказательстве теорем с использованим принципа
резолюций [Робинсон, 1965]. Программа доказательства
характеризуется стратегией доказательства, предусматривающей быстрый
ответ на простые вопросы даже при большой базе данных и
более высокий уровень взаимодействия между пользователем, ВОС
и базой данных.
Пользователь может управлять процессом доказательства
несколькими путями:
1) пользователь может потребовать поиска только ответа ДА
и НЕТ;
2) пользователь может потребовать от программы продолжить
поиск доказательства с увеличенными ресурсами, если
доказательство не было получено в пределах отведенного времени при
заданном объеме памяти;
3) пользователь может потребовать демонстрации хода поиска
доказательства;
4) более осведомленный пользователь может управлять
доказательством с помощью таких стратегий, как стратегия
предпочтения единичного дизъюнкта и стратегия опорного множества;
5) пользователь может пополнять и модифицировать базу
данных.
Система QA3 способна также решать задачи такого рода:
«найти последовательность действий, которая приводит к
достижению некоторой цели». Именно как решатель подобных задач
нас и будет интересовать система QA3. Читателей,
интересующихся вопросно-ответными системами как таковыми, мы
отсылаем к литературе [Грин, 1969; Слэйгл, 1965а; Виноград, 1972].
Ю.3.1, Представление знаний. Система знаний о мире состоит
из наборов фактов, аксиом и операторов, описанных в виде пра-
208
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
вильно построенных формул (ППФ) исчисления предикатов
первого порядка, а задаваемые вопросы представляют собой
подлежащие доказательству теоремы указанного исчисления. Таким
образом, знания системы QA3 имеют декларативную форму
представления.
Факты и аксиомы являются предложениями, которым
предшествует слово STATEMENT, указывающее программе, что она
будет иметь дело с предложением. Эти предложения
автоматически преобразуются в дизъюнкты и накапливаются в памяти.
Предложение может выражать сугубо частный факт, например,
STATEMENT: ЦВЕТ (КНИГА, КРАСНЫЙ) в соответствии с
обычным триплетом СВОЙСТВО-ОБЪЕКТ-ЗНАЧЕНИЕ.
Предложение может выражать более общие сведения — аксиому,
например,
STATEMENT : (V*) (V4)(VB) [A s В&хе= Л =► я е= Д],
что означает «если А есть подмножество В, а х есть элемент А,
то х есть элемент В»,
Вопросы, задаваемые QA3, также представляются
предложениями, перед которыми ставится слово QUESTION (вопрос). Для
формального описания вопроса как теоремы используется
предикат ANSWER (ответ). Рассмотрим вопрос
QUESTION: (Зу) ЖИВОТНОЕ (у),
который при отрицании дает дизъюнкт ЖИВОТНОЕ (у). К
этому дизъюнкту добавляется специальный символ ANSWER (у) и
получается выражение
ЖИВОТНОЕ (у) V ANSWER (у).
Таким образом, символ ANSWER добавляется к каждому
дизъюнкту при отрицании вопроса. Аргументом предиката
ANSWER являются переменные, стоящие в вопросе под
квантором существования. Когда в результате резольвирования
получается новый дизъюнкт, каждое слово ANSWER в новом
дизъюнкте принимает частное значение, так же как и другие слова
из этого дизъюнкта. Однако обработка символа ANSWER имеет
ту особенность, что ему не разрешается резольвировать пи с
одной литерой и он не учитывается при определении длины
содержащего его дизъюнкта.
Дизъюнкт, содержащий только символ ANSWER, называется
ответным дизъюнктом. Поиск ответа (доказательства) считается
успешным, если он завершается получением ответного
дизъюнкта. Указанное добавление предиката ANSWER не влияет на
полноту принципа резолюций и поэтому вполне правомочно. Таким
образом, в системе доказательства QA3 ответный дизъюнкт
эквивалентен пустому дизъюнкту в обычной системе доказательства,
§ 10.3. ДЕДУКТИВНАЯ ВОПРОСНО-ОТВЕТНАЯ СИСТЕМА QA3 209
основанной на принципе резолюций. Ответный дизъюнкт
указывает наборы значений, которые могут принимать переменные,
стоящие в вопросе под квантором существования.
Примером вопроса-теоремы для интересующего нас аспекта
приложения QA3 может служить
QUESTION: (3s) AT (с, s),
т. е. «существуют ли такие ситуации, в которых робот будет
занимать место с?». Ответ на этот вопрос будет содержать
последовательность действий робота, приводящую к достижению им
места с.
Описапие операторов осповано на понятии преобразований
состояний. Каждому действию или оператору / ставится в
соответствие логическая функция. Эта функция отображает одни
состояния в другие. Аксиома принимает следующую форму:
Pis,) & (f(Si) = s2) * Q(sJ,
где зпак =>- означает импликацию; s, — исходная ситуация;
Pis,) — предикат, описывающий исходную ситуацию; f(si) —
функция от sr, s2 — значение функции, представляющее собой
новую ситуацию; Q(s2) — предикат, описывающий новую ситуацию.
Исключая равенство, получаем более краткую запись
РМ <* Q(f(Si)).
10.3.2. Поиск. Процесс доказательства теоремы в QA3 есть
процесс получения ответа на вопрос. Вопрос считается
предположением, и QA3 пытается его доказать, чтобы ответить ДА.
Если предположение не доказывается, QA3 пытается доказать
отрицание этого вопроса, чтобы ответить НЕТ. Имеются еще два
типа ответов: ДОКАЗАТЕЛЬСТВО НЕ НАЙДЕНО и
НЕДОСТАТОЧНО ИНФОРМАЦИИ. Первый из указанных ответов имеет
место в случае, когда система QA3 израсходовала весь лимит
времени или объема памяти и не получила доказательства ни
ДА, ни НЕТ; второй ответ имеет место в случае, когда QA3 не
может сформулировать ни ДА, ни НЕТ, не выходя из пределов
указанных лимитов.
В качестве иллюстрации доказательства теорем в QA3
рассмотрим пример. Пусть два игрока pt и р2 играют в следующую
игру. В некоторой ситуации s{ игрок р{ занимает либо позицию
а, либо Ь:
А, • AT(pt, a, st) V АТ(ри Ь, *).
В ситуации Si игрок р2 может двигаться куда угодно:
A. (Vff)AT(p2, у, MOVE (p2, у, Sl)).
14 Е. И. Ефимов
210
ГЛ. 10 ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
Па позицию игрока pt не влияет передвижение игрока р2-
А9. (\/х) (У у) (V*) [AT (plf x, s) => AT (Pl, x, MOVE (p2J y, *))].
Требуется установить, существует ли некоторая ситуация
(последовательность ситуаций) такая, что pt и /?2 одновременно
окажутся в одной позиции:
QUESTION : (Зх) (3s) [AT (pln х, s)&AT (p2, x s)].
Доказательство имеет следующий вид:
1. АТ(ри х, s) V АТ(р2, х, s) V ANSWERS, s) Отрицание
вопроса
2. АТ(/?2, г/, MOVE(p2, у,^)) Аксиома Л2
3. AT(/?i,^, MOVE(/>2, a:, *,)) V ANSWERS, MOVE(p2, я, *))
Из (DjnrJ2)
4. AT(plf x% s)VAT(pu x, MOVE(/?2, г/, s)) Аксиома А,
5. AT(/?„ x, 8t) V ANSWER**, MOVE(plf x, Si)) Из (З) и (4)
6. AT(pu a, s^ V AT(pu 6, s4) Факт 4i
7. АТ(^, b, *,) V ANSWERCa, MOVE(/?2, a, *)) Из (5) и (6)
8. ANSWER(a, MOVE(p2, a, st))V ANSWERS, MOVE(/?2, b,Si))
Из (5) u (7)
Итак, QA3 формулирует ответ
ANSWER: ДА, b-аи *~MOVE(p„ a, *,)],
или
[x e fe и 5 = MOVE(/?2, 6, 5t)].
Этот ответ показывает, что существуют две возможности:
либо игрок Pi находится в позиции а, а игрок р2 двигается в а,
либо игрок Pi находится в позиции Ь, а игрок р2 передвигается
в Ь. Ответ с «ИЛИ» показывает, что мы не знаем, какое из
передвижений приведет к встрече. Такой ответ получается
благодаря тому, что факт Л, не указывает определенного положения
игрока.
Характер структуры ответов, получаемых системой QA3,
можно видеть из следующего примера, связанного с движением
робота. Рассмотрим предложение: «если робот находится в пункте
а в некоторой ситуации Si и выполняет действие по движению
от а к Ь, то робот будет в пункте Ь в пекоторой результирующей
ситуации s2». Соответствующая аксиома будет иметь вид
(\/sx) [AT (a, sx) =ф- AT (6, MOVE (a, 6, sx))],
где $2 ■» MOVE(a, b, *t).
Рассмотрим теперь пример, показывающий как QA3 может
быть использована для отыскания последовательности действий,
приводящей к цели (см. рис. 10.5). Соответствующие факты и
аксиомы таковы:
§ 10 3. ДЕДУКТИВНАЯ ВОПРОСНО-ОТВЕТНАЯ СИСТЕМА QA3 211
Отрицание вопроса
Аксиома Л4
Из (1) и (2)
Аксиома Л2
Из
Al. ЛТ(а, s0).
А2. (V,vt) [AT (a, sx) => AT (ft, MOVE (a, 6, s,))].
A3. (Vs2) [ AT (a, *2) =ф- AT (d, MOVE (at d% s2))].
A4. (V*,) IAT (ft, *,) => AT (c, MOVE (ft, c, *,))].
A5. (V*4) [ AT (d, *,)=► AT (ft, MOVE (d, 6, s%))].
Теперь мы задаем вопрос: «какая последовательность
действий приведет к передвижению робота в пункт с?»
QUESTION: (35) AT (с, s).
Доказательство:
1. AT (с, s) V ANSWER (s)
2. AT(ft, s3)VAT(c, MOVE(6, c, *,))
3. AT (6, s3) V ANSWER (MOVE (ft, c, *,))
4. AT (a, St)VAT(ft, MOVE (a, ft, sj)
5. AT(af *t) V ANSWER(MOVE(ft, c, MOVEU, ft, *,)))
(3) и (4)
6. AT (a, s0) Факт Al
7. ANSWER (MOVE (ft, c, MOVE(a,ft, *.))) Из (5) и (6)
Итак, ответ
ANSWER: ДА, S = MOVE (ft, с, MOVE (a, ft, sQ)),
который соответствует плану действий: MOVE (a, ft, s0), MOVE (bT
c, st). Заметим, что ответ имеет вложенную структуру,, которая
быстро усложняется с ростом «глубины» доказываемой теоремы.
Для поиска доказательств
теорем система QA3 использует
стратегию, представляющую собой
сочетание стратегий
«предпочтение единичных элементов»,
«опорное множество» и «замещение».
Стратегия предпочтепия
единичных элемептов [Вое и др., 19641
дает наивысший приоритет
резолюций единичных элементов
(однолитерных дизъюнктов).
Кроме того, эта стратегия
приписывает второй по величине приоритет резолюции двух дизъюнктов.
*м и С2, резольвепта С которых имеет наименьшее ожидаемо©
число литер.
Определим порядок дизъгопкта числом входящих в него
литер. Пусть дизъюнкты d и Сг имеют порядок h и I
соответственно. Тогда ожидаемый порядок их резольвенты С будет h H-
"Н--2, так как при резолюции по крарпей мере две литеры
вычеркиваются,
Таким образом, стратегия установит, например, следующий
порядок нахождения резольвент: единичный элемент с единич*-
14*
НсхоМш
лутт
о
-о
Цель
Рис. 10.5. Схема возможных
перемещений робота.
212
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
ным элементом, единичный элемепт с дизъюнктом 2-го порядка,
•единичный элемент с дизъюнктом 6-го порядка, дизъюнкт 2-го
порядка с дизъюнктом 3-го порядка, дизъюнкт 3-го порядка с
дизъюнктом 4-го, дизъюнкт 2-го порядка с дизъюнктом 6-го
и т. д.
Стратегия опорного множества использует разбиение
множества всех дизъюнктов на два подмножества: к первому относятся
заданные исходные факты и аксиомы, ко второму, называемому
опорным множеством,— все порождаемые дизъюнкты и
отрицанию теоремы. Согласно стратегии не допускаются резолюции
дизъюнктов из первого подмножества, все остальные резолюции
допускаются. Вое и др. [1964] экспериментально показали, что
стратегия, сочетающая в себе стратегию опорного множества
со стратегией предпочтения, часто более эффективна, чем
стратегия предпочтения, взятая отдельно.
Принципиальная особенность применения этих двух
стратегий в QA3 состоит в использовании двух множеств дизъюнктов.
Первое множество — ПАМЯТЬ — содержит все исходные
дизъюнкты. Второе множество — СПИСОК ДИЗЪЮНКТОВ,
выполняя роль ранее упомянутых опорпого и неопорного множеств,—
содержит рабочие исходные дизъюнкты и порождаемые
дизъюнкты.
Таким образом, главная стратегия QA3 состоит в том, чтобы
работать в основном с дизъюнктами из СПИСКА, периодически
пополняя его. новыми подходящими дизъюнктами из множества
ПАМЯТЬ.» Если в СПИСОК внести дизъюнкт, который не имеет
отношения к доказательству, то это может породить тем больше
бесполезных дизъюнктов, чем «длиннее» исходный дизъюнкт.
Чтобы избежать этого, стратегия QA3 ограничивает включение в
СПИСОК дизъюпктов большой длины.
Когда QA3 задается вопрос и система пытается доказать ДА,
исходный СПИСОК содержит только дизъюнкты отрицания
вопроса, которые составляют исходное опорное множество,
пополняемое в дальнейшем порождаемыми дизъюнктами. К этому
СПИСКУ применяется модифицированная стратегия предпочтения
единичных элементов, устанавливающая приоритет па резолюцию
дизъюпктов. По мере выполнения этой стратегии дизъюнкты из
ПАМЯТИ, допускаемые в качестве рабочих к резолюции с
дизъюнктами из опорпого множества СПИСКА, добавляются к
СПИСКУ, не входя в его опорное множество. Стратегия выполняется
до тех пор, пока при заданном ограничении на порядок резоль-
вируемых дизъюпктов еще можно применять резолюцию.
Если таким образом достигается предел, то это означает пе-
успех в получении ответа ДА. В этом случае СПИСОК временно
сохраняется, а система QA3 переходит к попытке получить от-
,вет НЕТ. Для этого она аналогичным образом накапливает и
§ 10.4. ПЛАНИРУЮЩАЯ СИСТЕМА STRIPS
213
сохраняет новый СПИСОК ДИЗЪЮНКТОВ. При неуспехе и в
этом случае система QA3 формирует ответ ДОКАЗАТЕЛЬСТВО
НЕ НАЙДЕНО или НЕДОСТАТОЧНО ИНФОРМАЦИИ.
Отмеченная выше стратегия замещения состоит в следующем.
Каждый новый порожденный дизъюнкт рассматривается с точки
зрения того, не может ли он быть заменен другим, более
коротким из СПИСКА; кроме того, выясняется, нельзя ли заменить в
СПИСКЕ все дизъюнкты большей длины. В обоих случаях более
длинные дизъюнкты вычеркиваются из СПИСКА.
Описанная стратегия QA3 полна в том смысле, что она
обычно находит все те доказательства, которые укладываются в
заданные ограничения по времепя и объему памяти.
Примепепие системы QA3 в различных областях знаний
показало, что в силу недостатков, присущих припципу резолюций
(см. § 5.4), вывод в такой системе получается медленным, очепь
детальным, что несвойственно человеку.
§ 10.4, Планирующая систему STRIPS
Система STRIPS работает в реальном мире во взаимодействии
с исполнительной системой PLANEX (Plan Executive).
10.4.1. Представление знаний. Проблемная среда системы
STRIPS включает модель мира, набор операторных схем и цель.
Модель мира представляется в виде набора ППФ логики
предикатов первого порядка, которые выражают собой факты
(например, ATR(a) — робот находится в пункте а) и законы, например,
(У/у) (V*) {[ ATR (уЩу ф z)] => ATR (*)},
т. е. робот не может одновременно запимать два различных
пункта у и z.
Операторная схема определяется наименованием, списком
параметров и описаниями в виде ППФ языка логики предикатов
первого порядка: условий применения действия и результата
действия. Последний в свою очередь содержит список
вычеркиваний и список добавлений*). Операторы порождают различные
модели мира путем генерирования новых фактов. Цель также
представляется в виде-ППФ той же логики.
Необходимость различать параметры и обычные кваитифици-
рованные переменные, входящие в описание проблемной среды,
заставляет несколько модифицировать принцип резолюций,
рассмотренный в § 5.2, о чем будет сказано чуть позже.
10.4.2. Поиск. Стратегия поиска составляет комбинацию из
модифицированной стратегии GPS и принципа резолюций. Пер-
*) Примеры операторных схем приведены ниже при рассмотрении
иллюстративного примера.
214
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
вая используется для определения различия и выбора
подходящего оператора, второй — для логического вывода целевых ППФ
и условий применения операторов. Таким образом, в системе
STRIPS процесс доказательства теорем ограничен рамками одной
(исходной или текущей) модели мира и полиостью отделен от
процесса поиска в пространстве моделей. Последний управляется
стратегией GPS.
В качестве программы доказательства теорем используется
программа QA3.5 [Гарвен, Клинг, 1969], обобщенная на случай,
когда схемы ППФ содержат параметры. Обобщение
производится за счет модификации алгоритма унификации, в котором (для
осуществления резолюций) разрешены следующие типы
подстановок: вместо переменных могут быть подставлены перемепные,
константы, параметры и функциональные термы, не содержащие
переменных; вместо параметров могут быть подставлепы
константы, параметры и функциональные термы, не содержащие
функций Сколема, переменных или параметров.
Тот факт, что один и тот же параметр может иметь много
вхождений в множество дизъюнктов, требует ввести и другое
изменение в процедуру доказательства. Пусть С — резольвепта
дизъюнктов Ci и С2, получаемая путем подстановки некоторого
терма t вместо параметра р. Тогда мы должны р заменить на t
во всех дизъюнктах, являющихся производными от С. В
остальном система доказательства теорем STRIPSa ничем не отличает-»
ся от принципа резолюций в исчислении предикатов первого
порядка,
Модификация стратегии GPS позволяет выделять различия
между текущей моделью и целью и отыскивать подходящие для
уменьшения этих различий операторы [Эрнст, Ньюэлл, 1969].
В системе STRIPS поиск начинается с попытки вывести
целевую формулу G0 из исходной модели мира М0. Для этого
программа доказательства теорем ищет противоречие в множестве
дизъюнктов Ш0 U G0). Если оно обнаруживается (выводится
пустой дизъюнкт), то исходная задача решается на этом шаге
тривиальным образом, т. е. исходная модель М0 удовлетворяет цели
G0. Если же указанное противоречие не обнаруживается, то
формируется так называемый незавершенный вывод D0. Этот вывод
представляется набором дизъюнктов, соответствующих отрицанию
формулы цели (в данном случае — б0), плюс все их производные,
если таковые есть, минус те дизъюнкты, которые исключаются
благодаря применению ограничивающих стратегий (например,
стратегий замещения и оценки предикатов).
Незавершенный вывод А, принимается в качестве различия
между М0 и G0, которое связывается с данным узлом (Д/0, G0).
Далее происходит поиск операторов, подходящих для
уменьшения полученного различия. Это такие операторы, действие кото-
§ 10.4. ПЛАНИРУЮЩАЯ СИСТЕМА STRIPS 215
рых па модель среды позволяет продолжить доказательство. При
поиске подходящего оператора значения его параметров
подвергаются частичному или полному перебору.
Поиск оператора состоит из двух шагов. На первом шаге
составляется упорядоченпый список операторов-кандидатов. Выбор
операторов-кандидатов основан на простом сравнении предикатов
из различия D0 с предикатами из списка дополнения оператора.
Второй шаг состоит в применении программы доказательства
теорем для определения того, есть ли в указанном списке
дополнений дизъюнкты, которые могли бы продолжить вывод после
применения этого оператора. Если этот шаг оказался успешным, то
оператор-кандидат с соответствующими значениями параметров
рассматривается как подходящий для уменьшения различия D0.
Когда таким образом оператор-кандидат найден, условия его
применения принимаются в качестве повых подцелей системы.
Рассмотрим простой пример. Пусть перед роботом поставлена
задача — перейти в точку Ь. Тогда G0 =3 ATR(fc) и до тех пор, пока
робот не окажется в точке &, попытки найти искомое
доказательство будут безуспешными. Очевидно, что частный случай goto(ra,
Ь) оператора goto(m, п) — перейти из пункта т в пункт п —
подходит для уменьшения различия D0 = 6?0, поскольку
результат—• ATRC6) позволяет продолжить вывод G0 (в данном случае
и закончить его). Роль новой подцели G{ будет играть
соответствующая схема ППФ — условия применения, скажем, ATR(m).
Система STRIPS поступает с подцелью G4 так же, как и с
целью. Она снова использует доказательство теорем для вывода
G, из Л/0. Здесь опять возможны два случая. Если система не
находит доказательства, то она аналогичным образом формирует
различие Di между М0 и Gt и устанавливает подцели,
соответствующие формулам условий применения соответствующих
операторов-кандидатов. Если система выводит Gi из Л/0, то
соответствующий частный случай оператора используется для
преобразования модели Д/о в новую модель Д/,. В вышеприведенном
простом примере подцель есть Gt -» ATR(w). Если ATRU)e Af„,
то частный случай Gu а именно ATRU), может быть выведен из
Л/0. В этом случае оператор goto(a, b) применяется к модели М0
и образует модель Мь включающую ATR(6). Затем STRIPS
продолжает попытки вывести G0 из Ми В нашем примере G0
тривиальным образом следует из Mlt Однако, если вывод G0 не
удается, устанавливаются соответствующие подцели и процедура
начинается сначала.
Иерархию цели, подцелей и моделей, порождаемую в процессе
поиска, можно представить в виде дерева поиска. Каждая
вершина такого дерева имеет вид (модель среды, (список подцелей))
и соответствует задаче достижения (по порядку) подцелей
целевого списка из указанной модели среды.
21G
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
Пример дерева поиска показан на рис. 10.6. Верхняя верши-
па (Л/о, (G0)) представляет исходную задачу: достичь G0 из
MQ. В данном случае устанавливаются две альтернативные
подцели Ga и Gb. Они добавляются в двух последующих дочерних,
вершинах в начале целевого списка. Выбрав левую ветвь,
предположим, что в вершине Ш0, (G0, G0)) цель Ga удовлетворяется
(Щ,(еР))
(M0,(Ga,G0))
Г v
Шва» ■
Г
(Mb(Gd,G0))
А
(M0,(Gb,Ga))
\
(0ff,(Gc,Gt„Gff))
A
Щ,(еь,&,))
V
Шв0»
(M3,(Ge,G0))
fe
ШЫ)
(M3l(Gf,G0))
Рис. 10.6. Дерево поиска в системе STRIPS.
в Мо и тогда соответствующий оператор, скажем /а, применяется
к модели Мо для получения модели Ми Если следовать далее по
этой ветви, задача будет состоять в том, чтобы цель G0
удовлетворялась в модели Ml9 и эта задача представлена вершиной
Ши (Go)).
Следуя по другому пути, получим вершину (М4, (G0)).
Предположим, что формула-цель G0 удовлетворяется в ilf4, т. е.
вершина Ш^ (G0)) является конечной. Тогда последовательность
операторов /с, /6, /е представляет решепие задачи.
Этот пример ясно показывает, что до получения
окончательного решения совершенно неярпо, какое место в этом решении
займет тот или иной оператор. Легко видеть также, что стратегия
системы STRIPS есть ^.„-стратегия, рассмотренная в § 8.3.
В системе STRIPS эта стратегия сочетает многие преимущества
§ 10.4. ПЛАНИРУЮЩАЯ СИСТЕМА STRIPS
217
прямого и обратного поиска. Когда система генерирует новую
вершину Ш, (G{, G<-i, ..., G0)), она немедленно проверяет,
удовлетворяется ли первая подцель списка Gt: если да, то
применяется соответствующий оператор, порождая новую производную
вершину; если нет, различие запоминается вместе с вершиной.
Начало
М+М0
СЦ+Go
Вершина.+ ЩСЦ))
JL
Да
С -+-первая цель
из СЦ
I
(М удовлетворяетл
~\ цели G? ,
Нет
Неудача
О пред. разл. Д для
верш, и залом, верш.
Нет (ffb/jjop верш.Т яе имеюшейЛ
к дочерних верш. ? )
уда
Цель <Г\ Да
\лоследняя?)
Успех
Нет
Вершина -*- выбор верш.
I
М -*- модель среды,
связанная с верш.
\СЦ~*- список целей вершины
Генерирование доч. верш.
М+модель средь/ Mf
сц+сц\е
Вершина -*-(М,(СЦ))
Генерирование доч. верш.
Втор по Л подходящ.
оператора f
СЦ+ СЦ + условия Г
Вершина ■«- (М, (СЦ))
Рис. 10.7. Схема работы планирующей системы STRIPS: СЦ — список
целей.
Не имея в виду те производные вершины, которые
получаются в результате применения операторов, процесс получения
остальных производных вершин можно описать следующим
образом: STRIPS выделяет некоторую вершину и использует
различие, запомненное вместе с вершиной, /для отбора подходящих
операторов. Затем она использует условие применения оператора
для получения новой вершины. Схема на рис. 10.7 дает
представление о процессе поиска в системе STRIPS.
Система STRIPS располагает эвристическим механизмом,
управляющим процессом генерации вершин. С этой целью
используется оценочная функция, которая .учитывает такие факторы,
как число оставшихся подцелей в списке целей, число и тип
предикатов в оставшихся формулах целей и сложность различия,
связанного с данной вершипой.
218 ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
10.4.3. Пример. Поясним работу системы STRIPS на
рассматриваемом уже ранее примере решения задачи «обезьяна и
бананы».
Модель мира Л/в-<АТШа), АТСВОХ, Ь\ НВ}, где ATRU) —
обезьяна на полу в точке х; АТСВОХ, у) — ящик на полу в
точке /у; НВ — лапы обезьяны пусты.
Цель G0 = НВ — в лапах обезьяны бананы.
Операторные схемы:
/,(го) — взобраться на ящик в точке го.
Условия: ATR(ro)& АТСВОХ, го).
Список вычеркиваний: ATR(ro).
Список дополнений: ATR(BOX).
/2(го, п) — подойти из точки го в точку ti.
Условия: ATR(ro).
Список вычеркиваний: ATR(ro).
Список добавлений: ATRCra).
fs(m, n) — передвипуть ящик из точки го в точку п.
Условия ATR(ro) & АТСВОХ, го).
Список вычеркиваний: ATR(ro) & АТСВОХ, го).
Список добавлений: ATRU}& АТСВОХ, /г).
/4 — схватить бананы.
Условия: ATR(BOX) & АТСВОХ, с) & НВ.
Список вычеркиваний: НВ.
Список добавлений: НВ.
Решение задачи будем сопровождать построением дерева
поиска, представленного в виде И/ИЛИ дерева (см. рис. 10.8).
1. G0 не следует логически из Д/0, и полное различие Д>в IIB.
2. Ho Do выбираем /4 и устанавливаем подцель
G, = ATRCBOX) & АТСВОХ, с) & НВ.
3. G, пе следует из Д/0, и полное различие для Gt в
результате незавершенного вывода составляет
Di - ATRCBOX) & АТСВОХ, с).
4. Пусть наиболее трудно устранимое различие в Dx будет
Di= ATRCBOX), тогда выбирается /Дго) и подцель
G2 - ATR(ro) & АТСВОХ, го)*).
*) Здесь и в дальнейшем выбор альтернатив сознательно осуществ-
дяется не лучшим образом, чгобы проследпть все паиболее характерные
моменты поиска.
§ 10.4. ПЛАНИРУЮЩАЯ СИСТЕМА STRIPS
219
5. Применяя принцип резолюций для установления
выводимости G2 из Л/0, получаем два варианта незавершенного вывода
и соответственно два различия для G2: (a) D2 = AT (BOX, а) и
(б) Z>; = ATR(6).
6. Выбираем вариапт (а) и находим /3(/?г, а) и G3 = ATR(m)&
&АКВОХ, т).
м4 ®
fy=Gj, цикл
Рнс. 10.8. Дерево поиска решения задачи «обезъяпа и бапапы» (Mt над
прямоугольником с оператором f) обозначает модель мнра, получаемую в
результате применения оператора /j).
7. Полное различие для 6?3 составляет: а) Д3== AT (BOX, а),
принятие которого ведет к циклу и который мы отбрасываем
для упрощения, и б) D3 = ATR (b).
8. По D3 находим /гСлъ, Ь) и G5 = ATR(m).
9. Gb следует из Л/0, применяем /2(а, Ь),
10. Получаем новую модель среды
A/, = {ATR(&), AT(BOX, Ь), ИВ).
И. Из Mi следует G3, применяем /Д6, а).
220
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
12. Получаем М2 « (ATR(a), АТЧВОХ, а), ИВ} (заметим, что
заданное упорядочение различий привело к удлинению плана и
тем самым к увеличению времени его поиска (обезьяна подходит
к ящику и передвигает его туда, где она была раньше)).
13. Из М2 следует вариант (а) (см. шаг 6), поэтому
применяем Д(а).
14. Получаем М3 = (ATR(BOX), AT(BOX, a), I1B).
15. Полное различие для Gi теперьсоставляет/}1 = АТ(ВОХ, с).
16. По D[ находим /а(т, с) и G6 = ATR(m) & АТ(ВОХ, т).
17. Полное различие для G6 составляет De==ATR(a).
18. По Д, находим f2(m, а) и G7 = ATR(m).
19. Полное различие для G7 есть D7 = ATR(m), no Z>7 находим
]г{ти т) и G8 = ATR(mi), и далее цикл, так как подходящего
оператора нет (пет оператора «слезть»), на этом пути решения
нет, и поэтому происходит возврат в точку ветвления шага 3.
20. По различию Di = AT (BOX, с) (см. шаг 3, второй
вариант) находим f3(m, с) и G2 = ATR(m) & АТЧВОХ, т).
21. Полное различие для G2 составляет: a) Dz = ATR(&) и
б) £>2 = AT (BOX, a).
22. По D2 находим /2Ы, Ъ) и G3 = ATR(m).
23. G3 следует из Л/0» применяем /2(а, &).
24. Получаем Л/, = {ATR(6), АТ(ВОХ, Ь), НВ}.
25. Из Mt следует G2, применяем /3(6, с).
26. Получаем М2 =т= (ATR(c), AT(BOX, с), HJ3}. ^
27. Полное различие для Gi составляет теперь D^ATR^OX).
28. По-2?! находим Д(т) и G4 = ATR(ro) & АТ(ВОХ, т).
29. G4 следует из М2, применяем /Дс).
30. Получаем Мл - (ATR(BOX), АТШОХ, с), НВ}.
31. Gi следует из Д/3, применяем /4.
32. Получаем М, - (ATR(BOX), АТШОХ, с), НВ}.
33. G0 следует из М4.
Итак, план имеет вид:
ШОДОЙТИ (а, 6), ПЕРЕДВИНУТЬ (6, с), ВЗОБРАТЬСЯ (с),
СХВАТИТЬ БАНАНЫ).
Полученное решение отражено на рис. 10.8, где цифры в
кружке означают номер шага решения, а запись f(s) означает
результат применения оператора / к ситуации s (при движении
в обратном направлении пока неизвестной), которая должна
уточниться после достижения цели G: ситуация находится путем
продвижения в прямом направлении в виде соответствующей
модели среды Ш,
10.4.4. Обучение. Обучение системы STRIPS заключается в
обобщении получаемых им конкретных планов в виде макроопе-
§ 10.4. ПЛАНИРУЮЩАЯ СИСТЕМА STRIPS
221
раторов с целью использования последних для решения других
конкретных задач. Указанное обобщение основано на формализме
треугольных таблиц (ТТ), рассмотренного ранее в § 3.2. Однако
применительно к системе STRIPS необходимо ввести
дополнительные понятия, связанные с ТТ [Файкс, Харт, Нильсон, 1972ah
Содержимое ячеек ТТ представляет собой высказывания.
Множество помеченных высказываний (у —1)-го среза плана
является множеством условий применения /-го оператора fa.
Результат Si представляет собой список добавлений оператора /f. Часть
плана, начинающаяся с /'-го оператора fh составляет /-й
остаток плана.
Назовем /*-м ядром ТТ прямоугольную подтаблицу ТТ,
содержащую ячейку (0, п+l) и строку /. Легко видеть, что /-и
остаток плана применим к модели мира, если все отмеченные
высказывания в /-м ядре истинны в этой модели. Действительно, если
это так, то первый оператор f} /-го остатка применим к модели
Afj. В результате применения порождается новая модель Alj+U в
которой будут истипны высказывания $,. Так как все отмеченные
высказывания (/+1)-й строки истинны, то к Mj+l применим
оператор /j+1. Продолжая аналогичные рассуждения, мы
устанавливаем, что /-й остаток плана применим к модели Ms.
Итак, обобщение конкретных планов в виде макрооператоров
осуществляется следующим образом [Файкс, Харт, Нильсон,
1972, б]. На первом шаге исходный конкретный план
преобразуется в наиболее общую форму. Для этого:
1. Каждое вхождение константы в первом ядре, в том числе
одной и той же константы, заменяется отдельным параметром.
2. Остальные столбцы именуются описаниями операторных
схем со своими неповторяемыми параметрами.
3. В столбцах i (i = 1, 2, ..., п) исходного плана все
константы в высказываниях заменяются соответствующими
параметрами операторных схем.
Пусть на рис. 10.9 в виде ТТ представлен конкретный план»
где INROOM (ри Рг) — объект р{ (робот или ящик) находится п
комнате р2, CONNECTS (pu р2, р$) — комнаты р2 и ръ соедипены
дверью ри GOTHRU (ри р2, р3) — робот идет через дверь pi из
комнаты р2 в комнату р3 и PUSHTHRU (р1? р2, Рг* рд — робот
толкает ящик /?i через дверь р2 из комнаты р3 в комнату /?4,
знаком звездочка, как и прежде, отмечены исходные данные для
соответствующих операторов.
Тогда в результате 1-го шага обобщения получается план,
изображенный на рис. 10.10.
На втором шаге введепные параметры уточняются таким
образом, чтобы отмеченные высказывания ./-и строки (/ = 1, 2, ...
• •., п) обеспечивали применение операторной схемы / п
исходный план представлял частный случай получаемого обобщения.
222
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
Для этого применительно к полученному па 1-м шаге плану
повторяется вывод условий применения каждого /-го оператора /j из
множества помеченных звездочкой высказываний, входящих в
;-ю строку, и полученные при этом подстановки используются
*INROOM (ROBOT, R/J
\*C0NNE0TS(B/,R/,R2J
\*INROOM(BOX, R2)
\* CONNECTS (B1, R!,R2)
* CONNECTS (я, & г)+
W CONNECTS (x,i,y)
&0THRU(V1,R1,R2)
*!NROOM (ROBOT, R2)
PUSH7HRU(B0X,l}fflM
1NR00M (ROBOT, R1)
ЖООМ (BOX, R1)
Рис. 10.9. Ыачальпая модель плана перемещения ящика из компаты /?2 в
компату /?1.
4NROOM (ROBOT, р2)
* CONNECTS(pJfp2,pBj\
* IN ROOM (рб, pB)
* CONNECTS (p8,p9,p5)
^CONNECTS(x,y,z)-*-
-*CONNECTS(x,Z,y)
GO THRU(pj, p2, p5)
*INROOM (ROBOT, p5)
PUSHTHRU(pOtp8, p5, p9)
IN ROOM'(ROBOT, p9)
IN ROOM (pff, p9)
Рис. 10.10. Модель плана после 1-го шага обобщения.
для уточнения плана. Для рассматриваемого примера указанные
выводы имеют вид:
Для GOTIIRU:
1. INROOM(pl, />2)-факт.
2. INROOMtROBOT, р12) VCONNECTS(pll, р12, р13) — от-
рицапие теоремы.
3. CONNECTS(pll, pl2t р13) из (1) и (2), подстановки: р2/р12
и ROBOT/pl
4. CONNECTS(p3, р4, р5) - факт.
5. □ из (3) и (4), подстановки: рЗ/pll, р2/р4, р5/р13.
§ 10 4. ПЛАНИРУЮЩАЯ СИСТЕМА STKIPS
223-
Для PUSHTIIRU:
1. INROOM(/?6, pi) - факт.
2. INROOJVKROBOT, />16) V INROOM(pl4, pl6) V CONNECTS X
X (plo. /И6, рП) — отрицание теоремы.
3. INROOJVKROBOT, pi) V CONNECTS(pl5, pl% рП) из (1) и
(2), подстановки: р6/р14, p7/piG.
4. INROOM(ROBOT, /?5) - факт.
5. CONNECTS (pi 5, /ю, /?17) из (3) и (4), подстановка р5//?7.
6. CONNECTS!*, г/, z) V CONNECTS**, z, у) — аксиома.
7 CONNECTS(pl5, /П7, />5) из (5) и (6), подстановки: р!5/х,
pb/y, pll/z.
8. CONNECTS(/?8, р9, /НО)-факт.
9. D из (7) и (8), подстановки: р8/р15, р9/рП, pb/piO.
8 итоге получаем обобщенный план, приведенный на рис. 10.11.
*IRROOM (р7,р2)
* CORRECTS (рд,р4,р5)\
* JRRCOM (pC, p7) !
* CORRECTS(p8,p9,pf0)
* CORRECTS (x,i/,z)+
•*• CORRECTS (£,g, у)
GOTRRU(pf1} p12,p73)
*lNROOM(ROB0T,ptt)\
\P0SRTRRU(p14,p!5,pl0,pl7)
IRROOM (ROBOT, p17)
MROOM (pH,p17)
Рис. 10.11. Модель плана после 2-го шага обобщения.
Иа третьем шаге осуществляются дополнительные
преобразования с целью избежать излишнего обобщения и возможного
противоречия. Излишнее обобщение возможно в случае, когда одно и
то же высказывание в пачальной модели плана помечается хотя
бы в двух строках. Тогда па 1-м шаге это высказывание
преобразуется в два различных высказывания. Во многих случаях это
приводит к полезным обобщениям. В нашем случае, например,
это приводит к преобразованию CONNECTS(Z)l, /?1, R2) в.
CONNECT8(/tf, p2% рЪ) и CONNECTS(/>8, p9, р5), что является
обоощепием конечной комнаты рЪ (которая смежна с рг или />0)
и перемещения ящика (не обязательно, перемещать в ту
комнату, в которой первоначально находился робот). Однако, если р2
и ро не использовались бы оба как параметры операторов в пла-
ие, то их без ущерба можно было бы считать эквивалентными.
224
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
При обобщении возможно противоречие в силу нарушения
молчаливого предположения, сделанного на 1-м шаге (см. п. 3),
о том, что вычеркивания в наиболее общей IT должны бьиь
теми же самыми, что и в начальной ТТ. Пусть, например, в
начальной ТТ содержатся предикаты АТ(ВОХ, а) и А1ЧВОХ, Ь),
соотнесенные соответственно с ее ;-й и (/ + 1)-й строками, и пусть
АТ(ВОХ, а) вычеркивается в результате применения оператора
/j. Пусть также в обобщенной ТТ эти предикаты принимают вид
AT(/?i, р2) и AT(/?t, р3) соответственно. Тогда вполне возможно,
что при нахождении частной реализации полученного таким
образом обобщенного плана параметры р2 и р3 будут заменены на
разные константы с и d и при этом процедура вычеркивания по
исключит, как это требуется, предикат ATiph с). В этом случае
АТ(ри с) автоматически перейдет в (/' + 1)-ю строку и
возникнет противоречие.
Для избежания таких противоречий необходимо проводить
корректировку обобщенной ТТ па основе оценки результатов
применения к ней процедуры вычеркивания. Применение списка
вычеркивания оператора /j к высказыванию R /-и строки дает
положительный результат, если высказывание R унифицируется
с некоторыми литерами списка путем подстановок типа р2\рх
или с |/?1.
В этом случае высказывание R вычеркивается, иначе оно
сохраняется и должно перейти в (/+1)-ю строку. Для того чтобы
при этом не возникло вышеупомянутого противоречия, в (/+ 1)-ю
строку включается не R, а одна пз импликант: р\Фрг-*- R пли
р1Ф с -> R. Если при этом R оказывается помеченным, то в
ячейку (0, /+1) добавляется высказывание р^Ф рг или р{ Ф с
соответственно. На этом третий шаг обобщения плана завершается,
и полученный обобщенный план представляет макрооператор.
Рассмотренный процесс представляет типичный процесс
обучения решателя в ходе решения им задач. Этот процесс
позволяет повысить эффективность системы при условии, что она будет
способна: 1) использовать любую часть макрооператора в ходе
планирования; 2) сводить к минимуму в каждом конкретном
случае избыточность макрооператора, являющуюся естественным
следствием результата обобщения; 3) регулировать процесс
накопления макрооператоров в системе.
Рассмотрим, как все это осуществляется в системе STRIPS.
Пусть в процессе планирования для уменьшения очередного
различия выбирается макрооператор F = /ь /2, ..., /„,
представленный в виде соответствующей ТТ. Макрооператор F содержит п
различпых списков добавлений sifj (/ = 2. ..., д+1),
принадлежащих его jf-м срезам. Эти списки добавлений используются
обычным способом для выбора наиболее подходящего из них для
данного различия. Пусть таким образом выбран список sitj. Очевидно,
§ 10.4. ПЛАНИРУЮЩАЯ СИСТЕМА STRIPS
225
что в этом случае нас перестает интересовать (;+1)-й остаток
F, поэтому из /-го среза F необходимо удалить все те операторы,
которые предназначались для формирования условий
применения (/-Ь1)-го остатка F, т. е. для всех AU=/+1, ..., п).
Кроме того, из /-го среза F необходимо удалить и все те операторы,
которые, не влияя на условия применения других операторов
/-го среза, ничего не добавляют для уменьшения различия.
В итоге имеет место следующий алгоритм упрощения
макрооператора F:
Шаг 1. Отмечаются (например, кружком) высказывания из
Sij, которые входят в незавершенный вывод, представляющий'
различие.
Шаг 2. Снимаются метки у всех высказываний,
составляющих условия применения fj+i.
Ш а г 3. Находится первый столбец справа, начиная с /-го,
не содержащий отмеченных высказываний, например, ih(ih<j).
Тогда у всех высказываний ik-& строки снимаются метки, a f\k
исключается из /-го среза F.
Шаг 4. Процесс, соответствующий шагу 3, повторяется до
первого столбца. Оставшаяся в результате последовательность
операторов /-го среза F
выдается как упрощенный
макрооператор,
пригодный для уменьшения
данного различия.
Пример 1.
Рассмотрим ТТ, приведенную на
рпс. 10.12. Числа в
ячейках представляют
высказывания: отмеченные
обведены кружком,
пригодные для уменьшения
различия помечены
звездочкой. В этом примере / = 6.
Алгоритм работает
следующим образом:
1) снимается метка у
высказывания 18;
2) столбец 4 (первый
справа) не содержит
отмеченных высказываний,
поэтому снимается метка у высказывания 11 и оператор /4
исключается;
6) следующий столбец 3 аналогичен столбцу 4, поэтому
исключается оператор /3;
4) подобным образом по столбцу 1 исключается оператор /А.
*5 Е. И. Ефимов
/
Z
д
4
5
6
7
©
®
©
®
©
®
©
«
11,%
13
11,12
®%
72
12
ъ
14,15,
16
15,16
©
16
16*
ъ
17,18,
19,20
17,18
19,20
17,18
Ц®
17
ъ
21,22,
23
21,22
21,22
21
6
®
24
24
ft
(Bf
ъ
2В
Puc. 10.12. Иллюстрация алгоритма
упрощения макрооператора.
226
ГЛ. 10 ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
1
г
г
®
0
©
4
®
1В
18
ъ
®
2*
ъ
25
О 1 2 о
Рис. 10.13. Результат
у и рощей и я
макрооператора.
В результате получается последовательность операторов /2$.
/б, U (см. рис. 10.13).
Использование упрощенного макрооператора связано главным
образом с формированием его условий применения. Поскольку
упрощенный макрооператор представляет часть полного макро-
оператора, необходимо уметь автоматически формировать
соответствующие условия для любого остатка
макрооператора. Ранее было показано, что
для применения /-го остатка плана
достаточно истинности всех отмеченных
высказываний в ;-м ядре. Для выявления
допустимых ядер используется процедура
сканирования ячеек ТТ, предложенная Файк-
сом [1971].
Очевидно, что чем меньше i и больше U
тем в большее число ядер одновременно
входит ячейка (г, /) ТТ. Это позволяет
целенаправленно просматривать ячейки ТТ в
порядке возрастания i и уменьшения /. Как
только находится ячейка U, ;"), в которой
хотя бы одпо высказывание не может быть доказано из текущей
модели М (не является истинным), из дальнейшего рассмотрения
исключаются все ячейки (&, /), &>/, так как они эаведомо и&
войдут в допуртимые ядра.
По мере выяснения истинности высказываний в ячейках ТТ
путем их доказательств получаемые при этом подстановки
параметров макрооператора немедленно распространяются на всю
таблицу. Если возникают альтернативы, то необходимо
осуществить процедуру возврата в точке ветвления дерева возхможностей.
С пЬмощыо процедуры сканирования находится /-и остаток
макроонератора с наивысшим / (наиболее короткий), применимый
к модели М. Если же неприменим весь макрооператор, то
конъюнкция отмеченных высказываний в первом ядре фиксируется
как новая подцель.
Накоплепие макрооператоров помимо увеличения
возможностей системы STRIPS может привести к избыточпости ее зпапий
и, как следствие этого, к снижению эффективности поиска.
Помимо очевидного пути — введения механизмов «забывания» ма-
лопспользуемых макрооператоров — рассмотрим более
конструктивный иуть регулирования количества макрооператоров в памя-
ми STRII*Sa. Он основан на исключении макроонераторов,
являющихся частью более общих макрооператоров. Это тем болеа
необходимо, поскольку указанное включение свойственно самойг
процедуре планирования STRIPSa.
Пусть, решая задачу, STRIPS включает в план некоторый
макрооператор Fx и затем обобщает полученный план в виде но-
§ 10.5. ПЛАНИРУЮЩАЯ СИСТЕМА AHSTRIPS
227
^ого макрооператора F2. Если для каждой подстановки
параметров в Ft существует такая же подстановка параметров в F2
(каждый конкретный результат Fx представляет часть
соответствующего результата F2), то F% может быть исключен из
памяти.
Если новый макрооператор F2 включает части старого Ft и
относительно общих частей Fi и F2 имеют место аналогичные
ранее указанным подстаповки, то из F2 исключаются части Fu
Пример 2. Пусть имеют место два макрооператора: старый
Ft: /i(/?D, /«(pi, р2)щ /8(рЗ), Д(рЗ, cl), /ДрЗ), Д(р4, р5) и новый
F2: Мрв\ /4(р6, cl), /,(/>7), /»(р6, p7).
Возможны следующие исключения:
1) /i(pl) и /2(р1, р2) в Fi могут быть исключены, так как Ft
содержит более общую подпоследовательность /i(p3), /2(p4, /?5);
2) /3(рб) и /4(р6, cl) в F2 могут быть исключены, так как в
Fi имеются /3(рЗ) и /4(/?3, cl).
Оператор /i(/?7) не может быть исключен из F2 ввиду FA: в F2
подпоследовательность /3(/?6), /4(р6, cl), /4(р7) является более
общей, чем в F4 подпоследовательность /3(/?3), /4(рЗ, cl), /ДрЗ).
§ 10.5. Планирующая система ABSTRIPS *)
10.5.1. Представление знаний. Для решателей практических
задач необходимо автоматически формировать абстрактные
пространства различных уровней из базового пространства, в
котором работает система STRIPS. В.системе ABSTRIPS
абстрактные пространства определяются уровнем детализации условий
применения операторов. Такой подход позволяет: 1) оставлять
неизменной модель мира — нет необходимости вычеркивать из
нее несущественные (для данного уровня абстракции) детали, их
можпо просто не учитывать; 2) оставлять неизменными
операторы по той же самой причине.
Таким образом, абстрактные пространства отличаются друг
от друга лишь условиями применения операторов: чем выше
уровень абстракции, тем меньше литер содержат условия
применения. Базовое прострапство содержит все литеры условий.
Исключаемые литеры и будут несущественными деталями в том
смысле, что учитывающий их план может быть найден и
выполнен, если будут выполнены более значимые литеры.
Например, рассмотрим оператор PUSHRUDR, описывающий
"проталкивание роботом объекта через дверь в смежпую комиату.
На верхпем уровне абстрактного пространства оператор может
быть применен тогда, когда существует путь через дверь в
требуемую комнату и объект можпо протолкнуть через нее. На бо-
*) Abstraction Basis STRIPS (базис абстракций плюс STRIPS),
15*
228
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
лее нижнем уровне необходимо потребовать, чтобы робот и
объект находились в одной комнате. На еще более нижнем
уровне абстрактного пространства дверь должпа быть открыта.
Наконец, в исходном, базовом пространстве робот должеп
находиться рядом с ящиком и ящик — рядом с дверью.
Существует много подходов к установлению значимости
литер условий применения оператора. Один из них основан на
экспертной ранжировке литер. Например, если взять оператор
TURNONTHELAMP(Z) (включить лампу), то для условий его
применения существенно,
ТУРЕ ( ) COLOR ( ) Ранг 4 что I есть лампа, затем что
"^^^ ^^^ она в комнате, менее суще-
I/ШОаГ^) Ранг 2 ствепно, что у лампы есть
1^ ^\^ шпур и штепсель и совсем
PLUGOEDIN ( ) UNPLUGGEV ( ) Ранг 2 несущественно, что находит-
'ч^1 ^^ ся рядом с лампой. В ре-
МЕХТТО ( ) Ранг 1 зультате получаем частичное
упорядочение литер по ран-
Рис. 10.14. Пример экспертной раижи- гам> приведенное на рис.
ровки литер условий применения one- 10.14.
ратора. Другая крайность —
установление значимости на
основе исчерпывающего анализа п\ возможных упорядочений п
литер в условиях применения. Подобному анализу можно придать
дедуктивной характер, т. е. упорядочивать литеры по их
выводимости из других истинных литер.
*В ABSTRIPSe принят промежуточный подход. Во-первых, все
литеры, истинпостные значения которых не могут быть изменены
никаким оператором, получают максимальный вес. Во-вторых,
каждая оставшаяся литера последовательно испытывается па
частичную упорядоченность. Если находится короткий план
достижения литеры из состояния, в котором все ранее
исследованные литеры истинны, то ей приписывается вес, равный ее рангу
в ранее полученном на основе экспертной оцепки частичном
упорядочении. Если такой план не находится, то литере
приписывается вес, больший чем наивысший ранг в упомянутом
частичном упорядочении, но меньший максимального веса.
Если вернуться к нашему оператору TURNONTHELAMPU),
то получим следующие веса литер его условий применения.
Литера TYPE (/, лампа) не может быть достигнута никаким
оператором, следовательно, ей присваивается максимальный вес (в
данном случае — 6). Две литеры INROOM пспытываются
следующим образом (для литер, предикаты которых имеют
одинаковый ранг в частичном упорядочении, порядок их исследования
произволен): они не могут быть достигнуты из состояния, в
котором утверждение TYPE (Z, лампа) истинно, и, таким образом,,
§10 5 ПЛАНИРУЮЩАЯ СИСТЕМА ABSTRIPS
229
им присваивается вес выше, чем наивысший рапг в частичном
упорядочении (в данном случае — 5). Литера PLUGGEDINU)
достигается из состояния, в котором литеры INROOM и TYPE
истинны. Таким образом, этой литере присваивается вес, равным
его рангу, т. е. 2. Наконец, литера NEXTTCKAf, l) достигается из
состояния, в котором все ранее взвешенные литеры истинны,
и ей присваивается вес 1.
Если выражать значимость (вес) литер числом в фигурных
скобках, то для вышерассмотренного оператора условия
применения будут окончательно ранжированы следующим образом:
{6JTYPEU, лампа) & (3 ЫШШЬЮОМШ, гх) &
{5} INROOM U, гх) & {2} PLUGGEDIN (Z) & {1} NEXTTO Шл I).
В итоге получаемые веса лнтер условий применения
операторов предопределяют иерархию абстрактных пространств: каждый
уровень такой иерархии характеризуется определенным весом.
10.5.2. Поиск. Процесс иерархического планирования
представлен на рис. 10.15 в виде рекурсивной исполнительной
программы. Вспомогательные процедуры отмечены пунктирными
прямоугольниками.
Когда ABSTRIPSy предлагается новая задача, то заданная
при этом целевая ППФ принимается за условия применения
пустого оператора. Исполнительная программа фиксирует
максимальный вес и строит скелет плана, состоящий в данном случае
из единственного пустого оператора (пустого шага), в
соответствующем этому максимуму абстрактном пространстве.
Затем на указанном уровне абстрактного пространства
строится (методом STRIPSa) план достижения условий применения
первого (в данном случае и единственного) оператора
полученного скелета плана, т. е. максимальной общности плана
достижения глобальной цели. Когда такой план находится, исполнитель-
пая программа выбирает следующее меньшее значение веса и
собирает из шагов плана предыдущего верхнего уровня скелет
плана данного уровня.
Далее программа вызывается рекурсивно, решая каждый раз
задачи соединения шагов в скелете плана путем обеспечения
условий их применения. Конечный шаг в скелете плана всегда
представляет пустой оператор, что позволяет контролировать
достижение искомой цели.
Когда все задачи соединения решены п, таким образом, из
скелета сформирован план, исполнительная программа вновь
вызывает себя рекурсивно для планирования в пространстве более
низкого уровня. Эта рекурсия продолжается до тех пор, пока не
будет построен полный план в базовом пространстве.
Описанная стратегия осуществляет планирование в каждом
абстрактном пространстве до конца, прежде чем осуществить пе-
230
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
реход на следующий уровень. Это позволяет системе определять
заранее шаги, приводящие к отбрасывапшо
малоэффективных планов.
Если какая-нибудь задача соединения шагов не решается на
данном уровне, т. е. пе реализуется план ближайшего верхнего
Целевая /7/7Ф
Состояние ■
■ ноу. модель лшра
3
Усл. прим. пустого о пера т. -
-*- целевая /7/7Ф
г
| Скелет плана ~*~ пуст, опер.
с
х
Вес -*- максимум
Нет
С/гелет
плана
пуст?
Да
ШАГ-*- первый шаг
скелета плана
скелет плана -*-
достаток скелета
плана
маним?
Да
(План достижения ч
модели, в которой
удовлетворяются
усл. nprnf. опер.,
используемого в ШГ,
успешен? у
\Пет
Определить след.
низший еес
Нет
Собрать из шагов
вдоль успешного пути
новый скелет плана
Да
Применить ШАГ
i„_
Г Дернуть процесс \
о простр. долее !
высш. уровня и
вь/драть лучший
\ ШАГ__ |
Г Перейти к процессу**
хв пространстве долее [
L ' низкаге_уроеня J
\3ь/дача успешного
плана, постр.
макрооператора
X
Успех
Рис. 10.15. Схема иерархического планирования системы ADSTRIPS.
уровня, то управление возвращается в пространство этого
уровня. Восстанавливается дерево поиска, выявляется и исключается
вершина, явившаяся причипой неудачи, и продолжается поиск
нового успешного плана па этом уровне, Этот механизм дей-
§ 10.5. ПЛАНИРУЮЩАЯ СИСТЕМА ABSTRIPS
231
ствпй системы при неудаче аналогичен механизму
автоматического возврата к точке ветвления в языке PLANNER. Основпая
причина подобных неудач заключается в недостатке
информации, поэтому ABSTRIPS с трудом реализует успешные планы
на наиболее высоких уровнях. Это заставляет модифицировать
алгоритм поиска STRIPSa. Первая модификация заключается в
изменении оценочной функции, используемой для выбора очередной
вершины дерева поиска. STRIPS придает особое значение
достижимости цели из данной вершины дерева и не придает никакого
значения достижению этой вершины из начального состояния.
Вследствие такой стратегии STRIPS предпочитает быстрый поиск
длинных планов медленному поиску коротких планов.
Однако каждый дополнительный шаг в верхних пространствах
приводит ко многим дополнительным шагам в базовом плане.
Поэтому для ABSTRIPSa оценочная функция должна зависеть от
уровня абстрактного пространства. Па самом высоком уровне
ABSTRIPS отдает одинаковое предпочтение оценкам
достижимости заданпой вершины и цели из этой вершипы. По мере
снижения уровня абстракции оценочная функция постепенно
переходит в оценочную функцию STRIPSa.
Вторая модификация состоит в том, чтобы при планировании
по возможности откладывать на более поздний срок означивание
параметров подходящего оператора. В процессе выбора
подходящего оператора, частично уменьшающего различие, может
осуществляться частичное означивание его параметров. Например,
если различие в том, что робота нет в комнате R3, то оператор
GOTHRUDR (<£r, гу) (ндтп через дверь dx в комнату гу)
выбирается и означивается как GOTHRUDR idx, ДЗ). Анализ в ходе
доказательства теоремы условий применения этого оператора
должен определить, через какую дверь лучше идти.
Если возникает несколько равпоэффективпьгх возможностей,
то ABSTRIPS выбирает произвольную дверь. Но при этом для
него лучшей будет та подстановка в dx, которая учтется как
можно позже. Возможность частичного означивания подходящего
оператора (в данном случае GOTHRUDR Ых, ДЗ)) используется
должным образом при планировании: предпочтение отдается
означиванию, которое следует из анализа плана нижнего уровшт.
Если такое озпачиванпе все же приведет к неудаче, то
коррекция путем испытания других возможных подстановок
осуществляется посредством механизма возврата.
10.5.3. Пример действий ABSTRIPSa*). Пусть предметная
область состоит из пяти комнат, соединенных дверями (см. рис.
*) Здесь приводится сокращенный вариант примера действий
ABSTRIPSa, заимствованный из книги Э. В. Попова и Г. Р. Фирдмава
[1976], Более полный вариант можно найти у Сакердоти [1974],
232
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
10.16). Операторы определены так, чтобы модель робота была
способна перемещаться к объектам пли определенным местам в
комнате, передвигать объекты внутри комнаты, переходить через
дверь в другие комнаты и открывать закрытые двери.
В интересах краткости изложения ниже не приводятся все
формальные шаги построения плана; возникающие вследствие
этого пробелы компенсируются словесным комментарием.
|Л7
\RJ
с
1
т
« i 77" i
1 Jj£ \
-=2ВОХ1 лт
zmeox2 ■
R2
■ I 77 Ч l
\JJ0 •
Kj?4
Rd\
ROBOT I
Рис. 10.16. Предметный мир робота до начала его действий.
Описание исходной ситуации идентично STRIPSy и ясно из
рис. 10.16. Чтобы дать возможность системе назначать веса
литерам условий применения операторов, вводятся две
дополнительные аксиомы:
(V*)(PUSHABLEU) =>TYPE(s, OBJECT)),
т. е. все то, что передвигается, является объектом, и
( V*)(STATUSU, CLOSED) со STATUSU, OPEN)),
т. е. всякая дверь закрыта тогда и только тогда, когда опа не
открыта.
Операторные схемы:
/t: PUSHB(b#, by) — передвинуть bx к объекту by.
Условия:
{6)TYPE(fci/, OBJECTKbr/ типа «объект»),
{6} PUSHABLE(kr) (bx можно передвигать),
(ЗгхМЫ INROOM(fcr, rx) & (5} INROOMCfy/, rx) &
& {5} INROOMCROBOT, гх)],
{l}NEXTTO(ROBOT, bx) (робот стоит вслед за Ъх).
Вычеркивания:
AT(ROBOT, $), NEXTTO(ROBOT,$), АТ(Ья, $),
NEXTTO(6*, $), NEXTTO($,ta).
Добавления:
• NEXTTO(by, bx). #NEXTTO(b*f by), NEXTTO(ROBOT, bx).
/2: GOTIIRUDR(dz, rx) — идти через dx в rx.
§ 10.5. ПЛАНИРУЮЩАЯ СИСТЕМА ABSTRIPS 233
Условия:
{6)TYPE(dx, DOOR)(<fc типа «дверь»),
(6) TYPE (rx, ROOMKra типа «комната»),
{2} STATUS (dx, OPEN)(дверь dx открыта),
(Эп/)[{5) INROOM (ROBOT, ry) & (6) CONNECTS (dx, ry, rx)].
Вычеркивания:
AT (ROBOT, $), NEXTTO (ROBOT, $), INROOM(ROBOT, $)•
Добавления:
» INROOM (ROBOT, rx).
/3: GOTOD (dx) — идти к двери dx.
Условия:
{6} TYPEWtf, DOOR),
(Эгх) (Згу) [Ш INROOM (ROBOT, rx) &
& № CONNECTS (dx, rx, ry)).
Вычеркивания:
AT (ROBOT, $), NEXTTO (ROBOT, $).
Добавления:
* NEXTTO (ROBOT, dx).
/4: GOTOB(frr) — идти к объекту Ъх.
Условия:
{6} TYPE(6*t OBJECT),
(Згх)Ш INROOM(6*, rx) {5} INROOM(ROBOT, rx)).
Вычеркивания:
AT(ROBOT, $), NEXTTO(ROBOT, $).
Добавления:
*NEXTTO(ROBOT, Ъх).
/5: OPEN(d#) — открыть дверь dx.
Условия:
{6} TYPE(te, DOOR),
{5} STATUS(fo, CLOSED) (дверь закрыта),
{5} NEXTTCKROBOT, dx).
Вычеркивания:
STATUS(<fe, CLOSED).
Добавления:
• STATUS(Ae, OPEN).
Примечания. 1. Числами в фигурных скобках обозначены
веса литер условий. 2. Звездочки перед выражениями указывают
на добавления, которые рассматриваются системой при поиске
пригодного оператора. 3. Символ $ означает произвольное
значение переменной.
Целевая НПФ: NEXTTO(BOXl, BOX2) & INROOM(ROBOT,
#1) — придвинуть ящик ВОХ1 к ящику ВОХ2, роботу перейти в
комнату Д1.
234
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
Поиск начинается в пространстве высшего уровня (с весом 6).
Различием является целевая ППФ в целом. Пригодным для
уменьшения первого члена различия является оператор /, при
&г = ВОХ1 и 6г/ = ВОХ2. Поскольку условия веса 6 исгшшы в
начальной модели, оператор применяется и в новой модели ВОХ1
придвинут к ВОХ2 и рядом с ним находится робот.
Различие между целью и текущей моделью — INROOM
(RQBOT\ /?i). Пригодным для его уменьшения является оператор
/2 при га = /?1, dx = ply где р{ -- неопределенный параметр,
означивание которого должпо произойти позже. Условия веса 6 этого
оператора TYPEU71, ROOM) & TYPE(/>„ DOOR) & (Згу) X
X CONNECTS(pu ry, R\) удовлетворяются при pt = D\.
Применение GOTIIRUDR(Z)l, /?1) порождает модель, в которой
удовлетворяется целевая ППФ. Таким образом, мы получаем план
наивысшего уровня в виде
PUSHB(BOXl, BOX2), GOTHRUDR(D1, ЯП. (10.1)
Далее осуществляется переход к планированию в пространстве
веса 5, в котором скелет плана представлен выражением (10.1).
Первая подцель — условия веса 5 первого оператора скелета
PUSHB(BOXl, BOX2). Различие между пачальпой моделью и
условиями'составляет INROOM(ROBOT, /?3). Подходящим
оператором является U при гх = ЯЪ и dx = рг. Однако /2 неприменим к
начальной модели. Альтернативными различиями, порожденными
оператором /2, являются INROOM(ROBOT, /?2) или INROOM
(ROBOT, Я4). Для уменьшения первого различия пригоден /2
при гх = /?2, однако он неприменим к начальной модели. Для
уменьшения второго различия пригодеп /2 при гх = Д4 и он
применим к начальной модели при dx = D4. Таким образом,
применяется оператор G0TI1RUDR(D4, /?4), в результате чего появляется
модель, к которой применим /2 при гх = ЯЗ п р2 = D3. Оператор
GOTHRUDR(D3, R3) формирует модель, в которой
удовлетворяются условия оператора PUSIIB(BOXl, BOX2) веса 5,
позволяющие применить этот оператор.
Теперь устанавливается новая подцель — условия второго
оператора скелета (10.1). Сравнение текущей модели с его
условиями веса 5 вырабатывает различие INROOM(ROBOT, /?2), для
уменьшения которого подходит оператор /2 при гх = /?2. Этот
оператор применим при Лг = рз = #2, так что GOTFIRUDR(Z)2, R2)
формирует новую модель, в которой исходная подцель
удовлетворена. В результате получаем план в абстрактном пространстве
веса 5:
GOTHRUDR(D4, Я4), GOTHRUDR(Z>3, ЯЗ), PUSHB(BOXl,
ВОХ2), GOTHRUDR(D2, Д2), GOTHRUDR(Dl, Я1). (10.2)
§ 10.6. ВОПРОСНО-ОТВЕТНАЯ СИСТЕМА QA4 235
Процесс планирования продолжается в абстрактном
пространстве веса 2. Первая подцель — условия первого шага оператора в
скелете (10.2). Сравнение с начальной моделью приводит к
различию STATUS(Z)4, OPEN), для уменьшения которого подходит
f5 при dx = Dk, Однако он неприменим. Различие составляет
NEXTTO(ROBOT, Z)4), для уменьшения которого пригоден /3 при
dx = #4. Этот оператор применим к начальной модели и
преобразует ее в модель, к которой применим Д. Поскольку, как легко
проверить, все остальные подзадачи непосредственно
удовлетворены, приходим к модели, в которой удовлетворяется целевая ППФ
с помощью нлапа веса 2:
GOTODUM), OPEN(ZM), GOTHRUDR(Z)4, Д4), GOTHRUDR(£3,
ДЗ), PUSHB(BOXl, BOX2), GOTHRUDR(Z>2, Д2),
GOTHRUDRCD1, Д1). (10.3)
Переходим к планированию в базовом пространстве веса 1.
Первые четыре оператора скелета (10.3) применяются по очереди,
однако пятый неприменим. Различием является NEXTTO(ROBOT,
ВОХ1), для уменьшения которого подходит Д при &я = ВОХ1.
Этот оператор применим, формируется модель, к которой
применим PUSHB(BOXl, ВОХ2). Окончательный план выглядит
следующим образом:
GOTOD(ZM), OPENUM), GOTHRUDR(Z)4, Д4), GOTHRUDR(Z)3,
ДЗ), GOTOB(BOXl), PUSHBCBOXl, BOX2), GOTHRUDR(£>2, Д2),
GOTHRUDRUM, Rl).
§ 10.6. Вопросно-ответная система QA4
Система QA4 является преемником QA3 и ориентируется на
автоматическое доказательство теорем, автоматическую проверку
и синтез программ и на планирование деятельности робота [Ру-
лифсон, 19731. Система QA3 также предназначалась для
автоматического доказательства теорем, и ее пытались использовать для
решения широкого класса задач. Неудачный результат этих
попыток объясняется тем, что в этой системе все знания о
действиях хранились в виде описаний логических аксиом без указания,
как их использовать. Вполне понятно, что если мир задач сложен
и содержит много операторов, то таким образом представленное
знание не может быть эффективно использовано: стратегии,
основанные па синтаксисе этих знаний, здесь не помогают.
Язык системы QA4 схож с языком LISP, но содержит большее
число синтаксических типов. Система, QA4 хранит информацию
об операторах в императивной форме в виде программ. Извлекая
информацию, система одновременно получает указания, как эту
информацию использовать. Таким образом, стратегии поиска
становятся в большей степепи семантическими, чем синтаксическими.
236
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
В QA4 условия применения оператора, списки вычеркивания
и добавления — все эти элементы операторных схем описываются
в едином формализме. До примера описания оператора приведем
необходимые сведения об элементах описапия в языке QA4.
Переменные. Среди прочих переменных языка QA4
выделим переменные -*- var и $ var. Префикс -«- позволяет переменной
var получить новое значение, а префикс $ обозначает связанную
переменную (переменную, получившую определенное значение),
которая сравнима с выражением ехр языка QA4 тогда, когда var
уже имеет значение ехр.
Образец, Описание оператора в QA4 начинается с образца
(LAMBDA(-<- vart... -*- varje), где LAMBDA — определяющее
выражение функции, которое определяет, сколько аргументов у
функции, как они обозначены и как можно задать значения этим
аргументам; -«- var4, ..., -«- varn — переменные, от которых
зависит определяемая функция; е — выражение, в которое входят эти
переменные "и которое служит для вычисления значения
функции, после того как с этими переменными связываются
подходящие значения.
Пример: (LAMBDA -«- X(PLUS $ Х2)). Здесь при сравнении
с аргументом переменная образца X связывается и далее
выполняется (PLUS $ Х2).
Механизм PROG. Язык QA4 включает механизм PROG,
общая форма которого имеет вид
(PROG(DECLARE var4.. .varj^.. .ej,
где оператор DECLARE объявляет локальные переменные,
входящие в выражение еи ..., ет.
Функция GOAL. Общий вид оператора: (GOAL целевой
класс целевое выражение указатель 1 свойство 1 указатель 2
свойство 2).
Пример: (GOAL $ DO(STATUS LICHTSWITCH 1 ON)).
Выполнение GOAL начинается с применения оператора
EXISTS к целевому выражению с данными свойствами. Если
свойства не заданы, то предполагается наличие пары MODELVALUE
TRUE. В примере осуществляется поиск выражения (STATUS
LICHTSWITCH1 ON) с парой (указатель — свойство)
MODELVALUE TRUE. Если выключатель 1 уже включен, т. е.
ранее было внесено в базу данных утверждение (ASSERT
(STATUS LICHTSWITCH1 ON)), то выбранное выражение
является значением оператора GOAL. Если в базе данпых такое
утверждение не находится, то происходит активация другого
оператора. Этот оператор должен быть применен к целевому
выражению GOAL, т. е. переменные его образца должны быть сравнимы
с этим выражением. В нашем примере необходимо найти
оператор, применимый к выражению (STATUS LICHTSWITCH1 ON).
§ 10.6. ВОПРОСНО-ОТВЕТНАЯ СИСТЕМА QA4
237
Для направления поиска нужных операторов используется
условие — они должны принадлежать целевому классу GOAL.
Значением целевого класса является набор из имен операторов.
Эти операторы программа пытается применить при выполнении
GOAL. В нашем примере можно присвоить $ DO значение
(TUPLE TURNONLICHT SEARCHORSWITCH), где TUPLE-
выражение языка QA4, обозначающее набор с упорядоченными и
неповторяющимися элементами. Теперь будет активирован
оператор TURNONLICHT (включить свет). Если его связываемые
переменные несравнимы с (STATUS LICHTWITCH1 ON) или если в
применении оператора возникает неудача, то управление
передается в GOAL и теперь уже активируется оператор
SEARCHORSWITCH. Если и здесь постигнет неудача, то на это г
случай в QA4 предусмотрен механизм возврата.
Рассмотрим более подробно описание и обработку операторов
в QA4. Например, описание оператора TURNONLICHT (включить
свет) выглядит следующим образом:
(LAMBDACSTATUS - М ON)
(PROGCDECLARE N)
(EXISTS(TYPE %M LICHTSWITCH))
(EXISTS(TYPE - N BOX))
(GOAL $ DO(NEXTTO $ N $ M))
(GOAL $ DO(ON ROBOT $ N))
($ DELETEC STATUS $ M OFF)))
(ASSERTCSTATUS $ M ON))
($ BUILDC4: $TURNONLICHTACTION $ M))))).
Программное описание данного оператора выглядит как
выражение на языке LISP, но вычисляется специальным
интерпретатором. Оператор может быть применим только к целям, которые
сравнимы с его образцом, т. е. если нужно нечто включить.
Образец оператора играет ту же роль, что и список добавлений в
STRIPSe.
Пусть нам необходимо включить первый выключатель
LICHTSWITCH 1, т. е. целью робота является (STATUS
LICHTSWITCH l ON). Образец оператора TURNONLICHT
сравним с этой целью, и переменная М принимает значение
LICHTSWITCH 1. После удачного сравнения программа должна
убедиться в том, что значением М является выключатель. Это
одно из условий применения оператора. Функция (EXISTS(TYPE $
% М LICHTSWITCH)) ищет в базе данных все вхождения
образца (TYPE $ LICHTSWITCH), которые имеют значение TRUE.
В данном случае ищется выражение (TYPE LICHTSWITCH 1
LICHTSWITCH). Если не оговорено противное, функция EXISTS
также проверяет, что это выражение объявлено истинным. Для
того чтобы выражение е было объявлено истинным, используется
Функция ASSERT(e). Эта конструкция полагает значение аргу-
238
ГЛ. 10. ЗАРУБЕЖНЫЕ РЕШАТЕЛИ
мента равным TRUE, и оно хранится в списке свойств
выражения. Таким образом, модель мира в QA4 представляет множество-
выражений со значением TRUE.
Пусть в базу данных перед решением задачи введены
выражения (ASSERTCTYPE LICHTSWITCH1 LICHTS WITCH)) и
(ASSERT4TYPE ВОХ1 BOX)) и, таким образом, обработка
функций EXISTS проходит успешно. Далее вступает в действие
функция GOAL, которая начинает свою работу, как и EXISTS, т. е.
она ищет, имеется ли (NEXTTO BOX1 LICHTSWITCH1) в базе
данных. Если ящик ВОХ1 уже находится рядом с выключателем,,
цель достигнута. В противном случае понадобится подвинуть
ВОХ1, используя другие операторы из целевого класса, и в этом
случае дапное условие применения становится очередной целью.
В рассматриваемых задачах для QA4 использовались два
целевых класса DO и GO. Класс GO состоял из единственного
оператора GOTO (идти (по полу)), класс DO состоял из операторов.
PUSHTO (двигать), CLIMBONBOX (влезть на ящик) TURNON-
LICHT (поверпуть выключатель).
Пусть нам потребовалось использовать оператор PUSHTO. Era
образец (NEXTTO +- M +- N) сравним с целевым выражением
оператора GOAL, следовательно, PUSHTO активируется.
Оператор PUSHTO в свою очередь может привести к подцели (NEXTTO
ROBOT BOX1) с целевым классом GO. Эта цель активирует
оператор GOTO, который успешно заканчивает сзою работу без
порождения новых целей.
Оператор TURNONLICHT требует не только, чтобы ящик
находился у выключателя, но чтобы и робот находился на ящике.
Среди операторов класса DO находится единственный, образец
которого удовлетворяет целевому выражению, это CLIMBONBOX
с образцом (ON' ROBOT «- М), который и активируется. Условия
применения этого оператора содержат требование, чтобы робот
находился у ящика ВОХ1. Эти условия выполнены в модели, и,
таким образом, оператор успешно применяется.
Оставшиеся функции оператора TURNONLICHT
предназначены для необходимого изменения модели мира. Функция
($ DELETE(4STATUS $ М OFF))) соответствует списку
удалений в STRIPSe, а функция ASSERT объявляет истинным
утверждение (STATUS LICHTSWITCH1 ON). Последняя функция
($ BUILD(4:$TURNONLISHTACTION $ М))) добавляет
рассматриваемый оператор к планируемой последовательности действий
робота.
Операторы QA4 столь же точны, как и в STRIPSe, по
содержат больше стратегической информации. Так, в случае
оператора TURNONLICHT системе сообщается, что ящик нужно
придвинуть к выключателю, прежде чем робот влезет на пего. В системе
STRIPS такого упорядочения нет, поэтому возможны исследова-
§ tO 6 ВОПРОСНО-ОТВЕТНАЯ СИСТЕМА QA4
239
ния тупиковых ветвей (робот влезает на ящик, а затем пытается
его передвинуть к выключателю). Правда, в системе STRIPS
возможно упорядочение условий применения, но его разработчики
больше интересовались поведением решателя в случае, когда он
сам находит наилучший порядок использования условий. Вопрос
о том, какое количество таких сведений нужно сообщать роботу
заранее, определяется, по-видимому, целями исследования; в QA4
предпочитается давать операторам как можно большую
информацию. Представляется, что на этом пути планирующие системы
будут решать действительно интересные задачи.
Хотя система STRIPS не в такой степени, как QA3, основапа
на аксиоматической системе доказательства теорем, она все же
использует доказательство теорем при определении достижимости
цели или применимости оператора, что в QA4 осуществляется
путем сравнения с образцом. Как показывает работа со STRIPSom,
доказательство теорем, включаемое в процессы поиска, действует
«слишком прямолинейно и сравнение с образцом выглядит более
подходящей процедурой.
Продолжая сопоставление систем QA4 и STRIPS можно
отметить также следующее. Планы в STRIPSe всегда являются
линейными последовательностями операторов и не содержат
разветвлений на случай непредвиденных обстоятельств. Отсутствует
механизм для рассмотрения альтернативных моделей миров. В
системе QA4 возможно построение условных планов на основе
храпения альтернативпых гипотез в различных контекстах.
В планах STRIPSa невозможны циклы, действие в STRIPSe
выполняется предписанное число раз. В QA4 планы фактически
являются программами, допускающими итерацию и рекурсию, что
дает возможность повторения действий. Так как система QA4
пригодна для составления планов с циклами, она может быть
использована и для синтеза программ. Система QA4 уже успешно
применялась для порождения простой последовательной
программы па ассемблере.
ГЛАВА 11
ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
§ 11.1. Сравнительный анализ отечественных систем
Исследование проблемы автоматизации доказательств началось
почти одновременно в Советском Союзе и США. Уже в первой
половине 60-х годов в этих странах, независимо друг от друга*
были разработаны основы двух методов автоматических
доказательств: обратный метод С. Ю. Маслова [1964, 1968J — Советский
Союз н принцип резолюций Робинсона [1965] — США'.
В Ленинградском отделении Математического института
(ЛОМИ) АН СССР группой логиков в 1965 г. было разработана
несколько версии алгорифма машинного поиска естественного
логического вывода в исчислении высказываний (АЛИЕВ) [Н.А. Ша-
пин, Г. В. Давыдов и др., 1965]. В том же институте на основе
обратного метода в 1969 г. был разработан машинный алгоритм
исчисления предикатов первого порядка [Г. В. Давыдов^
С. Ю. Маслов и др., 1969].
Разработка версий систем АЛПЕВ-ЛОМИ и алгорифма
исчисления предикатов носила поисковый, научно-исследовательский
характер и показала принципиальную возможность машинных
доказательств на оспове секвенциальных исчислений.
Первым отечественным решателем, по-видимому, следует
считать систему программирования ПРИЗ (пакет прикладных
инженерных задач), созданную таллинским коллективом научпых
сотрудников иод руководством проф. Э. X. Тыугу. Начало
разработки системы следует отнести к 1970—1971 гг., затем она
несколько раз усовершенствовалась вплоть до 1976 г. [Э. X. Тыугу, 1970г
1971; М. А. Мянписалу, Э. X. Тыугу, 1974; Э. X. Тыугу, М. Унг,
1976; М. И. Кахро, М. А. Мяшшсалу, 10. П. Саан, Э. X. Тыугу,
1976].
Ядром системы служит организующая программа, пе
ориентированная априори на какую-либо предметную область. В
наиболее общем режиме решатель по задаче, заданной текстом,
формирует ее описание и далее составляет и исполняет решение
вадачи.
§ it.i. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ОТЕЧЕСТВЕННЫХ СИСТЕМ 241
Знания о предметной области составляют содержание пакета
системы ПРИЗ и в процедуральной форме представляют собой
множество вычислительных моделей и программных модулей.
Система ПРИЗ не планирует вычислительный процесс,
составляющий решение заданной задачи, в полном объеме. Обычно в
текстовом описании задачи содержится информация, по которой
формируется управляющая программа, представляющая собой
последовательность требуемых подзадач. Таким образом, ПРИЗ
планирует решения только типовых подзадач при заданном
скелете решения задачи в целом.
Указанное планирование носит эвристический характер и
осуществляется в основном в прямом направлении. Система ПРИЗ
успешно решает задачи по геометрии и физике для старших
классов средней школы, а также производственные задачи в
различных предметных областях. Однако, как признают авторы, система
ПРИЗ обладает небольшими дедуктивными возможностями (они
по существу сводятся к программированию решений типовых
задач), что лишает ее определенной гибкости, заставляет
пользователя вводить в систему совместно с задачей и скелет ее решения.
К этому также необходимо добавить, что система ПРИЗ
предназначается для работы в вычислительных средах, представляющих
собой довольно простые и хорошо организованные предметные
области. Практически интересные задачи обычно связаны с более
сложными и плохо организованными средами.
Для решения производственных задач в Институте
кибернетики АН УССР было разработано несколько версий решателя
ППР (программа принятия решений), в качестве
планирующей систрмы интеллектуального робота [В. П. Гладун, 1977].
В ППР знания о предметной области представлены в
пространстве признаков в виде растущих пирамидальных сетей (РПС),.
которые строятся автоматически. С помощью таких сетей удается
хранить в системе необходимую информацию в компактном виде
(общие для нескольких объектов признаки соответствуют одной
вершине РПС), естественным образом организовать процедуру
обучения системы в пространстве признаков и формировать
понятия, характеризуемые своим объемом.
В первой версии решателя — ППР-1 — поиск решений
включает в число процедур: построение дерева возможностей,
эвристический поиск на дереве наилучшей ветви, анализ достижимости-
Целей и механизм возврата в случае неудачи. Во второй версии
решателя — ППР-2 — для увеличения эффективности поиска
введены следующие усовершенствования: двунаправленный поиск;
представление в виде РПС зпаний, описываемых на языке
предикатов; процедура формирования рабочей информации в зависимо-
сти от решаемой задачи и процедуры формирования и
применения макрооператоров.
16 Я и Ефимов
242
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
При всем при этом ППР представляет одноуровневую систему
планирования и не использует перспективные процедуральные
языкп типа QA4, что не позволяет считать успешно решенпой в
этой системе проблему эффективного поиска: поиск в такой
системе выглядит все еще достаточно громоздким.
Иной подход к проблеме представления знаний и организации
поиска решений производственных эадач реализован в системе
припятия решений интегрального робота ПРИР [Е. С. Кузин,
1975; Е. С. Кузин, И. Б. Фоминых, 1975; Е. А. Ерохип, М. И. Су-
дейкип, 1978].
В этой системе знания представлены процедурно в виде
формальных порождающих грамматик, позволяющих генерировать
ситуации п строить решения типовых подзадач. Поиск в системо
ПРИР состоит из двух этапов: редуцировапие исходной задачи
на подзадачи и построение решений подзадач. На первом этапе
используется модификация стратегии GPS, па втором — вывод в
порождающей грамматике.
Дальнейшее усовершенствование системы ПРИР состояло в
построении процедуры автоматического формирования схем пра-
впл порождающих грамматик на оспове структуризации и
обобщения получаемых конкретных решений. Указаппое обучение
предполагалось реализовать па базе редукционпых грамматик,
описывающих индуктивные правила вывода. Система ПРИР не
имеет еще большого опыта эксплуатации, п к ее первой версии в
полной мере можно отпести все замечания, высказанные ранее
относительно решателя ППР.
Анализ опыта построения и эксплуатации рассмотренных
зарубежных и отечественных решателей позволяет наметить одпп из
перспективных путей создания интеллектуальных решателей,
способных: 1) имитировать мыслительную деятельность человека при
решении широкого класса задач, 2) осуществлять эвристический
поиск в иерархическом пространстве, 3) использовать для
внутреннего представления знаний процедуральные языки высшего
порядка и 4) обучаться и пополнять свои знания в процессе
деятельности. Примером подобного семиотического решателя
является СФИНКС — система формальпого интеллекта комплкесных
стратегий IE. И. Ефимов, 1977а, 19776].
Решатель СФИНКС представляет собой концептуальную
систему эвристического поиска в перархическом пространстве с
элементами индуктивно-дедуктивного вывода и процедуральным
представлением впаний в формализме системы ДИЛОС
.[В. М. Брябрин, 1977; М. Г. Пховелишвилп, 1978].
Создание системы СФИНКС преследует научные цели,
состоящие в исследовании возможностей подобных решателей в области
ллапировапия поведения сложных систем, проектирования
технологических и вычислительных процессов, синтеза машинных про-
§ ii.l. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ОТЕЧЕСТВЕННЫХ СИСТЕМ 243-
грамм, автоматического доказательства теорем и других областей
научно-технической деятельности человека. Апробация решателя
на отдельных задачах подтверждает перспективность данного
направления для построения действительно интеллектуальных
систем [Е. И. Ефимов, 19776J.
Система ДИЛОС, используемая в качестве интеллектуального
банка данных для решателя СФИНКС, продолжает развитие и
реализацию процедуральиых форм представления знаний,
нашедшую свое отражение в таких интеллектуальных языках
программирования, как PLANNER, CONNIVER, РЕФАЛ, QA4 и
другие.
ДИЛОС обладает достаточно универсальным и гибким проце-
дуральным языком, позволяющим представлять знания в едином
формализме, пригодном для автоматизированного решения
интеллектуальных задач различного класса. Для описания фактуаль-
ных знаний (состояния объектов и факты внешнего мира)
используются такие выражения языка, как понятия и отношения; для
описания актуальных знапий (приемы, методы, умозаключения,
законы действий и др.) используются закономерности,
представляющие собой программы. Указанные выражения составляют
структуру модельной базы данных.
Особого интереса заслуживают закономерности, в которых в
разумной степени сочетаются форма и содержание актуальных
знапий, что в свою очередь позволяет организовать эффективную
машинную обработку закономерностей при сохранении полноты
содержащихся в них знаний.
Введение закономерностей перспективно еще и потому, что
позволяет априори вносить в модельную базу данных описания
схем решений элементарных и типовых задач и тем самым
сводить проблему автоматизированного решения сложных задач к
проблеме синтеза такого решения из имеющихся типовых
решений.
ДИЛОС представляет собой универсальный банк дапных,
осуществляющий формирование, поиск, удаление и модификацию
информации в базе данпых. Система ДИЛОС располагает
системой встроенных функций для обработки закономерностей, ее
сервис предусматривает организацию диалога, что позволяет
пользователю в случае необходимости вмешиваться в ход решения
задачи и вносить коррективы в дерева поиска.
ДИЛОС реализован па базе системы ЛИСП-БЭСМ-6 и легко
переносим на другие ЭВМ, имеющие транслятор с языка ЛИСП,
например на ЕС-машины, с помощью системы ЛИСП-МЭИ/ЕС
ЭВМ, разработанной сотрудниками Московского энергетического
института. Практическое использование системы ДИЛОС
подтверждает ее широкие возможности, особенно в сочеташш с
решателями типа СФИНКС.
16*
244
ГЛ. И. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
§ 11.2. Система АЛПЕВ-ЛОМИ
Система предназначена для определения выводимости
формулы R из допущений Qu ..., Qn логическими средствами
классического исчисления высказываний. Другими словами, система
должна уметь выводить формулу R в прикладном исчислении
высказываний VLZ[QU ..., Qn], где Qu ..., Qn играют роль
собственных аксиом.
11.2.1. Представление знаний. Алфавит исчисления И2[@,]
включает:
1) пропозициональные переменные tu t2, ...;
2) логические связки п (отрицание), & (конъюнкцию), У
'(дизъюнкцию), => (импликацию) и «» (эквивалентность);
3) знак секвенции ->.
Правильно построенные секвенции И2 определяются известным
образом. Часть секвенций объявляется аксиомами (к их числу
принадлежит и секвенция ->■ Qu .. .,Qn, тождественная истинность
которой устанавливается извне). Секвенции имеют следующую
интерпретацию: секвенция ии ..., uk -*- и — «при допущениях
ии ..., uk имеет место у», секвенция ии ..., ик -*- — «допущения
iii, •.., Hft приводят к противоречию».
К числу тождественно истинных секвенций (к аксиомам)
исчисления И2[(>Л относятся: собственная аксиома -»- Q^ ..., Qn,
логическая аксиома Х-*Х и логическая аксиома -*-{Y V "• У).
Обозначим через X, У, Z формулы, а через Г, 2, Д, П — списки
формул. Тогда система H2[(>d имеет следующие правила
логических переходов:
Г X 2 >- У
1) 'z-+(Xz)Y) освобождение от допущения;
Г -> X
2) -=—(Х у\ — присоединение произвольной посылки;
3)
г-» и х
г->(х:эУ)[
г->х
— введение произвольного заключения;
Г-МП XzdY)>
г-*х
2 -> (X zd Y)
4) у—г? сокращение посылки;
у V Д —► У
5) ' ' — двухпосылочное правило сечения;
Г-*.'-] у Г -> У Г -> 1 У Г -» У
1->(ХрУ) 2->(Хр1У) 2^(1ХрУ) 2-^(1 ХЭ1 У)_
Г, 2->1 X • Г, 2-*1Х ' Г, 2->Х ' Г, 2->Х
♦опровержение посылки импликации;
Г->Х
б)
2 —► У
7) v —/y nv\ —введение конъюнкции в сукцедент;
1 , Z-^A^gJ )
§ 11.2. СИСТЕМА АЛПЕВ-ЛОМИ 245
r-^(Xdgr) Г-+{Х£Г)
о) —рТГх—' Г->У исключение конъюнкции из
сукцедента;
оч Г~>1 (X&Y) Г^1(1 X&Y) Г^п(ДГсбТУ)
У> r-+(lXV-\Y)' r-v(IVir) ' Г-^-ПХ^У)'
••____.—1-——~-——. — отрицание конъюнкции;
Г -> X Г -* У
10) 1^(ХуЛ} Г->(ХуУ)"~~ введенле дизъюнкции в
сукцедент;
T-+(XVY)
2', X, 2" - Z
11) у, '' д, д// _^ ^ заключение разбором
возможных случаев;
Г -* 1 X Г -> X Г->1У Г -* У
49\ ^(^Уу) 2^(1 ХУУ) 2-> (XV Y) 2->(Х VI У)
^' Г, 2->У ' Г, 2-* У ' Г, 2->Х Г, 2-*Х 0Т~
рицание дизъюнктивного члена;
.оч Г->Т(Х V У) Г -»• Щ X V 1 У) Г -> 1 (1 X V У)
' r-nxcgir)' г^(х^г) » г-»(х<ету) f
Г-*1 (X V 1 У)
—г;—/ т v />v\ отрицание дизъюнкции;
1 -*"( I л&г)
Г^(ХзУ)
14) v~v(Xcv) У) введепие эквивалентности;
... г'-ЧХсоУ) Г-^(ХсоУ)
' г-»(ХвУГ г-» (У id X) — исключение эквивалентности;
„~ч Г^ 1 (Хоо У)
1о) г _+ t-i (х -JD } \ у 7 (Y => X))—отрицание эквивалентности;
Г X 2 ->
17) »* 21» -| х — опровержение приведением к противоречию;
Г "Т X 2 >
18) ' '2-Vx заключение от противного;
Г -> X
19) v _^ — констатирование противоречия;
9Ги Г,'х, 2, X, А->П
^U) ^ л-»»и устранение повторных допущении;
9П г,' Х,'2,'у, Д^П
^l) г, v v у 'л—п перестановка допущении.
Формула R выводима в исчислении H2[Qi\, если в пем
выводима секвенция -+R. Исчисление И2[@<] обладает избыточностью:
оно равнообъемпо исчислению ИДф], задаваемому аксиомами (1)
и (2) и правилами логических переходов (1), (2), (4), (7), (8),
(Ю), (И), (14), (15), (17), (21). Однако включение остальных
правил в Hit^J позволяет избежать чрезмерной измельченностп
логических выводов. Правило (21) введено исключительно в
технических целях для"составления машинных программ.
216
ГЛ. ii. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Для дальнейшего изложения напомним необходимые сведения
из области секвенциальных натуральных исчислений [Клини„
1967]. Каждое правило логического перехода представляет собой
секвенциальную фигуру, состоящую из посылки (посылок) —
верхней секвенции (верхних секвенций) и заключения — нижпей
секвенции. Член заключения, меняющийся при переходе снизу вверхг
называется главной формулой рассматриваемого правила, а члены
посылок, появляющиеся в результате изменения главной
формулы, называется боковыми формулами. Главная формула является
предком боковых формул, а те в свою очередь являются
наследниками главной формулы.
В секвенции и -** v член и называется антецедентом, a v —
сукцедентом. Правило перехода называется антецедентным (сук-
цедептным), если его главная формула входит в антецедент (сук-
цедент) заключения.
Контрприменение данного правила к секвенции S есть
построение такого набора секвенций (одного, если правило однопосы-
лочное, или двух, если правило двухпосылочпое), из которого S
получается в результате применения (сверху вниз)
рассматриваемого правила. Таким образом, контрприменение предполагает
применение правила снизу вверх, от заключения к посылкам.
Реализация правила есть любая фигура, получаемая при интерпретации
всех схемных переменных правила.
Вывод в секвенциальном исчислении строится в виде
секвенциального дерева снизу вверх. Каждая вершина такого дерева
представляет собой секвенцию. Вершина является концевой, если
она не имеет наследников. Вершина считается начальной, если
она не имеет предков. Вершина считается закрытой, если она
представляет аксиому данного исчисления. Вершина называется
тупиковой, если она не является закрытой и одновременно не
может быть использована для контрприменения. Вершина
является открытой, если она не является закрытой или тупиковой.
Дерево считается закрытым (замкнутым), если все его концевые
вершины закрыты. Дерево считается открытым, если среди его
концевых вершин есть хотя бы одна открытая вершина и пет ни
одной тупиковой. Вывод считается успешным, если в результате
формируется закрытое дерево. Член вершины является старым,
если он графически равен своему предку, в противном случае он
представляет новый член (боковую формулу).
Рассмотренное выше исчисление H2[(?J предполагалосьисполь-
зовать для оформления в наиболее естественном виде
окончательного вывода (машинный алгоритм вывода на базе H2[(?d
получился бы неэффективным из-за наличия правил типа (4) и (6)). Для
машинпого вывода авторы системы АЛПЕВ-ЛОМИ-1 предложили
исчисление эвристического поиска вывода — Эв1, к рассмотрению
которого мы и переходим.
§ 11.2. СИСТЕМА А Л ПЕВ-ЛОМИ
247
Исчисление Эв1 содержит аксиомы: а%) Г, X, 2 -*■ X; а2) Г,
Х% 2, ПХ, П -*• Д; а$) Г, ^Х, 2, X, П -*■ Д и следующие правила
логических переходов:
Г, X-v Q ч Г, X, 2-*д
Pi)
г -► Т xf гз
г-*х, г-* у
Г-*(*<6П
Г, 1 Х-*У
F-+UV К)'
Г, Х->У
Г - (X з Г)'
Г-*(Х=э V)
Г -*(У :=> X)
сч Г, 1 X-+Y ..
°i/ Г-*(Х V У)' 2'
Г, Х->У
81' Г-^/УпУИ 82)
г, 7 IX, 2 —д •
Г, X, У, S-vA
Г, (Х<£У), £-^Д
Г, X, 2->Д
Г, У, 2-* Л
', (XVУ), 2-*Д '
Г, 1 X, 2->Д
Г, У, 2-^Д
Тз
ба)
*> \
Г, 1 У, 2-^Д
Г, 1 X, 2-Д .
; Г* ЦХсбУ). 2+Д'
Г, IX, 1 У, 2-*Дв
Г, "T(Xvy), 2-*Д'
Г, X, 1 У, 2-*Д
Г, (Х=5У), 2->Д' "3/ Г, 1 (X о У), 2-Д'
t ч 1 -»у/ -> «) р ч Г, (X г> У), (У р!),2->Д
6l' г->-(Хсоу)' 6*' г, (Хоо у), 2->д
Г, 1 (X => У), 2 -* А
t \ Г, 1(У =>Х), 2->Д
*3' Г, п (Хсо У), 2-*А*
Секвенция 5 выводима в Эв1 тогда и только тогда, когда она
выводима в И2[Л], где Л — пустой список формул. Любое
правило Эв1 можно заменить несколькими примепеппями правил И21Л].
Эти свойства Эв1 позволяют весьма просто определять
выводимость формулы R из допущений Qu ..., Qn средствами
классического исчисления высказываний и при утвердительном ответе
получать вывод R в И2[ф<1. Действительно, R выводимо в И2[(),1
тогда и только тогда, когда секвенция Qu ...,()« -* R выводима в
И21Л]; при этом любой вывод указапной секвенции в И2[Л]
можно достроить до вывода формулы R в И2[Л] посредством
нескольких примепепий правила (5).
Таким образом, в случае успешного вывода в Эв1 этот вывод
преобразуется в вывод в И2[Л] посредством одппх лишь вставок
некоторых секвенций и далее — в вывод в И2[()<], т. е. пмеет
место Эв1 ■=* И2[Л] =* И2((?1, ..., QJ- Одпако такой вывод, как
показали испытапия системы АЛПЕВ-ЛОМИ-1, имеет много
недостатков (лишние ветви, лишние формулы, липшие допущения и т. д.).
В связи с этим было разработано более совершенное исчисление
Эв2, которое и было положено в основу системы АЛПЕВ-ЛОМИ-2.
Исчисление Зв2 получается из Эв1 преобразованием правил
Чз), б2), е2) и %>) при пустом сукцеденте Д в правил Уз)> б2), г2) и
L/ соответственно:
Г,2-Х Г,2-*тХ
™ Г,-|(Х&У),2-' °*>
Г, 2-+Х
г,
г,
, (* V Y),
2-*(Х=>
2-*(Г =>
2-*-
Y)
(Х=>У), 2-*' bw Г, 1(АооГ),2-
248
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Для исключения излишних обращении к правилу В2) в Эв2
введены также правила 7зЛ о2;, о3;, е2; и е3/> представляющие
собой видоизменение правил 7з)? ^)> бз)> е2) п е3) соответственно;
?1)
I)
Г, U.2.
Г, У, 2-
•д
Г, Т(ХсбПУ), 2-* А1
Q
г, s.
У
Г, (XVI У), S-
б'з)
Г, НГХ,У, 2.
Г, 2-
Г, 2-
X
У
Г, [X=>~[Y), 2-
Бз)
Г, 7 (XVI У), 2-
1\ X, У, 2->Д
СШИВАНИЕ-
Г, 7(ХзТУ), 2-^Д-
В исчислении Эв2 наряду с 6J используются также правила:
Л'\ Г, Х-^У ."ч Г, У->Х
0l' r->(-rxvy) °1' г-mxvi n •
В итоге 3b*2 получается из Эв1 добавлением правил 7з)> &>)г
е2) и 5д) взамен правил у3)» $2), е2) и £з) и правил 6i), б"),
7з)> б2), 63), е2) и в3)- Секвенция S выводима в Эв2 тогда и только*
тогда, когда она выводима в Эв1.
11.2.2, Поиск. Блок-схема поиска представлена на рис. ILL
Рассмотрим назначение каждого блока этой схемы.
Блок ТАКТИКА осуществляет построение дерева поиска
от очередной открытой вершины путем выбора
конкретной главной формулы этой
вершины для порождения ее
наследника (наследников).
Указанный выбор производится на
основе информации о
выделенной вершине, которая
содержится в блоке ИНФОРМАЦИЯ.
Здесь учитываются различного
рода эвристические
соображения: зацепленпость и
родственность секвенций, тип правила
(однопосылочное или двухпосы-
лочпое), местоположение
главной формулы (в антецеденте
или сукцедепте), тип виешпей
связи (импликация в антецеденте и ее отрицапие в сукцедепте
считаются неблагоприятной связью), длина главной формулы,
измеряемая числом ее символов, и т. д.
Блок СКЛЕИВАНИЕ использует зацепленность и
родственность секвенций для уменьшения количества ветвей в дереве
поиска. Для этого используется узкий набор правил:
Г', X, Г"->
Г-н. IX 2', '|Х, 2"-> Г, Г*-* Г, X, 2, X, П ->
ПРОПОЛКА
\иНФОРМАЦИЯ
-^
Начало
— ]
^^-^
ТАКТИКА
>
'
МОНТАЖ 1
*i
i
\,Вшо0вИ2пЛ
Рис. 11.1. Блок-схема поиска вывода
в системе АЛПЕВ-ЛОМИ-2.
Г, Х-^ » Г, Г", 2', 2"
Г, X, Г"
Г, X, 2, II-
§11.2. СИСТЕМА АЛПЕВ-ЛОМИ
249
С помощью указанного набора склеиваются графически
равные секвенции и склеиваются подчиненные секвенции.
Блок ПРОПОЛКА служит для упрощения дерева поиска.
Исходными данными для пего являются закрытые копцевые
вершины и концевые вершины с повторяющимися формулами
(Г, X, 2, X, П + Д), (Г, X, 2-*~lX)t (Г, IX, 2-Х).
В вершинах первого типа вычеркиваются списки Г, 2, П и А,
в вершинах второго типа — все повторяющиеся формулы, кроме
одной.
Прополка осуществляется сверху вниз. На каждом шаге из
очередной секвенции вычеркиваются те ее члены, которые
оказались лишними ввиду уже произведенных выше упрощении.
В результате лишними могут оказаться части дерева.
Более точно это делается следующим образом. Главная
формула вершины & вычеркивается в следующих случаях: при
одном наследнике у вершины 9& (если в этом наследнике пет ни
одного нового члена); при двух наследниках у вершины Ш (если
хотя бы у одного наследника нет нового члена; при этом второй
наследник является избыточным независимо от того, имеет или
нет он новый член).
Член вершины ^, не являющийся главной формулой,
вычеркивается, если у него нет ни одного наследника или имеется
избыточный наследник в вышеуказанном смысле. После того как в $
вычеркнуты все возможные члены, из дерева вычеркиваются
избыточный наследник вершины J? и вся расположенная над ним
часть дерева.
Если процесс прополки останавливается перед некоторой
вершиной, то полученное после прополки дерево преобразуется
следующим образом. В дереве фиксируется указанная
преграждающая вершина (она всегда одна) и ее главный наследник,
графически отличный от предка и не являющийся аксиомой
исчисления Эв2 (если такой наследник есть, то он всегда один). Если
преграждающая вершина не имеет главного наследпика, то
прополка заканчивается; в противном случае от дерева отсекается
все, что располагается над главным наследником. Далее, если
главный наследник имеет пустой сукцедент, то в некоторых
случаях делается еще один шаг: главный наследник преобразуется
посредством перенесения в сукцедент (с приписыванием или
вычеркиванием внешнего знака отрицания) его нового члена.
Блоки ПРОПОЛКА и СКЛЕИВАНИЕ совместно с Эв2
образуют исчисление ЭвЗ.
Блок МОНТАЖ преобразует вывод
Qu ..., Qn -*- #,
полученный в ЭвЗ, а вывод -*■ R в исчислении lldQi, ..., QJ.
250
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
§ 11.3. Система ПРИЗ
Система ПРИЗ^ предназначена для автоматического
составления в виде готовой рабочей программы решений вычислительных
задач из имеющихся в ее памяти программных модулей и
вычислительных моделей, а также для выполнения этих решений.
Составление осуществляется но имеющемуся описанию исходной
задачи и модели предметной области, являющейся внутренним
языком системы ПРИЗ, на котором задается семантика класса
решаемых задач.
Программы
на входном
язь/не-
X
Описание
предметной
области
I Трансляторы
программ
Тело панета
предметной
области \
\Програлимь/е\
модули
L.
Описание
задачи
Транслятор
описаний
Модель
задачи
г-1
Организующая
программа
ПРРЗ
у/ланирозщи/А
1_.
АШуль
решения
подзадачи
Штиля/пор
Генератор
программ
Рабочая
программа
Рис. 11.2. Состав системы ПРИЗ.
Состав системы ПРИЗ представлен на рис. 11.2, согласно
которому ПРИЗ состоит из двух подсистем: тела пакета и
организующей программы. Тело пакета содержит совокупность
программных вычислительных модулей, информационно совместимых
между собой и функционально обеспечивающих решение класса задач
из некоторой предметной области, и модель предметной области.
Последняя содержит необходимые сведения о предметной области
и входном языке: набор понятий, данные о применимости
модулей и таблицы входного языка пакета. Возможно создание
нескольких совместимых между собой пакетов программ. В этом
случае ПРИЗ играет роль интегрированной системы
программирования для решения задач из различных предметных областей.
§ 11.3. СИСТЕМА ПРИЗ
251
Организующая программа представляет собой совокупность
служебных программ и предназначена для управления работой
пакета при решении задач. Работа этой программы не зависит от
содержания пакета и входного языка, чем достигается известная
универсальность. В функции организующей программы входят:
1) перевод с помощью транслятора описания задачи со входного
языка па внутренний, итогом которого является построение
модели задачи и управляющей программы, в совокупности
образующих внутреннее описание задачи; 2) определение с помощью
геператора программ, состоящего из планировщика и
компилятора, последовательности применяемых модулей, т. е. рабочей
программы.
Иа каждом этапе работы ПРИЗа может использоваться тело
пакета, откуда берутся вычислительные модели для перевода
входного пакета, модули для составления рабочей программы и
модули, загружаемые в ходе вычислений по рабочей программе.
Транслятор описаний и генератор программ могут
использоваться в следующих режимах:
1) по задаче, заданной текстом на расширении входного языка
УТОПИСТ, формируется ее внутреннее описание (модель задачи
и управляющая программа) и далее составляется и исполняется
рабочая программа;
2) по программам, или описаниям предметной области,
заданным на входном языке, производится расширение или изменение
тела пакета;
3) по имеющемуся в теле пакета внутреннему описанию
задачи (в качестве модели задачи выступает некоторая
вычислительная модель, а в качестве управляющей программы — пекоторый
модуль) с помощью генератора составляется и исполняется
рабочая программа;
4) задача решается аналогично первому вариапту, но
управляющая программа берется из тела пакета;
5) задача решается аналогично первому варианту, но модель
задачи берется из тела пакета.
Рассмотрим более подробпо систему ПРИЗ с точки зрения
представления знаний и поиска решепий.
11.3.1. Представление знаний. Для описания задач
используется непроцедурный язык УТОПИСТ и предпроцессор, который
переводит входной текст на язык УТОПИСТ [М. Л. Мяннисалу,
Э. X. Тыугу, 1974]. Язык является промежуточным между языком
программирования и языком управления заданиями.
Предпроцессор распознает во входном тексте стандартные слова языка и те
слова, семантика которых описана в теле пакета. Предпроцессор
сохраняет только эти выделенные слова,'а также некоторые зиа-
чепия и обозначения, которые распознаются позиционио по отно-
шснпю к выделенным словам.
232
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Поскольку в описаниях задач на входном языке нет ссылок
па модули тела пакета, то добавление новых модулей не
отражается на синтаксисе, но может менять семантику некоторых
выражении. В этом смысле УТОПИСТ является языком с
семантическим расширением. Подобным расширением языка УТОПИСТ
является проблемно ориентированный входной язык пакета
прикладных программ, на котором формулируются решаемые задачи.
Входной язык пакета предназначен для пользователей, не
являющихся профессиональными программистами.
Возможности решателя возрастают, если необходимые
вычислительные модели строятся из подмоделей модели предметной
области, содержащейся в теле пакета. Для этого вводятся
операции иад понятиями: копирование понятия с заменой его
переменных и отношений и объединение понятий, при котором
переменные отождествляются по наименованиям. В описании задачи
теперь можно использовать не только исходные и искомые
переменные, но и выражения, по которым строится модель задачи.
В таком случае при трансляции с языка УТОПИСТ каждому его
предложению ставится в соответствие некоторая вычислительная
модель, вычленяемая из модели предметной области с помощью
копирования и объединения понятий. Слова указанных
предложений обозначают объекты, связанные отношениями. В системе
ПРИЗ примерами объектов могут служить «точка», «сторона»,
«центр» и др.; примерами отношений — «прямая», «окружность»,
«квадрат» и др.
Модели предложений объединяются в модель задачи. Таким
образом, каждой исходной задаче на языке УТОПИСТ
соответствует своя структура из вычислительных моделей, вход и выход
которой совпадают с исходной задачей. Эта структура и является
моделью задачи. Модели совместно с управляющими программами
являются внутренними представлениями данных, описываемых
на языке УТОПИСТ.
Как уже отмечалось, знания системы ПРИЗ, описанные на
внутреннем языке, составляют содержание тела пакета, т. е.
модель предметной области и пакет программных модулей. Модель
предметной области в основном представляет собой архив
понятий данной предметной области. Понятие — это элементарная
вычислительная модель, содержащая совокупность объектов,
являющихся переменными, и отношений, связывающих значения этих
переменных. В вычислительных моделях отношения играют роль
имен совокупности формул или уравнений, представляемых в про-
цедуральной форме соответствующими вычислительными
модулями пакета программ.
При фиксированном отпошепии одни переменные вычисляются
с помощью модулей через другие. Вычислительная модель может
быть наглядно изображена в виде графа, вершинам которого по-
§ 11.3. СИСТЕМА ПРИЗ
253
Рпс. 11.3.
Вычислительная
КВАДРАТ.
модель
ставлены в соответствие переменные и отношения, а реорам —
связи между ними. На рис. 11.3 приведена вычислительная
модель, именуемая КВАДРАТ.
Формально модель предметпон области описывается
следующим образом. Вводится понятие оператора ф как элементарного
отношения, являющегося идентификатором соответствующего
вычислительного модуля из пакета программ. Оператор ф пменует
отображение Хф -»■ Уф, где Хф = in (ф) и УФ = out (ф) — множества
соответственно входов и
выходов оператора. Тогда
отношение /? = {ф1, ф2, ..., ф„}
является конечным
множеством операторов. Модель
предметной области М есть
пара (X, Л), где X —
множество переменных, А —-
множество отношений и для всех
операторов фе]?е4
выполняются условия in (ф)s
Е X II OUt (ф) Е X.
11.3.2. Поиск решений. Пусть задана цепочка (U = W0)(piWi...
-. .Wb-WblWt = ТШ, А/)), где in (ф,) s W^ и Wt - Wt-t U out (ф<)
для i = 1, 2, ..., к. Очевидно, такая цепочка представляет па
модели М вычислительные процессы, заключающиеся в
последовательном применении операторов ц>и ф2, ..., фь и переводящие
модель М из исходного состояния W0 в состояния Wu W2, ...
..., Wk^={T/{U^ M). Выражение T{U, АО является транзитивным
замыканием множества переменных U на модели М.
Вычислительный процесс называется бесповторным, если в цепочке фь
ф2, ..., фь ни один оператор не встречается более одного раза.
Задача на модели М = (X, А) выражается парой (£/, V), где U —
мпожество исходных переменных и V — множество искомых
переменных задачи. Задача (С/, V) разрешима на модели М с помощью
бесповторного вычислительного процесса, если V^TiU, АО.
Можно построить процедуру, которая на конечной модели М
проверяет разрешимость задачи и для каждой разрешимой задачи
строит алгоритм ее решения [Э. X. Тыугу, 1970]. Этот алгоритм
в ПРИЗе составляет основу планирования процесса решения задач.
Поиск в наиболее общем виде включает следующие
процедуры: формирование по тексту задачи ее внутреннего описания
(составление модели задачи и управляющей программы);
планирование вычислительного процесса; получение результата решения.
В частном случае процедура формирования внутреннего
описания задачи может осуществляться путем вызова из тела пакета
либо модели задачи, либо управляющей программы, либо того и
Другого вместе.
254
ГЛ 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Для решения задачи ПРИЗ согласно входному тексту задачи
создает две структуры: модель задачи и управляющую программу.
Модель задачи представляет вычислительную модель, получаемую
(согласно тексту задачи) путем вычленения из модели предметной
области соответствующих понятий и их дальнейшего
структурирования. Благодаря этому для нахождения подходящих
программных модулей п планирования вычислительного процесса
используется только необходимая рабочая информация, чем ускоряется
поиск.
Так, формирование вычислительной модели КВАДРАТ (см.
рис. 11.3) позволяет в дальнейшем по заданному, например,
значению периметра р пайти значение стороны а и затем искомое
значение площади .9.
При построении модели задачи может потребоваться
формирование системы уравнений, которые неразрешимы
последовательной подстановкой значений переменных. Необходимо уметь
выделять их в модели предметной области и уметь числетгао
решать. Задача выделения минимальпых разрешимых систем
уравнений сама по себе довольно сложна. Поэтому рассматривается
только такой класс систем уравнений, которые становятся
разрешимыми (методом итераций) при фиксации значения одной
переменной.
Примером задачи, требующей решения подобпой системы
уравнений, является следующая:
ЗРИТЕЛЬ СИДИТ В КРАЙНЕМ РЯДУ ТАК, ЧТО МЕЖДУ
НИМ, БЛИЖАЙШЕЙ ТОЧКОЙ ЭКРАНА В И БЛИЖАЙШЕЙ
ТОЧКОЙ ПЛОСКОСТИ ЭКРАНА С ОБРАЗУЕТСЯ
ПРЯМОУГОЛЬНЫЙ ТРЕУГОЛЬНИК РВС. ТРЕУГОЛЬНИК АВР
ОБРАЗОВАН ЭКРАНОМ АВ И ТОЧКОЙ Р, ГДЕ РАСПОЛОЖЕН
ЗРИТЕЛЬ. УГОЛ АРВ-УГОЛ,
А ЭКРАН В О ПОД КОТОРЫМ ВИДЕН ЭКРАН
ИЗ ТОЧКИ Р. ТОЧКА В
ПРИНАДЛЕЖИТ ОТРЕЗКУ АС.
ЗАДАНО АВ - 12, ВС = 1.
ПУСТЬ X - МАКСИМУМ ПО СР
Р ВЕЛИЧИНЫ АРВ. ВЫЧИСЛИТЬ
X (см. рис. 11.4).
Для выделения минимальных
АЛ , 0 разрешимых систем уравнений
Рис. 11.4. Задача вычисления F F J^
максимального значения угла предполагается использовать эв-
ЛРВ. рпстики типа эвристик Пойа
1Э. X. Тыугу,1971Ь
Управляющая программа в процедурной форме содержит
описание решешш задачи в виде последовательности подзадач, при
этом точное решение каждой подзадачи, а следовательно, и
задачи в целом априори неизвестно. По существу, управляющая про-
§11.3. СИСТЕМА ПРИЗ
255
грамма — это скелет решения, который в дальнейшем будет
наполняться конкретными программными модулями,
определенными с помощью модели задачи.
Так, например, управляющая программа может содержать
типовую подзадачу «определить по заданному элементу X квадрата
все его остальные элементы».
Составление управляющей программы по тексту задачи не
требует от решателя дедуктивных выводов или планирования
действий в полпом смысле этого слова. Все дедуктивные
способности решателя по существу сводятся к программированию
решений типовых подзадач.
На оспове внутреннего описания задачи планировщик
находит решение каждой подзадачи в виде последовательности
элементарных вычислительных модулей. Так, например, для
вышеупомянутой типовой подзадачи, в которой переменной х ставится
в соответствие периметр /?, он находит ее решение в вид&
следующей последовательности элементарных модулей «периметр р»,
«площадь s», «диагональ d». При этом он использует
планирование как в прямом, так и в обратпом направлениях. Прямое
планирование позволяет паходить по полученным на данном
шаге текущим исходпым данным подходящий элементарный модуль
и искомое значение переменных; обратное планирование
позволяет по искомым значениям переменных находить подходящий
элементарный модуль и требуемые исходные данные.
Вначале решатель движется в прямом направлении,
проверяет разрешимость подзадач и определяет все подходящие
элементарные молули и иеременпые для этой подзадачи. Затем,
двигаясь в обратном направлении и рассматривая только подходящие
элементарные модули, решатель находит модуль решения
подзадачи, в котором отсутствуют лишние элементарные модели.
Для повышения эффективности планирования в решателе
используются теоремы. Но так как ПРИЗ не обладает
дедуктивными способностями для самостоятельного применения теорем, то
па них необходимо ссылаться в тексте. Вводится следующее
понятие теоремы: теоремой называется вычислительная модель с
правилами, определяющими допустимые переименования
переменных. Теорема примепима, если хотя бы две переменные в ней
могут быть переименованы так, чтобы они совпали с
переменными, уже имеющимися в модели задачи.
Если планирование решепия на модели задачи копчается
безуспешно, решатель ищет теоремы для дополиепия модели. После
этого планирование может повториться.'Пример теоремы: «если
два объекта равны, то равны и их соответствующие части».
Используя управляющую программу и модули решения
подзадач, компилятор выдает полностью готовую рабочую программу
Решения исходной задачи. Эта задача решается выполнением
^56
ГЛ. ii. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
указанной рабочей программы с участием служебных программ
ПРИЗа.
Система ПРИЗ успешно решает задачи по геометрии и физике
для старших классов средней школы. Вот пример такой задачи:
ЗАДАЧА - ТЕПЛОВОЗ С МАССОЙ ЛИ ОСТАНОВИЛСЯ ПОД
ДЕЙСТВИЕМ ТРЕНИЯ, СИЛА F1, ВРЕМЯ Г1, ПРИ ЭТОМ
ПРИРАЩЕНИЕ СКОРОСТИ 33 МЕТРА-В-СЕКУИДУ.
ИЗВЕСТНЫ МАССА ЛИ = 500 Т, ВРЕМЯ Л = 1 МИН. ВЫЧИСЛИТЬ F1.
§ 11.4. Программа принятия решений
Решатель ППР включает систему знаний, в основу которой
положена система АНАЛИЗАТОР, и систему эвристического поиска
решений задач.
11.4.1. Представление знаний. Для описания объектов
(предметов или операций) на внутреннем языке в первой версии
решателя — ППР-1 — используется так называемая растущая
пирамидальная сеть (РПС). Если определить субмножество элемента
а как множество элементов, включая и а, от которых имеется
направленный путь к элементу а, то РПС определяется как сеть,
удовлетворяющая следующим условиям:
1) сеть состоит из элементов двух сортов: входных,
называемых рецепторами, и остальных, называемых ассоциативными
элементами;
2) входы рецепторов не имеют связи с другими элементами;
3) выход любого элемента а не должен быть соединен со
входом элемента, входящего в субмножество элемента а.
Назначение рецепторов — воспринимать отдельные значения
признаков объектов, назначение ассоциативпых элементов —
фиксировать либо описапия объектов в целом, либо общие значения
признаков различных объектов.
Активным входом элемента РПС называется вход,
соединенный с выходом другого элемента, иначе он называется пассивным
входом. Ассоциативный элемент возбуждается, т. е. выдает
выходной сигнал, если возбуждаются все его активные входы.
Элементы из субмпожества элемента а, связанные с ним
непосредственно, образуют 0-субмножество элемента а. Множество
элементов, к которым имеются направленные пути от элемента
а, называется супермножеством элемента а. Элементы из
супермножества элемента а, связанные с ним непосредственно,
образуют О-супермножество элемента а.
Вводятся два типа РПС: а-РПС и (J-РПС. Первые служат для
описания объектов, представляемых неупорядоченными наборами
значений признаков; вторые — для описания объектов,
представляемых упорядочепными наборами признаков, например,
последовательностью операций. Оба типа РПС при вводе новых
§ 11.4. ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
257
объектов строятся автоматически с помощью своих алгоритмов
ввода.
Рассмотрим указанные типы РПС более подробно. До ввода
данных об объекте а-РПС представляет собой набор рецепторов.
Далее алгоритм ввода формирует а-РПС следующим образом.
Принцип 1. Если при восприятии нового объекта
возбуждается подмножество F О-субмножества ассоциативного элемента
а, содержащее не менее двух элементов, связи элемента а с
элементами из множества F ликвидируются и к сети
присоединяется новый ассоциативный элемент 6, входы которого
соединяются с выходами всех элементов множества F, а выход — с одним
из пассивных входов элемента а. Новый элемент считается
возбужденным (см. рис. 11.5, а, б).
Рис. 11.5. Формирование а-РПС.
Принцип 2. Если при восприятии объекта возбуждается
подмножество G, содержащее не менее двух элементов, и каждый
элемепт G не имеет других возбужденных элементов в своих
О-супермножествах, то к сети присоединяется новый
ассоциативный элемент с, входы которого соединяются с выходами всех
элементов из G. Новый элемепт считается возбужденным (см.
рис. 11.5, б, в).
Очевидно, с помощью первого принципа формируются общие
значения признаков разных объектов, с помощью второго —
описания объекта в целом. В итоге строится а-РПС,
представляющая собой в пространстве признаков компактную структуру
данных о совокупности объектов.
При рассмотрении р-РПС в качестве объектов будем иметь в
виду последовательность операций. Отличительной особенностью
Р-РПС является нумерация пи пг, ..., пк входов ее
ассоциативных элементов, которая, будучи представлена в порядке
возрастания слева направо, характеризует вхождение
подпоследовательности с числом операций щ в подпоследовательность с
числом операций ni+i и, в конечном итоге, в последовательность с
числом операций nh. Согласно такой нумерации г-й вход
ассоциативного элемента возбуждается лишь в том случае, когда на п{
первых (слева направо) рецепторов его субмножества поступает
17 Е. И. Ефимов
258
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
непрерывная подпоследовательность из щ сигналов (имеются в
виду операции). В итоге ассоциативный элемент возбуждается
при поступлении на все nh его рецепторов непрерывной
последовательности из nh сигналов.
Алгоритм ввода формирует р-РПС следующим образом.
Принцип 1. Пусть /1Ь п2, ..♦, nh Ы)> п{ при / > J, к > 2) —
нумерация к входов элемента а, и пусть при восприятии нового
объекта на входах ; + 1, / + 2, ,. ., j + l (0<j < к — 2, 2< I «^
<& — /) появляются сигналы, возникшие в результате
поступления на соответствующие рецепторы субмножества элемента а
непрерывной подпоследовательности операций /ij+1, nj+2> .. ♦, /ij+j.
Тогда к сети присоединяется новый ассоциативный элемент Ъ по
следующим правилам: 1) связи, ведущие к входам wi+1, ..., rcj+,
элемента а, переключаются на входы нового элемента; 2) выход
нового элемента присоединяется к входу пш элемента а; 3)
номер г-го входа нового элемента подсчитывается по формуле
(О, если i = l,
щ = hi + 7imax,i, где i = 1, 2, ..., Z; /г{ =
^/z^_i, если t =7= i,
и /гтах, < приравнивается либо наибольшему из номеров
ассоциативного элемента, выход которого переключается на 1-й вход,
либо единице, если на г-й вход переключается связь от рецептора
(см. рис. 11.6, а, б).
Принцип 2. Если при восприятии последовательности
операций возбуждается подмножество G, содержащее не менее двух
элементов, и каждый элемент G не имеет других возбужденных
а а
а) б) в)
Рис. 11.6. Формирование р-Р11С.
элементов в своих О-супермпожествах, то к сети присоединяется
новый элемент с. Номера входов нового элемента подсчитываютея
по приведенной формуле (см. рис. 11.6, б, в).
Очевидно, с помощью первого принципа формируются общие
подпоследовательности различных последовательностей операций,,
с помощью второго — оиисания последовательностей в целом.
§ 11.4. ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
259
На основе а-РПС в Институте кибернетики АН УССР была
.создана обучающая система АНАЛИЗАТОР, которая
формировала понятия путем анализа обучающей выборки и
классифицировала объекты в соответствии с построенным понятием. Работа
системы происходила следующим образом. В АНАЛИЗАТОР
вводится обучающая выборка и формируется ее сеть, состоящая из
положительных и отрицательных примеров. В этой сети каждый
элемент характеризуется числом т возбуждений элемента при
восприятии положительной выборки и числом рецепторов к в
субмножестве элемента. Другими словами, тик определяют
«частоту» и «длину» данного сочетапия значений признаков в
обучающей выборке.
Таким образом, ос-РПС выражает объем понятия. Прц
распознавании в дальнейшем новых объектов в полученной а-РПС для
соответствующего понятия формируются контрольные элементы
по следующим правилам.
Правило 1. Если при восприятии положительного объекта,
входящего в объем данного понятия, в пирамиде этого объекта
нет контрольных элементов, то элемент, имеющий наибольшее т
(при равных т — наибольшее к), отмечается как положительный
контрольный элемент понятия (ПКЭП)*,
Согласно правилу пирамида каждого положительного объекта,
входящего в объем понятия, обязательно содержит ПКЭП.
Правило 2. Если при восприятии отрицательного объекта,
не входящего в объем понятия, в пирамиде этого объекта есть
ПКЭП аи a2l ..., ah не содержащие в своих супермножествах
Uи Uг, ..., Ui других контрольных элементов понятия, то в
каждом из Uu U2, ..., Ui элемент, имеющий наименьшее &,
отмечается в пирамиде как отрицательный контрольный элемент понятия
(ОКЭП).
Согласно правилу 2, если пирамида отрицательного объекта
из обучающей выборки, т. е. объекта, пе входящего в объем
понятия, содержит ПКЭП, то обязательно содержит и включающий
его ОКЭП. Другими словами, в пирамиде этого отрицательного
объекта любая последовательность из ПКЭП и ОКЭП, лежащая
на одном пути, обязательно заканчивается ОКЭП.
Правило 3. Если при восприятии положительного объекта,
входящего в объем данного понятия, в пирамиде этого объекта
есть ОКЭП аи а2, ..., ah не содержащие в своих
супермножествах Uu t/2, ..., Ui других контрольных элементов понятия, то в
каждом из Uи U2y ..., Ut элемент, имеющий наименьшее к,
отмечается как ПКЭП.
Согласно правилу 3, если пирамида положительного объекта
из обучающей выборки содержит ОКЭП, то она обязательно
содержит и включающий его ПКЭП. Другими словами, в пирамиде
этого положительного объекта любая последовательность из ПКЭП
17*
260
ГЛ 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
н ОКЭТТ, лежащая па одном пути, обязательно закапчивается
ПКЭП.
Таким образом, ПКЭП выражают наиболее характерные
сочетания значений признаков объектов из объема понятия; ОКЭП
выражают такие сочетания значений признаков отрицательных
объектов, которые включают сочетания, отмеченные как ПКЭП.
Работа алгоритма формирования понятия закапчивается, если при
очередном просмотре обучающей выборки не появляются новые
контрольные элементы.
В соответствии с отмеченными правилами формирования
контрольных элементов а-РПС для соответствующего попятия
формулируется следующее правило распознавания новых объектов.
Объект входит в объем понятия, если в его пирамиде есть либо
только ПКЭП, либо наряду с ПКЭП только такие ОКЭП,
которые содержат в своих суиермпожествах ПКЭП. Объект ие входит
в объем понятия, если в его пирамиде есть только такие ПКЭП,
которые содержат в своих супермножествах ОКЭП. Если пи одно
из условий этого правила не выполняется, то объект считается
неопределенным.
После обучения нет необходимости сохранять элементы а-РПС,
находящиеся за пределами пирамид контрольных элементов, так
как опп ие используются для распознавания новых объектов.
Таким образом, система АНАЛИЗАТОР имеет дело с
объектами, описываемыми в пространстве признаков, п в этом смысле
может быть использована для решения задач распознавания в
мире операций (см. § 3.2). Однако с помощью аппарата РПС
возможно п декларативное представление таких объектов, как
ситуация, задача и оператор.
Остановимся на этом более подробно. При создании ППР-1
использовался язык, имеющий следующий алфавит и выражения в
металингвистической символике:
идентификатор) '•- = <буква) | <идентификатор) (буква)|
I идентификатор) <цифра)
(первичная строка) :: = <пусто)Кпоследователытость
символов, не содержащая символов ( );**->
<вторичиая строка) •'• = (первичная строка)
((первичпаястрока)) (первичная строка)!(первичная строка) ((вторичная
строка)) (первичная строка)!(вторичная строка) (вторичная строка)
(элементарное выражение) •• = (идентификатор) I (число) I
I ((первичная строка)) I ((вторичная строка)) I (идентификатор)
((вторичная строка))
(описание ситуации) *' = (элементарное выражение) I
(описание ситуации); (элементарное выражение)
(описание целевой ситуации) :: = ЦЕЛЬ (описание ситуации)
(формулировка задачи) •• = (описание ситуации) (описание
целевой ситуации)
§ ii.4. ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
2G1
<список параметров) ' : = <элементарное выражение) I <список
параметров); <элемеитарпое выражение)
<обращение к процедуре) :: = ПРОЦЕДУРА идентификатор)
(<список параметров))
<первичпое выражение) :: = <элемептарное выражение)I
(обращение к процедуре)
<сиисок условии) :: = (первичное выражение) I (список
условий); (первичное выражение)
(условие применимости оператора) :: = УСЛОВИЕ ((список
условий))
(левая часть описания оператора) '• = (условие применимости
оператора) Клевая часть описания оператора) (первичное
выражение)
(правая часть описания оператора) :: = (первичпое выраже-
ппе>1 (правая часть описания оператора) (первичное выражение)
(описание оператора) : * = (левая часть описания
оператора) =>■ (правая часть описания оператора)
Пример 1. Элементарные выражения: аЬ7,В (объект 1, а),
vsin 2х + cos у), П(а V Ь V (c&d))^ (f^^d)).
Пример 2. Задача: В (обезьяна, а); В (банан, Ь); В (ящик,
с) ЦЕЛЬ взять (банан).
ПримерЗ. Оператор ПОДОЙТИ К: УСЛОВИЕ (на полу
(робот); В (объект хи х2)) В (робот, х3); РЯДОМ (робот, объект
#4)=^# (робот, хг)\ РЯДОМ (робот, объект xk) *).
В операторах с циклами подчеркиваются циклы —- части
описаний, которые при применении оператора повторяются либо без
изменения, либо с различными значениями переменных.
В ППР-1 ситуации, задачи и операторы, описанные па
рассмотренном языке, представляются в виде р-РНС. Рецепторы
соответствуют отдельным символам входного языка, ассоциативные
элементы — описаниям отдельпых компонент, задач п операторов,
а также их описаниям в целом. Такая упорядоченная
организация данных позволяет производить на оспове единых процедур
сравнение отдельных выражений, например, при распознавании
условий применимости оператора. Иллюстрация представления
оператора ПОДОЙТИ К приведена па рис. 11.7.
И.4.2. Поиск решений. Схема поиска решений задачи
системой ГШР-1 содержит следующие основные процедуры:
построение дерева подцелей, выбор очередного оператора, анализ дерева
подцелей и изменение направления поиска. Рассмотрим эти
процедуры применительно к случаю, когда описания ситуаций,
задач и операторов представляют собой линейные последовательно-
*) В ИПР-1 описание операторных схем предполагает процедуру
вычеркивания (см. [Файкс, Нильсон, 1971]), поэтому после применения
оператора ПОДОЙТИ К в описании исходной ситуации вычеркивается
выражение В (робот, хъ) п РЯДОМ (робот, объект х4).
262
ГЛ. И. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
сти элементарных выражении, описываемых предикатами вида
P(tif t2y ..., tn), где Р — наименование д-местного предиката и
U — термы (переменные или константы).
Построение дерева подцелей. Целевая ситуация как
совокупность элементарных целей (элементарных выражений)
может быть достигнута путем применения соответствующих
операторов. Это означает, что она должна быть «покрыта» правыми
частями этих операторов. Фиксированный вариант покрытия
определяет конъюнктивное множество левых частей операторов или
,-л Правая
"7 часть
ж
о ш
И а полу
Mi I
о
Робот
№
О
Объема
й о
Рядом
Рис. 11.7. Представление оператора ПОДОЙТИ К с помощью Р-РПС.
конъюнкцию ближайших подцелей. Множество вариантов
покрытия определяет множество альтернативных решений или
множество дизъюнктивно связанных подцелей.
Целевой ситуации соответствует начальная вершина и
одновременно 1-й ярус дерева. В результате осуществления
процедуры обратного применения операторов формируется сверху вниз
И/ИЛИ дерево редукций. В этом дереве дочерними
конъюнктивными вершинами i-ro яруса являются выражения, из которых
путем применения соответствующих операторов может быть
получена родительская вершина U—1)-го яруса. Последний п-ш ярус
§ 11.4. ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
263
дерева содержит только заключительные вершины,
принадлежащие исходной ситуации. После построения дерева подцелей
вершины (/г —1)-го яруса составляют первоначальный список
подцелей. Построенное таким образом И/ИЛИ дерево содержит
всевозможные поддеревья решений исходной задачи. Теперь
необходимо найти паилучшее решение.
Выбор очередного оператора. В системе ППР-1
осуществляется направленный эвристический поиск решений на
ранее полученном дереве редукций. В основу направленного поиска
положены два момепта: многоцелевая направленность
выбираемого оператора и приоритет более конкретных целей над менее
конкретными, т. е. над целями, содержащими большее количество
переменных.
Очередной оператор выбирается из числа применимых к
текущей ситуации (исходной или полученной в результате
применения ранее выбранных операторов) с помощью оценочной функции
Q следующего вида:
где А?! — число помечаемых элементарных целей в списке
подцелей, совпадающих с точностью до переменных с помечаемыми
элементарными выражениями правой части рассматриваемого
оператора, к2 — число помеченных элементарных выражений
оператора, Lt.— суммарное число элементарных целей во всех
подцелях списка, содержащих помеченные элементарные цели, шЬ2 —
общее число элементарных целей в правой части оператора.
Очевидно, функция Q выражает многоцелевую направленность
выбираемого оператора, и чем она больше, тем предпочтительнее
выбор данного оператора. В итоге выбирается оператор с
наибольшим (), который и применяется к текущей ситуации,
осуществляя тем самым очередной шаг искомого решения
исходной задачи.
Анализ дерева подцелей. Анализ производится всякий
раз, когда выражения дерева оказываются, с точностью до
переменных, равными выражениям текущей ситуации, полученной
после применения очередного оператора (см. рис. 11.8). Значения
переменных х{, при которых достигается указанное равепство,
вносятся в список значений (СЗ), который формируется заново
при каждом запуске процедуры анализа.
Процедура анализирует возможность продвижения вверх по
дереву подцелей, исходя из последних достигнутых вершин.
Другими словами, она проверяет применимость операторов к
полученной текущей ситуации. Если рассматриваются вершины типа
И, то проверяется, все ли их выражения входят в текущую
ситуацию. При этом испытываются подстановки значений перемен-
2G4
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
ных из СЗ, а получаемые новые значепия х\ помещаются в СЗ.
Если подстановки из СЗ пе дают необходимых равенств, то
соответствующие группы значений х\ исключаются из СЗ для
дальнейшего анализа. Если в ходе анализа устанавливается
достижимость начальпой вершины, то это означает успех и
соответствующее поддерево решений объявляется искомым решением.
В противном случае очередные родительские вершины с учетом
\3апись значений
х в СЗ
Нет
(Теть ли непрд\ Нет
щеренные цели?)
\Да
Подстановна знач. so
в выражение
проверяемой, подцели
Сравнение выраж.,
полученных после
подстановки, с вы-
раж. тек, ситуации
Найдены ли
выраж., равные про-
веряемой подцели
при данных знач.?
ЪДа
выписывание новых
значений в СЗ
\М ( Есть ли еще в СЗ \
ч группы знач. х? )
\Нет
№
найдено ли хотя бы одно
выраж., равное провер.
подцели при наних-
лиоо знач. я из СЗ?'
\Иет
Занесение выраж.,
получен, в рез.
подстановна as
в списон целей
(Получена"
\ли цель
1*°ярусаТ
Да
Конец
- (решение\
Унайденоу
Переход на долее
высокий ярус дерева
Нет
\Вычернивание
группы значений хвСЗ
I Конец
У/ решение ,
yteнайдено)
Рпс. 11.8. Блок-схема анализа дерева целей.
§ 11.4. ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
265.
произведенных подстановок зпачений переменных х% пополняют
список подцелей, используемый для выбора очередного
оператора из числа применимых в дапной текущей ситуации.
Изменение направления поиска. Если для
последних т выбранных операторов (число т назначается па
основании опыта) функция Q убывает, то осуществляется возврат па
т шагов назад; при этом (/тг — 1) последних операторов
исключаются, а т-и оператор снабжается запретной меткой. После этого
выбирается новый альтернативный вариант.
Дальнейшим развитием ППР-1 явилось создание решателя
ППР-2. В новом решателе усовершенствована стратегия поиска
(за счет введения двунаправленного поиска в прямом и обратном
направлениях). Используются эвристики, обеспечивающие в
процессе поиска решения рост отдельных ветвей дерева подцелей
навстречу цепочке операторов, наращиваемой в прямом
направлении.
Целевые ситуации в ППР-2 представлены контрольными
элементами РПС. Рецепторы сети соответствуют отдельным
предикатам, определяющим свойства и связи объектов; пирамиды —
обобщенным описаниям ситуаций, т. е. выражениям с переменными;
контрольные элементы — сочетаниям предикатов, характерных
для классов целевых ситуаций.
Определение-рабочей информации для рассматриваемой
задачи в ППР-2 осуществляется на основе анализа РПС. Для этого
возбуждается пирамида, соответствующая описанию целевой
ситуации. По контрольным элемептам указанной пирамиды
выделяются все пирамиды, в которые они входят, и тем самым
формируется рабочее поле необходимой информации. В процессе поиска
рабочее поле расширяется за счет возникновения новых подцелей
и связанных с ними объектов.
В ППР-2 осуществлено автоматическое выделение
макрооператоров па основе накопления опыта. Для этого все получаемые
решения запоминаются в виде ji-РПС, ассоциативные элементы
которой соответствуют последовательностям операторов,
входящим в несколько решений. Для каждого такого элемента подсчи-
тывается частота; как только она превысит некоторый порог,
формируется макрооператор.
Планы в ППР-2 являются обобщением конкретных решений,
и их можно применять для решения однотипных задач. Для
выяснения возможности применения плана необходимо сопоставлять
описание задачи с описанием класса задач, к которым применим
план. В ППР-2 это делается автоматически и наряду с
формированием макрооператоров является формой обучения решателя.
Формирование описания класса задач происходит аналогично
формированию понятий, о котором говорилось рапее. Описание
класса задач состоит из описания класса исходных ситуаций и они-
266
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
сания класса целевых ситуаций. Класс задач включает заданную
вадачу, если ее исходная и целевая ситуации включаются в
соответствующие компоненты описания класса задач. Таким образом,
при редуцировании заданной задачи на подзадачи последние
распознаются (классифицируется) по отношению к классам задач
ранее описанным способом и тем самым определяется
подходящий план, а с ним и конкретное решение.
Аналогичным образом в ППР-2 выделяется рабочий массив
операторов, необходимых для решения задачи данного класса.
Пример. В качестве иллюстративного примера рассмотрим
сборку роботом-манипулятором прессформ для пластмассовых
изделий в радиотехнической промышленности.
Модель внешнего мира. Основными факторами,
определяющими необходимость автоматизации сборки (разборки) пресс-
форм, являются: большой объем номенклатуры применяемых в
нашей промышленности типов прессформ (несколько тысяч на
радиотехническом заводе средней мощности); частое изменение
номенклатуры в связи с усовершествованием и освоением новых
изделий; большой разброс по тиражу прессуемых изделий.
Разработка централизованных библиотек стандартных
программ, позволяющих предприятиям при необходимости получать
нужные программы действий робота-манипулятора, не дает
нужного экономического эффекта: во-первых, возникает большая
избыточность ресурсов библиотеки по отношению к потребности
отдельного предприятия; во-вторых, основной фонд такой
библиотеки должен был' бы насчитывать несколько тысяч программ, что
потребовало бы для ее обслуживания квалифицированных
специалистов, способных составлять и вводить в библиотеку указанные
программы. Поэтому более перспективно создание
автономных систем.
Вводятся следующие определения.
Стыковочная поверхность детали (сборки) — любая
поверхность, по которой данная деталь (сборка) может быть
состыкована с другими деталями или сборками; стыковочные поверхпосш
могут быть нижними и верхними.
Нижняя стыковочная поверхность — это поверхность, на
которую производится установка детали или сборки.
Верхняя стыковочная поверхность — это поверхность, по
которой деталь или сборка устанавливается на другой детали
(сборке).
Базовая поверхность — это поверхность детали только с
нижними стыковочными поверхностями, на которой она должна быть-
установлена перед установкой на нее других деталей.
Устанавливаемая сборка — сборка из двух деталей, в которой
образована верхняя стыковочная поверхность из поверхностей
этих деталей.
§11.4 ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
267
Фрагмент стыковочной поверхности — поверхности деталей,
образующие стыковочную поверхность устанавливаемой сборки.
Класс задач сборки прессформ определяется следующими
требованиями:
1. В исходной ситуации детали прессформ размещены на
монтажном столе в произвольном положении, по так, что возможен
захват любой детали за любые плоскости без изменения
положения остальных деталей.
2. Устаповку деталей на нижпие стыковочные поверхности
можно производить лишь тогда, когда детали, которым
принадлежат эти поверхности, уже установлены па другие детали или
поставлены на свои базовые поверхности.
3. Манипулятор может захватывать, устанавливать и снимать
отдельные детали или устанавливаемые сборки с
присоединенными к ним деталями.
4. Установка деталей или устанавливаемых сборок на любые
стыковочные поверхности одной детали, не включающие одна
другую, может выполняться в любом порядке.
Планирование действий робота разделяется на два уровня.
Верхний, технологический уровень определяет порядок
соединения деталей при сборке прессформы заданного типа. На нижнем
уровне программно описаны последовательности элементарных
действий (перемещения, повороты, захваты и т. д.),
соответствующие операторам технологического уровня.
При составлении описания наибольшие затруднения для ППР
вызывают следующие особенности формализуемых задач:
1. Возможность установки сборок стыковочными
поверхностями, состоящими из фрагментов стыковочных поверхностей.
2. Возможность установки на одну деталь нескольких
деталей путем их нанизывания на длинные направляющие штыри
этой детали.
3. Техническая невыполнимость установки и съема некоторых
сборок деталей.
4. Необходимость соблюдения определенного порядка в
установке деталей па нижние стыковочные поверхности, включающие
одна другую: нижняя стыковочная" поверхность готова к
установке детали лишь после полного окончания сборки частей пресс-
форм, установленных на стыковочных поверхностях, которые
расположены внутри нижней поверхности.
Описание мира для системы планирования ППР состоит из
описания деталей прессформ, расположенных на монтажном
столе. В описание детали входит информация, характеризующая
деталь в целом, информация о стыковочных поверхностях и их
Фрагментах. Для описания стыковочных поверхностей (СП) и их
Фрагментов используются следующие элементарные выражения
языка ППР-1:
2G8
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
1. ТИП (пов. Хи Х2, Х3, Х4, Х5) — СП Xi детали Х2
принадлежит классу Х3, типу Х4 и является Хь — нижней или верхней.
Существуют четыре класса СП.
Класс 1 — СП, которые граничат с фрагментами СП.
Класс 2 — все СП, ,не принадлежащие классу 1, с помощью
которых выполняется соединение двух деталей.
Класс 3 — СП, обеспечивающие присоединение к одной
детали нескольких путем нанизывания их на длинные направляющие
штыри.
Класс 4 — фрагменты СП.
2. ДОСТУПНА (нов. Хи Х2) — СП Х4 детали Х2 свободна.
3. СОДЕРЖИТ (пов. X,, Х2, пов. Х3, XJ - внутри СП X,
детали Х2 находятся другие СП, записанные в циклический список
пов. Х3, с установленными на них деталями из циклического
списка Х4 *).
4. ПРОТИВОПОЛОЖНАЯ (пов. X» пов. Х2, Х3) -
поверхность Х2 противоположна СП Xt детали Х8.
5. СМЕЖНЫЕ (пов. Х1? пов. Х2, Х3) — СП Xj класса 1 дета-,
ли Х3 граничит с фрагментом СП Х2.
6. iVBH (пов. Xi, X2) — суммарное число доступных СП,
расположенных внутри СП Xi детали Х2, доступных СП всех
деталей, установленных внутри поверхности Хь
Деталь в целом описывается следующими элементарными
выражениями:
1. УСТАНОВЛЕНА tXt) — деталь X, стоит на базовой
поверхности или установлена на другую деталь.
2. СНЯТА (XJ — деталь Xi снята с ирессформы.
3. БАЗОВАЯ (XJ — деталь Х4 имеет базовую поверхность.
4. iVcrtXt) — число нижних СП детали Хь
5. #Соед(Х,) — число деталей, непосредственно установленных
на нижние СП детали Хь
Описанием целевой ситуации служит описание прессформы,
которую нужно собрать. Возможны три варианта описания пресс-
формы.
Вариант 1. Каждому соединению деталей прессформы с СП
классов 1 и 2 соответствует либо СОЕДИНЕНЫ (X,, пов. Х2, Х3,
пов. Х4) — детали X, и Х3 соединены по СП Х2 и Х4, либо
СОЕДИНЕНЫ (СБОРКА (Xt*X2), пов. (Х3, Х4), Х5, пов. Хв) -
сборка из деталей Xj и Х2 соединена по СП Х3 и Х4 с СП Хв
детали Х5.
Вариант 2. Каждому соединению деталей прессформы с СП
классов 1 и 2 соответствует либо СОЕДИНЕНЫ (Xlt X2), либо
*) Здесь и далее подчеркнутые прямой линией выражения являются
циклами,
§11.4 ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
269
СОЕДИНЕНЫ (СБОРКА (X, * Х2), Х5). В отличие от
предыдущего варианта, здесь не указываются СП. Вариант 2 можно
применять, когда такие описания однозначно определяют прессфор-
му, например, когда для каждой пары деталей существует только
один вариант соединения.
Вариант 3. Вся прессформа описывается выражением
Х\ & Хг, в цикле Х^ которого перечисляются все присоединенные
детали, из которых состоит прессформа. Третий вариант
применим, когда каждая прессформа однозначно определяется набором
своих деталей.
Для варианта 2 операторы можно описать таким образом,
чтобы вместо стандартных обращений к процедурам,
предусмотренным входным языком ППР-1, были записаны выполняемые
процедурами операции. Выражения, определяющие операции,
должны быть подчеркнуты волнистой чертой. Всем выражениям в
целях лучшего пояснения присвоим номера. Приведем
соответствующие примеры.
1. ПОСТАВИТЬ (X,).
УСЛОВИЕ ((1) ВАЗОВАЯ (X*), (2) СНЯТА (X,)) (3) СНЯТА
(Xj) => (4) УСТАНОВЛЕНА (ХЛ При выполнении оператора
деталь Xt устанавливается на базовую поверхность.
2. УСТАНОВИТЬ 1 (нов. Хи Х2, пов. Х3, Х4).
УСЛОВИЕ ((1) ТИП (пов. Хи Х2, кл. 1, Х5, верхи.); (2)
ДОСТУПНА (пов. Хи Х2); (3) ТИП (пов. Х„ Х4, кл. 1, Х5, нижи.);
(4) ДОСТУПНА (пов. Х3, Х4); (5) УСТАНОВЛЕНА (Х4); (6)
iV№)=0; (7) AWnos. Хзг Х4) »0; (8) ТИП (пов. Х6, Х2,
кл. 4, Х7, Х8); (9) ТИП (пов. Х9, Х4, кл. 4, Х7, Х8); (10)
СМЕЖНЫЕ (нов. X,, пов. Х6, Х2); (11) СМЕЖНЫЕ (пов. Х3, пов. Х9,
Х4)); (12) ДОСТУПНА (пов. Хх, Х2): (13) ДОСТУПНА (пов. Х3,
Х4); (14) СНЯТА (Х2-)=М15) УСТАНОВЛЕНА (Х2); (16) ТИП
(пов. (Х6, Х9), СБОРКА (Х2*Х4), кл. 2, Х7, Х8); (17)
А;соеД(Х4) :: = Ncom(XJ + 1; (18) ДОСТУПНА (пов. Хв, Х9),
СБОРКА (Х2*Х4)); (19) Л^оед (СБОРКА (Х2*Х4)::=0; (20)
Оператор используется для соединения деталей в
устанавливаемые сборки. Оператор применим, если соединяемые детали Х2
п Х4 имеют доступные СП класса 1 Xd и Х3 (выр. (1) — (4))*
граничащие с фрагментами СП Х<$, Х9 (выр. (10), (И)). Деталь
А'4, имеющая нижнюю СП, должна быть установлена на другую
Деталь или на свою базовую поверхность (5). Устанавливаемая
Деталь Х2 не должна быть соединена с какими-либо другими
деталями (6). Внутри СП Х3 не должно быть доступных СП (7).
В результате выполнения оператора из фрагментов СП XG, Х9
образуется новая СП сборки детален Х2, Х4 (16). Число детален,
непосредственно присоединенных к детали Х4, увеличивается на
270
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
единицу (17). Переменной iVC0En сборки присваивается значение
0 (19).
3. УСТАНОВИТЬ 2 (пов. Х„ Х„ пов. Х3, X,).
УСЛОВИЕ ((1) ТИП (пов. Х„ X„ кл. 2, Х„ верхи.); (2)
ДОСТУПНА (пов. Х„ X,); (3) ТИП (пов. Х3, X,, кл. 2, Х„ пижн.);
(4) ДОСТУПНА (пов. Х3, X»); (5) УСТАНОВЛЕНА (X,); (6)
Nc.okz(X2) - 0; (7) iVBH(noB. X», Х4) = 0); (8) ДОСТУПНА (пов.
Х„ Х2); (9) ДОСТУПНА (пов. Х„ X»); (10) СНЯТА (Х2); (И)
СОДЕРЖИТ (пов. Х„ X», пов. Х^, Хт); (12) СОДЕРЖИТ (пов.
Х„ Х„ пов. Х!?1_Х«)-*-(13) СОЕДИНЕНЫ (Х„ пов. Х„ Х4, пов.
Х3); (14) УСТАНОВЛЕНА (Х2); (15) ЛГС0ВД(Х.):: = ЛГСоВД(Х4) + 1;
(16) СОДЕРЖИТ (пов. Х„ Х4,'пов. X,, X,, X,); (17) СОДЕРЖИТ
(пов. Х„, Х9, пов. Xio, Хг, Xj); (18) Л^Вп(пов. X», ^):_:_ = #вПпов.
Х„ X4)-1 + JVCT(X2); (19) iVBH(noB. Х„ X.) :: - #вн (пов. Х„
Лj - 1 + УУСТ(Х2). (20) ^(СБОРКА (Х4 * X,,)):: = Ncv
(СБОРКА (X4*X„))-1+JVct(X2).
Оператор используется для установки деталей и
устанавливаемых сборок СП класса 2. Оператор применим, если деталь Х4 с
нижней СП Х3 уже установлена (5), деталь Х2 с верхней СП X!
не соединена с другими деталями (б) и полностью окончена
сборка частей прессформы внутри нижней СП (7). В результате
выполнения оператора деталь Х2 устанавливается на деталь Х4 (13)»
пересчитывается Ncoer детали Х4 (15). Если СП, на которую
производится установка, находится впутрп другой СП Х6, изменяется
yVBH поверхности Х„ (18). Пересчитывается NBr всех тех СП,
внутри которых размещена деталь Х4 (19). Деталь Х2 вносится в
списки деталей, установленных впутри этих поверхностей, а также
внутри поверхности Хв (выр. (11), (12), (16), (17)). Если деталь.
Х4 входит в состав устанавливаемой сборки, изменяется NCt
сборки (20).
4. УСТАНОВИТЬ 3 (пов. Х„ Х„ пов. Х„ Х4).
УСЛОВИЕ ((1) ТИП (пов. Х„ Х„ кл. 3, Х„ верхн.); (2)
ДОСТУПНА (пов. Х„ Х2); (3) ТИП (пов. Х3, Х4, кл. 3, Х„ пинш.);
(4) ДОСТУПНА (пов. Х3, X»); (5) УСТАНОВЛЕНА (Х4); (6)
дгсовд(Х2) - 0; (7) JVBH(noB. Х3, Х4) = 0: (8)
ПРОТИВОПОЛОЖНАЯ (пов. Х„ пов. Х„, X,)); (9) ДОСТУПНА (пов. Х„ Х2); (10)
ДОСТУПНА (пов. Х„ Х4); (И) СНЯТА (X,); (12) СОДЕРЖИТ
(пов. Х„ Х4, пов. Х_3, X,); (13) СОДЕРЖИТ (пов. Х„ Х„, пов.
Хм, X») -*- (14) СОЕДИНЕНЫ (Х„ пов. Xt, X4, пов. Х3); (15)
УСТАНОВЛЕНА (X,); (16) AWX,) : : - ^С0ЕД(Х4) + 1; (17)
СОДЕРЖИТ (пов. Х7, Х4, пов. X,, Х2, X,); (18) СОДЕРЖИТ (пов. Х„
Х,о, пов. Хи, Хг, Xj); (19) ТИП (пов. X», Х2, кл. 3, Х5, нижн.);
(20) ДОСТУПНА (пов. Х„ Х2); (21) #вн (пов. Х7, XJ:: == NB&
§ П.4. ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
271
(лов. Х7, Х,)-1 + ;Уст(Хг); (22) NBR (пов. Х„ X.,:: = iVBH (пов.
X,, Xlt,)-l + JVcT(X2); (23) уст. (СБОРКА_ (Х4_* X»))::_= Net
(СБОРКА (X, * Х,2)) - 1 + JVCT(X2).
Оператор используется для установки деталей СП класса 3.
Описание оператора отличается от описания оператора 3 только
выражениями (8), (19) и (20). Эти выражения указывают, что
поверхность, противоположная верхней СП устанавливаемой
детали, после установки преобразуется в нижшою СП класса 3,
которая в свою очередь может быть использована для
присоединения новых деталей.
5. СНЯТЬ «X»).
УСЛОВИЕ ((1) ТИП (пов. (X,, X,), СБОРКА (X, • Х2), кл. 2,
X», Хв); (2) СНЯТА (сборка (X, *Х4)); (3) ЛиЕД(Х.) = 0; (4)
УСТАНОВЛЕНА (X,); (5) ТИП (пов. (Х2, Х3), СБОРКА (X, * Х4),
кл. 2, Х„ Хв); (6) ДОСТУПНА (пов. (Х2, Х3), СБОРКА (Х2 * Х4));
(7) Л'соед (СБОРКА (Х,»Х,)); (8) NCT (СБОРКА (Х,*Х4))=*
-> (9) ДОСТУПНА (пов. Х2, Х4); (10) ДОСТУПНА (пов. Х3, X4)j
(И) СНЯТА (X,); (12) #С0ЕД(Х4):: = ^С0ЕД(Х4) - 1.
Оператор используется для разборки устанавливаемых сборок.
Разборку устанавливаемой сборки можно производить лишь в
том случае, если она снята с прессформы (2) и с ее верхней
части (т. е. части с верхней СП) сняты все детали, соединенные
поверхностями классов 2 и 3. При выполнении оператора в
описании ситуации вычеркиваются все выражения, определяющие
разбираемую конструкцию (4)—(8). Поверхности, которыми
соединялись детали в сборке, становятся доступными (выр. (9), (10)).
6. СНЯТЬ 2 (X,).
УСЛОВИЕ ( (1) СОЕДИНЕНЫ (Х„ пов. Х2, Х„ пов. Х4); (2)
]УГ,ОЕД(Х,) = 0; (3) ТИП (пов. Х2, Х„ кл. 2, Х„ верхи.)); (4)
СОЕДИНЕНЫ (Х„ пов. Х2, Х3, пов. Х4); (5) УСТАНОВЛЕНА (X,);
(6) СОДЕРЖИТ (пов. Х0, Х3, пов. X*, Х„ X,); (7) СОДЕРЖИТ
(пов. Х8, Х9, пов. Xjj, Х„ Х3) =^ (8) ДОСТУПНА (пов. Х2, X,);
<9) ДОСТУПНА (пов. Х4, Х3); (10). ЛГСоед(Х3) :: = ЛГС0ЕД(Х3) - 1;
(И) СНЯТА (X,); (12) СОДЕРЖИТ (пов. Хв, Х3, пов. X,, X,);
(13) СОДЕРЖИТ (пов. Х„ Х9, пов. Xj,, _Х,); (14) Nm (пов. Х6,
X,):: - JVBII (пов. Х6, Х3) + 1 - ЛГСТ(Х,); (15) JVBH (пов. Х8,
^-•Г-^вн (""в- Х8, Xj + 1-NcAXJ; (16) iVCT(CBOPKA (X, *
* Хи)):; = JVCT(CBOPKA (X3 * X,»)) + 1 - NCT{Xt).
Оператор используется для отсоединения от прессформы
детали X,, установленной СП класса 2. Деталь можно отсоединить,
«ели к ней не присоединены другие детали (2). При выполнении
оператора производится корректировка Л^соед детали Х3, с
которой снимается деталь Х4 (10), а также корректировка iVBH СП
детали Х3, внутри которой была установлена снимаемая деталь (14)
272
ГЛ. It. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Эта деталь вычеркивается из всех списков, регистрирующих
детали, которые установлены внутри СП (выр. (6), (7), (12), (13)).
Поверхности, которыми соединялись разъединяемые детали,
становятся доступными (выр. (8), (9)). Если деталь Х3 входит в
состав устанавливаемой сборки, изменяется NCt сборки (16).
7. СНЯТЬ 3 (ХО.
УСЛОВИЕ ( (1) СОЕДИНЕНЫ (Xt, пов. Х2, Х3, пов. Х4); (2)
jy<W*t)-0; (3) ТИП (пов. Х2, Хи кл. 3, Хб, верхи.); (4)
ПРОТИВОПОЛОЖНАЯ (пов. Х2, пов. Хв, X,)); (5) СОЕДИНЕНЫ
(Хь пов. Х2, Х„ пов. XJ; (6) УСТАНОВЛЕНА (X,); (7) ТИП
(пов. Хв, Х„ кл. 3, Хв, нижн.); (8) ДОСТУПНА (пов. Xe, Xt); (9)
СОДЕРЖИТ (пов. Х7, Х3, пов. X*, Xt, X_8); (10) СОДЕРЖИТ
(пов. Х9, Х10, пов. Хи, Хи X*) ■* (И) ДОСТУПНА (пов. Х2, Xt);
(12) ДОСТУПНА (пов. Х4, Х9); (13) NC0ER(Xs):: - ^соед(Х3) - 1;
(14) СНЯТА (XJ; (15) СОДЕРЖИТ (пов. Х7, Х3, пов. X*, XJ;
(16) СОДЕРЖИТ (пов. Х9, Х10, пов. _Хн,_Х3); (17) 7Урн(пов. X7t
Хз):: - ТУвн (нов. X,, XJ + 1 - jVctUj); (18) JVbh(hob., Х0,.
Xi0); : *= #вн(пов. Х9, Х10) + 1 - #ст(Х4); (19) JVBH (СБОРКА
(Хз * Х12)):: *=7УСТ (СБОРКА (Х3 * Х12)) + 1 - NctJXJ.
Оператор используется для отсоединения от прессформы
детали Хи установленной СП класса 3. Описание оператора
отличается от описания оператора 6 только выражениями (4), (7), (8),
1чоторые показывают, что поверхность, к которой присоединена
деталь Xl9 после выполнения оператора перестает быть
стыковочной поверхностью.
Операторы, соответствующие варианту 1 описания прессформ,
отличаются от приведенных только структурой выражений типа
СОЕДИНЕНЫ: при использовании варианта 3 описапия пресс-
форм выражения СОЕДИНЕНЫ в правых частях описания
операторов установки заменяются выражениями типа Xi&X^, где
Х4 и Х2 — соединяемые детали.
Особенности формализуемых задач, рассмотренные выше,
учитываются в описании операторов следующим образом:
1. Образование СП из фрагментов осуществляется при
выполнении оператора УСТАНОВИТЬ 1. Сборки и отдельные детали
устанавливаются оператором УСТАНОВИТЬ 2.
2. Установка на одну деталь нескольких деталей путем их
нанизывания на длинные направляющие штыри реализуется
оператором УСТАНОВИТЬ 3. Здесь применяется метод
искусственного восстановления условий применимости оператора после
нанизывания каждой детали. Восстановление условий достигается
путем преобразования верхней поверхности установленной детали в
стыковочную, что создает возможность повторного применения
того же оператора.
§ 11.4. ПРОГРАММА ПРИНЯТИЯ РЕШЕНИЙ
27£
3. Запрещение установки и съема каких-либо сборок деталей^
кроме устанавливаемых, реализуется путем учета для каждой
детали числа устанавливаемых па ней других деталей (переменная
Л^соед)- Установка детали может быть выполнена только при
нулевом значении Л^соед.
4. Порядок установки деталей на СП, включающие другие СП,,
реализуется путем учета для каждой нижней СП числа
свободных СП, размещенных непосредственно на ней п на всех
установленных внутри нее деталях. Учет выполняется с помощью
переменных NBn, Net, а также списков СП и деталей в
выражениях типа СОДЕРЖИТ (пов. Хи Х2, пов. Хз, XJ. Установка
детали на нижнюю СП производится лишь после того, как на ней el
па размещенных впутри нее деталях не остается свободных СП
Wbh-0).
Планирование действий
робота-манипулятора на технологическом уровне. Описание исходной
ситуации:
описание детали 1;
СНЯТА (1)_
БАЗОВАЯ (1)
ЛГст(1)-2
#СОЕд(1)=0
ТИП (пов. а, 1, кл. 2, 1, нижн.)
ДОСТУПНА (пов. а, 1)
СОДЕРЖИТ (пов. а, 1, пов. Ъ)
iVBH(noB. а, 1) «= 1
ТИП (пов. Ъ, 1, кл. 2, 11, нижп.)
ДОСТУПНА (пов. Ь, 1)
iVBH(noB. by 1) = О
описание
детали 1;
описание
детали 1;
поверхности а
поверхности J>
описание детали 2;
СНЯТА (2)
iVCT(2) - О
Лсовд(2>-0
ТИП (пов. Ь, 2, кл. 1, 1, верхп.)
ДОСТУПНА (пов. Ь, 2)
СМЕЖНЫЕ (пов. 6, пов. d, 2)
ТИП (пов. d, 2, кл. 4, 11, верхн.)) описание
J детали z;
описание поверхности
детали 2;
поверхности
описание детали 3;
18
СНЯТА (3)
БАЗОВАЯ (3)
iVCT(3) - 1
Л^СОЕД(З) - О
ТИП (пов. а, 3, кл. 1, нижн.)
ДОСТУПНА (пов. а, 3)
СМЕЖНЫЕ (пов. а, пов. с, 3)
Л^вн(пов. а, 3) *- О
Е. И. Ефимов
описание поверхности а
детали 3;
274
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
ТИП (пов. с, 3, кл. 4, 11, верхн.) 1 описание поверхности с
r J детали 3;
СНЯТА (4) 1
7VCt(4) =0 ? описание детали 4;
^СОЕД(4) - 0 J
ТИП (пов. Ь, 4, кл. 2, 1, верхн.) 1 описание поверхности Ь
ДОСТУПНА (пов. Ь, 4) J детали 4;
Описание целевой ситуации:
СОЕДИНЕНЫ (СБОРКА (2, 3), 1)
СОЕДИНЕНЫ (4, 1).
При построении плана оператор ПОСТАВИТЬ выбирается с
приоритетом по отношению к другим операторам. Он
выполняется во всех случаях, когда имеются условия его применения. В
результате двукратного применения оператора ПОСТАВИТЬ к
исходной ситуации выражения СНЯТА в описаниях деталей 1 и 3
заменяются выражениями УСТАНОВЛЕНА. После этого
единственным применимым оператором оказывается оператор,
выполняющий соединения деталей 2 и 3 — УСТАНОВИТЬ 1 (пов. &, 2,
нов. а, 3). В результате выполнения этого оператора появляются
выражения УСТАНОВЛЕНА (2); ТИП (пов. (Ь, а), СБОРКА (2*
♦ 3), кл. 2, И, верхн.): ДОСТУПНА (пов. (6, я), СБОРКА (2*3))
ж новые переменные ^соед (СБОРКА (2*3)), iVCT (СБОРКА
(2*3)).
В повой ситуации применимы операторы УСТАНОВИТЬ 2 к
•сборке деталей 2, 3 и детали 1 и СНЯТЬ 1 к деталям 2 и 3.
Выбирается оператор УСТАНОВИТЬ 2, так как при его выполнении
достигается цель СОЕДИНЕНЫ (СБОРКА (2 * 3), 1). Затем опять
можно применить два оператора: УСТАНОВИТЬ 2 к деталям 1
и 4 и СНЯТЬ 2 к сборке деталей 2, 3 и детали 1. Выбирается
первый оператор, так как он приводит к достижению оставшейся
цели СОЕДИНЕНЫ (4, 1).
Итак, формируется следующий плап сборки:
ПОСТАВИТЬ (1); ПОСТАВИТЬ (3); УСТАНОВИТЫ (пов. Ь,
2, пов. а, 3); УСТАНОВИТЬ 2 (пов. (6, а); СБОРКА (2*3),
лов. 6, 1); УСТАНОВИТЬ 2 (пов. Ь, 4, пов. а, 1).
§ 11.5. Система принятия решений интегрального робота
Система принятия решений интегральпого робота (ПРИР)
предназначена для решения следующих производственных задач:
перемещение объектов в производственной среде, сборка узлов
по их описанию и перемещение робота в производственной среде.
Система ПРИР (см. рис. 11.9) содержит следующие три
модели: модель памяти, формирующую решения типовых подзадач,
модель поиска, осуществляющую поиск новых решений в прост-
§ it.5. СИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ ИНТЕГРАЛЬНОГО РОБОТА 275
раистве редукций, и модель обучения, осуществляющую
обобщение новых решений.
Модель памяти содержит информационную базу и блок
интерпретаций. Информационная база хранит знапия и текущие
данные. Блок интерпретаций выделяет рабочую информацию.
Модель поиска содержит блок генераций, строящий дерево поиска, и
блок управления, указывающий порядок раскрытия вершин
дерева. Модель обучения структурирует и обобщает конкретные
полученные решения.
11.5.1, Представление знаний. Знания системы проблемно
ориентированы и представлены на основе использования
аппарата формальных
порождающих грамматик, краткое
описание которых приведено
ниже.
Пусть F —Словарь
(алфавит) языка,
представляющий конечное множество,
элементами которого
являются символы (буквы).
Произвольная конечная
последовательность элементов из V
составляет цепочку. Пустую
цепочку обозначают
символом Л. Число символов в
цепочке со называется ее
длиной |со|. Над цепочками
определена операция
конкатенации, согласно которой из цепочек со и ф получаем цепочку соф^
Очевидно, Лео = соЛ = со.
Пусть со = т]1фт)2 определена в словаре V. Тогда цепочка х\х *
* Ф * "Иг, где символ * не принадлежит V, называется
вхождением цепочки ф в цепочку со. Произвольное множество цепочек в
словаре V образует язык L. Однако задание языка
перечислением всех цепочек немыслимо. Языки задаются с помощью
формальных грамматик, порождающих все цепочки данного языка, и
только их.
Порождающая грамматика — это упорядоченная четверка
Г = <7Т, FH, Iу РУ, где VT и Vn— словари терминальных и
нетерминальных символов соответственно; / — начальная форма Г;
! то/г
ГЕНЕРАЦИЙ
УЛ
>
МО/С 1
Ш?ЕНЮ^*
'
\тФ0МАтошАя\\
\ РАЗА П
Г~~]
J 1
1 модель 1
1 тш \
\
г V
J МОДЕЛЬ Л
~| памш 1"
\
f
5Я0/С
ИНТЕРЛРЕТЯЦИ*
МОДЕЛЬ 1
ОЖЕЛЛЛ 1
А
Л
Рпс. 11.9.
Функциональная структура
системы ПРИР.
Р-
конечное множество правил вывода вида ф -> *ф, где ср и if)
произвольные цепочки полного словаря VT U Vn. P называется
схемой грамматики Г, а цепочки ф -*• i|) ~ правилами Г.
Пусть г: ф ->• \|) — некоторое правило Г и rj, * ф * г|2 —
вхождение ф в цепочку со = r\i<pr\2 в словаре VT U Vn* Говорят, что
цепочка £ = rjtifria непосредственно выводима из со применением.
18*
276
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
правила г к вхождению ф в цепочку со. В этом случае пишут
Последовательность цепочек D = (о)0, cdi, ♦ .♦, о)„) (п>1)
называется выводом (оп из (Оо в грамматике Г, если для каждого *
(I ^ i^n) имеет место co^-i t= co<. Число п называется длиной
вывода D. В этом случае пишут о)01-*соп, т. е. cort выводима из о>0 в Г.
Множество цепочек в словаре VT грамматики Г, выводимых
из ее начальной формы /, называется языком, порождаемым
грамматикой Г, и обозначается L(D.
Известны следующие типы формальных грамматик,
задаваемых путем наложения последовательно усиливающихся
ограничений па правила Р.
Грамматика Г называется грамматикой непосредственно
составляющих (ПС-грамматикой), если каждое ее правило имеет
вид rj^Ha -*• т^фг^, где г]! и г)2 — произвольные цепочки bFtU
U Vlu А определено в FH и ф — произвольная цепочка в FTU FH.
При применении НС-правила одпо вхождение А заменяется па ф
в зависимости от контекста ц{ и г^. Поэтому эта грамматика
называется еще контекстной.
Грамматика Г называется контекстно-свободной (КС), если
все ее правила имеют ви*д А ->- ф, где Any имеют прежний
смысл. Грамматика Г называется автоматной грамматикой с
конечным числом состояний, если каждое ее правило имеет вид
А ->- аВ, или А -*- а, где а определено в FT, a А п В определены
в FH.
Вернемся теперь к представлению знаний в системе ПРИР.
Память системы представляет собой КС-грамматику Г==<ГМ, Гв>,
где 1\т — метаграмматика, задающая текущие состояппя среды,
Т8 — строгая грамматика (см. ниже), задающая знания о
процессах решения типовых подзадач.
Под метаграмматпкой подразумевается тройка Гм = < FTW, У1Ш,
РЫУ, где FTM = {{frJ, izt), {*zf}} — словарь терминальных
символов: ibk) — множество значений параметров операций, {zt) —
множество имен элементарных операций, {*Z/} — множество имей не-
элемеитарных операций; УПм = {{SJ, {ХД} — словарь
нетерминальных символов, {Bi) — множество отношений между
значениями параметров операций, {ХД — множество параметров операций;
Рм — множество правил вывода следующих типов: Btbh -> Ьпу
например. НА СТОЛ -+■ ДЕТАЛЬ 1 (то, что па столе, есть
ДЕТАЛЬ 1), ВА-+А, например, НА СТОЛ —А (СТОЛ свободен),
Xj-+bh, например, Xt -*■ ДЕТАЛЬ 1 (присвоение переменной Хх
значения ДЕТАЛЬ 1).
Под строгой грамматикой подразумевается четверка Ts = (Fi,
F2, h, £>, где Fi — множества форм в словаре {Vmi U {bh} U
U {*zJ}\{A}, из которых порождаются нетерминальные (сложные)
.^операторы *zt\ Fz — множество форм в словаре (FHm U {bh} U {zt}},
§ 11.5. СИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ ИНТЕГРАЛЬНОГО РОБОТА 277
313 которых порождаются терминальные (элементарные)
операторы zt\ Is — начальная форма из Fly не содержащая символов из
{Bi)\ S — множество схем вывода вида р -*- а1е4 &.. .& е„, где
p&Fu о е {Ft и F2) U (Л), е< — элементарный предикат условий
применимости правил вывода.
Форма из F, имеет вид •ztBtlX1 ... BinXn, форма из F2
имеет вид ztBtlX1 ... BtnXn. Вывод нетерминальных и
терминальных операторов языка ЫТ8) из форм FA и F2 достигается
путем означивания параметров с помощью подстановок Xt ->■ bh п
сокращения каждой цепочки Bt.bh с помощью подстановки Вфк-+ Л
или Bt.bk-+bn. В итоге получаются операторы вида *ztbia..bn
л ztbi...bn.
Начальная форма I8^Fi имеет вид *ztXi ... ХП1 а после
означивания — *ztbi v. bn. Предикат е< истинен, если метаграмма-
тика Гм содержит правило Вфк -*- bnj или В$к -*- Л, и ложей, если
таких правил нет.
Из схем вывода S правила вывода получаются путем замены
всех входящих в них форм выводимыми из них терминальными и
нетерминальными операторами. По существу, схемы вывода S
описывают процедура л ьные представления операторов системы.
Эти представления имеют вид
•ztillt) - »zj(^)... «Л/ДМЯ^е! & ... & е„,
где Н — множество параметров соответствующего оператора
(терминального или нетерминального). В этом выражении зД/Л) —
идентификатор терминального оператора, который может быть
•сразу применен к формируемому состоянию среды, выражения
*Zj и другие со знаком * впереди являются идентификаторами
нетерминальных операторов, которые не применяются
непосредственно к данному состоянию. Выражение следует понимать так:
чтобы выполнить нетерминальный оператор *2*(Я<) при исходном
состоянии мира М0, необходимо вначале выполнить
последовательность нетерминальных операторов *зД7/;), ..,, *zh{IIk), что
приведет к такому состоянию среды, при котором будет возможно
применение терминального оператора г<(#»)т а затем уже
выполнить ZiUIi).
Таким образом, знания представляются в процедуральной
форме, так как для каждой типовой операции *z{ указывается, какие
операции и в какой последовательности необходимо применить к
рассматриваемому состоянию среды, прежде чем выполнить
операцию ziy а с ней и *z<. Описания терминальных операторов z{
представляются в виде z{: аг- -*■ [Ve*, где а* и [J< — списки
вычеркивания и добавления соответственно.
11.5.2. Пример представления знаний. Пусть
производственная среда представлена двумя площадками ПЛ-1 н ПЛ-2. На
278
ГЛ. И. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
площадке ПЛ-1 находится объект ОБ-1, площадка ПЛ-2 пуста.
Системе ПРИР предложена задача: «положить объект XI,
занимающий место Х2, на место ХЗ». Для построения модели памяти
вводятся следующие символы: ПОЛОЖ — имя терминального
оператора «положить», * ПОЛОЖ — имя нетерминального
оператора «положить», ПЛ-1, ПЛ-2, ОБ-1 — конкретные значения
параметров операторов, НА — отношение, XI -5- Х5 — параметры
операторов.
Компоненты метаграмматики Гм имеют следующий вид:
Утм-{{ПЛ-1, ПЛ-2, ОБ-1}, {ПОЛОЖ}, {* ПОЛОЖ}};
Fmi-«HA}f {X1 + X5»;
/>М = ША ОБ-1-А, НА ПЛ-1 -* ОБ-1, НА ПЛ-2 -* А, XI —
-* ОБ-1, Х2 -> ПЛ-1, ХЗ - ПЛ-2}.
Компоненты строгой грамматики Г5 имеют вид
Л-{«ПОЛОЖ НА XI XI Х4, * ПОЛОЖ НА ХЗ ХЗ Х5,
* ПОЛОЖ Х1Х2ХЗ};
F2 = (ПОЛОЖ Х1Х2ХЗ}; /s = {* ПОЛОЖ Х1Х2ХЗ};
S = {# ПОЛОЖ XI Х2 ХЗ -* * ПОЛОЖ НА ХЗ ХЗ Х5, *
ПОЛОЖ НА XI XI Х4, ПОЛОЖ XI Х2 ХЗ/е, (НА Х5 -* А) & е2 (НА
Х4-А»
и т. д. для остальных форм из Fi.
Таким образом, правила Рм задают описание исходной (и
текущей) ситуации, F4 описывает множество решаемых задач,
например, предложенной «положить объект, находящийся на
объекте XI, с места XI на место Х4» (• ПОЛОЖ НА XI XI Х4), Fz
описывает множество элементарных операций, например,
«положить объект XI с места Х2 на место ХЗ» (ПОЛОЖ XI Х2 ХЗ),
18 описывает исходную задачу и S — решения мпожества
типовых подзадач, например, положить объект XI с места Х2 на
место ХЗ — это значит сначала положить объект, находящийся па
объекте ХЗ, с места ХЗ на Х5 (освободить объект ХЗ), затем
положить объект, находящийся на объекте XI, с места XI ла место
Х4 (освободить объект XI) и, наконец, положить объект XI с
места Х2 па место ХЗ. При этом объекты Х5 и Х4 должны быть
свободными для помещения на них соответствующих объектов.
Они обычно находятся, исходя из истинности соответствующих
предикатов ei и е2.
11.5.3. Поиск с использованием знаний. В системе ПРИР
стратегия поиска является обобщением стратегии системы GPSt
получаемым за счет включения в поиск знаний о структурах
решения типовых подзадач. В памяти ПРИР имеется набор
операторов Qt\ pt-*ot/st, где Qt — идентификатор терминального или
нетерминального оператора, р<, ot e Fi U F2 и F{ и F2 — формы
строгой грамматики Г8. Результат действия Qt и условия его
применения задаются с помощью грамматики Гм. Вывод в Ге фик-
§ 11.5. СИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ ИНТЕГРАЛЬНОГО РОБОТА 279
сирует для заданного нетерминального оператора * z цепочку
терминальных операторов zu выполнение которой необходимо для
выполнения * z.
Блок-схема поиска решения представлена на рис. 11.10. При
предъявлении системе ПРИР повой задачи (М0, GQ) с именем Q0
(одновременно это и имя оператора) формируется пачальный узел
Генерирование ОДУ
СУ-*-СДУ\±СУ\УЗЕЛ
Рис. 11.10. Блок-схема поиска решения в системе ПРИР.
\МУ (СЦ), v), в который заносится исходная модель среды М =*
^Л/о, список целей СЦ = {(Gfff Q0)}, включающий глобальную
Цель G0, и пустая последовательность примененных операторов
17 = Я. Первоначальный узел запосится в список узлов СУ.
280
ГЛ. И. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
В ходе поиска содержимое СУ проверяется на пустоту. Если
СУ пуст, то решение исходной задачи Q0 отсутствует: в
противном случае из СУ выбирается первый узел, а из СЦ этого
узла — первая цель G и соответствующий ей оператор Q. Цель G
анализируется на достижимость путем определения ее вхождения
(при отрицании цели — невхождения) в модель М. Если G не до-
стигается, то оператор Q представляется исходной формой Is и
затем делается попытка построить в грамматике Т8
соответствующий вывод из Is.
При отсутствии пеобходимых знаний (в Ts выводится пустая
цепочка) используется модификация стратегии GPS:
определяется полное различие D между М и G, по полученному D
формируется, если это возможно, множество /-х альтернативных
цепочек }((?!, Qi), ..., (Gip Qi.), ..., (Gn.y Qnj)}, в которых каждая пара
содержит условия применения G{. для соответствующего
оператора Q ij, генерируется список /-х дочерних узлов СДУ, в списки
целей которых вносится содержимое СЦ родительского узла и
соответствующая /-я альтернативная цепочка, еппсок СДУ
включается в существующий СУ, а родительский узел из СУ
исключается*).
Если при обращении в блок ПАМЯТЬ необходимые знания
имеют место, то осуществляется вывод, формируется аналогичная
цепочка (Gt, QJ, ... «?<, ()<), ..., (Gn, QJ и аналогичным
образом преобразуется содержимое СЦ данного узла.
Если при анализе очередной цели G она оказывается
достижимой п при этом непоследней в списке СЦ данного узла, то
содержимое этого узла преобразуется по всем компонентам и поиск
продолжается. Если же очередная цель G оказывается
достижимой и при этом последней в списке СЦ, то поиск успешно
заканчивается и выдается решение v исходной задачи (V
11.5.4. Обучение. Задача обучения состоит в построении схем
правил вывода грамматики Та путем структуризации и обобщения
получаемых конкретных решений.
Правила вывода грамматики Тв в процессе обучения
формируются автоматически. Это осуществляется следующим образом.
В модель обучения поступает информация о текущем состоянии
среды, описываемая в языке грамматики Гм, и конкретное
решение (Dj исходной задачи, полученное при поиске путем перебора
в пространстве редукций. Модель обучения структурирует coj,
получая при этом элементарные правила вывода, и затем обобщает
*) Альтернативное мпожество цепочек {(бу^) 1..о(С4 ,<?^) >'-->(GnfQnj)}
порождается не только за счет многообразия подходящих операторов Qu,
но и за счет различного порядка их применения.
§ 11.5. СИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ ИНТЕГРАЛЬНОГО РОБОТА 281
эти правила путем преобразования их в схемы вывода
грамматики rs.
Для структуризации используется редукционная грамматика
Гя = <1/я, WR> /л, Sh), которая задается человеком при фиксации
проблемной области. В этой грамматике словарь VR = VT U Vn
представляет .собой конечное множество операторов,
свойственных данной проблемной области. При этом VT = (zt Xt .,. XJ
является множеством терминальных операторов, т. е. операторов,
которые непосредственно применимы к данному состояпито
среды, а словарь Vn = {*zt Xt ... Хп)— множеством нетерминальных
операторов, т. е. операторов, которые непосредственно
неприменимы к данному состоянию среды.
Вид правил грамматики Гя задается с помощью Wn = W? U
U Wn, составляющего множество схем р -* а, где р и о
определены в словаре VR U {со,} U Ш,} U {а{} U {s&il, Ш,-} — множество
нетерминальных цепочек, {coj — множество терминальных цепочек,
{е5^»} — множество нетерминальных символов и {аД — множество
терминальных символов.
При этом WT задает вид правил грамматики Г8, a Wa — внд <
структурных преобразований конкретных решений.
Для рассматриваемого класса задач было принято
WT = {$&2 -+ а2, s£2 -*- Qza2},
Wn = {S&i -* Qi^COi, S£i -* йх^гСО!, J^i ~> QifiaasCDi).
Исходная форма IR есть множество соотношепий / ->■ cdj, где
7 е {«s$ J и со, — структурируемое решение. Схемы редукции SR
имеют вид Ч* =*- 0, где ¥, 0е WR U IRy Ч? является
структурируемым соотношением вида IR -*- со,, а 9 состоит из двух
соотношений IR ->■ coj и рА -> aft, выражающих результат структурирования
и необходимое для его получения правило вывода Г 8
соответственно. Перед использованием схема редукции преобразуется в
правило путем конкретизации ее переменных.
Схемы редукции SR имеют следующий вид:
Ы, -+ QiZtillt)^) => ((^1 -* Q, • bUIJaiHtZiUli) -* zf(#<)))|e,,
(j^i -> QiQ2Zi(//i)c0i) =>
** ((.#, -> Qt * z,(//,)©t)(»z,(#«) -+ Q2(Zi)(IIi)))\e2.
В этих схемах
Qlf Q2 e= {* ZjCfft), ..., * zn(#„)}, 0)! e {zi(//i), ..., ZniUJ}.
Условие 8t означает, что если параметры оператора z,(#t) не
связаны с параметрами оператора из Qt, т. е. в Рм нет правил,
описывающих связи между указанными параметрами, то к ис-
282
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
ходному соотношению s&i -> Й^ДТ/г)^ применяется 1-я схема
редукции, преобразуя его в s&i -*■ Qi * ZiiHJcot и формируя
правило вывода * Ziilli) -* Zi(Hi).
Условие 82 означает, что если параметры оператора z&Hi)
связаны посредством правил из Рм с параметрами операторов из Qz
либо совпадают, то применяется 2-я схема редукции, преобразуя
исходное соотношение s&i -*- £2iQ2Zi(#()cOi в соотношение ^4 -*■
-* Qi * ZiUIdtoi и строя правило * г{(Н{) ->- Q2Zi(H{).
Применение схем редукции к структурируемым решениям
продолжается до тех пор, пока в их правой части остаются
идентификаторы терминальных операторов.
Пример. Пусть получено решение со = ВЗ Ь3 ПОМ b3bk ВЗ bz
ПОМ b2b6 ВЗ Ь{ ПОМ bibs, где ВЗ —оператор «взять», ПОМ
—оператор «поместить», fct, Ъ2 и b3 — имена объектов, 64, &s и 66 —
имена площадок. Пусть также исходпое состояние среды НА bt ->
-* Ьа, НА Ь5 -* b3j НА Ь4 -* А, НА К -*• А.
Изменение структуры исходного решения со, описываемого в
виде соотношения / -*- со, осуществляется следующим образом:
1) Так как Q4 и Q2— пустые цепочки, используется 1-я
схема редукции, в которой символ зФ^ соответствует /, z*(/Z«) —
оператор ВЗ &з, coi — оставшаяся цепочка. Получаем соотношение
/ -* * ВЗ Ъ3 ПОМ b3bk ВЗ Ь2 ПОМ Ь2Ь6 ВЗ bi ПОМ Ь^5 и правило
вывода * ВЗ Ъ3 ->■ ВЗ 63.
2) Используется 2-я схема редукции, так как параметры
операторов * ВЗ Ъ3 и ПОМ b3bi. совпадают. В схеме символу й4
соответствует пустая цепочка, символу Q2 — оператор * ВЗ Ь3.
Получаем соотношение / -*■ * ПОМ &3Ь4 ВЗ Ъ2 ПОМ b2b6 ВЗ Ь, ПОМ ut65 и
правило * ПОМ b3bk -> * ВЗ Ъ3 ПОМ 63Ь4.
3) Здесь опять используется 1-я схема, так как выражения
* ПОМ Ь3Ьь и ВЗ Ь2 не связаны по параметрам. В результате
получаем соотношение / -> *ПОМ 63&4 * ВЗ Ь2 ПОМ b2bQ ВЗ Ь4 ПОМ Ьи h
и правило * ВЗ Ь2 ->- ВЗ Ь2.
4) Используется 2-я схема, и в результате получаем
соотношение /-*- * ПОМ&3Ь4 * ПОМЬ2ЬвВЗ Ь4 ПОМ feifes и правило
* ПОМ &2&б -* * ВЗ Ь2 ПОМ Ь2Ьб.
5) Используется 2-я схема, так как * ПОМ b2bQ и ВЗ bi имеют
связапиые параметры (в исходном состоянии имеет место НА 6, -*•
-> 62). В результате получаем соотношение / -*- * ПОМ Ъ3Ък *ВЗ 6*
ПОМ 6,65 и правило * ВЗ Ъ, -* * ПОМ &i&6 ВЗ Ьь
6) Используется 2-я схема, в которой Й2 является цепочкой
* ПОМ 63&4 * ВЗ Ь^ В итоге получаем структурированное
соотношение / -*■ * ПОМ 6i65 и правило * ПОМ &А -* * ПОМ &А * ВЗ Ьх
ПОМ ЬА.
После структуризации исходного соотношения наступает этап
обобщения полученных при этом правил вывода. Процесс
обобщения правила включает предварительное формирование предикатов
§ 11.5. СИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ ИНТЕГРАЛЬНОГО РОБОТА 283
условий его применения е, преобразование параметров входящих
в пего операторов и обобщение параметров этих операторов.
При предварительном формировании условий применения
правила в виде конъюнкции предикатов достаточна истинность только
тех предикатов, которые либо отражают вышерассмотрепные связи
между значениями параметров из левой и правой частей эгого
правила, заданные предикатами еША-*- 6„), либо характеризуют
значения параметров терминальных операторов из правой части,
заданные предикатами &(Bibh-+ А). Таким образом, существенные
-связи относятся только к объектам.
Пребразование параметров построенных правил сводится к 1)
выделению из условий применения предикатов е(В{Ьк-+- Ьп),
причем Ьп — зпачение параметра оператора из правой части, bk — из
левой части правила; 2) исключению выделенных предикатов из
условий применения; 3) формированию подстановок Ьп -»- Вфк и
замене всех вхождений Ьп на его порождение В{Ьк.
Обобщение параметров операторов в правилах вывода
осуществляется так: вначале вводится множество обобщенных
параметров {Xj}, а загем конкретные параметры заменяются
обобщенными.
Продолжая рассмотрение примера обучения, получаем
следующие результаты.
Предварительное формирование предикатов условий
применимости правил Г8.
*ВЗЬ3 -> ВЗЬ3;
* ПОМ Ь3Ь4^*В36з ПОМ6|Ь41НАЬ4-*Л;
* ВЗ Ъ2 -> В3&2;
* ПОМ&А -* * В362 ПОМ Мб!НАЬв -* Л;
* ВЗ fti-^ПОМЬЛ B3bjHAbe-*A, НА &,-*&,;
* ПОМ ЪХЬЪ -* * ПОМ &з&4 * вз &i пом btbelHA h -* bif НА Ь4 ->
— Л.
Преобразование параметров правил Т8.
Выделяются и исключаются из условий применимости
предикаты Bibh -*■ Ъп, т. е. НА Ъь -*■ Ь3 и НА 6t -*- Ь2.
Осуществляется замена всех вхождепий Ьп на Вфк:
* ВЗ НАЬ5 -* ВЗ НА Ь5;
* ПОМ НА Ь А -^ * ВЗ НА Ъь ПОМ НА ЪЬЪ, I НА&4 -* Л;
* ВЗ НАЬХ -* ВЗ НА bt;
* ПОМ НА ЬЛ - * ВЗ НА 6, ПОМ НА btb6lHA bQ -> A;
*ВЗ bt -* * ПОМ НА Me ВЗ 6JHA К -* Л;
* ПОМ Ъ%ЬЬ -> * ПОМ НА 65&4 * ВЗ Ь4 ПОМ 6AIHA Ь4 ~> Л.
Обобщение параметров в правилах Га.
Согласпо Ъх -+ Х4, Ь4 -> Х2, 6» -•• Х3 и Ьв -* Х4 получаем
окончательно
* ВЗ НА Х3 -* ВЗ НА Х3;
* ПОМ НА Х3Х2 -> * ВЗ НА Х3 ПОМ НА Х3Х2| НА Х2 -* А;
284
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
* ВЗ НА X, -v ВЗ НА Xt;
* ПОМ НА ХД4 -> * ВЗ НА X, ПОМ НА ВДША Х4 -* Л;
* ВЗ X, - * ИОМ НА ХД4 ВЗ Х{ | НА Х4 - Л;
* ПОМ ХД3 - * ПОМ НА ХД2 * ВЗ X, ПОМ ХД3|НА Х2 -» Л.
§ 11.6. Интеллектуальный решатель СФИНКС
Система формального интеллекта комплексных стратегий —
СФИНКС —представляет собой паиболее общую концептуальную
модель интеллектуального решателя задач. СФИНКС воплощает в
себе такие основные аспекты формального интеллекта, как
формальная модель мыслительной деятельности человека, людей,
решающих задачи; эвристический поиск в иерархическом
пространстве задач в сочетании с логическим выводом; процедуралыго-
пекларатшшое представление знаний, наиболее эффективно
обеспечивающее направленный попек.
Теоретико-множественная модель СФИНКСа рассмотрена в
§ 4.6, его внешний язык (логика решений L) и знания (теория
решепий S) рассмотрены в гл. 6. СФИНКС реализуется
средствами ДИЛОСа, входящего в вычислительную систему,
представленную на рис. 11.11.
Главная база данных (ГБД) содержит наборы трансляторов,
прикладных программных модулей (ППМ) на разных языках
программирования и данных в различных форматах, а также
содержит стандартные средства
Конечные
пользователи
I
Системные
аналшиш
Ы
\ДИЛОС\
МБД
доступа к указаппым наборам.
Модельпая база данных
(МБД) содержит знания
системы о предметной области
в виде совокупности
объектов, как терминальных, так
и являющихся описаниями
объектов ГБД. Доступ
пользователя к ГБД обычно
осуществляется через МБД.
Обращение пользователя
к рассматриваемой системе
Рпс. 11.11. Состав вычислительной си- происходит через ДИЛОС,
стемы. который анализирует
входные сообщения, обращаясь
к содержимому МБД, и либо выдает ответы, либо реализует
требуемые действия, обеспечивая необходимую связь между МБД
и ГБД.
Роль системного аналитика при настройке системы па
определенную предметную область состоит в заполнении МБД и ГБД
необходимыми объектами.
>— \ \ ГБМ
[]•;•□ Ш Ш
Трансляторы ППМ Данные
§ 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 285-
ГБД реализована средствами системы ПУЛЬТ на БЭСМ-6
совместно с операционной системой ДИАПАК (ОС ДИАПАК).
Все прикладные программы п данные хранятся в архивах системы
ПУЛЬТ. Трансляторы универсальных языков программирования
АЛГОЛ-60, ФОРТРАН, ПАСКАЛЬ и др. вызываются через ОС
ДИАПАК.
МВД также -реализована средствами сисгемы ПУЛЬТ на
БЭСМ-6. ДИЛОС представляет собой систему взаимосвязанных
функций (процедур), которые
сгруппированы в четыре основных [Естественный язык\
блока, называемые процессорами ( 1 г
(см. рис. 11.12). Лингвистический
процессор (ЛИНГП)
осуществляет преобразование входных фраз
языка, близкого к естественному,
в выражения формального
интерфейса, представляющие собой
обращения к соответствующим
функциям процессоров.
Информационно-понсковый про-
ДИЛОС
\лингп
Язык формального интерфейса
3Z i ~Е.
и г
/7/1/1
J/U/ /1
Т
till |
_1.
МЩ
цессор (ИПП) ооеспечивает фор- ^ ,,,0 ^
, ™ ™ -г ~ ъ Рис- 11.12. Структура системы
мирование, модификацию и ас- ДИЛОС.
социативный поиск объектов в
МВД. Вычислительный процессор (ВП) предназначен для
организации связей между МВД и ГБД, а именно: для поиска и
активизации ППМ, для управления взаимодействием различных
программ и для извлечения наборов данных.
Логический процессор (ЛОГП) является основной частью
ДИЛОСА и осуществляет анализ и модификацию МВД,
проектирование из ППМ различных сложных программ и вывод ответов
на задаваемые вопросы. ЛОГП обычно действует во
взаимодействии с другими процессорами. Так как СФИНКС; в основном
реализуется средствами ЛОГП, то в дальнейшем будет рассмотрен
формализм только ЛОГП.
11.6.1. Представление знаний. Знания СФИНКСа, описанные
на внутреннем языке, содержатся в МВД в виде следующих
объектов: понятия, индивидуальные объекты, отношения, факты и
закономерности. Понятия представляют собой общие описания
предметов и событий, характеризующихся одинаковыми
наборами свойств, и могут находиться в иерархической подчиненности
Друг к другу. В этом случае самое общее понятие является
базовым, а каждое более общее понятие по отношению к соседнему,
менее общему понятию играет роль суперпопятия.
Индивидуальные объекты являются описаниями самого
нижнего уровня иерархической структуры понятий и обладают
терминальными значениями свойств. Например, ИВАНОВ ПЕТР
28G
ГЛ. ii. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
АЛЕКСЕЕВИЧ является копкрегиым представителем
суперпонятия ЧЕЛОВЕК, а событие СОВЕРШИЛ ПОСАДКУ В
АЭРОПОРТЕ ШЕРЕМЕТЬЕВО САМОЛЕТ ТУ-132 В 12 Ч 30 МИН-коикрет-
Д1ым представителем суперпонятия СОВЕРШИЛ ПОСАДКУ.
Отпошепия выражают различные связи (пространственные,
времепные, причиппо-следствеппые и др.) между предметами и
операциями. Конкретизация отношения является фактом.
Например, факт РОБОТ НАХОДИТСЯ МЕЖДУ ПУНКТАМИ А и В
является конкретизацией отношения МЕЖДУ.
Наконец, закомерности описывают процедуры, выражающие
различные актуальные знания.
Для внутреннего представления всех объектов МВД
используются четыре способа.
Способ ВР (name (is sup ВР (ind 1 val 1, ..., ind к val к))).
Здесь name — имя объекта, is — стандартное обозначение, sup —
имя суперпонятия данного объекта: если объект является
базовым,, то значением sup служит стандартное обозначение BN
(базовое имя) или BR (базовое отношение). Обозначение ВР также
является стандартным. Пары ind 1 val 1 , ..., ind к val к есть
пары <свойство — значение). ВР-представление чаще всего
применяется для описания понятий и отношений, например,
(СТРАНА (is BN ВР (СТОЛИЦА ( )
РАСПОЛ (, ЕВР A3 АФР СЕВ-AM ЮЖ-АМ АВСТ)
НАСЕЛ (: 1 1000)
ПЛОЩ(:0.5*)
РЕКА (* РЕКИ)
ПЛ-НАС (+(fun)))))
или
(НА (is BR ВР (ЧТО ( ) НА-ЧЕМ ( )) SYSN $2)),
где значения свойств задаются пустым списком ( ),
означающим, что на фактические значения этого свойства не наложено
ограничений; перечисляемым списком (, cl, с2,...),
начинающимся с запятой; диапазонным списком (rminmax) или (:min*)t
где * указывает, что верхняя граница диапазона неограничена;
списком раздела (* разделы); вычисляемым списком
^(функция)). Выражение SYSN $ гс означает, что уже имеются
конкретные факты этого отношения с системными именами $ 1, ...
«,., $ п — 1 и что новому факту должно быть присвоено имя $ п.
Способ PV (name (* sup PV(val 1 val 2 ... val к))). Здесь * п
PV являются стандартными обозначениями, val, .,.. val к —
значения свойств, соответствующие индикаторам ind 1, ..., ind к в
описагеле. PV-представление используется для описания
индивидуальных объектов, например,
(СССР(* СТРАНА PV (МОСКВА (, ЕВР A3) 255 22.4 (,ВОЛГА
ЕНИСЕЙ) 11))),
§ 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 28?
ИЛИ
( $ 1 (• НА PV (BOX 1 BOX 2))).
Свободный способ (name (ind 1 val 1... ind к val к))„
В таком представлении нет ссылки на суперпонятие с его
свойствами, поэтому объект имеет свободные свойства. Свободное
представление обычно используется для описания
закономерностей.
Смешанный способ (name (is sup BP (ind 1 val 1...
... ind к val к) ind к + 1 val к + 1...)). Этот способ используется
для представления понятий и отношений, например,
(СМЕЖ ((is BR BP (ЧТО ( ) С-ЧЕМ { )) SYSN $ 101)),
где SYSN и $ 101 не являются базовыми.
Остановимся более подробно на представлении знаний с
помощью закономерностей. Закономерность в общем виде
представляется следующим образом:
(th-name (* ТН
РАТТ (pattern)
FUN (program)
BODY (A KCND (condition 1)
CNS (consequence 1)
ACT (action 1)
A 2 (CND (condition 2)
CNS (consequence 2)
ACT (action 2)
i ))).
Основными компонентами закономерности являются:
1) системное имя th-name, которое используется для ссылки:
на данную закономерность из других объектов;
2) специальное свойство * ТН, которое служит для отличия
закономерности от других объектов;
3) образец вызова pattern, который служят контрольным
синтаксическим элементом, сопоставляемым с входным
выражением; удачное сопоставление активизирует данную
закономерность;
4) ЛИСП — программа program, которую необходимо
вычислить при активизации закономерности и которая подготавливает
все необходимое для дальнейшей обработки закономерности;
5) тело BODY, состоящее из одной или нескольких альтернат
тив 41, А2, ..., которые начинают обрабатываться при
активизации данной закономерности.
Каждая альтернатива состоит из трех компонент: условия
(condition), следствия (consequence) и действия (action), причем
любая из них может отсутствовать. Указанные компоненты вво-
288
ГЛ. ii. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
дятся как подсвойства свойства BODY с помощью индикаторов
CND, CNS и ACT.
Каждое из свойств РАТТ, FUN и BODY может отсутствовать.
Если отсутствует свойство РАТТ, то сопоставление образцов
считается успешным. При отсутствии свойства FUN происходит
непосредственный переход к обработке свойства BODY. Если
опущено свойство BODY, то подразумевается, что после обработки
свойства FUN активизация закономерности окончена.
Примером закономерности сможет служить
(ТИ ДОСТИЖИМ (• ТН РАТТ (- X ДОСТИЖИМ = Y)
FUN (CHECK ( + ХСМЕЖ - О)
BODY (Al (CNB (EQVAL + Y (EVPV (' + С)))
CNS (RTN О ДОСТИЖИМ)))
А2 (CND (NULL (EVPV V + С)))
CNS (RTN СНЕ ДОСТИЖИМ)))
A3 (CNS (RTN (CHECK (+ С ДОСТИЖИМ +
+ Y))))))).
Данная закономерность описывает процесс достижимости вер-
тпин на некотором графе, который словесно выражается
следующим образом: «из X достижим У, если X смежен с У, или X
смежен с С и С смежна с У; Г недостижим, если X —
изолированная вершина».
11.6.2. Поиск решений. Система СФИНКС осуществляет
направленный поиск согласно алгоритмам, рассмотренным в гл. 8 й
реализуемым на основе встроенных функций ЛОГП. Для
обработки закономерностей используются следующие основные
функции: (CHECK <relation>), (DELR <relation>), (ADDR
(relation)) и (CHANGER (relation) (vl wl...vkwk)).
Выражение (relation), являющееся аргументом при
обращении к этим фупкциям, имеет вид
(* file obj = var : arg 0 rel arg 1... arg к),
тде file —имя раздела, в котором происходит действие данной
функции. Если * file опущено, то подразумевается, что действие
происходит в последнем открытом разделе. Символ obj — список
объектов, для которых должно происходить действие. Если obj
отсутствует, то подразумевается, что действие происходит на всех
объектах данного раздела. Выражение = var — переменная, в
качестве зпачения + var которой в промежуточной памяти
заносится результат работы основных функций. Если = var опущено, то
в промежуточной памяти не происходит запоминания указанных
результатов работы. Функция ADDR служит для занесения
новых объектов в МВД, DELR служит для их удаления из МВД,
CHECK осуществляет поиск нужных объектов и CHANGER
модифицирует объекты.
$ 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 289
ЛОГП реализует следующий алгоритм:
1) На вход ЛОЩ поступает обращение к одной из функций
ADDR, CHECK и DELR, в качестве аргумента <relation>
которого используется целевой объект.
2) Делается попытка отыскать в соответствующем разделе
МБД объект с именем rel, являющийся описателем отношения.
Если такого rel нет, то ЛОГП прекращает работу.
3) Из описателя отношения rel извлекается управляющий
фильтр, соответствующий исходной функции и представляющий
небазовое свойство в описателе rel. Значение этого фильтра
указывает на перечень уместных закономерностей. Если фильтр
пусть, то ЛОГП заканчивает работу.
4) Уместные закономерности начинают последовательно
обрабатываться по схеме: вызов закономерности, сопоставление
образца, активизация, выполнение FUN, обработка альтернатив, выход
на другую закономерность. При этом могут происходить опрос и
модификация объектов МБД, запуск ППМ и т. д. В итоге
строится дерево альтернатив в диалоге с пользователем.
5) По окончании обработки всех закономерностей
выполняются действия в соответствии со сформированным деревом.
В процессе диалога пользователь может активно влиять на
формирование этого дерева.
Обработка подходящей закономерности происходит
следующим образом.
К вспомогательной функции ТНАСТ поступает обращение
(ТНАСТ <паше> <relation>), где <name> — имя выбранной
закономерности, которую надо активировать, и <relation> — образец
(целевой объект), который сопоставляется со значением свойства
РАТТ закономерности <name>. Эта функция вызывает
закономерность <name> и задает обращение к функции EQPATT.
По обращению (EQPATT <relation> <pattern>); где <pattern> —
значение свойства РАТТ у активируемой закономерности,
производится попарное сравнение соответствующих элемептов, входя-
щих в <relation> и <pattern>, с учетом следующих возможных
вариантов их представления:
а) если один из элементов <relation> имеет вид + val, то он
заменяется на значение 4- val из промежуточной памяти;
6) если один из элементов <pattern> имеет вид = var, то
создается переменная +var, которой присваивается соответствующее
значение из <relation> (эта переменная используется для
дальнейшей обработки закономерности).
Далее проверяется эквивалентность с учетом значения свойств
типа «диапазон» и «множество» соответствующих элементов.
Если одна из пар этих элементов неэквивалентна, то результат
работы EQPATT будет NIL. Пара считается эквивалентной, еслп
«сечение» ее элементов непусто, либо эта пара имеет вид (эле-
*9 Е. II. Ефимов
290
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
мент из <relation>, NIL). При удачном сопоставлении обработка
закономерности продолжается, при неудачном — заканчивается и
происходит вызов другой закономерности.
Затем вычисляется значение свойства FUN. В результате
формируются необходимые начальные условия для обработки
альтернатив.
Обработка свойства BODY состоит в последовательном
переборе и обработке альтернатив. Активизация закономерности
заканчивается либо после обращения к функции RTN (типа ~
RETURN), если она встречается в следствии CNS альтернативы
А, либо, если RTN не фигурирует, заканчивается после
обработки всех альтернатив.
Условие альтернативы предназначено для проверки
ограничений, накладываемых на элементы входного выражения. Оно
может быть выражено набором обращений к любым функциям
ЛИСПа или ЛОГП. Условие считается удовлетворенным, если все
эти обращения не вырабатывают результата NIL. Если условие
опущено, то по умолчанию оно считается удовлетворяемым.
Следствие альтернативы также представляется списком
обращений к любым функциям ЛИСПа или ЛОГП. Эти функции могут
вызывать различные побочные эффекты, например модификацию
или опрос МВД. Однако для поддержания процесса логического
вывода в следствие вводятся обращения к функциям ADDR,
CHECK, DELR и CHANGER. Обращения к этим функциям могут
вовлечь в анализ новые закономерности, и процесс обработки
становится рекурсивным.
Обработка альтернативы осуществляется набором программ
ЛИСПа или обращений к функциям ЛОГП. Программы и
обращения не выполняются во время обработки альтернативы, а
заносятся в дерево действий. Если в альтернативе действие
опускается, то оно не заносится в дерево действий.
11.6.3. Пример работы ЛОГП. Рассмотрим модификацию
встречавшейся ранее задачи «обезьяна и бананы». Пусть в базе
данных имеют место следующие отношения и факты:
(ИМЕТЬ (is BR ВР (КТО ( ) ЧТО ( )) CHECKFTH
ИМЕТЬ))
(ДОСТАТЬ (isBRBP (КТО ( ) ЧТО ( )) CHECKFTH
ДОСТАТЬ))
(НА (is BR ВР (КТО ( ) ЧТО ( )) CHECKF ТН НА))
(ПОД (isBRBP (ЧТО ( ) ЧЕМ ( )) CHECKFTH ПОД))
(ВЗБИРАТЬСЯ (isBRBP (КТО ( ) ЧТО ( )) SYSNB2))
(ДВИГАТЬ (isBRBP (КТО ( ) ЧТО ( ) КУДА ( П
SYSND2))
(В1 (* ВЗБИРАТЬСЯ PV (ОБЕЗЬЯНА КОРОБКА)))
(D1 (* ДВИГАТЬ PV (ОБЕЗЬЯНА КОРОБКА БАНАНЫ))).
S 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 291
Пусть также в базе данных имеют место следующие
закономерности:
(ТН ИМЕТЬ (» ТН РАТТ (= КТО ИМЕТЬ - ЧТО)
BODY U0(CNS (RTN (CHECK (+КТО ДОСТАТЬ +
+ ЧТО)))
ACT (+ КТО ДОСТАТЬ + ЧТО)))))
(ТН ДОСТАТЬ (• ТН РАТТ (== КТО ДОСТАТЬ - ЧТО)
BODY (АО (CNS (RTN (AND (CHECK (КОРОБКА ПОД + ЧТО))
(CHECK ( + КТО НА КОРОБКА))))
ACT (+ КТО НА КОРОБКА)))))
(ТН НА (* ТН РАТТ (~ КТО НА = ЧТО)
BODY (АО (CNS (RTN (CHECK (+ КТО ВЗБИРАТЬСЯ
НА + ЧТО)))))
(ТН ПОД (» ТН РАТТ (= ЧТО ПОД - ЧЕМ)
BODY (АО (CNS (RTN (CHECK (=ХХ ДВИГАТЫ-
+ ЧТО 4-ЧЕМ)))
ACT (+XX ДВИГАТЬ + ЧТО ПОД +
+ ЧЕМ)))».
Пусть на вход системы поступает входное обращение (CHECK
(ОБЕЗЬЯНА ИМЕТЬ БАНАНЫ)). Согласно алгоритму работы
ЛОГП указанное обращение активизирует через фильтр CHECKF
закономерность ТН ИМЕТЬ, которая генерирует обращение
CHECK (ОБЕЗЬЯНА ДОСТАТЬ БАНАНЫ))
и заносит в дерево действий
(ОБЕЗЬЯНА ДОСТАТЬ БАНАНЫ).
Последнее обращение активизирует закономерность ТЫ
ДОСТАТЬ, которая заносит в дерево действий
(ОБЕЗЬЯНА НА КОРОБКА)
я генерирует два обращения
(CHECK (КОРОБКА ПОД БАНАНЫ))
(CHECK (ОБЕЗЬЯНА НА КОРОБКА))
и т. д. В конечном результате получается план действий
(ОБЕЗЬЯНА ДВИГАТЬ КОРОБКА ПОД БАНАНЫ)
(ОБЕЗЬЯНА ВЗБИРАТЬСЯ НА КОРОБКА)
(ОБЕЗЬЯНА ДОСТАТЬ БАНАНЫ).
Приведенный иллюстративный пример, демонстрируя работу
ЛОГП, однако, не раскрывает возможностей системы СФИНКС
как иерархического решателя. Для этого необходимо рассмотреть
более сложпую задачу, в качестве которой мы выбираем задачу
шахматного эндшпиля. Для обозримости этого примера мы
воспользуемся представлением ее решения в виде доказательства
на внешнем языке (на языке теории решений 5), имея в виду,
что в действительности должно иметь место представление в
только что рассмотренном формализме системы ЛОГП.
292
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
11.6.4. Пример шахматного эндшпиля. Введем следующие
обозначения: w — произвольная фигура; х — произвольное поле;
Г = {Г1 -г Г8) — произвольная горизонталь; В е= {Bt -*- B8} —
произвольная вертикаль; Д е= {Д1 -*- Д26) — произвольная
диагональ; ОП е {01 -5- 64) — окрестность поля П, т. е. множество
соприкасающихся с полем Г1 полей; ОУ е {0У1 -s- 0У4) —
окрестность углового поля У; М е {Г, В, Д, ОП, ОУ) — произвольное
выделенное множество полей; t — момент времени, измеряемый
полуходами; W €= {б, ч} — произвольная сторона (белые или
черные); X — произвольное множество полей; у —решение 1-го
уровня; V — решение 2-го уровня, П — множество пешек (п)<
Вводятся следующие основные атомарные формулы.
Язык Lt: ОТКРЫТ (w, xi9 х2, t) — линейно упорядоченное
подмножество полей между полями хх и х2, принадлежащее
доступному для w множеству М, открыто для w в момент t\ при
этом доступность М определяется согласно правилам шахматной
игры; СВОБ-СВОЙ (х, t) — поле х свободно от своих фигур в
момент t; СВОБ-СВОЙ (#, i) — поле свободно от чужих фигур в
момент t; ИМЯ (w, у) — фигура w имеет имя у; ШАХ (ы?, хи Кр,
#2, t) — фигура w на поле xt шахует короля на поле х2 в момент
t; ХОД (ш, t) — ход фигуры w в момент t; НА (w, x, t) —
фигура w занимает поле х в момент t; СВОЙ (wu w2) — фигуры wx и
w2 принадлежат одной стороне; МАРШ (u?, xu x2, t) — фигуре ш
доступен маршрут от х± до х2 в момент t.
Язык L2: PEC (W, У, t) — сторона W имеет ресурс У
(измеряемый в фигурах) в момент t\ ЦУГ (W, t) — сторона W имеет
единственный ход в момент t; БЛОК {W, X, i) — сторона W
атакует каждое поле из X; MAT (Wu W2, t) — сторона W4 атакует
короля и каждое поле его возможного отступления; СТОИМ
(Г, С) — суммарная стоимость фигур из Y равна С, где С
определяется из расчета: стоимость пешки — 1, стоимость коня или
слона — 3, стоимость ладьи — 5, стоимость ферзя — 9, стоимость
короля — <».
Аксиоматика Kt
Статические аксиомы *).
Аксиомы атаки
А1 ПА (u?, xu t) ОТКРЫТ (и>, хи х2, t) ** АТАКУЕТ {w, xu х2, t)
А2 АТАКУЕТ iwu xu <r2, t) НА (и>а, xit t) -<^ АТАКУЕТ
(wuxu w2y х2у t)
Аксиома существования фигуры
A3 НА (w, х, t) ■* БЫТЬ (w,t).
*) В формуле НА(м% хи t) переменные w и х\ связаны зависимостью
<Pi(w, х\) = 0, позволяющей по одной переменной находить другую,
например, х\ ■= ф!(м;),
§ 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 233
Аксиома шаха
А4 АТАКУЕТ (и>, х„ Кр, х2, t) СВОЙ (ю, Кр) <=*•
ШАХ (и?, х,, Кр, х2, *).
Аксиома существования маршрута (последовательности ходов)
А5 МАРШ (и>, х„ х2, t) -—
АТАКУЕТ (в\ х„ х, *) МАРШ (н>, ж, х2, t + 1),
где переменная а; находится процедурно. При одноходовом
маршруте х = х2, МАРШ (и>, х, х2, J + 1) — тождественно истинная
формула п
МАРШ (и>, х,, хг, t) <=> АТАКУЕТ (w, х„ х2, t).
Динамические аксиомы.
Эти аксиомы имеют вид Bt Вг ■< В3, где В{ = Z?0(£,) — описание
исходного состояння объекта действия, Вг — By(.tt) — описание
условий применения действия и В, = B0(t2) — описание
результирующего состояния объекта действия.
Б1 Аксиома перемещения на один ход любой фигуры (кроме
короля)
Bt = 0; Вг = ХОД (ш, t) АТАКУЕТ (и?, х„ х2, t) СВОБ-
-СВОЙ (х2, t) ИМЯ (ю, Кр); В, = НА (w, х2, t+ 1).
Б2 Аксиома перемещения на один ход короля
Я, = 0; Вг = ХОД (Кр, *) АТАКУЕТ. (Кр, х„ х2, г) СВОБ-
-СВОЙ (х2, I) ШАХ (и>, а:,, Кр, х2, t+l); S3 = HA (Кр, х2, t+ 1).
Аксиоматика /£ ,2
И НА (W, X, *) <*>(3w s W) (Зо;еХ) [НА (u>, х, *)]
Г2ЦУГ W, t)^
.-•♦ (3! м; е W0 [ХОД (ц% f) & АТАКУЕТ (u?, х„ х2, t) &
СВОБ-СВОЙ (х2, *) & (ИМЯ (ш, Кр) V ИМЯ (и?, Кр) &
ШАХ (Кр, х2, < + 1)]
ГЗ MAT (W, Кр,«) •»*■ (BipjS WO (Vx<=X) (3wasfT)
[ШАХ (и>„ х,, Кр, х2, t) &
((ОТКРЫТ (Кр, х2, х, *) =>ШАХ (ю,, х3, Кр, х, *+ 1))1
Г4 ОТКРЫТА, Х„ Х2, t) ++ (3w eW) (Зхх e X,) (3x2 e= X2)
[ОТКРЫТЫ, х„ x2, «)]
Г5 IIIAXW, Kp, t) 4+ (Зие W) [ШАХЫ, x„ Kp, x2, t)]
Г6 АТАКУЕТЕ, X„ X2, t) ч*
(Эи>€=И')(3*1е=Х1)(3^е.У,) [АТАКУЕТЕ, x„ x2, t)l
Г7 БЛОК(W, X, t) <^ (Vx e= X) (3u> <= РГ)
[АТАКУЕТЫ, х„ x, t)\
Г8 АТАКУЕТ^,, X„ Wt, X2, *) -*•- ,
(3u>, s WJ (3u>2<= Ид [АТАКУЕТ^,, x„ u>2, x2, t)l
rOMAPDKW, Х„ X2, t)<*
{3w <= W7) (3*4 € Xj) (Зхг <= X2) [MAPIlKw, x„ x2) t)l.
294 ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Аксиоматика К2.
Статические аксиомы.
Аксиомы превосходства
Д1РЕС(Ж,-Кр1, У„ t) PECW2-Kp2, У2, *)СТОИМ(У„ С,)
СТОИМ(У2, Сг) БОЛЬШЕ (С, - С„ 4) * nPEBOCX(JF„ W2, f)
Д2 PECWt - Kpl, Ф1, *) PECW2 - Кр2, Ф2, О
НА(Кр2, ОУ, t) НА(Ф2, У, t) -*• ПРЕВОСХ(ТУ„ W2, t)
Аксиомы правил шаха
ДЗ АТАКУЕТ W„ Х„ Кр, Х2, t) СВОЙ (.W,, Кр) -«*
IIIAXW,, Х„ Кр, Х2, *)
Д4 IHAX(W, Х„ Кр, Х21 t) -> ХОД(Кр, t)
Д5 ШАХ (И\ Х„ Кр, Х2, *) -»■ ХОД (W, - Кр, *)
Аксиома атаки
Д6НА(»У, Х„ *) ОТКРЫТО?, Х„ Х„ t) <=*
АТАКУЕТСЯ, Хи Х2, t)
Д7 АТАКУЕТ^,, Х„ Х2, t) HA(W2, Х2, t) <*
АТАКУЕТ* W„ X„ W2, X2, *)
Аксиома превращения
Д8 PECW,, Ф, t) —
-»» CTOHMW,, С) СТОИМОР2, С,) БОЛЬШЕЕ - С„ 4)
Динамические аксиомы.
Е1 Аксиома превращения пешки
i?, = PEC(W„ У, U П, «); Я2 = ХОД(П, t)
АТАКУЕТШ, Г„ Г,,,, «)
НА(б U ч, Г2/1, *), где Г, е {Г„ Г2> и Г2/| = { ^8, если Г, = Г7,
Е2 Аксиома мата
В, = 0; B2 = XOR{Wl, *,) IIPEBOCXW,, И7,, *,);
В.-МАТСИ^, W2,h)
ЕЗ Аксиома ухода из-под шаха
B,-IIIAX(W„ Х„ Кр, Х2, 0; Я2 = ХОД(Кр, *J
АТАКУЕТСКр, Х2, Х„ t)
БЛОКПУ,, Х3, *+ 1); Я, = ШАХ(1У„ Х„ Кр, Х„ t + 1)
НА (Кр, Х„ *+1)
Е4 Аксиома взятия
Я, = РЕС( W2, ш2 U У2, t); Вг = ХОД W„ «)
АТАКУЕТ(ТУ„ Х„ ю„ х2, *);
#3 = PEC(W2, У2, t + 1) БЫТЬ(и>2, * + 1) HA(W„ ж2, * + 1)
Е5 Аксиома нападения
Я,-HAW,, X„ *,); S2 = XOfl(W„ *,) MAPIIKWj, Х„ Х„ *,);
В3 = АТАКУЕТ^,, X, Х2, h), где X находится процедурно.
Е6 Аксиома передвижения (кроме короля)
В, - 0; Вг = ХОД W„ *,) МАРПКИ7,, Х„ Х2, г) HAW,, X2, «,);
fia = HAW„ Х2, *,).
§ 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 295
Е7 Аксиома цугцванга
В, = PECW, Y U w, t) HA(W, xu t)\B2 = ХОД(W% t) ЦУГ(W, t);
S3 = HA(u>, X2, *+D,
где w — единственная фигура, способная ходить.
Е8 Аксиома передвижения короля на один ход
В, = 0; Вг - ХОД(Кр, Хи t) АТАКУЕТШр, Xl9 Х2у t)
ШАХ(Wu Xs, Kp, Xu t+ 1); Вз - НА(Кр, Х3, * 4-1).
Е9 Аксиома форсированного выигрыша
В> = 0; B2 = XOJ\(Wu ti) PECWt, Ф1, tt) RA(Kp2, ОУ, tt)
НА(Ф2, У, tt)\ Bs - MATWb Wt% и).
Алгоритм поиска включает следующие характерные
особенности. Если цель игры для стороны W{ в момент их хода им пе
ясна, то ход условно передается стороне W2y т. е. секвенция
ВМ) -> ХОД (W%, t) условно считается истинной, и затем цель
игры для Wi определяется как отрицание плана игры для W2.
Формирование текущих позиций /?и(*) и 2?иШ осуществляется
постепенно по мер£ проведения доказательств в теории S =*
= <0!, Oi2, S2/.
Вывод в теории 512 осуществляется каждый раз, когда либо
обобщается £и(0), либо дальнейшее доказательство в теории S2
становится невозможным.
Исходная позиция. Белые: Кре2, СА5, еА; Черные:
Kpg2, d6, *5, fe2.
Задача: белые начинают и выигрывают.
В целях удобства введем обозначения: Kpl — белый король,
Кр2 — черный король, С — слон, п — пешка белых, п1 — левая
(со стороны белых) пешка черных, п2 — центральная пешка
черных, пЗ — правая пешка черных.
Решение. Решение задачи осуществляется путем
доказательства соответствующих теорем. Алгоритм поиска
комментируется словесно; при этом достаточно очевидные или повторяемые
моменты опускаются. Доказательство представляется в виде
линейно упорядоченной последовательности выражений. Запись
/?(£, /) означает применение правила вывода R к выражениям J и/.
Запись V(tu t2) означает план V, выработанный в момент £4 и
относящийся к началу t2. Запись /?иШ означает позицию 1-го
уровня (i =» 1, 2) в момент t.
Так как у белых нет ясной цели игры, то согласно алгоритму
поиска ход условно передается черным, т. е. Вц (0) -*■ ХОД(ч, 0)
и в начальный момент £ = 0 оценивается Ви(0) с точки зрения
угрозы превращения черной пешки в ферзя.
1 ВЪ (0) -*• АТАКУЕТ (П, Г2, П, 0) Теорема Sl2
2 Г6 Аксиома Кп
296 ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
3 В\ (0) -> (Зп е= П) (Зя, е Г2) (Зя2 е П) (АТАКУЕТ
(и, xv #2, 0)]
/?1(1, 2)
4 В£ (0) -^ АТАКУЕТ (пЗ, /г2, М, 0) Я7 (Д7 (Д7 (3)))
5 А2 Аксиома /?!
6 BJ (0) -> НА (пЗ, /г2, 0) ОТКРЫТ (пЗ, й2, Л1, 0)
Д1 (4,5)
Дальнейшее доказательство в St2 путем опровержения
приводит к замкнутому дереву. Следовательно, теорема 1 доказана,
т. е. для пЗ на Ш открыт маршрут до поля М. Теперь (имея в
виду Е1) необходимо исследовать поле превращения Г1 (имеется
в виду hi).
7 Bk (0) -> НА (б ч, п1, 0), где НА ( ) еВ^ (0) Теорема Sn
8 Г1 Аксиома/i12
9 Bi(0)-^(Vws6U4)[HA(u?,Mf0)] Л1(7,8)
Ю Bit (0) -> НА (Ь, М, 0), Л6 (9)
где b — экзистепциональная переменная. Никакая подстановка
фигур из Ви (0) вместо Ъ не приводит к опровержению.
Следовательно, теорема 7 доказана, т. е. поле превращения Г1 свободно.
Далее исследуется, чей ход в момент t = 0.
11 Ди(0) -> ХОД (п, 0) Теорема Slt
Доказательство теоремы 11 и ей подобных следует из анализа t
на четность. Если t нечетно, то ход черных. В данном случае (11)
истинно по условию. Теперь необходимо все результаты собрать
воедино, т. е. сформировать нужный фрагмент 2?и(0).
12 B\l (0) -> АТАКУЕТ (П, Г2, П, 0) НА(б U ч, И, 0)ХОД(П, 0)
Теорема 512
13 В£(0)-* АТАКУЕТ ( ); В&(0)-+ЕА( ); Вк(0)-*ХОД( )
R3(12)
Таким образом, теорема 12 доказапа, т. е. превращение Е1
имело бы место в момент t = 0, если бы ход был за черными.
Оцениваются последствия этой угрозы.
14 Е1 Аксиома К2
15 В!!(0)-*РЕС(ч, {п1, п2, Ф2}, 1)НА(Ф2, Г1, 1),
Ж2 (12, 14)
16 D1 Аксиома Кг
17 ВЦО) -+ ПРЕВОСХ (ч, б, 1) № (15, 16)
§ 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 297
Итак, доказано, что черные имели бы превосходство в момент
t = 1. Возможные последствия прослеживаются дальше.
18 Е 2 Аксиома К2
19 В\ (0) -^ МАТ (ч, б, У й2 (17, 18)
Итак, доказано наличие далеко идущей угрозы со стороны
черных: Уч(0, 1) = El, E2 — черные могут превратить пешку в
ферзя и затем за счет полученного превосходства поставить
белый мат. Эту угрозу необходимо ликвидировать путем срыва
плана Уч(0, 1). Для этого надо первым делом сорвать действие Е1.
Целью белых становится отрицание условий применения Е1,
которые последовательно и анализируются.
20 ВЪ(0)-+-НА (б, Г1, 1) Теорема 52
21 Е6 Аксиома К2
22 fifj (0) -> АТАКУЕТ (б, X, И, 0) Ж2 (20, 21)
Теперь необходимо выяснить, атакуют ли белые поле
превращения в исходной позиции #и(0). Для этого необходимо осущест-»
вить переход па 1-й уровень.
23 Г6 Аксиома Кгг
24 B|i(0) -+ {3w е= б) (Зхг е!) [АТАКУЕТ {w, x1% М, 0))
R1 (22, 23)
25 В\ (0) -> АТАКУЕТ (р, <р (р), М, 0) R7 (24)
где р — универсальная переменная и <р(р) — функция, ставящая
в соответствие фигуре ее место. Каждая подстановка фигур из
#и(0) вместо р дает опровержение, следовательно, никакая
фигура белых не атакует поле hi в момент * = 0. Итак, теорема 20
недоказуема. Анализируется следующее условие применения Е1.
26 Я2И(0)-*ХОД(П, 1)
27 D5
28 5^(0)-ч-ШАХ (б, X, Кр2, Xt, 1)
29 D3
30 Bli(0) -> АТАКУЕТ (б, X, Кр2, Хг, 1)
31 Е5
32 Sfi(O) -*• МАРШ (б, Хи Xit 0)
33 Г9
34 В*и(0) -+ (Зи; е= б) (3xt е= Xt) (Эж2 е= Х2
35 Яи(0)->МАРШ (Pl, Ф(Р1), *2, 0)
Теорема 5а
Аксиома К3
Я% (26,27).
Аксиома К.2
<Я2(28,29)
Аксиома К2
Si (0,31)
Аксиома К12
)1МАРП1(и>,х1,хх,Щ
R,(32,33)
/?7(Д7(34))
298 ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Подстановка р! = С, <р(р4) = А5 приводит к секвенции
36 В\ (0) -* МАРШ (С, ft5, #2, 0)
37 А5 Аксиома Кх
38 B\(Q) -> АТАКУЕТ (С, А5, ж, 0) МАРШ (С, я, g2, 1)
Л1 (36, 37)
Секвенция (38) является истинной при х =» /3. Теорема 28
доказана, т. е. можно отразить угрозу превращения со стороны
черных путем объявления им шаха в позиции при этом
план белых V6(0y 0) = Е5 и истинна секвенция #и(0)->#и(1), где
Яи(1) = ШАХ (б, X, Кр2, Х2, 1) НА (б, X, 1).
39 Ви(0) -+ ХОД (С, 0) АТАКУЕТ (С, /*5, /3, 0)
Лог. аксиома Кг
40 Б1 Аксиома К1
41 Bli(0) -> НА (С, /3, 1) Я1 (39, 40)
Итак, уб(0, 0) = Б1 и истинна секвенция 5и(0)-*Ви(1),
т. е. имеет место ход 1: С/3 + (слон занимает поле /3 с шахом).
Теперь необходимо продолжить построение плана V6{0, 0).
42 5^(1) -+ ШАХ (б, Xlt Kp2, Х2, 1) Лог. аксиома К2
43 D4 Аксиома К%
44 В&(1)->ХОД(Кр2, 1), Ж2 (42, 43)
т. е. королю необходимо уйти из-под шаха. Отсюда следует
необходимость доказательства теоремы (условия ЕЗ).
45 ВЪ(1)-+ АТАКУЕТ (Кр2, X,, Х2, 1) БЛОК (б, Х2, 2)
Теорема S2
46а Я&(1) -* АТАКУЕТ (Кр2, Х1У Х2, 1);
466 Ви(1) -* БЛОК (б, Х2, 2) ДЗ (45)
47 Г6 Аксиома Кп
48 Ди(1)-* АТАКУЕТ (Кр2, g2, р, 1) Д7(Й1 (46а, 47))
49 Г7 Аксиома К12
50 J3&(1) -> (Зя2 <= Х2) (Vw е= б) [АТАКУЕТ (ш, ф (u>), я2, 2)]
Я1 (466, 49)
51 Я&(1)-* АТАКУЕТ (Ь, <р(Ь), р, 2) Я6(Я7(50))
52 А4 Аксиома Кг
53 Й(1)-*ШАХ(Ь, Ф(Ь), Кр2, р,2)
Сравнивая (51) и (48) и перебирая всевозможные значения Ь
из Sh (1)» находим поле p^gl, которое не атакует никакая
фигура белых. Теорема 45 доказана, т. е. возможен уход черного
короля из под шаха.
§ li.e. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 299
54 ЕЗ Аксиома К2
55 Ви(1) -> НА (Кр2, Х2, 2) 312 (45, 52)
Итак, белые получили продолжение плана F6(0, 1) «= ЕЗ и
соответствующую этому продолжению доказанную теоремуДп(0)-^Ди(2)«
56 Ви(1) -+ АТАКУЕТ (Кр2, gl, 1) ШАХ (Ь, Ф (Ь), Кр2, #1, 2)
Лог. аксиома/^
57 Б2 Аксиома К1
58 Ви(1)->НА(Кр2, gl, 2) Я1 (56, 57)
Итак, гб(0, 1) = Б2 и истинна секвенция #и(0)->2?м(2).
Согласно i;6(0, 1) совершается мысленно ход 2: Kp2gl (черный
король занимает поле gl). У белых опятьнетясной игры, поэтому
снова ход условно передается черным, т. е. условно принимается
истинной секвенция #и(2)-*~ ХОД(ч, 2). Аналогичным образом
доказывается теорема 59.
59 Яи(2)-> АТАКУЕТ (П, Г2, И, 2)НА(б11ч, 2)ХОД(П, 2)
60 Е1 Аксиома К2
61 Ви(2) ->- РЕС (ч, {п1, п2, Ф2}, 3) НА (Ф2, И, 3)
№ (59, 60)
Доказана возможность превращения черной пешки в ферзя на
поле превращения Г1 в случае их хода в момент t = 2.
Продолжается оценка последствий этого превращения, доказывается
теорема 62.
62 Я и( 2)-^АТАКУЕТ (б, Xlf ч, П, 2)
63 Е4 Аксиома К2
64 В2Ш(2) -+ БЫТЬ (Ф2, 4) НА (б, П, 4) М2 (62, 63)
Доказана возможность взятия ферзя на поле П.
Аналогичным образом доказывается теорема 6$, т. е. взятие черными
белой фигуры на поле П.
65 ВИ(2)->БЫТЬ(С, 5)НА(ч, П, 5)
Оценивая последствия этих взятий, белые исследуют
возможность постановки мата черными.
66 В&(2)-*-МАТ(ч, б, *i), где ^ > 5 Теорема S2
67 Е2 Аксиома К2
68 Ви (2) -* ПРЕВОСХ (ч, б, *2), где tx > t2 > 3
#2 (66, 67)
Для постановки мата необходимо иметь превосходство.
69 D1 Аксиома К2
70 Ви(2) -* БОЛЬШЕ {Сх - С2, 4, t2) Я2 (68, 69)
71 D8 Аксиома К2
72 Ви(2) -> РЕС (ч, {У, Ф2}, t2) НА(Ф2, П, t2)
№ (70, 71)
300
ГЛ. И. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
Для получения превосходства необходимо иметь ферзя.
73 Е1 Аксиома Кг
74 ВЪ(2) -+ АТАКУЕТ (П, Г2, Г1, t3) НА (б U ч, П, *3)
т2 (72, *73)
Для получения ферзя необходимо превращение пешки.
75а В\ (2) -> АТАКУЕТ (П, Г2, П, *3);
756 ВЦ (2) -+ НА (б U ч, Г2, *3) ДЗ (74)
76 D6 Аксиома К2
77 S2n(2) --> НА (П, Г2, *8) m2 (75а, 76)
78 Е6 Аксиома К2
79 би(2) -* МАРШ (П, Xlf Г2, *4) НА (ч, Г2, *4)
$2(77,78)
Для превращения пешки необходимо создать проходную пешку
80а#и(2)-*НА(ч, Г2, *4);
806 Ви (2) -> МАРШ (П, Хи Г2, *4) ЛЗ (79)
Для создания проходпой необходимо освободить маршрут для
пешки из П.
81 Г9 Аксиома К12
82 Ви(2)->МАРП1(п2, еЪ, е2, *4)
83 Ви(2) -* АТАКУЕТ (п2, eb, <?4, *4) МАРШ (п2, е4, е2, f4+l)
Анализ 5Й (2) ->• АТАКУЕТ (п2, е5, е4, *4) приводит к
необходимости взять п па ei, т. е. к необходимости БЫТЬ (и, h).
84 Е4 Ак:иомайГ2
85 Яи(2)-*ВЗЯТ(ч, б, f6)
Черные доляшы взять фигуру белых на вертикали В.
86 D6 . Аксиома К2
87 Д|(2) -> АТАКУЕТ (ч, Xlf п, <?4, *в)
<%2(83, 84)
Для взятия необходимо атаковать эту фигуру белых.
88 Е5 Аксиома К2
89 Яи (2) -+ МАРШ (ч, Х1Ч е4, *в) й2 (87, 88)
Черные должны выйти на позицию атаки поля еА. Дальпен-
ший анализ на 1-м уровне доказывает истинность теоремы 66,
выявляя при этом соответствующие фигуры белых и черных.
Итак, доказала угроза мата со стороны черных, т. е.
уч я (2, 3) « Е1, Е4, Е4, Е5, Е4, Е6, El, E2 — черные
превращают пешку в ферзя, белые берут ферзя на поле превращения,
черные берут фигуру белых на поле превращения, черные
нападают на пешку белых, берут ее, продвигают свою пешку до 2-й
юризонтали, превращают ее в ферзя и ставят мат белым.
§ 11.6. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС
301
Таким образом, полный план Уб(0,0)V4 (2,3) не устраивает
белых, начиная с Els V4 (2,3). Поэтому белые оценивают свои
возможности с момента-£ = 2 по отражению угрозы черных, т. е.
возможность срыва первого из указанных превращений Е1.
90 В\(2) ->НА (б U ч, И, 3) Теорема 5.
2
т. е. с целью недопустимости превращения черных необходимо,
чтобы поле превращения было бы занято какой-либо фигурой к
моменту t =* 3.
91 Е6 Аксиома К2
92 В2И(2) -> АТАКУЕТ (б, И, 2) 5?2 (90, 91)
Далее в теории Si2 доказывается истинность выражения (92),
т. е. слон белых в момент t — 2 атакует поле превращения М.
Тем самым устанавливается истинность теоремы 90. Таким
образом, F6(0, 2) = Е6 и истинна секвенция #и(0)-* #и(3).
Аналогичным образом находим i;6(0, 2) = Б1, устанавливаем
истинность секвенции Ви(0)-> #и(3) и фиксируем ход 3: СМ.
Белые, продолжая анализ позиции 5и(3), аналогичным
образом с помощью аксиом /£2(Д6 и Е4) доказывают теорему:
93 £и(3)-> БЫТЬ (С, 4) НА(ч, Г1,4),
т. е. черные к моменту t = 4 берут фигуру белых на поле
превращения и при этом занимают это поле сами. Итак, F6(0, 3) = Е4
и истинна секвенция #и(0) -> #и(4). Аналогичным образом
устанавливается, что уб(0, 3) = Б2, секвенция #и(0)-* #и(4)
истинна и фиксируем ход 4: Кр2: М (черный король бьет слона
на поле М).
Далее белые, оценивая возможности черных в позиции#и(4),
находят их план F4(4, 5) = Ell, El, EJ2. Необходимо попытаться
сорвать Ell, для этого анализируется -ои(4).
94 Яи(4) -> ШАХ (б, Хг, Кр2, Х2, 6) Теорема 5,
2
Необходимо, чтобы черный король, пытаясь освободить поле
превращения, попадал под шах в момент t = 6.
95 D3 Аксиома К2
96 В\ (4) -> АТАКУЕТ (б, Xlf Kp2, Х2, 6) № (94, 95)
97 D7 Аксиома Кг
98 Б2И(4) ->- АТАКУЕТ (б, Xv X%, 5) М2 (96, 97)
99 D6 Аксиома К2
100 J?S(4) -> НА (б, Х1У 5) № (98, 99)
101 Е 6 Аксиома К2
102 Яи(4)-* МАРШ (б, XL1 Х2, 4) $2 (100, 101)
Итак, F6(0,4) ==» Е6. В теории S, формируется г;б(0,4)==Б1 и
ход 5: Kpl /1. Таким образом, угроза F4(4,5) ликвидирована.
Далее осуществляется анализ #и(5).
302
ГЛ. 11. ОТЕЧЕСТВЕННЫЕ РЕШАТЕЛИ
103 ВЪ(5) ->■ЦУГ (ч, 5) Теорема S12
104 Г2 Аксиома К12
105 52и(5)-^ АТАКУЕТ (nl, d6, d5,5) СВОЕ (d5, 5)
Д1 (103, 104)
Секвенция (105) является исгинной, следовательно, истиппа
теорема 103, т. е. для черных в момент f = 5 имеет место цугцванг.
106 ВЪ (5) ->- ВгВ2 (для Е7) Лог, аксиома S2
107 Е7 . Аксиома К2
108 В2И(5) -> НА (ч, X, 6) Ж1 (106, 107)
Имеем F6(0*5) « Е7 и уб(0,5) — Б1.
109 Фиксируем ход 6: db (вынужденный ход пешкой п1
на поле db)*
110 ВЪ (6) -> ВгВ2 (для Е4) Лог. аксиома К2
111 E4 АксиомаК2
112 Ви(6)-> БЫТЬ (nl, 7) НА (б, d5, 7) <#2(110, 111)
Имеем Гб(0,6) = Е4 и уб(0,6) — Б1.
113 Фиксируем ход 7 • еА • db (пешка белых п берег
пешку nl на поле db).
Доказывается теорема 114: Ви (7) -* ЦУГ(ч, 7), в результате
имеем Уб(0, 7) — Е7 и i>6(0, 7) — Б1.
115 Фиксируем ход 8 : еА (вынужденный ход черной
пешкой п2 на поле е4).
Далее доказывается возможность мага черным.
116 F6(0,8) = E6, El, E2 — белые продвигают пешку п
до горизонтали Г7 (аксиома Е8), превращают ее (Е1>
и ставят мат (Е2).
117 Ход 9 : dQ (согласно Е6 «= F6(0,8) пешка п
идет на поле dQ).
118 Ход 10 •' еЪ (вынужденный ход пешкой п2 на
поле еЗ).
119 Ход H:d7 (согласно Е6 е F6(0, 8) ход пешкой п на
поле d7).
120 Ход 12: е2 + (вынужденный ход пешкой п2 на поле е2
с шахом).
Неожиданность для белых: они не могут приступить к
реализации El e Fe(0,8), так как должны уйти из-под шаха.
Доказывается возможность взятия пешки черных.
121 Ви(12) ->- ВХВ2 (для Е4) Лог.аксиома К2
122 Е4 Аксиома К2
123 В&(12)-* БЫТЬ (п2, 13) НА (б, е?2, 13)
522(121, 122)
Белые корректируют план, т. е. 70(0,8) «■ Е8, Е4, El, Е2*
§ ii.e. ИНТЕЛЛЕКТУАЛЬНЫЙ РЕШАТЕЛЬ СФИНКС 303
124 Ход 13: Kpl : е2 (белый король берет пешку п2 на
поле el).
Доказывается возможность (как окажется, призрачная) мата
белым.
125 F4(13,13) = Е6, El, E2 — черные освобождают поле
превращения М для пЗ (аксиома Е8), получают
ферзя (Е1) и ставят мат (Е2).
126 Ход 14: Kp2gl (согласно E6^F4(13, 13) черные ходом
короля на поле gi освобождают поле превращения hi).
127 Ход 15: d8<Dl (согласно £tl e= F6(0,8) белые превращают
пешку в ферзя на поле d8).
128 Ход 16: Й1Ф2 (согласно Е1 е= F4(13,13) черные получают
ферзя на поле hi).
Доказывается возможность стереотипного (с известной
последовательностью ходов) выигрыша белых в позиции B\i (16).
129 £и(1б) -+- ПРЕВОСХ (б, ч, 16) Теорема S2
130 D2 Аксиома Я2
131 5^(16)^НА(Кр2,ОУ, 16)НА(Ф2,У, 16)
Так как секвенция (131) истинна, то теорема 129 также
истинна
132 Е9 Аксиома #2
133В2и(16)-^МАТ(б, ч, t) Я2 (131, 132)
Стереотипная процедура Е9 порождает ходы: 17: Ф1^5-Ь
18:Кр2/*2; 19:Ф1А4+; 20:Kp2g2; 21:Qlg4+; 22:Kp2fe2; 23:Kpl/2;
24:Ф2со (ферзь черных делает любой ход); 25:Ф1#2Х (белые
ставят мат ходом ферзя на поле #2).
Итак, белые сформировали выигрышный план игры (не играя
реальной партии) в следующем Ьиде: F6(0,0) = Е5, ЕЗ, Е6, Е4,
Е6, Е7, Е4, Е7, Е6, Е4, El, Е9. Этому плану соответствует план
г;б(0,0)> который в принятой шахматной нотации имеет вид:
l.C/3+.Kpgl; 2.СЛ1,Кр:М; 3. Kp/l,d5; 4. e4:d5, eA; 5. d6, e3;
6. d7,e2+; 7. Kp:e2,Kpgl; 8. <Ш>, МФ; 9. Ф#5 +, Кр/*2;
40. ФА4+,Крвг2; .11. Ф^4+,КрЛ2; 12. Кр/2,Ф~; 13. ф#2 X.
На этом мы закончим рассмотрение круга вопросов,
связанных с интеллектуальными решателями задач.
ПОСЛЕСЛОВИЕ
Основная проблематика интеллектуальных решателей как
систем искусственного интеллекта в целом состоит в представлении
знаний и организации эффективных процедур манипулирования
ими. Мы показали, что основу знаний интеллектуального
решателя представляют декларативно-процедуральные описания иерар*
хического мира локальных и элементарных задач, а также
элементарных операции конкретпой предметной области. Мы также
старались показать, что создание действительно эффективных
процедур поиска решений и представления знаний немыслимо»
без серьезного изучения психологических аспектов мыслительной
деятельности человека и построения семиотических моделей:
этой деятельности.
Можно считать, что к настоящему времени сложилось
устойчивое понятие об интеллектуальном решателе как системе,
характеризующейся:
1) фреймовым представлением знаний о предметном мире;
2) наличием семиотической модели мыслительной деятель-
ности, обеспечивающей стратегию эвристического поиска;
3) эвристическим поиском в иерархическом пространстве
задач с элементами дедуктивно-индуктивного вывода;
4) использованием процедуральных языков высокого уровня*
обеспечивающих тактику поиска на основе актуальных знаний;.
5) автоматическим обучением, используемым для пополнения*
усовершенствования и обобщения знаний решателя.
Построенные на основе машппно-ориептированиых логик
элементы метатеории теорий решений позволяют надеяться, что
всесторонние теоретические исследования интеллектуальных
систем различной природы не такое уж безнадежное занятие и
дело ближайшего будущего.
Формализация мыслительной деятельности человека,
решающего задачи, является стержневой идеей данной книги, весь ее
материал концентрируется вокруг нее и подчинен ей. Стремление
довести эту идею до широкого круга читателей предопределил гг
стиль изложения всей книги: везде, где только возможно, дается
предпочтение наглядности изложения, быть может, даже в ущерб,
некоторой его строгости и корректности.
ПОСЛЕСЛОВИЕ
30$
В силу нобизпы некоторые концепции, рассмотренные в
книге, возможно, носят незавершенный или дискуссионный
характер. Так, например, предлагаемая трехуровневая структура
локальной задачи при сохранении объективного и рефлексного
уровней в действительности может иметь в зависимости от
конкретной предметной области гораздо больше внутренних уровней
с различными соотношениями свойств «перцептивности» и «реф-
лексиости» информации. Концептуальный характер системы
СФИНКС еще требует машинной реализации и практической
оценки многих заложенных в нее идей. Рассматриваемую в
работе теорию интеллектуальных решателей ждет дальнейшее
развитие в части использования семиотических моделей, индуктивного
и нечеткого вывода, псевдофизических логик пространства и
времени, рефлексии и рефлексного управления и многого другого.
В книге не нашли в должной мере отражения и такие
представляющие интерес системы искусственного интеллекта, как
диалоговые системы и системы, понимающие естественный язык,,
интеллектуальные банки данных, и многие другие. Остается
надеяться, что затронутые в данной работе проблемы построения
интеллектуальных решателей окажутся полезпыми для
изучающих указанные и прочие проблемы искусственного интеллекта..
ЛИТЕРАТУРА
Адельсон-Вельский Г. M.t Арлазаров В, Л. и др.
1970 О программировании игры вычислительной машины в шахматы.—
Успехи математических наук, 1970, т. XXV, вып. 2 (152).
А м а р е л С.
1966 Подход к автоматическому формированию теории,— Пер. с англ.—
В кн.: Принципы самоорганизации.— М.: Мир, 1966.
Андерсон, Бледсоу (Anderson R., Bledsoe W.)
1970 A linear format for resolution with merging and a new technique for
establishing completeness,— J. ACM, 1970, v. 17, № 3.
Акофф (Ackoff R. L.)
1970 A concept of corporate planning.— New York: Wiley-Interscience, A
Division of John Wiley and Sons, 1970. (Русский перевод: Планирование
в больших экономических системах.— М.: Сов. Радио, 1972.)
Б а р а б а ш 10. Л., Барский Б. В. и др.
1967 Вопросы статистической теории распознавания,— М.: Сов. Радио, 1967.
Беиерджи (Banerji R. В.)
1969 Theory of problem solving.— New York: American Elsevier Publishing
Company, Inc., 1969. (Русский перевод: Теория решения задач.— М.:
Мир, 1972.)
Б е р и га т е й н И. А.
1968 Проблемы моделирования в биологии активности.— В кн.:
Математическое моделирование жизненных процессов.— М.: Мысль, 1968.
Б и р (Beer St.)
1961 Cybernetics and management.— New York: Wiley, 1961. (Русский
перевод: Кибернетика и управление производством,—2-е изд.—М.: Наука,
1965.)
Ъ о п г а р д М. М.
1967 Проблема узнавания,— М.: Наука, 1967.
Ботвинник М. М.
1968 Алгоритм игры в шахматы,— М.: Наука, 1968.
1975 О кибернетической цели игры.— М.: Сов. Радио, 1975.
Б р а и л о в с к и й В. Л.
1964 Алгоритм распознавания объектов со мпогими параметрами и его
приложения.— Изв. АН СССР. Техническая кибернетика, № 2, 1964
Б р а й н е с С. Н., Напалков А. В., С в е ч и п с к и й В. Б.
1962 Нейрокибернетика.— М.: Мир, 1962.
Б р у д н о А. Л.
1963 Грани и оценки для сокращения перебора вариантов,-Проблемы
кибернетики, 1963, вып. 10.
Брябрип В. М.
1977 Диалоговая информационпо-логпческая система.—Труды Межд. конф.
по Искусственному Интеллекту, Ленинград — Репино, 1977.
Б у с л е п к о Н. П., Калашников В. В., Коваленко И. II.
1973 Лекции па теории сложных систем.— М.: Сов. Радио, 1973.
ЛИТЕРАТУРА 30?
Бут Р. Р.
1962 Стохастические модели обучаемости/Пер. с англ.— М.: Физматгиз*
1962.
Виноград (Winograd Т.)
1972 Understanding natural language.—New York: Acad. Press, 1972.
(Русский перевод: Программа, понимающая естественный язык.— М.: Мирг.
1976.)
В о й ш в и л л о Е. К.
1967 Понятие.— М.: Изд-во МГУ, 1967.
Вое, Карсон, Робинсон (Wos L., Carson D., Robinson G.)
1964 The unit preference strategy in theorem proving.— Proc. AFIPS Annual
Fallo Joint Computer Conf., 1964, pp. 616—621.
1965 Efficiency and completeness of the set of support strategy in theorem-*
proving.— J. ACM, v. 12, № 4, pp. 536—541.
Г а р в е й, К л и н г (Garvey Т., Kling R.)
1969 Users guide to QA3.5 Question-answering system.—Stanford Res. Inst.^
Artifical Intelligence Group., Tech. Note 15, Meulo Park, Calif., Dec,
1969.
Г л а д у п В. П.
1977 Эвристический поиск в сложных средах.— Киев: Наукова думкаг.
1977.
Грин, Рафаэль (Green С. С, Raphael В.)
1968 The use of theorem-proving techniques in question-answering systems.—
Proc. 23rd ACM Nat. Conf., 1968.
Грин (Green С. С.)
1969 Theorem-proving hy resolution as a basis for question-answering
systems,— In: Machine Intelligence, vol. 4, Edenburg Univ. Press, pp. 183—
205. (Русский перевод: Доказательство теорем с использованием
правила резолюции как основа для построения вопросно-ответной
системы.— В кн.: Искусственный интеллект/Пер. с англ.— М.: Мир,
1973.)
Давыдов Г. В., М а с л о в С, Ю., Минц Г. Е., О р е в к о в В. П.,
СлисенкоА. О.
1969 Машинный алгорифм установления выводимости на основе обратного^
метода.— В кн.: Исследования по конструктивной математике и мате—
матической логике,— (Записки научных семинаров ЛОМИ АН СССР) —
т. 16.— Л.: Наука, 1969.
Дружинин В. В., К о н т о р о в Д. С.
1972 Идея,г алгоритм, решение.— М.: Воен. изд-во МО СССР, 1972.
Д э в и с, Путнэм (Davis M.. Putnam H.)
1960 A computing procedure for quantification theory,—J. ACM, v. 7, № 3,,
I960.
E p о x и н Е. А., С у д е й к и н М. И.
1978 Модель системы планирования интегрального робота.— В кн.:
Инженерно-математические методы в физике и кибернетике, вып. 8.— М.::
Атомиздат> 1978.
Ефимов Е. И.
1977а СФИНКС — система формального интеллекта комплексных
стратегий.— В кн.: Вопросы кибернетики, вып. 18. Теория и практика
ситуационного управления,— М.: Научный Совет по комплексной
проблеме «Кибернетика», 1977.
19776 Моделирование шахматных окончаний на основе автоматизации
доказательства теорем,— М.: Изв. АН СССР, Техническая кибернетика,.
1977, № 2.
1979 Автоматическое обучение решателя задач.— Проблемы управления и,
теории информации, 1979, т. 8, № 3. (Английский перевод: Efi-
m о v E. I., Automatic learning of problem solver.— Problems of
Control and Information Theory, v, 8 (3), pp. 239—256.)
20*
308
ЛИТЕРАТУРА
Ефимов Е. II., Поспелов Д. А.
1977 Семиотические модели в задачах планирования для систем
искусственного интеллекта.—Изв. АН СССР. Техническая кибернетика,
1977, № 5.
Кахро М. И., М ян писал у М. А., Саап Ю. П., Тыугу Э. X.
1976 Система программирования ПРИЗ.— Программирование, 1976, № 1.
Квенд Э.
1969 Анализ сложных систем/Пер. с англ.—М.: Сов. Радио, 1969.
К л и н и (Kleene S. С.)
1967 Mathematical logic—New York; London; Sydney. 1967. (Русский
перевод: Математическая логика.—М.: Мир, 1973.)
Клыков 10. И.
1974 Ситуациопное управление большими системами.— М.: Энергия, 1974.
Ковальский, X э й е с (Kowalski R., Hayes P.)
1969 Semantic trees in automatic theorem-proving.—In: Meltzer В.,
Michie D. (eds.). Machine Intelligence, vol. 4, pp. 87—101. (Русский
перевод: Семантические деревья в автоматическом доказательстве
теорем.— Кибернетический сборник. Новая серия, вып. 9.— М.: Мир, 1972.)
Колмогоров А. Н.
1968 Автоматы и жизнь.— В кн.: Кибернетика ожидаемая и кибернетика
неожиданная.—М.: Наука, 1968.
Кузин Е. С.
1975 О языке представления моделей проблемных сред,— В кн.: Вопросы
радиоэлектроники. Серия общетехническая, вып. 8, 1975.
Кузин Е. С, Фоминых И. Б.
1975 Алгоритм планирования целенаправленной деятельности робота в
детерминированных квазистационарных средах.— В кн.: Вопросы
радиоэлектроники. Серия общетехническая, вып. 8, 1975.
Л а к х э м (Luckham D.)
1969 Retinement theorems in resolution theory.—Stanford Artifical
Intelligence Project.— Memo Al-81, March 24, 1969.
,JI а в л е н д (Loveland D.)
1968 A linear format for resolution.—Carnegie-Mellon University Computer
Science Dept. Report, Dec, 1968.
Марин, Стоун.
1970 Моделирование процесса формирования понятий на вычислительной
машипе.— М.: Мир, 1970.
М а с л о в СЮ.
1964 Обратный метод установления выводимости в классическом
исчислении предикатов.—ДАН СССР, 1964, т. 159, № 1, с. 17—20.
1968 Обратный метод установления выводимости для логических
исчислений.— Труды МИАН, т. 98.— Л.: Наука, 1968.
1972 О поиске вывода в исчислениях общего типа.— В кп.: Исследования
по конструктивной математике и математической логике.— (Записки
научных семинаров ЛОМИ АН СССР) — т. 32.— Л.: Наука, 1972.
1979 Теория поиска вывода и вопросы психологии творчества.— В кн.:
Семиотика и информатика, вып. 13.— М.: ВИНИТИ, 1979.
М а т го га к и n A. H.
1968 Основные психологические модели проблемных ситуаций,— В кн.:
Основные подходы к моделированию психики и эвристическому
программированию. Материалы симпозиума, Киев, 1968.
М е л ь ц е р (Meltzer В.)
1966 Theorem-proving for computers: some results on resolution and
renaming.— Сотр. J., 1966, v. 8, p. 341—343.
Месарович M. (Mesarovic M. D.)
1964 Foundations for a general systems theory.—In: Views on Gen. Syst.
Theory.—New York; London; Sydney: Wiley. 1964. (Русский перевод:
ЛИТЕРАТУРА
309
Обоснование общей теории систем.—В кн.: Общая теория систем.—
М.: Мир, 1966.)
1965 Toward a formal theory of problem solving.— In: S a s s M., VV i I-
kin son VV. (eds.). Computer augmentation of humen reasoning.
Washington. 1965, p. 37.
Месарович М. Ma к о Д., Такахара И. (Mesarovic M. D.. Мас-
ko D., Takahara Y.)
1970 Theory of hierarchical multilevel systems.— New York; London: Acad.
Press, 1970. (Русский перевод: Теория иерархических мпогоуровпевых
систем.—М.: Мир, 1973.)
Миллер Г., Галантер Е., Прибрам К. (Miller G. A., Galanter E..
Pribram К.)
1960 Plans and the structure of behavior.—New York: 1960. (Русский
перевод: Планы и структуры поведения.— М.: Прогресс* 1965.)
Минский М. (Minsky M. L.)
1962 Problems of formulation the artificial intelligence area. Proc. Sump, on
Mathem. Problems in Biology,—Am. Math. Soc, 1962.
(Русский перевод: Проблемы в области искусственного интеллекта.—
В кн.: Математические проблемы в биологии.— М.: Мир, 1966.)
1974 A framework for representing knowledge.— Cambridge: Massachusetts
Institute of Technology, 1974. (Русский перевод: Фреймы для
представления знаний.— М.: Энергия, 1979.)
Минский М., П е йп ерт С. (Minsky M., Papert S.)
1969 Perceptrons.— Cambridge, Massachusetts, 1969. (Русский перевод: Пер-
цептроны,— М.: Мир, 1971.)
М я н н и с а л у М. А., Т ы у г у Э. X.
1974. Язык описания задач УТОПИСТ.—В кн.: Управляющие системы,
№ 1, Киев, 1974.
Ныоэлл А., Шоу Д ж., Саймон Г. (Newell A., Shaw J., Simon Ы.)
1957 Empirical explotations of the logic theory machine.—Proc. Western
Joint Computer Conf., 1957 (Русский перевод: Эх\гаирпческие
исследования машины «логик-теоретик».— В кн.: Вычислительные машины
и мышление.— М.: Мир, 1967.)
1960 A variety of intelligent learning in a general problem-solver.—In: Lo-
vits M. C., Cameron (cds.). Self-organizing systems.—New York:
Pergamon Press, 1960, pp. 153—189. (Русский перевод: Разновидность
интеллектуального обучеппя вычислителя для решения задач общего
типа.— В кн.: Самоорганизующиеся системы,— М.: Мир, 1964.)
Ньюэлл, Саймон (Newell A., Simon H. А.)
1961 Computer simulation of human trinking.— Sciense, 1961, v. 134,
№ 3495.
Нильсои И. (Nilson N.)
1971 Problem solving methods in artificial intelligence.— New York: Mc Graw-
Hill Book Company, 1971. (Русский перевод: Искусственный
интеллект.—М.: Мир, 1973.)
Пензов Ю. Е.
1968 Элементы математической логики и теории множеств,— Саратов;
Изд-во Саратовского ун-та, 1968.
П о й a (Polya G.)
1954 Mathematics and plausible reasoning (2 vols).—Princeton, 1954.
(Русский перевод: Математика и нравдоподобпыо рассуждения,— М.:
Наука, 1975.)
1962 Mathematical discovery.—New York; London: Wiley, 1962. (Русский
перевод: Математическое открытие.— М.: Наука, 1970.)
Попов Э. В., Ф и р д м а н Г. Р.
1976 Алгоритмические осповы интеллектуальных роботов и искусственного
интеллекта.— М.: Наука, 1976.
310
ЛИТЕРАТУРА
Поспелов Д. А.
1971 Принципы ситуационпого управления.—Изв. АН СССР. Техническая*
кибернетика, 1971, № 2.
Поспелов Д. А., Пушкин В. Н., Садовский В. Н.
1967 Эвристическое программирование и эвристика как паука.— Вопросы
философии, 1967, № 7.
Поспелов Г. С, И р и к о в В. А.
1976 Программно-целевое планирование и управление.— М.: Сов. Радио.
1976.
Пушкин В. Н.
1965 Оперативное мышление в больших системах.— М.: Энергия, 1965.
II х о в е л и ш в и л и М. Г.
1978 Исследование и реализация интеллектуальных банков данных,— Канд.
диссерт. Выч. Центр АН СССР, 1978.
Рапопорт (Rapoport A.)
1969 Математические аспекты абстрактного анализа систем.— В кн.:
Исследования по общей теории систем/Пер. с англ.— М.: Прогресс, 1969.
Р е й т м а н В. (Reitman W. R.)
1965 Cognition and thought.— New York; London; Sydney: Wiley, 1965.
(Русский перевод: Познание и мышление.— М.: Мир, 1968.)
Риге Ж.
1963 Бинарные отношения, замыкания, соответствия Галуа.—
Кибернетический сборник, вып. 7.— М.: ИЛ, 1963.
Робинсоп A. (Robinson A.)
1963 Introduction to model theory and to the metamathematics of Algebra.—
Amsterdam: North-Holland Publishing Company, 1963. (Русский перевод:
Введение в теорию моделей и математику алгебры.— М.: Наука, 1967.)
Робинсон Дж. (Robinson G.)
1965 A machine-oriented logic based on the resolution principle.—- J. ACMr
1965, v. 12, № 1, p. 23—41. (Русский перевод: Машшшо-ориентирован-
пый логический базис в принципе резолюции.—Кибернетический
сборник, Новая серия, № 7, Мир, 1970.
1970 An overview of mechanical theorem proving.—4. System Simp., 1970,
Робинсон, Вое (Robinson G., Wos L.)
1969 Paramodulation and theorem-proving in first-order theories with
equality,—In: Machine Intelligence, 4, Dale E., Michie D. (eds.).
Edinburg: Oliver and Boyd, 1969, pp. 135—150.
Розенблатт (Rosenblatt F.)
1962 Principles of neurodynamics.— Washington: Cornell Aeronaut. Lab. Rep.
1196-G-8, Spartan, 1962. (Русский перевод: Принципы нейродинами-
ки.— М.: Мир, 1965.)
Рулифсоп (Rulifson J. F.)
1973 Et al QA4: procedural calculus for intuitive reasoning,—SRI AI
Center Technical Note 73, November, 1973.
Сакердоти (Sacerdoti E. D.)
1974 Planning in a hierachy of abstraction spaces.— Artificial Intelligence,
v. 5, pp. 115-135.
С л э й г л (Slagle J. R.)
1965а Experiments with a deductive, question-answering problem.—Commun.
ACM, v. 8, 792—798.
19656 A multipurpose theorem-proving heuristic program that learns.—Proc.
IFIP Congr., vol. 11. Spartan Books, Washington. D. C. pp. 323—328.
1967 Automatic theorem-proving with renamable and semantic resolution.—
J. ACM, v. 14, pp. 687-697.
Слэйгл, Барский (Slagle J., Bursky Ph.)
1968 Experiments with a multipurpose, theorem-proving heuristic program.—
J. ACM, v. 15, № 1, 85-99.
ЛИТЕРАТУРА
311
Слэйгл, Конайвер (Slagle J., Koniver D.)
1970 Finding resolution proofs and using duplicate coals in AND-OR trees.—
Heuristics Lab. Div. of Computer Res. a. TechnoL, Nat Inst of Health,
Bethesda, Md., 1970.
Тихомиров О. К.
1969 Структура мыслительной деятельности человека.— М.: Изд-во МГУ.
1969.
Т ы у г у Э. X.
1970 Решение задач на вычислительных моделях,— Вычислит, математика
и матем. физика, 1970, т. 10, № 3, с. 716—733.
1971 Решатель вычислительных эадач.— Вычислит, математика и матем.
физика, 1971, т. И.
1977 Формирование модели мира в системах искусственного интеллекта.—
Науч. Совет по компл. проблеме «Кибернетика», ротапринт, 1977.
Ты угу Э. X., Упт М.
1976 Эксперименты с решателем вычислительных вадач.— Научный Совет
по комплексной проблеме «Кибернетика», Ип-т кибернетики АН Груз.
ССР, Труды IV Меж д. объединенной конф. по искусственному интсл-
лекгу, т. 3, с. 172—182.
Фейгенбаум, Фельдман, ред. (Eds. Erward A. Feigenbaum and
J. Feldman).
1963 Computers and thought.— New York: San Francisko; Toronto; London,
1963. (Русский перевод: Вычислительные машины и мышление,—
М.: Мир, 1967.)
Ф а й к с (Fikes R. Е.)
1971 Monitored execution of robot plans produced by STRIPS.— Proc. IFIP
Congr., Ljublana, Yugoslavia, 1971.
Ф а й к с, Нильсон. (Fikes R., Nilson N.)
1971 STRIPS: A new approach to the application of the theorem proving to
problem solving.— Proc. 2-nd Intern. Conf. on Artificial Intelligence,
London, 1971, pp. 608—619. (Русский перевод: Система STRIPS —
новый подход к применению доказательства теорем при решении
задач,—В кн.: Интегральные роботы, вып. 1,—М.: Мир, 1973.).
Ф а и к с Р., X а р т П., Нильсон Н. (Fikes R., Hart P., Nilson N.)
1972a Some new directions in robot problem solving.— Machine Intelligence,
v. 7. Edenburg: Univ. Press, 1972, pp. 405—430. (Русский перевод:
Новые направления в автоматическом решении задач роботом,—
В кн.: Интегральные работы, вып. 2.— М.: Мир, 1975.)
19726 Learning and executing generalized robot plans,— Artificial
Intelligence, v. 3, No. 4, p. 251—288.
X а й е с P. (Hayes R. J.)
1971 Logic oi actions.— Machine Intelligence, v. 6, New York, 1971, pp. 495—
519. (Русский перевод: Логика действий.— В кн.: Интегральные
роботы, вып. 2.— М.: Мир, 1975.)
Хант, Марин, Стоун (Hunt E., Marin J., Stoun P.)
1966 Experiments in induction.— New York, 1966.
Хант Е. (Hunt Earl B.)
1975 Artificial intelligence.— New York; San Francisko; London: Acad. Press,
1975. (Русский перевод. Искусственный интеллект,- М.: Мир, 1978.)
Ч э н г, Ли (Chang CM Lee W.)
1973 Symbolic Logic and mechanical theorem proving.—New York; London:
Acad. Press, 1973.
Шанин Н. А., Давыдов Г. В. и др.
1965 Алгорифм машипного поиска естественного логического вывода в
исчислении высказываний.— М.; Л.: Наука, 1965.
Шапиро СИ.
1973 От алгоритмов — к суждениям,— М.: Сов. Радио, 1973.
312 ЛИТЕРАТУРА
трейдер Ю. А.
1971 Равенство Сходство, Порядок,— М.: Наука, 1971.
Э р б р а и (Herbrand J.)
1930 Recherches sur la Ihcorie de la demonstration,—Trav. Soc. Sci. Lettres
varsovie, Clusse 1II Sci. Math. Phys., No. 33,1930.
Эрнст, Ныовлл (Ernst G. W.f Newell A.)
1967a Generality and GPS —Center for the Study of Information Processing,
Carnegie-Mellon Univ., Pittsburg Pa., Jan , 1967,
19676 Some issves of representation in a general problem solver,—Proc»
AF1PS Aun. Spring Joint Camputer ConL, 1967.
1969 GPS: A case study in generality and problem solving,—ACM. Mono,—
New York: Acad. Press, 1969.
Э id б и У. (Ashby W. Ross)
1952 Desing for a brain — New York: Wiley, 1952. (Русский перевод:
Конструкция мозга.— М.: Map, 1964,)
1961а Principles of the self-organizing system.— Illinois Symposium on
Principles of self-organization, pp. 255—278 Univ of Illinois, Urbana, 1961.
(Русский перевод: Принципы самоорганизации.- В кн,: Принципы
самоорганизации.— М.: Мир, 1966.)
19616 What is an intelligent machine? — Proc. of the Western Joint Computer
Conf., May 9—11, 1961, pp. 278—280. (Русский перевод: Что такое
разумная машина? — Зарубежная радиоэлектроника, 1962, № 3, с, 67.)
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Адаптация 79
Аксиома 104
— базовая 140
— дипамическая 113
— логическая 106, 112, 122, 124, 134
— собственная 106, 113
— статическая ИЗ, 121
— тривиальная 137
Активность внутренняя 9
Алгоритм допустимый 165
— направленного перебора 165
— обучения 186
— унификации 92
Антецедент 96
Атом 108
База Эрбрана 89
Вершина вывода 90
— заключительная 163
— начальная 163
— неблагоприятная 90
— неразрешимая 163
— разрешимая 163
Выражение замкнутое 109
Вес вершины 177
— семантически правильное 108
Гештальт-психология 17
Гипотеза решения 23, 32, 38
Гомоморфизм 128
Данные исходные 30, 35, 49
— объективные 51
Дедукция 173
Дерево доказательства 98
оптимальное 164
потенциальное 164
— замкнутое 90, 99, 155
— И/ИЛИ 163
— опровержения 98
— полное 90
— секвенциальное 96
Деятельность исследовательская 21
Деятельность мыслительная 5, 9, 15,
21, 28
— перцептивная 24
— реальная 9
— эвристическая 19
Диаграмма 130
— отрпцательная 129
— положительная 129
Дизъюнкт 88
Доказательство 104
— макро 107
— микро 107
Задача 41
— глобальная 56
— декомпозиции 35, 36
— интеллектуальная 43
— комплексная 8
— локальная 49, 66, 72
— многоуровневая 50
— па доказательство 41
— на нахождение 41
— иесхематпзированная 8, 30
— одноуровневая 50
— перцептпвпая 52
— рефлексная 52, 67
— с двумя концами 11
— с одним концом 11
~ схематизированная 7
— типовая 52
— управления 7
— элементарная 31, 49
Заключение 86
Закон обратного отношепия 172
Знания актуальные 31, 54
— структурированные 33
— фактуальные 31, 54
Зона ориентации 22
Изоморфизм 128
— по индивидам 141
Индивид 84
Индукция 173
Интеллектуальность 42
314
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Иптерпретация'84
Истинность секвенций 131
Исчисление предикатов 96
— прикладное 81, 105
— секвенций 95
Код 178
— единичный 178, 179
— нулевой 178, 179
Контрпример опровергающий 96
Копцепция мышления
семиотическая 18
Лемма о наличии замкнутого дерева
170
контрпримера 169
— о непротиворечивости правил 133
— о полноте теории решений 141,
142
— о разрешимости матрицы 185
теории решений 168
— о связи веса и областей
префикса 181
— об общезначимости аксиом 134
— об определимости секвенций 1
Литеры 89
— базовые 140
— производные 140
— разрешающие 93
Логика машинно-ориентированная
— предикатов 84
— семиотическая 107
Местность префикса 84
Метатеорема о дедукции 86, 132
— о допустимости префикса 183
— о замене выражений 131
— о местности префикса 185
— о непротиворечивости 135
— о подстановке отношений 130
термов 131
— о полноте 145
резолюций 94
— о противоречивости 86
— о разрешимости 185, 170
— о редукции 136
— об общезначимости 131
— об эквивалентности 131
— Эрбрана 90
Механизм переноса результатов 22
— планирования 24
— прогнозирования 24
— регуляции действий 20
объема зоны 22
— сравнения 24
Мир внешний 53, 79
— впутренний 53, 79
— задач 80
Мир объективный 51, 79
— операций 79
Множество невыполнимое 88
Модель 86
— вероятностная 20
— внешпего мира 13
— внутреннего мира 13
— динамическая 129
— информационная 20
— исходная 129
— конечная 129
— мира задач 49
операций 43
— множества аксиом 129
— мыслительной деятельности 15
— поведенческая 15, 19
-— подобная 129
— решателя 54, 75
— семиотическая 5, 34, 36
— ситуационная 76
— статическая 129
Нейрокибернетика 17
Непротиворечивость теории 132, 135
— формальной системы 105
Область допустимая 179
— единичная 178
— запретная 179
— нулевая 178
— противоречивая 179
Обучепие 79
— автоматическое 6,174
Оператор главный 98
Операция элементарная 44
Описание объективное 51
— перцептивное 51
— рефлексное 52
Определимость горизонтальной сек~
венции 142
— Диагональной секвенции 143
— неэлементарной секвенции 141
— предложения 140
— элементарной секвенции 141
Орган исполнительный 9, 65
— решающий 9, 65
Пара критическая 178
Переменная индивидная 84
— неуправляемая 179
— ограниченная 109
— свободная 84
— связанная 84
— универсальная 88
— управляемая 179
План 24
— действий 47
ПРЕДМЕТНЫЙ
УКАЗАТЕЛЬ
315
План деятельности 7
Подмодель 129
Подсистема исполнительная 8» 55
— решающая 8, 55
Подстановка 92
—t композиция 92
Подструктура 111
— концевая 62
— одноранговая 62
Подход бихевиористический 15, 37
— информационный 17
— макро 10
— механистический 9
— микро 10
— системный 10, 18
— терминальный 8, 9
— физиологический 17
— целенаправленный 8
Поиск 42
— контрпримера 96
— обратный 33, 68, 71
— прямой 33
<— систематический 37
— эвристический 37
Полнота по Геделю 139
Робинсону 139
— теории решений 142, 145
— формальной системы 105
Понятие 172
—, объем 172
—, содержание 172
Постановка задачи 50
локальной 66
рефлексной 67
Посылка 86
Потребность поисковая 23
Правило вывода 104, 133
— двустороннее 134
— допустимое 101, 149
— непротиворечивое 133
— опровержения 133
— производное 123
— редуцирования 123, 124
— теории решений 121
Предикат 84
Предложение 108
Предмет элементарный 44
Преобразование средств в цели 23
— элемептарноо 177
Префикс 86, 174
— запретный 179
Принцип резолюций 6, 83, 92
Проблема оценки 10
Прогноз развития 34
Программа 39
— операций 46, 56, 73, 74
— универсальная 38
— эвристическая 17, 38
Программирование эвристическое 21,
36
Процедура выбора 12
— решения задач 5
— стандартизации 88
— стереотипная 31
— эвристическая 6
Процесс технологический 7
Разрешимость относительно
доказательства 104
матрицы 180
общезначимости
Расширение 129
Резольпепта бинарпая 93
Резолюция 94
— опровержения 94
Результат желаемый 35
— требуемый 30, 35, 50
Решатель интеллектуальных задач 5.
36
— иесхематизированпых задач 8
— схематизированных задач 7
— целенаправленный 8
Решение допустимое 40
— задачи 30, 42, 50
— замысла 35, 68
— комплексное 56, 73
— одтимальное 11
— рациональное 40
Свойство знакосохраияющее 150
— подформульяости 150
Связка 108, 109
Секвенция 96
— вертикальная 141
— горизонтальная 141
— диагональная 143
— элементарная 141
Семантика теории решений 126
Система большая 7
— взаимодействия 22
— генценовская 99
— иптегральпая 8
— организационная 7, 8
— технологическая 7
— формальная 104
— целенаправленная 9
Ситуация 21, 46, 130
— естественная 34
— исходная 7
— конечная 34, 46
— макро 77
— микро 77
— проблемная 19
— противоречивая 178
Следование логическое 86
— модельное 132
316
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Словарь теории 140
базовый 140
производный 140
Случай константно-частный 88
Смысл операциональный 23
— попытки 25
— ситуации 25
Стратегия комплексная 12, 56, 66, 74
Структура 129
— динамическая 111
— доказательства 139
— знаний 64
— иерархическая 32
— организационная 64
— предметная 110
— решений 64
— смысловая 32, 36
— управляющая 63
Сукцедент 96
СФИНКС 78, 79
Схема аксиомы 115, 117
— деятельности 7
— лабиринтпая 16, 37
— рефлексной задачи 52
— решений 7, 32
— элементарной задачи 50
операции 44
Таблица треугольная 47, 67
Теорема каноническая 137
— многошаговая 136
— теории решений 104
Теория 104
— аксиоматическая 104^
— бинарных отношений 58
— динамическая 106
— доказательств 103
— иерархическая 106
— интеллектуальных решателей 13,
14
— компактная 143
— моделей 103
— оптимального управления И
— открытая 106
— перцептивная 107
— рефлексная 107
— решений 106
— трансляционная 107
Терм 84, 108
— перцептивный 109
— рефлексный 109
Технология 7
Универсум Эрбрана 88
Унификатор 92
— наиболее общий 92
Условие задачи 49
Факт 109
Форма конъюнктивная 86
— пренекспая 86
— сколемская 88
Формула 109
— атомарная 84
— боковая 98, 246
— выполнимая 84
— главная 98, 246
— замкнутая 109
— общезначимая 85 i
— правильно построенная 84 i
— противоречивая 84 i
Фрейм 31, 52, 80, 106, 109, ПО, 116, j
121, 125
Функция оценочная 164
Целенаправленность 9, 11
Шаг опровержения 96
Эвристика 16, 24, 31
—, цель-—средства 24 i
Элемент концевой 62
— корневой 62
— наивысшего ранга 62
— наименьшего ранга 62
Ядро 181
Язык декларативный 39
— перцептивный 102
— представления знаний 13 i
— процедуральный 6, 39
— рефлексный 102
— трансляционный 102 i
— формальный 104
Ярус релевантный 180 i
— ситуаций 179 !
Евгений Иванович Ефимов
Решатели интеллектуальных задач
(Серия: «Проблемы искусственного интеллекта» >
Редактор В. Я. Захаров
Техн. редактор И. Ш. Акселърод
Корректоры Г, В. Подволъская, Н. Б. Румянцева
ИБ М> 11723
Сдано в набор 18.12 81. Подписано- к печати 11.06 82»
Т-06796. Формат 60x90l/i6. Бумага тип. № 1.
Обыкновенная гарнитура. Высокая печать. Условн. печ.
л. 20. Уч.-изд. л. 21,36. Тираж 7000 экз. Заказ № 837.
Цена 2 р. 40 к.
Издательство «Наука»
Главная редакция
физико-математической литературы
117071, Москва, В-71, Ленинский проспект, 15
4-я типография издательства «Наука»
630077, Новосибирск, 77, Станиславского, 25
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
ГОТОВИТСЯ К ИЗДАНИЮ
Серия «Проблемы искусственного интеллекта»
ГАЕК П., ГАВРАНЕК Т. Автоматическое образование
гипотез: математические основы общей теории. Перевод с
английского.
Проблематика книги, принадлежащей перу известных
чехословацких специалистов, связана с известным вопросом
искусственного интеллекта: «может ли машина мыслить?», который
понимается авторами как вопрос: «может ли машина
формулировать и проверять гипотезы?». Книга содержит две части: «логи-!
ка индукции» и «логика открытия». I
В монографии рассматриваются нестандартные логические
исчисления с обобщенными кванторами в смысле А. Мостовско-
го (в том числе многозначные исчисления), которые
применяются для формализации рациональных индуктивных выводов и для
построения логических основ вычислительной статистики. В
книге излагается метод автоматического образования гипотез и
исследуются вопросы вычислительной сложности рассматриваемых
процедур.
Книга адресована специалистам по искусственному
интеллекту, программированию, математической логике, а также
философам, интересующимся проблемами индукции.
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
ГОТОВИТСЯ К ИЗДАНИЮ
Серия «Проблемы искусственного интеллекта»
ЗАРИПОВ Р. X. Машинный поиск вариантов при
моделировании творческого процесса.
Книга посвящена одной из наиболее важных проблем
психологии мышления и построения искусственного интеллекта —
проблеме транспонирования, т. е. переноса инвариантной структуры .
(носителя некоторого образа) при варьировании ситуаций. Этот
перенос является необходимым компонентом творческой дея-1
тельности во всех сферах ее проявления. Рассматриваются прин- г
ципы варьирования ситуаций и моделирования творчества на
ЭВМ. Иа их основе построен машинный алгоритм, порождающий
мелодические вариации на заданную музыкальную тему.
Вариации рассматриваются! также на примере плетения кружев и ком-'
бинаторных игр, народных сказок.
Книга предназначена для читателей, интересующихся во-|
просами построения искусственного интеллекта, моделированиям
творчества, кибернетики и психологии мышления. \