Автор: Гаскаров Д.В.
Теги: документация научно-техническая информация (нти) печать в целом авторство кибернетика информатика искусственный интеллект информационные технологии информационные системы
ISBN: 5-06-004611-7
Год: 2003
Д.В.ГАСКАРОВ
ИНТЕЛЛЕКТУАЛЬНЫЕ
ИНФОРМАЦИОННЫЕ
Допущено Министерством образования
Российской Федерации
в качестве учебника для студентов
высших учебных заведений,
обучающихся по специальности
"Информационные системы в технике и технологиях"
направления подготовки
дипломированных специалистов
"Информационные системы"
Москва
«Высшая школа»
2003
УДК 002.52/54
ББК 32.811
Г22
Федеральная целевая программа «Культура России»
(подпрограмма «Поддержка полиграфии и книгоиздания России»)
Рецензенты:
кафедра «Системы автоматизированного проектирования вычислительных
средств» Рязанской государственной радиотехнической академии (зав.
кафедрой д-р техн. наук, проф. В.П. Корячко); д-р техн. наук, проф. О.И. Кутузов
Гаскаров, Д.В.
Г22 Интеллектуальные информационные системы. Учеб. для
вузов. — М.: Высш. шк., 2003. — 431 с: ил.
ISBN 5-06-004611-7
Изложены основы интеллектуализации информационных систем
различного назначения с раскрытием проблемной области искусственного
интеллекта, моделями представления данных и знаний, классификацией
интеллектуальных систем. Рассмотрены методы устранения неопределенности при
представлении знаний, их обобщении и классификации. Отдельное внимание
уделено задачам компьютерной логики и лингвистики (проблеме общения).
Особо выделены вопросы интеллектуализации процедур прикладного
характера в предметной области — поиск, управление и контроль (восприятие
информации и модели обучения). Подробно изложены методологические
аспекты построения экспертных систем и связанных с ними структурных и
технологических задач. Описаны диалоговые системы и раскрыто их формальное
содержание.
Для студентов, обучающихся по специальности «Информационные системы
А- технике и-технологиях» направления подготовки дипломированных
специалистов «Шфо'рАационные системы».
УДК 002.52/54
ББК 32.811
ISBN 5-06-004611-7 © ФГУП «Издательство «Высшая школа», 2003
Оригинал-макет данного издания является собственностью издательства
«Высшая школа», и его репродуцирование (воспроизведение) любым способом без
согласия издательства запрещается.
Предисловие
Как известно, одной из наивысших человеческих
квалификаций в обществе является генерация знаний, в особенности новых
знаний. В недалеком прошлом считалось, что это доступно только
естественному интеллекту. Однако в связи с созданием за
последние десятилетия реальной технической и информационной среды
существования искусственного интеллекта, проблема генерации
новых знаний может решаться на автоматизированной основе.
Для расширения и углубления среды искусственного
интеллекта и обеспечения ее эффективного существования в различных
предметных областях, естественно, нужны специалисты,
подготовленные по информационным компьютеризированным и
математизированным специальностям. Это объясняется тем, что
необходимость интеллектуальных систем, интеллектуальных концепций и
технологий вызвана реальной потребностью, поскольку
применение высокопроизводительной вычислительной техники в области
расчетных вычислений уже в основном обеспечило в настоящее
время потребности практики.
Введение новых специальностей и специализаций, новых
учебных планов и государственных образовательных стандартов
учитывает эту тенденцию в мире образовательного процесса.
Дисциплины, связанные с интеллектуальными системами, появились при
обучении студентов по многим специальностям, так как
теоретическая и прикладная значимость направления интеллектуальных
систем существенно обогащает проблемные области практически в
любой сфере деятельности.
Общеизвестно, настоящая ценность специалиста в области
компьютерной техники возрастает, когда, кроме знания техники,
он владеет языками программирования и имеет хорошую
математическую базу. Однако знания в области искусственного
интеллекта поднимают этих специалистов на наиболее высокий уровень
интеллектуального программиста-математика.
Поэтому в последние годы интенсифицировались работы,
связанные с построением и применением интеллектуальных
информационных систем, экспертных систем, систем, построенных на
знаниях, инженерии знаний и т.д.
з
В десяти главах учебника излагаются основные вопросы
интеллектуализации информационных систем. Даны определения и
классификации видов и типов интеллектуальных систем,
описание проблемной области искусственного интеллекта, модели
представления знаний. Рассматриваются основы методов работы
со знаниями: построение базы знаний и приобретение знаний,
формализация качественных знаний и пополнение знаний, а
также обобщение и классификация знаний. Излагаются задачи
компьютерной логики и компьютерной лингвистики с раскрытием
проблемы общения и уровней понимания, вопросы понимания
текстов на естественном языке и когнитивной компьютерной
графики. Отдельная глава посвящена интеллектуализации процедур
поиска и выбора, контроля и управления, восприятию
информации и моделям обучения.
Одним из наиболее развитых типов интеллектуальных систем
являются экспертные системы (ЭС), при изучении которых
важным является представление структуры ЭС и их классификация,
принципы построения ЭС и технология их разработки,
представление знаний в ЭС и достижение целей. При этом особое внимание
уделено рассмотрению продукционных ЭС, в частности элементов
ЭС продукционного типа по решению задачи прогнозирования.
Достаточно подробно рассматриваются диалоговые системы
(ДС) в информационных комплексах как одно из важнейших
средств интеллектуализации информационных систем. Здесь
основное внимание уделено классификации ДС, языкам описания
ДС, структуре и адаптивным факторам диалоговых алгоритмов.
Автор выражает искреннюю признательность рецензентам за
полезные замечания и советы, способствовавшие улучшению книги.
Автор
Введение
Научно-техническая реализация компьютерной техники
последних поколений, совершенствование и развитие
соответствующих им программных продуктов привели к реальной возможности
создания систем искусственного интеллекта, интеллектуализиро-
ванных информационно-вычислительных комплексов, экспертных
систем в различных проблемных областях, инженерии знаний и
т.д. Необходимость обеспечения науки и технические приложения
подобными системами вызвали к развитию множество приемов,
методов, подходов, которые постепенно накапливались,
модифицировались, обобщались, образуя в конце концов
интеллектуальные технологии формализации математически трудноописываемых
проблемных областей и принятия решений в условиях
неопределенностей и многомерности.
В разных сферах практической деятельности, связанных с
решением задач управления и контроля, оптимизации и
моделирования, поиска и выбора, распознавания и классификации и др.,
остро встала необходимость интеллектуальной поддержки для
преодоления трудностей в слабоформализованных ситуациях и при
ограниченных ресурсах.
С другой стороны, активизировались теоретические
исследования в различных математических областях: алгебры логики и
теории множеств, теории графов и информатики, семантического
анализа и иерархических сетей, теории фреймов и продукционных
моделей, диалоговых и экспертных процедур, теории когнитивной
графики и распознавания текстов на естественном языке и т.д.
В начале 60-х годов прошлого века шли горячие споры — может
ли машина «мыслить», «творить», играть в шахматы и т.д.
Прошедшие десятилетия вполне определенно дали положительный ответ.
Современные интеллектуализированные программы, совмещенные
с сенсорными системами, образуют робототехнические комплексы
высокого уровня. Системы искусственного интеллекта (ИИ)
способны выполнять функции, ранее считавшиеся исключительно
прерогативой естественного интеллекта: доказывать
математические теоремы, переводить тексты с одного языка на другой,
диагностировать болезни, распознавать месторождения полезных
ископаемых, умело играть в шахматы и другие интеллектуальные игры.
5
Кроме робототехнических автоматов, наделенных ИИ и
способных выполнять сложнейшие функции на других планетах и
труднодоступных (опасных) для человека производственных
местах, получил развитие еще один класс систем ИИ, нашедший
широкое распространение в последнее время, — это экспертные
системы, т.е. системы, позволяющие на базе современных
компьютеров накапливать, обновлять и корректировать знания из различных
предметных областей. Впервые возникшие на глазах нашего
поколения экспертные системы (их количество исчисляется сотнями)
помогают не только накапливать и хранить информацию в удобном
для пользователя виде, но и получать новые знания в медицине,
геологии, геофизике, машиностроении, робототехнике, экономике,
экологии и в других предметных областях.
Особенности современных теорий искусственного интеллекта и
информатики заключаются в том, что они имеют тесную связь с
лингвистикой, психологией и логикой, которые изучают явления,
относящиеся к познанию, пониманию и умозаключениям. Эти
связи носят взаимный характер: с одной стороны, сегодня
лингвисты, психологи, специалисты в области математической логики
переводят в программы те новые модели, которые они
разрабатывают (точно так же, как математики, биологи, исследователи в
области медицины), а с другой — исследователи в области
искусственного интеллекта изучают эти модели и пытаются воссоздать на
их основе логику эффективных методов решения задач.
Особенно тесные взаимосвязи имеются между искусственным
интеллектом и науками о познании. При этом основной задачей
является воссоздание с помощью искусственных устройств (в
основном, с помощью компьютеров) разумных рассуждений и
действий. Причем здесь возникают трудности двух типов: во-первых, в
большинстве случаев, выполняя какие-то действия, мы сами не
осознаем, как мы это делаем (нам не известен точный
алгоритм — так происходит понимание текста, узнавание лица,
доказательство теоремы, выработка плана действий, решения задачи и
т.п.); во-вторых, компьютеры априорно далеки от человеческого
уровня компетентности (до начала любой их работы необходимо
составить соответствующие программы).
Следовательно, методы искусственного интеллекта
представляют собой экспериментальную научную дисциплину. Под
экспериментом в данном случае понимается проверка и уточнение моделей
(программы для ЭВМ) на многочисленных примерах (наблюдениях
над человеком).
6
Таким образом, всякая задача, для которой неизвестен
алгоритм решения, априорно относится к искусственному интеллекту
[50]. К сфере искусственного интеллекта относятся те весьма
различные области, в которых мы действуем, не имея абсолютно
точного метода решения проблемы. Некоторые области обладают в
общем двумя характерными особенностями:
• в них используется информация в символьной форме: буквы,
слова, знаки, рисунки;
• в них предполагается наличие выбора; иными словами,
сказать, что не существует алгоритма, это значит констатировать, что
нужно сделать выбор между многими вариантами в условиях
неопределенности; эта свобода действия является существенной
составляющей интеллекта.
Методы и средства искусственного интеллекта
материализуются и доходят до потребителя в виде интеллектуальных технологий,
которые практически инвариантны к той или иной проблемной
области.
Учебные дисциплины «Интеллектуальные (интеллектуализиро-
ванные) информационные системы», «Экспертные системы» и
«Диалоговые информационные системы» являются одними из
самых динамичных дисциплин, поскольку непрерывно появляются
новейшие разработки в различных разделах информатики.
Учебник написан в соответствии с учебными планами
специальностей «Прикладная математика и информатика»,
«Информационные системы в технике и технологиях», «Комплексное
обеспечение информационной безопасности автоматизированных
систем» в Санкт-Петербургском государственном университете водных
коммуникаций.
Глава 1
ИНТЕЛЛЕКТУАЛИЗАЦИЯ ИНФОРМАЦИОННО-
ВЫЧИСЛИТЕЛЬНЫХ ПРОЦЕССОВ
Смена поколений вычислительной техники приравнивается к
очередной научно-технической революции, и это не
преувеличение. С появлением нового поколения ЭВМ не только стал
решаться принципиально новый класс задач во всех отраслях науки и
техники, но и существенно расширяются возможности при решении
прежних традиционных задач на новом, более качественном, уровне.
Более высокий качественный уровень в решении задач
предполагает, прежде всего, обеспечение необходимой и достаточной
интеллектуальной поддержкой. Интеллектуализация
информационно-вычислительных систем (ИВС) имеет в виду использование не
только нового поколения инструментальных средств, но и нового
поколения математического, алгоритмического и программного
обеспечения.
Информационно-вычислительные системы с интеллектуальной
поддержкой, как правило, применяются для решения сложных
задач, где логическая (смысловая) обработка информации
превалирует над вычислительной. Примерами подобных задач являются:
понимание и синтез текстов на естественном языке (ЕЯ);
понимание и синтез речи;
анализ визуальной информации;
управление роботами;
анализ ситуаций и принятие решений и т.д.
В последние десятилетия подобные системы получили
значительное распространение в мире.
1.1. Определения и классификации в теории
интеллектуализированных систем
Прежде всего уточним, как будем называть системы с
элементами искусственного интеллекта и что понимать под
«интеллектуальной системой» и «интеллектуализированной системой».
8
Определение 1.1. Интеллектуальная система — это
информационно-вычислительная система с интеллектуальной поддержкой при
решении задач без участия оператора (лица, принимающего
решение -ЛПР).
Определение 1.2. Интеллектуализированная система — это ИВС
с интеллектуальной поддержкой при решении задач с участием
оператора — ЛПР.
Определение 1.3. Система с интеллектуальной поддержкой —
система, способная самостоятельно принимать решения.
Под способностью системы самостоятельно принимать
решение необходимо понимать способность системы получать и
анализировать информацию, понимать ее и делать новые выводы
(пополняя ее), формулировать заключения, т.е. «мыслить», помогая
естественному интеллекту — человеку, который, в свою очередь,
корректируя, «улучшает» принятое интегрированное решение.
Здесь следует оговорить, что существуют автоматы или просто
механическое или электронное реле, которые реагируют на
наличие или отсутствие сигнала или при контроле параметров
работают по принципу «годен — негоден». Это тоже принятие решения,
однако отнесем их к ИВС с низким уровнем
«интеллектуализации».
В связи с этим под интеллектуализированной системой (ИнС)
будем понимать систему, способную принимать решение в условиях:
а) необходимости обрабатывать и анализировать большой
массив информационной базы данных;
б) ограниченной информации;
в) неопределенности;
г) многомерного пространства;
д) необходимости распознавать ситуацию (образы, сцены и
т.д.);
е) различных стадий жизненного цикла объектов
(процессов) — проектирования, производства, эксплуатации;
ж) динамических, эволюцйонизирующих, нестационарных
фактов, влияющих на решение задачи;
з) формализации и представления знаний;
и) адаптации, самообучения, самоорганизации и т.д.
Таким образом, если ИВС имеет необходимую математическую,
алгоритмическую, программную и инструментальную поддержку в
принятии решения в перечисленных условиях, то будем считать,
что она имеет интеллектуальную поддержку при решении
широкого класса разнообразных задач.
9
Иными словами, можно формально записать:
ИнС = <МО, АО, ПО, ИО>|(а, в,.... „),
где МО, АО, ПО, ИО — соответственно математическое,
алгоритмическое, программное и инструментальное обеспечение;
Обозначает при условии.
Все существующие ИнС можно разбить на два класса: общего
назначения и специализированные. К ИнС общего назначения
отнесены те, которые не только исполняют заданные процедуры; но на
основе метапроцедур поиска генерируют и исполняют процедуры
решения новых конкретных задач. Технология использования
таких систем состоит в следующем. Пользователь-оператор (эксперт)
формирует знания (данные и правила), описывающие выбранное
приложение (прикладные задачи, предметную область). Затем на
основании этих знаний, заданной цели и исходных данных
метапроцедуры системы генерируют и исполняют процедуру решения
конкретной задачи.
Данную технологию называют технологией систем, основанных
на знании, или технологией инженерии знаний (рис. 1.1.)
К специализированным ИнС отнесены те, которые выполняют
решение фиксированного набора задач, предопределенного при
Эксперты, вторичные источники
информации (книги, отчеты и т.д.)
Знания, описывающие предметную
область
Заданная цель [
!
Метапроцедуру
1
Исходные
_ данные
| | Задачи 3
/ | Зал
Генерация и
исполнение
процедуры
решения
задачи 1
\
[ачи 2
Рис. 1.1. Технология использования ИнС общего назначения
(инженерия знаний)
проектировании системы. Для использования таких систем
требуется наполнить их данными, соответствующими выбранному
приложению (прикладным задачам, предметной области).
До недавнего времени при разработке специализированных
ИнС использовалась технология традиционного (процедурного)
программирования, что позволяет обеспечить их высокую
эффективность (рис. 1.2) [43J.
Однако эта технология существенно ограничивала способность
ИнС к изменению их поведения при изменяющемся окружении,
что крайне важно при решении многих интеллектуальных задач. В
связи с этим в последнее время для устранения этого недостатка
отдельные виды ИнС (системы речевого общения, обработки
изображений и т.д.) стали разрабатывать, используя технологию
инженерии знаний, в виде экспертных систем (ЭС). Примерами
специализированных ИнС являются, например, интеллектуальные
диалоговые системы, а также прикладные ЭС.
Так как терминология в области разработки ИнС находится на
стадии формирования, определим основные термины следующим
образом [1, 28, 40, 43].
Предметная область — объектно-ориентированным образом
выделенная и формально описанная область человеческой
деятельности (множество сущностей, описывающих область исследования
или экспертизы).
Проблемная область — предметная область плюс совокупность
решаемых в ней задач.
Неформализованные задачи — задачи, которые обладают одной
или несколькими из следующих характеристик:
Процедурное
программирование задачи
1
Исходные
данные
Процедурное
программирование задачи
2
Исходные
данные
Процедурное
программирование задачи
N
Исходные
данные
Рис. 1.2. Традиционный подход к разработке специализированных ИнС
(с использованием процедурного программирования)
11
1) они не могут быть заданы в числовой форме, т.е. задаются в
качественном виде или в терминах теории нечетких множеств;
2) цели не могут быть выражены в терминах точно
определенной целевой функции;
3) не существует алгоритмического решения задач;
4) алгоритмическое решение существует, но его нельзя
использовать из-за ограниченности ресурсов (время, память).
Экспертная система (система, основанная на знаниях, — СОЗ) —
сложный программный комплекс, аккумулирующий в формальном
виде знания специалистов в конкретных предметных областях.
Пользователь {конечный пользователь) — лицо, для которого
предназначена система.
Инженер по знаниям (когнитолог, инженер-интерпретатор) —
специалист по ИИ, выступающий в роли промежуточного буфера
между экспертом и базой знаний.
Эксперт — высококвалифицированный специалист,
согласившийся поделиться опытом в рассматриваемой предметной области.
Интерфейс пользователя — комплекс программ, реализующих
диалог пользователям с ИнС на всех стадиях функционирования ИнС.
База знаний (БЗ) — ядро ИнС, совокупность знаний
предметной области, записанная на машинный носитель на языке
представления знаний (обычно приближенном к естественному).
Решатель (машина логического вывода, дедуктивная машина,
интерпретатор) — программа, моделирующая ход рассуждений
эксперта на основании знаний, имеющихся в БЗ.
Подсистема объяснений — программа, позволяющая
пользователю получать ответы на вопросы: как была получена та или иная
рекомендация и почему система приняла такое решение?
Технология синтеза ЭС — технология создания на основе
знаний экспертов систем, решающих неформализованные задачи в
слабоструктурированных предметных областях.
Как показал почти 20-летний опыт интенсивной разработки
ИнС для различных приложений, существует порядка 8—10
типовых задач (табл. 1.1), для которых использование технологии ИнС
приносит значительные результаты [1—3, 40, 43].
В общем случае все ИнС можно подразделить на решающие
задачи анализа и на решающие задачи синтеза. Примерами задач
анализа являются задачи интерпретации данных и диагностики.
Примерами задач синтеза являются задачи проектирования и
планирования. Комбинированные задачи — задачи обучения,
мониторинга, управления.
12
Класс ИнС объединяет сегодня несколько тысяч различных
систем, которые можно классифицировать по различным
критериям, предлагаемым отдельными авторами [1—5, 8—12, 16—18,
26-28, 31-35, 37-43].
Таблица 1.1. Типы задач, решаемых ИнС
[ Тип задачи
[ Интерпретация
1 Диагностика
| Слежение (мониторинг)
Прогнозирование
Планирование
Проектирование
Отладка, ремонт
Обучение
Управление
Определение (адресуемые задачи)
Процесс определения смысла данных (построение
описаний по наблюдаемым данным)
Процесс обнаружения неисправностей (в технике и в
живых организмах)
Непрерывная интерпретация данных в реальном
масштабе времени и сигнализация о выходах параметров за
допустимые пределы
Предсказание будущих событий на базе моделей
прошлого и настоящего (вывод вероятных следствий из
заданных ситуаций)
Конструирование плана, т.е. программы действий
Построение спецификаций на создание объектов с
заранее определенными свойствами
Выработка рекомендаций по устранению неисправностей
Диагностика, интерпретация, планирование,
проектирование
Интерпретация, прогноз, планирование,
моделирование, оптимизация выработанных решений, мониторинг |
На рис. 1.3—1.9 представлены наиболее распространенные
типы классификаций ИнС.
Существуют и другие классификации ИнС:
по предметной области (медицина, геология, авиация и т.д.);
ИнС
[_
Прототипы
Демонстрационный
E0 — 100 правил, 3 мес.)
Исследовательский
B00—500 правил, 1-2 года)
Действующий
E00 — 1000 правил, 2-3 года)
Промышленные системы E00 — 1500 правил, 2-4 года)
Коммерческие системы A000 — 3000 правил, 3-5 лет)
, Рис. 1.3. Классификация ИнС по степени реализации
(стадиям существования)
13
ИнС
Поверхностные (используют знания в виде
правил типа "условие — действие")
I I Глубинные (используют более сложные модели
представления знаний)
Рис. 1.4. Классификация ИнС по степени сложности
по моделям представления данных (продукционные,
фреймовые и др.);
по типу вывода (прямого или обратного);
по типу ЭВМ (малые, средние, большие).
Следует отметить, что подавляющее число ИнС, используемых
для решения практически значимых задач, являются
интегрированными, т.е. состоящими из традиционной ИнС и других
программных систем (см. рис. 1.5), с которыми ИнС взаимодействуют в
процессе работы (СУБД, пакеты прикладных программ (ППП),
электронные таблицы и т.д.).
Базовой проблемой в таких ИнС является проблема
интеграции, которую можно рассматривать с точки зрения следующих
аспектов [38]:
интеграция в ИнС различных компонентов, определяющих
специфику функционирования системы в целом (ИнС с поверхностной
и глубинной интеграцией компонентов);
интеграция (функциональная, структурная, концептуальная),
связанная с основными проектными решениями и концепциями;
ИнС Н
Традиционные (автономные)
(использование только методов ИнС)
Интегрированные
Объединение ИнС с САПР
Объединение ИнС с СУБД
Объединение ИнС с ППП
графического и расчетного
характера
Рис. 1.5. Классификация ИнС по степени интеграции с другими программными
системами (САПР — система автоматизированного проектирования; СУБД —
система управления базами данных; ППП — пакет прикладных программ)
14
ИнС
1
Простые
Сложные
Поверхностные ИнС
Традиционные ИнС
Выполняются на ПЭВМ
Коммерческая стоимость
100-25000 долл.
Стоимость разработки
50000-500000 долл.
Время разработки
3-12 мес.
Количество правил
200-1000
Глубинные ИнС
Интегрированные ИнС
Выполняются на
символьных ЭВМ, рабочих
станциях, мощных
универсальных ЭВМ
Стоимость разработки
5-10 млн долл.
Время разработки 1-5 лет
Количество правил
1500-10000
Рис. 1.6. Классификация ИнС по сложности и типу ЭВМ
интеграция (информационная, программная, техническая),
связанная с используемыми технологиями программирования,
инструментальными средствами и платформами.
Очевидно, что, используя данный принцип, можно вводить и
более детальную классификацию интегрированных ИнС [40—43].
ИнС
Статические
если исходная информация
не меняется в процессе
решения задачи
если задача не изменяет исходных
данных в процессе
ее решения
Динамические (в противном случае)
Рис. 1.7. Классификация ИнС по типу области экспертизы
(типу предметной области) \
15
I поколение
Простые ИнС
11 поколение
Сложные
статические
ИнС
III поколение
Сложные
динамические
ИнС
Рис. 1.8. Классификация ИнС по эволюции развития
Обработка
данных
на основе
знаний
Интерпретация
данных
Диагностика
Мониторинг
ИнС
Формирование данных
на основе
знаний
Обработка и
формирование данных
и знаний
Прогнозирование
Планирование
Проектирование
Обучение
Управление
Обработка и
формирование знаний на
основе
метазнаний
Оболочки
(«пустые»
системы)
Инструментальные
системы и средства
для
автоматизации
разработки ИнС
Рис. 1.9. Классификация ИнС по типам решаемых задач
1.2. Проблемная область искусственного
интеллекта
В настоящее время в области искусственного интеллекта
выделено шесть основных проблем (направлений развития) [8].
1. Представление знаний. В рамках этой проблемы решаются
задачи, связанные с формализацией и представлением знаний в
памяти ИнС. Для этого разрабатываются специальные модели
представления знаний и языки для описания знаний, вьщеляются различные
типы знаний. Изучаются источники, из которых ИнС может черпать
знания, и создаются процедуры и приемы, с помощью которых
возможно приобретение зцаний для ИнС. Проблема представления
знаний для ИнС чрезвычайно актуальна, так как ИнС — это систе-
16
Проблемная
область
ИсТ]
Ист2
Истп
=>
Формализация
знаний
1
Модели
представления
знаний
~*i
Представление
знаний
1 ¦•
Языки
описания
[ знаний
Типы
знаний
Рис. 1.10. Схема описания проблемы представления знаний
(Ист — источники знаний)
ма, функционирование которой опирается на знания о проблемной
области, которые хранятся в ее памяти (рис. 1.10).
2. Манипулирование знаниями. Для того чтобы знаниями можно
было пользоваться при решении задач, ИнС должна уметь:
1) оперировать знаниями;
2) пополнять знания (с помощью разрабатываемых способов на
основе неполного описания знаний);
3) классифицировать хранящиеся в системе знания;
4) обобщать по тем или иным разработанным процедурам
знания;
5) формировать на основе знаний абстрактные понятия;
6) осуществлять достоверный и правдоподобный вывод на
основе имеющихся знаний с помощью создаваемых методов;
7) пользоваться моделями рассуждений, имитирующими
особенности человеческих рассуждений.
Манипулирование знаниями и представление знаний — эти два
направления тесно связаны друг с другом. Создающаяся в
настоящее время теория баз знаний включает исследования, относящиеся
как к первому, так и ко второму направлению (рис. 1.11).
3. Общение. В круг задач этого направления входят:
а) проблема понимания связных текстов;
Теория баз
знаний
Манипулирование
знаниями
Представление
знаний
Рис. 1.11. Связь проблемы манипулирования дгтппми
представления знанщй
ПРОбЖЛГОй
2 — 3466
ц
б) понимание речи и синтез речи;
в) теория моделей коммуникации между человеком и ИнС;
г) задачи формирования объяснений действий ИнС, которые
она должна уметь порождать по просьбе человека;
д) комплекс задач, связанных с интеграцией в единый
внутренний образ сообщений различной модальности (речевых, текстовых,
зрительных и т.п.), полученных в процессе коммуникации.
На основе исследований в этом направлейии формируются
методы построения лингвистических процессоров (ЛП),
вопросно-ответных систем (ВОС), диалоговых систем (ДС) и других ИнС,
целью которых является обеспечение комфортных условий для
общения человека с ИнС (рис. 1.12).
4. Восприятие. Это направление включает (рис. 1.13):
• проблемы анализа трехмерных сцен;
• разработку методов представления информации о зрительных
образах в базе знаний;
• создание методов перехода от зрительских сцен к их
текстовому описанию и методов обработки перехода;
• разработку процедур когнитивной графики (КГ);
• создание средств для порождения зрительских сцен на основе
внутренних представлений в ИнС.
Существуют большие возможности в повышении уровня
интеллектуальности ИнС за счет обработки зрительной (образной)
информации и соотнесения ее с обработкой символьной (текстовой)
информации.
5. Обучение. Основная черта ИнС — это способность к
обучению, т.е. решение задач, с которыми они ранее не встречались. Для
этого необходимо:
1) создать методы формализации условий задачи по описанию
проблемной ситуации или по наблюдению за этой ситуацией;
лп
Интеллектуальная
поддержка принятия
решений
1
ВОС
дс
Другие ИнС
Рис. 1.12. Схема интеллектуальной поддержки принятия решений
при общении человека с ИнС
18
БЗ
Методы
обработки и
перехода к
тексту
КГ
2) научиться переходу от известного решения
частных задач (примеров) к решению общей задачи
(синтез);
3) создать приемы декомпозиции исходной для
ИнС задачи на более мелкие так, чтобы они для
ИнС оказались известными (анализ);
4) разработать нормативные и декларативные
модели самого процесса обучения;
5) создать теорию подражательного поведения.
И такой перечень задач можно продолжить.
6. Поведение. Так как ИнС должны действовать
в некоторой окружающей среде, то необходимо
разработать специальные поведенческие процедуры
(бихевиористические модели), которые позволили
бы им адекватно взаимодействовать с окружающей
средой, другими ИнС и людьми. Для достижения
такого взаимодействия необходимо вести
исследования в ряде направлений и создать модели
целесообразного поведения, нормативного поведения,
ситуационного поведения, специальные методы
многоуровневого планирования и коррекции планов в
динамических ситуациях (рис. 1.14).
Схема основных проблем и направлений
развития представлена на рис. 1.15.
Как было отмечено выше, создание ИнС имеет
существенные отличия от разработки обычного
программного продукта, а слепое копирование
методологий, принятых в традиционном
программировании, чаще всего приводит к отрицательному
результату.
Самым первым вопросом, который необходимо
решать всякий раз перед началом разработки
конкретной ИнС, является вопрос: а следует ли вообще разрабатывать
ИнС для данного приложения? Насколько оправдано будет
использование методов и средств ИнС для данной задачи и даст ли
это ощутимый эффект?
Эти вопросы, возникающие перед заказчиком (конечным
пользователем) и инженером по знаниям, необходимо решать на этапе
предварительного системного анализа конкретной предметной
области (ПО).
Как показывает опыт исследователей, связанный с разработкой
значительного числа ИнС, системный анализ ПО (совокупности
Рис. 1.13. Схема
восприятия и
воспроизведения
трехмерных
зрительских сцен
2*
19
Поведенческие
(бихевиористические)
модели
Модели
целесообразного
поведения
Модели
нормативного
поведения
Модели
ситуационного
поведения
Модели
многоуровнего
планирования
Модели
коррекции
планов в
динамических ситуациях
Проблемно-предметная область
(окружающая среда)
ПРЕДСТАВЛЕНИЕ ЗНАНИЙ
I Г
Рис. 1.14. Классификация поведенческих моделей
решаемых задач) на предмет применимости/неприменимости
технологии ИнС заключается в общем случае в проведении трех видов
исследований, которые могут быть оформлены в виде
последовательных (хотя и необязательных) этапов [18, 29, 35, 38].
1. Проведение на основе системы выбранных критериев
анализа на уместность (обоснованность) разработки ИнС для
данной ПО.
2. Проведение на основе системы выбранных критериев
анализа на оправданность разработки ИнС
для данной ПО.
3. Проведение на основе системы
выбранных критериев анализа на
возможность разработки ИнС для
данной ПО.
В зависимости от «да» или «нет»
по этапам 1—3 можно сделать общее
заключение о применимости или
неприменимости технологии ИнС для
анализируемой ПО.
В настоящее время уже
сформировался набор критериев (необходимых
требований), которые могут быть взяты
за основу при проведении системного
анализа ПО. Используя работы [20, 21,
40] и практический опыт создания ИнС
для широкого класса задач [38, 43],
можно составить схематическое
изображение методики системного анализа
Рис. 1.15. Схема представления nQ ( { ^ СОВОКУПНОСТИ
основных проблем, возникающих 11W VF*1^ А- »> ™ ^ ;„
при создании ИнС критериев 1.1—1.5, 2.1—2.5, 3.1—3.7.
РАБОТА
(МАНИПУЛИРОВАНИЕ)
СО ЗНАНИЯМИ
I
ОБЩЕНИЕ И ВОСПРИЯТИЕ
ЗНАНИЙ
I
МОДЕЛИ ОБУЧЕНИЯ
ПОВЕДЕНЧЕСКИЕ МОДЕЛИ
20
1. Проведение исследования на
уместность (обоснованность) разработки
ИнС данной ПО
1
\
Проверка выполнения следующих
требований
1.1. Решение задачи опирается на
использование операций с символами,
а не с числами (т.е.задача связана не
с расчетом, а с логическими
рассуждениями, анализом, перебором
вариантов).
1.2. Решение задачи опирается на
использование эвристики, задача не
имеет четкого алгоритмического решения.
1.3. Задача не слишком проста (задача
считается простой, если ее решение
не требует больших усилий или даже
обходится без привлечения ЭВМ).
1.4. Задача представляет большой
интерес для практики (практический
интерес).
1.5. Задача не является слишком
крупной для решения ЭВМ (например, это
комбинаторная задача и т.д.).
2. Проведение исследования на
оправданность разработки ИнС для данной
по
h
1
Проверка выполнения хотя бы одного
требования
2.1. Решение задачи обещает приносить
высокий доход.
2.2. Показано, что существует
опасность постепенного утрачивания опыта
решения задач для данной области.
2.3. Экспертов в данной области явно
не достаточно.
2.4. Сходные специалисты нужны во
многих физически удаленных
местах.
2.5. Условия, в которых решается
задача, опасны для человека
(т.е.окружение враждебно для человека).
3. Проведение исследования на
возможность разработки ИнС для
данной ПО
1
Проверка выполнения следующих
требований
3.1. Задача не имеет общедоступных
знаний, «здравого смысла» (т.е.опыта
в решении задач, который пока не
удается выделить).
3.2. Задача требует только
интеллектуальных навыков (решение задачи
требует только рассуждений, а не
действий).
3.3. Эксперты могут описать
(вербализовать) применяемые ими методы
работы и объяснить их.
3.4. В природе существуют люди —
признанные специалисты по решению
задач такого рода.
3.5. Эксперты единодушны в
применяемых ими решениях (сходятся в оценке
предлагаемого решения).
3.6. Задача не слишком трудна
(т.е.эксперту не нужны недели или месяцы для
ее решения).
3 7. Сама решаемая задача достаточно
понятна (т.е. не требует разработки
новых методов ее решения).
Рис. 1.16. Схема системного анализа ПО на применимость технологии ИнС (ЭС)
Следует обратить внимание на то, что для получения
совокупного «да» по исследованиям на «уместность» (обоснованность), а
также на «возможность» разработки ИнС необходимо проверять
все перечисленные критерии, каждый из которых может быть про-
ранжирован или «взвешен» с помощью коэффициентов выбранной
шкалы весов (рангов).
Для получения совокупного «да» по исследованиям на
«оправданность» разработки ИнС достаточно провести проверку
выполнения хотя бы одного из перечисленных критериев.
Эти особенности необходимо учитывать при разработке блока
«Системный анализ ПО» будущей системы (назовем ее для
общности — КОНСУЛЬТАНТ). Специального обсуждения типа
проектируемой системы КОНСУЛЬТАНТ не будет, поскольку это право
каждого студента решать, что ему лучше разработать — некоторую
традиционную информационно-поисковую систему с БД или
простейшую ИнС продукционного типа, которая будет выступать в
качестве своеобразной ИнС, предметной областью для которой
является «Проектирование ИнС» или что-то другое.
В качестве типового примера рассмотрим вариант реализации
некоторой гипотетической ИнС, которая осуществляет
консультации, используя знания из БЗ «Системный анализ ПО».
Интересные идеи по созданию системы подобного рода можно найти в
работе [21].
Примеры реализации гипотетической ИнС КОНСУЛЬТАНТ [43].
Используется простейший интерфейс, в ко-
I Интерфейс I Т0Р0М КОНСУЛЬТАНТ задает вопросы пользо-
I 1 вателю, указывая в форме меню возможные
ответы.
Пример 1. Хотите узнать с помощью КОНСУЛЬТАНТА, нужно
ли Вам создавать ИнС для решения Вашей задачи?
Да
Нет
Пример 2. Оправдана ли разработка ИнС в данном случае (умеет-
на, возможна)?
Да
Нет
Не знаю
22
При необходимости пользователь должен иметь возможность
получить объяснения на заданный ему вопрос.
Так, для первого примера он увидит на экране следующий текст:
ИнС КОНСУЛЬТАНТ сама представляет собой ИнС, предметной областью
для которой является область «Проектирование ИнС».
Подробно об ИнС можно прочитать в литературе:
1. Уотерман Д. Руководство по ЭС. — М.: Мир, 1989.
2. Хейес-Рот Ф., Уотерман Д., Ленат Д. Построение ЭС. — М.: Мир, 1987.
3. Попов Э.В. Экспертные системы. — М.: Радио и связь, 1990.
4. Справочник по искусственному интеллекту: В 3 кн. — М.: Радио и связь,
1990.
Оправданность разработки ИнС связана с выполнением ряда требований, о
которых Вас запросит система КОНСУЛЬТАНТ, если сейчас Вы ответите «Не знаю».
Во втором примере на экране может быть следующий текст:
Точно так же пользователь с помощью другой контрольной
клавиши может потребовать объяснения, почему ему был задан
вопрос и т.д.
База знаний
Для описания БЗ в системе
КОНСУЛЬТАНТ используется продукционная модель
представления знаний, т.е. БЗ будет включать
правила вида: «ЕСЛИ ... , ТО ... ».
Для иллюстрации фрагмента БЗ используется ЛИСПО-подоб-
ная запись в виде списков, например двухуровневых, где самый
первый список представляет собой часть «ТО ...» правила, а
остальные списки — набор условий, в совокупности образующих часть
«ЕСЛИ ...».
Приведем примеры четырех самых общих правил БЗ
«Системный анализ ПО»:
((«ИнС__применима» «Да»)
(«ИнС_уместна» «Да») («ИнС_оправдана» «Да»)
(«ИнС__возможна» «Да»))
((«ИнС_применима» «Нет») («ИнС_уместна» «Нет»))
((«ИнС^применима»/ «Нет») («ИнС_оправдана» «Нет»))
((«ИнС_применима* «Нет») («ИнС_возможна» «Нет»))
Приведенные четыре правила гарантируют, что система
КОНСУЛЬТАНТ подтвердит применимость технологии ИнС в том
и только том случае, когда создание ИнС является и уместным, и
оправданным, и возможным.
23
Машина вывода
Машина вывода в системе
КОНСУЛЬТАНТ очень проста.
Рассуждение в ней ведется «от цели», так что в
первую очередь в БЗ ищется правило, в правой части которого
содержится исходная цель, например («ИнС_применима» «Да»). Это
приводит к тому, что появляются новые цели (т.е. подцели):
(«ИнС_уместна» «Да»), («ИнС_оправдана» «Да»),
(«ИнС_возможна» «Да»).
Кроме правил в БЗ необходимо
содержать информацию об «атрибутах», где
дается их развернутое описание, которое
будет затем использовано при построении
объяснения, почему был задан вопрос — заранее запасенный
вопрос к пользователю, позволяющий выяснить значение атрибута, а
также подробное объяснение смысла задаваемого вопроса, которое
будет выдано на экран, если пользователю непонятен сам вопрос.
Блок объяснений
1.3. Представление данных и знаний
Всегда вызывает интерес соотношение между данными и
знаниями, в особенности представления (способы формализации) тех
и других, модели представления данных и знаний, поскольку
данные и знания — это форма представления информации в ЭВМ
(рис. 1.17).
Информация, с которой имеет дело ЭВМ, разделяется на
процедурную и декларативную. Процедурная информация овеществлена в
программах, которые выполняются в процессе решения задач,
декларативная — в данных, с которыми эти программы работают (рис.
1.18).
Данные
Знания
Способы
1 формализации
1
1
Модели данных
Способы
формализации
1
'
Модели знаний
Рис. 1.17. Обобщенная схема представления данных и знаний
24
Информация в ЭВМ
Процедурная
информация
Программное
обеспечение
Декларативная
информация
БД
СУБД
Концепция знаний
Рис. 1.18. Классификация информации в ЭВМ
Стандартной формой представления информации в ЭВМ
является машинное слово, состоящее из определенного для
данного типа ЭВМ числа двоичных разрядов — битов. В ряде случаев
машинные слова разбиваются на группы по восемь двоичных
разрядов, которые называются байтами. Одинаковое число
разрядов в машинных словах для команд и данных позволяет
рассматривать их в ЭВМ в качестве одинаковых информационных
единиц (ИЕ) и выполнять операции над командами, как над
данными. Содержимое памяти образует информационную базу (рис.
1.19).
Для удобства сравнения данных и знаний можно выделить
основные формы (уровни) существования знаний и данных. Как
представлено в табл. 1.2, у данных и знаний много общего. Однако
знания имеют более сложную структуру, и переход от данных к
знаниям является закономерным следствием развития и
усложнения информационных структур, обрабатываемых на ЭВМ. Поэтому
Информация
в ЭВМ
Машинные
слова
Биты
байты
^
Машинные
слова
команд
Машинные
слова
данных
мационная
единица
Память
ЭВМ
мационная база
Рис. 1.19. Представление информации в ЭВМ
25
знания иногда называют хорошо структурированными данными,
метаданными, данными о данных и т.д. [43].
Таблица 1.2. Сравнение структур знаний и данных
Знания (Зн)
3hi — знания в памяти человека
Знг — материализованные знания
(учебники, справочники и т.д.)
Знз — поле знаний (структурированное
полуформализованное описание 3hi и
Зн2)
3н4 — знания на языках представления
знаний (формализация 3н3)
Зн5 — база знаний в ЭВМ (на
машинных носителях информации)
Традиционно выделяют три уровня:
3hi (знания) —> 3н3 (поле знаний) —» 3hs (БЗ)
Данные (Д)
Д1 — результат наблюдений над
объектами или данными в памяти человека
Д2 — фиксация данных на
материальном носителе (таблицы, графики и т.д.)
Дз — модель данных (некоторая схема
описания, связывающая несколько
объектов)
Да — данные на языке описания данных
Д5 — база данных на машинных
носителях информации
Традиционно выделяют три уровня:
Д1 (внешний) -»Дз (логический) —> Д5
(физический) 1
Сравнение данных и знаний можно проиллюстрировать
сравнением ИнС и обычных программных систем.
ИнС существенным образом отличаются от традиционных
программных систем не только наличием БЗ, в которой знания
хранятся и модифицируются в форме, понятной специалистам
предметной области (именно поэтому вопросы разработки БЗ являются
центральными при создании ИнС).
Конечный
пользователь
—»-
Аналитик
—^-
Программист
—^
Оператор
ЭВМ
Обычная
программа
а
Конечный
пользователь
Оператор
Инженер по
знаниям
Аналитик,
программист,
оператор
ЭВМ
ИнС
б
Рис. 1.20. Сравнение двух технологий разработки приложения:
а — классическая технология разработки программного обеспечения; б— технология
разработки программного обеспечения с использованием ИнС
26
Дело в том, что стиль программирования ИнС непохож на
стиль традиционного программирования с использованием
обычных алгоритмических языков. На рис. 1.20 и 1.21 и в табл. 1.3
показаны характерные различия между ИнС и обычными
программными системами [43].
Таблица 1.3. Сравнение параметров традиционной программы и ИнС
1 Тип
системы
ИнС
[Традиционная
программа
Характерные параметры
Тип
обработки
Символьная
Числовая
Методы
решения задач
Эвристический
поиск
Алгоритмы
Задание
шагов решения
Неявное
Точное
Искомые
решения
Удовлетворительные
Оптимальные
Управление
и данные
Перемешаны
Разделены
Модификация
Частые
Редкие
Следует добавить, что кроме общих выделенных особенностей
разработки ИнС и традиционных программных систем каждый
тип ИнС обладает, как правило, своим собственным стилем
программирования, что затрудняет его использование для других
ИнС.
Тем не менее в качестве основного вывода по сравнительной
характеристике ИнС и традиционных программных систем можно
отметить, что обычное для классических систем соотношение
ДАННЫЕ + АЛГОРИТМЫ = ПРОГРАММА
заменяется на новую архитектуру, основу которой составляет БЗ и
интерпретатор БЗ (машина логического вывода) [5], т.е.
ЗНАНИЯ + ВЫВОДЫ = СИСТЕМА.
Программа
i
i
Входные данные
а
База знаний
j
1
Интерпретатор БЗ
>
i
Входные данные
и
Рис. 1.21. Различие структур обычной программы и ИнС:
а — обычная программа; б— программа ИИ (ИнС)
27
1.4. Данные
Параллельно с развитием структуры ЭВМ происходило
развитие информационных структур для представления данных.
Появились способы описания данных в виде: векторов, матриц,
списочных структур, иерархических структур, структур, создаваемых
программистом (абстрактных типов данных).
В настоящее время в языках программирования высокого
уровня используются абстрактные типы данных, структура которых
создается программистом. Появление баз данных (БД)
знаменовало собой еще один шаг по пути организации работы с
декларативной информацией.
По мере развития исследований в области ИнС возникла
концепция знаний, которая объединила в себе многие черты
процедурной и декларативной информации.
Сегодня термины «база данных», «информационная
интеллектуальная система», как и многие другие термины информатики,
стали широко употребительными. Причина этого — всеобщее
осознание (социальная потребность) необходимости интенсивного
внедрения ЭВМ и других средств автоматизированной обработки
информации в самые различные области деятельности современного
общества. Начало последней четверти нынешнего столетия по
праву можно назвать началом эры новой информационной
технологии — технологии, поддерживаемой автоматизированными
информационными ИнС. Актуальность проблематики ИнС и лежащих в
их основе БД определяется не только социальной потребностью,
но и научно-технической возможностью решения классов задач,
связанных с удовлетворением информационных нужд различных
категорий пользователей (включая как человека, так и
программно-управляемое устройство). Такая возможность возникла
(примерно на рубеже 70-х годов) благодаря значительным достижениям
в области технического и программного обеспечения
вычислительных систем.
База данных как естественнонаучное понятие характеризуется
двумя основными аспектами: информационным и манипуляцион-
ным. Первый аспект отражает такую структуризацию данных,
которая является наиболее подходящей для обеспечения
информационных потребностей, возникающих в предметной области
(ПО). С каждой ПО ассоциируется совокупность
«информационных объектов», связей между ними (например, «поставщики»,
«номенклатура выпускаемых изделий», «потребители» —
категории информационных объектов, а «поставки» — тип отношений,
28
имеющих место между этими объектами), а также задач их
обработки. Манипуляционный аспект БД касается смысла тех
действий над структурами данных, с помощью которых
осуществляются выборка из них различных компонентов, добавление новых,
удаление и обновление устаревших компонентов структур
данных, а также их преобразования.
Под системой управления базами данных (СУБД) понимается
комплекс средств (языковых, программных и, возможно,
аппаратных), поддерживающих определенный тип БД. Главное
назначение СУБД, с точки зрения пользователей, состоит в обеспечении
их инструментарием, позволяющим оперировать данными в
абстрактных терминах (именах и/или характеристиках
информационных объектов), не связанных со способами хранения данных в
памяти ЭВМ. Следует заметить, что средств СУБД может, вообще
говоря, не хватать для решения всех задач той или иной ПО.
Поэтому на практике приходится адаптировать (дополнять,
настраивать) средства СУБД для обеспечения требуемых возможностей.
Системы, получаемые путем адаптации СУБД к данной ПО,
относятся к ИнС.
Жизнеспособная ИнС, т. е. способная поддерживать модель БД
с учетом динамики развития ПО, по необходимости должна в
качестве своего ядра содержать СУБД. Выработанная на сегодняшний
день методология проектирования ИнС (с точки зрения БД)
включает четыре основные задачи:
1) системный анализ ПО, спецификацию информационных
объектов и связей между ними (в результате вырабатывается так
называемая концептуальная, или семантическая, модель ПО);
2) построение модели БД, обеспечивающей адекватное
представление концептуальной модели ПО;
3) разработку СУБД, поддерживающей выбранную модель БД;
4) функциональное расширение (посредством некоторой
системы программирования) СУБД с целью обеспечения возможностей
решения требуемого класса задач, т.е. задач обработки данных,
характерных для данной ПО.
Эти задачи и связи между ними естественно рассматривать как
конкретизацию триады «модель — алгоритм — программа»
применительно к проблематике ИнС.
На практике в каждом рассматриваемом случае пути решения
этих задач выбираются исходя из специфики ПО, функциональных
возможностей доступных СУБД и вычислительных систем,
допустимых затрат на создание ИнС и др.
29
Основная масса работ по теоретическим и
теоретико-прикладным исследованиям в области ИнС за весь период ее развития
(начиная с конца 60-х годов) была связана с моделированием БД,
разработкой архитектур СУБД и их языковых средств. Среди вопросов
программной реализации СУБД основное внимание уделялось
разработке способов эффективного размещения данных в памяти
ЭВМ.
Рассмотрим кратко основные направления исследований в
области БД.
На раннем этапе (примерно до 1975 г.) развития этой области
наиболее характерными являются исследования способов
структуризации данных, не зависящих от специфики организации среды
хранения (памяти ЭВМ). Разработанные способы структуризации
данных получили название моделей данных. Каждая такая модель
характеризуется определенными средствами и методами
структурирования данных. Наиболее известны, как уже упоминалось,
иерархическая, сетевая и реляционная модели данных [75].
Реляционная модель (разработанная Э. Ф. Коддом в 1970 г.)
выгодно отличается от всех других моделей данных за счет
простоты, математической строгости и практической полезности.
Большинство публикаций по БД было так или иначе связано с
реляционным подходом. Основной прагматической направленностью
этого подхода было построение средств структурирования данных и
манипулирования ими, которые позволяли бы решать задачи
проектирования СУБД, языков манипулирования данными,
отвлекаясь при этом от всего того, что связано с организацией среды
хранения данных, адресации и доступа к ним. Структуры данных в
этой модели уточняются через конечные отношения (или реляции,
отсюда и название «реляционные» БД), заданные на доменах
(множествах) первичных данных. Важным моментом реляционного
подхода явилась также реляционная алгебра, рассматриваемая как
аппарат построения одних структур данных из других, уже ранее
построенных или первоначально заданных. Все это послужило
толчком к разработке новых и интересных, с практической точки
зрения, языков манипулирования данными и СУБД.
На втором этапе (примерно 1975—1980 гг.) развития теории БД
акценты заметно смещаются в сторону анализа прагматико-смы-
словых интерпретаций данных. Практика показала, что «хорошая»
ИнС должна обеспечивать возможности манипулирования и
обработки данных в соответствии с пониманием (пользователями) их
смысла. Известные на это время модели данных оказались
неадекватными с точки зрения информационного представления в БД
зо
знаний о фрагменте действительности — предметной области ИнС.
Все это привело к формированию нового направления
исследований, ориентированного на вскрытие структур и закономерностей
ПО. Для этого периода характерно построение моделей данных
путем расширения иерархической, сетевой и реляционной моделей за
счет включения элементов «смысловой интерпретации»
информационных объектов ПО, связей и зависимостей между ними.
Однако наиболее удачной в смысле математической строгости и
прагматической полноты оказалась расширенная реляционная модель,
предложенная Э. Ф. Коддом в 1979 г. Эта модель в отличие от
других интересна еще тем, что при ее разработке была
удовлетворительно решена задача уточнения как информационного, так и ма-
нипуляционного аспектов БД. Важность манипуляционного
аспекта автор этой модели БД особенно подчеркивает тем, что
структуры данных без способов и правил манипулирования ими похожи
на анатомию без физиологии.
В этот период были также получены интересные результаты,
связанные с различными типами зависимостей между
компонентами структур данных в реляционных БД. Такие зависимости,
называемые еще ограничениями целостности БД, играют роль
информационных инвариантов ПО и в связи с этим должны
поддерживаться в БД на протяжении всего периода ее использования.
Однако попытки реализации моделей БД с достаточно богатыми типами
зависимостей натолкнулись на трудности, связанные с
недостаточно глубоко исследованными механизмами их поддержания.
В первой половине 80-х годов внимание исследователей
сконцентрировалось на построении самостоятельных, автономных
моделей ПО и выработке методов отображения их в модели БД. Что
же касается структур данных и средств манипулирования ими, то
они в данном случае полностью или частично выпали из поля
зрения исследователей. Ввиду большой сложности проблемы
моделирования ПО предложенные языковые средства
моделирования представляют собой, как правило, набор синтаксических
структур без строгой семантической их интерпретации. Поэтому,
как и следовало ожидать, исследования по моделированию ПО не
привели к появлению глубоких результатов в теории БД, хотя и
обеспечили богатый фактологический материал, касающийся
этой проблематики.
В целом проблематика БД и ИнС развивалась по
экстенсиональному пути. Это означает, что основное внимание уделялось
широте охвата вопросов, не придавая особого значения
расстановке акцентов на них, не отделяя главные, носящие принципиальный
31
характер вопросы от второстепенных. Большое количество
публикаций в этой области, разобщенность взглядов авторов,
интуитивная трактовка понятий породили своего рода «терминологический
Вавилон». Все это не могло не сказаться отрицательно на
интенсиональном характере развития этой проблематики. Другими
словами, вопросы построения и исследования основополагающих
концепций БД, познания их глубинной природы затрагивались
слабо. Пожалуй, только в рамках реляционного подхода был сделан
определенный (хотя и довольно локальный) шаг в сторону интен-
сионализации проблематики БД. Следует отметить, что такое
положение в области БД не делает ее каким-то исключением. Любая
достаточно емкая и комплексно трудная научная область в
изначальном своем развитии характеризуется тем, что
экстенсиональный этап будет предшествовать интенсиональному.
В настоящее время исследования в области БД заметно
смещаются в сторону алгебро-логического моделирования БД,
направленного на адекватное (полное) уточнение на разных уровнях
абстракции информационных структур и средств манипулирования их
компонентами, а также вскрытие сущности различных типов
знаний (предметно-понятийных, функциональных, логических) о ПО
и способов вывода производных знаний на основе заданных
базовых знаний.
Эти исследования, как нам представляется, позволят теснее
связать проблематику БД, языков манипулирования данными, с
одной стороны, и проблематику современных языков
программирования и поддерживающих их систем — с другой. Заметно стала
сближаться область баз данных (знаний) с областью
искусственного интеллекта. Это очень важно, так как одним из основных
требований, предъявляемых к современным ИнС (и особенно к ИнС
типа экспертных систем), является высокий уровень их
«интеллектуальности» во взаимодействии с пользователем.
Однако успехи указанных исследований, глубина получаемых
результатов, полезность разрабатываемых проектов ИнС во многом
зависят от того, насколько удачными и точными будут разработаны
сами основания теории ИнС. Это, прежде всего, система таких
понятий (построенных на теоретико-множественной основе), на
которых возможно развитие самой теории БД как вглубь, так и
вширь. Выработка оснований теории даст возможность по-новому
переосмыслить накопленные теоретические результаты, богатый
фактологический материал, опыт построения и использования
реальных СУБД, ИнС и на основе всего этого глубже взглянуть на
32
природу баз данных, баз знаний, построить высокопродуктивные
информационные технологии.
После краткого ознакомления с основными направлениями
исследований в области БД перейдем к более подробному
обсуждению вопросов, касающихся концепций структур данных, средств
манипулирования ими и базирующихся на них моделей БД. При
этом основное внимание будет уделено семантическому (как
определяющему) аспекту структур данных и средств их обработки.
Рассмотрим табличные структуры данных и действий над ними, так
как на связанных с ними понятиях основывается изучение
наиболее простых и в то же время очень интересных, с практической
точки зрения, БД — табличных БД. Кроме того, интерес к этому
классу БД вызван еще тем, что он включает ставшие широко
известными реляционные БД.
Табличные структуры данных. Во многих областях человеческой
деятельности используется термин «таблица». При этом в каждом
конкретном случае в него вкладывается свой смысл. Наряду со
смыслом, или сущностью, таблицы обладают теми или иными
формами их представления. Понятие таблицы многоаспектно.
Налицо, по меньшей мере, три аспекта — прагматика, семантика и
синтаксис. Прагматика задает цели рассмотрения таблиц. Исходя
из прагматики, определяется их сущность (семантика).
Синтаксический аспект таблиц связан с построением их форм, наиболее
подходящих для заданного восприятия (здесь может учитываться
ориентация на человека, устройство-автомат и др.). Связь между
этими аспектами таблиц выражается как принцип подчиненности:
синтаксический аспект подчинен семантическому, а последний
зависит от прагматического.
Уточняя сущность таблиц, необходимо выбрать такой уровень
конкретизации, чтобы, с одной стороны, можно было получать
достаточно содержательные результаты, а с другой — такой уровень
абстракции, чтобы не вовлекать в рассмотрение несущественные с
точки зрения решаемых задач детали. Выбор уровня абстракции
зависит от прагматики решаемых задач.
Понятие таблицы у нас будет выступать в качестве одной из
основных концепций баз данных (БД), названных в связи с этим
табличными БД (ТБД). Посредством таблиц в ТБД представляется
информация (сведения) о совокупности однородных объектов, их
свойств, фактов, событий, характерных для этой или иной
предметной области. Над таблицами как структурами данных должны
задаваться определенные действия (манипуляции),
обеспечивающие информационные потребности пользователей БД.
3 — 3466
33
В рамках ТБД нас будут интересовать таблицы в плане их
сущностей. Что же касается их синтаксического аспекта, то с целью
концентрации основного внимания на семантическом аспекте мы
от него будем умышленно отвлекаться. В этом заключается
принцип отделения, который так же, как и принцип подчиненности
указанных аспектов таблиц, выступает в качестве
основополагающего принципа ТБД.
Рассмотрение таблиц естественно начать с примеров (табл. 1.4 и
1.5).
Таблица 1.4
Фамилия
Иванов
[ Сидоров
Курс
1-й
2-й
Факультет
Кибернетический
Экономический
Таблица 1.5
Факультет
Экономический
Кибернетический
Курс
2-й
1-й
Фамилия
Сидоров
Иванов
Эти таблицы (и им подобные) состоят из конечной
совокупности строк и столбцов. Каждый столбец характеризуется своим
именем. Имена столбцов для удобства выносятся в заголовок таблицы.
Строки состоят из элементов, каждый из которых связан с именем
столбца. Например, элемент (число) 1 первой строки табл. 1.4.
связан с именем «курс». Собственно такие связи и выделяют столбцы
как составные части таблиц. Анализируя табл. 1.4 и 1.5, видим, что
они отличаются по форме (перестановкой строк и столбцов), но
имеют одно и то же содержание (сущность). Действительно, в
таблицах представлены одни и те же сведения о студентах.
Поскольку таблица может рассматриваться как конечная
совокупность строк, имеющих фиксированное количество элементов,
то вскрытие сущности таблиц сводится к вскрытию сущности
строк. Строка таблицы — это совокупность именованных
элементов, т. е. пар, первые компоненты которых трактуются как имена, а
вторые — как их значения, причем каждые две такие пары в рамках
одной и той же строки отличаются, по меньшей мере, по первым
их компонентам. Каждые две строки таблицы отличаются не более
чем значениями имен.
На основе этого интуитивного представления понятий строк и
таблиц естественным образом вводятся формальные уточнения их
семантики.
34
Пусть АиЕ- непустые множества элементов, трактуемых
соответственно как имена (атрибуты) и значения (денотаты). Тогда
под семантикой строки естественно понимать конечное
множество пар:
d = {(a1,a1),(a2,a2),...,(an,an)},
где at G A, an G 2 и а^ * aj для i * j A < i,j < n). Условимся такие
множества называть атрибутными множествами или А-множества-
ми.
В качестве примера рассмотрим первую строку табл. 1.4.
Семантика ее адекватно задается А-множеством {(Фамилия, Иванов),
(Курс, 1), (Факультет, Кибернетический)}.
Непосредственно из определения А-множества вытекают
следующие его свойства:
1) А-множество представляет собой конечное бинарное
функциональное отношение между атрибутами и их значениями;
2) пусть at(d) и den(d) обозначают соответственно множество
атрибутов и денотатов А-множества d, тогда:
а) из at(di) = at(d2) следует IdJH^I (здесь и далее |S| обозначает
количество элементов конечного множества S);
б) имеют место отношения: |den(d)|<|at(d)|=|d|;
в) из dj Cd2A следуют at(d,) Cat(d2) и den(d2) Cden(d2).
В дальнейшем приходится рассматривать А-множества с
точностью до значений их атрибутов. Поэтому на А-множестве
естественно ввести следующее отношение: два ^-множества di и йг
называются совместимыми, если at(d!) = at(d2). Например, строки
di = {(Фамилия, Иванов), (Курс, 1), (Факультет,
Кибернетический)} и d2 = {(Фамилия, Сидоров), (Курс, 2), (Факультет,
Экономический)} совместимы.
Семантика таблицы является производной от семантики строки
и отношения совместимости. Она уточняется как конечная
совокупность попарно совместимых А-множеств. Договоримся эту
совокупность называть табличным множеством, или Т-множеством.
Из этого определения и свойств А-множеств вытекает ряд важных
свойств Т-множеств:
1) для каждого табличного множества t существует
единственное подмножество имен X С А, такое, что из d G t следует at(d) = X
(если Т-множество пустое, т. е. t = 0, тогда X = 0);
2) пусть at(t) и den(t) обозначают соответственно множества
атрибутов и их денотатов в табличном множестве t, тогда для любого
t выполняются соотношения:
3*
35
a)den(t)= (Jden(t);
det
6)|den(t)|<|t|-|at(t)|;
в) из tj С t2 следует at^) = at(t2) и den^) С den(t2).
Первое из приведенных выше свойств указывает, что каждому
Т-множеству однозначно соответствует некоторое множество
атрибутов, являющееся общим для любого его элемента (т. е. А-множе-
ства). Этим, в частности, объясняется удобство использования
таблиц как стандартных представлений Т-множеств. Все атрибуты
Т-множества в его стандартном представлении выносятся в
заголовок таблицы, что обеспечивает компактность такого
представления. Связи между атрибутами и их значениями во всех строках
задаются через столбцы. Следовательно, понятие столбца как
составной части стандартной формы таблицы несет не столько
семантическую, сколько синтаксическую нагрузку. Свойство 2 б)
определяет для таблиц связи между их количественными
характеристиками — количествами строк и атрибутов. Эти характеристики,
собственно, и задают двухмерность стандартной формы. Следует также
отметить, что указанные количественные характеристики
Т-множеств являются одними из важнейших факторов выбора
эффективных представлений табличных структур данных в памяти ЭВМ.
Итак, говоря о таблицах, будем подразумевать в плане их
семантики Т-множества, а в плане синтаксиса — стандартные
(двухмерные) табличные формы. Поскольку основным из этих двух
аспектов таблиц является семантический, в рассмотрениях ТБД
именно он будет занимать центральное место. Стандартные
табличные формы, являясь производными от структур Т-множеств,
здесь будут рассматриваться не более чем на уровне конкретных
примеров.
Построение ТБД для фиксированной предметной области
сводится, в частности, к определению совокупности состояний ТБД.
Такие состояния естественно рассматривать как конечные
множества поименованных таблиц. Приведем пример одного из
возможных состояний ТБД для предметной области ВУЗ (табл. 1.6—1.8)
Это состояние включает три таблицы с именами СТУД (студент),
ПРЕП (преподаватель), УСП (успеваемость) и атрибутами: КОД
(код студента), ФИО__С (фамилия и инициалы студента), ГОД_Р
(год рождения), УЧ_ГР (учебная группа), КУРС, ФАК (факультет),
ФИО_ПР (фамилия и инициалы преподавателя), УЧ_СТ (ученая
степень), КАФ (кафедра), ПРЕДМ (изучаемый предмет),
КОЛ_ЧАС (количество часов для изучения предмета), ОЦ
(экзаменационная оценка), СЕМ (семестр).
36
Таблица 1.6. СТУД
Гкод
Hioi
102
105
237
240
[241
ФИО С
Иванов И.И.
Петров П.П.
Сидоров С.С.
Леоненко Н.Н.
Семенов А. М.
Кузьмин Б.В.
ГОД_Р
1983
1983
1981
1984
1983
1980
КУРС
2
2
5
1
4
5
УЧ ГР
П02
П02
ЭК5
твз
TB4
ТВ5
ФАК
Физический
Физический
Физический
Механико-математический
Тоже
»
Таблица 1.7. ПРЕП
Г фио_пр
ГМаслов В.В.
Дмитрук Ю.В.
Федоров Ф.Ф.
Степанов С.С.
УЧ_СГ
Без степени
Кандидат
физико-математических наук
Доктор физико-математических
наук
Тоже
КАФ
ОФ
ОП
ТВ
МА
ФАК
Физический
Физический
Механико-математический
Тоже
Таблица 1.8. УСП
КОД
1 101
102
105
123
240
1 237
ФИО ПР
Дмитрук Ю.В.
Дмитрук Ю.В.
Маслов В.В.
Федоров Ф.Ф.
Степанов С.С.
Степанов С.С.
ПРЕДМ
Физика
Физика
Оптика
Механика
Логика
Программирование
КОЛ-ЧАС
120
120
76
76
120
120
оц
3
5
4
5
5
4
СЕМ
1
2
4
3
1
4 1
Приведенное состояние ТБД отражает конкретное
информационное наполнение таблиц, а именно сведения о студентах,
преподавателях и успеваемости студентов по ряду предметов в
фиксированный момент времени. С течением времени эти сведения будут,
естественно, меняться. Это приведет к изменению всего состояния
базы данных. Другими словами, в рамках фиксированной
предметной области ТБД с течением времени должна переходить из одного
состояния в другое. Однако при таких изменениях состояний
атрибуты таблиц будут фиксированными. Такими же будут оставаться и
имена таблиц. Через эти имена осуществляется доступ к таблицам
при решении пользовательских задач или при изменении
состояний ТБД.
На основе этого примера и общих соображений можно
сформулировать следующие выводы:
1. Состояния ТБД для фиксированной предметной области
должны быть однотипными, т. е. отличаться друг от друга не более
чем совокупностями значений атрибутов.
37
2. Совокупность однотипных состояний ТБД однозначно
характеризуется конечным множеством пар, первый компонент
каждой из которых — имя (однотипных) таблиц, а второй —
множество атрибутов, являющееся общим для каждой из однотипных
таблиц. При этом каждые две такие различные пары отличаются
друг от друга, по меньшей мере, первыми их
компонентами — именами таблиц. Например, совокупность однотипных
состояний ТБД для предметной области ВУЗ может быть
охарактеризована тремя парами:
(СТУД, {КОД, ФИО_С, ГОД_Р, УЧ_ГР, ФАК, КУРС}),
(ПРЕП, {ФИО_ПР, УЧ_СТ, КАФ, ФАК}),
(УСП, {КОД, ФИО_ПР, ПРЕДМ, СЕМ, КОЛ_ЧАС, ОЦ}).
Кроме этой характеристики состояний, еще могут задаваться
(постулироваться) некоторые зависимости в таблицах,
ограничивающие класс допустимых состояний ТБД. В качестве примера
простейших и очень важных с практической точки зрения
зависимостей рассмотрим так называемые ключевые зависимости. Смысл
последних поясним на содержательном уровне применительно к
совокупностям состояний ТБД для данной предметной области.
Примем следующие предположения:
1) каждые два студента в рамках вуза имеют различные коды
(это могут быть, например, номера зачетных книжек);
2) среди преподавателей вуза нет однофамильцев (с учетом
инициалов);
3) каждый студент в данный семестр сдает экзамен по
заданному предмету только одному конкретному преподавателю, и при
этом учитывается только последняя оценка, которую он получил в
случае пересдачи.
Эти предположения позволяют выделить в качестве допустимых
состояний ТБД только такие, в которых:
• таблица с именем СТУД (ПРЕП) состоит из строк, попарно
различающихся по меньшей мере значениями атрибута КОД
(ФИО_ПР) (предположения 1 и 2);
• каждые две строки таблицы с именем УСП различаются
своими подстроками с атрибутами КОД, ФИО_ПР, ПРЕДМ и
СЕМ (предположение 3).
Множества атрибутов {КОД}, {ФИО_ПР} и {КОД, ФИО_ПР,
ПРЕДМ, СЕМ} в данном случае называются ключами, а свойство
однозначного соответствия между значениями ключей
(значениями атрибутов, входящих в состав ключей) и содержащими их стро-
38
ками таблиц — ключевой зависимостью. Эти зависимости
записываются следующим образом:
{КОД}->{ФИО_С, ГОД_Р, УЧ_ГР, ФАК, КУРС},
{ФИО_ПР}->{УЧ_СТ, КАФ, ФАК},
{КОД, ПРЕДМ, ФИО_ПР, СЕМН{КОЛ_ЧАС, ОЦ).
Такая характеристика совокупностей однотипных состояний
называется схемой состояний ТБД, или схемой ТБД. Таким
образом, построение ТБД для конкретной предметной области
сводится, в частности, к построению схемы ТБД.
Наряду с таблицами, которые мы рассматривали до сих пор,
могут использоваться так называемые многоуровневые таблицы.
Последние содержат строки, атрибуты которых допускают в
качестве значений опять строки. Такие атрибуты называются
составными, а атрибуты, значениями которых являются первичные данные,
т. е. элементы из Z, — простыми. Ниже приведена двухуровневая
таблица (табл. 1.9).
Таблица 1.9. Двухуровневая ТДБ
Г ФИО
Фамилия
| Иванов
Имя
Иван
Отчество
Иванович
ДАТА-РОЖД
Год
1982
Месяц
Июнь
Число
12
КУРС
з
Свойство двухуровневости этой таблицы проявляется в том, что
значениям и атрибутов ФИО и ДАТА — РОЖД являются строки с
множествами атрибутов соответственно ФАМИЛИЯ, ИМЯ,
ОТЧЕСТВО и ГОД, МЕСЯЦ, ЧИСЛО.
Уточнение семантики многоуровневых таблиц сводится к
соответствующему обобщению понятия А-множеств.
1.5. Знания
Рассмотрим общую совокупность качественных свойств для
знаний (специфических признаков знаний) и перечислим рад
особенностей, присущих этой форме представления информации в
ЭВМ и позволяющих охарактеризовать сам термин «знания» [8].
Прежде всего знания имеют более сложную структуру, чем
данные (метаданные). При этом знания задаются как экстенсионально
(т.е. через набор конкретных фактов, соответствующих данному
понятию и касающихся предметной области), так и
интенсионально (т.е. через свойства, соответствующие данному понятию, и схе-
39
му связей между атрибутами). С учетом сказанного перечислим
свойства.
Внутренняя интерпретируемость знаний. Каждая
информационная единица (ИЕ) должна иметь уникальное имя, по которому ИС
находит ее, а также отвечает на запросы, в которых это имя
упомянуто. Когда данные, хранящиеся в памяти, были лишены имен, то
отсутствовала возможность их идентификации системой. Данные
могла идентифицировать лишь программа.
Если, например, в память ЭВМ нужно было записать сведения
о студентах вуза, представленные в табл. 1.10, то без внутренней
интерпретации в память ЭВМ была бы записана совокупность из
четырех машинных слов, соответствующих строкам этой таблицы.
Таблица 1.10. Сведения о студентах
Фамилия
Петров
Захаров
Иванов
Кузьмин
Год рождения
1978
1977
1976
1975
Факультет
Экономический
Механический
Транспортный
Электротехнический
Курс
2-й |
3-й |
4-й
5-й 1
При этом информация о том, какими группами двоичных
разрядов в этих машинных словах закодированы сведения о студентах,
у системы отсутствует. Они известны лишь программисту.
При переходе к знаниям в память ЭВМ вводится информация о
некоторой протоструктуре информационных единиц. В
рассматриваемом примере она представляет собой специальное машинное
слово, в котором указано, в каких разрядах хранятся сведения о
фамилиях, годах рождения, специальностях и курсе. При этом
должны быть заданы специальные словари, в которых перечислены
имеющиеся в памяти системы фамилии, года рождения, название
специальностей и курса. Все эти атрибуты могут играть роль имен
для тех машинных слов, которые соответствуют строчкам таблицы.
По ним можно осуществлять поиск нужной информации. Каждая
строка таблицы будет экземпляром протоструктуры. В настоящее
время СУБД обеспечивают реализацию внутренней
интерпретируемости всех ИЕ, хранимых в базе данных.
Структурированность (рекурсивная структурированность) знаний.
Информационные единицы должны обладать гибкой структурой.
Для них должен выполняться «принцип матрешки», т.е.
рекурсивная вложимость одних ИЕ в другие. Каждая ИЕ может быть
включена в состав любой другой, и из каждой ИЕ можно выделить
некоторые составляющие ее ИЕ. Другими словами, должна
существовать возможность произвольного установления между отдельными
40
ИЕ отношений типа «часть — целое», «род — вид» или
«элемент — класс».
Связность (взаимосвязь единиц знаний). В информационной базе
между ИЕ должна быть предусмотрена возможность установления
связей различного типа. Прежде всего эти связи могут
характеризовать отношения между ИЕ. Семантика отношений может носить
декларативный или процедурный характер. Например, две или
более ИЕ могут быть связаны отношением «одновременно», две
ИЕ — отношением «причина — следствие» или отношением
«аргумент — функция». Приведенные отношения характеризуют
декларативные знания. Различают отношения структуризации,
функциональные отношения, каузальные отношения и семантические
отношения. С помощью первых задаются иерархии ИЕ, вторые несут
процедурную информацию, позволяющую находить (вычислять)
одни ИЕ через другие, третьи задают причинно-следственные
связи, четвертые соответствуют всем остальным отношениям.
Между ИЕ могут устанавливаться и иные связи, например
определяющие порядок выбора ИЕ из памяти или указывающие на
то, что две ИЕ несовместимы друг с другом в одном описании.
Перечисленные три особенности знаний позволяют ввести
общую модель представления знаний, которую можно назвать
семантической сетью, представляющей собой иерархическую сеть, в
вершинах которой находятся ИЕ. Эти единицы снабжены
индивидуальными именами. Дуги семантической сети соответствуют
различным связям между ИЕ. При этом иерархические связи
определяются отношениями структуризации, а семантические связи
—отношениями иных типов.
Семантическая метрика (семантическое пространство знаний с
метрикой). На множестве ИЕ в некоторых случаях полезно задавать
отношение, характеризующее ситуационную близость ИЕ, т.е.
ассоциативную связь между ИЕ. Его можно было бы назвать
отношением релевантности для ИЕ. Такое отношение дает возможность
выделять в информационной базе некоторые типовые ситуации
(например, «покупка», «регулирование движения на перекрестке»).
Отношение релевантности при работе с ИЕ позволяет находить
знания, близкие к уже найденным.
Активность знаний. С момента появления ЭВМ и разделения
используемых в ней ИЕ на данные и команды создалась ситуация,
при которой данные пассивны, а команды активны. Все процессы,
протекающие в ЭВМ, инициируются командами, а данные
используются этими командами лишь в случае необходимости. Для ИнС
эта ситуация неприемлема. Как и у человека, в ИнС актуализации
41
ЗНАНИЯ
Поверхностные знания (совокупность эмпирических
ассоциаций и причинно-следственных отношений
между понятиями предметной области)
Глубинные знания (абстракции, образы, аналогии, в
которых отражается понимание структуры
предметной области и взаимосвязь отдельных понятий)
Рис. 1.22. Классификация знаний по «глубине»
тех или иных действий способствуют знания, имеющиеся в
системе. Таким образом, выполнение программ в ИнС должно
инициироваться текущим состоянием информационной базы. Появление в
базе фактов или описаний событий, установление связей может
стать источником активности системы.
Следует упомянуть о функциональной целостности знаний, т.е.
возможности выбора желаемого результата, времени и средств
получения результата, средств анализа достаточности полученного
результата.
Перечисленные пять особенностей ИЕ определяют ту грань, за
которой данные превращаются в знания, а базы данных
перерастают в базы знаний (БЗ). Совокупность средств, обеспечивающих
работу со знаниями, образует систему управления базой знаний
(СУБЗ). Однако к БЗ, в которых в полной мере была бы
реализована внутренняя интерпретируемость, структуризация, связность,
введена семантическая мера и обеспечена активность знаний, еще
необходимо проделать определенный путь.
Все приведенные выше качественные свойства знаний касаются
в основном уровня 3hi и связаны со сложной природой знания,
изучение которой происходит на междисциплинарном стыке таких
наук, как кибернетика, лингвистика, психология и т.д.
ЗНАНИЯ
Жесткие знания (позволяют получать однозначные
четкие рекомендации при заданных начальных
условиях)
Мягкие знания (допускают множественные,
расплывчатые решения и различные варианты
рекомендаций)
Рис. 1.23. Классификация знаний по «жесткости»
42
ЗНАНИЯ
Знания о процессах решения задач, используемые
решателем (интерпретатором)
Знания о языке общения и способах организации
диалога, используемые диалоговым компонентом
(средствами общения)
Знания о способах представления и модификации
знаний, используемые компонентом приобретения
знаний
Специальные знания, используемые
объяснительным компонентом
Рис. 1.24. Номенклатура (состав) знаний, используемых различными
компонентами ИнС
ЗНАНИЯ Н
Неинтерпре-
тируемые
Вспомогательные
Н О языке
Ч О диалоге
Поддержи- [J
вающие
Н Технические
Ч Семантические
Интерпретируемые
О представ-
| лениях 1
Управляющие J
Фокусирующие
Решающие
Предметные Н
Н Описатели
Собственно
предметные
Факты
Операционные
Рис. 1.25. Классификация знаний на основе учета их использования
в процессе работы в ИнС
43
Из всего многообразия существующих способов
классификации знаний на рис. 1.22—1.23 представлены наиболее важные из
них с точки зрения технологии разработки ИнС [1, 8, 28, 40, 43].
Вопросы для самопроверки
1. Каковы основные определения в теории интеллектуализированных систем?
2. Что из себя представляет технология инженерии знаний?
3. Какова основная терминология в области разработки ИнС?
4. Какие типы классификаций ИнС распространены в последние годы?
5. Что составляет проблемную область искусственного интеллекта?
6. В чем состоят основные аспекты системного анализа ПО на применимость
технологии ИнС?
7. Каким образом осуществляется представление данных в компьютере?
8. Особенности представления знаний ИнС.
9. В чем принципиальное отличие представления данных и знаний в ЭВМ?
10. Каковы классификация и состав знаний в ИнС?
Глава 2
МЕТОДЫ ФОРМАЛИЗАЦИИ ЗНАНИЙ
О ПРЕДМЕТНОЙ ОБЛАСТИ
2.1. Понятийная структура
предметной области
При построении описания выделенного фрагмента реальной
действительности (предметной области — ПО) одним из основных
допущений является предположение о том, что мир состоит из
независимых объектов (предметов, процессов, вещей или
сущностей), которые могут быть уникально идентифицированы. В
дальнейшем при обозначении реальных объектов ПО для
однозначности будем использовать термин сущность.
Напомним, что термин «проблемная область» включает
понятие «предметная область» (т.е. множество сущностей,
описывающих область экспертизы) плюс решаемые в ней задачи
(представляемые в виде исполняемых утверждений типа правил, процедур,
формул и т.д.).
Определение 2.1. Сущность — это объект произвольной
природы, принадлежащий реальному или воображаемому (виртуальному)
миру. На самом общем уровне сущности делятся на следующие
категории (классы): предмет, свойство (атрибут), состояние, процесс,
событие, оценка, модификатор, квантификатор, модальность.
Любое понятие относится к одной из этих категорий [54].
Сущность ПО необходимо адекватным образом представить в
памяти вычислительной машины, чтобы с ее помощью обеспечить
поиск, анализ, обработку и выдачу накопленной информации в
форме, удобной для принятия решений. Эта задача может быть
решена путем использования соответствующих средств описания
ПО, предоставляющих необходимые базовые понятия,
инвариантные по отношению к любым ПО, и правила, позволяющие строить
более сложные синтаксические конструкции на основе базовых.
Средства предоставления информации о ПО различные
исследователи называют по-разному.
45
Под понятием (концептом) понимается класс сущностей,
объединяемых на основе общности признанных (атрибутивных)
структур.
Следует отметить, что наиболее естественным для человека
способом описания любых сущностей ПО является соотнесение с
ними в собственной памяти совокупности определенных понятий
(простых и сложных), образующих понятийную структуру
предметной области, а в памяти ЭВМ — как правило, некоторых объектов,
состоящих из атрибутов со значениями (хотя это, безусловно, не
единственный способ реализации описания понятий в памягги
ЭВМ).
В ряде случаев вообще не делается попыток различения
понятийной структуры и объектов предметной области, а сразу
отмечается, что предметную область можно характеризовать
совокупностью объектов, характеристик объектов и отношений между
объектами [40]. Справедливость подобных утверждений будет вполне
очевидна после рассмотрения некоторых приведенных ниже
определений [24, 25].
Определение 2.2. Под простым понятием понимается тройка,
состоящая из имени, интенсионала и экстенсионала понятия.
Имя понятия — любой идентификатор; интенсивная
понятия — множество атрибутов (свойств) понятия с областями их
определения; экстенсионаа понятия — совокупность кортежей
значений, удовлетворяющих интенсионалу; атрибуты — первичные
характеристики данной ПО, не подлежащие дальнейшей
структуризации.
Определение 2.3. Сложные понятия — это понятия, образованные
из ранее определенных понятий применением некоторых правил.
Следует добавить, что простота или сложность понятий
является явлением относительным и изменяющимся с развитием науки,
причем изменение статуса понятия возможно и в процессе
разработки конкретной ИнС. Отметим также, что для определения
понятийной структуры области необходимо выявление отношений на
множестве понятий, которые являются отражением объективных
законов ПО или субъективных мнений специалистов.
Напомним, что классические модели данных (иерархические и
сетевые) базируются на таких понятиях, как запись, атрибут и
связь. Современные модели данных (реляционные и
семантические) используют математическое понятие отношение, которое
задается на множествах, и понятие объекта для представления
сущностей ПО в БД.
46
В соответствии с данными определениями отметим
следующее. Структура признаков — это совокупность взаимосвязанных
признаков (атрибутов), характеризующих понятие, выделяющих
его среди других понятий. Признаки, входящие в совокупность,
называются существенными. Их состав определяется исходя из
множества понятий, в котором необходимо выделить
рассматриваемое [55].
Совокупность существенных признаков, характеризующих
понятие, называется его содержанием (интенсионалом). В силу
ограниченного числа существенных признаков Alf...,Aj,...,Ak будем
представлять содержание понятия А множеством A = {A1,...,Aj,...,Ak}.
При этом содержание понятия должно отвечать взаимнопротиво-
положным требованиям полноты и неизбыточности. Совокупность
существенных признаков можно рассматривать как координаты
k-мерного признакового пространства. Оно должно отличаться от
признакового пространства, характеризующего другое понятие.
Если отойти от двух градаций i-ro признака — его наличия, либо
отсутствия в анализируемом понятии — и определить меру
схожести, то можно решать задачу выявления аналогии понятий.
Класс сущностей, объединяемых в понятие, называется его объемом
(экстенсионалом). Сущности, входящие в объем понятия и
называемые экземплярами, вариантами или фактами, задаются
перечислением. Объем понятия, в отличие от его содержания, может варьироваться
заданием ограничений. По этой причине объем понятия, как правило,
задается перечислением не экземпляров Aj, i= 1, 2, ..., а признаков,
которым они удовлетворяют: А = {А{:VAj G A,j = l,...,k}.
Знаковое представление понятий. Понятия именуются с
помощью слов или словосочетаний естественного языка, которые
играют роль знаков или имен. Таким образом, носителем знаковой
формы представления знания является естественный язык. Он
позволяет с применением символов (букв и цифр) зафиксировать
любую информацию, в том числе и графическую. Такая
специфическая форма информации, как музыкальная, записывается с
помощью знаков специального вида (нотная запись).
Для представления понятия в естественном языке используется
слово или словосочетание, называемое именем. Оно играет роль
идентификатора, выделяя понятие среди остальных. Имя или знак
(sign) — единица языка, отражающая семантически сущность
отображаемого мира, а синтаксически — субъект или объект
высказывания. В пропозициональной функции имя представляется
предметной переменной или константой.
47
Иными словами, знак — это заменитель некоторого объекта,
явления или процесса, используемый для накопления, хранения,
переработки и передачи информации или знаний.
Пара, состоящая из имени и обозначаемого, в семиотике
называется знаковой ситуацией. Сущности ПО, на которые можно
ссылаться с помощью имени или знака, как уже упоминалось,
называются денотатами.
Денотат знака — это конкретная сущность или предмет, на
которые указывает данный знак. Другими словами, денотат знака является
способом интерпретации данного знака в рамках некоторой
ситуации, рассматриваемой в ПО. Денотат знака — это значение, которое
может иметь знак в рамках данной знаковой ситуации [46]. Можно
указать на следующие основные свойства знаковой ситуации:
• имена способны замещать денотаты. Например, имя понятия
АВТОМОБИЛЬ может использоваться в качестве заместителя
любого конкретного автомобиля;
• имя нетождественно денотату, оно не может полностью
заменить денотат. Так, при алгебраических преобразованиях мы
можем использовать буквенные обозначения чисел. Однако, если
необходимо вычислить числовое значение выражения, то требуется
подставить конкретные числа (денотаты) вместо букв;
• связь «имя — денотат» многозначна, т. е. некоторое имя
может обозначать множество денотатов — омонимия, и наоборот,
одному денотату можно поставить в соответствие несколько имен —
синонимия.
Отношение, связывающее обозначаемую сущность (denotat),
отражающее ее понятие (consept) и его имя (designat), графически
выражается треугольником Фреге (рис. 2.1). Сплошными линиями
изображен базовый треугольник Фреге, характеризующий
однозначное отношение. Оно является желательным, но не всегда
достижимым. Пунктирными линиями изображены два треугольника,
представляющие два случая неоднозначности отношения [44].
Треугольник «сущность 1, понятие 1, имя 2» в сочетании с
базовым иллюстрирует случай синонимии. Сущности 1 и понятию 1
ставятся в соответствие два имени, называемые синонимами. Это
слова или словосочетания, тождественные или близкие по своему
значению, например булева алгебра и алгебра логики.
Источниками синонимии являются:
1) русское и иностранное происхождение (рынок и маркет);
2) полное и краткое обозначение (килограмм и кг);
3) фамильный и отражающий существенные признаки (метод
Парето и метод недоминируемых альтернатив);
48
Имя 1
Сущность 1
Сущность 2 /
о-
Понятие 2
о
Рис. 2.1. Треугольники Фреге,
отражающие неоднозначность отношения
Имя
Прагматика
Сущность
Понятие
Рис. 2.2. Четырехугольник
Поспелова
4) именование сущности по разным признакам (северный и
холодный климат);
5) различное авторское именование на этапе формирования
новой терминологии (рабочее и функциональное диагностирование).
Треугольник «сущность 2, понятие 2, имя 1» в сочетании с
базовым иллюстрирует случаи омонимии и полисемии. Сущностям 1 и
2 и понятиям 1 и 2 ставится в соответствие одно и то же имя, что
свидетельствует о его многозначности. В случае полисемии
понятия 1 и 2 характеризуются общим происхождением (одна статья в
толковом словаре), например сферы — небесная и интересов. При
омонимии понятия 1 и 2 имеют различное происхождение.
Например, в бытовом значении слово ключ характеризует предмет,
связанный с безопасностью помещений, а в программировании под
ключом понимают программный код, используемый для поиска
данных. Смысл таких слов можно распознать только по контексту.
К частному случаю омонимии можно отнести омографы — слова,
различающиеся звучанием и обозначающие разные понятия (замок
и замок).
Определения понятий являются результатом соглашения. Оно
достигается, например, при разработке терминологических
стандартов. Такие определения называются нормативными. Однако в
реальной жизни могут использоваться и ненормативные
определения. Наиболее подверженным изменению в определении является
признак, характеризующий роль или назначение понятия, т.е. его
прагматику. В связи с этим Д.А. Поспелов предложил дополнить
треугольник Фреге 4-й вершиной, характеризующей прагматику
понятия (четырехугольник Поспелова). Он изображен на рис. 2.2.
Схема и формулы понятий. Как уже отмечалось, сущности,
составляющие объем понятия, различаются с помощью признаков.
Признаковые отношения предписывают одним понятиям
выполнять роль некоторых качественных свойств по отношению к
другим понятиям. Признаки понятий могут быть отнесены к одному
4 — 3466
49
из следующих типов: дифференциальные, характеристические и
валентные [46].
Дифференциальные признаки используются в качестве
характеристики содержания понятия.
Характеристические — это признаки, которые позволяют
отличить сущности, относящиеся к объему одного и того же понятия.
Валентные — это признаки, обеспечивающие связь между
различными понятиями. Без потери общности можно считать такие
связи бинарными.
Признак характеризуется именем и значением. Можно
выделить несколько типов значений признаков: логические, числовые,
символьные и др. Имя признака вместе с его значением образует
полное наименование соответствующего признака. Например,
признак ВОЗРАСТ вместе со значением «30 лет» образует
наименование признака «возраст 30 лет».
Имя признака позволяет указать ту семантическую роль,
которую играет его значение в организации связи между сущностью и
признаком, ее характеризующим. Так, в предыдущем примере имя
признака ВОЗРАСТ характеризует определенную роль понятия «30
лет» по отношению к некоторой сущности, в качестве которой
выступает конкретный человек.
Совокупность имен дифференциальных, характеристических и
валентных признаков составляет схему понятия, обозначаемую как
shm P. Таким образом, схему понятия Р можно представить в виде
тройки
shm P = <D,H,V>, B.1)
где
D = {Di}, i = l,n — множество имен дифференциальных
признаков;
Н = {Hj}, j = l,m — множество имен характеристических
признаков;
V = {Vk}, k = TJL — множество имен валентных признаков.
Имена признаков будем обозначать прописными буквами
латинского алфавита (возможно, с индексами) А, В, С, D, ...., а
значения — строчными буквами.
Тот факт, что признак А, данного понятия принимает одно из
возможных значений a} Gdom Ai? будем выражать в виде пары (Аь
а)). Здесь dom Ai обозначает множество (домен) всех возможных
значений признака А,. Тогда каждая сущность е, принадлежащая
50
объему понятия Р, может быть представлена в виде множества пар
дифференциальных, характеристических и валентных признаков:
e = {(Di,d1n),(Cj,cil),(Vk,vik)}. B.2)
Однако описывать аналогичным выражением понятие не всегда
естественно, так как у понятий некоторые из значений признаков
могут не определяться. Более подходящей формой представления
понятий являются логические формулы.
Любое понятие можно выразить в виде логической формулы, в
которой элементы, образующие понятия, представлены
предикатами и соединены логическими операциями конъюнкции,
дизъюнкции и отрицания. В зависимости от вида этой формулы
представляемые ею понятия можно классифицировать на простые и
сложные.
Простое понятие Р(Х) представляется логическим выражением
PCXKAAifeJ.XX B3)
где z\ EdomAj — j-e значение признака Ai, a Ai(z],X)— предикат
истинный, если признак Aj сущности X принимает значение z],
иначе — ложный.
Для данного понятия в логической формуле может
присутствовать не более одного значения некоторого признака А*. Это
логическое выражение допускает простую интерпретацию: любая
сущность X, обладающая совокупностью признаков ъ\ EdomAj,
является денотатом данного понятия Р(Х). Примером простого понятия
может служить понятие КНИГИ-МАРТИНА:
КНИГИ-МАРТИНА (Название, Y)<- АВТОР (Название, Мартин)
& ГОД-ИЗДАНИЯ (Название, 1982) & ЯЗЫК
(Название, русский), & ЦЕНА (Название, Y),
которое описывает множество книг, написанных Дж. Мартином и
выпущенных на русском языке в 1982 г. Денотатами понятия
КНИГИ-МАРТИНА являются книги «Организация баз данных в
вычислительных системах» и «Сети ЭВМ». В качестве
дифференциальных признаков выступают признаки (АВТОР, Мартин) и
(ГОД-ИЗДАНИЯ, 1982), а в качестве характеристического признак
ка - (ЦЕНА, Y).
Если допускается несколько значений данного признака Aj, то
для такого понятия справедлива логическая формула
4*
51
n
P(X)<-&Ai(z;,X)VAi(z^,X)V...vAi(z^,X), B4)
где v, & — знаки дизъюнкции и конъюнкции соответственно.
Признаки, которые могут принимать несколько значений,
называются множественными.
Более сложный класс понятий описывается
дизъюнктивно-конъюнктивными логическими выражениями вида
Р(Х) «- Q,(X) V Q2(X)...vQm (X), B.5)
где Qk = & Р*(Х) и Р* (X) — предикаты, входящие в k-й дизъюнкт.
Выражение вида B.5) фактически определяет понятие Р(Х)
через m-альтернативных понятий Qk(X), каждое из которых является
конъюнкцией предикатов Р* (X).
В связи с этим без потери общности можно считать, что любое
понятие может быть представлено формулой
п
P(X)«-&Pi(X), B6)
i=l
где Pi(X) — предикаты, которые могут интерпретироваться как
другие понятия или как признаки понятия Р(Х).
Если учесть деление признаков понятия Р(Х) на
дифференциальные, характеристические и валентные, то логическое выражение
B.6) можно представить в виде
n m 1
Р(Х)«- & D^dj.X^AHjW &Vk(X), B ?)
где d] GdomDi — значения дифференциальных признаков Dj.
Устанавливая различные значения дифференциальных
признаков, мы получаем класс понятий с однородной структурой: все
понятия данного класса обладают одинаковой схемой.
Так как для импликации B.6) справедлива эквивалентная
форма записи
-Р, (X) V -P2(X)V...V -Pn (X) V Р(Х), B.8)
где -1 — знак отрицания, то это означает, что широкий класс
понятий может быть представлен в виде хорновских дизъюнктов.
Хорновским называют дизъюнкт, который содержит не более
одного позитивного компонента.
52
Мы не вводим для описания понятий более сложные
логические выражения, а ограничиваемся лишь такими, которые могут
быть представлены в виде хорновских дизъюнктов. Как показал
Ковальски [74], применение хорновских дизъюнктов по своим
изобразительным возможностям эквивалентно логике предикатов
первого порядка, но позволяет реализовать эффективные алгоритмы
обработки.
В тех случаях, когда понятие определяется альтернативными
логическими выражениями, целесообразно использовать термин
процедура.
Под процедурой понимают множество хорновских дизъюнктов,
заголовки которых содержат одинаковые имена предикатов и одно
и то же количество аргументов. Так, понятие Р(Х, Y) может быть
определено процедурой вида
Р(Х,Y) «- R2(X,a2)&Q2(Y,b2), 0.9)
которая означает, что для определения понятия Р(Х, Y) сначала
следует использовать предикаты Ri(Y, ai) и Qi(Y, bi), а затем —
предикаты R2(Y, a2) и Q2(Y, b2).
Например, если необходимо определить понятие ПРЕДОК (X,
Y), то это можно сделать с помощью следующей процедуры:
ПРЕДОК (X, Y) <- РОДИТЕЛЬ (X, Y),
ПРЕДОК (X, Y) <- РОДИТЕЛЬ (X, Z) & ПРЕДОК (Z, Y).
Здесь первая формула содержит утверждение, что субъект X
является предком Y, если он является его родителем. Вторая формула
определяет понятие ПРЕДОК (X, Y) рекурсивно: субъект X
является предком Y, если существует некоторый Z, для которого X
является родителем и, кроме того, Z является предком Y.
Таким образом, наиболее удобным аппаратом формализации
понятий, используемых для представления знаний о фактах,
действиях, событиях, ситуациях и т. д., является логика исчисления
предикатов. Ограничиваясь правилами, формулируемыми на основе
хорновских дизъюнктов, мы получим простой и достаточно общий
способ выражения связей как между признаками и понятиями, так
и между различными понятиями.
Экстенсионал и интенсионал понятия. В семиотике для
характеристики понятия и знаковой ситуации получили распространение
категории денотата и концепта, а в логике для тех же целей служат
термины «экстенсионал» и «интенсионал».
53
Одно и то же понятие может обозначать разные денотаты.
Множество всех объектов, предметов или сущностей, являющихся
денотатами понятия, составляет объем, или экстенсионал понятия.
Если экстенсионал понятия Р обозначить через extP, то может
записать следующее выражение [46]:
ExtP = [сь е2,...,еп], B.10)
где еь ег, ..., еп — сущности, являющиеся денотатами понятия Р.
Экстенсионал понятия — это совокупность всех его допустимых
денотатов, соответствующих концепту этого понятия. Так, чтобы
описать экстенсионал понятия АВТОМОБИЛЬ, следует
рассмотреть класс всех автомобилей. Мы полагаем, что в БЗ используются
только конечные экстенсионалы понятия.
Если ограничиться понятиями, которые допускают не более
одного значения некоторого признака, то между экстенсионалом
понятия и его признаками может быть установлена функциональная
связь вида
firextP^domAj, B.11)
сопоставляющая каждой сущности е] Е extP некоторое значение
признака z\ Е dom A{.
Разные понятия могут иметь один и тот же экстенсионал. Так,
понятия «множество точек, равноудаленных от сторон данного
угла» и «прямая, делящая угол на два равных угла», имеют одно и
то же множество точек в качестве денотатов (биссектрису данного
угла). Эти понятия имеют общий экстенсионал, но выражают
различный смысл, который мы связываем с их интенсионалами.
Следовательно, понятие не полностью характеризуется
экстенсионалом. Необходимо учитывать также интенсиональный аспект
понятия, который связан с его концептом.
Интенсионал понятия — это тот смысл, который мы вкладываем
в данное понятие, т. е. интенсионал характеризует концепт данного
понятия, его содержание. Интенсионал понятия Р будем
обозначать intP.
Возможны два подхода к формальному представлению интен-
сионала: теоретико-множественный и логический. При
теоретико-множественной формализации в интенсионал обычно
включают множество всех дифференциальных признаков,
характеризующих понятие.
Так, если понятие Р обладает некоторой совокупностью
дифференциальных признаков (Di, d1) (D2, d ), ..., (Dn> dn), где Dj — это
54
имя дифференциального признака, adn- соответственно его
значение, то интенсионал понятия Р можно представить в виде
множества пар
intsP = {(D1d1),(D2,d2),...,(Dn,dn). B.12)
Здесь индекс S (от английского слова Set) у интенсионала
означает его теоретико-множественную трактовку. Данный способ
чаще всего используется для формального представления интен-
сионалов простых понятий. При этом под интенсионалом простого
понятия Р понимают совокупность признаков, необходимых и
достаточных для принятия решения о принадлежности некоторой
сущности экстенсионалу данного понятия.
Очевидно, что при таком способе представления схема понятия
не содержится в его интенсионале, так как имена
характеристических и валентных признаков в выражении B.12) отсутствуют.
Для сложных понятий более естественна логическая форма
представления интенсионала. Так как широкий класс понятий
может быть описан логическими формулами в виде хорновских
дизъюнктов, то под интенсионалом понятия в этом случае обычно
понимают правую часть импликации B.6), т. е.
intLP(X)=&Pi(X). B13)
Здесь индекс L (от английского слова Logic) у интенсионала
означает его логическую формализацию.
Соответственно, если понятие представлено логической
формулой B.7), то интенсионал может быть определен выражением
n m 1
intLP(X)=&Di(d4X)&Cj(X)&Vk(X). BИ)
Очевидно, что при таком представлении интенсионал включает
также информацию о схеме понятия, хотя и не выделенную явным
образом.
Логическая форма представления интенсионала допускает
следующую интерпретацию: интенсионал понятия Р принимает
истинное значение на всех сущностях с{ G extP. Так, на множестве
точек «биссектриса угла» истинны оба утверждения: «равноудалены
от сторон данного угла» и «делят данный угол на два равных».
Связи между различными категориями, используемыми для
описания понятий в логике и семиотике, представлены на рис. 2.3.
55
Понятие
Объем Обозначение Содержание
,... /
Экстенсионал
Денотат
Т/Г
И
Концепт
\
Интенсионал
Рис. 2.3. Связи между категориями, используемыми для описания понятий
Суммируя вышеизложенное, можно представить понятие в виде
тройки:
Р = <int P, ext P, shm P>. B.15)
В зависимости от характера деятельности внимание
проектировщиков ИнС концентрируется на различных составляющих
понятия: системные аналитики и администраторы задач приложений,
создающие формальную модель ПО, больше должны опираться на
интенсионал понятий ПО, а администраторы базы данных — на их
схему. Тем самым понятие становится чрезвычайно удобным
средством, которое позволяет, с одной стороны, путем использования
интенсионала выразить семантические отношения для некоторого
фрагмента реального мира, а с другой стороны, с помощью схемы
обеспечить возможность перехода к менее детальному описанию и
представлению этой информации в базе знаний.
Абстрагирование понятий. Абстракция понятий представляет
собой основной механизм, с помощью которого человек познает
окружающий мир.
Абстракция — это выделение существенных признаков и связей
понятий, используемых при решении данной задачи, и
игнорирование несущественных. Абстрагирование является основным
методологическим приемом при разработке программного обеспечения.
Оно позволяет разбить решаемую задачу на подзадачи, каждая из
которых проще исходной задачи. Причем при рассмотрении
начальной задачи нет необходимости учитывать те детали и ту более
подробную информацию, которые используются на этапе
рассмотрения подзадач. В поле зрения должны находиться только те
сведения, которые позволяют охватить проблему целиком и осуществить
ее декомпозицию на более простые подзадачи.
Абстрагирование обеспечивает упорядочение, структуризацию
и понимание информации о реальном мире. Поэтому методы
абстракции широко используются в формальном описании предметной
области.
56
Известны следующие основные типы абстрагирования понятий:
агрегация, обобщение, типизация и ассоциация [46].
Перечисленным типам абстрагирования соответствуют
определенные логические приемы, с помощью которых может быть
достигнут необходимый результат. К таким приемам образования
понятий обычно относят:
синтез и анализ понятий;
объединение понятий на основе их сходства или подобия;
сравнение и сопоставление конкретных сущностей с целью
выявления общих признаков;
связывание двух или более понятий.
Синтез и анализ понятий используются в абстракции
агрегации. В процессе объединения понятий на основе их сходства или
выявленного подобия порождается новое понятие, которое
является обобщением исходных понятий. При установлении
определенного сходства сущностей в процессе сравнения или сопоставления
их признаков может порождаться новое более общее понятие,
которое объединяет целый класс подобных понятий, что
соответствует абстракции типизации. Если в процессе связывания понятий
образуется новое понятие, а исходные понятия выступают в виде
членов вновь порожденного понятия, то это абстракция ассоциации.
Вследствие того, что для каждого метода абстрагирования
возможно как повышение уровня абстракции, так и его понижение,
мы имеем дело с парами: агрегация — декомпозиция,
обобщение — специализация, типизация — конкретизация,
ассоциация — индивидуализация. Данные виды абстракций фиксируют
простейшие базовые отношения между понятиями и поэтому более
подробно рассматриваются ниже.
Агрегация понятий используется в тех случаях, когда вновь
порожденное понятие включает исходные понятия в качестве своих
компонент или составных частей. Например, понятие
АВТОМОБИЛЬ включает в качестве своих составных частей такие
компоненты, как КУЗОВ, ШАССИ, ДВИГАТЕЛЬ.
Агрегация понятий — это такая форма связи понятий, при
которой на основе исходных понятий Р и Q образуется понятие
агрегат R более высокого уровня.
При агрегации вновь образованное понятие R наследует все
признаки входящих в него понятий Р и Q, так что для интенсиона-
лов при их логической формализации и экстенсионалов
выполняются следующие соотношения:
intL R -* intL R&intL Q, B.16)
57
extR = extP x extQ.
B.17)
Выражение B.16) можно интерпретировать следующим
образом. Для принятия решения о принадлежности некоторой
сущности экстенсионалу понятия-агрегата R необходимо, чтобы эта
сущность удовлетворяла как интенсионалу понятия Р, так и интенсио-
налу понятия Q.
Легко видеть, что это требование удовлетворяется, если экстен-
сионал понятия-агрегата R определяется в соответствии с
выражением B.17).
Действительно, если сущность ер G extP, а сущность е_ G extQ,
то intLP(ep) = intLQ(eq) = true. Но сущность ег G extP x extQ в
соответствии с правилом наследования обладает одновременно
признаками обеих сущностей ер и eq, поэтому intLP(er) = intLQ(er) = true,
что приводит к истинности выражения
intLR(er) = intLP(er )&intLQ(er).
Очевидно, что для теоретико-множественной формы
представления интенсионалов будем иметь
ints R = intsP UintsQ. B.18)
Из выражения B.18) непосредственно следует, что сущность
ег Е extR обладает дифференциальными признаками обоих понятий
Р и Q, что соответствует сформулированному выше правилу
наследования признаков для абстракции агрегации. Так, понятие
АВТОМОБИЛЬ наследует все признаки, относящиеся к понятиям
ДВИГАТЕЛЬ, КУЗОВ и ШАССИ. При этом множество признаков
понятия АВТОМОБИЛЬ является объединением признаков своих
составных частей.
Пример иерархии агрегации представлен на рис. 2.4.
Так как признаки составляющих понятий наследуются
понятием-агрегатом, то схемы понятий при абстракции агрегации связаны
между собой выражением
shmR = shmP U shmQ. B.19)
Допустима, в частности, точка зрения, когда признаки также
рассматриваются как составные части понятия. Это означает, что
понятие является агрегатом, состоящим из своих признаков.
Семантическое отличие агрегации признаков от агрегации понятий
заключается в том, что признаки не определяются как
независимые понятия ПО и, следовательно, могут быть представлены в мо-
58
Автомобиль
Двигатель
Кузов
Шасси
Газораспределение
Зажигание
Питание
Охлаждение
Механизм
двигателя
Бампер
Сиденья
Багажник
Капот
Двери
Корпус
Управление
_ Ходовая
часть
Трансмиссия
Рис. 2.4. Иерархия агрегации для понятия АВТОМОБИЛЬ
дели знаний только в том случае, когда описаны соответствующие
базовые понятия.
Абстракция агрегации выражает такую связь понятий, которая
семантически обозначается как «часть — целое».
Процессом, противоположным абстракции агрегации, является
декомпозиция. При декомпозиции исходное понятие расчленяется
на ряд независимых компонент, каждая из которых обладает лишь
частью признаков исходного понятия.
Абстракция агрегации используется в тех случаях, когда
необходимо синтезировать сложное понятие, состоящее из совокупности
более простых понятий. Если в результате данного процесса мы
получим понятия, состоящие из других понятий, то можно
говорить об иерархии агрегации. Так, понятие КУРС может включать
понятие ГРУППА, которое в свою очередь включает понятие
СТУДЕНТ.
Таким образом, абстракция агрегации позволяет выразить
семантику внутренних связей, существующих между отдельными
элементами системы. При этом структура сложного понятия
раскрывается путем его декомпозиции на совокупность составляющих
понятий, называемых компонентами. Такая декомпозиция приводит
к представлению анализируемого понятия в виде многоуровневой
иерархической системы компонент, дающих описание внутреннего
устройства сложного понятия.
Обобщение понятий — это такая форма порождения нового
понятия R на основе одного или нескольких подобных понятий Р и
Q, когда порождаемое понятие К сохраняет общие признаки
исходных понятий Р и Q, но игнорирует их более тонкие различи-
59
тельные признаки. Для интенсионалов и экстенсионалов понятий
Р, Q и R, участвующих в данном процессе абстракции,
справедливы следующие соотношения:
ints R = ints P П ints Q, B.20)
intL R *- intL P V intL Q, B.21)
extR = extP II extQ. B.22)
Здесь знак Ц означает операцию размеченного объединения
множеств. Выражение B.20) непосредственно следует из определения, так
как пересечение интенсионалов понятий Р и Q обеспечивает
выделение их общих признаков. Так как любая сущность ег Е extR в
соответствии с выражением B.22) является либо сущностью ер Е extP,
либо сущностью eq EextQ, то всегда один из интенсионалов intLP
или intLQ истинен, а это значит, что будет истинен и интенсионал
понятия R, если он определен логической формулой B.21).
Напомним, что в отличие от операции обычного объединения
множеств, когда любые различия между элементами объединяемых
множеств игнорируются, при выполнении операции размеченного
объединения существовавшие различия элементов исходных
множеств сохраняются. Это означает, что для обобщения возможен
противоположный процесс, когда исходное понятие может
делиться на несколько более узких понятий. Такой процесс называется
специализацией, или ограничением понятий. Следовательно, при
обобщении подобные видовые понятия соотносятся с родовым
понятием более высокого уровня, а при специализации, наоборот,
родовые понятия делятся на два или более видовых понятия
низшего уровня. Это означает, что объем (экстенсионал) понятия в
процессе обобщения увеличивается и содержит в качестве своей
части объемы (экстенсионалы) исходных понятий, что и находит
свое выражение в формуле B.22).
Особенностью примера иерархии обобщений, представленного
на рис. 2.5, является наличие для понятия ЗАВЕДУЮЩИЙ
КАФЕДРОЙ двух понятий более высокого уровня, с которыми данное
понятие связано отношением ЕСТЬ — НЕКОТОРЫЙ. Если
понятия более низкого уровня связаны отношением обобщения только
с одним понятием более высокого уровня, тогда возникает
древовидная структура обобщений.
Для схемы понятия-обобщения R и обобщаемых понятий Р и Q,
которые называют также категориями, выполняется соотношение
shmR = shmP П shmQ. B.23)
60
Личность
Служащий Учащийся
Рис. 2.5. Иерархия обобщений понятия ЛИЧНОСТЬ применительно
к предметной области ВУЗ
Использование абстракций обобщения и агрегации и правил
наследования признаков обеспечивает мощные механизмы
накопления и обработки информации, хранящейся в БД и в БЗ, о
фрагменте действительности.
Абстракции агрегации и обобщения обеспечивают возможность
структурированного описания предметной области без
дублирования информации и возникновения противоречий и вместе с тем
позволяют путем использования процедур логического вывода,
основанных на правилах наследования признаков, произвести ее
корректную переработку.
Группировка объектов на основе соответствия их интенсиона-
лов некоторому эталону называется типизацией, а полученный при
этом класс объектов именуется типом. Например, класс объектов
ЛИЧНОСТЬ может быть создан путем объединения таких
понятий-сущностей, как Петров, Сидоров, Александров и т. д., при том
условии, что совокупности основных признаков этих понятий
совпадают. Обратным по отношению к процессу типизации является
процесс порождения экземпляров.
Понятие-тип обычно выражает то общее, что присуще
некоторой совокупности сущностей ПО. Причем это общее в первую
очередь выражает однородность, однотипность сущностей и
игнорирует индивидуальные отличия сущностей друг от друга,
определяемые значениями признаков.
Идентифицировать определенную сущность внутри типа можно
только в том случае, когда заданы значения ее признаков. Набор
признаков, единственным образом идентифицирующий сущность
внутри экстенсионала данного типа, обычно называют ключом.
Таким образом, понятие-тип можно интерпретировать как
отношение эквивалентности, которое задается на экстенсионале
данного понятия. Так как всякое отношение эквивалентности может
быть выражено через отношение БЫТЬ ЭТАЛОНОМ, то отсюда
61
следует, что сущности принадлежат одному типу в том случае,
когда они имеют общий эталон, который может быть отождествлен с
их интенсионалом [46].
Если в процессе абстракции типизации понятий-сущностей Р и
Q порождается понятие-тип R, то для интенсионалов, схем и экс-
тенсионалов должны выполняться следующие соотношения:
intsR = intsP = intsQ, B.24)
intLR = intLP = intLQ, B.25)
shmR = shmP = shmQ, B.26)
extR = extP II extQ. B.27)
Принадлежность сущностей одному типу позволяет переносить
знания с одной сущности на другую. Так, можно утверждать, что
сущности, принадлежащие экстенсионалу одного типа, имеют
одинаковое внутреннее устройство, а значит, и обладают одной и той
же схемой. Сопоставление абстракции типизации с абстракцией
обобщения показывает, что типизация является частным случаем
обобщения. Семантически типизация позволяет выразить
отношение ЕСТЬ ЭКЗЕМПЛЯР между понятием-сущностью и
понятием-типом и абстрагироваться от различий между описываемыми
экземплярами.
Ранее мы рассматривали такие отношения между понятиями,
для которых определены специальные правила, позволяющие по
интенсионалам исходных понятий перейти к интенсионалу
искомого понятия, а также указать формулы, позволяющие определить
его схему на основе схем базовых понятий. Однако при
формальном описании очень часто встречается ситуация, когда нет
необходимости в такой сильной интеграции понятий, хотя определенные
связи между понятиями следует отразить. Данная возможность
обеспечивается путем использования абстракции ассоциации.
Связь между двумя независимыми понятиями, при которой
необходимо учесть соответствие между экземплярами сущностей,
принадлежащих экстенсионалам понятий одного или разных типов,
называется ассоциацией. Для ассоциации одним из основных
моментов является выделение того обстоятельства, что экстенсионал
понятия-ассоциации R является подмножеством декартова
произведения экстенсионалов исходных понятий Р и Q:
extR = extP x extQ. B.28)
62
Связи между интенсионалами и схемами для ассоциации в
общем случае не определяются, однако в каждом конкретном
приложении они должны быть специфицированы. Наиболее подходящей
формой для указания данной информации является использование
правил в виде хорновских дизъюнктов. Спецификация
соотношений, связывающих интенсионалы понятий ассоциации в виде
хорновских дизъюнктов, позволяет применять стандартные методы
логического вывода.
Если от ассоциации понятий осуществляется переход к
отдельным понятиям, то такой процесс называют индивидуализацией. При
этом происходит абстрагирование от имеющихся связей между
двумя понятиями, что позволяет рассматривать их независимо друг от
друга и, следовательно, значительно упростить представление ПО
при формировании БЗ.
Обычно в ассоциации различают три вида связей между
отдельными сущностями 1:1, 1:М и N:M.
При взаимооднозначном отображении сущностей возникает
ассоциация типа 1:1. Примером служит связь между понятиями
ЛИЧНОСТЬ и АВТОМОБИЛЬ, если не разрешается иметь более
одного автомобиля. Ассоциация вида 1:М возникает в тех случаях,
когда одна из сущностей позволяет идентифицировать несколько
других сущностей. Однако если рассматривать данную связь в
другом направлении, то можно указать только одну сущность, с
которой связана каждая из сущностей ассоциации. Например, между
понятиями СЛУЖАЩИЙ и ОТДЕЛ может быть определена
ассоциация типа 1:М.
Ассоциация вида N:M возникает в тех случаях, когда в обоих
направлениях ассоциации можно указать более одной сущности, с
которой возможна связь, т. е. связи в ассоциации в обоих
направлениях не уникальны. Примером такой ассоциации служит связь
между ИЗДЕЛИЯМИ и ПОСТАВЩИКАМИ, когда одно
ИЗДЕЛИЕ поставляется несколькими ПОСТАВЩИКАМИ и
ПОСТАВЩИК может поставлять несколько ИЗДЕЛИЙ.
Сопоставление различных методов абстрагирования понятий
показывает, что фундаментальными видами абстракций являются
агрегация и обобщение. Абстракция типизации — лишь частный
случай абстракции обобщения, когда игнорируются различия в ин-
тенсионалах и схемах обобщаемых понятий, а абстракция
ассоциации эквивалентна абстракции агрегации по способу формирования
экстенсионалов, но использует более частные методы
комбинирования интенсионалов и схем, зависящие от исследуемой ПО.
63
Коренное различие между агрегацией и обобщением состоит в
следующем. Агрегация обеспечивает понимание строения одних
понятий ПО через строение других понятий, связанных с первым
определенным отношением. В обобщении, напротив, понимание
строения понятий ПО достигается через сравнение, сопоставление
понятий между собой и выделение в них общей структуры, которая
имеется во всех обобщаемых понятиях.
2.2. Формализованное представление
базы знаний
Для размещения базы знаний в компьютере ИнС с целью ее
использования для решения прикладных задач, необходимо ее
формальное описание с помощью математических моделей. Как уже
упоминалось, представление знаний возможно с помощью
декларативных и процедурных моделей.
К типовым декларативным моделям обычно относят сетевую и
фреймовую модели. Несмотря на то что они, как правило,
содержат процедурные составляющие, название дается по
преимущественной декларативной составляющей.
2.2.1. ДЕКЛАРАТИВНЫЕ МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
Ранее были рассмотрены базовые механизмы структурирования
понятий ПО. Сейчас мы переходим к способам представления
знаний о ПО в целом. К таким способам относятся семантические
сети и фреймовые модели.
Понятия, как указывалось, могут быть простыми и сложными.
Основным механизмом образования сложных понятий является
связывание входящих в них понятий. В естественном языке мы
находим многочисленные примеры предложений, которые выражают
взаимосвязь понятий. Так, предложение «Слесарь Иванов И.И.
работает в цехе 5» описывает связь между понятиями «Слесарь»,
«Иванов И.И.» и «цех 5».
Семантические модели представления знаний. Совокупность
взаимосвязанных понятий образует семантическую сеть понятий.
Эта сеть является концептуальной моделью ПО. Обычно она
состоит из понятий различных категорий: объектов» свойств,
операций, событий и т. д.
Семантическая сеть понятий содержит в первую очередь
интенсиональные знания о ПО. Если ПО рассматривать как совокуп-
64
ность понятий и связей (отношений) между ними, то
семантические сети дают возможность представлять знания о ПО в
наглядной и структурированной форме, что не всегда возможно при
других способах представления знаний. Семантические сети понятий
обеспечивают представление ПО в виде ориентированного графа,
вершинами которого выступают понятия, а ребрами — связи между
ними. Если в сети предусмотрена иерархия обобщения, то при
этом можно использовать механизм логического вывода,
основанный на наследовании признаков. Например, начиная навигацию от
исходного понятия, можно по ребрам связей достичь другого
понятия за некоторое число шагов. Однако такая навигация может стать
простым перебором вариантов, если путь продвижения по сети
понятий не определен.
Семантическую сеть можно рассматривать как композицию
троек (синтагм) вида АгВ, где А и В — два понятия, а г — связь
между ними.
Связь между понятиями семантической сети выражает
минимальный объем знаний, простейший факт, относящийся к двум
понятиям. Более сложные утверждения в рамках семантической
сети могут быть определены путем вьщеления соответствующих
подграфов. В естественном языке такие подграфы выделяются с
помощью отдельных законченных предложений, которые
описывают определенные ситуации, возникающие между понятиями ПО
[6, 75].
Напомним, что ПО в каждый момент времени может быть
представлена в виде совокупностей сущностей, понятий и
ситуаций. Выделенная совокупность сущностей, понятий и ситуаций
ПО называется ее состоянием. Любое изменение состояния ПО
будем связывать с некоторым событием в ПО. Основной сферой
использования событий являются ситуации, приводящие к
изменению состояний понятий ПО.
Каждой ситуаций можно поставить в соответствие некоторое
утверждение или суждение об ее истинности или ложности,
поэтому взаимосвязь группы понятий носит информационный
характер, что позволяет считать ситуации основной категорией для
описания ПО. Различие методов концептуального моделирования в
основном определяется теми формальными средствами, которые
используются для описания ситуаций: в семантических сетях и
фреймах — это понятия и их взаимосвязи, в логических методах —
предикаты и логические формулы, в объектно-ориентированном
подходе — объекты, классы и сообщения.
5 — 3466
65
Использование ситуаций обеспечивает механизм для
декомпозиции семантической сети понятий, моделирующей ПО, на более
простые, семантически связанные блоки понятий. Ситуация — это
простейшая логически законченная структура, которая может
выступать в виде некоторого автономного блока семантической сети
понятий, рассматриваемой ПО.
Основу модели семантической сети составляют понятия ПО,
представляемые вершинами. В системе SIMER-MIR вершины
(узлы) сети делятся на события, атрибуты, комплексы признаков и
процедуры [44].
Под событиями здесь понимаются различные объекты ПО:
суждения, факты (индивидные понятия), результаты наблюдений,
рекомендации. События могут представляться как словосочетаниями,
так и числами. События группируются тематически или
функционально в разделы. Имена последних должны отличаться от имен
входящих в них событий. Одно событие может быть более чем в
одном разделе.
События в системе делятся на характеризуемые и
характеризующие (события-признаки). Например, событие Дождливая погода
характеризуется событием Идет дождь. Это событие называется
обусловленным признаком первого, ибо дождливая погода без дождя
невозможна.
В зависимости от направления влияния на событие признаки
делятся на положительные и отрицательные. В примере с дождем
приведен положительный признак. Примером отрицательного
признака является Сухая земля.
Характеризующее событие, имеющее несколько значений,
называется атрибутом. Например, свойством понятия Время года
является Погода. Поскольку последняя имеет несколько значений:
Холодная, Теплая, Дождливая, — ее считают атрибутом понятия
Времена года.
Несколько признаков могут объединяться в комплекс,
характеризующий событие в большей степени, чем отдельный признак.
Если существование события возможно только при реализации
всех его свойств, оно относится к полным событиям. Полным, в
частности, является событие, имеющее единственный атрибут или
комплекс признаков.
Процедуры являются специфическими компонентами сети,
выполняющими преобразование информации. Они позволяют
вычислять значения одних атрибутов на основании других, оперируя как
с числами, так и с символами.
66
Для вывода знания события в сетевой модели делятся на исход-
ные (признаки) и целевые (гипотезы).
Значения признаков предполагаются известными. Все
признаки, помимо присущих им значений: Истинно (Да) и Ложно
(Нет) — имеют еще два стандартных значения: Пока неизвестно и
Неизвестно. При задании последнего значения признак
исключается из рассмотрения. Значения исходных атрибутов либо
выбираются из определенного списка, либо вводятся извне.
Объектами вывода в рассматриваемой модели являются
гипотезы. К ним относятся рекомендации, диагнозы, прогнозы и другие
решения, определяемые спецификой ПО. Условием вывода должно
быть существование хотя бы одной гипотезы. В этом случае
решением является оценка ее истинности.
Виды семантических связей [44]. Семантическая связь (СС)
отражает отношение понятий в понятийной системе. В лексике им
соответствуют лексемы любого вида, в том числе представляющие
предикаторы «меньше», «равно», «если, то» и др.
Внелексические свойства СС выражаются через
рефлексивность, симметричность и транзитивность. Обозначим их значения
следующим образом: Rf—рефлексивность; Nrf—
нерефлексивность; Arf—антирефлексивность (ни одной рефлексии);
Sm — симметричность; Ns — несимметричность; Ans —
антисимметричность (ни одной симметрии); As — асимметричность
(контекстное свойство — обращение связи дает иную связь из списка);
Тг — транзитивность; Ntr — нетранзитивность.
Относительно сочетания перечисленных свойств СС делятся на
типы, представленные в (табл. 2.1.) [69].
Таблица 2.1. Свойства семантических связей
Номер
класса
1
2
3
4
Тип связи (X, Y)
Gen-генеративная
Sit-ситуативная
Neg-негативная
Ins -инструментальная
Сот-комитативная
Сог-коррелятивная
Fin-финитивная
Cous-каузальная
Pot-потенсивная
Каноническая форма
«X является элементом Y»
«X находится в ситуации Y»
«X отрицает Y»
«X является средством Y»
«X сопровождается Y»
«X иногда увеличивает
возможность Y»
«X является целью Y»
«X вызывает Y»
«X может вызывать Y»
Свойство
Arf, Ns, Ntr
Arf,As,Tr
Arf, Sm, Ntr
Nrf, Ns, Ntr 1
Rf, Ans, Tr
Rf, Sm, Ntr
Arf, Ns, Ntr
Nrf,Ns,Tr
Nrf, Ns, Ntr 1
Внелексические свойства семантических связей в суждениях
проверяются следующим образом.
5* 67
1. Рефлексивность определяется по критерию подстановки:
вместо объекта А подставляется объект В(АгВ -» ВгВ) и выбирается
один из следующих ответов:
1) вполне возможно (тавтология) -> Rf;
2) не исключено -» Nrf;
3) невозможно —> Arf.
Пример. Вегетативные расстройства сопровождаются
вегетативными расстройствами. Ответ 1 для Com.
2. Симметричность определяется по критерию перестановки:
объекты А и В меняются местами (АгВ -> ВгА) и выясняется
справедливость полученного предложения. При утвердительном ответе
высказыванию приписывается свойство Sm, в противном
случае — свойство Ns.
Пример. Головная боль всегда сопровождается вегетативными
расстройствами, и Вегетативные расстройства всегда
сопровождаются головной болью. Ответ «Нет» для Com. Это соответствует
свойству Ns.
3. Свойство Ns уточняется на более сильные свойства: Ans и As.
Первое имеет место для любых примеров анализируемой связи.
Например, для связи Com имеет место свойство Ans.
4. Для выявления свойства As используется критерий
обращения: если высказывания А предикатор В и В предикатор А
принадлежат различным типам высказываний в таблице, то имеет место
свойство As.
5. Транзитивность выявляется на основе критерия
трансформации, в высказывание вводится уточнение (как 2-я посылка).
Например, в качестве уточнения в высказывание вводится
модальность необходимости: если А, то необходимо появиться В. При
справедливости такого высказывания оно относится к каузальному
типу (Caus), в противном случае (модальность возможности) — к
потенсивному типу (Pot).
Типы связей в высказываниях разбиты в табл. 2.1 на четыре
группы. Группы 1—3 отражают одномоментные зависимости,
группа 4 — разномоментную зависимость между объектами
высказывания (следствие реализуется позже посылки).
Типы связей групп 1 — 3 различаются свойством рефлексии
(Arf, Nrf, Rf соответственно). Внутри этих групп типы связей
различаются по свойствам симметрии.
Поскольку в группе 4 все связи обладают одинаковым
свойством несимметрии Ns, для их различения используются свойства
рефлексивности и транзитивности.
68
Таким образом, свойства одномоментности, рефлексивности,
симметричности и транзитивности можно использовать в качестве
признаков установления типов высказываний. Дерево вывода
типов связей с перечисленными свойствами в качестве оснований
деления изображено на рис. 2.6.
В системе SIMER-MIR устанавливаются двусторонние связи
между двумя событиями, причем они могут различаться.
Реализованы следующие связи.
1. При наблюдении события А может наблюдаться (обычно
наблюдается) событие В. Эта связь является положительной. Она
порождает событие В в качестве гипотезы или увеличивает
уверенность в его истинности.
2. При наблюдении события А всегда наблюдается событие В.
Эта положительная связь более сильная.
3. При наблюдении события А обычно отсутствует (может
отсутствовать) событие В. Эта связь является отрицательной. Она
уменьшает уверенность в истинности события В.
4. При наблюдении события А всегда отсутствует событие В.
Эта связь называется исключающей, поскольку событие В
исключается из списка гипотез.
Nrf ^
Ntr
Arf Ntr
As
Nsm
Arf
.Gen
\ Nrf
\rj>
V?m
Nsm
Nsm
NySm
Neg
Ins
Tr
^9
s^tr
Cor
Com
MCom
^#
Рис. 2.6. Дерево выводов типов высказываний
69
Фреймовая модель представления знаний. Одним из широко
используемых формализмов для представления знаний являются
фреймы [44, 46]. Фрейм — это некоторая структура для
представления знаний, которая при ее заполнении соответствующими
значениями превращается в описание конкретного факта, события или
ситуации.
Фреймовую модель можно считать более специализированной
по отношению к сетевой. Она основана на принципе
кластеризации (фрагментация) знаний.
Основной структурной единицей фрейма является слот,
который может быть представлен в виде
(имя слота) :{(А,У )},{ri}, B.29)
где Ai — имя признака; V — его значения; г» — некоторая связь с
другими-слотами.
В качестве связей, в частности, могут использоваться
отношения ЧАСТЬ-ЦЕЛОЕ, РОД-ВИД, ЕСТЬ-ЭКЗЕМПЛЯР и т. д.
Фрейм может быть в общем виде представлен следующим
образом:
<имя фрейма>:
[<роль1>] (<имя слота1> : <значение слота1>);
[<роль2>] (<имя слота2> : <значение слота2>); B.30)
[<рольп>] (<имя слотап> : <значение слотап>).
Каждый фрейм можно рассматривать как семантическую сеть,
состоящую из выделенных вершин и связей. Верхний уровень
фрейма представляет соответствующее понятие, а последующие
уровни — терминальные слоты, которые содержат конкретные
значения.
В качестве примера рассмотрим следующую ситуацию:
«Студент Сидоров получил книгу Л.Н. Толстого «Воскресение»
в библиотеке им. Н.В. Гоголя, расположенной в Москве».
Описание данной ситуации может быть представлено в виде
фрейма:
ПОЛУЧЕНИЕ:
ОБЪЕКТ (КНИГА: (Автор, Л.Н. Толстой), (Название, Воскресение));
АГЕНТ (СТУДЕНТ: (Фамилия, Сидоров));
МЕСТО (БИБЛИОТЕКА: (Название, им. H.B. Гоголя),
(Расположение, г. Москва)).
70
Здесь ОБЪЕКТ, АГЕНТ и МЕСТО —- это роли, которые играют
слоты соответственно КНИГА, СТУДЕНТ и БИБЛИОТЕКА в
рамках фрейма ПОЛУЧЕНИЕ.
В семантической сета данной ситуации (рис. 2.7) можно выделить
три характерных уровня. На нулевом уровне представлены
конкретные значения сущностей ПО (Толстой, Воскресение, Сидоров и т.д.),
на первом — понятия, используемые для описания ПО (КНИГА,
СТУДЕНТ, БИБЛИОТЕКА), и на втором — собственно описываемая
ситуация ПОЛУЧЕНИЕ. Связи между отдельными понятиями,
участвующими в ситуации ПОЛУЧЕНИЕ, также имеют некоторые имена,
которые выражают роли понятий в рамках данной ситуации.
Еще раз подчеркнем, что прототипом фрейма в семантической
сети является подсеть, состоящая из некоторой сущности и
характеризующих ее свойств (события, его признаков и атрибутов).
Например, если под событием понимать ПОЕЗД №1,
отправляющийся из Санкт-Петербурга в 23 часа 55 минут и прибывающий в
Москву в 7 часов 55 минут, соответствующая ему подсеть
представляется графом, представленным на рис. 2.8.
Поезд №1 считается истинным событием, если имеют место
приведенные на рис. 2.8 значения атрибутов, т.е. он обладает
соответствующими свойствами. Как реляционная структура данных
этот граф представляется в табличной форме (табл. 2.2).
Таблица 2.2
Номер
поезда
1
Пункт
отправления
Санкт-Петербург
Пункт
назначения
Москва
Время
отправления
23-55
Время
прибытия
7-55
При представлении таблицы в виде фрейма поля записи
называются его слотами. Таблица содержит имена и значения слотов, а
ее название трактуется как имя фрейма.
Второй
уровень
Первый
уровень
Нулевой
уровень
Авто
1
Объект
/
Книга
1
р На
Л.Н.Толстой
Получение L
Агент
i
Студент 1
звание
1
Воскресение
V
Сидоров
Место
\
Библиотека
i
J Месторас-
1 положение
1 1 H.B. Гоголь 1
Москва
Рис. 2.7. Семантическая сеть ситуации ПОЛУЧЕНИЕ
71
Пункт отправления Время отправления
Санкт-Петербург 23-55
Поезд №1
Пункт назначения Время прибытия
Москва 7-55
Рис. 2.8. Пример подсети неоднородной семантической сети
Модель фрейма была предложена М. Минским с целью борьбы
с высокой размерностью сетевых моделей. Каждый фрейм (рамку,
скелет) можно рассматривать как фрагмент сети, объединяющий
сущности на основе семантической близости. Например, с
помощью фрейма можно описать такую локальную ситуацию, как
обстановка в комнате, при составлении сетевой модели квартиры.
Принципиальными особенностями фреймовой модели,
отличающими ее от реляционной модели данных, являются:
• возможность смешанного заполнения слотов константами
(как в базе данных) и переменными;
• возможность наличия пустых слотов;
• размещение в слотах указателей на другие фреймы
(наследование частей) для создания сети;
• размещение в слотах имен выполняемых процедур.
Использование аппарата ссылок позволяет реализовывать
сложные модели представления знаний путем детализации любых
понятий фреймов. Например, могут потребоваться знания о других
поездах. Тогда в слот вместо поезда №1 будет помещена ссылка на
список поездов. Там могут быть помещены сведения об уровне
сервиса, количестве свободных мест и т.д. В свою очередь, если
потребуется пояснить характеристики свободных мест
(плацкартное/купейное, верхнее/нижнее, поперечное/боковое и т.д.), по
ссылке заводится фрейм, содержащий эти характеристики.
Аналогичным образом детализируется уровень сервиса. Таким образом, с
помощью аппарата ссылок формируется иерархическая фреймовая
сеть. Дочерний фрейм, на который делается ссылка, находится в
отношении PART OF к своему родителю.
. Наличие процедур в слотах фрейма означает, что фреймовая
модель (ФМ) является смешанной моделью представления знаний,
в основу которой положена декларативная составляющая.
72
Фреймом-прототипом называется фрейм, у которого значения
всех или части слотов являются переменными ПО, а фреймом-э#с-
земпляром (или фреймом-примером) — фрейм, у которого значения
всех слотов являются константами. Этой классификации отвечают
верхняя и нижняя строка табл. 2.2 Фреймы-экземпляры находятся
в отношении IS А к фрейму-прототипу.
Типовая фреймовая модель (ФМ). Рассмотрим типовую ФМ (на
примере системы FMS).
1. Она состоит из иерархически связанной совокупности
фреймов — корневого (ROOT) и дочерних: нетерминальных (NOT
BOTTOM) и терминальных (BOTTOM). Фреймы сети делятся на
системные и оцениваемые. К системным относятся:
LISPPROC — хранение процедур;
TABLE — хранение таблиц;
FINDING — ввод признаков в режиме диалога;
IH AGG — продукционные правила для вычисления
промежуточных гипотез и их интерпретаторы.
База знаний — сеть фреймов с корневой вершиной (например,
DISEASE — в медицине).
2. Каждый фрейм имеет имя (уникальный идентификатор) и
тип (шаблон, или экземпляр класса).
3. Фрейм состоит из произвольного числа слотов с
уникальными именами. Слоты делятся на служебные (пользователь, дата
создания/модификации фрейма и т.д.), системные (редактирование
базы знаний, управление выводом) и информационные
(предметное знание). Обязательные слоты имеют фиксированные имена.
Остальные имена определяются пользователем. Стандартный
системный слот (АКО) указывает на роль фрейма (родитель, либо
дочерний фрейм, находящийся в отношениях IS А, или PART OF).
Информационные слоты имеют следующую структуру (поля
записи):
3.1. Имя слота.
3.2. Указатель наследования — задает способ наследования
значений атрибутов:
S(ame) — наследование значений данных фрейма верхнего
уровня (например, цвета «красный», «синий»).
R(ange) — диапазон значений ограничен во фрейме верхнего
уровня (например, от желтого до голубого).
U(nique) — слот наследуется, но данные в каждом фрейме могут
принимать любые значения;
I(ndependence) — без наследования;
73
0 (verride) — значение слота берется у фрейма верхнего уровня,
но если значение переопределить, то оно уже будет уникальным.
3.3. Поле тип данных определяет тип слота. Наиболее типичны:
REAL, INTEGER, BOOLEAN, TEXT, ATOM;
FRAME — указатель на фрейм;
TABLE — указатель на таблицу;
PROCEDURE (LISP) — процедура (LISP-функция) и т.д.
С помощью слотов типа FRAME строится фреймовая сеть
(указанием имени дочернего фрейма).
3.4. Поле значение содержит данные заданного типа с учетом
способа наследования. Если значением слота является процедура,
она инициируется (выполняется) только при явном обращении к
данному слогу во фрейме. В системе FMS она пишется на языке
LISP. Такая процедура называется присоединенной
процедурой-слугой. В частности, она может реализовывать специальный механизм
управления выводом.
Кроме слуг, существуют процедуры-демоны. Они запускаются
самостоятельно при выполнении определенного условия,
указанного в их типе. Например. IF__ADDED запускается при
подстановке в слот значения; IF_REMOVED запускается при удалении
значения; IF_NEEDED запускается, если в момент обращения к слоту
его значение отсутствует. Слоты могут быть изначально пусты и
заполняться по мере пополнения базы знаний.
Фреймы-примеры задают совокупность реализаций
фрейма-прототипа. Например, фрейм-прототип описывает в ФМ дом
структуру фрейма комната (как описание типов данных в языках
программирования), а описание конкретных комнат содержатся во
фреймах-примерах.
Рассмотрим, например, фрейм Секция 4 ФМ Конференция по
искусственному интеллекту.
При обращении к слоту докладчики и отсутствии информации
она запрашивается у пользователя. В случае добавления помещения
оно должно быть забронировано, при отказе — бронь снимается.
Во фреймовых моделях широко используется принцип
умолчания. При создании системы Конференция подразумевается, что
работа секций проходит в конференц-зале. Однако пользователь
может в любой момент изменить эту информацию. Для изменения
темы доклада используется присоединенная процедура. Через слот
Руководитель секции данный фрейм связан с фреймом Оргкомитет
конференции.
Основной механизм вывода из ФМ — сопоставление (matching).
Различают синтаксическое сопоставление, когда сравнивается струк-
74
тура единиц знания (фреймов или слотов), и семантическое
сопоставление, когда сравнивается содержимое этих единиц. Результат
сопоставления может быть бинарным (да/нет) или иметь
параметрический характер (введенный параметр отражает степень
сопоставимости образцов).
Рассмотрим вывод на примере медицинской системы,
состоящей из корневого фрейма DISEASE, семи фреймов для каждой
болезни (типа template) и фреймов-экземпляров для каждой болезни
(типа instance).
Вывод начинается передачей сообщения в слот LOGIC фрейма
DISEASE. При этом запускается присоединенная процедура
MAINLOGIC, которая последовательно передает сообщения всем
семи фреймам названий болезни. Из полученных на основе
анализа данных во фреймах-экземплярах результатов делается вывод о
наиболее вероятной болезни.
Существует ряд языков представления знаний, основанных на
ФМ. В них присоединенные процедуры реализуются на ЛИСПе. К
таким языкам относятся FRL, KRL и др. Фреймовую модель
можно создавать и на обычных языках программирования, например
C++.
Универсализм ФМ приводит к такому разнообразию
конкретных реализаций, что достоинства и недостатки определяются уже
не фреймовой идеологией, а конкретной реализацией.
Характерными чертами фреймовых языков являются:
1) представление иерархической модели понятий ПО и
отвечающей ей совокупности экземпляров;
2) реализация связей и закономерностей ПО присоединенными
процедурами;
3) семантическое сопоставление понятий при поиске по образцу.
В настоящее время универсальным средством для
представления знаний являются объектно-ориентированные языки
программирования, которые способны реализовать все особенности
фреймовой модели.
2.3. Процедурные модели представления
знаний
К типовым процедурным моделям представления знаний
относят, как правило, логические модели, реализуемые на языках
алгебры логики (исчисления высказываний и предикатов),
продукционные модели.
75
Логические модели представления знаний. При традиционном
подходе к представлению информации для некоторой задачи
приложений системный аналитик составляет алгоритм ее решения в
виде процесса, а также явно задает требуемые операции и
отношения между сущностями. Причем такое описание задачи
неотделимо от процесса ее решения, а соответствующие операции и
отношения определяются указанием конкретного способа их
вычисления.
Основное отличие логического способа представления знаний о
ПО заключается в отделении средств описания задачи от процедур
вычисления. Логическое представление не является описанием
процесса вычислений. Оно не содержит ни присваиваний, ни
условных выражений, ни циклов. Логическое представление
фрагмента ПО обычно представляет собой совокупность правил,
определяющих понятия и отношения между ними. Таким образом, в
основе логического представления лежит идея описания знаний о
ПО в виде некоторого множества утверждений, выраженных в виде
логических формул, и получение решения построением вывода в
некоторой формальной (дедуктивной) системе [46|. Интерпретатор
логических выражений, пользуясь логическим выводом, сам строит
необходимую цепочку вычислений на основе исходного описания.
Вычисление результата решения проблемы соответствует
такому доказательству существования искомого объекта, когда
требуемый объект строится явно.
Напомним, что связь между вычислениями и логикой можно
кратно выразить следующей формулой [74]:
Алгоритм = Логика + Управление,
где «Логика»» обозначает ту часть программы, которая моделирует
структуру предметной области, а «Управление» реализуется
интерпретатором, который делает выводы из логической части программы.
Значение логического подхода заключается в возможности
построения интерпретатора, работа которого не зависит от
логических формул, описывающих ПО, что принципиально отличается от
традиционного программирования, когда управляющая структура
уникальна для каждой вновь создаваемой программы.
Синтаксис логического способа представления знаний. Правила в
логическом представлении имеют вид
P0^Plf...,PB> B.31)
где Ро, Рь ..., Рп — атомарные формулы.
76
Определение 2.4. Логическая формула называется атомарной,
если она имеет вид P(tb ..., tn), где Р — n-арный предикатный
символ^ a tb t2,..., tn — либо переменная, либо константа, либо
составной терм вида f(tb t2, ..., tn), где f—n-арный функциональный
симэол.
Определение 2.5. Термами называют некоторые сущности,
которые могут быть простыми (простой терм вида 0 и сложными
(составной терм вида f (tb t2, ..., tn)).
В формуле B.31) Ро называют целью, а Рь Р2, ..., Рп —телом
правила. Предикаты Pi, Р2, ..., Рп — условия, которые должны быть
выполнены, чтобы достижение цели Р0 стало успешным.
Когда п = 0 (тело пусто и отсутствуют предварительные условия
достижения цели Р0), правило B.31) называется фактом. Если
правило имеет вид
*-Qi,Q2,...,Q„, B.32)
где Q — атомарные формулы и п > 0, то оно называется запросом.
Запрос интенсионально определяет множество таких объектов,
когда формула B.32) истинна.
Знания, которые могут быть представлены с помощью логики
предикатов, являются либо фактами, либо правилами. Для
представления предметной области в виде логических формул прежде
всего необходимо выбрать термы-константы, которые будут
определять объекты в данной области, функциональные и предикатные
символы, которые соответственно задают функциональные связи
объектов и отношения объектов.
При использовании логических методов сначала анализируется
структура предметной области, затем выбираются соответствующие
обозначения и в заключение формируются логические формулы,
представляющие закономерности рассматриваемой области.
Множество таких формул, по существу, будет являться логической
программой, содержащей информацию о ПО. В частности, в качестве
языка логического программирования можно использовать ПРОЛОГ,
а совокупность логических формул, состоящую из запроса,
множества фраз программы и интерпретатора языка, можно
рассматривать как алгоритм решения задач приложений. Причем запрос и
логические правила программы представляют собой множество
начальных формул алгоритма, а интерпретатор обеспечивает правила
преобразования этих формул.
Интерпретатор играет активную роль, осуществляя логические
выводы и тем самым реализуя отношения, определенные
предложениями логической программы [76].
77
Семантика логического программирования. Для выяснения
смысла логических программ необходимо каждой программе приписать
некоторое значение, вычисляемое программой. Возможны три вод-
хода к определению семантики логических программ:
декларативная семантика, процедурная (или операционная) семантика и
вычислительная семантика.
Декларативная семантика определяет такие значения
конкретных отношений, заданных логическими формулами, когда они
становятся истинными.
В соответствии с процедурной семантикой условия, входящие в
состав логической формулы, специфицируют процесс
установления истинного значения данной формулы, т. е. условия трактуются
как последовательность шагов, которые необходимо выполнить,
чтобы соблюдалось отношение, определяемое формулой.
При выполнении запроса интерпретатор применяет по
отношению к множеству логических формул некоторую стратегию
решения задачи, которая определяет поведение интерпретатора в
процессе обработки логической программы. Смысл логической прот
граммы, который проявляется в виде действий интерпретатора,
рассматриваемых как поведение некоторой абстрактной машины,
определяет вычислительную семантику.
Рассмотрим логическую формулу
P*-Q,R, B.33)
где Р, Q и R — некоторые предикаты.
С точки зрения декларативной семантики Р истинно, если Q и
R истинны, а с точки зрения процедурной семантики необходимо
сначала установить истинность Q (решить подзадачу Q), а
затем — установить истинность R (решить подзадачу R). Таким
образом, различие между декларативной и процедурной семантикой
заключается в том, что процедурная семантика определяет не только
логические связи между заголовком логической формулы и
условиями в ее теле, но также и порядок, в котором эти условия
обрабатываются. Так, для формулы B.33) сначала должна быть
установлена истинность Q, а затем истинность R.
Декларативный смысл логической программы определяет
истинность Р вне зависимости от порядка обработки условий Q и R,
так как все условия соединены логической операцией & и должны
соблюдаться одновременно.
Логический вывод. Принцип резолюции. Определение 6.
Логический вывод — это получение некоторой формулы исходя из
множества других логических формул путем применения правил вывода.
78
Для автоматизации логического вывода используют специальную
процедуру, называемую принципом резолюции [46].
Принцип резолюции применим к двум дизъюнктам, один из
которых содержит позитивную литеру, а второй — негативную с
тем же предикатом и одинаковым количеством аргументов.
Вычеркивая данную литеру, можно сформировать новый дизъюнкт,
называемый резольвентой, который является логическим следствием
исходных дизъюнктов. Например, если даны два дизъюнкта,
P(a,b)vQ(c,d), B.34)
-P(a,b)vR(c), B.35)
то можно получить их резольвенту в виде
Q(c,d)vR(c). B.36)
Фактически принцип резолюции распространяет общепринятое
правило вывода modus ponens на дизъюнкты с произвольным
числом литер. Действительно, так как P->Q равносильно -iP V Q, то
исходя из истинности Р в соответствии с принципом резолюции
непосредственно следует истинность Q.
Если есть множество логических формул Q и некоторая формула
Р, то для проверки выводимости Р из Q следует применить
следующую процедуру. Берем отрицание Р исходной формулы и, выбирая
некоторую формулу из множества Q, содержащую позитивную
литеру Р, строим их резольвенту, которая аналогичным образом может
быть использована для построения другой резольвенты, и т. д.
Повторяя данную процедуру, можно в конце концов вывести
некоторую формулу F, состоящую из одного предиката, и
противоположную формулу -iF, резольвента которых даст пустую формулу.
Это означает противоречие и, следовательно, выводимость
первоначальной формулы Р из множества формул ?2.
Фактически в основе приведенной выше процедуры
используется доказательство от противного: если в результате отрицания
исходной посылки мы получим противоречие, то это значит, что
исходная посылка истинна.
Для сопоставления логических формул, содержащих
переменные, необходима специальная процедура, называемая
подстановкой. Содержательно подстановка применяется к некоторому
логическому выражению и заменяет в нем каждое вхождение
переменной Xi на терм ti. Обозначим подстановку символом в, тогда
G= {xp= t!,x2:= t2,...,xn:= tn}. Подстановка 0 называется унифи-
79
катором атомарных формул Pi и Р2, если Pi = вРг. С помощью
процедуры унификации удается провести сопоставление двух
атомарных формул Pi и Р2.
Интерпретатор осуществляет построение логического вывода
путем последовательного применения правила резолюции к
текущему целевому утверждению и к некоторой логической формуле,
выбираемой из хранящейся в памяти программы. Если
интерпретатору удается вывести «пустую» формулу, то процесс вывода
заканчивается, и на выходе в качестве результата вьщаются те значения
переменных, которые были определены подстановками в
результате последовательных унификаций.
В качестве примера рассмотрим множество дизъюнктов вида
P(a,Y)vQ(a,Y), B.37)
Q(X,b)V-R(X,b), B.38)
W(b), B.39)
R(a,b). B.40)
Требуется установить выводимость из заданного множества
хорновских дизъюнктов формулы Р(а, Ь). Для этого берем
отрицание формулы Р(а, Ь) и строим ее резольвенту с формулой B.37).
Резольвента -iQ(a, b) может быть найдена, если использовать
подстановку
e1={Y:=b}.
Полученная формула может быть унифицирована с предикатом
Q(X, b) формулы B.38) путем использования подстановки
62={Y:=a},
что позволяет вывести новую резольвенту
-,R(a, b). B.41)
Резольвента формул B.40) и B.41) дает пустой дизъюнкт, что
означает противоречие. Так как добавление Р(а, Ь) к исходному
множеству дизъюнктов приводит к противоречию, то это значит,
что Р(а, Ь) является их следствием.
Особенности логических методов представления знаний.
Использование логики для представления знаний дает возможность
перейти от процедурного способа задания информации о предметной
области к спецификации отношений между объектами, которые су-
80
ществуют в реальном мире. При этом программа является
логической спецификацией задачи, а конкретное вычисление понимается
как запрос к этой программе. База знаний в соответствии с
логическим подходом к описанию знаний ПО представляет собой набор
логических формул. Добавление или уничтожение логических
формул означает модификацию базы знаний. Таким образом,
логические формулы могут рассматриваться как неделимые единицы для
манипулирования знаниями в таких системах.
Основное преимущество логических представлений — наличие
регулярных методов вывода, в терминах которых можно определять
процедуры доказательства.
Второе преимущество логических методов состоит в
возможности использования семантики, которая допускает разную трактовку
в зависимости от целей логических представлений. Декларативная
семантика может применяться в том случае, когда требуется
решить задачу понимания ПО, а процедурная семантика
обеспечивает применение использования вычислительных машин для
доказательства выводимости утверждений из логически заданных
закономерностей о данной ПО.
Третье достоинство логических представлений заключается в
простоте, лаконичности и единообразии употребляемой нотации
для представления знаний о ПО, что обеспечивает возможность
создания однозначно интерпретируемых описаний баз знаний.
Основной недостаток логических методов состоит в
отсутствии принципов структуризации логических формул,
составляющих основу базы знаний. Для больших баз знаний данное
требование весьма существенно, так как без его соблюдения
невозможно обеспечить цельность и непротиворечивость получаемых
представлений.
Продукционная модель представления знаний. Она является
развитием логических моделей в направлении эффективности
представления и вывода знания. В общем виде под продукцией
понимается выражение вида
(i); Q; Р; А->В; N.
Здесь
А-»В — ядро, являющееся основным элементом продукции.
Обычно оно интерпретируется фразой Если А, то В. Под А обычно
понимается условие существования заключения В;
(i) — имя продукции, с помощью которого данная продукция
выделяется из множества продукций. Именем может быть как
номер продукции, так и имя понятия, которому она соответствует;
6 — 3466 81
Q — сфера применения продукции, описывающая ПО или
ситуацию. Это позволяет систематизировать продукции, что
облегчает работу с системой продукций;
Р — условие применимости ядра продукции (предикат). Если Р
истинно, ядро продукции активизируется;
N — постусловие продукции. Оно представляет собой
процедуру, которую следует выполнить после успешной реализации ядра
(необязательно сразу). Например, после покупки вещи у их
количество следует уменьшить на 1.
Все части продукции, кроме ее ядра, являются факультативными.
В зависимости от оценок реализации ядро делится на
обязательное и необязательное. В качестве оценок реализации могут
применяться вероятность, возможность, коэффициент
уверенности. Например: Если А, то с большой долей уверенности
реализовать В.
Взаимосвязанный набор продукций образует систему.
Основной проблемой вывода знания в системе продукций является
выбор для анализа очередной продукции. Проиллюстрируем
проблему следующим примером:
а) А-»В; б) B&D-»A; в) AvB->D; г) D-»C.
Если истинно условие А, то кандидатами на выполнение
являются продукции а) и в), если же истинны условия В и D, то — б),
в) и г).
Этот пример показывает, с одной стороны, неоднозначность
выбора очередной продукции, а с другой — возможность
распараллеливания вычислений (одновременной реализации группы
продукций). Конкурирующие продукции образуют фронт.
Если порядок выполнения продукций важен, то имеется
возможность в постусловиях указывать номера следующих продукций.
В этом случае система продукций превращается в обычную
программу. В противном случае для выбора очередной продукции
применяются различные эвристики.
1. Приоритетный выбор. Приоритет может устанавливаться
статически или динамически. В первом случае продукции
упорядочиваются в процессе построения модели в соответствии со
спецификой ПО. Динамические приоритеты вырабатываются в процессе
функционирования системы продукций, например в зависимости
от времени нахождения продукции во фронте. Статические
приоритеты используются, в частности, в системе PROLOG.
82
2. Принцип метапродукций. Он является разновидностью
предыдущего принципа. На основе анализа заданных признаков в
условиях продукций, находящихся во фронте, метапродукции
устанавливают порядок их выполнения. Если признаки, подлежащие
анализу, фиксируются в рабочей памяти, принцип сводится к
«классной доске».
3. Принцип стопки книг. Он основан на той идее, что наиболее
часто используемая продукция является наиболее полезной.
Готовые продукции образуют «стопку», в которой порядок определяется
частотой ипользования продукций в прошлом. В этом методе
нужно накапливать частоты. Этот принцип используется в
планирующих системах роботов для систем относительно независимых
продукций.
4. Принцип наиболее длинного условия. Из фронта выбирается та
продукция, у которой стало истинным наиболее длинное условие
выполнимости ядра. Принцип основан на той идее, что частные
правила, относящиеся к узкому классу ситуаций, важнее общих
правил, относящихся к широкому классу ситуаций. Используется в
системах продукций, упорядоченных в отношении частное-общее.
Продукционная модель имеет следующие преимущества:
• простоту и ясность основной единицы базы знаний
(БЗ) — продукции;
• независимость продукций и легкость модификации БЗ;
• строгость, простоту и изученность механизма логического
вывода;
• асинхронность и естественный параллелизм
функционирования, что дает возможность использовать параллельные
вычисления.
К ее недостаткам относятся:
• малая степень структуризации БЗ (всего 1—2 уровня знаний);
• неясность взаимных отношений продукций;
• сложность оценки целостного образа знаний (выявление
противоречий);
• неуниверсальность (не всякое знание удобно представлять в
виде продукций).
Наибольшее применение для реализации продукционных
моделей получил язык ПРОЛОГ. В нем используется механизм
обратного вывода. Для разрешения конфликтов используется
статический приоритет, задаваемый программистом путем порядка записи
правил.
6*
83
Продукционно-фреймовая модель представления знания. В
соответствии со своим названием эта модель является смешанной, что
позволяет сочетать преимущества составляющих моделей. Такая
модель реализована в инструментальной системе Leonardo,
предназначенной для создания, отладки и функционирования экспертных
систем [71].
База знаний этой модели состоит из совокупности продукций
(правил), задающих причинно-следственные отношения между
простыми и сложными объектами (сущностями). В качестве
сложных объектов используются фреймы. На основе объектов-условий
определяется значение выделенного объекта цель, играющее роль
одной из гипотез.
Вывод истинной гипотезы в этой модели может осуществляться
в двух направлениях: прямом (от правил) и обратном (от цели), а
также смешанным образом. При прямом выводе осуществляется
обход дерева условий от корня до соответствующей заданным
условиям гипотезы. При обратном выводе выполняется проверка
истинности условий, при которых предполагаемая гипотеза
оказывается истинной.
Если степень уверенности в истинности объектов менее 1, то
при выводе подсчитывается степень уверенности выбранной
гипотезы.
Объекты в Leonardo имеют следующие особенности;
• простые объекты имеют два атрибута: имя и значение — и
типы: real, text или list;
• числовые объекты распознаются в правилах с помощью
операторов сравнения (=, <, <=, >=, >, О), а текстовые — с помощью
ключевого слова is.
Для распознавания списковых объектов используются операторы:
includes (include) does not includes (do not include)
excludes (exclude) does not excludes (do not exclude).
Пример [44].
if осадки is дождь
then ВремяГода includes «весна, лето, осень»
Сложный объект имеет имя и множество атрибутов,
размещаемых в слотах фрейма. Фреймы делятся на фреймы-объекты типа
real, text или list и фреймы-процедуры.
Стандартный фрейм-объект имеет следующий вид:
1. Name: автомобиль (пример)
84
2. LongName: (расширенное имя)
3. ТУре: (real, text, list, procedure)
4. Value: (текущее значение, присвоенное либо при
компиляции, либо при вводе)
5. Certainty: (степень уверенности от 0 до 1)
6. DerivedFrom: (источник означивания: правило, ввод,
фиксированное, default)
7. DefaultValue: (значение, присваиваемое при ответе unknown)
8. FlxedValue: (значение, присваиваемое независимо от
истинности условия)
9. AllowedValues: (разрешенные значения — список, диапазон)
10. Compute Value: (имя процедуры, исполняемой, если значение
не выведено)
11. ОпЕггог: (сообщение при выходе за допустимые значения)
12. QueryPromt: (вопрос пользователю — одна строка текста)
13. QueryPrefase: (пояснение к вопросу)
14. Expansion: (пояснение объекта, его роли и связей —
выводится по F7)
15. Commentary: (произвольный комментарий)
16. Introduction: (заставка консультации во фрейме — параметре
функции seek)
17. Conclusion: (финальное сообщение, например при задании
[температура хх] выводится двузначное число)
Слоты 1, 3, 4, 5, 6 являются защищенными (не могут
редактироваться).
Слоты 9, 11, 12, 13, 16, 17 используются при формулировании
вопросов пользователю.
Примеры задания значений в слоте 9:
• Список 5 or 7 or 10;
• Диапазон >= 5 and <= 10.
Дополнительные слоты:
1. BoxWidtb: 25 (ширина окна ответа, заданная на 25 символов)
2. ForbidUnk: (по умолчанию допускает в качестве ответа
unknown)
3. Form: (задает форму вывода, должен быть последним во
фрейме)
4. IntroAttrib: (задает цвета символов и фона)
5. Layout: (объект используется в роли буфера в командах
чтения)
6. RulcSct: (набор правил для вывода значения объекта)
В слоте Form: могут помещаться:
85
1) свободный текст;
2) текущее значение объекта;
3) рамки окна.
Для распечатки текущего значения объекта командой Formprint
(объект) в слоте Form: задается имя объекта в квадратных скобках,
например [НомерСлужащего]. Форматы значений по умолчанию
для текстов — по числу символов в нем, для чисел — 11 символов
B — для дробной части). Формат переопределяется следующим
образом: [НомерСлужащего 125], [зарплата хххххххх].
Слот Layout: должен быть последним во фрейме. Объект-буфер
и все объекты, включаемые в этот слот, должны быть глобальными.
Пример формирования слота Layout:
Name: ЗаписьДанныхСлужащего
LongName:
Type:
Value:
Certainty:
DerivedFrom:
Layout:
Описание формата записи данных служащего содержит 57
символов. Из них первые 25 символов содержат имя служащего,
которое должно пересылаться в объект ИмяСлужащего. Символы с 26
по 30 содержат ЗарплатуСлужащего, которая должна пересылаться
в объект ЗарплатаСлужащего и т.д.
Таким образом:
ИмяСлужащего 25
ЗарплатаСлужащего 5
Отдел 12
Дата поступления 15
Эти данные считываются процедурой ЧитатьДанныеСлужа-
щего.
Если фрейм содержит слот Rule Set:, то в случае обращения к
этому фрейму при обработке правил последняя прерывается и
начинается обработка правил, заключенных в слоте RuleSet:. Если
при их обработке устанавливается значение этого фрейма, то
выполняется возврат к обработке, из которой пришли во фрейм. Если
в правилах фрейма есть имя другого объекта со слотами RuleSet:,
то управление передается в него и т.д.
86
Пример записи фрейма со слотом RuleSet:
Name: ДействиеОператора
LongName: Действие, предпринимаемое оператором станка
Туре: Текст
RuleSet:
Эти правила определяют действие, которое должно
выполняться оператором станка в неблагоприятной ситуации:
if КрасныйСвет is мигает
then ДействиеОператора is «выключить станок»
2.4. Приобретение знаний
Приобретением знаний называется выявление знаний из
источников и преобразование их в нужную форму, а также перенос в
базу знаний ИнС. Источниками знаний могут быть:
а) книги, архивные документы, содержимое других баз знаний
и т.п., т.е. некоторые объективизированные знания, приведенные к
форме, которая делает их доступными для потребителя;
б) экспертные знания, которые имеются у специалистов, но не
зафиксированы во внешних по отношению к ним хранилищах
(экспертные знания являются субъективными)',
в) эмпирические знания (также субъективный вид знаний),
которые получаются путем наблюдения за окружающей средой (если у
ИнС есть средства наблюдения) (рис. 2.9).
Ввод в БЗ объективизированных знаний не представляет
особой проблемы, выявление и ввод субъективных и особенно
экспертных знаний достаточно трудны. Чтобы разработать
методологию приобретения субъективных знаний, получаемых от эксперта,
надо четко различать две формы репрезентации (представления)
знаний.
Одна форма связана с тем, как и в каких моделях хранятся эти
знания у человека — эксперта. При этом эксперт не всегда
осознает полностью, как репрезентированы у него знания. Другая форма
связана с тем, как инженер по знаниям (когнитолог),
проектирующий ИС, собирается их описывать и представлять. От степени
согласованности этих двух форм репрезентации между собой зависит
эффективность инженера по знаниям. В когнитивной психологии
изучаются формы репрезентации знаний — когнитивные
структуры знаний, характерные для человека. Примерами могут служить:
87
мационные
поля
—^-
—*¦"
Объективизированные
Книги,
документы
знания
Субъктиви-
Экспертные
знания
зированные
Эмпирические знания
знания
Рис. 2.9. Схема приобретения знаний
• представление класса понятий через его элементы (например,
понятие «птица» репрезентируется рядом «чайка, воробей,
скворец,...»)
птица = <чайка, воробей, скворец,...>;
• представление понятий класса с помощью базового
прототипа, отражающего наиболее типичные свойства объектов класса
(например, понятие «птица» репрезентируется прототипом «нечто с
крыльями, клювом, летает,...»)
птица = <нечто с крыльями, с клювом, летает,...>;
• представление с помощью признаков (для понятия «птица»,
например, наличие крыльев, клюва, двух лап, перьев, ...)
птица = <крылья, клюв, две лапы, перья,...>.
Кроме понятий репрезентируются и отношения между ними.
Как правило, отношения между понятиями определяются
процедурным способом, а отношения между составляющими понятий
(определяющими структуру понятия) — декларативным способом.
Наличие двух видов описаний заставляет в моделях представления
знаний одновременно иметь обе компоненты, например
семантическую сеть и продукционную систему, как это представлено в
когнитивной модели (рис. 2.10).
88
Когнитивная
модель
Семантическая
сеть
Продукционная
система
Рис. 2.10. Представление когнитивной модели
При приобретении знаний важную роль играет так называемое
поле знаний, в котором содержатся основные понятия, используемые
при описании предметной области, и свойства всех отношений,
используемых для установления связей между понятиями. Поле
знаний связано с концептуальной моделью проблемной области, в
которой еще не учтены ограничения, которые неизбежно возникают
при формальном представлении знаний в БЗ. Переход от описания
некоторой области в поле знаний к описанию в БЗ аналогичен
переходу от концептуальной модели БД к ее логической схеме, когда уже
зафиксирована СУБД. Важно отметить, что переход
непосредственно к формальным представлениям в БЗ без этапа концептуального
описания в поле знаний проводит к многочисленным ошибкам, что
замедляет процесс формирования БЗ ИнС (рис. 2.11).,
Относительно способа извлечения знаний: документы относят к
пассивному, а специалистов — к активному источнику знания.
Относительно способа передани знания документы относят к
письменным, а специалистов к устным источникам знания. Термин
извлечение знаний трактуется как выявление закономерностей в носителе
знания, а термин приобретение знаний подразумевает
дополнительное построение компьютерной модели знания.
Проблема приобретения знаний изучается в рамках инженерии
знаний. Схема приобретения знаний может быть представлена
следующим образом:
Носитель информации —> Посредник —> Модель знания
Под посредником, участвующим в процессе построения модели
знания, обычно понимается человек, который обладает специфи-
Предметная
(проблемная)
область
—*-
-^—
Концептуальная
модель
проблемной
области
—^-
Поле
знаний
—*-
-^—
Модели
формализации
знаний
—^
¦^—
База
знаний
Рис. 2.11. Формирование БЗ в ИнС
89
ческими знаниями и называется инженером по знаниям или ког-
нитологом.
Посредник в приобретении знаний используется по следующим
причинам.
1. Эксперт владеет субъективными знаниями, которые не всегда
можно выразить словами. К ним относятся навыки и умения как
результат приобретенного опыта. Обычно зная, что из А следует В
(А—»В), эксперт упускает промежуточные звенья цепочки вывода:
A-»R, R->Q, Q->B.
2. Известно, что объясняющий в процессе объяснения сам
лучше начинает понимать проблему, так как при ассоциативном
мышлении наглядные образы получают словесную интерпретацию.
3. Посреднику, который владеет меньшим объемом знаний и
деталей о ПО, проще постепенно строить целостную модель ПО.
В качестве посредника между носителем знания о ПО и
инструментарием, используемым для построения модели ПО, могут
использоваться:
• инженер по знаниям (когнитолог);
• специальная программа.
По отношению к носителю предметного знания посредник
должен обладать метазнанием, к которому относится знание
следующих научных областей:
• системного анализа;
• математики;
• моделей знания;
• машинного представления моделей знания;
• основ проектирования программных систем;
• психологии (при работе с экспертом);
• лингвистики (при работе с текстами);
• изобразительного искусства (при работе с графикой);
• музыки (при работе с музыкальным материалом).
Помимо метазнания, посредник должен приобрести первичные
знания о конкретной формализуемой ПО.
Специалист, обладающий перечисленными знаниями, обычно
называется системным аналитиком.
Преимуществом когнитолога перед специальной программой
извлечения знаний и построения модели ПО является его
универсальность по отношению к предметным областям и моделям
знаний. С другой стороны, программа дает возможность
специалисту-предметнику напрямую проектировать модель знания ПО.
При этом необходимо его обучение основам построения моделей
90
знания. Использование программ сужает область применения
когнитолога как системного аналитика, но не может исключить
его совсем.
Таким образом, приобретением знаний называют процесс
получения знаний от эксперта или каких-либо других источников и передача
их в ИнС. Однако наряду с термином «приобретение» сегодня
широко используются и другие термины для обозначения этого
процесса, например: «извлечение», «получение», «добыча»,
«формирование знаний». В англоязычной литературе по ИнС используются в
основном два термина: acquisition (приобретение) и elicitation
(извлечение, выявление, установление).
Для преодоления терминологических различий и достижения
общности описания этих сложных процессов воспользуемся
предположениями о трех стратегиях получения знаний при разработке
ИнС [28,43], суть которых представлена на рис. 2.12.
Таким образом, целесообразность использования конкретного
термина может быть описана тремя правилами.
Правило 1. Если при разработке ИнС процесс получения
знаний от экспертов (или каких-либо других источников)
осуществляется без использования компьютерных средств поддержки этого
процесса путем непосредственного контакта инженера по знаниям
и источника знаний, то уместно говорить об извлечении знаний.
Правило 2. Если при разработке ИнС процесс получения
знаний от источников знаний осуществляется с использованием
специальных программных средств поддержки деятельности инженера
по знаниям и эксперта, то уместно говорить о приобретении
знаний.
Этапы разработки ИнС
Получение знаний
JL
Без применения
компьютера
Извлечение
знаний
A-я стратегия)
С использованием специальных
программных средств
i
Приобретение
знаний
| B-я стратегия)
Формирование
знаний
C-я стратегия)
Рис. 2.12. Три стратегии получения знаний при разработке ИнС
91
Правило 3. Если при разработке ИнС процесс получения
знаний от источников знаний осуществляется с использованием
программ обучения при наличии репрезентативной (т.е. достаточно
представительной) выборки примеров принятия решений в ПО, то
уместно говорить о формировании знаний.
Наиболее широкую трактовку имеет термин «приобретение».
Как показано в работе [1], приобретение знаний может
характеризоваться следующими аспектами.
1. Фазы приобретения знаний.
2. Модели приобретения знаний.
3. Номенклатура приобретения знаний.
4. Уровни знаний.
5. Средства отладки знаний.
Аспекты 1 и 2 носят больше методический и технологический
характер, аспекты 3 и 4 — теоретический, а аспект 5 имеет
специфический характер, определяемый инженерными особенностями
разработки той или иной ИнС. Рассмотрим подробнее фазы и
модели приобретения знаний.
Несмотря на существование различных точек зрения на число
фаз в процессе приобретения знаний, большинство исследователей
выделяют три фазы, отражающие изменение функций участников
проектирования ИнС на данном этапе (т.е. инженера по знаниям и
эксперта):
предварительная фаза — это фаза собственно извлечения знаний
из источника знаний на домашинных этапах разработки ИнС
(идентификация проблемы, получение знаний, структурирование,
формализация);
начальная фаза — это фаза приобретения знаний, которая
осуществляется на этапе реализации прототипа ИнС и обеспечивает
наполнение ИнС знаниями об области экспертизы;
фаза наполнения — это фаза, выполняемая в основном на этапах
реализации и тестирования и связанная с решением таких задач,
как:
обнаружение неполноты, неточности или противоречивости
знаний, используемых ИнС;
извлечение новых знаний, устраняющих обнаруженные
«нефакторы»;
преобразование новых знаний в вид, понятный ИнС.
Иными словами, в широком смысле под приобретением знаний
понимаются все вышеперечисленные фазы, а в узком
смысле — только фаза накопления, когда происходит непосредственная
92
передача знаний в действующий прототип ИнС, находящийся на
этапах реализации и тестирования.
Рассмотрим самую сложную фазу —фазу извлечения знаний,
процессы которой в отличие от процессов других фаз не поддаются
формализации и осуществляются вручную, оставаясь больше
искусством, чем наукой. При этом разработчикам ИнС (инженерам
по знаниям) приходится практически самостоятельно
разрабатывать методы извлечения знаний в каждом конкретном случае,
сталкиваясь со следующими трудностями:
неудачный способ извлечения знаний, не совпадающий со
структурой знаний в данной области;
значительное упрощение «картины мира» эксперта;
неумение наладить контакт с экспертом;
терминологические проблемы;
отсутствие целостной системы знаний и неадекватная модель
(язык) представления знаний;
неувязки организационного, финансового и др. характера.
Для того чтобы разобраться в природе извлечения знаний, в
работе [28] предлагается выделить три основных аспекта этой
процедуры:
психологический, в рамках которого рассматривают три слоя
психологических проблем, возникающих при извлечении знаний:
контактный, процедурный, когнитивный;
лингвистический, в рамках которого рассматривают слои
важных для инженерии знаний проблем (проблема «общего кода»,
понятийная структура, словарь пользователя);
гносеологический, в рамках которого рассматривают отдельные
закономерности процессов отражения действительности в
сознании человека (описание и обобщение фактов, установление связей,
построение модели, объяснение и предсказание явлений).
Следует отметить, что в большинстве случаев извлечение
знаний осуществляется инженером по знаниям в естественном
взаимодействии с экспертом, причем деятельность инженера по
знаниям направлена на психостимуляцию поля знаний (когнитивного
поля) в сознании эксперта с целью либо актуализировать и верба-
лизировать скрытые знания, либо оценить знания, предъявляемые
непосредственно инженеру по знаниям.
В общем случае, как показано на рис. 2.13, построение поля
знаний, т.е. некоторого материального представления извлеченных
из эксперта знаний в полуформализованном виде, является
финальной стадией получения знаний от эксперта (этот этап принято
называть структурированием).
93
Область
пертизы
(действительность
Получение знаний
Модель
мира
эксперта
Модель
мира
инженера
по знаниям
Поле
знаний
Модель
знаний в
ИнС
W
тг
ft
Этап
извлечения знаний
Рис. 2.13. Схема передачи знаний в ИнС
Этап структу- Этап форма-
рирования лизации
Следует заметить, что в начале рассматриваются в основном
отображения 12 и I3 (Ii изучают психология и философия, L*
рассматривается позднее). Если описать h и Ь в терминологии ИнС,
то мы будем иметь дело с превращениями некоторого экспертного
знания 3hi (в памяти человека) и теоретического опыта Зн2 (книги,
учебники и т.д.) в поле знаний Знз, которое есть материализация
модели мира инженера по знаниям.
Кроме учета различных аспектов извлечения знаний, важную
роль играют и те методы, с помощью которых они могут быть
получены из источников знаний.
Классификация методов получения знаний. На сегодня не
существует единой классификации методов извлечения знаний. Целый
ряд интересных предложений на этот счет можно найти в работах
[1, 12—15, 25—28, 34—35, 37]. На рис. 2.14 приводится
модифицированная и уточненная в [43] классификация методов получения
знаний, описанная в работе [28]. На основе этой классификации
каждый инженер по знаниям сможет в зависимости от конкретной
задачи выбрать подходящий метод.
В основе приведенной классификации лежат принципы
деления:
по источникам знаний;
по активной или пассивной роли, выполняемой участниками
процесса извлечения знаний;
по использованию индивидуальных или групповых мнений
экспертов;
по специфике обработки полученных результатов;
по стратегии навигации по письменному
проблемно-ориентированному тексту.
Методы, а точнее процедуры, извлечения знаний определяются,
в первую очередь, самой природой источника знаний, а также ха-
94
Извлечение знаний
Коммуникативные методы
Пассивные
Наблюдения:
за реальным
процессом;
за имитацией
Анализ протоколов
«мыслей вслух»
Лекции
1
Прямые
1
Активные
i
Групповые
Индивидуальные
Круглый стол
«Мозговой штурм»
Экспертные игры
(ролевые игры в
группе)
Анкетирование
Интервью
Свободный
диалог
Игры с экспертом
Текстологические методы
1
Косвенные
Многомерное
шкалирование
Иерархическая
кластеризация
Построение
взвешенных
ситуаций
Ранжирование
деревьев
выбора
Анализ
репертуарных
решеток
Инкрементальный
(пошаговый)
анализ текста
Броузинг
(просмотр текста по
сигнализирующим
лексемам и
синтаксическим
конструкциям)
Рис. 2.14. Классификация методов извлечения знаний
рактеристикой предметной области и личностными особенностями
инженера по знаниям и эксперта. Например, с точки зрения
психологической характеристики выделяют три типа экспертов:
мыслитель (ориентирован на интеллектуальную работу, учебу,
теоретические обобщения);
собеседник (общительный, открытый человек, готовый к
сотрудничеству);
практик (предпочитает активные действия, хорошо реализует
замыслы других, результативен).
Для характеристики предметных областей можно
воспользоваться критерием структурированности и выделить:
хорошо структурированные области, обладающие устоявшейся
терминологией, четкой аксиоматизацией, широким
использованием математического аппарата;
среднеструктурированные области с развивающейся теорией,
определяющейся терминологией, явными взаимосвязями между
явлениями;
слабоструктурированные области с богатой эмпирикой,
размытой терминологией, скрытыми взаимосвязями, с большим
количеством «белых пятен».
Рассмотрим кратко каждый из упомянутых методов. Группа
коммуникативных методов ориентирована на взаимодействие
инженера по знаниям (ИЗ) с экспертом. Она охватывает все виды
контактов между ними. Текстологические методы предназначены
для извлечения знаний из текстов.
Коммуникативные методы относительно активности ИЗ в
процессе приобретения знаний делятся на две группы. Пассивные
методы подразумевают, что ведущая роль в этой процедуре
передается эксперту, а инженер только протоколирует рассуждения
эксперта во время реальной работы либо записывает то, что эксперт
желает рассказать.
Активные методы в зависимости от числа экспертов делятся на
индивидуальные и групповые. Групповые методы отличаются тем,
что помимо индивидуальных контактов с экспертами ИЗ
применяет и групповое обсуждение вопросов, относящихся к
анализируемой ПО.
Приведенные в классификации методы могут применяться как
по отдельности, так и комплексно (даже во время одного сеанса
работы).
Рассмотрим суть методов, приведенных в классификации.
96
Коммуникативные методы. Наблюдение. Оно может вестись под
управлением эксперта за реальным процессом или за его
имитацией. Наблюдение за имитируемым процессом используется в тех
случаях, когда участие ИЗ в реальном процессе невозможно,
например, по причине этики или недоступности (космические
исследования).
Этот метод может потребовать от ИЗ:
1) техники стенографирования и хронометрирования;
2) серьезного предварительного знакомства с ПО.
Полученные протоколы сеансов расшифровываются и
обсуждаются с экспертом. Это единственный «чистый» метод, так как
исключается вмешательство ИЗ в действия эксперта.
Анализ протоколов «мыслей вслух». Эксперт не просто
комментирует свои действия, но и пытается объяснить, как это решение
было найдено. ИЗ протоколирует все слова эксперта. Реже
используется диктофон, так как психологически это может нарушить
атмосферу доверительности. Этот метод удобен для эксперта, так как
позволяет ему показать свои умения, эрудицию. Однако не каждый
эксперт способен объяснить свои действия. От ИЗ требуются те же
навыки, что и при наблюдениях.
Лекции. Это наиболее естественный способ передачи знаний, но
он может быть применен только с экспертом, имеющим опыт
преподавания. У эксперта появляется богатый простор для
самовыражения. Должны быть лишь сформулированы тема и задача лекции.
Лектор может тщательно подготовиться к лекции, структурировать
темы ПО. Роль ИЗ сводится к ведению конспекта, в котором
фиксируется все наиболее существенное, касающееся данной области
знания. По ходу лекции ИЗ задает вопросы. От умения правильно
их сформулировать зависит эффективность усвоения экспертного
знания.
Анкетирование. Это наиболее стандартизированный метод. Его
преимуществом является возможность сбора информации от
нескольких экспертов.
Богатый опыт анкетирования накоплен в психологии и
социологии. К анкете предъявляется ряд требований:
1) она не должна быть монотонной (вариация форм вопросов,
смена тематики и т.д.);
2) должна быть приспособлена к языку экспертов;
3) должна быть продумана последовательность вопросов, так
как они влияют друг на друга;
4) допускается избыточность вопросов с целью перепроверки
ответов.
7 — 3466
97
Интервью. Это специфическая форма общения ИЗ и эксперта,
в которой инженер по знаниям задает эксперту серию заранее
подготовленных вопросов. На качество интервью влияют:
1) язык вопроса (понятность, лаконичность, терминология);
2) порядок вопросов (логическая последовательность и
немонотонность);
3) уместность вопросов (этика, вежливость).
Свободный диалог. Это метод извлечения знаний в форме беседы
ИЗ с экспертом, в которой нет жесткого регламентированного
плана и вопросника. Большое значение имеет психологический
фактор, выражающийся в умении ИЗ расположить к себе собеседника,
внушить ему заинтересованность и доверие. Свободное
варьирование тем и вопросов предполагает подготовленность ИЗ к диалогу.
Во время диалога следует выбрать правильный темп беседы, не
утомляющий эксперта.
Игры с экспертом. Игра — это вид человеческой деятельности,
условность которой позволяет отвлечься от серьезности намерений
и результатов. В игре с экспертом ИЗ может брать на себя
различные роли. Это может быть роль ученика в игре Учитель и ученик.
Эксперт выявляет и исправляет ошибки ученика. В игре Медицина
ИЗ может взять на себя роль врача, ставящего диагноз, а
эксперт — роль консультанта и т.д. Инициатива в выборе игры
остается за ИЗ. Групповые методы в принципе могут оказаться более
результативными ввиду суммирования знаний нескольких экспертов.
Круглый стол. Он заключается в обсуждении проблем ПО в
присутствии привлеченных экспертов, обладающих равными
правами. Роль ИЗ сводится к организации обсуждения: слежению за
регламентом, управлению последовательностью выступлений, к
соблюдению темы и корректности выступлений. Полезно
документировать обсуждение записью выступлений на магнитофон.
«Мозговой штурм». Он является эффективным методом с точки
зрения активизации мышления. Штурм обычно длится около 40
минут. Участникам (до 10 человек) предлагается высказывать
любые идеи, вплоть до фантастических, на заданную тему, причем
критика запрещена. Регламент выступления участников — до 2
минут. Основной девиз метода: чем больше идей, тем лучше. Обычно
идеи оцениваются группой экспертов, не участвовавших в их
генерации. Метод эффективен для новых ПО.
Ролевые игры. Они сводятся к обычным деловым играм,
используемым, например, для обучения персонала. В них сами эксперты
распределяют между собой роли.
98
Текстологические методы. Группа текстологических методов
объединяет методы извлечения знаний, основанные на изучении
специальных текстов из учебников, монографий, статей, методик и
других носителей профессиональных знаний.
Задачу извлечения знаний из текстов иногда формулируют как
задачу понимания и выделения смысла текста. Эта область
инженерии знаний тесно взаимодействует с компьютерной
лингвистикой и таким направлением исскуственного интеллекта, как
обработка естественного языка.
Представим схему извлечения знаний из текста в следующем
виде:
Mi -» Вербализация —> Текст —> Понимание —» Мг,
Mi — модель мира автора текста;
М2 — модель, возникающая при чтении текста (модель ИЗ).
Модели Mi и М2 не могут совпадать в силу искажения смысла
при вербализации Mi и интерпретации М2. Она разная у двух ИЗ.
Научный текст строится из следующих основных компонент:
a) наблюдения объективной информации;
b) системы научных понятий;
c) взглядов и опыта автора;
d) общих мест;
e) заимствований (материалов из других источников).
Отсюда модель автора можно представить кортежем Mi =
= <а, Ь, с, d, e>.
Модель ИЗ формируется из экстракта <а, Ь, с, е>'
прочитанного текста и индивидуальных свойств ИЗ, характеризуемых
следующими компонентами:
f) личным опытом;
g) общенаучной эрудицией;
h) предварительными сведениями о ПО;
Таким образом, модель ИЗ имеет вид
М2 = [<a,b,c,e>/,<f,g,h>>].
Разница между моделями Mi и М2 очевидна, что
свидетельствует о неполном соответствии приобретаемой и исходной
информации.
Для ИЗ можно предложить следующую последовательность
работы с текстовыми источниками.
1. Составление списка базовой литературы для ознакомления с ПО.
2. Выбор текста для извлечения знаний.
7* 99
3. Беглое прочтение текста. Для определения значения новых
слов используются консультации со специалистами или
привлечение справочной литературы.
4. Внимательное прочтение текста с выписыванием ключевых
слов и выражений («смысловых вех»).
5. Определение связей между ключевыми словами, разработка
макроструктуры текста в форме графа (гипертекста) или реферата.
6. Формирование модели знаний.
Характер источников влияет на понимание текста. Проще всего
работать с учебниками, в которых знания хорошо
структурированы, а субъективные факторы минимальны. Анализ документов, с
одной стороны, облегчен заданностыо структуры, а с другой —
обычно затруднен сжатостью изложения и отсутствием
комментариев. Наиболее сложно анализировать научные статьи.
Прямым приобретением знаний называется подход, при котором
посредником между источником и БЗ является компьютерная
система. Поскольку этот подход реализован в системе SIMER-
MIR, изложим его применительно к принятой в ней модели
знаний, а именно интенсиональной неоднородной семантической сети
(ИНСС). Она описывается четверкой символов: M=<A,RH,Rf,R€>,
которые представляют собой событие А, отношение
инцидентности между ними RH, функцию Rf, характеризующую их свойства, и
Re — отношение принадлежности между событиями и свойствами
(функциями).
Интенсиональная неоднородная семантическая сеть строится с
помощью интерактивного интерпретатора экспертизы (ИИЗ).
Объектами интерпретации являются имена предметов и процессов,
их свойства, области значений свойств и отношения на множестве
предметов и процессов. В ИИЗ используется стратегия прямого
приобретения знаний от эксперта. Они предназначены для
преобразования информации, вводимой экспертом, в формулы с
последующей компиляцией их в интенсиональную семантическую сеть.
Стратегии прямого приобретения знаний. Разбиение на ступени.
Эта стратегия направлена на выявление структуры событий
предметной области и реализуется с помощью сценария Имя —
Свойство. Приведем алгоритм формирования структуры ПО в форме
диалога Система — Эксперт, причем вопросы задает система.
1. Назовите имя события — Погода.
2. Назовите имя признака события — Лето (Температура).
3. Существует ли множество значений введенного признака?
(Да/Нет).
100
4. Если ответ Нет (для признака Лето), то имя признака
воспринимается как имя события. При этом образуется пара имен
введенных событий (Погода, Лето). Если имя 2-го события
является для модели новым, то выполняется переход к шагу 2.
5. Если ответ в п.З Да (для признака температура), то ставится
вопрос: Назовите тип множества (Непрерывное/Дискретное) —
Непрерывное (для признака температура).
6. Если тип — Непрерывное, то ставится вопрос: Задайте
границы диапазона (О — 40), иначе — перечислите элементы дискретного
множества.
7. Задайте единицы измерения признака — Градусы по шкале
Цельсия.
8. Задайте подмножество значений атрибута для
характеризуемого события — A5 — 35).
В процессе выполнения шагов 2 — 8 создается глобальный
объект: имя атрибута и множество его значений. Он связывается с
введенным в п.1 событием.
Стратегия репертуарных решеток. Она предназначена для
выявления системы личностных психологических конструктов
эксперта. Каждый конструкт описывается некоторой совокупностью
шкал, а каждая шкала, в свою очередь, образуется оппозицией
свойств. Наиболее эффективный способ выявления оппозитных
(противоположных) свойств — предъявление эксперту триад
семантически связанных событий с предложением назвать свойство,
отличающее одно событие от двух других. На следующем шаге
предлагается назвать имя противоположного свойства. Таким
образом формируется базис области.
Пример. Эксперту в области представления знаний
предъявляется триада моделей: система продукций, семантическая сеть,
фрейм. Организуется следующий диалог [44].
1. Какая модель отличается от других? Система продукций.
2. Какое свойство отличает систему продукций от двух других
моделей? Легкость описания динамики.
3. Какое свойство противоположно названному? Трудность
описания динамики.
4. Каково имя свойства, имеющего значениями названные
свойства. Возможность описания динамики.
В результате формируется шкала «возможность описания
динамики» со значениями легкость описания динамики для системы
продукций и трудность описания динамики для других двух моделей.
Таким же образом можно выявить отличие семантических сетей от
двух остальных моделей.
101
Выявление семантических связей. Эта процедура используется
при построении ИНСС на основе высказывания эксперта. В табл.
2.1 приведены основные виды связей, используемые в ИНСС, а
также критерии, применяемые для выявления вида связи,
существующей между двумя именами событий (вершинами ИНСС):
1) время возникновения событий (для установления одно/раз-
номоментности);
2) подстановка (для установления рефлексивности);
3) перестановка (для установления симметричности);
4) обращение (для установления асимметричности);
5) трансформация (для установления транзитивности);
6) модальность (для различения связей по модальности).
Эти критерии сопоставлены ярусам дерева вывода вида связи
(см. рис. 2.6). Установление вида связи между двумя именами
событий выполняется с помощью интерактивного интерпретатора
экспертизы (ИИЭ) по следующему алгоритму.
1. Эксперту предъявляется список имен событий и предлагается
выбрать из него пару связанных событий.
2. Если эксперт не находит такой пары, то диалог завершается и
управление передается ИИЭ. Если эксперт выбирает некоторую
пару (А, В), то она подставляется во все канонические формы
высказываний (см. табл. 2.1) в разном порядке: вначале XR[Y := ARjB
(первая часть списка), а затем XRiY:=BRiA (вторая часть списка).
3. Из полученного списка эксперту предлагается выбрать
высказывание L,, наиболее соответствующее связи между именами А
и В. Пусть это будет ARiB.
4. Если выбранное экспертом высказывание принадлежит
первой части списка, то формируется признак F(irst), если второй,
то — S(econd).
5. Для выбранного высказывания L, эксперт указывает,
появляются ли события А и В одновременно или в разные моменты
времени.
6. Если ответ — одновременно, то формируется признак J,
иначе — признак D.
7. Высказывание L, проверяется по критерию подстановки.
8. Если сформирован признак J и один из признаков Rf или
Arf, то Lj проверяется по критерию перестановки.
9. Если сформирован признак J и несформирован признак Sm,
то Lj проверяется по критерию обращения.
10. Если сформированы признаки J и Rf или Arf и не
сформирован признак Sm, то Lj проверяется по критерию трансформации.
102
11. Если сформированы признаки D и Nrf, то снова Lj
проверяется по критерию трансформации.
12. Если сформированы признаки F, J, Arf и не сформирован
признак Sm, то для Lj устанавливается тип связи Gen(A.B).
13. Если сформированы признаки F, J, Arf, As, Тг, то для Lj
устанавливается тип связи Sit(A.B).
14. Если сформированы признаки F, J, Arf, Sm, то для Lj
устанавливается тип связи Neg(A.B).
15. Если сформированы признаки F, J, Nrf и не сформирован
признак Sm, то для Lj устанавливается тип связи Ins(A.B).
16. Если сформированы признаки F, J, Rf, Тг и не сформирован
признак Sm, то для Lj устанавливается тип связи Сот(А,В).
17. Если сформированы признаки F, J, Rf, Ntr и не
сформирован признак Sm, то для Lj устанавливается тип связи Мсот(А,В).
18. Если сформированы признаки F, J, Rf, Sm, то для L,-
устанавливается тип связи Сог(А.В).
19. Если сформированы признаки F, D, Arf, Ntr, то для Lj
устанавливается тип связи Fin(A,B).
20. Если сформированы признаки F, D, Nrf, Ntr, то для Lj
устанавливается тип связи Cous(A.B).
21. Если сформированы признаки F, D, Nrf, Ntr, то для Lj
устанавливается тип связи Pot(A,B).
Модели приобретения знаний [1,43]. Рассмотрим приобретение
знаний в широком смысле (т.е. учитываются все три фазы
приобретения), что в общем случае предполагает выполнение следующей
последовательности задач:
1) определение необходимости модификации (расширения)
знаний ИнС;
2) осуществление извлечения новых знаний в случае
необходимости такой модификации (либо окончание процесса
приобретения в противном случае);
3) преобразование новых знаний в форму, «понятную» ИнС;
4) модификация знаний ИнС и осуществление перехода к
выполнению первой задачи.
В зависимости от того, кто выполняет конкретную задачу,
можно выделять различные модели приобретения знаний, отражающие
различные уровни автоматизации процессов решения задач 1—4.
В модели приобретения знаний с помощью ИЗ (рис. 2.15)
эксперт взаимодействует с системой непосредственно или с помощью
ИЗ, причем задачи 1 и 2 они решают совместно, а задача 3
решается ИЗ. Автоматизировано только решение задачи 4.
юз
Эксперт
\
ИЗ
ИНС;
| БЗ | !
1 Решатель | j
Рис. 2.15. Модель
приобретения знаний с помощью ИЗ
Эксперт ;
^-i
ИнС :
1 БЗ
Метазнания (знания о
структуре знаний)
Решатель
Интеллектуальный
редактор
Рис. 2.16. Модель приобретения
знаний с помощью интеллектуального
редактора
В модели приобретения знаний с помощью интеллектуального
редактора (рис. 2.16) эксперт решает задачи 1 и 2, а задачи 3 и 4
выполняются уже автоматизированным способом.
В модели приобретения знаний с помощью индуктивной
программы (рис. 2.17) уже ИнС приобретает знания по аналогии с
человеком-экспертом. Индуктивная программа анализирует данные,
содержащие сведения о предметной области, автоматически
формирует отношения и правила, описывающие эту область.
Предполагается, что в БЗ в явном виде хранятся конкретные факты, а
индуктивная программа делает обобщения. Таким образом,
автоматизировано выполнение всех четырех задач.
Самая сложная модель — это модель приобретения знаний с
помощью программы понимания текста (рис. 2.18), так как проблема
понимания текстов (особенно естественноязыковых) сама по себе
является серьезной научной проблемой. В этом случае так же, как и
в предыдущем, автоматизировано выполнение всех четырех задач.
Данные :
(содержащие :
сведения о ПО);
БЗ
Решатель
Индуктивная
программа
ИнС
Рис. 2.17. Модель приобретения знаний с помощью
индуктивной программы
104
Тексты :
ИнС
БЗ
Решатель
Программа
понимания текста и
формирования знаний о ПО
Рис. 2.18. Модель приобретения знаний с помощью программы
понимания текста
На сегодня самыми распространенными моделями
приобретения знаний являются модели приобретения знаний с помощью ИЗ
и интеллектуального редактора.
Средства автоматизированного приобретения знаний. Как уже
отмечалось, для преодоления трудностей, возникающих на
домашинных этапах создания ИнС, последние годы стали развиваться
исследования и разработки, направленные на создание
инструментальной программной поддержки деятельности ИЗ и эксперта. С
наиболее детальными и содержательными обзорами на эту тему
можно познакомиться в работах [27, 28, 34, 35, 37, 43].
В настоящее время существуют различные классификации
систем автоматизированного приобретения знаний, причем в
этих системах моделируются в основном три функции ИЗ, а
именно:
собственно извлечение знаний из экспертов (или из других
источников);
структурирование (концептуализация) знаний;
формализация знаний.
В работе [28] системы автоматизированного приобретения
знаний, в частности системы диалогового извлечения знаний,
предлагается классифицировать с точки зрения:
области применения;
методов и способов приобретения знаний;
типа приобретаемых знаний.
В работе [27] в зависимости от природы встроенных знаний, т.е.
знаний, жестко встроенных в систему приобретения знаний,
выделены три группы систем:
105
системы, основанные на знаниях о конкретном формализме
представления;
системы, основанные на знаниях о предметно-независимых
методах (стратегиях) решения задач;
системы, основанные на детально проработанной модели
решения предложенных задач.
Наиболее обобщенная классификация систем
автоматизированного приобретения знаний в зависимости от использованных в них
методов извлечения знаний из экспертов предложена в работе [35]
и включает:
средства приобретения знаний в простейших ИнС, основанные
на деревьях решений (dicision trees);
системы приобретения знаний, базирующиеся на
психологических методах (методы репертуарных решеток, кластерный анализ,
многомерное шкалирование и др.);
системы приобретения знаний, использующие модели и методы
решения конкретных типов задач (problem solving methods);
системы приобретения знаний, основанные на рассуждениях по
прецедентам (case-based reasoning);
индуктивные средства приобретения знаний для простейших
ИнС, в котррых знания об области экспертизы могут быть
представлены в виде примеров;
системы приобретения знаний, использующие комбинацию
различных методов и подходов к извлечению знаний.
Все приведенные классификации являются, конечно,
достаточно условными, но в то же время весьма удобными для того чтобы,
с одной стороны, охарактеризовать отдельные наиболее широко
распространенные методы извлечения знаний, а с другой —
показать опыт реализации этих методов в конкретных системах
приобретения знаний.
В свою очередь, большинство систем, использующих
автоматизированные методы приобретения знаний, могут быть
сформированы в группы, отражающие степень их автоматизации или модели
приобретения знаний. Примеры таких групп показаны на рис. 2.19
(используются наиболее известные зарубежные системы
приобретения знаний, упомянутые в работе [37]).
В последние годы резко возрос интерес к новому источнику
знаний — БД и появлению в связи с этим нового вида систем
автоматизированного извлечения знаний. Это объясняется тем, что с
начала 90-х годов стали резко смещаться акценты с традиционной
106
MACSYMA
Ручной ввод
знаний
CYC
ONCOCIN
MYCIN
NEOMYCIN
ASK
OPAL
AQUINAS
MOLE
SALT
TEIRESIAS
DISIPLE
LEAP
PROTOS
СТЕПЕНЬ АВТОМАТИЗАЦИИ
Интеллектуальный редактор
Интерактивное
извлечение
знаний
AM
FNIX
LEX
SOAR
STRIPS
CHEF
CLASSIFIERS
INDUCE
SEEK2
AUTOCLASS
CLASSIT
EBG
EBL
EGGS
KARDIO
XPLAIN
ODISSEUS
GENETIC ALG
ID3
BACKPROP
Автоматические
методы формирования
новых знаний
Рис. 2.19. Классификация зарубежных систем приобретения знаний
по степени автоматизации
обработки данных в сторону аналитической обработки
накопленных данных и принятия решений, для чего современные СУБД
мало пригодны.
В связи с этим широкое распространение получили
программы (инструментальные средства) извлечения знаний,
позволяющие перекачивать различные выборки данных из операционных
БД в дополнительные БД, созданные для Data Warehouse — среды
накопления данных, оптимизированной для выполнения сложных
аналитических запросов управленческого персонала [42].
В общем случае средства извлечения знаний из БД должны
обеспечивать выполнение трансформаций (преобразований),
представленных на рис. 2.20.
В заключение отметим, что проблемой автоматизированного
приобретения знаний из БД в искусственном интеллекте
занимается новое направление, называемое Data Base Mining или Knowledge
Discovery.
107
Данные
(неструктурированные наборы чисел и символов)
у
Информация
(описания обнаруженных закономерностей)
у
Знания
(значимые для пользователя закономерности)
у
Решения
(последовательность шагов, направленная на
достижение потребностей пользователей)
Рис. 2.20. Схема трансформации при извлечении знаний из БД
Вопросы для самопроверки
1. Что входит в понятийную структуру ПО?
2. Что из себя представляют:
• знаковые представления понятий;
• схемы и формулы понятий;
• экстенсионал и интенсионал понятий;
• абстрагирование понятий;
• обобщение и специализация понятий?
3. Что включает в себя декларативное и процедурное представления знаний?
4. В чем состоит семантическая модель представления знаний?
5. Каково основное содержание фреймовой модели представления знаний?
6. Каково содержание логической модели представления знаний?
7. В чем состоит технология продукционной модели знаний?
8. Какова основная схема приобретения знаний?
9. Какие существуют стратегии получения знаний при разработке ИнС?
10. Какова классификация и содержание методов извлечения знаний?
11. Каковы модели приобретения знаний (их сходство и отличие)?
Глава 3
МЕТОДЫ УСТРАНЕНИЯ НЕОПРЕДЕЛЕННОСТЕЙ
И ПОПОЛНЕНИЯ ЗНАНИЙ
Одной из основных трудностей при принятии решений (даже у
естественного интеллекта) является наличие неопределенностей
при получении, формировании и представлении знаний. Интел-
лектуализированным информационным системам во многом
труднее оценивать ситуацию, воспринимать события и явления в
предметной области (ПО), решать задачи контроля, управления, поиска
и др. при наличии нечеткого представления знаний.
3.1. Методы работы с нечеткими
знаниями
Особенностью большинства интеллектуализированных
информационных систем является их функционирование в сложных ПО
со множеством объектов, разнообразных процессов и носителей
естественного интеллекта — людьми. К производственным ПО
можно отнести технические, технологические и экологические
системы, разные промышленные, энергетические и транспортные
комплексы, предназначенные для создания материальных и других
видов продукции. Современные производственные ПО
представляют собой сложную структуру, состоящую из совокупности
взаимосвязанных подструктур, функционирование которых направлено на
достижение общих целей всей структуры ПО. В этих условиях при
исследовании подобных структур и описании их математическими
моделями возникает проблема дефицита информации. Дефицит
информации возникает, во-первых, из-за неполноты
(ограниченности) информации, описывающей объект или наблюдаемый
процесс (явление); во-вторых, из-за качественного
(неформализованного) представления информации, порождаемой трудноформали-
зуемой ситуацией; в-третьих, из-за нечеткости информации,
появляющейся в условиях неопределенности.
Проблему, связанную с недостатком информации, решают
следующими способами: либо стараются уменьшить дефицит инфор-
109
мации, либо примиряются с недостатком информации и
продолжают исследование в сложившихся условиях.
Одно из направлений исследований в решении проблем
неопределенности связано с созданием математических методов для
описания нечетко определенных ПО. Трудности здесь возрастают,
если существует лингвистическая неопределенность при описании
ПО. В подобных ситуациях широкое применение находит аппарат
нечеткой логики Л. Заде [84].
Что же предложил Заде? Во-первых, он расширил классическое
канторовское понятие множества, допустив, что
характеристическая функция (функция принадлежности элемента множеству)
может принимать любые значения в интервале @;1), а не только
значения 0 либо 1. Такие множества были названы им нечеткими
(fuzzy). Л. Заде определил также ряд операций над нечеткими
множествами и предложил обобщение известных методов логического
вывода modus ponens и modus tollens. Введя затем понятие
лингвистической переменной и допустив, что в качестве ее значений
(термов) выступают нечеткие множества, Л.Заде создал аппарат для
описания процессов интеллектуальной деятельности, включая
нечеткость и неопределенность выражений. Математическая теория
нечетких множеств, предложенная Л.Заде более четверти века
назад, позволяет описывать нечеткие понятия и знания, оперировать
этими знаниями и делать нечеткие выводы. Основанные на этой
теории методы построения компьютерных нечетких систем
существенно расширяют области применения компьютеров. В последнее
время нечеткое управление является одной из самых активных и
результативных областей исследований применения теории
нечетких множеств.
Таким образом, при формализации качественных знаний может
быть использована теория нечетких множеств, особенно те ее
аспекты, которые связаны с лингвистической неопределенностью,
наиболее часто возникающей, например, при работе с экспертами
на естественном языке. Под лингвистической неопределенностью
подразумевается не полиморфизм слов естественного языка,
который может быть преодолен на уровне понимания смысла
высказываний в рамках байесовской модели, а качественные оценки
естественного языка для длины, времени, интенсивности, для
логического вывода, принятия решений, планирования.
Лингвистическая неопределенность в системах представления
знаний задается с помощью лингвистических моделей, основанных
на теории лингвистических переменных и теории приближенных
рассуждений. Эти теории опираются на понятие нечеткого множе-
110
ства, систему операций над нечеткими множествами и методы
построения функций принадлежности.
Одним из основных понятий, используемых в лингвистических
моделях, является понятие лингвистической переменной.
Значениями лингвистической переменной являются не числа, а слова или
предложения некоторого искусственного или естественного языка.
Например, числовая переменная «возраст» принимает дискретные
значения между нулем и сотней, а целое число является значением
переменной. Лингвистическая переменная «возраст» может
принимать значения: молодой, старый, довольно старый, очень молодой
и т.д. Эти термы — лингвистические значения переменной. На это
множество (как и на числа) также накладываются ограничения.
Множество допустимых значений лингвистической переменной
называется терм-множеством.
При вводе в ЭВМ информации о лингвистических переменных
и терм-множестве ее необходимо представить в форме, пригодной
для работы на ЭВМ. Лингвистическая переменная (ЛП) задается
набором из пяти компонентов:
ЛП = <А, Т(А), U, G, М>,
где А — имя лингвистической переменной; Т(А) — ее
терм-множество; U — область, на которой определены значения
лингвистической переменной; G описывает операции по порождению
производных значений лингвистической переменной на основе тех
значений, которые входят в терм-множество. С помощью правил из G
можно расширить число значений лингвистической переменной,
т.е. расширить ее терм-множество. Каждому значению а
лингвистической переменной А соответствует нечеткое множество Ха,
являющееся подмножеством U. По аналогии с формальными
системами правила G часто называют синтаксическими. Наконец,
компонента М образует набор семантических правил. С их помощью
происходит отображение значений лингвистической переменной а
в нечеткие множества Ха и выполняются обратные преобразования.
Именно эти правила обеспечивают формализацию качественных
утверждений экспертов при формировании проблемной области в
памяти ИнС.
Основные понятия и элементы теории нечетких множеств. Для
успешного применения математических методов при анализе
сложных, количественно трудноформализуемых ПО необходимо
использовать средства для учета нечетких представлений и суждений
людей — специалистов в ПО. Наиболее перспективным средством
сбора и обработки такой нечеткой информации является теория
in
нечетких множеств. В основе этой теории лежит понятие нечеткого
множества, которое является математической формализацией
нечеткой информации, используемой при анализе, моделировании и
управлении сложными системам ПО. Приведем основные
положения и определения теории нечетких множеств [48].
Определение 3.1. Пусть X — непустое (универсальное)
множество (в обычном смысле). Нечетким множеством (подмножеством) А
на множестве Х(А С X) будем называть совокупность пар:
А = (х,ця(х)) = /ця(х)|х, х GX, ця(х)Е[0Д C.1)
х
где «J» — обозначает операцию объединения одноточечных
нечетких множеств ц~(х)|х; «~» означает нечеткость соответствующих
параметров.
В дальнейшем для простоты обозначения там, где не возникает
неясность, символ нечеткости «~» будем опускать.
Функция n,~(x):X-*R, отображающая универсальное
множество X в пространство R, называется функцией принадлежности
нечеткого множества А. Значение ц~ называется степенью принад-
А
лежности х нечеткому множеству А. Функцию принадлежности
можно интерпретировать как распределение возможностей. Это
означает, что произвольное множество может рассматриваться как
ограничение на возможные значения некоторой переменной.
Когда R содержит только две точки 0 и 1, А является обычным
множеством и его функция принадлежности совпадает с
характеристической функцией множества А.
Далее везде будем предполагать, что R — интервал [0,1], причем
ц~(х) = 0 означает полную непринадлежность х множеству А, а
А
ц- (х) = 1 — полную принадлежность х множеству А.
Несмотря на известную аналогию с методами теории
вероятностей, существенное отличие методов теории нечетких множеств
состоит в том, что неопределенность связана не со случайностью, а с
имеющимися неточностями и размытостями, а функция
принадлежности выражает субъективную возможность наличия у элемента
х свойств, позволяющих отнести его к множеству А.
Носителем нечеткого множества А называется множество тех
элементов х G X, для которых
ц~(х) > OisupA = {x:x G Х,ц~(х) > 0}.
А А
112
Пример 3.1. Рассмотрим нечеткое множество А, отвечающее
нечеткому понятию (представлению оператора) «температура в
реакторе нормальная». Носителем данного нечеткого множества
является конечное множество, элементы которого представляют собой
значения температуры: {481,482,...,489}, нечеткое множество имеет
вид [48]
А ={0,3 1481; 0,4 1482; 0,5 1483; 1,0 1484; 1,0 1485; 1,0 1486; 0,5 1487;
0,4 1488; 0,3 1489}.
Отсюда видно, что для человека-оператора, который управляет
температурой в реакторе, понятию «нормальная температура в
реакторе» полностью соответствуют значения температуры от 484 до
486, в меньшей степени — значения температуры от 481 до 483 и от
487 до 489. Значения температуры в реакторе, которые меньше 481
и больше 489, понятием «нормальная» охарактеризованы быть не
могут, т е. не являются носителем данного нечеткого множества.
Точкой перехода нечеткого множества А называется множество
таких точек в X, для которых ц~(х) = 0,5. В примере 3.1 точкой
перехода нечеткого множества, описывающего понятия «нормальная
температура», являются точки х = 483 и х = 487, в которых
ця(х) = 0Д
Нечеткое множество называется пустым, если ц0(х) = О для
VxGX.
Нечеткое множество А называют нормальным, если верхняя
граница его функции принадлежности равна единице: supfiA(x) = l. В
хех
противном случае нечеткое множество называют субнормальным.
Пусть А и В — нечеткие множества в X с функциями
принадлежности цА(х), цв (х). Из равенства функций принадлежности двух
нечетких множеств вытекает эквивалентность этих нечетких
множеств: В = А, если для Vx G X цА(х) = цв(х).
Множество А включает в себя В, т. е. ВС А, если для Vx E X
выполнено цв(х) < цА(х). Если В С А, то sup В С sup А.
Над нечеткими множествами можно выполнять операции,
аналогичные операциям над обычными множествами, а также
выполнять специальные операции, введенные для использования
нечетких множеств в задачах принятия решений. Некоторые операции
над нечеткими множествами (объединение, пересечение), в
зависимости от специфики решаемой задачи, можно определить
различными способами. Выбор конкретного вида операции зависит от
смысла, вкладываемого в эти операции.
8 — 3466
113
Рассмотрим основные операции над нечеткими множествами.
Классические определения объединения (U) и пересечения (П)
множеств в случае нечетких множеств можно сформулировать
следующим образом.
Объединением нечетких множеств А и В в X называется нечеткое
множество AUB с функцией принадлежности:
HaubOO = тах{цА(х),цв(х)}, х Е X. C.2)
Пересечением нечетких множеств А и В в X называется нечеткое
множество АПВ с функцией принадлежности:
НапвОО = min{|HA(x),Mx)},х е X. C.3)
Для носителей этих множеств выполняются следующие
равенства:
sup (A U B)=(sup A) U (sup В),
sup (АП B)=(sup А) П (sup В).
Объединение соответствует логической связке «или», а
пересечение соответствует логической связке «и».
Есть и другие способы представления этих операций
(ограниченная сумма, ограниченное произведение и др.).
Пример 2. Пусть X = {2, 3, 4, 5} — универсальное множество, а
нечеткие множества А и В имеют вид [48]:
А={0,5|2; 1,0|3;0,8|4;0,7|5},
В = {0,7|2; 0,8|3; 1,014; 0,615}.
Здесь и далее мы опускаем те элементы, которые полностью не
принадлежат рассматриваемому нечеткому множеству, т. е
элементы, для которых цА(х) = 0, цв(х) = 0, тогда
AUB = {0,7|2; 1,0|3; 1,014; 0,715},
АПВ = {0,5|2; 0,8|3; 0,8|4; 0,б|5}.
Дополнением или отрицанием нечеткого множества А в X
называется нечеткое множество А с функцией принадлежности:
цх(х) = 1-Мх), хеХ. C.4)
Операция дополнения соответствует логическому отрицанию.
Например, нечеткие множества А — {качественные продукты} и
"Я = {некачественные продукты} являются дополнением друг другу.
114
Отметим, что в отличие от классических множеств, для
нечетких множеств выполняется АЛ А ** 0
Произведение нечетких множеств А и В обозначается А о В и
определяется выражением
АоВ=/цА(х)-Мх)|х. <3-5>
X
Любое нечеткое множество Аа(ос > 0) на основе C.5) можно
записать в виде
Аа=/|и5[(х)|х. C.6)
х
Частными случаями операции возведения в степень являются
операция концентрирования (CON), уменьшающая нечеткость
множества:
CONA = A2 = /^(x)|x, xGX, C.7)
х
и операция растяжения (DIL), увеличивающая нечеткость:
DIL А = А0'5 = JVaOOIx, x G X. C.8)
х
Приведенные операции полезны в представлении
лингвистических неопределенностей и используются в качестве модификаторов
(связки) в нечетких высказываниях [48].
Пример 3. Пусть универсальное множество X и нечеткие
множества А и В определены так же, как и в примере 3.2, тогда
АоВ = {0,3512; 0,813; 0,814; 0,4215},
А2 ={0,125|2; 1,0|3; 0,512|4; 0,343|5},
CON В = {0,49|2; 0,64|3; 1,0|4; 0,3б|5},
DIL В = {0,84|2; 0,9|3; 1,0|4; 0,7815}.
Разность нечетких множеств А и В в X определяется как
нечеткое множество А\В с функцией принадлежности:
Иа\в(*) =
Мх)-Мх) при цА(х)>цв(х), ^v
X t A. n q\
0 в противном случае, yjy)
Симметрической разностью называют нечеткое множество AVB,
имеющее функцию принадлежности
8* 115
I^vb =IMX)-MX)I> XGX.
Декартово произведение Ах х ... х Ап нечетких множеств А, в Хь
i = 1, ..., п, определяется как нечеткое множество А в декартовом
произведении Х = Х, х...хХп с функцией принадлежности:
fiA(x) = min{jiAi (х1),...,цАп(хп)}, х = (xl5...,xn) G X. C.10)
Выпуклой комбинацией нечетких множеств Аь ..., An в X
называется нечеткое множество А с функцией принадлежности:
п п
i=l i-1
Множеством уровня ос нечеткого множества А в X является
множество:
Аа={х:хеХ,цА(х)>а}, VaG[0,l]. C.11)
Множество уровня а позволяет свести нечеткую задачу к
четкой и применить известные методы для решения полученной
задачи. К основным свойствам множества уровня а можно отнести:
(AUB)a=AaUBa, (АПВ)а=АаПВа,
п
(A1X...XAn)a=(A1)aX...X(An)a, f|(Ai>a CAa-
Рассмотрим отображение нечетких множеств. Пусть на
множестве управлений X задано отображение <р:Х -» Y. Образ у = ф(х)
управления х Е X есть реакция системы на выбор управления. Если
управление — нечеткое множество (х,ц,А(х)), то для нахождения
реакции системы на такое управление нужно определить образ цА(х)
при отображении <р, А — нечеткое подмножество множества X с
функцией принадлежности цА(х).
Принципом обобщения называется способ расширения области
определения отображений на класс нечетких множеств. В основе
лежит определение образа нечеткого множества при четком
отображении.
Образ множества А при отображении ф определяется как
нечеткое подмножество множества Y:
(у,Му)) = (ф(х),ца(х)), х е х,
функция принадлежности образа цв : Y -* [0,1] — имеет вид
116
цв(Х)= sup цА(х), yGY, C.12)
хеф'Чу)
где для любого фиксированного у G Y ф~*(у) = {х : х G X, ф(х) = у}.
Нечетким отображением ф: X -» Y множества X во множество Y
называется нечеткое подмножество с заданной функцией
принадлежности ц<р(х,у) [48].
Образом В нечеткого множества А в X при нечетком
отображении цф:Хх Y-*[0,1] называется нечеткое множество с функцией
принадлежности:
^B(y)supminftiA(x),fi (х,у)}.
xGX
В случае х = X! х...х Хп:
цА(х1х...ххп) = тт{ц1(х1),...,цп(х1),...,цп(хп),у(х)},
, v Г1 при х G X,
v(x) = j
[О при х^Х,
МУ)= sup min{fi1(x1),...,jiII(xIl),v(x),|if(x,y)}.
x=(x,,.~,xn)ex
Такой способ обобщения довольно простой, но не
единственный.
Прообразом А нечеткого множества В, определенного в X, при
нечетком отображении цф:Хх Y-*[0,1] называется объединение
всех нечетких множеств, образы которых при этом отображении
принадлежат нечеткому множеству В.
Обозначим а 9\х9 образ нечеткого множества а при
отображении цф. Прообразом нечеткого множества В является объединение
всех множеств а, удовлетворяющее условию а#|ифС'В или по
принципу обобщения условию:
supmin{na(x),jiФ(х,У)} ^ МУ)> Vy G Y.
хех
Введем множества:
N = {(х,у):(х,у)G X х Y, цф(х,у)>цв(У)Ь
Nx={y:yGY, (x,y)GN},
X°={x:xGX, Nx*0}.
117
Во введенных обозначениях нечеткое множество А (прообраз
множества В) описывается функцией принадлежности
М*) =
finf |ыв (у) при х Е Х°,
'y€N
1 прихех\х°.
Нечетким числом называется нормальное нечеткое множество,
определенное на пространстве R1.
Операция сложения в множестве чисел R1 представляет собой
отображение:
f r^xR1 -*R!,
f(r1,r2) = r = r1 +г2.
Пусть |^1,ji2:R1 -*[0,1] — два нечетких числа. Суммой ц*(г) =
= Hi(ri) + Цг(гг) называется образ пары (fii(ri), \кг(гг)) при
отображении f, где
Мг) = sup тпфДгХМг)}.
r,+r2=r
При моделировании и управлении в сложных предметных
областях на основе методов теории нечетких множеств одним из
наиболее часто встречающихся математических понятий является
понятие нечеткого отношения. Важность этого понятия
заключается в том, что оно на основе экспертной информации позволяет
формулировать и анализировать математические модели сложных
ПО [48].
Нечетким отношением R на множестве X называется нечеткое
подмножество декартова произведения ХхХ, характеризующееся
функцией принадлежности
цк:ХхХ-[0,Ц
Значение ц,к(х,у) понимается как субъективная мера или
степень выполнения отношения xRy.
Обычное отношение можно рассматривать как частный случай
нечеткого отношения, функция принадлежности которого равна О
или 1.
В общем случае n-арное отношение есть нечеткое
подмножество декартова произведения:
118
R= / Mxi-mX^Kx,,...^,,). C.13)
x,x_xxn
Приведем основные характеристики нечетких отношений.
Носителем нечеткого отношения R на множестве X называется
подмножество декартова произведения X х X:
supR = {(x,y) G X X X, fiR(x,y) > 0}. C.14)
Из C.14) видно, что sup R связывает все пары (х, у), для
которых степень выполнения данного нечеткого отношения не равна
нулю.
Множество уровня а нечеткого отношения R определяется по
формуле:
R« = {(х,У):(х,у) е X х X, Мх,у) ^ а}. C.15)
Рассмотрим операции над нечеткими отношениями, некоторые
из которых являются аналогами операций над нечеткими
множествами, а остальные присущи только нечетким отношениям.
Пусть А и В — нечеткие отношения в X с функциями
принадлежности цА(х,у),цв(х,у), тогда В С А, если для Vx,y G ХцА(х,у) < цв(х,у).
Объединением нечетких отношений А и В в X называется
нечеткое отношение AUB с функцией принадлежности:
ЦАив(х>У) = т^{Мх>У)>Мх>У)}- (зл6)
Пересечением нечетких отношений А и В в X называется
нечеткое отношение Af|B с функцией принадлежности:
ЦАпв(х>У) = т1п{Мх>У)>Мх>У)}- <3-17)
Дополнением к нечеткому отношению А в X называется
нечеткое отношение X с функцией принадлежности:
цА(х,у) = 1-цА(х,у), для Vx,y e X. C.18)
Обратное к нечеткому отношению R в X определяется как
нечеткое отношение A'(xR-1y о yRx) с функцией принадлежности:
ЦА'(Х>У) = 1-Мх>У)> Для Vx>y 6 X
или
HR-i(x,y) = Mx,y). C.19)
Алгебраическая сумма и произведение нечетких отношений А и
В задаются соответственно функциями принадлежности:
119
^а+в(х>У) = Мх>У) + Мх>У)-Мх>У)-Мх>У)>
И а-в (х> У) = И а (х> У)' И в (х> У>
Максиминное произведение А о В нечетких отношений А и В в
X характеризуется функцией принадлежности:
^аов(х>У)= sup min{|j,A(x,y),yB(x,y)}.
х,уЕХ
Важное значение в задачах моделирования и принятия решений
имеет композиция (произведение) нечетких отношений, которую
можно определить различными способами. Наиболее часто
употребляемыми определениями этой операции являются максиминная
и минимаксная композиции, характеризуемые соответственно
функциями принадлежности.
ЦАов(х>У) = SUP min{jiА(х,у),цв(х,у)}. C.20)
х.уех
ЦАов(х>У)= inf тт{цА(х,у),цв(х,у)}. C.21)
х,у€Х
Нечеткие отношения могут обладать следующими свойствами:
рефлексивностью: jiR(x,x) = 1,
антирефлексивностью: jmR(x, х) = 0,
симметричностью: цк(х,у) = jnR(y,x),
антисимметричностью: из ц R (х, у) > 0 => ц R (у, х) = 0 или
min{jiR(x,y),fiR(y,x)} = 0 для Vx, у G X,
транзитивностью: ^R(x,y)> supmin{fiR(x,z),nR(z,y)}.
zGX
Следующими фундаментальными понятиями, используемыми в
теории нечетких множеств, являются нечеткая и лингвистическая
переменные. Сначала приведем содержательную интерпретацию
этих переменных.
Особенностью человеческого мышления является способность
анализировать и выбирать сведения, имеющие отношение к
анализируемой проблеме, т. е. способность оценивать разнородную
информацию. Такая способность играет важную роль в описании
сложных явлений и процессов.
Рассмотрим способность человека оценивать понятие
«температура». Во многих случаях при оценке значений температуры люди
оперирует не числовой характеристикой, а нечетко выраженными
понятиями, такими, как «низкая», «очень низкая», «средняя»,
«нормальная», «высокая» и др. При этом, если речь идет об оценке
температуры в печах определенного типа (в которых недостаточны или
отсутствуют приборы для измерения температуры), то человек (опе-
120
ратор) легче ориентируется по качественной информации, например
«нормальная», чем по конкретному числовому значению
температуры. Мы не путаем понятия «низкая» или «высокая», зная>о какой
температуре идет речь: о температуре в холодильнике, или о
температуре воздуха в определенном городе в определенном месяце.
Можно привести еще много аналогичных примеров, из
которых ясно, что человек мыслит и рассуждает чаще всего нечетко
выраженными понятиями и категориями. Это не означает, что
человек пренебрегает точностью, напротив, часто пользуясь
нечеткими понятиями, он стремится к использованию самой точной
информации.
Такой способ оценивания информации является качественным,
так как отражает характер явления и процесса. При этом большую
роль играет наш естественный язык, который позволяет выразить
основные понятия, необходимые для оценивания явления, для
описания исследуемого объекта.
Использование лингвистического подхода к оцениванию или
анализу сложных объектов и систем позволяет формализовать этот
процесс посредством нечетких понятий и отношений
естественного языка. Введем понятия нечеткой и лингвистической
переменной, которые, как и обычная переменная, могут изменять свое
значение.
Нечеткой переменной называется набор (F,X,R(F;x)), где
F — наименование нечеткой переменной, X = {х} — универсальное
множество, определяющее область изменения F, R(F; х) С X
—нечеткое множество, представляющее собой нечеткое ограничение на
значения переменной F, смысл нечеткой переменной.
Неограниченная обычная переменная X является для F базовой переменной..
Нечеткая переменная F характеризуется уравнением назначения,
имеющим вид
f=x, xGR(F;x). C.22)
Это уравнение отражает то, что переменной f назначается
значение х с учетом ограничения R(F;x).
Степень, с которой удовлетворяется равенство C.22),
называется совместимостью значения х с R(F;x) и обозначается через С(х):
C(x) = ^R(F;x)(x),xeX, C.23)
где |iR(F;x)(x) — степень принадлежности к ограничению R(F;x),
являющаяся мерой того, насколько значение х удовлетворяет
ограничению R(F;x).
121
Пример 4. Пусть универсальное множество X = {0, 15]
описывает область определения параметра — выход летучих веществ,
характеризующий качество продукта, например нефтяного кокса [48].
Нечеткое множество R(F;x), описывающее переменную
F = «среднее», можно представить в виде
15
Я(среднее) = J ехр(-0,693 |х — 7,5|3) |х.
о
Тогда нечеткая переменная запишется следующим образом:
/среднее,Х = [0Д5]Д(среднее) = /ехр(-0,693 |х - 7,513) |х\
Перейдем к рассмотрению лингвистической переменной,
являющейся переменной более высокого порядка, чем нечеткая
переменная. Это определяется тем, что значениями лингвистической
переменной являются нечеткие переменные. Например,
значениями лингвистической переменной «качество» могут быть: «низкое»,
«среднее», «невысокое», «высокое», «очень высокое» и т. п. Каждое
из этих значений является названием нечеткой переменной.
Из приведенного выше примера видно, что значениями
лингвистической переменной являются не числа, как у числовой
переменной, а слово или предложение в естественном или формальном
языке. Это свойство лингвистической переменной дает
возможность приближенно описывать сложные, количественно трудно-
описываемые на привычном или естественном языке системы и
явления.
Для описания структуры лингвистической переменной
используются следующие два правила:
синтаксическое, которое задается в форме грамматики,
порождающей названия значений переменной;
семантическое, которое определяет алгоритмическую процедуру
для вычисления смысла каждого значения.
Теперь напомним формальное определение понятия
лингвистической переменной применительно к нечетким переменным [48].
Определение 3.2. Лингвистическая переменная характеризуется
набором
<L,T(L),X,G,M>,
в котором
L — название переменной;
122
T(L) — множество ее значений, т. е. терм-множество
переменной L, причем каждое из лингвистических значений L является
нечеткой переменной F со значениями из универсального множества
X с базовой переменной х; множество T(L) называется базовым
терм-множеством лингвистической переменной;
G — синтаксическое правило (в частности, формальная
грамматика), описывающее процесс образования новых значений
лингвистической переменной (названия нечеткой переменной F),
исходя из ее терм-множества; множество Т* = TUG(T) называется
расширенным терм-множеством лингвистической переменной;
М — семантическое правило, которое ставит в соответствие
каждой нечеткой переменной F ее смысл M(F), т. е. нечеткое
подмножество M(F) универсального множества X. Семантическая
процедура М (например, экспертный опрос) позволяет превратить
каждое новое значение лингвистической переменной, образуемое
процедурой G, в нечеткую переменную, т. е. приписать ему
семантику путем формирования соответствующего нечеткого множества.
В данном случае термом назовем конкретное название F,
порожденное синтаксическим правилом G. Терм-множество
определяется объединением термов.
Смысл M(F) терма F можно определить как ограничение R(F;x)
на базовую переменную х, обусловленное нечеткой переменной F:
M(F) = R(F; x). C.24)
В C.24) нечеткое ограничение R(F; x) и, следовательно, смысл
M(F) можно рассматривать как нечеткое подмножество
универсального множества X, имеющее название F.
Уравнение назначения в случае лингвистической переменной
принимает вид:
F = терм в T(L) = название, порожденное грамматикой G. C.25)
Подставляя C.25) в C.24), определим смысл терма F в виде
M(F) = Я(терм в T(L)). C.26)
Пример 3.5. Пусть оценка объема вырабатываемой продукции
производится с помощью понятий нечетких переменных — «мало»,
«ниже среднего», «среднее», «выше среднего», «много». При этом
максимальный объем выработки продукции равен 20 т/ч.
Формализация такой оценки может быть проведена с помощью
лингвистической переменной L = «объем продукции», характеризуемой
набором:
123
<ОБЪЕМ ПРОДУКЦИИ, T(L), [0, 20], G, М>,
где T(L) = {мало, ниже среднего, среднее, выше среднего,
много} — терм-множество лингвистической переменной, в котором
каждый из элементов является нечеткой переменной, X = [0,
20] — универсальное множество, характеризующее область
определения базовой переменной х для каждого из термов и для базовой
переменой; G — процедура перебора элементов множества T(L);
М — процедура экспертного опроса, с помощью которого
определяется смысл нечеткой переменной, т. е. множество M(F).
Нечетким соответствием Г = (X, Y, F) между множествами X и
Y называется тройка множеств, в которой X, Y — произвольные
четкие множества, a F — нечеткое множество в X х Y.
Подобно названиям элементов четкого соответствия,
множество X называют областью отправления, множество Y — областью
прибытия, a F — нечетким графиком нечеткого соответствия.
Носителем нечеткого соответствия Т — (X, Y, F) назовем
четкое соответствие Г = (X, Y, F), у которого график F является
носителем нечеткого графика F.
Нечеткое соответствие может быть задано
теоретико-множественно, графически и в матричном виде.
Для теоретико-множественного задания нечеткого соответствия
необходимо перечислить элементы множеств X и Y и задать
нечеткие множества F в X х Y.
В матричном виде нечеткое соответствие Г = (X, Y, F) задается
с помощью матрицы инциденций Rr, строки которой помечены
элементами х4 € X (i 6 I = {1,2,...,п}), столбцы — элементами yj € Y
(j e J = {l,2,...,m}), а на пересечении строки Xj и столбца yj ставится
элемент гу =jiF(xi,yj), где цР —функция принадлежности
элементов из X х Y нечеткому графику.
Как уже отмечалось, нечеткое соответствие можно задать в виде
ориентированного графа с множеством вершин XUY, каждой дуге
(xi, yj) которого приписано значение функции принадлежности
3.2. Пополнение знаний
Пополнение БЗ осуществляется различными методами при
общении с внешней средой, при постановке новых задач и при
достижении новых целей. Кроме того, пополнение знаний
осуществляется самой ИнС на основе имеющейся БЗ и машин (программ)
логического вывода новых знаний. Это ведет к устранению
трудности, связанной с ограниченностью знаний.
124
Проблема пополнения знаний возникла при решении задач:
понимания естественного языка, обучения, поиска ответов на
вопросы к БЗ, анализа ситуаций, сцен и др. Знания могут быть
представлены в виде фактов, хранящихся в БЗ, или в виде описания
ситуаций, поступающих на вход ИнС.
Укажем несколько подходов к пополнению знаний: а) модели
«здравого смысла»; б) сценарии; в) подход, опирающийся на идею
о том, что физические закономерности внешнего мира могут быть
описаны в рамках специальных псевдофизических логик (рис. 3.1).
Все подходы в той или иной степени используют идею
продукционных правил. Система продукций отражает закономерности,
присущие заданной проблемной области. Например, для ситуаций,
описывающих статистические пространственные отношения между
объектами, можно выбрать следующие продукции: х Содержится
в> У, У Содержится в> z —> х Содержится в> z (свойство
вложенности, которое выполняется в «матрешках»); х<находится на> у,
2<находится на> x-»z <находится на> у.
Пополняя постепенно БЗ продукциями такого типа, можно в
ИС создать достаточно мощные средства для порождения новых
фактов из тех, которые в ней имеются. Процедуры пополнения
знаний отличаются друг от друга структурой продукционных
правил и стратегий управления в системе продукций.
Псевдофизические логики. Здесь физическая модель предметной
области переносится на язык логики (язык ЭВМ). При
определенных стратегиях управления система продукций превращается в
дедуктивную логическую систему. Широкий класс таких систем
называется псевдофизическими логиками (ПФЛ). В их аксиомах и
правилах вывода используются не только реальные физические свой-
Методы пополнения знаний
Модели «здравого
смысла»
Сценарий
Псевдофизические
логики
Продукционные
правила
Закономерности
предметной области
Рис. 3.1. Схема методов пополнения знаний
125
ства окружающего мира, но и особенности его восприятия
человеком. ПФЛ обладает рядом особенностей:
1. ПФЛ есть логики отношений: временных, пространственных,
каузальных, действия.
2. Часть рассуждений в ПФЛ связана со шкалами:
метрическими (абсолютными и относительными) и топологическими. На
абсолютной метрической шкале задан некоторый масштаб и выбрана
точка отсчета; на относительной указывается лишь расстояние
между точками, а начало отсчета может «плавать». Топологическая
шкала представляет собой порядковую шкалу. На ней указываются
отношения порядка (строгого, нестрогого, размытого) между
упорядочиваемыми.
3. ПФЛ содержат в качестве аксиом-утверждения, вытекающие
из восприятия мира человеком, которые подтверждаются
результатами соответствующих психологических экспериментов.
4. Совокупность ПФЛ характеризуется связями между
отдельными частями — логиками (например, логика времени тесно
связана с логиками пространства и действий).
Существуют модели временнйх логик, статической
пространственной логики, фрагменты логики действий и каузальной логики
(рис. 3.2).
Каждая ПФЛ является системой, включающей модель
предметной области в виде понятий и отношений, существующих в ней, и
модель вывода. Первая модель задает формальный язык описания
знаний (ситуаций), вторая позволяет получать пополнение этих
знаний (рис. 3.3.).
Пополнение знаний на основе сценариев. Пополнение знаний
можно выполнить с помощью сценариев. Перечислим основные
схемы рассуждений на сценариях, используемых при выводе. Часть
схем является интерпретацией значений слотов сценария (СЦ).
Схема 1 (ключ — посылки). Пусть в СЦ значением слота «ключ»
является имя события р*, а значением слота «посылки» — список
Логические модели
i
Модели
временных логик
п,
Модели
статической
пространственной логики
ГЬ
Модели
каузальной логики
п3
Модели логики
действий
п4
Рис. 3.2. Модели логики отношений при пополнении знаний
126
имен событий (рь р2, ..., Рк). В этом случае имеют место
соотношения (й Ri р*), (Pi П3 р*), i = ТЛЕ, где Ri — отношение
предшествования во времени; П3 — каузальное (причинно-следственное)
отношение.
Схема 2 (ключ — следствия). Пусть в СЦ значением слота
«ключ» является имя события р*, а значением слота
«следствия» — список имен событий (рь р2,..., Рт). Тогда имеют место
соотношения (й Ri р*), (й П3 р*), i = Т& где R! - отношение
«следовать за».
Схема 3 (посылки — следствия). Обозначим множество
значений слотов «посылки» через X, а множество значений слота
«следствие» через Y. Имеют место следующие утверждения: для Vpj 6X
и Vpj G Y верно (pi «предшествует» Pj).
Схема 4. Пусть ц — значение слота «цель деятеля» в СЦ,
р* — ИМя ключевого события. Верно следующее: (р* Ri ц), (р* П3 ц).
Схема 5. Пусть р\ — значение слота «ключ» в СЦ1, р2 —
значение аналогичного слота в СЦ2. Известно, что pj П3 р2. Обозначим
множество значений слота «посылки» в СЦ1 через Хь а в
СЦ2 —через Х2; множество значений слота «следствие» в
СЦ1 — через Yb а в СЦ2 — через Y2. Имеют место следующие
отношения: из Vpj G X! и Vpj G Х2 следует (р* Ri ft); из Vpk G Y, и
Vpm G Y2 следует (pk Ri pm).
Схема 6. Рассмотрим случай схемы 5 — Pi П3 р2. Имеет место
следующее: из Vpt G X следует (pj П3 р2), где X = Х{ UX2.
Общая схема построения плана достижения цели по сценариям
такова:
Отношения
^ Понятие J (^Понятие ]
Модель ПО
Язык описания
знаний (ситуаций)
Модель вывода
Пополнение
знаний
Рис. 3.3. Система ПФЛ
1. Из описания проблемной области выбирается сценарий,
значение слота «цель» которого соответствует поставленной цели.
2. Анализируются значения всех слотов указанного сценария и
строится последовательность Пь являющаяся значением слотов
«посылки» и «ключ» с их спецификациями.
3. Выполняется последовательное обращение к сценариям,
указанным в Пь
Взаимодействие базы знаний с внешней средой. При пополнении
БЗ необходимо общение с внешней средой, как одним из
источников знаний. Сама по себе БЗ — это набор выявленных
закономерностей, представленных с помощью одной из рассмотренных ранее
моделей знаний. К внешней по отношению к ней среде относятся
источники знаний Z, фактов X и управляющих воздействий Ub U2,
U3, а также рецепторы выводимого знания Y. Графически
отношения между этими переменными представлены на рис. 3.4.
Аналитически эти отношения записываются следующим
образом. Базу знаний символизирует п + 1-местное отношение
RCXx...xXxY. Оно задает соответствие между п исходными
фактами и значениями выводимого знания Y. Множество фактов
X, исходное знание Z, закономерность R являются функциями
управляющих воздействий U1,U2,U3:X = f1(U1), Z = f2(U2),
R = f3(U3). Управляющие воздействия Ub U2, U3 предназначены
соответственно для изменения множества фактов X, вводимого в
систему знания Z и реструктуризации закономерности R.
Относительно приведенных переменных и зависимостей базы
знаний можно классифицировать следующим образом:
с фиксированным и изменяемым множеством фактов X;
с фиксированным и пополняемым знанием Z;
с фиксированной и реструктурируемой закономерностью R.
В частном случае фиксированное множество фактов X может
быть пустым: X = 0. При этом БЗ выполняет роль генератора ва-
у и риантов предметного знания, подобно генера-
I' |3 тору сигналов. Информационные системы,
I I ядром которых является генератор вариантов
t Т предметного знания, а назначением — порож-
х *"" R *^Y дение справочных данных в узкой ПО, называ-
¦ ют интеллектуальными справочниками [58].
I Модель вывода генератором вариантов зна-
и2 »-z ния описывается формальной системой F =
D i.r = <Т, Р, А, В>.
Рис. 3.4. Схема взаи- ' ' '
модействия базы зна- Ее символы интерпретируются соответст-
ний с внешней средой венно как множества базовых элементов,
синих
токсических правил, аксиом и правил вывода (семантических
правил).
Базовые элементы Т задают алфавит ПО (логический,
словарный, предметный и т.д.). Принадлежность элемента х
алфавиту Т устанавливается за конечное число шагов с помощью
процедуры П(Т).
Синтаксические правила Р задают ограничения на построение
синтаксически правильных совокупностей — цепочек символов
(формул, слов и предложений языка). Синтаксическая правильность
цепочек должна устанавливаться за конечное число шагов с
помощью процедуры П(Р).
Аксиомы А представляют собой подмножество синтаксически
правильных совокупностей (формул), общезначимых в ПО. Для
проверки общезначимости должна существовать конечная
процедура П(А). В качестве таковой используется построение таблиц
истинности для соответствующей формулы.
С помощью правил вывода В порождаются новые семантически
правильные совокупности, к которым также применимы правила
вывода. Таким образом, формируется множество выводимых в
формальной системе совокупностей.
Разрешимость системы определяется наличием процедуры П(В)
сопоставления порождаемых формул с известными их образцами и
разделения последних на семантически правильные и
неправильные. С этой целью заранее известные ограничения вариантов
генерации задаются запрещенными формулами либо их признаками.
Соответствующие им формулы признаются неправильными и
исключаются из рассмотрения в процессе порождения. Результатом
генерации являются семантически правильные формулы, или
иначе — правильно построенные формулы (ППФ), образующие
перечислимое множество допустимых вариантов.
Формальная система непротиворечива, если в ней не найдется
такой формулы, что и она сама, и ее отрицание выводимы.
Формальная система полна, если множество аксиом и правил
вывода позволяет генерировать все допустимые совокупности [44].
Пример 3.6, В качестве базовых элементов Т примем буквы
русского алфавита. Синтаксические правила Р задают нормы
формирования допустимых сочетаний букв. Например, сочетание «ще» в
русском языке относится к запрещенным. В качестве аксиом
примем сочетания букв, образующих приставку П, корень К, суффикс
С и окончание О. В качестве правил вывода слов на основе
приведенных аксиом примем правила конкатенации (присоединения) и
подстановки.
9 — 3466
129
Правило конкатенации определим как истинность любых
непустых последовательностей из цепочки П-К-С-О. Например,
истинными являются последовательности П-К, К-С, К-С-О,
П-К-С-0 и т.д. Здесь тире играет роль разделителя слогов.
Правило подстановки определим как таблицу:
|ti,t2,-.,tk |
Результатом подстановки является одновременное замещение
всех свободных вхождений х4 в формулу Т, состоящую из
совокупности слогов. При замещении переменных формулы П-К
значениями при и вал получается, например, слово привал, семантически
правильное в русском языке.
Особенностью модели формальной системы является жесткая
предопределенность представляемого ею знания. В тех случаях,
когда модели требуется придать адаптационные свойства, например с
целью обучения, ее расширяют следующим образом:
F = <Т, Р, А, В, ДСП, А(Р), Д(А), Д(В)>.
Дополнительные символы модели задают правила изменения
первых четырех ее компонентов, что позволяет корректировать
базовые элементы, синтаксические правила, аксиомы и правила
вывода при углублении знания о ПО либо при взаимодействии с
другими ПО.
Управление функционированием формальной системы
реализуется как через ограничение выводимых последовательностей
(цепочек), так и через расширение ее компонентов: ДТ, ДР, ДА, ДВ. В
первом случае возможны два варианта функционирования
аксиоматической БЗ: вывод одной цепочки, обусловленной вектором
значений управляющих признаков < ul9...9ил >, и вывод всех
допустимых цепочек f2 :U{ x...x Uk -> Y или их части (режим
автоматической генерации). Последний основан на переборе всех или
части значений управляющих признаков.
Фиксированное знание характерно для специализированных
интеллектуальных информационных систем, а пополняемое
знание — для систем, обладающих свойством адаптации к изменению
внешней среды. Помимо пополнения знания, может требоваться
его реструктуризация, связанная с изменением закономерностей.
Основными источниками создания и пополнения БЗ ПО
являются эксперт, документы и базы данных. В соответствии с ними БЗ
включаются в состав экспертных систем, систем документирования
130
и систем, основанных на извлечении знаний из данных (data
mining).
Операции, выполняемые над базой знаний при ее пополнении.
Машинная форма представления базы знаний зависит от ее роли в
ИнС. База знаний может быть либо встроена в ИнС, либо быть
внешней по отношению к ней. В первом случае она реализуется
как программный компонент ИнС, а во втором — размещается на
машинном носителе в виде файла. Однако и в том, и в другом
случае используется общий набор базовых операций над базой
знаний. Их можно разделить на три группы:
• подготовка базы знаний;
• исполнение (получение знания);
• взаимодействие с внешними подсистемами.
Подготовка базы знаний включает следующие операции:
• создание;
• отображение (визуализация);
• отладка;
• контроль;
• обновление;
• сохранение и регистрация.
Для реализации перечисленных операций разрабатываются
редакторы баз знаний. Несмотря на специфику, отражающую
используемые модели знаний, они реализуют следующие группы
стандартных функций.
1. Функции отображения:
• отображение модели знаний на экране терминала;
• навигация по структуре модели.
2. Функции преобразования:
• изменение содержимого модели знания;
• добавление новых знаний;
• удаление ненужных фрагментов.
3. Функции контроля:
• контроль семантической целостности БЗ после модификации;
• проверка полноты и непротиворечивости;
• инициализация тестовых примеров.
4. Функции сохранения и регистрации:
• поддержание файловой системы;
• регистрация изменений;
• авторизация изменений.
9* 131
Для получения знания из БЗ используются следующие базовые
операции:
• Настройка БЗ на вывод требуемого знания.
• Настройка подсистемы вывода знания.
• Ввод фактов (значений) входных переменных.
• Вывод знания.
• Представление результатов вывода (полученного знания).
• Объяснение результатов.
• Сохранение результатов.
Центральная операция — вывод знания — реализуется
решателем. В разных ИнС его также называют интерпретатором, или
машиной вывода. Операции настройки решателя реализуются
подсистемой настройки. Для хранения исходных данных' (фактов) и
результатов используется база данных. Представление результатов
вывода и их объяснение реализуется подсистемами отображения и
объяснения (обоснования).
Взаимодействие БЗ с внешними подсистемами осуществляется
по данным процедурам и управляющей информации. Обмен
данных осуществляется через БЗ системы. Использование внешних
процедур реализуется с помощью механизма встраивания их в БЗ.
Обмен управляющей информацией осуществляется с целью
настройки режимов взаимодействия БЗ с внешними подсистемами.
Архитектура системы работы со знаниями. Различают следующие
уровни представления и пополнения знаний:
1. Внешний, или пользовательский уровень использует
предметный язык (вербальный, графический), привычный предметнику.
На этом уровне формулируются функции системы.
2. Концептуальный уровень (в понятиях ПО) определяет общую
структуру знания ПО. Концептуальные и формальные модели
строит системный аналитик.
3. Внутренний уровень представляет собой конкретную
программную реализацию системы, выполняемую программистом.
4. Аппаратно-программный уровень характеризует
компьютерную среду, используемую в качестве носителя знания.
Как следует из пояснений, различие между уровнями
заключается в языке, применяемом для представления знаний. Для работы
со знаниями на любом из этих уровней используются следующие
базовые компоненты:
• база знаний;
• редактор базы знаний;
• база данных со своей СУБД;
132
• решатель;
• подсистема настройки и управления;
• подсистема объяснения;
• диалоговая подсистема.
В некоторых источниках совокупность средств,
обеспечивающих работу со знаниями, называют системой управления базой
знаний (СУБЗ) по аналогии с СУБД. Сложность перечисленных
компонентов, их роль и участие в составе системы на различных
стадиях работы с БЗ зависит от назначения системы, использующей эту
БЗ. Взаимодействие этих компонентов представлено на рис. 3.5.
Рассмотрим некоторые компоненты подробнее.
Инструментальная система. На рис. 3.5 редактор и диалоговая
подсистема разработчика выделены пунктиром, поскольку
непосредственно для работы БЗ они не требуются. Редактор играет роль
инструментальной системы и используется разработчиком
(экспертом) для создания, редактирования, обновления, пополнения,
контроля компиляции БЗ.
Инструментальные системы, используемые для создания и
накопления знаний, делятся на специализированные и универсальные.
Специализированные системы (оболочки — shell) ориентированы
на определенные модели знаний. Например, инструментальные
системы PROLOG, LEONARDO, SIMER-MIR предназначены для
создания экспертных систем на основе соответственно
продукционной, продукционно-фреймовой и сетевой моделей.
Базы знаний, проектируемые с помощью оболочек,
представляют собой файлы с расширением, привязанным к редактору
(например, *.pkb для LEONARDO и *.spm для SIMER-MIR). Такая форма
представления допускает автономное использование БЗ (вне редак-
i
БД
А
БЗ
*
Решатель
|
Объяснение
•+—|—
т [
»|
т 1
J СУБД
1.
1 : Редактор
Ч Настройка и
J управление
*
1 Отображе-
J ние
-**-
¦* —
Диалог
Диалог
Рис. 3.5. Архитектура системы работы со знаниями
133
тора) при наличии автономной системы настройки и управления.
Это свойство присуще системе SIMER-MIR, в которой
допускается возможность отчуждения экспертной системы. Функции
получения (вывода) знаний выполняет подсистема MIR.
Инструментальные системы различаются между собой также
степенью интеллектуальности, характеризующей близость языка
представления модели знания к естественному языку. Если в
оболочках PROLOG и LEONARDO модели знаний проектируются с
использованием языков программирования, то SIMER-MIR
использует возможности только естественного языка. Универсальная
инструментальная система инвариантна к модели знания. Системы
этого типа различаются технологиями проектирования
программных систем вообще и систем, основанных на знаниях, в частности.
Решатель. Характеристика решателя зависит от типа базы
знаний. При этом каждый решатель использует три источника
информации: базу знаний, рабочую память и память состояния решателя.
Типовой цикл работы решателя состоит из четырех шагов:
• выборка информации;
• анализ информации;
• разрешение конфликтов;
• выполнение.
1. На этапе выборки информации осуществляется
определение подмножества элементов рабочей памяти и модулей БЗ,
которые могут быть использованы в текущем цикле. Иногда один
этап выборки используется сразу для некоторой
последовательности циклов.
Выборки делятся на синтаксические и семантические. Выборка
1-го типа выполняет грубый отбор информации. Семантическая
выборка выполняется на основе метазнаний о базе знаний,
вводимых пользователем.
2. Анализ определяет информацию, релевантную поставленной
задаче.
3. На этапе разрешения конфликтов решатель осуществляет
выбор варианта из конфликтного набора (например, выбирает то
правило, которое будет выполняться в текущем цикле). На этом этапе
решатель оценивает выбранные модули с точки зрения их
полезности для достижения текущей цели. Поэтому данный этап часто
называют планированием.
4. На этапе выполнения осуществляется вывод промежуточного
или конечного знания. В ходе этого этапа выполняются операции
ввода/вывода, а также модифицируется рабочая память, память
состояния решателя, реже — сама база знаний.
134
Подсистема настройки и управления. Эта подсистема служит для
настройки базы знаний и решателя на оптимизацию решения
поставленной задачи. Особенности подсистемы также определяются
типом базы знаний. Например, в системе SIMER-MIR
выполняются следующие основные операции по настройке базы знаний:
• разметка базы знаний (задание роли событиям: признака,
обусловленного признака, гипотезы);
• расположение разделов сетевой модели в заданном порядке;
• установление порядка опроса событий при вводе фактов.
Настройка решателя заключается в выборе режима его
функционирования. Например, в системе Leonardo выбирается один из
методов вывода знания (направление обхода дерева решения):
прямой, обратный и смешанный (двусторонний) по умолчанию.
Подсистема диалога. Подсистема диалога (компонент
взаимодействия) играет важную роль в общении человека с системой.
Вне зависимости от цели диалога она выполняет две основные
функции:
1) организует диалог система — пользователь (разработчик);
2) осуществляет обработку каждого введенного сообщения.
Организация диалога — это процесс непротиворечивого
взаимодействия участников, в котором они преследуют свои цели с
помощью обмена сообщениями на установленном языке общения.
Непротиворечивое взаимодействие возможно при условии
согласования целей участников.
Инициатором диалога может выступать как пользователь, так и
система. Пользователь инициирует действие командой или запросом
на естественном языке (ЕЯ). Система инициирует действие
предложением меню или анкеты.
Для того чтобы взаимодействие между системой и
пользователем было успешным, необходимо соблюдать постулаты общения
(постулаты Грайса):
• адекватность количества информации цели (высказывание
не должно содержать больше информации, чем требуется);
• приемлемость качества информации (необходимо вводить
только известную и проверенную информацию);
• релевантность теме (необходимо вводить информацию
только касающуюся данной темы);
• ясность выражения (однозначность, упорядоченность и
краткость информации).
Обработка сообщения основана на обработке ЕЯ.
135
От того, как построена компонента взаимодействия, во многом
зависит дружественность системы по отношению к пользователю.
Систему можно считать дружественной, если компонента
взаимодействия имеет следующие свойства:
• адекватность системе, т.е. возможность для конечного
пользователя сформулировать любой запрос, который может обработать
система;
• релевантность, т.е. система предоставляет конечному
пользователю лишь ту информацию, которая необходима в данный
момент;
• самообъяснение, когда от конечного пользователя не требуется
предварительного «безмашинного» обучения и наличия во время
сеанса работы каких-либо внешних инструкций по обучению;
• безызбыточность, т.е. система не заставляет конечного
пользователя выполнять какие-либо лишние действия в ходе диалога
(например, для завершения работы с системой на произвольном
шаге диалога);
• терпимость к ошибкам (толерантность), что означает выдачу
системой развернутых диагностических сообщений и наличие
средств корректировки ошибок, а также устойчивость по
отношению к несанкционированным действиям конечного пользователя;
• устойчивость к сбоям (например, возможность
восстановления информации при ее искажении и т.п.).
Подсистема объяснения. Она необходима по двум причинам:
• сложность системы не позволяет пользователю охватить все
нюансы ее функционирования;
• поскольку в слабоформализованной области нет твердой
гарантии достоверности результата, пользователь должен сам иметь
возможность убедиться в достоверности и логичности получаемых
решений.
Компонент объяснения (КО), как и компонент
взаимодействия, должен ориентироваться на разные категории пользователей.
Построение КО основано на двух подходах.
1. Используются записанные объяснения, т.е. заранее
подготовленные тексты на ЕЯ. Обычно так строятся сообщения об
ошибках. Этот подход прост, но имеет существенные ограничения.
2. Генерируются объяснения на основе трека выполнения
программы. Для этого обычно запоминаются все события, которые
реализовывались ЭС, и в случае вопроса компонент объяснений
просматривает трек работы в обратном порядке.
136
В системе SIMER-MIR в качестве обоснования принятого
решения приводятся списки положительных и отрицательных
признаков. В качестве объяснения отрицательного признака выступает
предшествующий признак или гипотеза, вошедшая в решение,
которое исключает данный признак. Для визуализации зависимости
полезно представление фрагмента сетевой модели с цветовым
обоснованием зависимостей между вершинами. Этот пример
показывает возможность представления различных форм зависимости
между введенным знанием и исходными условиями.
3.3. Методы логического вывода
пополнения знаний
Методы логического вывода являются одними из основных
компонентов интеллектуализированных систем пополнения знаний.
Подобная гипотетическая система пополнения знаний состоит из
трех частей: интеллектуального интерфейса, подсистемы хранения
данных и знаний, подсистемы пополнения данных и знаний,
включающей в себя машину логического вывода (рис. 3.6) [45].
К настоящему времени в области искусственного интеллекта
известно большое количество систем логического вывода. Все они
отличаются друг от друга заложенными в них моделями знаний,
И НТЕЛЛЕКТУАЛ ЬНЫЙ
ИНТЕРФЕЙС
Анализ и синтез
речи
Лингвистический процессор
Сенсоры
Система
зрительного восприятия
Эффекторы
ПОДСИСТЕМА ХРАНЕНИЯ
ДАННЫХ И ЗНАНИЙ
База знаний
База данных
Внешняя
среда
ПОДСИСТЕМА
ПОПОЛНЕНИЯ ДАННЫХ И ЗНАНИЙ
Машина логического вывода
Рис. 3.6. Структура системы пополнения знаний
137
видами логического вывода, способами реализации, методами
логического вывода и могут входить в состав ИнС различного
назначения. В свою очередь, методы вывода основанных, например, на
логических моделях знаний, можно классифицировать в
зависимости от применяемых исчислений, принципов доказательства
теорем, направленности вывода, стратегий и тактик управления
выводом. Характеристика системы логического вывода представлена на
рис. 3.7.
Рассмотрим более подробно модели знаний и виды логического
вывода.
Модели знаний. Знания, как уже говорилось ранее, есть
совокупность фактов, закономерностей и эвристических правил, с
помощью которых можно решить поставленную задачу.
Поверхностные знания представляют собой эвристики и некоторые
закономерности, устанавливаемые опытным путем. Глубинные
знания — это совокупность основных закономерностей, аксиом и
фактов о конкретной предметной области. Они отражают наиболее
общие принципы, в соответствии с которыми развиваются все
процессы в предметной области, а также свойства этих процессов.
Содержание как глубинных, так и поверхностных знаний полностью
обусловливается природой предметной области и видом решаемых
задач [118].
Системы логического вывода
Методы вывода
Назначение
ИнС
Модель знаний
Экспертная
система
И Логическая
Система
управления
База данных и !
знаний I
САПР, АСНИ,
Вид вывода
Продукционная
И Фреймовая
Реализация
Дедуктивный
Н Программная
Абдуктивный
Индуктивный
Программно-
аппаратная
Аппаратная
На
семантических сетях
Рис. 3.7. Характеристика систем логического вывода
138
3 искусственном интеллекте используются различные способы
представления и пополнения знаний. Наибольшее
распространение в системах логического вывода нашли следующие модели
(формы представления) знаний продукционная, логическая,
фреймовая и на семантических сетях.
Для большинства используемых сегодня способов
представления знаний и созданных на их основе систем логического вывода
характерно резкое усложнение описания задачи при возрастании ее
масштабов. Единственным исключением является математическая
логика [33]. Если во всех других способах при усложнении задачи
до некоторого уровня фактически исчезает возможность
управления знаниями (полученный результат не есть гарантия его
достоверности), то логика позволяет гарантировать получение надежных
результатов даже при понижении эффективности представления.
Кроме того, логическое представление имеет высокий уровень
модульности знаний, и одновременно с этим позволяет получить
единственную систему описания, в которой логически
разъясняются свойства знаний как единого целого.
В силу этих причин логическая модель знаний получила
широкое распространение в системах логического вывода. В
дальнейшем будут рассматриваться знания, представленные именно
логическим способом.
Виды логического вывода. Существуют три основных вида
логического вывода [45]:
• дедукция — аналитический процесс, основанный на
применении общих правил к частным случаям, с выводом результата;
• индукция — синтетические рассуждения, которые выводят
правило, исходя из предпосылок и результата;
• абдукция — другая форма синтетического вывода, однако
выводящая предпосылки из правила и результата.
Один из основателей науки об обработке символов Дж. Пирс
называет индукцию и дедукцию в качестве основных способов
логического вывода [119]. Он дает описание связей между этими
принципами, используя следующий широко известный силлогизм:
1. Правило (главная посылка) Vx HUMAN(x) => MORTAL(x).
2. Факт (второстепенная посылка) HUMAN(SOCRAT).
3. Цель (вывод) MORTAL(SOCRAT).
Дедукцией называется логический вывод, заключающийся в
выведении цели 3 из посылок 1 и 2. Индукцией называется
логический вывод, при котором предполагается, что между двумя
известными фактами — второстепенной посылкой 2 и выводом 3 — су-
139
ществует главная посылка 1. Поскольку правило 1 представляет
собой аксиому или общий принцип, индукция — это вывод
существования общего принципа между двумя отдельными фактами.
Обычно неясно, верен ли общий принцип, полученный с помощью
индукции. Для подтверждения его правильности оказываются
необходимыми проверки под самыми разными углами зрения.
Продолжая рассмотрение силлогизма, можно так определить
абдукцию: абдукцией называется логический вывод, при котором
предполагается, что между известными — главной посылкой 1 и
выводом 3 — существует второстепенная посылка 2.
Абдукция — это вывод второстепенной посылки 2 на основании главной
посылки 1 и цели 3.
Рассмотрим абдукцию более подробно. Абдукция — широко
используемый в повседневных рассуждениях процесс вывода. Она
заключается в нахождении объяснений для наблюдаемых фактов.
Абдукция является одной из форм немонотонного вывода,
поскольку найденные объяснения могут быть отменены в процессе
вывода. На самом деле, объяснения, которые согласуются с одним
состоянием базы знаний, могут не согласоваться с ней после
добавления нового знания. Существование различных объяснений
одного и того же эффекта является основной чертой абдуктивного
вывода, и выбор наиболее «предпочтительных» из них является
важной задачей.
Задачу абдукции можно сформулировать следующим образом
[45]. Пусть знания представляются множеством клозов Т и дана
формула G (наблюдение). Задачей абдукции является нахождение
множества формул D (абдуктивного объяснения G), такого, что
1) Т U D -* G, 2) Т U D — совместно.
Первое условие вытекает из определения абдукции, а
второе — дополнительное требование, носящее естественный
характер.
Можно задать другие естественные условия, которым должно
удовлетворять абдуктивное объяснение. Например, можно
потребовать, чтобы объяснение было минимальным, т. е. не включало в
себя другое возможное объяснение.
Перспективными областями применения абдукции являются
[120]:
• Диагностика. Например, в области медицинских диагнозов
кандидатами в абдуктивные объяснения являются возможные
заболевания, а наблюдениями являются симптомы заболеваний. В
диагностике отказов множество клозов описывает нормальное поведе-
140
ние системы, и задача заключается в том, чтобы найти множество
объяснений вида «некоторый компонент А не в порядке», которое
объясняет, почему система не функционирует нормально.
• Распознавания графических объектов. В этом случае
объяснениями являются объекты распознавания, а наблюдениями —
описание изображения в поле зрения.
• Обработка естественных языков. Абдукцию можно применять
в обработке естественных языков для интерпретации
неоднозначных предложений. Здесь абдуктивными объяснениями являются
различные варианты понимания таких предложений.
• Планирование. В задачах планирования планируемые действия
можно трактовать как объяснения целевого состояния, которое
должно быть достигнуто.
• Приобретение знаний. Приобретение знаний может
происходить как добавление к базе знаний не самих данных, поступающих
в систему, а их абдуктивных объяснений.
Формальные системы и методы пополнения знаний на основе
логического вывода. В основе любой системы логического вывода лежит
формальная система (ФС). Под ФС понимается совокупность
чисто абстрактных методов, в которых представлены правила
оперирования множеством символов в чисто синтаксической трактовке без
учета смыслового содержания [50].
В ФС, оперирующей теми или иными символами, эти символы
воспринимаются как элементы, с которыми обращаются согласно
определенным правилам. Понятие истинности в этом случае
появляется лишь в связи с возможными интерпретациями системы.
Формальная система считается заданной, если выполняются
следующие условия:
• задано некоторое множество элементов-термов и конечное
множество элементов-связок или операций;
• заданы правила конструирования формул;
• выделено некоторое множество формул, называемых
аксиомами;
• имеется множество отношений между формулами, т.е.
правила вывода.
Наибольшее распространение в системах логического вывода
получили два класса ФС: исчисление высказываний и исчисление
предикатов первого порядка. В исчислениях высказываний и
предикатов существует множество правил вывода. Они могут
применяться либо для установления истинности утверждений в целом,
либо для порождения заключений.
141
Рассмотрим возможности представления знаний в логике
высказываний.
Пропозициональный словарь логики высказываний
традиционно составляется из бесконечного (счетного) множества
высказываний, обозначаемых строчными буквами (иногда с индексами), и
пяти связок: отрицания (—), конъюнкции (л или &), дизъюнкции
(v), импликации (—») и эквивалентности (<->). Словарь дает
возможность строить сложные или составные высказывания из
исходных (простых, элементарных), соединяя последние связками.
Правила построения описывают те выражения, которые являются
объектами языка. Такие высказывания называют формулами.
Интерпретировать формулу — значит приписать ей одно из двух
значений истинности: истина И A) или ложь JI @). Семантика
произвольной формулы исчисления высказываний полностью
определяется ее таблицей истинности. Формула семантически выполнима
или просто выполнима, если она допускает некоторую модель, т.е.
ее можно интерпретировать со значением И. Формула
общезначима, если она истинна независимо от истинностных значений,
приписанных составляющим ее высказываниям. Общезначимые
формулы исчисления высказываний часто называют тавтологиями.
Любая формула может быть преобразована в эквивалентную ей,
имеющую вид «нормальной», или «канонической» формы [121]. В
этом отношении особый интерес представляют понятия
«дизъюнкт» и «конъюктивная нормальная форма». Дизъюнктом
называется дизъюнкция конечного числа литералов. Дизъюнкт
общезначим тогда и только тогда, когда он содержит пару
противоположных литералов.
Единственным невыполнимым дизъюнктом является пустой
дизъюнкт, обозначаемый Л или 0. Конъюнктивной нормальной
формой (КНФ) называется конъюнкция конечного числа
дизъюнктов КНФ, которая содержит только пустой дизъюнкт и
эквивалентна Л.
Часто бывает, что какой-либо метод логического вывода,
неэффективный в наибольшей общности, оказывается эффективен в
некоторых частных случаях. Например, метод резолюции,
рассматриваемый далее, оказывается наиболее эффективным, когда задача
представлена в виде хорновских дизъюнктов [122], т. е. таких,
которые не содержат более одного позитивного литерала. Дизъюнкт
Хорна Bi & В2 & ... & BN —> А иногда также называется хорновским
клозом или правилом. Если антецедент (тело) дизъюнкта
отсутствует, то формула принимает вид -> А и называется фактом. Если
142
отсутствует сукцедент (голова), то формула Bi & В2 & ... & Bn -»
называется целью (запросом).
В логическом языке Пролог, в основе которого лежит принцип
резолюции на базе хорновских дизъюнктов, вывод состоит в
доказательстве непротиворечивости цели базе данных, состоящей из
правил и фактов.
К настоящему времени в области искусственного интеллекта
известно большое количество методов логического вывода. Все они
отличаются друг от друга заложенными в них формами
представления правил, законами логики, принципами и направленностью
вывода, стратегиями и тактиками управления выводом.
Характеристика методов логического вывода представлена на рис. 3.8.
Методы логического вывода
Форма представления
данных
Законы логики
Секвенции
Дизъюнкты
Клозы Хорна
Принцип
Modus ponendo
ponens
\—\ Эрбрана
Modus tollendo
tollens
Modus ponendo
tollens
Резолюции
Деление
дизъюнктов
Modus tollendo
ponens
Направленность
Тактика
Прямой
И Обратный
Стратегии
Сначала
«вглубь»
Сначала
«вширь»
|_|
Двунаправленный
Синтаксические
Семантические
Эвристические
Рис. 3.8. Характеристика методов логического вывода
143
Законы логики и принципы. Фундаментальная проблема любой
аксиоматической системы, называемая проблемой дедукции,
формулируется так: определить, является ли формула А логическим
следствием множества формул Вь Вг, ..., Bj.
Во многих методах дедукции в качестве правил вывода
используются законы логики. В частности, широкое распространение
получили следующие два закона [123].
Modus ponendo ponens:
В-»С,В
С "
Modus tollendo tollens:
B-»C,B
С
Из большого числа различных принципов логического вывода
рассмотрим наиболее известные.
Тривиальный алгоритм требует просмотра некоторого полного
семантического дерева, соответствующего конечному множеству
высказываний, встречающихся в А. Этот алгоритм крайне
неэффективен: если формула А содержит п различных высказываний, то
нужно рассматривать 2П интерпретаций.
Алгоритм Куайна и алгоритм редукции [8] — довольно
незначительное усовершенствование тривиального алгоритма. Дэвис и
Патнем доказали, что алгоритм Куайна для проверки
выполнимости и общезначимости формулы упрощается в применении к
конъюнктивной нормальной форме. Проблема общезначимости
становится тривиальной: речь идет о проверке тавтологичности каждого
дизъюнкта.
Важные и интересные результаты в этом направлении были
получены Эрбраном [124]. Его подход основан на том, что множество
дизъюнктов S невыполнимо тогда и только тогда, когда оно
принимает значение Л во всех интерпретациях на любых областях.
Однако в силу невозможности рассмотрения всех интерпретаций,
необходимо найти такую специальную область интерпретации,
установив на которой факт невыполнимости множества дизъюнктов,
можно было бы сделать вывод о невыполнимости его на других
областях. Такая область получила название универсума Эрбрана.
Несколько иной подход предложил Робинсон [19], разработав
достаточно удобный метод для выявления невыполнимости
множества дизъюнктов, представленных в виде КНФ. Действительно, по
144
определению множество дизъюнктов невыполнимо тогда и только
тогда, когда пустой дизъюнкт Л является логическим следствием из
него. Таким образом, невыполнимость множества S можно
проверить, порождая логические следствия из S до тех пор, пока не
получим пустой дизъюнкт.
Для порождений логических следствий используется правило
резолюции:
{AvX, BvX}->AvB,
где А, В — дизъюнкты; X — высказывание.
Литералы X и X называются контрарной парой; полученный в
результате применения данного правила дизъюнкт называется
резольвентой. Если S — невыполнимое множество, то при помощи
резолюции можно получить пустой дизъюнкт (Л).
Именно на основе принципа резолюций построен один из
наиболее распространенных языков логического
программирования — Пролог.
Направленность и тактика. В зависимости от направления
возможны три вида вывода [8]. Это, во-первых, правосторонний или
обратный вывод, когда вывод ведется от заключения к исходным
посылкам. Иногда для указания использования обратного вывода
пользуются термином «модель трансформации целей». Во-вторых,
левосторонний вывод, когда вывод осуществляется от исходных
посылок к заключению, — так называемый прямой вывод («модель
трансформации знаний»). И наконец, двунаправленный вывод,
т. е. доказательство ведется параллельно как от исходных посылок,
так и от заключения.
Независимо от направления вывода можно выделить две
тактики управления ходом вывода. Дерево состояний, начинающееся от
заданной цели или начального состояния, может быть просмотрено
сначала «вглубь» или сначала «вширь».
При поиске «вглубь» дерево просматривается от заданного
состояния на всю глубину до исчерпания последовательности
«преемственных» состояний на этом пути, т. е. движение
осуществляется вдоль самой левой ветви до тех пор, пока не будет найдено
решение или достигнут конец ветви. В последнем случае необходимо
«отступить» в предыдущую точку ветвления (так называемая
процедура back tracking) и просмотреть все.остальные ветви.
Недостатком просмотра сначала «вглубь» является необходимость
сохранения информации о всех пройденных вершинах, так как постоянно
существует вероятность возврата в любую из них.
10 — 3466
145
При поиске сначала «вширь» происходит порождение всех
возможных на данном уровне альтернатив, а затем альтернатив на
следующем уровне и т. д. При этом порождение альтернатив текущего
уровня может выполняться параллельно, что важно для методов
параллельного логического вывода.
Стратегии. В настоящее время существует множество различных
стратегий, направленных на повышение эффективности процедур
поиска нужных дизъюнктов. Эти стратегии можно поделить на
синтаксические, семантические и эвристические. Необходимо
отметить, что на практике часто встречается комбинация различных
видов стратегий вывода. Наиболее известны следующие стратегии
[124]. Так называемый «чистый Пролог» использует стратегию
линейного вывода. При такой стратегии i-e предложение вывода
имеет в качестве одного из своих «родителей» (i — l)-e предложение
вывода, что сильно сужает число рассматриваемых дизъюнктов и
приводит к довольно обозримым (по сравнению с интуитивным
выбором) доказательствам.
Другая эффективная стратегия была предложена Дж. Слейглом
и получила название семантической резолюции. При
использовании семантической резолюции число излишних дизъюнктов
уменьшается за счет интерпретации и упорядочения предикатных
букв. Исходное множество делят на два подмножества и запрещают
образование контрарных пар (L и Г) внутри одного подмножества.
Для разбиения на подмножества используется интерпретация,
когда в первое подмножество включаются дизъюнкты, которые при
данной интерпретации принимают значение И, а во второе —
дизъюнкты, принимающие значение Л. Также способствует
ограничению количества генерируемых резольвент упорядочение литералов
(например, по алфавиту). Тогда в качестве родительских будут
выбираться дизъюнкты, у которых контрарные литералы являются
наибольшими (крайними слева).
Иногда множество предложений удается упростить, исключив
из него некоторые предложения (или литералы из предложений). С
помощью такой стратегии упрощения можно снизить скорость
роста числа новых предложений.
Под исключением тавтологий понимается: любые предложения,
содержащие литерал и его отрицание, можно отбросить, так как
любое невыполнимое множество, содержащее тавтологию, остается
невыполнимым и после исключения последней.
Исключение подслучаев предполагает следующее: если дизъюнкт
{1^} является подслучаем дизъюнкта {М,}, то предложение {Li} можно
146
исключить, не нарушая свойства невыполнимости оставшегося
множества.
Присоединение процедур понятно из следующего рассуждения.
Иногда можно оценить значение истинности некоторых литералов.
Такое означивание легко провести для константных частных
случаев. Если какой-либо литерал предложения получает значение
истинности, то все содержащие его предложения можно отбросить.
Если же какой-либо литерал при означивании получает значение
«ложь», то из всех предложений можно исключить данное
вхождение литерала.
Гиперрезолюция предполагает, что можно сделать так, чтобы в
резолюции участвовало сразу несколько предложений, т. е.
вводится гиперрезолюция. Для конечного множества предложений {Q,
С2, ..., Сп} и единственного предложения В должны
удовлетворяться следующие условия:
1) В содержит п литералов: Lb L2, ..., Ц;
2) для каждого i(l < i < п) предложение Q содержит литерал Ц,
но не содержит других литералов из В или из любого отличного от
него Q.
Тогда гиперрезольвента определится следующим образом:
Rn = (С, - {IJ, С2 - {Г2}, ..., Сп - {Q, В - {Lb L2, ..., Ц}).
Существуют и другие стратегии выбора и упрощения дизъюнктов.
3.4. Обобщение и классификация знаний
Обобщение знаний. Способность человеческого мышления к
обобщению лежит в основе любого научного исследования.
Именно в результате обобщения получаются новые знания, т.е. знания,
не следующие непосредственно из ранее известных. В системах,
моделирующих мышление, обобщение понимают как процесс
получения знаний, объясняющих имеющиеся факты и способных
объяснять, классифицировать или предсказывать новые. В общем виде
задача обобщения формулируется следующим образом: по
совокупности наблюдений (фактов) F, совокупности требований и
допущений к виду результирующей гипотезы Н и совокупности
базовых знаний и предложений, включающих знания об особенностях
предметной области, выбранном способе представления знаний,
наборе допустимых операторов, эвристик и др., сформулировать
гипотезу Н : Н —> F(H «объясняет» F) (рис. 3.9.).
10* 147
Новые знания
Совокупность
наблюдений
(фактов) F
Совокупность
требований и
допущений
L
т
Результирующая
гипотеза
Н: Н-— F
i
БЗПО
-А
Набор операторов,
эвристик,
Модели
| представления
знаний
Рис. 3.9. Схема обобщения знаний
Форма представления и общий вид гипотезы Н зависят от
цели обобщения и выбранного способа представления знаний.
Модели обобщения, включающие модели классификации,
формирования понятий, распознавания образов, обнаружения
закономерностей, определяются целями обобщения, способами
представления знаний, общими характеристиками фактов,
критериями оценки гипотез.
При работе с информацией о предметной области можно
выделить: А — модели обобщения по выборкам и Б — модели обобщения
по данным.
А. В первом случае совокупность фактов F имеет вид
обучающей выборки — множества объектов ?ц i e I, каждый из которых
сопоставляется с именем класса К,, j € J, т.е. это обобщение
(обучение) с учителем. При этом существует априорное разбиение на
классы. Целью обобщения в этом случае может являться:
a) формулирование понятий — построение по данным
обучающей выборки для каждого класса К,, j e J, максимальной
совокупности его общих характеристик;
b) классификация — построение по данным обучающей
выборки для каждого класса Kj, j е J, минимальной совокупности
характеристик, которая отличала бы элементы Kj от элементов других
классов;
c) определение закономерности последовательного появления
событий.
К моделям обобщения по выборкам относятся: а)
лингвистические модели; б) методы автоматического синтеза алгоритмов и
программ по примерам и др.
Б. В моделях обобщения по данным априорное разделение
фактов по классам отсутствует. Здесь могут ставиться следующие цели:
148
• формулирование гипотезы, обобщающей данные факты;
• выделение образов на множестве наблюдаемых данных,
группировка данных по признакам (задача формирования понятий,
определенная в модели обобщения по выборкам, также часто
ставится без априорного разбиения обучающей выборки по классам);
• установление закономерностей, характеризующих
совокупность наблюдаемых данных.
С точки зрения способа представления знаний и допущений на
общий вид объектов наблюдений 1Х методы обобщения делятся на: 1)
методы обобщения по признакам; 2) структурно-логические (или
концептуальные) методы и 3) методы обобщения на семантических сетях.
В первом случае объекты 1Х е F, i е I представляются в виде
совокупности значений косвенных признаков — параметров Пк, к е Q.
Методы обобщения и распознавания по признакам
различаются для качественных и количественных (измеримых) значений
признаков.
В формально логических системах, использующих
структурно-логические методы обобщения, вывод общих следствий из
данных фактов называют, как уже упоминалось выше, индуктивным
методом.
В ИнС для представления знаний об объектах используются
обычно модификации языка исчисления предикатов без
ограничения парности предикатных символов или адекватные им по
выразительной мощности семантические сети.
Моделям обобщения на семантических сетях свойственны
черты как для алгоритмов обобщения по признакам, так и
индуктивной логики. Здесь также определяется набор операторов,
используемых при формировании обобщенного представления (гипотезы)
Н и выдвигаются критерии оценки «интересности» и
обоснованности гипотез. Кроме того, в этих моделях широко используется
характерный для обобщения по качественным признакам аппарат
теории покрытий и устанавливаются отношения на множестве
значений признаков объекта — элементов сети. Методами
структурного обобщения решаются обычно задачи классификации,
формирования понятий, анализа сцен.
Задача обобщения — классификации по признакам — ставится
следующим образом. Пусть имеется некоторое множество Z
объектов и множество П = {я*}, i = Т7п признаков. Для каждого щ е П
задана область его определения Дь Каждый объект ? е Z однозначно
определяется вектором П* значений его признаков: П/ е Di x...x Dn.
Известно, что классы Кь К2, ..., Km являются подмножествами Z.
149
Для каждого К,, j = l,m задана информация Ij в виде обучающей
выборки (V+,Vr) множеств положительных и отрицательных
примеров: V/ G Kj, Vj" G Kj ^ 0 Требуется построить решающие
правила \|/j, j = l,m, позволяющие определить принадлежность
произвольного объекта ? е Z классам К,.
Структурно-логические методы в отличие от признаковых
предназначены для решения задачи обобщения на множестве объектов,
имеющих внутреннюю логическую структуру (последовательности
событий, иерархически организованные сети, характеризуемые как
признаками и свойствами объектов-элементов сети, так и
отношениями между ними, алгоритмические и программные схемы).
Сначала рассмотрим идею методов индуктивного вывода в
формальных исчислениях, а затем — методов обобщения на семантических
сетях.
Основой каждой модели индуктивного вывода является набор
правил (схем) индуктивного вывода. В частности, за основную
схему вывода может быть выбрана схема индуктивной резолюции:
P&R -*К
&
-p&F2-*ia
= F1VF2-*K,
или в другой форме
P&R -*К,
= Ft&F, -К.
P&F, -*К
V
-P&F2->K|
(Знак | = обозначает отношение индуктивного следования;
Р = (Рь Р2,»-,Рп) — множество событий или объектов.)
Применение аппарата семантических сетей для решения задач
классификации и формирования понятий позволяет получать
обобщенные представления множеств объектов, имеющих
наглядную семантическую трактовку, и использовать в процессе
обобщения семантику таких понятий, как «признак», «имя», «класс»,
«отношение». Роль языка представления наблюдений и классов
(понятий) играет в данном случае выбираемый формализм
семантической сети.
Рассмотрим методы обобщения на сетях. Пусть Z — множество
объектов ?. Каждый объект представляется сетью, называемой
семантическим графом (СГ), который включает вершины двух типов:
объектные и предикатные. Объектной вершине приписьюается имя
(объекта), имя базового класса объекта и вектор его признаков;
предикатной вершине — имя отношения, выполняющегося между
150
объектами (возможно с отрицанием). Семантический граф,
предназначенный для представления объекта, ? е Z распадается на
иерархически упорядоченное множество двухуровневых р-графов,
служащих для представления объектов ?, его «частей» (р-потом-
ков), частей его частей и т.д.; р-подграф содержит на первом
уровне объектную вершину Vs, связанную отношением р
(целое — часть) с объектными вершинами второго уровня, которые
связаны между собой отношениями через предикатные вершины.
Таким образом, модели и методы обобщения знаний можно
представить в виде схем (рис. 3.10).
Классификация знаний. Классификация — одна из простейших
регулярных структур-взаимосвязей однотипных понятий. Ее
значение определяется, в первую очередь, тем, что она задает на
множестве рассматриваемых понятий однородную структуру
(семантическую сеть), которая носит глобальный характер в рамках данной
предметной области.
Модели обобщения
знаний
Модели обобщения по
выборкам (с учителем) с
априорными данными
Методы
обобщения по
признакам
а
Модели обобщения по
данным (без учителя)
без априорных данных
Методы обобщения
знаний
--—1^^~
Структурно-
логические методы
обобщения
Модели
индуктивного
вывода
Методы обобщения
на семантических
сетях
Модели
обобщения на
семантических
сетях
Рис. 3.10. Классификация методов и моделей обобщения знаний
151
Классификация играет фундаментальную роль как логическое
средство целостного описания некоторой части реального мира,
так как предшествует этапу анализа более тонких, а потому и более
частных связей между понятиями предметной области, которые
должны быть выявлены при решении конкретных прикладных
проблем. Она представляет системным аналитикам и
разработчикам функциональных задач интеллектуализированной
информационной системы целостную совокупность инвариантных для данной
предметной области понятий, которые выполняют роль
естественных координат для описания функциональных задач предметной
области и тем самым позволяют ограничиться рассмотрением
только допустимых классов сущностей без потери информации. Кроме
того, увеличение степени абстракции, которое достигается при
переходе от одного уровня классификационной схемы к другому,
позволяет существенно повысить выразительность спецификации
предметной области, обеспечивая более ясное и более сжатое
представление информации. При этом открывается возможность
устанавливать связи не только между базовыми понятиями ПО,
находящимися на нижнем уровне классификационной схемы, но и
между понятиями верхних уровней. Это обстоятельство делает
понятия, созданные в рамках классификационной схемы, гибким
инструментом анализа ПО в целом.
Классификационные системы, используемые в большинстве
прикладных наук, биологии, геологии, медицине, земледелии и
т. д., представляют, собой не что иное, как иерархию обобщения.
Классификационные структуры совместно с иерархией
агрегации обеспечивают рассмотрение сущностей ПО с двух
взаимодополняющих точек зрения: с позиции взаимосвязей понятий,
образованных для глобального описания ПО (внешние связи
сущностей), и с позиции внутреннего строения сущностей (локальные
связи).
Экстенсиональный и интенсиональный аспекты классификации.
Классификация — это вьщеление на основе существенных
признаков из некоторого множества понятий универсального класса всех
входящих в него подмножеств (подклассов) и установление между
выделенными подмножествами отношения порядка. Признаки, на
основе которых производится вьщеление из универсального класса
всех его подклассов, называются классификационными. Если
Ко — некоторый класс, а Кь Кг,...,К* — его подклассы, то
K0 = ClK1,KinKJ-(a C.27)
i=l
152
Однако в общем случае не обязательно, чтобы выполнялось
соотношение Kj DKjj = 0
Каждый из классов IQ, в свою очередь, может быть подвергнут
дальнейшему разбиению на подклассы К,, так что
К.-ОВДПК1-0 C.28)
j=i
и т. д. В результате возникает определенная структура
взаимосвязей между классами, которая содержит важную семантическую
информацию о предметной области. В частности, между классами
устанавливается отношение порядка
KqDKj ЭК]....
Полученная структура классов полностью характеризуется их
экстенсионалами, так как определяется вхождением сущностей ПО
в классы и их взаимосвязями друг с другом. Это экстенсиональный
аспект классификации. На экстенсиональном уровне
классификацию можно рассматривать как алгебру К < Kj, c> с
теоретико-множественной операцией включения.
Правила построения упорядоченной системы классов
опираются на совокупность тех признаков, которыми обладают
классифицируемые понятия, т. е. используют информацию, которая
заключена в интенсионале понятий.
В классификации важны оба указанных выше аспекта —
интенсиональный и экстенсиональный. Интенсиональный аспект
отображает сходство сущностей (понятий) некоторого класса по
совокупности классификационных признаков, а экстенсиональный
аспект позволяет указать множество (класс) тех сущностей, которые
обладают заданной совокупностью признаков.
Таксономия и мерономия. В классификационных системах класс
сходных сущностей называют классификационным таксоном, а
способ членения этих сущностей на отдельные части,
позволяющий установить их сходство, — мерономией [52]. Таким образом,
таксон — это объем (экстенсионал) некоторого класса, а
мерономия — содержание (интенсионал) понятия, связываемого с данным
классом. Если таксономия определяет знание о внешней структуре
связей между классами сущностей ПО, используя многоуровневую
абстракцию обобщения и отношение ЕСТЬ-НЕКОТОРЫИ, то
мерономия задает внутреннее устройство классов с помощью
отношения ЧАСТЬ-ЦЕЛОЕ.
153
Таксономия и мерономия тесно связаны между собой. С одной
стороны, признаки сущностей служат для разделения и
распознавания сущностей, а с другой — для группирования сходных
сущностей в классы (таксоны).
Упорядоченную совокупность признаков, характеризующих
данный таксон с точки зрения внутренней структуры входящих в
него сущностей, назовем архетипом [52].
Архетип — это некоторая внутренняя структура, которую
можно обнаружить во всех сущностях соответствующего таксона.
Здесь уместно указать на существенное различие между схемой
класса, понимаемой как подмножество множества имен
классификационных признаков, дополненного собственными
характеристическими признаками класса, и архетипом. Дело в том, что в
архетип таксона входят не только имена признаков, но и их значения.
Другими словами, с архетипом в классификации связывают интен-
сионал таксона. Архетип — это структура отдельных частей
классов, составляющих классификационную схему. Эти части в
классификации называют меронами. Фактически это значит, что мероны
совпадают с классификационными признаками понятий. Как
видно из диаграммы выявленных взаимосвязей понятий
классификации, логики и семиотики (рис. 3.11), чем больше таксон, тем менее
разнообразно, менее детализировано внутреннее строение
входящих в него сущностей и, наоборот, чем меньше таксон, тем
детальнее должно быть описание внутренней структуры сущностей таксо-
Рис. 3.11. Диаграмма связей понятий в классификации, логике
и семиотике
154
на. Это значит, что отношение порядка может быть установлено не
только для таксонов, но и для архетипов соответствующих классов.
Отсюда следует, что классификация — это совокупность двух
структур: таксонов и архетипов, упорядоченных по включению.
Если структура таксонов позволяет установить близость элементов,
охватываемых классификационной схемой, в зависимости от
объема соответствующего таксона (сущности тем более сходны друг с
другом, чем меньше тот таксон, к которому они одновременно
принадлежат), то структура признаков (архетип) характеризует
сходство сущностей таксона исходя из их внутреннего устройства
(сущности тем ближе друг к другу, чем больше множество их
общих признаков).
Структура таксонов характеризует экстенсиональный аспект
классификационной системы, а структура меронов —
интенсиональный, что позволяет определить класс как тройку
К = <arhK, taxK, shmK>, C.29)
где arhK и taxK соответственно обозначают архетип и таксон
данного класса.
Средства описания архетипов аналогичны средствам,
используемым для формализации интенсионала, но на практике, при
построении реальных классификационных схем, большее
распространение получил теоретико-множественный подход [100, 117].
Обратим внимание, что архетип класса, являясь его
интенсиональной характеристикой, не совпадает с интенсионалом
сущностей, входящих в этот класс: он лишь содержит необходимую и
достаточную информацию о классификационных признаках
сущностей, позволяющих принять однозначное решение о вхождении
сущности в таксон (экстенсионал) класса.
Диаграмма теоретико-множественных связей между классом и
понятиями, которые используются для построения
классификационной схемы, представлена на рис. 3.12.
Таксономия и мерономия понятий в совокупности
обеспечивают двойственное описание классификационной структуры. С
математической точки зрения здесь возникают две алгебраические
системы: алгебра таксонов и алгебра архетипов.
Роль классификации в изучении реального мира заключается в
возможности сравнивать между собой не отдельно взятые
сущности, но и целые классы таких сущностей (таксоны). Минимальные
таксоны, которые могут быть выделены в рамках некоторого
универсального класса, называются видами. Тогда все остальные
таксоны можно рассматривать как множество видов [52]. Чем меньше
155
Архетип
t
Содержится
1
Интенсионал
1
Имеет
Определяет
Определяет
4меет
Класс
1
Имеет
1
Таксон
Объединяет
1
Экстенсионал t
t
Имеет
1
1
Понятие t
Имеет
Характеризует
[Характеризует
Имеет
Схема
Содержится
1
Схема
—'
Рис. 3.12. Диаграмма теоретико-множественных связей между классом и
понятиями (для простоты при установлении связей между схемами классов и понятий не
учтена возможность введения собственных характеристических признаков классов)
таксон, к которому принадлежат виды, тем они ближе друг к другу.
Для выяснения вопроса о степени близости видов необходимо
уметь сопоставлять их внутренние структуры, что относится уже к
сфере действия мерономии.
Типы классификаций. Как уже указывалось ранее, между
таксонами существуют определенные взаимосвязи. Наиболее простая
связь между двумя таксонами — отношение включения. Таксон Ti
содержится в таксоне Tj, если все виды таксона Ti принадлежат
таксону Tj. Кроме того, таксоны могут быть связаны отношением
пересечения.
Если таксоны Т4 и Tj имеют непустое пересечение и один из
них содержится в другом, то классификационная структура
таксонов по отношению включения является древовидной. Каждый
таксон в этой структуре принадлежит определенному уровню в дереве
(рис. 3.13). Наиболее ярким примером древовидной классификации
является Универсальная десятичная классификация (УДК). Как
будет показано ниже, алгебраическая структура архетипов может
быть как древовидной, так и иметь более сложное строение.
Возможна и противоположная ситуация: архетипы образуют
структуру типа дерево, а множество всех таксонов организовано не
156
0-й уровень
1-й уровень
2-й уровень
т 2
т
2
2 I
f 2l
V J
1
0
1т1
V J
v. J
{ ' ^
т 2
131
т
ж.
ЖТ7\
Рис. 3.13. Алгебраическая структура таксонов древовидной классификации
в виде дерева, а устроено более сложно. Например, этими
свойствами обладает рубрикатор реферативных журналов. Так, выпуск
«Теоретическая кибернетика» входит как в раздел «Математика»,
так и в раздел «Автоматика и телемеханика», т. е. древовидность
таксонов не выполняется, однако архетипы, как показано ниже,
организованы в виде древовидной структуры.
Наконец, в заключение рассмотрим два случая, когда
древовидной структурой не обладают ни таксоны, ни архетипы. Как станет
ясно позже, данный тип классификации является наиболее
универсальным. Строение множества таксонов и определяющих его
архетипов задается более сложными алгебраическими структурами,
известными в математике как решетки. Решетки могут быть
определены как множества, для любой пары элементов которых можно
указать наибольший и наименьший элементы. Это определение
фактически задает на исходном множестве двойное отношение
порядка: «сверху вниз» и «снизу вверх». Это, как мы увидим далее,
позволяет установить глубокую связь между таксономией и меро-
номией, присущей классификационным схемам данного типа.
Простейшими классификационными структурами данного типа
являются булевы классификации. К другому типу таксономической
структуры относятся фасетная или комбинативная классификации.
В качестве фасет (аспектов) такой классификации выступают
признаки понятий, имеющие различные имена. Каждый признак
определяет разбиение множества сущностей на непересекающиеся
подмножества первого уровня. Попарные пересечения таксонов
первого уровня, которые задаются признаками с различными
именами, дают таксоны второго уровня, тройные пересечения —
таксоны третьего уровня и т. д. В результате таксон может быть
взаимосвязан с двумя и более таксонами верхнего уровня.
157
Следовательно, комбинативная классификационная структура
не является древовидной. Как и в случае булевых классификаций,
алгебраическая структура комбинативных классификаций является
решеткой.
Древовидные классификации. Проведем сопоставление
различных типов классификационных схем путем сравнения структур их
таксономических решеток по отношению
теоретико-множественного включения входящих в них таксонов [46]. Отношение
включения является на множестве таксонов также и отношением порядка.
Простейшая классификационная схема — древовидная иерархия.
Порядок называется древовидным, если для двух таксонов Tj и Tj
либо Ti с Tj, либо Ti П Tj пусто.
Для древовидной классификации существует максимальный
таксон, включающий в себя все остальные таксоны, и для каждого
таксона совокупность подчиненных ему таксонов образует
совокупность непересекающихся подмножеств. В качестве примера
древовидной классификации рассмотрим УДК документов [46].
В соответствии с принципами построения УДК потенциальное
множество всех документов делится на десять непересекающихся
классов, которые индексируются цифрами от 0 до 9. Каждый из
полученных таким образом классов снова разбивается в свою
очередь на десять подклассов и т. д. В результате некоторому классу
приписывается цифровой код, который рассматривается и как имя
соответствующего таксона документов, и как архетип класса,
состоящий лишь из одного признака. Значения признака этого
архетипа определяются последней цифрой кода, а имя признака —
остальными цифрами. Например, код 535.31 может
интерпретироваться как имя таксона ГЕОМЕТРИЧЕСКАЯ ОПТИКА или как
признак со значениями «призма» — 535.315, «тонкие линзы» — 535.316,
«толстые линзы» — 535.317 и т.д. Очевидно, что в этом случае
каждый архетип (признак) подчинен лишь одному более старшему
архетипу, т. е. для УДК характерны иерархичность не только
таксонов, но и архетипов. При этом каждый документ принадлежит
некоторой рубрике УДК, которая в дальнейшем уже не делится.
Причем чем меньше таксон класса документов, тем длиннее цифровой
код, являющийся архетипом класса, и наоборот, чем больше
таксон, тем меньше цифровой код архетипа, т. е. мы имеем дело как
бы с обратной иерархией архетипов.
Отметим, что иерархия признаков десятичной классификации
обычно находит свое реальное отражение в классификаторе или
тезаурусе информационной системы в виде иерархии
соответствующих статей.
158
Булевы классификации. Другим видом классификационной
схемы является ситуация, когда таксоны образуют структуру булевой
алгебры [46]. В этом случае на выделенной системе классов К,
задаются теоретико-множественные операции объединения (и),
пересечения (п) и разности (\). Тогда исходная система классов
превращается в булеву алгебру
K0=<Ki,n,U/>.
Данный тип классификационной схемы возникает, например, в
случае использования дескрипторов для классификации текстов
документов. В качестве примера рассмотрим множество терминов,
состоящее из четырех дескрипторов: db d2, d3, сЦ. Тогда структура
таксонов может состоять (рис. 3.14) из одного таксона Т0,
включающего все наличные тексты; четырех таксонов первого уровня
Т/, Т2!, TJ, Т4!, включающих тексты, содержащие по одному
дескриптору di, d2, d3 или d4; шести таксонов второго уровня Т2, Т22, Т32,
Т42, Т52, Т62, включающих тексты, содержащие по одной из пар
дескрипторов (db d2), (di, d3), (di d4), (d2, d3), (d2, CI4), (d3, &0;
четырех таксонов третьего уровня Т,, Т23, Т33, Т43, включающих тексты,
содержащие тройки дескрипторов (db d2, d3), (db d2, d4>, (db d3, d4),
(d2, d3, d4), и одного таксона четвертого уровня, включающего
тексты, содержащие все четыре дескриптора (db d2, d3, &*).
Архетипами соответствующих классов документов будут
выступать множества значений дескрипторов:
Рис. 3.14. Булева классификационная структура таксонов документов
159
arhKl = {diharhK^ = {d^arhK^ = {d3},arhKj = {d4};
aihK? «{dpdjbaihK^ «{d^dahaihKf ={dlfd4},
arhKi ={d2,d3},arhK52 ={d2,d4},arhK^ ={d3,d4},
ariiKj* ={d1,d2,d3},arhK^ ={d1,d2,d4},
arhK^ ={d1,d3,d4},arhK43 ={d2,d3,d4},
arhKt={d1,d2,d3,d4}.
Если изучать данную классификационную структуру с точки
зрения внутреннего строения ее архетипов, т. е. исходя из наличия
в тексте совокупности тех или иных дескрипторов, то получим
антиизоморфную картину (рис. 3.15).
Сопоставление таксономической структуры текстов и их
внутреннего строения на основе входящих в них дескрипторов
показывает, что объединению таксонов текстов соответствует пересечение
множеств дескрипторов, входящих в соответствующие архетипы, а
пересечению таксонов текстов — объединение множеств
дескрипторов архетипов.
Структура таксонов по включению антиизоморфна структуре
всех подмножеств множества дескрипторов {di, d2, d3, d4}, т. е.
булевой решетке. Действительно, включение таксона Ti с Tj означает,
что таксой Ti определяется какими-то дополнительными
дескрипторами, т. е. если таксону Ti сопоставить архетип arhKi, а таксону
Рис. 3.15. Антиизоморфная структура архетипов поисковых образов
документов
160
Т, — архетип arhK, то будет выполняться соотношение
arhKi DarhKj.
Комбинативные классификации. Комбинативные (фасетные)
классификации [52] возникают как результат классификации
понятий по совокупности имен и значений их признаков.
Фасеты такой классификации определяются булевыми
операциями над именами признаков и образуют булеву алгебру.
Очевидно, что классификацию текстов на основании содержащихся в них
дескрипторов с этой точки зрения можно рассматривать как одно-
фасетную, так как мы имеем только один признак ДЕСКРИПТОР
для всех терминов, используемых при классификации текстов. Но
в комбинативных классификациях, как правило, полагают, что
классификационные признаки сущностей не являются
множественными.
Для выделения таксонов каждый фасет в свою очередь подвергается
дополнительному делению на основе использования значений
признаков. Так, если имеются признаки А, В, С, то в комбинативной
классификации можно выделить той фасета первого уровня — FA, FB, F0; три
фасета второго уровня — F , F*0, FBC и один фасет третьего уровня
FABC. Таксоны первого уровня Т?9Т?9...9Т?Л?*•••>??,??*---*Т?
образуются путем деления каждой из фасет FA, FB, F0 на основе
значений признаков. Таксоны второго уровня могут быть получены путем
попарных пересечений таксонов первого уровня и т. д. Количество
таксонов на первом уровне определяется суммарной мощностью
доменов значений признаков
domA = {а4}, i = T^n; domB = {b,}, j = l,m,
domC = {ck}, k = ТдТ.
Общее число уровней в комбинативной классификации равно
количеству признаков. Как видно из рис. 3.16, структура таксонов
комбинативной классификации по отношению включения не
является иерархической. Если рассматривать структуру связей между
отдельными фасетами, то получим булеву алгебру.
Архетипы классов комбинативной классификации
представляют собой подмножество множества пар {(Аиа])} имен и значений
признаков. Для рассмотренного выше примера архетипами классов
второго уровня будут множества:
arhKf8 ={(A,a1},(B,b1)},arhKf ={(A,ai),(B,b2)},
...агЖ^={(А,ап},(В,Ьт)};
11 — 3466 161
arhK^ ={(A,a1},(C,c1)},arhK^ ={(A,ai),(C,c2)},
AC _
arhK^={(A,an},(C,ck)};
-ВС _
агЬКГ ={(B,b1},(C,c1)},arhK2^ ={(B,b1),(C,c2)},
...arhK«ck={(B,bm},(C,ck)}.
В качестве примера рассмотрим комбинативную
классификацию множества сущностей {еь е2, е3, е4, е5, еб, е7, е8}, содержащих
признаки с именами А, В, С, D и значениями domA = {аь а2, а3},
domB = {Ьь b2}, domC = {сь с2, с3} и domD = {db d2, d3, d4}.
Пусть значения признаков по сущностям распределены
следующим образом:
ei =(ai,b,,c1,d2),e2 =(a1,b1,c2,d1),
е3 =(a1,b2,c1,d3),e4 =(a1,b3,c2,d3),
е5 =(a2,b2,c1,d4),e6 =(a2,b3,c1,d4),
e7 = (a2,b3,c2,d4),e8 = (a2,b3,c1,d2).
Тогда классификационная решетка рассматриваемой
предметной области может быть представлена в виде рис. 3.17. На первом
уровне решетки находятся таксоны, которые определяются
одиночными значениями признаков, на втором уровне они
определяются парными комбинациями признаков, на третьем — тройками
значений признаков.
АВ
F°j
т,А
-г. А
т2
т,АВ
~ АВ
т2
FB
FAC
рАВС
т-А
~ А
т2
т,в
т2в
тпс
f^*
L ас
2
т.Н
""
^ ABC
2
FC
FBC
v\
т2с
|т,вс
Lвс
2
Рис. 3.16. Фасетная классификационная система
162
Рис. 3.17. Пример классификационной решетки гипотетической ПО
Таксон Т0 содержит сущности, принадлежащие всей ПО, так
как на него не накладывается никаких ограничений, а таксон TABCD
пуст вследствие того, что в ПО отсутствуют сущности, обладающие
всеми допустимыми значениями признаков одновременно.
Отметим также, что в классификационной решетке отсутствуют классы
сущностей первого уровня со значениями свойств bi и Ь2, так как о
множествах объектов {еь е2} и {е3, е5} можно сделать более точное
утверждение, чем то, что эти классы сущностей обладают
свойствами bi и Ь2. Действительно, таксон Ti содержит сущности,
обладающие как признаком Ьь так и признаком аь а таксон Ti —
сущности, имеющие признаки Ь2 и С\. Множества {еь е2} и {ез, е5},
выделенные на основании только одного признака bi или Ь2, являются
не классами, а предклассами. При свершении некоторых событий
предклассы могут переходить в класс, и наоборот, классы могут
превращаться в предклассы.
Отметим, что третий уровень классификационной решетки
фактически содержит информацию, совпадающую с признаками
ПО, за исключением таксона Те, в который попали сущности ев и
е8, не различимые на основании классификационных признаков с
именами А, В и С, но имеющие различные характеристические
признаки: сущность еб имеет свойство d4, а сущность е8 —
признак d2.
и* 163
Известно [46], что для рассматриваемого множества таксонов
классификационной решетки могут быть выделены
таксоны-образующие, позволяющие путем выполнения над ними
теоретико-множественной операции пересечения получить все остальные
таксоны решетки.
Из рис. 3.17 видно, что в качестве классов-образующих для
классификационной решетки необходимо взять таксоны T^Tf,
ТС трВ трА трАВ тпВС
2 > М > 12 у А1 9 М •
Очевиден и общий алгоритм выделения классов-образующих.
Для этого достаточно к классам первого уровня решетки
присоединить те классы более низких уровней, которые получены из пред-
классов первого уровня, чтобы получить искомый класс.
Комбинативные классификации имеют ряд преимуществ перед
иерархическими классификациями, обеспечивая многоаспектное
классифицирование информации, возможность произвольного
комбинирования классификационных признаков, большую глубину
понятий и возможность гибкого включения новых признаков [46].
Вопросы для самопроверки
1. Что понимается под нечеткими знаниями (нечеткими множествами)?
2. Какова роль функции принадлежности?
3. Что называется точкой перехода нечетких множеств?
4. Как определяется объединение, дополнение, разность, отображение,
отношение в теории нечетких множеств?
5. Какова роль лингвистической переменной в представлении знаний?
6. Что такое терм-множества при описании знаний?
7. Какова схема методов пополнения знаний?
8. Что представляют собой псевдофизические логики?
9. Как осуществляется пополнение знаний на основе сценариев?
10. Какова основная схема взаимодействия базы знаний с внешней средой?
11. Какие основные операции осуществляются над базой знаний при ее
пополнении?
12. Каково содержание архитектуры системы работы со знаниями?
13. Какие существуют методы логического вывода пополнения знаний?
14. Как осуществляется обобщение знаний?
15. Как осуществляется классификация знаний?
16. Каковы экстенсиональный и интенсиональный аспекты классификации?
17. Что такое таксономия и мерономия?
18. Какие существуют типы классификаций?
Глава 4
ЗАДАЧИ КОМПЬЮТЕРНОЙ ЛОГИКИ
И КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ
(ПРОБЛЕМА ОБЩЕНИЯ)
В средние века существовали специальные науки — герменевтика,
экзегетика и гомилетика, связанные с пониманием и толкованием
текстов. Для постижения смысла текста и значения содержащейся в нем
информации герменевтика использует только текст, экзегетика— не только
текст, но и все сведения о том тексте, в рамках которого этот текст
создавался; гомилетика — общие сведения о морально-этических нормах
времени создания текста, мотивы и цепи автора, его личностные
характеристики (рис. 4.1).
Создать ИнС, не вложив в них средства понимания, а следовательно,
и того опыта, который накопили эти науки, а также литературоведе-
Герменевтика
Текст
Рис. 4.1 Схема
использования информации в
герменевтике (а), экзегетике (ф,
гомилетике (в)
Время создания
текста, цели
автора, его
характеристика
165
ние, невозможно. Именно поэтому в работах по искусственному
интеллекту стали мелькать термины «семантическая герменевтика», или
«герменевтика текста»
4.1. Уровни понимания
Очевидно, что объем информации в тексте, информации, которая
помогает понимать текст и сопровождает его, объем БЗ и т.п. определяют
уровни понимания текста.
Введем рад обозначений: Т —- текст на естественном языке,
представленный для ввода в систему; Е — расширенный текст, включающий
условия его порождения в некоторой среде; Р — расширенный текст,
включающий все невербальные (несловесные) компоненты, относящиеся
к субъекту, порождающему текст; TR — правила пополнения текста,
опирающиеся на его структуру; ER — правила пополнения текста,
опирающиеся на знание о коммуникации и психологии личности; А — ответ,
формируемый системой; К — знания, хранящиеся в БЗ; F — факты,
хранящиеся в базе фактов; FRK — правила порождения знаний из фактов;
КМ — метафорические знания; KRM — правила порождения знаний
метафорического уровня.
Предположим, что на вход ИнС (рис. 4.2) поступает текст В {Т, Е, Р}.
Будем говорить, что ИнС понимает текст В, если она дает ответы,
правильные с точки зрения человека, на любые юпросы, относящиеся к
тому, о чем говорится в тексте.
Классификация уровней понимания. В существующих ИнС можно
выделить пять основных уровней понимания и два уровня метапони-
мания.
Первый уровень характеризуется схемой Т—>А, показывающей, что
любые ответы на вопросы система формирует только на основе прямого
содержания, введенного из текста Т. Если, например, в систему
введен текст: «В восемь утра, после
завтрака, Оля ушла в школу. В два часа она
вернулась домой. После обеда она ушла
гулять», то на первом уровне понимания
система обязана уметь отвечать правильно
на вопросы типа: «Когда Оля ушла в
школу?» или «Что сделала Оля после
обеда?» Интеллектуализированная система,
способная отвечать на такие вопросы,
Рис. 4.2. Схема обучения ИнС должна иметь средства, показанные на
пониманию текста рис. 4.3*
166
Текст
^
Вопрос
ИнС
[ Ответ
Человек-эксперт
j
i
Источник текста
тТ
i
1 Вопросы Qi
Лингвистический
процессор
Внутренние
представления ,
IT
Т Т
База
данных
Qi
Блок
вывода
1 ¦
т Т
База знаний
}
f
Ai
Ответы
Рис. 4.3. Схема первого уровня понимания (Т-> А), где IT, IQ соответствуют Inter
Text и Inter Question
В лингвистическом процессоре происходит морфологический,
синтаксический и семантический анализ текста и вопросов,
относящихся к нему. На выходе лингвистического процессора получается
внутреннее представление текста и вопросов, с которыми может
работать блок вывода. Используя специальные процедуры (логические
модели описания предметной области, дедуктивные выводы на знаниях),
этот блок формирует ответы. Другими словами, уже понимание на
первом уровне требует от ИнС определенных средств представления
данных и вывода на этих данных.
Второй уровень характеризуется схемой (Т, TR)-»A. На втором
уровне добавляются средства логического вывода, основанные на
информации, содержащейся в Т. Это разнообразные логики текста
(временная, пространственная, каузальная и т.п.), которые способны
породить информацию, явно отсутствующую в тексте. Для нашего
примера на втором уровне возможно формирование правильных ответов
на вопросы типа: «Что было раньше: уход Оли в школу или ее обед?»
или «Гуляла Оля после возвращения из школы?» Только построив
временную структуру текста Т, ИнС сможет ответить на подобные
вопросы. Схема ИнС, с помощью которой может быть реализован второй
уровень понимания (рис. 4.4), имеет еще одну базу знаний. В ней
хранятся закономерности, относящиеся к временной структуре событий,
возможной их пространственной организации, каузальной зависимости
и т.п., а логический блок обладает всеми необходимыми средствами
для работы с псевдофизическими логиками.
167
Текст
U i
Вопросы Qi
Лингвистический
процессор
Внутренние
представления
*1Т
База
данных
IQi
Блок
вывода
БЗ,
БЗ,
Ai
"Ответы
Рис. 4.4. Схема второго уровня понимания (T, TR-» А)
Третий уровень характеризуется схемой (Г, TR, ER) —»А- К средствам
второго уровня добавляются правила пополнения текста Т знаниями
системы о среде. Эти знания в ИнС, как правило, носят логический
характер и фиксируются в виде сценариев или процедур иного
типа. На третьем уровне понимания ИнС должна дать правильные
ответы на вопросы типа: «Где была Оля в 10 утра?» или «Откуда
вернулась Оля в два часа дня?» Для этого надо знать, что означает
процесс «пребывание в школе» и, в частности, что этот процесс является
непрерывным и что субъект, участвующий в нем, все время находится
«в школе».
Схема ИнС, в которой реализуется понимание третьего уровня,
внешне не отличается от схемы, показанной на рис. 4.4. Однако в
логическом блоке должны быть предусмотрены средства не только для
чисто дедуктивного вывода, но и для вывода по сценариям.
Три перечисленных уровня понимания реализованы во всех
практически работающих ИнС. Первый уровень и частично второй входят в
разнообразные системы общения на естественном языке.
Следующие два уровня понимания реализованы в существующих
ИнС лишь частично.
Четвертый уровень характеризуется схемой (Е, TR, ER) -» А.
Вместо текста Т в ней используется расширенный текст Е, который порож-
дается лишь при наличии двух каналов получения информации. По
одному в систему передается текст Т, по другому — дополнительная
информация, отсутствующая в Т. При человеческой коммуникации роль
второго канала, как правило, играет зрение. Более одного канала
коммуникации имеют интеллектуальные работы, обладающие
зрением.
168
Зрительный канал коммуникации позволяет фиксировать
состояние среды «здесь и сейчас» и вводить в текст Т наблюдаемую
информацию. Система становится способной к пониманию текстов, в
которые введены слова, прямо связанные с той ситуацией, в которой
порождается текст. «Посмотрите, что сделала Оля! Она не должна была
брать это!» При наличии зрительного канала процесс понимания
становится возможным.
При наличии четвертого уровня понимания ИнС способна отвечать
на вопросы типа: «Почему Оля не должна была брать это?» или «Что
сделала Оля?» На рис. 4.5 показана схема такой ИнС.
Блок понимания третьего уровня соответствует схеме рис. 4.4. Если
юпрос, послупишпий в систему, соответствует третьему уровню, то система
выдает нужный ответ. Если для ответа необходимо привлечь
дополнительную информацию («экзегетическую»), то внутреннее представление текста
и вопроса передается в блок, который осуществляет соотношение текста
с той реальной ситуацией его порождения, которая доступна ИнС по
зрительному или какому-нибудь иному каналу фиксации ситуации
внешнего мира.
Пятый уровень характеризуется схемой (Р, TR, PR) -» А. Для ответа
на этом уровне ИнС кроме текста Т использует информацию о
конкретном субъекте, являющемся источником Т, и хранящуюся в памяти
системы общую информацию, относящуюся к коммуникации (знания
об организации общения, о целях участников общения, о нормах уча-
Вопр
осы Qi
-^
Отв<
Т
Текст Е
Блок расщепления
ЕнаТи
остаточный текст
]
f т
Блок понимания
третьего уровня
2ТЫ
1 Ai
Отказ
от отв
ы
ета
IT, IQi
О
Блок обработки
остаточного текста
, 1 "
Блок «погружения»
текста в ситуацию
порождения
гветы 1
f A
i
Рис. 4.5. Схема четвертого уровня понимания (Е, TR, ER) —» А
169
стая в общении). Теория, соответствующая пятому уровню, — это так
называемая теория речевых актов.
Для четвертого и пятого уровней понимания интересны
результаты по невербальным (несловесным) компонентам общения и
психологическим принципам, лежащим в основе общения. Кроме того, в PR
входят правила вывода, опирающиеся на знания о данном конкретном
субъекте общения, если такие знания у системы есть. Например,
система может доверять данному субъекту, считая, что порождаемый им
текст Т истинен. Но может не доверять ему и понимать Т, корректируя
его в соответствии со своими знаниями о субъекте, породившем Т.
Знания такого типа должны опираться на психологические теории
общения, которые пока развиты недостаточно. Структура ИнС, способной
осуществить понимание на пяггом уровне, показана на рис. 4.6. Блок
корректировки ответа использует информацию из базы знаний,
хранящей информацию о конкретных людях, городах, автомобилях и т.п.,
которая отличает их от абстрактных понятий: человек, город,
автомобиль. База знаний может быть совмещена с базой данных, так как эти
сведения представляют собой некоторые константные факты.
Если в системе реализуются четвертые и пятые уровни, то на ее
вход поступает текст Е, а текст, расширяющий Т до Р, формируется
так, как показано на рис. 4.6.
Первый метауровень характеризуется схемой (F, FRK)-»K. На
этом уровне происходит изменение содержимого базы знаний. Она
пополняется фактами, известными системе и содержащимися в тех
текстах, которые в систему введены. Разные ИнС отличаются друг от друга
характером правил FRK- Правила FRK могут бьпъ основаны на
принципах вероятностей, размытых выводах и т.п. Во всех случаях база знаний
Текст Т Вопросы Qi
, I I ,
Блок понимания
третьего
I уровня
f Ответы Ai
База знаний о
конкретных
ситуациях и фактах
I Скорректированные
Т ответы Ai
Рис. 4.6. Структура ИнС пятого уровня понимания
170
Блок
корректировки
Добавление Т до Р
оказывается априорно неполной и в таких ИнС возникают трудности с
поиском ответов на запросы. В частности, в БЗ становится необходимым
немонотонный вывод.
Второй метауровень характеризуется схемой (К, KRM)—»КМ. На
этом уровне происходит порождение метафорического знания. Правила
KRM, используемые для этих целей, представляют собой специальные
процедуры, опирающиеся на вывод по аналогии и ассоциации. Известные в
настоящее время схемы вывода по аналогии используют, как правило,
диаграмму Лейбница, которая отражает лишь частный случай рассуждений по
аналогии. Еще более бедны схемы ассоциативных рассуждений.
Если рассматривать уровни и метауровни понимания с точки
зрения архитектуры ИнС (см. рис. 4.2 — 4.6), то можно наблюдать
последовательное наращивание новых блоков и усложнение реализуемых
ими процедур.
1. Т->А.
2. (Т, TR) -> А.
3. (Т, TR, ER) -> А.
4. (Е, TR. ER) -> А.
I. (F, FRK) -> К.
II. (К, KRM) -> KM.
На первом уровне достаточно лингвистического процессора с БЗ,
относящихся только к самому тексту. На втором уровне в этом
процессоре возникает процедура логического вывода. На третьем уровне
необходима база знаний. Появление нового канала информации, который
работает независимо от исходного, характеризует четвертый уровень. Кроме
процедур, связанных с работой этого канала, появляются процедуры,
увязывающие между собой результаты работы двух каналов,
интегрирующие информацию, получаемую по каждому из них. На пятом уровне
развитое получают разнообразные способы вывода на знаниях и данных.
На этом уровне становятся важными модели индивидуального и
группового поведения. На метауровнях возникают новые процедуры для
манипулирования знаниями, которых не было на более низких уровнях
понимания.
4.2. Понимание текстов
на естественном языке
Для понимания текстов на естественном языке (ГЕЯ) необходима в
ИнС система знаний, на основе которой и происходит понимание текста.
При восприятии текста сначала формируется его промежуточное
когнитивное представление. Это представление является не конечным
171
Информация
I
< »
Система
знаний
_ -J
?
Понимание
Рис. 4.7. Схема понимания ТЕЯ
результатом, а лишь средством,
позволяющим соотносить
информацию, содержащуюся в сообщении, с
системой знаний, на основе чего
происходит ее понимание. Далее
формируется целостное
представление о содержании текста как о
фрагменте действительности, описываемом
этим текстом (рис. 4.7).
Система понимания текста. Можно считать, что система понимает
текст, если она может, во-первых, отвечать на все прямые вопросы
по этому тексту и пополнять информацию, содержащуюся в тексте,
теми знаниями о действительности, которые хранятся в ее БЗ, и,
во-вторых, «представлять» то множество ситуаций, которые могли бы
соответствовать введенному в нее тексту в реальном мире.
Понимание текстов на естественном языке (ТЕЯ) включает три
уровня интерпретации: синтаксический, семантический и
прагматический (рис. 4.8).
1. Синтаксическая процедура на основе информации, заложенной
в словаре, осуществляет грамматический разбор предложений:
выделяется подлежащее, сказуемое, дополнение и т.п., между которыми
указываются связи по управлению в виде дерева зависимостей.
2. Семантика связана с выводом значений различных
синтаксических составляющих. Для этого часто используются специальные
структуры — ролевые фреймы, которые описывают то необходимое
окружение, с которым всегда связано данное слово на этапе его понимания.
На семантическом этапе строится семантический граф предложения, от
которого затем может быть осуществлен переход к тем
соответствующим данному предложению знаниям, которые хранятся в базе
предметных знаний.
Понимание ТЕЯ
1 Я
аци]
прет
i*2-
S
1 5
!§э-
!?
^
Синтаксический
'
г
Семантический
'
'
Прагматический
Рис. 4:8. Уровни понимания ТЕЯ
172
3. Наконец, прагматика пытается соотнести отдельные
предложения друг с другом и с непосредственным контекстом в
действительности.
Первые исследования по написанию ТЕЯ с помощью ЭВМ были
связаны с машинным переводом (МП), основными этапами которого
является анализ и синтез ТЕЯ. Первоначальный подход состоял в
создании огромных по объему двуязычных словарей и организации
пословного перевода. На следующем этапе разработки пришли к мысли,
что необходимо привлекать синтаксис естественного языка (ЕЯ).
Приобрела популярность теория трансформационных грамматик (ТГ).
Общие с МП проблемы анализа ТЕЯ возникли и в других задачах
обработки текстов на ЕЯ: при разработке вопросно-ответных систем,
систем общения с ЭВМ на ЕЯ, решении задач, сформулированных на
ЕЯ и т.д. (табл. 4.1).
Таблица 4.1. Задачи обработки текстов на ЕЯ
Написание ТЕЯ
с помощью ЭВМ
МП
Вопросно-ответные системы
Системы общения
с ЭВМ на ЕЯ
Решатели задач,
оформленных на ЕЯ
[и т.д.
Содержание
1. Анализ и синтез ТЕЯ (двуязычные словари, организация
пословного перевода)
2. Привлечение синтаксиса ЕЯ и теории ТГ
Формальные описания и алгоритмическое обеспечение
обработки текстов (логико-семантические отношения)
Математическое, структурно-логическое содержание
диалоговых процедур (лингвистическая теория)
Набор правил о лингвосемантических отношениях между
текстовыми единицами
Система понимания ТЕЯ должна, как минимум, выделять из
текста отдельные термины, обозначающие объекты и их свойства, а
также использовать отношения между терминами, уточняющими их
роль в том контексте, в котором они встретились. При этом наиболее
важными являются два типа отношений: а) выражающие связи,
постоянно существующие между языковыми единицами; б) выражающие связи
между языковыми единицами, возникающими в конкретном тексте.
Методы описания языковых объектов и создания правил
анализа текстов должны использовать следующие процедуры:
1) составление грамматической характеристики для каждой
лексической единицы;
2) грамматическое (структурное) описание каждого предложения
на «глубинном» (или абстрактном) уровне;
3) прагматическое и семантическое описание предложения;
173
4) преобразование глубинной структуры предложения,
получаемой при анализе содержания текста в «поверхностную» структуру,
непосредственно используемую в языке для передачи смысла;
5) использование теории речевого поведения.
Система понимания ТЕЯ должна состоять, по крайней мере, из
трех частей:
• описания данной предметной области в терминах важнейших
базисных объектов или понятий этой области, в том числе
основных, связывающих их логико-семантические отношения;
• лингвистической теории, опирающейся на соответствующие
характеристики лексических единиц и на грамматические и
семантические правила, которые лежат в основе системы анализа языка;
• набора правил, позволяющих перейти от каждой приемлемой
входной цепочки к глубинной структуре, выражающей лингвосеман-
тические отношения между объектами, полученными в результате
лингвистического анализа, а также логико-семантические отношения.
Понимание ТЕЯ на лингвистическом уровне. В большинстве случаев
системы понимания ТЕЯ на лингвистическом уровне состоят из двух
частей. Первая представляет собой подсистему морфологического и
синтаксического анализа (СинтА) — анализатор, который для каждого
предложения входного ТЕЯ строит дерево, на котором указывается
грамматическая функция слов и определяется тип синтаксической связи между
ними. Вторая представляет собой подсистему семантического анализа
(СемА) — интерпретатор, который использует результаты работы
анализатора, а также семантическую информацию, получаемую из словарей или
справочников, и выдает формализованные представления ТЕЯ (рис. 4.9).
Морфологический анализ является наиболее освоенным ЭВМ
этапом понимания ТЕЯ, не вызывающим в настоящее время
трудностей. Более сложным считается ограниченный или полный
СинтА ТЕЯ. Количество алгоритмов, дающих синтаксическую
структуру в виде дерева зависимостей, очень велико.
В основу ТГ положена идея трансформационных
преобразований языковых выражений, при которой сохраняются
семантические инварианты и обеспечиваются новые возможности некоторых
явлений ЕЯ. В системах, основанных на
ТГ, каждому предложению входного ТЕЯ
ставятся в соответствие две различные
структуры: глубинная и поверхностная.
При этом используются операции,
изменяющие структуру предложения.
Рис. 4.9. Система понимания Для сокращения в ТГ-алгоритмах ко-
ТЕЯ на лингвистическом уровне личества операторов был разработан син-
Система понимания ТЕЯ
на лингвистическом уровне
174
таксический анализатор расширенной сети переходов (РСП).
Преимуществом РСП является то, что она позволяет получить
компактное представление и эффективные алгоритмы для различных
грамматик. Последний класс систем понимания ТЕЯ на
лингвистическом уровне представляется системами анализа,
включающими семантические процедуры, которые используются в дополнение
к синтаксическим методам или вместо них.
Понимание ТЕЯ на семантическом уровне. Семантическими принято
считать системы, в которых в процессе анализа содержания текста
делаются попытки учесть не только лингвосемантические, но и
логико-семантические отношения между языковыми объектами. Кроме
того, контекст, определяющий лингвосемантические отношения и в
обычных системах СинтА, не выходящий за пределы предложения, в
семантических системах распространяется на уровни дискурса и
текста. Наконец, предполагается, что система семантического
анализа должна учитывать как сведения о данной ПО, так и ее связи с
внешним миром в целом. Таким образом, в семантических системах
делаются попытки осуществить глобальное понимание ТЕЯ.
Переход к уровню семантического представления влечет за собой
введение новых формализмов. В отличие от синтаксических структур,
имеющих вид дерева, семантическое представление имеет вид графа.
Существует много подходов к построению систем СемА Среди
семантических систем, в основе которых лежит прагматическая точка
зрения на язык как на вид человеческой деятельности, можно
выделить категоризационную, ассоциативную и процедурную модели.
Значительная часть моделей СемА относится к моделям типа
«Смысл-Текст». Наиболее известные из них следующие:
1. Модель семантик предпочтения (СП) базируется на
использовании семантических представлений и принципа предпочтения
без промежуточных морфологической и синтаксической интерпретаций.
2. Модель концептуальной зависимости (КЗ) в качестве основы
семантического представления использует сеть концептуализации
(пар семантических единиц, связанных соответствующими
отношениями), являющуюся квазиграфом.
3. Модель «Смысл-Текст» рассматривает семантическое
представление связного фрагмента текста как состоящего из двух компонентов:
семантического графа и сведений о коммуникативной организации смысла.
Современные системы понимания ТЕЯ, как правило,
ориентированы на определенную ПО и в качестве средств понимания
используют лингвистические знания в виде словарей и грамматик и
знания о ПО в виде структуры семантической сети, в которой
фиксированы типовые ситуации. Причем ПО ограничивается одним
или несколькими сюжетами, а элементы знаний о ПО образуют
175
большую гамму переходов — от атомов смысла (словесные,
текстовые и т.п. атомы) до крупных концептуальных единиц
(гиперфреймы, планы, сценарии).
Понимание ТЕЯ — это воссоздание реальной ситуации
действительности, о которой говорит текст. Описание всей ситуации
действительности потребует построения некоторой познавательной
структуры, в которой основным является выделение отношений между
элементами действительности и указание тех пользовательских ролей,
в которых эти элементы находятся в связи с этими отношениями.
Синтез святых текстов. Проблема синтеза связного текста
возникает в таких ИнС, как системы машинного перевода,
реферирования и аннотирования текстов, диалоговые системы, отвечающие
на ЕЯ, экспертные системы. В идеале задача сводится к тому,
чтобы некоторое исходное содержание, хранящееся в памяти ЭВМ в
закодированном виде, передавать в виде взаимосвязанной цепочки
предложений на ЕЯ.
Синтез текста состоит из трех этапов: определение содержания
текста и последовательности развертывания его во времени; запись
будущего текста на внутреннем языке системы; перевод текста на ЕЯ (рис. 4.10).
Сочинение любого текста предполагает адресата: автор текста
(или собеседник в диалоге) старается учесть возможности
понимания его читателем (или слушателем). Это отражается, прежде всего,
на общей организации текста, закономерности построения
которого исследует теория дискурса. Более локальной является теория фокуса
внимания, которая исследует условия, переключающие внимание
адресата с одного объекта на другой, и приемы автора текста для
управления вниманием адресата. Способы соотношения единиц языка с
понятиями и объектами действительности изучает теория референции.
Теория коммуникативных неудач исследует случаи направленного
понимания текста и их причины.
Рассмотрим схему дискурса и синтез текстов. Теория дискурса
отражает законы построения устных и письменных текстов и строится на
базе трех фундаментальных предпосылок.
Синтез текста
Содержание текста
и развертывание его
во времени
Запись будущего текста
Перевод текста на ЕЯ
Рис. 4.10. Трехэтапный синтез текста
176
1. Форма, в которой информация появляется в тексте, не
обязательно совпадает с формой, в которой она хранится в памяти человека
(в базе знаний).
2. Наряду с общечеловеческими законами построения текстов
имеются законы, характерные для отдельных социокулыур, для носителей
данного языка или для данной группы людей.
3. При построении текстов необходимо учитывать их жанровые
особенности
При описании многих моделей дискурса в качестве базовых
структурных единиц, которыми говорящий пользуется для описания
действительности, используются так называемые риторические предикаты.
Риторическим предикатом называется семантико-синтаксический инвариант
всех предложений, имеющих единую риторическую (или, в иной
терминологии, коммуникативную) функцию. Наиболее часто используются
следующие риторические предикаты: Атрибуция. Эквивалентность.
Уточнение общего факта. Объяснение некоторого логического заключения.
Доказательство факта. Аналогия. Отличительный признак в классе. Состав
чего-либо. Возможность. Альтернатива Причинно-следственная связь.
Противопоставление с учетом закона исключенного третьего. Вывод.
Идентификация. Переименование. Упоминание. Пример из класса.
Можно выделить четыре схемы дискурса:
1. Схема текста с общим атрибутивным значением.
2. Схема с общим значением идентификации.
3. Схема с обищм значением состава.
4. Схема сравнения и противопоставления.
Выбор схемы дискурса при порождении текстов определяется
целями, которыми руководствуется генератор текстов. Эти цели могут
формулироваться в терминах типа «доказать», «сравнить», «описать»,
«объяснить» и т.п.
Машинное творчество. Машинное творчество является
программной имитацией процесса создания произведений, которые можно
считать результатом творческой деятельности. В этой проблеме выделяются
два аспекта: использование ЭВМ для исследования человеческого
творчества и его закономерностей, в частности модельная проверка пшотез о
структуре и особенностях творческого щюцесса; использование ЭВМ для
идентификации творческого процесса в диалоге с человеком с целью
создания творческих произведений.
Сложность проблемы усугубляется отсутствием четкого определения
понятия «творчество». Под творчеством принято понимать процесс
создания нового. Однако после того, как найден алгоритм решения задачи,
считавшейся творческой, ее решение перестает считаться творческим
процессом. Таким образом, под творческим процессом понимается ре-
12-3466 177
шение задач, для которых в настоящее время неизвестны алгоргамы
опускания решения.
Перечислим основные особенности произведений, которые являются
результатом творческого процесса и считаются творческими:
1. В основе всех произведений независимо от их характера всегда
лежат определенные исходные данные: тема (цель), вцд произведения,
набор (часто весьма большой, но всегда конечный) исходных
«кирпичиков» (слов, нот и т.п.), из которых строится произведение.
2. Все произведения строятся с использованием более или менее
формализованных закономерностей, правил и ограничений (правила
грамматики, правила стихосложения, типовые структуры сказок и др.).
3. Отклонение от правил (так называемые «творческие находки») в
массе своей имеют случайный характер и могут быть воспроизведены
искусственно включением в машинную программу случайных составляющих.
Основной задачей машинного моделирования творчества является
использование известных и поиск новых закономерностей
человеческого творчества.
Основу творческой деятельности человека составляют глобальные
процедуры мышления, не ориентированные на коифетную деятельность, а
присущие любой из них, например: альтернативный выбор из
множества имеющихся вариантов; установление связей между описаниями
начальной и целевой ситуаций; вычисление классифицирующей структуры
(фрейма), позволяющей относить ситуацию к тому или иному классу
ситуаций; обобщение описаний; прогнозирование; заимствование
ситуации из некоторого из множества; варьирование (трансформация)
ситуации и др.
Невозможность или неумение алгоритмически описать процедуру
решения задачи привели к попыткам алгоритмического описания
действий людей, решающих подобные задачи. На основе анализа этих
описаний строятся алгоритмы, повторяющие действия, которые
используются для решения задачи. Это направление получило наименование
эвристического программирования. Практика показала, что эвристические про-
граммы часто приводят к цели, однако гарантировать достижение цели
всегда, а также приобрести уверенность, что с их помощью получается
оптимальное решение, невозможно. Если удается найти точные оценки
применимости и результативности эвристических программ, то они
перестают быть эвристическими и превращаются в обычные программы для
алгоритмизированных задач.
Ограниченность эвристического подхода демонстрирует система
простых эвристических правил, рекомендуемых при решении школьных
геометрических задач: 1) выпишите, что дано; 2) выпишите, что
следует доказать; 3) сделайте чертеж; 4) выпишите перечень относящихся или
178
могущих относиться к задаче теорем; 5) наметьте план решения, т.е.
сформируйте промежуточные подцели; 6) приступите к процедуре решения
(доказательства). Выполнение этих правил помогает решить задачу,
однако их недостаточно. Необходимы еще знание геометрии, удача,
интуиция или знание при выборе подцелей, т.е. знание ПО, из которой взята
задача.
Таким образом, основной недостаток эвристических программ
заключается в том, что, используя знания о поведении человека при
решении творческих задач, они не используют в достаточной мере знания
о свойствах и особенностях той ПО, в рамках которой должна решаться
задача
4.3. Построение естественно-языковых
интерфейсов
Усиливающаяся тенденция к хранению информации в
компьютерных структурированных источниках данных (СИД), с одной
стороны, и широкое распространение глобальной компьютерной
сети Интернет и средств доступа к ней, с другой, делают вопрос
доступа к информации, хранящейся в СИД, одним из
первостепенных в мире информационных технологий. Особенно остро этот
вопрос стоит для класса пользователей, не являющихся
специалистами в информационных технологиях, которые составляют
большинство современных пользователей Интернет. Среди многих типов
пользовательских интерфейсов к СИД естественно-языковые
интерфейсы (ЕЯ) являются актуальным, быстроразвивающимся
способом доступа к СИД. Очевидно, ЕЯ-интерфейсы к СИД должны
быть востребованы в ситуации, когда пользователь обращается к
источнику данных, расположенному в Интернете, например,
используя Web-браузер.
Широкому применению ЕЯ-интерфейсов для доступа к
источникам данных препятствует ряд проблем. Основной проблемой
является качество работы ЕЯ-интерфейсов, повышение которого
ограничено прежде всего сложностью анализа запросов на
естественном языке, которая неизбежно упирается в проблему
автоматического понимания естественного языка как такового. Вторая
проблема связана с объемом усилий по созданию ЕЯ-интерфейса к
произвольному источнику данных. В совокупности эти две
проблемы можно охарактеризовать как требование снижения трудоемко^
сти построения и поддержки ЕЯ-интерфейса при повышении каче-
12*
179
ства понимания ЕЯ-запросов и интеллектуальности
ЕЯ-интерфейса в целом.
Отдельно следует обозначить требование мультиязычности в
современных ЕЯ-интерфейсах, поскольку в условиях глобализации
современного информационного мира потребность в обращении
пользователей к СИД на различных естественных языках является
столь же высокой, сколь и неудовлетворенной именно в области
ЕЯ-запросов к СИД. По вполне понятным причинам английский
язык в этом смысле находится в привилегированном положении, и
интернационализация автоматического понимания естественного
языка является благодатной точкой приложения усилий.
Анализ работ по тематике построения ЕЯ-интерфейсов к СИД
показал, что основное внимание при разработке ЕЯ-интерфейсов
уделяется прежде всего качеству понимания ЕЯ для определенной
предметной области и для определенного языка, в то время как
вопросам возможности портирования системы анализа на другой
естественный язык, другую предметную область и другие платформы
уделяется минимум внимания. Проблема портируемости тесно
связана с вопросами трудоемкости построения ЕЯ-интерфейса к
заданному структурированному источнику.
В связи с этим можно сформулировать целевую область в
общей проблематике и классы задач, которые встречаются в
компьютерной лингвистике:
• уменьшение трудоемкости построения ЕЯ-интефейсов к
реальным базам данных. В эту цель как составляющие входят:
минимизация количества и трудоемкости операций по созданию
ЕЯ-интерфейса; минимизация или устранение работ по настройке,
которые не мог бы выполнить настройщик, не обладающий навыками
лингвиста и инженера знаний; и наконец, унификация ядра
системы анализа ЕЯ для различных предметных областей и языков;
• повышение надежности понимания ЕЯ в интерфейсах к
реальным базам данных различной сложности и в различных
предметных областях;
• увеличение независимости системы анализа от конкретного
естественного языка, конкретного типа СИД, конкретной
предметной области и конкретной целевой платформы исполнения
ЕЯ-интерфейса.
Классы задач как подобласть целевой области:
• анализ архитектур и методик построения ЕЯ-интерфейсов к
структурированным источникам данных различных типов; анализ
особенностей различных типов СИД и языков запросов к ним,
180
влияющих на возможность построения ЕЯ-интерфейсов к ним;
выбор архитектуры системы построения ЕЯ-интерфейсов;
• методы построения мультиязычных ЕЯ-интерфейсов к
реляционным базам данных на основе семантически-ориентированного
подхода с применением методологии отделения предметной
области от регистра ЕЯ-запросов к базам данных и дополнением анализа
обработкой концептуальных структур;
• компоненты анализатора ЕЯ-запросов, включающие:
структуру сетевого представления модели предметной области
(МПО), отражающей логическую и концептуальную структуру ПО;
• структуру сетевого представления промежуточного языка
запросов в терминах модели предметной области;
• продукционную программу анализа естественного языка на
основе семантически-ориентированного подхода, использующей
логическую и концептуальную информацию МПО;
• разработка экспериментальной версии системы построения
ЕЯ-интерфейсов к реляционным базам данных. Данная задача
необходима, чтобы оценить преимущества метода построения
ЕЯ-интерфейсов на реальных примерах, к реальным базам данных
различной сложности и в различных предметных областях.
ЕЯ-интерфейсы к структурированным источникам данных. Они
имеют определенную нишу среди прочих интерфейсов к СИД, в
частности, в случае, когда необходимо минимизировать усилия со
стороны неподготовленного пользователя по освоению интерфейса
и сделать доступ к СИД наиболее естественным. Проведенный
анализ показал, что широкому распространению ЕЯ-интерфейсов
препятствует высокое отношение цена/качество ЕЯ-интерфейсов
для реальных источников данных.
Критерии качества ЕЯ-интерфейса собираются в единую
иерархическую схему (рис. 4.11). Под надежностью ЕЯ-интерфейса
понимается способность ЕЯ-интерфейса правильно понимать
намерения пользователя по получению информации из источника,
при условии, что пользователь корректно выразил потребности в
Рис. 4.11. Иерархия качественных характеристик ЕЯ-интерфейса
181
виде ЕЯ-запроса. Любой ЕЯ-интерфейс имеет некоторое
пространство правильно понимаемых запросов. Чем больше это
пространство, тем большей полнотой обладает ЕЯ-интерфейс.
Гибкость — показатель того, насколько разнообразные типы запросов
может понимать ЕЯ-интерфейс. Дружественность интерфейса
можно определить как меру того, насколько ЕЯ-интерфейс
удобен в работе, насколько корректно он может сообщать о
проблемах понимания, может ли он помогать в переформулировке небе-
рущихся запросов и т.д.
Важным критерием при сравнении ЕЯ-интерфейсов является
также необходимое количество усилий (времени), требуемых для
его построения. Хотя современные промышленные системы
построения ЕЯ-интерфейсов обладают достаточно высокой степенью
портируемости на различные базы данных, что, безусловно,
снижает трудоемкость построения ЕЯ-интерфейса, вопрос сортирования
системы анализа на другие языки, а также на различные типы
СИД, является открытым.
Повышение свойства портируемости системы анализа и
независимости ее от предметной области, типа источника данных и
языка, очевидно, позволяет существенно снизить отношение
цена/качество. Среди рассмотренных методов анализа ЕЯ-запросов
семантически-ориентированный подход представляется наиболее
отвечающим поставленным целям — он основан на анализе семантики
запроса, причем семантическая структура ЕЯ-запроса сходна для
различных естественных языков, в том числе и из различных
языковых групп. Этот подход позволяет учитывать модель предметной
области в достаточно развитой форме.
Среди многообразия архитектур ЕЯ-интерфейсов можно
выделить относительно устоявшуюся общую схему ЕЯ-интерфейсов к
структурированным источникам данных (рис. 4.12). Основными
составными частями этой схемы являются компоненты анализа
(лексического, основного, пост-анализа), использующие
определенные структуры данных (правила анализа, словарь, МПО, схема
источника данных), а также компоненты для взаимодействия с
источником данных и пользователем.
В состав МПО в общем случае входит часть, описывающая
структуру ПО, например ER-диаграммой, а также часть,
описывающая ПО с содержательной стороны, например множества
объектов, значений и т.д. Обе эти части имеют соответствие и
зачастую описаны в самом СИД (рис. 4.13) [78].
Среди средств описания модели предметной области наиболее
полно отвечает поставленным целям ER-диаграмма, т.е. диаграмма
182
Правила
лексического
анализа
Словарь
МПО
Схема СИД
Рис. 4.12. Основные составляющие ЕЯ-интерфейсов и их взаимосвязи
«сущность-связь» (рис. 4.14). Сеть связанных классов объектов
может служить основой для адекватного представления предметной
области для многих типов СИД, причем для некоторых типов этот
формализм является наиболее естественным (в частности,
объектно-ориентированные базы данных).
Существуют различные типы структурированных источников
данных, в частности реляционные и объектные СУБД, XML, RDF.
Важным критерием для типов СИД, которые попали в рассмотре-
мпо
Схема классов
СИД
Параметры атрибутов
Множества значений
Рис. 4.13. Соотношение частей МПО структуре и содержимому СИД
183
Named object
name TXT
Person
age
birth_date
last name
Country
Employee
service
hire_date
^
I
D
Contact person
duty
TXT
Customer
г
Delivar
who ordered
I
Supplier
ot^
vho made
Order
when_ordered
when_required
when_shipped
cost
ship address
A
D
D
D
MNIO
address
feo deliver-J
K>- items—order -O^ amount I
price price
discount A10
Order Item
J
product supplier
Product type
name TXT
-O-type—O^
| Product item
name
supplydiscount
price
availability
packing
TXT
BL
price
N10
TXT
Рис. 4.14. Диаграмма «сущность — связь» базы данных «North Wind»
ние, является наличие схемы у источников этих типов, а также
наличие универсального языка запросов к СИД данного типа. Еще
одним критерием для рассмотрения типов СИД является
распространенность этих типов в данный момент и тенденции к
распространению в будущем.
184
Языки запросов к перечисленным типам СИД,. несмотря на
разнообразие в синтаксисе, имеют общую структуру, т. е. одни и те
же структурные элементы запроса (табл. 4.2).
Весьма важно то, что эти структурные элементы
естественно-языкового запроса в семантически-ориентированном подходе.
Таблица 4.2. Сравнительный анализ структуры запроса для языков запросов
к различным типам СИД
Язык
Тип СИД
ГСтруктурный
элемент 1
Структурный
элемент 2
| «Дано»
«Получить»
Г «Источник»
«Упорядочить»
«Группировать»
SQL
РСУБД
Запись
Поле
+
+
+
+
+
OQL
ОСУБД
Объект
Атрибут
+
+
+
+
+
XQL
XML
Элемент
Атрибут,
вложенный
элемент
+
+
Г XMLOL
XML
Элемент
Атрибут,
вложенный
элемент
+
+
+
+
RDF Query
RDF
Ресурс
Атрибут
+
+
+
+ 1
Из всего этого можно сделать вывод о возможности создания
на основе семантически-ориентированного подхода технологии
построения ЕЯ-интерфейсов, которая бы обеспечила:
а) высокую степень независимости процесса анализа от
предметной области, языка и типа СИД;
б) уменьшение отношения трудоемкость/качество путем
минимизации усилий по настройке системы анализа на конкретную
предметную область, конкретный источник данных, конкретный
язык, при высоком качестве работы создаваемых ЕЯ-интерфейсов.
Технология построения ЕЯ-интерфейсов к СИД. Основой
построения ЕЯ-интерфейсов является
семантически-ориентированный подход к анализу ЕЯ в узких предметных областях,
дополненный методологией отделения предметной области от регистра
ЕЯ-запросов. Данный подход позволяет использовать ряд
принципов:
абстрагирование от конкретного естественного языка;
абстрагирование от конкретной предметной области;
абстрагирование от конкретной базы данных.
Первый пункт возможен благодаря применению в подходе
правил семантического анализа, мало отличающихся от языка к языку.
Так, опыт применения этого подхода при построении
ЕЯ-интерфейсов для ряда языков, в том числе для русского, английского,
185
немецкого, чешского, грузинского и некоторых других, показал,
что в этих языках основные правила анализа одни и те же, что
позволяет говорить о независимости ядра системы семантического
анализатора от языка в достаточно широком диапазоне языков. В
том случае, если требуется увеличить поддержку какого-либо языка
с большим количеством грамматических особенностей, в систему
анализа добавляются соответствующие правила, не меняющие
систему в целом. Механизмом, способствующим усилению данного
принципа, является применение концептуальных структур,
которые являются в высокой степени независимыми от языка и
позволяют при невозможности изменения продукционной программы
повысить надежность анализа ЕЯ-запросов для любого языка [79].
Подобный метод инвариантен также по отношению к
предметной области. Поскольку основной процесс анализа работает с
семантическими компонентами, выражающими семантику лексем не
в предметной области, а в регистре языка, состав и количество
классов в МПО никак не отражается на принципах анализа.
Добавление же возможности использования предопределенных
элементов МПО (классов, отношений) усиливает этот принцип тем, что
надежность анализа повышается, если предметную область строить
с применением таких известных систем анализа универсальных
классов, как «Именованный объект», «Человек», а также
отношений «Часть — целое», «Тип» и т.д.
Введение промежуточного уровня представления предметной
области позволяет скрыть детали организации базы данных в ее
модели, не поднимая их на более высокий уровень. Это, в свою
очередь, создает предпосылки для более эффективной работы
настройщика — нет необходимости работать постоянно, ее заменяет
МПО. Кроме того, при тех изменениях в структуре СИД, которые
не влияют на МПО, изменения в интерфейсе минимальны,
поскольку не касаются словаря.
Создание и развитие ЕЯ-интерфейса, согласно такому методу,
является итерационным процессом, требующим внимания
настройщика интерфейса на протяжении значительного времени,
поскольку ЕЯ-интерфейс должен удовлетворять потребности
пользователей в информации, а эти потребности меняются со
временем.
Порядок создания ЕЯ-интерфейса изображен на рис. 4.15.
Пунктиром выделены шаги, которые являются штатными при
эксплуатации ЕЯ-интерфейса, и которые не приводят к существенной
перестройке интерфейса.
186
Начало
¦*j Построение схемы СИД
t
¦*Н Построение МПО
+\ Начальное наполнение словаря |
Эксплуатация ЕЯ-интерфейса
Прокачка СИД
t
Тестирование ЕЯИ
t ~
Редактирование ЕЯИ
Рис. 4.15. Блок-схема процесса построения ЕЯ-интерфейса
Построение схемы источника данных, например модели базы
данных (МБД), является первым и необходимым этапом. На его
основе строится МПО. Такое решение обусловлено тем, что
необходимо соответствие между элементами МПО и элементами схемы
СИД для построения конечного формального представления
запроса из промежуточного и представления результата, полученного
от СИД, в терминах МПО. Затем выполняется начальное
наполнение словаря. Этот этап и предыдущий (построение МПО) могут
выполняться с применением библиотек предметных областей,
которые содержат шаблоны МПО для данной предметной области и
словарное наполнение с привязкой к этим шаблонам (рис. 4.16)
[78,79].
Содержимое словаря состоит из трех основных частей:
универсальная часть, лексика из базы данных и слова, введенные
настройщиками. Универсальная часть появляется в словаре при
создании ЕЯ-интерфейса, при этом возможен выбор универсального
словаря из нескольких. Это может использоваться при построении
ЕЯ-интерфейсов на определенном языке либо по определенной
тематике.
Процесс «прокачка» заключается в наполнении словаря
лексикой из содержимого источника данных. Для числовых полей есть
возможность сканировать интервалы их значений в базе данных.
Эти интервалы являются частями МБД и становятся частью МПО
при ее построении на основе МБД. Сканирование интервалов
осуществляется вместе с прокачкой текстовых полей. Перед наполне-
187
Рис. 4.16. Структура и источники МПО и словаря
нием лексикой словаря база данных сканируется на предмет
наличия регулярных выражений (так называемых шаблонов, например,
номеров телефонов или e-mail).
Тестирование ЕЯ-интерфейса — это собственно работа с
ЕЯ-интерфейсом, в том числе и эксплуатация. Как уже
указывалось, построение ЕЯ-интерфейса — это итерационный процесс,
который осуществляется постоянно при использовании
ЕЯ-интерфейса. Для облегчения работы настройщика предусмотрен список
тестовых запросов. Этот список может составляться в самом начале
построения ЕЯ-интерфейса и отражает его требуемую
функциональность. Тестирование заключается в проверке правильности
работы ЕЯ-интерфейса, при этом происходит дополнение словаря
лексикой тестовых запросов. Редактирование ЕЯ-интерфейса
подразумевает изменение любых настроек, в том числе МБД и МПО,
изменение словаря, а также редактирование и отладку
продукционной программы анализа. Общая схема построения ЕЯ-интерфейса
в диаграмме потоков данных показана на рис. 4.17.
Процесс настройки является достаточно автоматизированным и
позволяет строить и поддерживать ЕЯ-интерфейсы пользователям
без лингвистической подготовки. В то же время технология должна
содержать дополнительные средства, позволяющие производить
более тонкую настройку ЕЯ-интерфейса, меняя продукционную
программу, набор предопределенных семантических компонентов
и т.д., в частности, благодаря встроенной системе SNOOP
(разработанной С.А. Шаровым в РосНИИ искусственного интеллекта).
188
Среда для построения ЕЯ-интерфейсов
ЕЯ-интерфейс
Редактирование
продукционной
программы
Чтение структуры БД
Р и с. 4.17. Общая схема построения ЕЯ-интерфейса
Все операции по созданию, настройке и тестирования
ЕЯ-интерфейса доступны из единой исполняемой среды, что увеличивает
удобство настройщика.
Система анализа естественного языка. Система анализа ЕЯ
включает продукционную программу и набор базовых
семантических классов. Кроме того, требуются в конкретных разработках
дополнения семантически-ориентированного анализа и оценка их
влияния на качество работы системы.
Ядро системы анализа — продукционная программа реализуется
на основе семантически-ориентированного подхода с
дополнительным и опциональным использованием концептуальных структур.
Концептуальные структуры позволяют повысить качество
анализа, добавляя в семантически-ориентированный подход
дополнительные способы учета знаний прагматического уровня,
выраженных в конструкциях языка. Эти знания помогают при разрешении
неоднозначности в автоматическом понимании запроса.
Суть семантически-ориентированного подхода в том, что
лексическим единицам языка (лексемам, словокомплексам)
приписываются определенные семантические классы, выражающие смысл
данной лексической единицы в регистре задросов к базе данных. Кроме
того, некоторые семантические классы имеют в качестве атрибута
семантическую ориентацию, которая в каждом конкретном случае
связывает данное слово с определенным элементом МПО. Система
семантических классов и процесс анализа построены таким образом,
что в ходе анализа выделяются те комбинации семантических
классов, которые в запросе имеют смысл более крупных семантических
структур (например, предикатов). Таким образом, осуществляется
процесс построения дерева запроса снизу-вверх. Использование
семантической ориентации позволяет выполнять взаимное уточнение
смысла лексем, используя их контекстное вхождение в запросе.
Для демонстрации работы семантически-ориентированного
подхода рассмотрим анализ запроса к тестовой базе «Кадры»,
содержащей одну таблицу, в которой каждой записи соответствует
сотрудник:
Зарплата менеджеров и их домашний телефон
Attr (Salary) Val (Post) LogConj Insign Attr (HomePhone) Attr (WorkPhon)
Attr (HomePhone)
Под каждым словом даны семантические классы с
семантической ориентацией в скобках. Классы и ориентации указываются в
словаре для каждого слова. В результате анализа собираются пре-
190
дикаты из значений: в этом запросе слово «менеджер» имеет
семантическую ориентацию на поле базы данных Post, чего вполне
достаточно для собирания предиката
Post = 'manager7.
Поисковый образ 'managed также хранится в словаре, он
получается в результате прокачки. Остальные атрибуты не имеют
соответствующих значений, поэтому они попадают в часть запроса
«выдать». Результирующий запрос на SQL выглядит следующим
образом:
select name, lastname, salary, workphone, post
from kadr
where post like 'managers'
В список выдаваемых атрибутов попадают имя и фамилия
сотрудников (эти атрибуты заданы по умолчанию к выдаче), а также
должность (поскольку атрибут Post входит в предикат).
Этот рассмотренный пример запроса — к достаточно простому
ЕЯ-интерфейсу к базе данных, состоящей из одной таблицы.
Однако опыт разработки ЕЯ-интерфесов показал, что для более
сложных предметных областей этот подход в его традиционном
исполнении дает ряд сложностей.
Рассмотрим запрос к базе данных «North Wind», которая
описывает деловую деятельность небольшой фирмы, торгующей
некоторым набором продуктов:
Продукты стоимостью от 100 руб.
Obj (Product) Attr (Product.price) (>) Val (Product.price) Unit(Productprice)
Attr (Orderltem.sum) Val(Orderltem.sum) Unit(Orderltem.sum)
Attr(Order.sum) Val(Order.sum) Unit(Order.sum)
Видно, что данный запрос имеет большую неоднозначность на
уровне отдельных лексем. Это создает затруднения в правильном
понимании системой запроса. Решение данной проблемы идет в
предлагаемом подходе по нескольким путям:
1. МПО дополняется концептуальными структурами. Под
концептуальными структурами, или концептуализациями, здесь
понимается совокупность ролевых отношений, которые строятся поверх
основной схемы классов МПО. Для рассматриваемого запроса
может быть применена концептуализация PRODUCT, которая
содержит роли, являющиеся атрибутами класса Product: name, price, и
191
т.д. При анализе определяется наиболее вероятная
концептуализация для данного запроса. Критерием вероятности является,
например, полнота отождествления лексем запроса ролями данной
концептуализации, а также наличие в запросе концепт-маркера, т.е.
слова, которое однозначно указывает на определенную
концептуализацию. Этот подход выделяет только те смыслы слова, которые
определены в «победившей» концептуализации, называемой
определяющей.
2. Добавляется новый способ доуточнения: для пары
уточняемых слов вычисляются два параметра — сила контекстной связи в
запросе и сила связи по предметной области. При разрешении
неоднозначности учитываются оба этих параметра, причем
преимущества получают варианты с максимальными силами связи.
3. Правила взаимного уточнения
семантически-ориентированного подхода дополняются рядом новых правил. Так, например,
введение нового класса Obj (объект) повлекло за собой
необходимость введения правил для этого класса, аналогичных уточняющим
правилам для семантического объекта с классом атрибут (Attr).
Применительно к нашему запросу первый путь (ввод
концептуализации) приводит к тому, что из всех прореагировавших
концептуализации только PRODUCT имеет концепт («Продукт») в
запросе, а следовательно, и имеет безусловное преимущество. После
удаления ролей других концептуализации получаем:
Продукты стоимостью от 100 руб.
Obj (Product) Attr (Productprice) (>) Val (Product.price) Unit(Product.price)
Таким образом, устраняется неоднозначность для всех лексем в
запросе.
Второй путь (введение более гибкого механизма уточнения
через силу связи между лексемами) определит, что лексемы
«продукт» и «стоимостью» имеют сильную связь в контексте (стоят
рядом) и наиболее сильно связаны в МПО (стоимость является
атрибутом продукта). После уточнения семантики этих двух слов
корректируется аналогичным способом и семантика остальных слов
запроса, что также приводит к правильному пониманию запроса.
Сравнивая эффективность двух методов — с концептуализация-
ми и без, надо отметить, что первый приводит к более надежным
результатам, но требует предварительного задания
концептуализации для данной ПО, тогда как второй требует меньших усилий при
настройке ЕЯИ, будучи при этом менее надежным способом. Од-
192
нако комбинация этих двух методов приводит к довольно
высокому качеству работы системы анализа в целом. В результате качество
понимания зависит от усилий, затраченных при настройке
системы, — адекватное и полное описание концептуализации
предметной области приводит к максимальному эффекту.
Модель предметной области. Необходимо описать концепцию,
структуру и реализацию МПО. Перечислим основные требования к
МПО, необходимые для обслуживания системы анализа [78]:
1. МПО должна адекватно отражать феномены предметной
области, представленной в базе данных.
2. МПО должна быть интуитивно понятной и/или иметь
возможность быть представленной как интуитивно понятная для
неподготовленного пользователя.
3. МПО используется на этапе анализа ЕЯ и Q-генерации и,
следовательно, должна быть представлена в виде семантической
сети, используемой при анализе.
4. МПО используется на этапе построения запроса к источнику
данных, а также на этапе обработки результата от источника и
поэтому должна хорошо отображаться на схему СИД.
5. МПО должна иметь возможность к расширению, т.е.
появлению новых элементов без существенной переделки всей модели.
Основные феномены предметной области, которые могут
отражаться в МПО:
• классы и объекты;
• отношения между классами и объектами;
• атрибуты (свойства) классов и объектов;
• ситуации;
• зависимости между значениями атрибутов;
• область допустимых значений атрибутов;
• наборы единиц (масса, пространственные характеристики,
время и пр.) и перевод из одной единицы в другую внутри одного
набора;
• множества, объединяющие объекты;
• списки значений.
Описываемая модель предметной области состоит из четырех
основных частей.
1. Расширенная схема классов.
2. Хранилище семантических компонентов.
3. Концептуальные структуры.
4. Словарь (Строго говоря, словарь является отдельной
подсистемой. Однако тот факт, что словарные статьи имеют семантиче-
13 — 3466
193
ские ориентации на элементы МПО, а также то, что в словаре как
структуре хранения большого объема можно хранить сами
элементы МПО, позволяет рассматривать словарь как составную часть
МПО. На рис. 4.16 словарь условно показан как выходящий за
рамки МПО.)
Схема классов является центральной и обязательной частью.
По своей структуре она представляет собой ER-диаграмму с
некоторыми расширениями. В числе расширений — задаваемая
иерархия типов, параметры атрибутов, в частности области значений.
Схема классов представляет собой множество классов, связанных
отношениями. В схему не входят все объекты, хранящиеся в
источниках данных, и это позволяет охарактеризовать схему как
статическую структуру, как правило, инвариантную к изменению
содержимого СИД и отражающую его структуру. Отношения задаются
атрибутами особого вида — объектными. Согласно типологии
МПО, такие атрибуты имеют тип множества объектов (в случае
отношения 1:1 или п:1 состоящего из одного объекта), причем тип
объектов соответствует классу, связанному с данным.
Классы и объекты соответствуют классическому
ориентированно-объектному подходу, для них характерно наследование, в том
числе множественное. Классу соответствует набор атрибутов,
атрибуты имеют тип.
Неотъемлемой частью схемы являются параметры атрибутов
классов. Среди параметров атрибутов — битовые признаки,
например идентифицирующий, выдаваемый. Идентифицирующими
помечаются атрибуты класса, если их значения однозначно
определяют конкретный объект класса. Выдаваемые атрибуты по
умолчанию выдаются пользователю в ответе на ЕЯ-запрос, если их класс
участвует в Q-запросе. Атрибуту также может быть присвоена
единица измерения и область возможных значений.
Атрибуты классов могут быть вычисляемыми, т.е. их значения
зависят от значений атрибутов объекта или объектов, связанных с
данным. Для атрибутов, являющихся атрибутами классов,
связанных с данным, в качестве выражения задается аксессор (путь по
связанным классам). Вычисляемые атрибуты, а также
принадлежащие другим классам, но доступные непосредственно как атрибуты
данного, называются виртуальными. На рис. 4.18 показаны
отношения между элементами схемы классов.
Хранилище семантических компонентов является
необязательной частью МПО. Эта часть хранит компоненты и структуры из
них, которые далее участвуют в процессе анализа. В число храни-
194
Рис. 4.18. Отношения между элементами схемы классов
мых компонентов входят множества, списки, последовательности и
радикалы.
Множествами являются именованные Q-запросы, задающие
множества объектов.
Например, следующее множество определяет матерей как
пересечение множеств Женщины и Родители (здесь множество
представлено в OQL-подобном синтаксисе, хотя в МПО множество
задается в виде Q-дерева):
create set Mothers as
select x
from Employee x
where x in Women
and x in Parents
Списки представляют собой перечисленную коллекцию
значений простых типов. Списки могут иметь в качестве элементов
другие списки, и таким образом может быть построена иерархия
значений в виде дерева. Примером такой иерархии может быть
иерархия групп продуктов в базе данных «North Wind».
Последовательность — список из упорядоченных элементов.
Порядок в последовательности задается произвольным образом.
Элементом может быть не только значение, но также множество,
список и другая последовательность. В ЕЯ-интерфейсе
последовательности являются средством для описания шкал, не заданных
непосредственно в СИД. Последовательность может иметь значение
для запросов типа «военнослужащие старше майора», «сотрудники
с образованием выше ВА». Для этого МПО содержит последова-
13*
19$
тельности званий и иерархию уровней образования, составленную
из последовательностей. Таким образом, иерархии в МПО могут
сочетаться с последовательностями и быть построенными с их
помощью.
Радикалами называются структуры, являющиеся фрагментами
Q-запроса и доопределяющие некоторые параметры объектов,
выдаваемых в запросе. В качестве характерного примера можно
привести радикал, выражаемый в ЕЯ словами «вчера», «вчерашний».
Семантику этого слова можно описать с помощью такого
толкования: «с датой на 1 меньше сегодняшней». Формально это
выражается в семантической сети структурой Q-языка Предикат с заменой
конкретного атрибута типом Date (так как не определено, какая
именно дата — в базе может быть несколько атрибутов данного
типа). Сетевое представление для этого радикала приведено на рис.
4.19.
Радикалы являются средством для описания семантики
ЕЯ-выражений, которые нельзя выразить другими способами
(отношениями, множествами, атрибутами). Альтернативой радикалам
являются толкования, однако толкования являются одним из видов
простой текстовой подстановки лексемы в запросе, и в силу своей
простоты имеют побочные эффекты. Радикалы можно определить
как толкования, прошедшие анализ и представленные в
формальном виде.
Модель предметной области при анализе используется в виде
статической семантической сети. Принципы строения сети МПО
следующие.
• Классы, атрибуты, области значений, типы, множества,
списки представляются в виде узлов в сети МПО SNOOP.
• Признаки атрибутов, типы атрибутов, выражения для
вычисляемых атрибутов задаются как поля узлов-атрибутов.
• Структурные отношения,
связывающие классы, отношения,
атрибуты, множества, задаются через
связи сети МПО SNOOP.
Модель предметной области
должна иметь также текстовой
формат хранения, понятный человеку и
пригодный для ручной правки и
одновременно пригодный для
машинной обработки (парсинга). В качестве
Рис. 4.19. Сетевое представление такого формата предлагается исполь-
радикала «вчера» ЗОВать XML.
196
Структура Q-языка. Рассмотрим идеологию и структуру языка
представления запросов промежуточного уровня — Q-языка.
Промежуточное представление запроса имеет важное значение
в ЕЯ-интерфейсе, поскольку является своеобразным
«водоразделом» между представлением смысла запроса в терминах МПО и
регистра языка и формальным представлением запроса для
конкретного типа СИД. Важность Q-языка обусловлена и тем, что
пользователь для контроля за правильностью понимания его запроса
нуждается в выводе промежуточного представления именно в терминах
предметной области, кроме того, результат, полученный из
источника данных, необходимо представить в терминах МПО.
Представление запроса в Q предполагает формальное
выражение смысла этого запроса в терминах МПО, адекватное функции
ЕЯ-запроса. При этом сам язык Q (как и ЕЯ) служит средством
выражения значений. Значение запроса выражается в виде условий на
объект запроса, которые представлены деревом предикатов,
связанных логическими связками, а также атрибутами этого объекта,
предъявляемыми пользователю.
Представим Q-язык своей структурой, а не синтаксисом.
Структурно Q-запрос представляет собой дерево, в котором задан
класс выдаваемых объектов, условия на эти объекты (как правило,
представленные предикатами над атрибутами), а также описана
выдаваемая информация (список атрибутов, агрегатные функции,
выражения над атрибутами и т.д.). Отказ от синтаксического
представления запроса обусловлен тем, что уже готовое дерево запроса
затем можно легко преобразовывать в другой формальный язык
запросов, минуя, таким образом, стадию парсинга. Для передачи
Q-запроса генератору конечного формального представления,
например SQL, может использоваться XML-синтаксис, который
отлично приспособлен для передачи древовидных структур.
Идеологически Q-запрос состоит из двух основных разделов:
«сообщаю» недоопределенное описание объекта запроса (т.е.
задается подмножество объектов ПО, удовлетворяющих некоторым
характеристикам) и «запрашиваю» информацию о таких объектах.
Риторическая часть запроса «сообщаю» представлена в виде
матрицы атрибутов и ограничений на их значения, тип матриц взят
из заданной системы категорий ПО, одним из важных ее
признаков является наследование классов.
Один из классов этой системы (СОТРУДНИК) задает набор
атрибутов объекта запроса (тип матрицы) и возможно некоторые
логические условия (например, класс Начальник или Клиент задает
особую прагматическую интерпретацию).
197
Недоопределенное описание этого объекта состоит из
логических выражений, ограничивающих диапазон значений этих
атрибутов, а также задающих принадлежность объекта некоторому
множеству, в частности, полученному в результате вложенного запроса.
Логические выражения состоят из имени атрибута, отношения и
значения. Отношения включают в себя отношения сравнения (=,
<, ...) и принадлежности (списку, интервалу или множеству).
Логические выражения могут соединяться связками И, ИЛИ, НЕ
(список строк матрицы соответствует по умолчанию И). Логические
выражения в Q и связки между ними строятся из предикатов и
соответствующих связок дерева, построенного в ходе
лингвистического анализа.
Для множества объектов, отождествленных с недоопределен-
ным объектом запроса, производится операция, заданная в части
«запрашиваю» Q-запроса. В регистре запросов к БД возможны два
вида таких операций: предъявление этих объектов пользователю и
отображение этого множества в значение. В первом случае
предъявление основывается на наборе идентифицирующих атрибутов
данной категории (это задано в МПО), а также импликациях из
присутствия в запросе атрибутов, отношений или значений (о чем
спрашивается в запросе). Группа атрибутов может быть объединена
в гиператрибут. При порождении списка отображаемых атрибутов
часть из них берется непосредственно из списка несвязанных
атрибутов запроса (Зарплата Петрова), часть — из атрибутов, связанных
в предикатах (Сотрудники с зарплатой большей 2000), часть — из
списка идентифицирующих атрибутов данного объекта. В
последнем случае конструктор задает набор правил отображения,
например: для сотрудника всегда отображается фамилия, если задается
отображение зарплаты, то отображается и должность; если задается
отображение комнаты, то отображается и телефон. В интерфейсе
должна также существовать возможность отображения всех
атрибутов найденного объекта.
Структурно Q-запрос представлен в виде дерева и состоит из
следующих основных частей:
• класс выдаваемых объектов, называемый объектом запроса;
• условия отбора объектов;
• состав выдаваемой информации об объектах (атрибуты,
агрегатные функции типа min, max);
• указание порядка сортировки выдаваемого результата
(необязательно) и ограничение на количество отбираемых объектов,
например первые пять (необязательно);
198
• требование группировки результата по некоторым атрибутам,
относящимся к выдаваемым объектам (необязательно) и фильтр на
выдаваемые группы (необязательно).
Для представления пользователю могут использоваться
различные варианты синтаксиса, отображающие одну и ту же
внутреннюю структуру запроса.
В качестве примера рассматриваются различные представления
следующего запроса к базе данных «North Wind»:
ЕЯ:
List all the products in bottles that cost less than 5$
Q:
[measure—unit = bottle']
price<=5/$/ J
OQL:
select p.price, p.name, p.measure unit
from Product p
where рпсе<=5{$}
and measure_unit='bottle'
На рис. 4.20 представлено Q-дерево.
Приведенный выше пример содержит представление запроса в
виде дерева. Узлы этого дерева являются компонентами в
терминологии семантически-ориентированного анализа или классами в
понятиях SNOOP. Набор компонентов, участвующих в Q, частично
пересекается с набором компонентов, участвующих в МПО (Класс,
Атрибут, Множество и пр.).
Корневым узлом всегда является узел Запрос (Query). К нему
относятся узлы: Выдаваемая информация (Get), Объект запроса
(QObject), Условия (Conds), а также необязательные узлы
Сортировка (Sort), Ограничение количества (Тор/Воттом), Группировка
(Group).
К узлу Выдаваемая информация могут подсоединяться
узлы-атрибуты, агрегатные функции (min, max и пр.) и т.д. Узел Объект
запроса задает класс объектов, к которому применяются условия,
заданные узлом Условия и связанные с ним. В Условия входят
наследники узла Предикат (наследники APredicate). Выдаваемый
результат сортируется, исходя из узлов-наследников класса
выражения, которые содержит узел Сортировка.
Для ограничения выдачи количества объектов предназначен
узел Ограничение количества. Информация об объектах может
группироваться в соответствии с составом узлов, подчиненных узлу
Группировка. Под группировкой здесь понимается возможность вы-
199
давать значения агрегатных функций по группам объектов, группы
при этом определяются исходя из значений обозначенных
атрибутов, связанных с объектом. Для фильтровки по уже собранным
группам предназначен узел Фильтр групп (GroupFilter).
Классы узлов в Q-дереве образуют иерархию наследования.
Например, класс предикат (APredicate) является предком для
Сравнения (Compare), от Выражения (Expression) наследуются Значение
(Val), Функтор (Aggr) и т.д. Иерархия вводится для использования
в продукционной программе правил, абстрагирующихся от
несущественных для данного правила деталей (например, все предикаты
равноправны по отношению к классу Условия). Часть классов
фактически являются абстрактными — в Q-дереве присутствуют только
их предки. Абстрактными классами являются — ПРЕДИКАТ,
ВЫРАЖЕНИЕ, МНОЖЕСТВО, АТРИБУТ, АКСЕССОР (табл. 4.3).
Таблица 4.3. Перечень абстрактных классов
Предикат
Г APredicate
Compare
InOSet
InVSet
Exists
ForAll
Or
And
I Not
Выражение
AExpr
Val
Aggr
Vqiery
Expr
AAttr
Атрибут
AAttr
Attr
CAttr
GAttr
OAttr
Запрос
AQuery
Query
VQuery
LQuery
SQuery
Список
AList
List
LQuery
Множество
ASet
Set
SQuery
Intersect
Union
Except
Из табл. 4.3 видно, что в иерархии применяется множественное
наследование: например, для класса LQuery (запрос-список)
предками является список AList и запрос Aquery.
Необходимо учитывать вопросы генерации конечного
синтаксического представления Q-запроса для различных типов СИД.
Так как Q-язык достаточно гибок и выразителен для представления
семантики запроса, и в то же время достаточно структурирован и
формализован для перевода в языки запросов СИД, Q-представле-
ние обладает всем необходимым для дальнейшего перевода запроса
в языки запросов к рассмотренным СИД.
Интегрированная среда построения ЕЯ-интерфейсов к
реляционным БД. Следует использовать интегрированную систему
построения ЕЯ-интерфейсов к реляционным базам данных и общей
архитектуре системы с известными основными компонентами, а также
с повышенными основными характеристиками системы.
201
На рис. 4.21 показан основной цикл работы ЕЯ-интерфейса в
idef-нотации. ЕЯ-запрос от пользователя поступает на вход
процесса «Анализ ЕЯ». Этот процесс, используя лексическую
информацию, хранящуюся в словаре, а также МПО выбранного
ЕЯ-интерфейса, преобразует ЕЯ-запрос в промежуточный язык Q. Затем в
процессе «Генерация SQL» Q-запрос преобразуется в SQL-форму.
При этом используется как МПО, так и МВД в виде реляционной
схемы.
Полученный SQL-запрос поступает к целевой БД, являющейся
внешней системой по отношению к данной схеме, от нее
получается результат в виде множества кортежей. Процесс «Обработка
результата» преобразует этот необработанный результат в вид,
пригодный для представления пользователю.
В качестве Л-процессора можно использовать виртуальную
машину SNOOP (System with Network and Object-Oriented
Programming). Эта система представляет собой удобное средство
разработки лингвистических процессоров, сочетая преимущества
объектно-ориентированного подхода, сетевого представления
данных (узлы сети и отношения между ними являются объектами
задаваемых классов) и продукционного механизма исполнения
правил.
В настоящее время компоненты SNOOP (компилятор, редактор
и отладчик продукционной программы) и разделяемые с InBASE
компоненты (словарь и виртуальная машина) объединены в один
проект с InBASE. Это означает, что в состав ЕЯ-интерфейса может
входить исходный текст продукционной программы, что позволяет
подстраивать Л-процессор на конкретную предметную область.
h
II
се о
О. О.
ю
О
202
Словарь
ЕЯ
ЕЯ_
МПО
Слова
МВД
МПО
Схема БД
Пользователь
Анализ ЕЯ
Генерация
SQL
2__?
Обработка
результата
I Генерация ЕЯJ-,CJl 1-нШ БД 4Ж
Результат
UK
в1&
8
Рис. 4.21. Основной цикл работы ЕЯ-интерфейса в idef-нотации
Применение семантически-ориентированного анализа с
минимальным использованием синтаксиса запросов позволяет понимать
ЕЯ-запросы на нескольких языках. В рамках подобных сред можно
тестировать Л-интерфейсы на русском и английском языках.
Интересен тот факт, что один ЕЯ-интерфейс может понимать запросы
на нескольких языках и даже понимать запросы, состоящие из слов
различных языков.
Среди тестировавшихся известны интерфейсы к базам данных с
различными предметными областями. Так, база данных «Флот»
представляет собой справочник по типам судов и конкретным
кораблям. Предметная область данной базы построена на основе
отношения класс — экземпляр. Еще одной тестовой базой является
база данных «Кадры», которая представляет собой таблицу
сотрудников некоторой компании с заполненными атрибутами для
каждого сотрудника. И наконец, тестовой базой была база данных
«North Wind», которая довольно известна благодаря включению в
дистрибутивы СУБД корпорации Microsoft — Access и SQL Server.
Предметной областью этой базы является деловая деятельность
небольшой фирмы -— продажа товаров по заказу.
Благодаря использованию базового SQL, а также компонента
BDE (Borland Database Engine), система может строить
ЕЯ-интерфейсы ко всем основным коммерческим СУБД, в том числе и тем,
которые доступны с помощью драйверов ODBC. Характерным
примером времени создания ЕЯ-интерфейса может быть создание
русскоязычного интерфейса к БД «Кадры», которое занимает
несколько часов.
Благодаря использованию семантически-ориентированного
подхода, ЕЯ-интерфейсы при правильном их построении обладают
достаточно большой надежностью. Помимо запросов, правильных
с точки зрения синтаксиса, понимаются запросы, заданные в
«телеграфном» стиле, более характерном для поисковых систем.
Механизм разрешения неоднозначности позволил свести к минимуму
обращение к пользователю и разрешать неоднозначность в системе
анализа.
Качество понимания запросов, в частности гибкость и полноту
ЕЯ-интерфейсов, иллюстрируют следующие правильно
понимаемые ЕЯ-запросы к кадровой базе данных.
Дни рождения семейных сотрудников, родившихся в апреле
1965 г.
У кого нет детей?
Есть ли матери-одиночки?
203
Зарплата женатых консультантов и инженеров, кроме
работающих с 1995 г.
Домашний телефон заместителя директора.
Зарплата 500—1000.
Чей телефон 217-76-77?
1973 год рождения; отцы. Вывести количество детей, зарплату.
Таким образом, можно использовать современные методы
построения ЕЯ-интерфейсов к структурированным источникам
данных, базирующиеся на семантически-ориентированном подходе к
анализу ЕЯ-текста в ограниченной предметной области на основе
ее модели и обеспечивать независимость организации процесса
создания интерфейса от конкретного естественного языка,
предметной области, типа источника данных. При этом архитектура
лингвистического процесса реализует анализ ЕЯ-запросов к
информационным системам с использованием аппаратов
концептуальных структур и семантической сети для организации процесса
анализа входного ЕЯ-текста, а также представляет МПО и
содержания промежуточного языка запросов.
4.4. Когнитивная компьютерная графика
Средства интерактивной компьютерной графики (ИКГ)
являются распространенным каналом общения между человеком и
ЭВМ. ИКГ реализует две связанные между собой функции:
иллюстративную и когнитивную (рис. 4.22).
Одновременный вывод ИКГ-изображений в разные окна на
экране дисплея создает у пользователя синтетический полиоконный
ИКГ-образ. Иллюстрированная функция обеспечивает визуальную
адекватность графического образа оригиналу, т.е. визуальную
«узнаваемость» оригинала. Когнитивная функция позволяет (при
определенных условиях) изображать в наглядной графической форме
внутреннее содержание оригинала.
Отметим ряд особенностей когнитивной ИКГ. Когнитивная
ИКГ является средством прямого целенаправленного воздействия
на интуитивные, образные механизмы мышления: динамизм ИКГ
(например, в режиме мультипликации) «включает в работу»
специальные процедуры, эффективно отслеживающие динамику
изменения ИКГ-изображений, а поиск таких инвариантов и тенденций
является главной задачей любого и, прежде всего,
абстрактно-математического научного исследования; когнитивная ИКГ позволяет
визуализировать содержание проблемы, которая интересует иссле-
204
Полиоконный
И КГ-образ оригинала
И КГ-отображение
формы оригинала
Иллюстративная
функция И КГ
1
ИКГ-отображение
содержания оригинала
Когнитивная
функция ИКГ
ИКГ
Невербальный, визуальный уровень
рассмотрения проблемы
Оригинал (объект, явление, процесс,
понятие, теория, идея и т.п.)
Рис. 4.22. Функциональное содержание ИКГ
дователя, в этом случае ситуация настраивает исследователя на
активный поиск нового знания.
В этой области актуальными являются следующие задачи:
1) разработка архитектуры когнитивных ИКГ-систем;
2) разработка методологии применения когнитивных
ИКГ-систем для интенсификации процесса научного творчества и создания
качественно нового знания;
3) использование когнитивных ИКГ-систем для
экспериментального исследования высших механизмов интуитивного,
образного мышления в условиях реального процесса творческого
научного поиска.
В настоящее время известны два вида систем представления,
переработки и использования знаний: экспертные системы (ЭС) и
системы автоматизации научных исследовании (САНИ).
Рассмотрим «движение» от незнания к знанию (рис. 4.23). Очевидно, что
такой процесс является непрерывным, итерационным и
диалектическим.
Все его этапы тесно связаны между собой. В настоящее время
сильна тенденция объединения обоих подходов (ЭС и САНИ):
основанного на качественных моделях и используемого на этапе
формирования гипотез и теорий и основанного на количественных
моделях. Такое объединение создает инструмент мощной интел-
205
Выдвижение гипотез
типа ЕСЛИ - ТО
Q*D
Когнитивная
ИКГ-система
Верификация
гипотез
Т
1
Построение
количественной
научной теории
J
(сани)
Рис. 4.23. Пополнение знаний на основе ИКГ-системы
лектуальной поддержки для исследователя. Такая гибридная
технология и служит основой для ИКГ-систем.
Архитектура когнитивных ИКГ-систем. Общая схема
интегрированной проблемно-ориентированной когнитивной ИКГ-системы
приведена на рис. 4.24.
Основными ее элементами являются следующие.
1. КП — конечный пользователь сетевой ПЭВМ.
2. Диспетчер, обеспечивающий управление интерактивным
доступом КП к системе.
3. Основные режимы работы ИКГ-системы:
• коммуникация — обеспечение оперативной связи КП друг с
другом и с внешними системами на уровне теледоступа;
• ЭС — принятие решений в рамках работы с традиционной
ЭС;
• извлечение знаний из эксперта — формирование и наполнение
БЗ ЭС в режиме коллективного экспертного анализа ситуаций из
ПО, представленных в форме ИКГ-изображений на дисплее
ПЭВМ;
• информационное обслуживание — работа с интеллектуальной
информационно-поисковой системой по формированию и
наполнению индивидуального банка фотографических и
экспериментальных данных по вопросу, интересующему конкретного КП, а
также поиск и анализ аналогий и прецедентов в других БЗ;
• научное исследование — решение с помощью САНИ так
называемых обратных задач научного исследования («жесткое»
математическое моделирование);
• «мягкое» математическое моделирование — построение,
конструирование и верификация новых научных теорий;
206
И нтелл ектуал ьный
ИКГ-интерфейс
Автоматизированный
эксперимент
СУБДЗ
БЗ
ИПС
БЗ
ЭС
БЗ
САПР
БЗ
И КГ-изображений
БЗ
САНИ
БЗ автоматизированного
обучения
Рис. 4.24. Общая схема интегрированной проблемно-ориентированной когнитивной ИКГ-системы
• расчетно-логическое решение — решение прямых (вычислив
тельных) задач научного исследования на базе соответствующегб
интеллектуального пакета прикладных программ;
• эксперимент — оптимальное управление экспериментом, сбор
и первичная обработка экспериментальных данных;
• САПР — поиск новых технических решений и ИКГ,
проектирование технических систем и технологических процессов;
• обучение — интеллектуальное автоматизированное
преподавание (обучение) типа проблемно-ориентированных систем
автоматизированного обучения, основанных на единой ИКГ-методоло-
гии.
4. Внешняя среда — телекоммуникационные связи с другими
когнитивными ИКГ-системами коллективного пользования,
суперЭВМ, интегрированными базами данных общего назначения,
промышленными и технологическими.
5. Интеллектуальный ИКГ-интерфейс — управление ИКГ
общением КП с исследуемой проблемой во всех указанных режимах.
6. Автоматизированный эксперимент — управление
экспериментальными установками и каналами обмена экспериментальной
информацией с БЗ в реальном масштабе времени.
7. СУБЗ — управление интегрированным комплексом
взаимосвязанных БЗ.
8. Единая (интегрированная) БЗ — взаимосвязанные
специализированные БЗ, которые, с одной стороны, благодаря единой
СУБЗ максимально открыты и доступны для всех КП и друг для
друга, а с другой — сохраняют автономию и специфику своих
прототипов (БЗЭС, БЗ САНИ, БЗ САПР и т.д.).
Процесс ИКГ-генерации нового знания можно схематично
описать следующей последовательностью основных этапов:
1) создается новое (или вызывается старое из соответствующей
БЗ) ИКГ-изображение;
2) это ИКГ-изображение подвергается любым допустимым
преобразованиям;
3) в каждом получаемом таким образом ИКГ-изображении
визуально отыскиваются графические особенности;
4) эти особенности ИКГ-изображений анализируются с
помощью продукций из БЗ ЭС и строится множество консеквентов этих
продукций — содержательно-значимых гипотез-высказываний из
всего множества высказываний V;
5) полученные гипотезы-высказывания анализируются с точки
зрения их значимости и новизны посредством, например, поиска
208
по ключевым словам аналогов и прототипов в БЗ
информационно-поисковой системы (ИПС);
6) если обнаруживается новая содержательно-значимая
гипотеза из V, то поиск (конструирование) доказательства этой гипотезы
реализуется также с помощью когнитивного ИКГ-подхода.
Вопросы для самопроверки
1. Что подразумевается под пониманием текста на естественном языке (ТЕЯ)?
2. Сколько существует уровней понимания ТЕЯ?
3. Каково содержание уровней понимания ТЕЯ?
4. В чем состоит система понимания ТЕЯ?
5. В чем особенности понимания ТЕЯ на лингвистическом и семантическом
уровнях?
6. Каково содержание процедуры синтеза связных текстов и машинного
творчества?
7. Как строятся ЕЯ-интерфейсы?
8. Какими являются основные составляющие ЕЯ-интерфейсов и какова их
взаимосвязь?
9. Что составляет технологию построения ЕЯ-интерфейсов к
структурированным источникам данных?
10. Какова блок-схема процесса построения ЕЯ-интерфейсов?
11. Какой является среда для построения ЕЯ-интерфейсов?
12. В чем особенности запроса в виде дерева?
13. Каково основное содержание средств когнитированной компьютерной
графики?
14. Что из себя представляет общая схема проблемно-ориентированной
ИКГ-системы?
14 — 3466
Глава 5
ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕДУР ПОИСКА,
УПРАВЛЕНИЯ И КОНТРОЛЯ
(восприятие информации и модели обучения)
При общении человека с предметной областью существует
достаточно хорошо очерченный круг задач, в которых
интеллектуальные технологии наиболее хорошо внедряются и дают прикладной
эффект. Это, прежде всего, задачи поиска, контроля,
диагностирования, прогнозирования, управления, оптимизации,
распознавания, восприятия и др.
Задача поиска в своем проявлении достаточно
разнообразна — это интеллектуальный поиск научно-технической и
технологической информации. На стадии проектирования систем —это
процедуры полного конструирования, на стадии
производства — поиск оптимальных технологических решений, на стадии
применения — это поиск наилучших условий функционирования
объектов и процессов, а также рутинный поиск данных.
При осуществлении контроля систем (процессов), как и при
решении задачи управления, возникают вопросы оценки
многомерной ситуации, необходимость формализации трудно
формализуемых объектов, экспертной поддержки при принятии решений в
конфликтных ситуациях, использования методов нечеткой логики,
генетических алгоритмов и нейронных сетей.
5.1. Интеллектуализация поисковых процедур
Системы управления знаниями в настоящее время с успехом
используются во многих областях применения
автоматизированных информационных систем, ориентированных на
интеллектуальные методы. С другой стороны, информация современного
общества привела к появлению крупнейших информационных банков в
различных отраслях научно-технических знаний. Попытки
разработки и внедрения многокритериальных систем классификации
информации, а также автоматизации информационного поиска
210
пока не приводят к сколько-нибудь существенным результатам с
точки зрения увеличения релевантности и комфортности
информационного поиска.
Развитие новых информационных технологий и образования
реальной всемирной компьютерной сети настоятельно требует
предоставления новых возможностей получения актуальной
информации и знаний, которые предприятия и физические лица могут
использовать в своей деятельности. Таким образом, возникает
проблема интеллектуального поиска необходимой пользователю
научно-технической и технологической информации. Решение этих
проблем может быть найдено в развитии методологии
проектирования систем управления знаниями для информационного поиска.
На современном этапе к числу проблем поиска информации
можно отнести следующие:
• при получении пользователем большого объема информации
в результате автоматизированного поиска много времени
затрачивается на ее просмотр и выбор, в то время как даже простой выбор
необходимой информации зачастую представляет собой нелегкую
проблему;
• выбор информации, осуществляемый человеком, нередко не
является рациональным и строго последовательным, что
существенно осложняет поиск информации;
• пользователь при поиске информации обычно не строго
определяет цель поиска, т. е. использует нечетко определенные
понятия.
Недостатки существующих систем управления знаниями
заключаются в том, что при построении с целью поиска
персональной модели знаний для организации или пользователя и при
последующем поиске информации в базе знаний не учитываются
отношение к знанию пользователя и взаимодействие элементов
информации между собой, что ведет к увеличению объема выборки
из баз данных.
Процедура проведения поиска информации, необходимой
пользователю, предполагает в ходе опроса выявление ключевых
понятий поиска и их значимости для пользователя.
Типичная архитектура системы управления знаниями приведена
на рис. 5.1. На увеличение используемости систем управления
знаниями влияет несколько факторов:
• влияние окружающей среды;
• развитие технологий;
• способность создавать ценную информацию.
14* 211
Пользователь
Интерфейс пользователя
Логический/интеллектуальный уровень
Экспертные системы/интеллектуальные агенты/фильтры!
Ком муникационный/транспортный уровень
Intranet/Internet/WWW/E-Mail/Сообщения
Хранилище
данных
База данных
общения
с
пользователем
Фактические
и
процедурные данные
Репозитарий
знании
Рис. 5.1. Архитектура системы управления знаниями
Решение проблемы построения систем поиска информации
существенно облегчается при использовании систем управления
знаниями.
Недостатки существующих систем управления знаниями в том,
что при поиске информации в базе знаний не учитывают
отношение к информации пользователя и взаимодействие элементов
информации между собой, что ведет к большому объему выборки из
баз данных, и расположение документов представляет собой
беспорядочную структуру, а не последовательность, расположенную по
возрастанию степени важности документа.
В связи с этим необходимо составить библиотеку моделей
представления знаний (МПЗ), используемых при построении систем
управления знаниями. При этом для формализации описания
модели знаний следует использовать универсальную алгебру.
При проектировании баз знаний используют четкое
взаимоотношение объектов, т.е. традиционную логику, которая
подразумевает, что символы и управляемые процедуры точно определены.
Такой подход облегчает создание систем, основанных на знаниях.
Однако указанный подход недостаточен для определения реального
мира (предметной области), в котором часто возникает
неопределенность отклонений между объектами. В отличие от
традиционной логики нечеткая логика обладает способностью обрабатывать
неопределенность и приблизительные рассуждения.
212
Информационно-документальная база знаний (ИДБЗ). Для
определения информации, необходимой пользователю, надо
располагать знаниями, являющимися отображением содержания запроса
пользователя. На их основе строятся гипотезы о необходимой ему
информации и формируются запросы на ее получение. Поскольку
обрабатывается документальная информация, которая не
формализуется, необходимо вводить и использовать ИДБЗ, которая
отражает смысловую взаимосвязь между различными документами [80].
Для представления ИДБЗ используется семантическая сеть, в
основе которой лежит универсальная алгебра, описанная тройкой:
А = {S, О, R},
где S — множество семантических сетей, представляющих модель
предметной области; О — множество операций на S; R —
множество отношений на S.
Семантическая сеть ИДБЗ, соответствующая модели
предметной области, рассматривается в работе как двойка следующего
вида:
Sno = {D, U},
где D — множество документов; U — множество дуг, связывающих
документы. Каждая дуга показывает взаимосвязь документов или
отношение между документами (указывается степень зависимости
одного документа от другого).
Вводится понятие нечеткого объекта, который основывается на
нечеткой логике. На его основе строится модель предметной
области с нечеткими объектами и отношениями между ними, что
позволяет наиболее адекватно представить реальную картину мира в
системах представления знаний.
Документ Di семантической сети представляется следующим
образом:
где I — содержание документа (это может быть текст, рисунок,
видеоролик и т.д.); Р — множество понятий, описываемых или
связанных с документом; UDi — множество отношений между
понятиями Р и содержимым документа I.
Отношения UD определяются как множество двоек типа
< T,UiP >, где Т определяет тип отношения для понятия и
информационной части документа, a UjP представляет собой нечеткое
подмножество, которое показывает степень зависимости документа
213
и понятия между собой (степень зависимости определяет близость
понятия и описательной части документа). Тип отношения Т
определяет два вида зависимости понятия в документе:
hx - понятие является входным для документа,
{t2 - понятие является выходным для документа;
U ip определяется как
u?p = (n0ff(Pj)l)|PjeDi,ieDi)j=I._n,
где Pj — понятие, принадлежащее документу D4; n — количество
понятий в документе. Таким образом, документ D* соответствует
объекту Dj с неопределенными и фиксированными атрибутами:
65 ={Ii,P1,...,Pn,tp,Oi5(Ii,P1),...,jLi5i(Ii,Pn)}},
где Ii — информационная часть i-ro документа; Рь ..., Рп —
понятия, принадлежащие i-му документу; tp — тип отношения для
понятия Р4; |i- (Ij ,P|) — отношение близости понятия Р4
информационной части1 Ij. Если исходить из предложенной схемы построения
узла семантической сети ИДБЗ, зависимость между узлами будет
строиться на основе взаимосвязи между понятиями документа.
Далее устанавливается нечеткое отношение Up у = jlls (Pi ,PjX
определяющее близость понятий между собой. На ее основе формируется
нечеткое подмножество Up:
Up = {Pi,Pj,^is(Pi,Pj)|Pi ep,Pj eP,i,j = i...N},
где N — количество понятий в ИДБЗ.
При формировании отношений между понятиями необходимо
выделить три основных свойства:
1) VPj Е SjJLl^Pj ,Pj) = 1 (СИНОНИМИЧНОСТЬ),
2) VPX GS,VP2 GS,|iis(P1,P2) = ^s(P2,P1) (симметричность),
3) VPj ?S,VP2 GSjIli^P^P^^O (положительные значения).
Нечеткие отношения, удовлетворяющие 1 и 2, называются
отношениями близости.
Создание ИДБЗ основывается на описании нескольких моделей
предметной области (МПО), взаимосвязанных или несвязанных
между собой. Для облегчения создания ИДБЗ каждая МПО
строится на основе отдельной семантической сети, которые потом
объединяются в «единую» МПО. Определим основные операции и
отношения на семантических сетях, описывающие различные МПО.
214
Определяются следующие отношения на элементах
семантической сети:
1. Равенство документов Dl = D2.
2. Дополнение D{ = D2 или Dx = D2.
3. Документы Di и D2 имеют общие составляющие (отношение
4. Документы Di и D2 не имеют общих составляющих
(отношение 1).
5. Включение D{ CD2 (нестрогое включение); Dt CD2 (строгое
включение).
Затем приводятся основные отношения R на семантических
сетях.
1. Принадлежность документа D4 семантической сети S.
2. Вхождение документа D4 в семантическую сеть S.
3. Эквивалентность семантических сетей.
4. Дополнение семантических сетей.
5. Включение семантической сети Si в S2.
6. Si и S2 имеют общие составляющие (отношение <->).
7. Si и S2 не имеют общих составляющих (отношение ±).
Таким образом, перечислены основные отношения на
семантических сетях, позволяющие определять зависимость созданных
семантических сетей ИДБЗ между собой.
Основные операции между составными элементами
семантической сети:
1. Пересечение D3 =zDlf]D2>
2. Объединение D3 = D{ UD2.
3. Разность D3 = Dj — D2.
4. Разбиение документа a(D) = D1{I1,P1},D2{I2,P2},...,Dn{In,Pn}.
Операции над семантическими сетями:
1. Пересечение S3 = Sj riS2.
2. Объединение S3 = S{ US2.
3. Разность S3 = Si — S2.
4. Разбиение семантической сети.
5. Добавление вершины.
6. Удаление вершины.
Основные операции над семантическими сетями ИДБЗ
позволяют создавать МПО, описываемые в терминах семантической
сети, разбивать и объединять построенные МПО.
215
При поиске информации в ИДБЗ необходимо описать способы
построения моделей пользователя и обучаемого, построение
модели пользователя в системе поиска информации, а также модели
действий пользователя и обучаемого. Очевидно, необходим
алгоритм предварительного определения количества групп документов
в ИДБЗ для эффективной идентификации документов.
Для поиска информации в базе знаний должен существовать
механизм логического вывода, который выделяет на основе
анализа построенной ИДБЗ:
• наиболее важные документы из представленных в базе
знаний;
• тематическую подборку документов, необходимых
пользователю;
• последовательность выдачи документов, если пользователь
является обучаемым.
Механизм логического вывода строится на основе теории
принятия решений и анализа экспертной информации. Принятие
решения о выдаче пользователю информации состоит из следующих
этапов:
• генерация возможных альтернатив решений;
• оценка возможных альтернатив решений;
• согласование решений;
• анализ динамики развития ситуации;
• выбор решения.
В основе генерации возможных альтернатив выбора документов
используется гипотеза о подобии: для выбранного документа
находится другой документ, базовые понятия которого наиболее близки
по смыслу понятиям выбранного.
Оценка возможных решений базируется на использовании
нечеткой логики, которая применяется для построения
семантической сети ИДБЗ.
Согласование решений состоит в поиске компромисса при
определении окончательного выбора решения. Он строится на основе
следующей методологии:
, • метод уступок;
• метод согласования по главному критерию;
• метод согласования решения при лексикографическом
упорядочивании;
• метод согласования групповых решений с использованием
ранжирования по Парето.
216
Анализ динамики развития ситуации строится на основе
сформированной модели пользователя и модели действий пользователя
в процессе работы системы поиска информации.
Выбор набора документов, предъявляемых пользователю, может
содержать разное число вариантов. Он может состоять из одного
варианта, из нескольких (в частности, из всех представленных)
вариантов, либо может быть пуст («отказ от выбора»).
Для определения необходимых документов из множества
вариантов используется метод выбора по отношениям предпочтения
для построения функции отношения предпочтения. С использоваг
нием этой функции и критериально-экстремизационных
механизмов выбора определяется последовательность выдачи документов
пользователю.
Для использования метода выбора отношения предпочтения
определим функцию предпочтения Si(k, ?). Для характеристики
меры близости документа Dk к D/ используется функция близости
fi(k, ?), определяющая степень близости документа Dk по
отношению к документу D/. Причем функция ? (к, ?) указывает не степень
превосходства Dk над D*. Функция ?(к, ?) обладает следующими
свойствами:
1) fi(k, ?) возрастает с возрастанием значения оценки близости
документа Dk к D*;
2) fi(k, ?) = 1 означает безусловную близость документа Dk к
документу D/, fi(k, ?) = О означает полное отсутствие близости Dk и
D/. Если fi(k, ?)е [0,1] и Si(k, ?) > Sl9(?9 k), то в нечетком
отношении это означает, что Dk предпочтительнее D*.
Отношение предпочтения на паре альтернатив (Dk, D/)
определяется соотношением
Si(k,0=Twjgj(k,4
j=i
где Wj — весовой коэффициент, определяющий значимость j-ro
понятия для i-ro документа; gj — функция предпочтения по j-крите-
рию для пары альтернатив (Dk, D/) и определяется соотношением
gj(k,0 =
^jk-^j/>eamnjk >ц^;
0, в противном случае,
гДе M-jk^M-i/ являются мерами близости к j-му понятию k-го и ?-то
документов соответственно и вычисляются следующим образом:
217
1 м
m=l
где М —количество понятий, принадлежащих k-му документу;
щ(Р|,Рт) — отношение близости между j и m понятиями; wm —
весовой коэффициент, определяющий значимость m-го понятия для
k-го документа.
Таким образом, используя функцию предпочтения для анализа
множества документов ИДБЗ, можно определить наиболее близкие
(взаимосвязанные) документы.
Структуры модели пользователя (МП). Рассмотрим
представление модели пользователя в системе управления знаниями для
поиска информации. Определим модели действий пользователя для
следующих случаев:
• система не знает о цели поиска пользователя;
• системе известно о цели поиска.
Модель пользователя представляется множеством понятий,
используемых пользователем с определенными весовыми
коэффициентами значимости понятия для пользователя.
С целью определения искомого документа для пользователя в
системе поиска информации используется критериально-экстреми-
зационные механизмы выбора. При этом строится числовая ось, на
которую отображается множество документов ИДБЗ.
Отобразим множество вариантов документов на числовую ось
Ф, т.е. припишем отдельным ее точкам наименования одного или
нескольких документов. Наличие числовой оси позволяет
приписать каждому выбранному документу Dk из Sno число ФМпООк), со~
ответствующее той точке шкалы ф, в которую отображен этот
документ.
Оценка ФМп(^к) определяет меру близости:
j i
9Mn(Dk) = 2wJ2wiJis(Pi,Pj),
j=i i=i
где J — количество понятий, принадлежащих модели пользователя;
I — количество понятий, принадлежащих документу DK; w, —
значимость понятия в модели пользователя; щ — значимость
(близость) понятия к документу; n,s(Pj,Pj) — близость i-ro понятия к
j-му. Чем больше значение ФМп(°к)> тем больше значимость
документа. Полученную шкалу назовем критериальной. Приписанное
документу Dk число ФМпФк) назовем его критериальной оценкой.
218
Таким образом, искомыми документами будет множество
документов, удовлетворяющих условию max(p(Dk), т.е. в выбор искомых
документов включаются варианты, имеющие максимальную
критериальную оценку при сравнении со всеми другими вариантами
документов, принадлежащих МПО.
Оценочная функция <pMn(Dk) используется двумя способами.
1. Использование коэффициентов. Указанный способ предпб-
лагает использование коэффициентов при вычислении отношений
между документами, причем для целевого списка понятий
устанавливается некоторый коэффициент аь а для остальных a2(ai > a2).
Использование коэффициентов позволяет сосредоточиться на
поиске документов, которые близки к понятиям, заданным
пользователем, а также просматривать документы, которые косвенно
связаны с понятиями, определяющими цель поиска.
2. Использование только тех понятий, которые заданы
пользователем для поиска. Указанный способ предполагает рассмотрение
понятий, которые принадлежат только целевому списку понятий.
Использование понятий, заданных целью поиска, позволяет
выделить только те документы, которые связаны с этими
понятиями, и отранжировать эти документы по уровню близости к
требованиям пользователя (на основе модели пользователя).
Для улучшения определения наиболее релевантных документов
необходимо разделить документы МПО на тематические группы.
Выявление группирования документов является одной из задач при
поиске документов, необходимых пользователю.
Для определения группирования документов определяются
следующие свойства групп:
плотность характеризует группу как скопление документов в
пространстве МПО;
дисперсия характеризует степень рассеяния документов в
пространстве относительно центра группы, показывает, насколько
близко друг к другу расположены в семантической сети документы;
размеры определяют количество документов, которые
принадлежат группе.
Выделение групп происходит на основе анализа множества
документов, которые еще не были выданы пользователю. Алгоритм
выделения к групп в пространстве семантической сети ИДБЗ
состоит в следующем:
1. В пространстве семантической сети МПО случайным
образом выделяются к документов. Им присваиваются
соответствующие указатели.
219
2. Для создания предварительных групп документов, близких к
выделенным, используется функция оценки ср.
3. Отыскивается центр каждой образованной группы. Центром
группы является документ, у которого сумма оценочных функций
для каждого документа максимальна.
4. Указатели в каждой группе перемещаются на документ,
являющийся ее центром.
5. Производится проверка, произошло ли изменение
указателей. Если да, то переход к шагу 2, иначе разбиение на группы
завершено.
Приведенный алгоритм требует знания количества групп,
присутствующих в МПО. Для первоначального определения
количества групп используется отклонение документа от центрального
документа в группе и отклонение группы от центральной группы в
пространстве МПО. В качестве характеристики отклонения документа
используется средняя сумма квадратов отклонений от опорного
документа, являющегося центром группы:
Z=j2(tr^-<D'>-1)!)-
где V — среднее отклонение документов в группах; J —
количество созданных групп в МПО; Nj — количество документов в j-й
группе; <pn(Di)— нормализованная оценочная функция близости
документа Ъх:
ф.(°к)-1й2^г2^»1-(Р|^х
где М — количество понятий в центральном (опорном) документе
группы; L — количество понятий в документе Dk.
В качестве характеристики отклонения группы используется
средняя сумма квадратов отклонений от опорной группы,
являющаяся центром групп МПО:
2по42(Фп(Г!)-1J'
где ^ — среднее отклонение групп в МПО; К — количество
образованных групп; (рп(Г\) —нормализованная оценочная функция
близости групп:
220
Mr Lr
mr j=i Lr i=i
где Мг — количество понятий в центральной (опорной) группе;
Lr — количество понятий в группе Гк; w, — средняя значимость j-ro
понятия в центральной группе; щ — средняя значимость i-ro
понятия в группе Гк.
Средняя значимость понятия для группы вычисляется
следующим образом:
1 N
где N — количество документов в группе, включающих j-e понятие.
Характерно, что значение среднего отклонения группы, когда
группа одна, равно нулю, и значение среднего отклонения
документов в группах при количестве групп, равном количеству
документов, также равно нулю. Для значений среднего отклонения
каждой из характеристик формируются граничные условия.
Граничные условия для V в группе:
если к —» N, то V --> О*
если к —> 1, то V -» const = С,
где -» определяет, что к приближается к количеству документов N;
N — количество документов в МПО; к — количество образованных
групп; С — константа-отклонение документов или групп в
пространстве МПО.
Граничные условия для ^ в пространстве МПО:
если к -» N, то V -» const = С,
' JLJTIO '
если к -> 1, то У* -> 0.
' ^по
Если привести графическую интерпретацию Т и Т (рис.
5.2), то точку пересечения графиков можно принять за
первоначальное разбиение пространства на группы.
В дальнейшем, при изменении количества групп в
пространстве, изменяется размер группы и соотношение между группами. Это
221
Рис. 5.2. Изменение отклонения
группы и документов в группе в
зависимости от количества
образованных групп (К —
количество групп, Z — значение
отклонения документа или
группы от центра)
позволит увеличить или уменьшить
выборку из группы необходимых
пользователю документов. Для получения
точки пересечения V и V
используется итерационный алгоритм (рис.
5.3).
После определения начального
количества групп и самих групп
производится начальная выборка
документов по каждой группе, и они
предоставляются на выбор пользователю.
В результате окончательного выбора
пользователя определяется
принадлежность выбранного документа
группе и используется оценочная функция для выбора документов из
группы.
Изменение количества образованных групп производится в
зависимости от размера выбранной группы. Если количество
документов в группе очень велико, то для уменьшения объема группы
увеличивается количество групп в МПО. Если количество
документов в группе очень мало, то для увеличения объема группы
уменьшается количество групп в МПО. Это позволяет более гибко
влиять на выбор пользователя.
Программная реализация системы поиска информации [81].
Программная реализация включает в себя: собственно систему поиска
информации, подсистему приобретения знаний и подсистему
организации ИДБЗ, перечень основных задач, решаемых системой
поиска информации и подсистемой приобретения знаний.
Для создания системы поиска информации можно
использовать по известному опыту следующие технические средства:
рабочая станция — компьютер Pentium 166, с 32 Мбайтами памяти и
установленной операционной системой Microsoft Windows NT 4.0;
сервер — компьютер Pentium II — 233, с 128 Мбайт памяти и
установленными системами Microsoft Windows NT 4.0 Server и
Microsoft SQL-Server 6.5.
Программа может быть написана для функционирования в
среде Windows 95/NT 4.0. Необходимым элементом работы системы
является наличие сервера Windows NT 4.0 с установленным
программным средством Microsoft SQL-Server 6.5.
222
С Начало }
—*—
Определение начального
разбиения (к=1)
_
'
г
Увеличение начального 1
разбиения (к=к+1)
¦
Определение к
групп
*
Вычисление Ег и Епо
Нет ^<J
^х^^^ "Т
^no^>
f Да
Присваивание количеству 1
разбиений предыдущего
значения (k=k-l)
¦
( Конец )
В качестве инструментальных средств
проектирования и разработки
исследовательского прототипа системы поиска
информации в ИДБЗ можно
использовать пакет Microsoft Visual Studio 6.0. В
качестве основного языка
программирования, в частности, можно
применить язык объектно-ориентированного
программирования Microsoft Visual
C++ 6.0 [80,81].
Для организации доступа к
удаленным базам данных используется
стандартный интерфейс ODBC (Open
Database Connectivity). Он позволяет
организовать обращение к различным
источникам локальных и серверных
данных (dBase, FoxPro, Oracle, MS
SQL-Server).
Практическая реализация системы
поиска информации позволяет решать
следующие задачи:
• выявлять наиболее важные
документы из представленных в
информационно-документальной базе знаний;
• выдавать тематическую подборку
документов по запросу пользователя;
• определять последовательность выдачи искомых документов
для пользователя.
Интеллектуализация проектно-конструкторской деятельности.
Решения конструкторских задач на ранних стадиях проектирования
строятся в условиях значительной неопределенности как исходных
данных, так и проектных критериев. Необходимый при этом учет
влияния качественных факторов предполагает использование
различных форм внелогических знаний конструктора (интуиции,
конструкторского видения, озарения и др.). Это, в свою очередь,
требует пересмотра многих традиционно сложившихся представлений
в сторону их большей формализации.
Применительно к выполнению процедур поискового
конструирования рассмотрим концептуальную схему человекомашинного
взаимодействия, представляемую в виде двух моделей:
процедурно-кибернетической модели проектно-конструкторской деятельно-
223
Рис. 5.3. Алгоритм определения
начального количества групп в
МПО
Процедурно-кибернетическая
модель процесса ПКД
Стадии ПКД
Преобразовательные
процедуры
Логически
завершенные
операции
ч- Поисковые
действия
а.б.
в.гд.
А
Б
В
Инженерно-
психологическая
модель
принятия
оперативных
решений
Рис. 5.4. Взаимодействие моделей профессиональной деятельности:
1,2,3 — функциональные этапы преобразовательной деятельности при решении задач
поискового конструирования; а, б, в, г, д — интеллектуальные поддержки поисковых действий (а —
указатели стратегии, тактики ПКД и семантической обратной связи; б — мнемоническая схема
выполнения поисковых действий; в — содержательные характеристики разрешаемой проблемной
ситуации; г — гистограммы выполняемой поисковой операции; д — текущие значения
параметров «входа» и соответствующие им характеристики «выхода»); А, Б, В — вспомогательная
информация, поддерживающая процедуры ассоциативного переноса (А — статическая, Б —
кинематическая, В — динамическая составляющие информационного содержания разрешаемой
проблемной ситуации)
сти (ПКД) и инженерно-психологической модели принятия
оперативных решений (рис. 5.4). Взаимодействие этих моделей
осуществляется посредством поэтапного «наложения» модели принятия
оперативных решений на «канву» профессиональной деятельности
конструктора [82].
Процедурно-кибернетическая модель ПКД. По функциональному
признаку процедурно-кибернетическая модель, представляющая
собой 16 этапов поискового процесса, разделяется на две
взаимосвязанные подсистемы: «Порождение» и «Выбор» (рис. 5.5).
Подсистема «Порождение» предназначена для сопровождения и
информационного обслуживания процедур внелогического
порождения множества приемлемых альтернатив. Подсистема «Вы-
224
Структурная диаграмма проектно-конструкторской деятельности (ПКД)
Подсистема «Порождение»
Подсистема «Выбор»
ПТ
G
ПО-|
ипс
ОИБЗ
ид
УС
НБНО
10
11
12
13
14
15
16
;ССВ
U мк
БИК
ТТО
Настройка A, 2, 3)
УТ
МКРБ
УС
ОС
п пп
WMBA
Корректировка
количественных
ограничений
Изменение качественных значений
U ПО
ММПВ
ИОП
лп Ц
«в»
ППР
Нммв
ЛП, W, Y:
Нмэв
w иН
Н дк
нрвр
ПР
I Корректировка
Изменение
W:
t, Г, S, р
Рис. 5.5. «Эворитм» репродуктивной деятельности:
1-16 - функциональные этапы процесса ПКД; ТТТ - тактико-технические требования; ПО ИПС - предметно-ориентируемая информацион-
но-поиск^^ база знаний; ИД-исходные данные; УС-указатель «Ч^п^ВД
ССВ-сГ^ма селекции вариантов; БНО - блок начальной оптимизации; МКТС-матрица ™^
ТТО - таблица технологических офаничений; БИК - базовые информационные карты; УТ - указатель «тактики» ПКД, КРБ - ™™"ми"
расчетный блок; УСОС - указатели семантической обратной связи; ПП МВА - процедура порождения множества возмо^^
МПВ - процед^а отбора множества приемлемых вариантов; ИОП - информация об опыте прошлого; ЛП «в» - ^нгвисти^ая переменная
«Величина»; ППР - промежуточное принятое решение; ММВ - матрица многокритериального выбора; МЭВ -множество эффективных вари-
нятое решение; * - индикатор выполняемой операции; Wj - компоненты вектора предпочтений; Y, - параметры сопоставления, t, г, s, p - ко
эффициенты дополнительных критериев
бор» — для выполнения операций, связанных с
многокритериальным выбором рационального варианта. На этапах, представляющих
собой «ключевые точки» (на рис. 5.5 обозначены удлиненными
прямоугольниками), пользователю предъявляется ориентирующая
информация, играющая роль интеллектуальных поддержек. На
этапах, обозначенных прямоугольниками с двойными линиями, с
помощью автоматизированной системы осуществляется
управление процессом решения конкретной конструкторской задачи.
Мнемоническая схема поисковой деятельности
Как?
На сколько?
Ситуация
(I)
s
X
о
У
л
X
го
&
О
Что?
Цель
Средство
Результат
Проблема
(И)
QQ
Проблемная
ситуация
(III)
s
X а
ас
03
Информационное поле РПС
Вход
ПУ
ПС
Выход
1
УСОС
Э L ЛЭ
тзхпхп|
УТ
пц
ПУ
к
ПС
УС
пц
г
ид
Информационное
поле СУПР
Столбиковая
диаграмма РПС
га
Операционное поле
выполненной
информации
Рис. 5.6 Информационные поддержки комбинаторной деятельности:
I, II, III — типы интуиции. ПЦ — параметры цели; ПУ — параметры управления; ПС —
параметры состояния; ИД — исходные данные; С„ — n-я «стратегия» (преобразовательной
деятельности); Э — эффективность (удовлетворения ТЗ); ТТЗ — требования технического задания;
X — порядковый номер операции; 1 — 6 — указатель последовательности выполнения
оперативных действий; Yj— характеристики анализируемого варианта решения; ПКР — проект-
но-конструкторское решение; РПС — разрешаемая проблемная ситуация; СУПР — система
управления поиском решения; L — показатель потерь
226
Ассоциативная информация
Поясняющая
(динамическая)
Дополняющая
(кинематическая)
Уточняющая
(статическая)
Диаграмма измерения
характеристик РПС
Ортогональная
Структура ВП
Матрица KTC
(const)
Качествен-
Качественные ограни- ные оценки
чения КТС ПКР
—
тто
-
-
-
—
ж
БИК
Корректировка
значений ЛП
| > | < | =
Рис. 5.7. Вспомогательная информация продуктивной деятельности:
КТС — конструктивно-технологическая ситуация; ВП — вектор предпочтений; TTO — таблица
технологических ограничений (остальные обозначения см. на рис. 5.4—5.6)
Инженерно-психологическая модель принятия оперативных
решений. Инженерно-психологическая модель также по
функциональному признаку подразделяется на три процедурно различных
уровня преобразовательной деятельности (рис. 5.5, 5.6, 5.7).
Первому — репродуктивному уровню преобразовательной
деятельности в ЭВМ соответствует так называемая процедурная
диаграмма (обобщенный эвроритм поискового процесса) в виде 16
этапов (см. рис. 5.5), на которых определяются локальные цели,
средства их достижения, последовательность и содержание
поисковых действий. Таким образом, с помощью ЭВМ осуществляется
«нежесткое» управление неформальными действиями
конструктора путем предъявления ему различных видов
структурно-упорядоченной информации, играющей роль «четких смысловых опор».
Состав этой информации меняется на каждом шаге поискового
процесса в зависимости от характера возникающих проблемных
ситуаций.
15*
227
Второму — комбинаторному уровню преобразовательной
деятельности соответствует «картина», представленная на рис. 5.6. Эта
«ответная деталь» ЭВМ привлекается в тех случаях, когда
трудности получения оперативного решения на том или ином «шаге»
поискового процесса превышают возможности репродуктивного вида
деятельности человека-конструктора. В целях преодоления этих
трудностей ему предоставляется более широкий набор
вспомогательных средств, с помощью которых обеспечивается необходимый
«информационный комфорт». Конструктору предъявляется пять
интеллектуальных поддержек:
• формальные указатели стратегии ПКД, тактики ПКД и
семантической обратной связи, объединенные в специальную
систему управления поиском решения (СУПР);
• специальная мнемоническая схема выполнения поисковых
действий, с помощью которой упорядочивается структурный состав
интуитивно-логических вмешательств и устанавливается
ориентировочная последовательность неформальных операций,
осуществляемых на каждом «шаге» многоциклового поискового процесса;
• содержательные характеристики разрешаемой проблемной
ситуации, представляемые в понятийно-структурированной форме,
соответствующей потребностям используемых типов интуиции, а
также значения изменяемых параметров, их взаимосвязи и
отношения, которые для рассматриваемой проектно-конструкторской
задачи (ПКЗ) являются ключевыми;
• гистограмма выполняемой операции, с помощью которой в
наглядно-образной форме представляется абсолютный уровень
многопараметрических рассогласований ТЗ — ПКР и степень их
относительного изменения после каждого неформального
вмешательства;
• специальное окно, с помощью которого значения параметров
управления («входа») и соответствующие им значения параметров
состояния («выхода») отображаются на одном информационном
поле «выход — вход». Тем самым обеспечиваются благоприятные
условия для визуально-семантического сопоставления степени
влияния конкретных поисковых действий на конечный результат.
Последняя пятая форма интеллектуального подкрепления в ряде
случаев может оказаться весьма действенной, так как благодаря
функциональному объединению «входа» и «выхода» реализуется
возможность использования механизма визуальной координации
моторно-поисковых действий конструктора — его биологической
228
обратной связи. С помощью этого механизма, путем практической
наработки неформальных умений и навыков могут быть
определены субъективные значения так называемых коэффициентов
влияния, которые характеризуют «эффективность» применяемых
управляющих воздействий.
На рис. 5.6 цифрами I, II, III обозначены три вида
агрегированной информации, структурное содержание которой ориентировано
на формирование соответствующих типов интуиции (утверждение,
предсказание и инсайт). Рекомендуемая ЭВМ очередность
выполнения поисковых действий, изменяющаяся на каждом шаге ПКД в
соответствии с характером разрешаемой проблемной ситуации, на
рис. 5.6 указана арабскими цифрами. В целом, рассмотренные
выше пять форм интеллектуального сопровождения процедур
поискового конструирования способствуют ориентировке
человека-конструктора в проблемной среде, обеспечивают возможность
получения им необходимых для решения данной ПКЗ
неформальных умений и стимулируют их рациональное использование.
Третьему — продуктивному уровню преобразовательной
деятельности отвечает «картина», представленная на рис.5.7. Данный
тип интеллектуальной поддержки необходим в тех случаях, когда
обнаруживается неадекватность или отсутствие готовых схем
интуитивно-логической обработки нечеткой информации,
имеющейся в распоряжении ЭВМ. В этих случаях конструктору
предъявляется вспомогательная информация, характеризующая разрешаемую
проблемную ситуацию с трех различных сторон: динамическая,
кинематическая и статическая. Путем ассоциативных переносов,
аналогий и других неформальных преобразований вспомогательной
информации (уточняющей, дополняющей и поясняющей) (рис.
5.7) он устанавливает неизвестные ранее функциональные связи и
порождает новое информационное содержание.
В целом рассмотренные типы интеллектуальных поддержек
ориентированы на работу трех мыслительных механизмов,
используемых человеком-конструктором в процессе его
преобразовательной деятельности: дедуктивного, биноминального и индуктивного.
В результате взаимодействия этих механизмов происходит
функциональное объединение содержательных знаний об объекте с
процедурными (как логическими, так и внелогическими) знаниями о
способах его преобразования. Иными словами, осуществляется
синтез знаний с возникновением нового качества, которое, в силу
проявления свойств системности, не равно простой сумме их
элементного состава [83].
229
Модель многокритериального выбора в условиях неопределенности.
При решении задач поискового конструирования конструктор
имеет дело с формально неопределенными связями, неметрическими
признаками, качественными критериями, а зачастую и с
неформальным описанием требований технического задания (ТЗ).
Наличие в таких задачах подобного рода неопределенностей ведет к
необходимости их формального учета и в проектных критериях.
Если поиск рационального проектно-конструкторского
решения (ПКР) ведется в условиях неопределенности, то нет смысла
точно фиксировать окончательную цель. В соответствии с этим,
формальное описание цели ТЗ, параметров разрешаемой
проблемной ситуации, а также значений качественных факторов,
выражаемых в терминах цели, можно представить в виде нечетко
определенных предпочтений. Например:
Ремонтопригодность — «НЕ ОЧЕНЬ ВЫСОКАЯ»,
Технологичность — «НИЗКАЯ».
С целью формализации процедур выбора, связанных с
неколичественными измерениями на базе нечетких множеств [84, 85],
используются специальные функции принадлежности и на их основе
вводятся лингвистические переменные, которые в наиболее
естественной для конструктора форме отражают особенности его
неформальных предпочтений и в то же время являются точными
операндами для расчета на ЭВМ.
Каждый из записанных на естественном языке нечетких
терминов (обозначаемых в дальнейшем А) может быть представлен в виде
A = /|iA<y)/dy,
и
где А — нечеткое множество элементов U области рассуждений; цА,
U [0;1] —функция принадлежности, связывающая с каждым
элементом у из U число jLL(y) в интервале [0;1], которое и представляет
собой степень принадлежности к А.
Применение лингвистических переменных для описания
неформальных элементов, встречающихся в процессе решения проект-
но-конструкторской задачи (ПКЗ), обусловлено еще и тем, что
размытость (расплывчатость) свойственна самой сущности процессов
восприятия, воспроизведения и переработки информации
человеком-конструктором. Конструктору легче формулировать свое
мнение расплывчато, и нечеткая оценка в большинстве случаев
оказывается более адекватной реальной действительности, чем четкая.
Если требуется найти решение, экстремизирующее все частные
критерии (составляющие многокомпонентного ТЗ), то необходимо
230
рассматривать векторный критерий оптимальности. Как известно,
точная оптимизация векторного функционала недостижима [86].
Единственным объективным фактором, характеризующим
проблему векторной оптимизации (в рамках того субъективизма, который
связан с выбором самих локальных критериев), является наличие
области Парето в пространстве критериев и существование
парето-оптимальных решений. Область Парето (область компромиссов)
ограничивает возможный выбор проектных решений. Для выбора
ПКР из множества парето-оптимальных решений необходим ввод
в рассмотрение дополнительных критериев.
В настоящее время основными группами методов при решении
задач векторной оптимизации являются:
• оптимизация последовательности скалярных (локальных,
частных) критериев при введении приоритетов и назначении
последовательных уступок;
• оптимизация в целях выделения парето-оптимальных решений;
• оптимизация, в смысле близости решения к некоторому
идеальному значению;
• оптимизация на основе компромиссных соотношений,
например путем введения весовых коэффициентов или
использования пороговой оптимизации.
Эти группы методов различаются степенью дополнительной
информации, которую необходимо получить от конструктора для
проведения оптимизации, а также сложностью вьиислительных
процедур, предназначенных для обработки этой информации.
Наиболее распространенным способом скаляризации является
взвешенная сумма частных критериев
F(x) =
|)(wjfj(x))k
Li=l
1/k
при k=l,..., N,
где Wj — весовой коэффициент j-го критерия; п — количество
частных критериев; fj (x) — линейное преобразование частных критериев
У,(х), связанное с нормированием и переносом начала координат.
Функция полезности рассматривается в виде взвешенной
суммы разности показателей, отражающих фактическое состояние
ПКР и требований ТЗ
231
где Wj — весовой коэффициент j-ro требования ТЗ; п — количество
требований ТЗ; t^ = А?3 -Ау —частный критерий
эффективности, характеризующий относительное отклонение показателей
ПКР от требований ТЗ.
Типовая последовательность расчетных процедур
многокритериального выбора представляется в следующем виде [87]:
1. Устанавливается ранг модели Y = F(X), (m + n), где YjG = 1,
..., n) — множество частных критериев; Xi(i = 1, ..., m) — множество
альтернатив.
2. Исходя из опыта прошлого и среднестатистических
представлений лиц, принимающих решения, устанавливаются приемлемые
значения функций принадлежности ц(у) и формируется
структурное содержание лингвистических переменных.
3. Определяются весовые коэффициенты частных критериев Wj.
4. Формируется матрица многокритериального выбора (табл. 5.1).
Таблица 5.1. Матрица многокритериального выбора
Альтернативы
ПКРОД
X,
х2
Х3
...
¦Х-щ
W|
Характеристики 00
количественные
Y,
In
hi
tn
'ml
W,
Y2
111
In
In
...
1ml
W2
Y3
/w
hi
/зз
*m3
W3
качественные
Y,
lu
In
I»
Ал4
W4
Yn
tin
tin
iin
'mn
Wn
Потери
абсолютные
L,
Li
U
и
Un
взвешенные
LT
L'
|W
3
Lw
Вводятся требования альтернативных ТЗ (АТЗ), а также
качественные и количественные характеристики альтернатив ({Ay}, i = 1,
..., m, j = 1,..., п), определяемые либо на этапе порождения, либо с
помощью экспертного опроса.
5. Производится линейное преобразование частных критериев,
имеющих количественный характер. Нормированные значения
количественных характеристик определяются из соотношения
Mj = l Mj ~~ *minjj/l Ymaxj ^minjjj
где^
Yij — нормированное значение j-ro критерия i-ro варианта;
Yy — абсолютное значение j-ro критерия i-ro варианта;
232
Yminj — минимальное значение j-го критерия;
Ymaxj — максимальное значение j-ro критерия.
6. Определяются нормированные рассогласования j-й
характеристики i-ro варианта с требованиями ТЗ:
/ij=Aj3-Aij=|HAj3(y)-tiAij(y)|.
Для j = 1, ... п имеем следующее:
?{ =l/2Fmax{|fAT3FAT3 -fA РА4|-К(цАтз -ЦА,J +
+0i^(y)-H^(y)J]1/2[2Fmax -(fAT3FAT3 +fA FAi)]},
где
fa„9A{ =[ц^т?А|]/1— нормированный показатель нечеткости
функции принадлежности;
Fmax = М^У)** У "^ = 1 — параметр максимальной
неопределенности;
FAT3, Aj = Aj = /цАтз, Aj (y)dy — показатель неопределенности
о
параметров Атз и Ai;
\i Атз, Aj = у %, Ai — моды площадей F тз А;
A,J,A>
Цдтз,А1 — ординаты центров тяжести (ЦТ) площадей FaT3 A,Aj,
(рис. 5.8).
Рис. 5.8. Графическая иллюстрация к построению метрики потерь
233
7. Определяются суммарные взвешенные потери:
j=l
8. После ряда преобразований получим для Vi (i= l,...,m)
определение уровня относительной неопределенности А*:
Д>=Н4/Ь?,
где
п
Hi = 2wj^u ~~ неопределенная часть рассогласований;
п
Lf = У*>?^д* —детерминированная часть рассогласований.
j=i
9. Согласно методике [97], выделяется множество эффективных
ПКР из условий: (L? = Ц)min < (L? = Hj); (L?) min = min L?.
Дальнейший выбор рационального ПКР производится на
основе праксеологического анализа структуры дополнительных
критериев [88].
5.2. Методы интеллектуальных технологий
в управлении техническими системами
На современном этапе развития общества в условиях роста нау-
коемкости техники и технологии потребность в их
информационном обеспечении особенно велика. Этим объясняется широкое
внедрение в практику научных исследований и промышленного
производства информационных и экспертных систем, систем
поддержки принятия решений, систем автоматизированного
проектирования управления производством, т.е. всего комплекса методов,
программных и технических средств, объединяемых понятием
«новые информационные технологии».
В последнее время с ростом сложности решаемых задач все
большее распространение получают так называемые интеллекту-
альные технологии (ИТ). Традиционно к их числу относят нечеткую
логику (НЛ), генетические алгоритмы (ГА) и нейронные сети (НС).
Эти технологии нашли широкое применение в распознавании
образов и речи, в системах поддержки принятия решений в условиях
234
неопределенной исходной информации, в задачах поиска при
плохо формализованных параметрах.
Широкие возможности для использования ИТ открываются
при создании сложных систем управления. Современное
устройство управления должно обеспечивать надежное управление
объектом в разных режимах его работы, быть устойчивым как к резким
изменениям, так и деградации параметров системы управления,
учитывать возможное наличие шумов и внешних предусмотренных
и непредвиденных влияний и, наконец, должно обеспечивать
легкую адаптацию к новым объектам управления в случае их замены.
Многие задачи управления аналогичны задачам, решаемым с
помощью ИТ, что в значительной степени определяет
перспективность их использования при проектировании систем управления.
Успех практического применения методов ИТ определяется не
только их эффективностью, но и наличием комплекса
инструментальных средств, поддерживающих процесс разработки систем
управления.
Основные ИТ, включая НЛ, ГА и НС, могут эффективно
использоваться при создании систем управления. При этом
целесообразность их использования определяется:
1) способностью реализовывать распределенные схемы
выполнения вычислений, что позволяет расширить пространство поиска
без значительного увеличения времени и сложности необходимых
вычислений;
2) возможностью описания процессов управления средствами
простого, близкого к естественному языка;
3) возможностью неаналитического представления нелинейных
объектов управления и описания процессов, характеризующихся
неоднозначностью и большим количеством особых ситуаций;
4) способностью осуществлять интеллектуальный поиск в
пространстве решений плохо формализованных задач.
Исследование требований, предъявляемых системами
управления к используемым при их создании методам, позволило
сформулировать направления совершенствования ИТ, расширяющих
возможности их применения в системах управления. Среди них
можно выделить следующие:
1) разработка подхода к использованию НЛ в задачах
управления, позволяющего с единых позиций формально описывать
широкий класс нечетких систем управления и адаптации;
2) разработка новых генетических операторов, дающих
возможность представлять хромосомы непосредственно в виде векторов
вещественных параметров; разработка динамических ГА, обеспечи-
235
Методы ИТ
/ |
ЛъЛ-
Ча^
f
Регулятор h
к
¦L^-
ч
Объект
управления!
Рис. 5.9. Гибридная адаптивная система управления
вающих поиск в реальном масштабе времени вещественных
параметров, изменяющихся во времени объектов;
3) разработка процедуры настройки параметров нейронных
сетей на основе использования ГА, позволяющей расширить сферу
применения нейронных сетей в системах управления за счет
снижения уровня требований к параметрам функционирования сети.
Для обеспечения гибкости использования НЛ при решении
задач автоматического управления рассмотрим подход к
формальному описанию широкого класса нечетких систем управления на
основе структурного представления алгоритма управления и
адаптации. Такой подход также позволяет интегрировать различные
методы ИТ в единое целое (рис. 5.9).
В процессе разработки нечетких алгоритмов (НА) управления
часто возникает ситуация, когда несогласованность правил,
формирующих НА, приводит к потере значимости реакции такого
алгоритма при увеличении числа правил, участвующих в выводе (рис.
5.10).
Критерий оценки непротиворечивости задаваемых экспертом
правил, сформулированный для нечеткой подсистемы с одним
входом, известен как интерполяционный принцип.
Рассмотрим интерполяционный принцип для системы с двумя
входами, описываемый следующей теоремой [89].
Теорема. В случае нечеткого правила (Xi ,Yi)=>Zi и нечеткой
посылки (Х2, Y2) алгоритм A={(Yk ,Yk)=>Zk}, k = 1,2, является
интерполяционным (непротиворечивым), если выполняется
следующее условие: Z2 С Z2 CZ2, где
Z = Z1fl(X1«X2)A(Y1oY2)t
и {[УСх{А2х{)]А[\/Aу}А2у})]}<1гк9
^^{[yOXiA'xjMAlyOyjA^jM^Zk.
236
z2HI2zk||=
Нечеткие правила посылки
i
LN N Z P LP
R,:(X,xYz)
R2(XLNxYLP)uR,U(XLPxYLN)
I
LN N Z P LP
R3(XLNxYLP)uR2U(XLPxYLN)
LN N Z P LP
y\/\^k/v
Рис. 5.10. Пояснения к нечетким алгоритмам управления
Здесь Z2 и Z2 — соответственно нижняя и верхняя границы
вновь вводимого правила.
Сформулированный выше критерий оценки
непротиворечивости нечетких алгоритмов накладывает очень жесткие ограничения
на заключения вновь вводимых правил, в то время как во многих
практических применениях допустимо некоторое отклонение от
интерполяционности.
Формально интерполяционный алгоритм соответствует матрице
отношения R, являющейся решением системы уравнений вида
X1oR = Y1
XkoR:
lk>
которое не всегда существует.
Для приближенного решения системы уравнений, задающих
матрице R нечеткого отношения, Негойце предложил использовать
генетический алгоритм, допустив малые изменения входных
посылок. Однако не только нечеткие посылки, но и нечеткие
заключения вводимых правил являются формой представления знаний
эксперта и, следовательно, в определенной степени могут быть изме-
237
нены. Поэтому при использовании ГА для нахождения матрицы
нечеткого отношения допускаются небольшие изменения как
посылок, так и заключений нечетких правил. Изложенный подход
позволяет получить НА, дающий меньшее суммарное
рассогласование по сравнению с другими методами получения матрицы
нечеткого отношения.
Применение ГА в адаптивных системах управления
сдерживается тем, что существующие ГА используют бинарное кодирование
вещественных хромосом, что усложняет обработку вещественной
информации.
Для поиска квазиоптимального решения в пространстве
вещественных чисел предложено использовать представление хромосом
непосредственно в виде вектора вещественных чисел. Такое
кодирование требует соответствующего определения генетических
операторов скрещивания и мутации.
В связи с этим для вещественного кодирования хромосом
вводится операция линейного скрещивания, при которой потомки
находятся на линии, соединяющей точки, соответствующие
родителям. Кроме этого вводится операция нормально-линейного
вещественного скрещивания, которая является разновидностью
линейного скрещивания с определением позиции потомков на линии,
соединяющей родителей, в соответствии с нормальным законом
распределениям (рис. 5.11).
Процедура нормальной вещественной мутации, введенная для
случая вещественных хромосом, отличается от бинарной тем, что
здесь изменяются не гены в хромосоме, а вся хромосома в целом.
Конкретная позиция точки пространства поиска, соответствующая
измененной хромосоме, определяется в соответствии с
нормальным законом распределения.
Нормально-линейное Нормальная
вещественное скрещивание вещественная мутация
Рис. 5.11. Графическая интерпретация линейного скрещивания
238
Введенные генетические операции нормально-линейного
вещественного скрещивания и нормальной вещественной мутации,
позволяют разрабатывать ГА, обеспечивающий адекватный поиск в
пространстве вещественных чисел.
Генетический алгоритм представляет собой многократно
повторяющийся процесс выбора родителей из популяции, применения к
ним процедур скрещивания и мутации и, наконец, помещения
получаемых потомков в популяцию. Признаком окончания работы
ГА является выполнения некоторого условия, связанного с
достижением точности нахождения искомых параметров, которые не
зависят от времени. Однако в большинстве задач управления
параметры исследуемых систем изменяются во времени. Для того чтобы
использовать ГА в таких ситуациях, следует использовать новый
тип ГА — динамические ГА, которые функционируют одновременно
с работой самой системы управления (рис. 5.12).
Использование динамических ГА с вещественным
кодированием хромосом позволяет организовать процедуру поиска параметров
динамических объектов, в том числе и процесс идентификации
параметров объекта управления.
Одним из направлений развития методов ИТ является принцип
обучения НС, позволяющий снизить уровень сложности ее
практической реализации.
Проектирование НС заключается в задании ее топологии и
определении ее параметров на основе обучающей
последовательности. Обычно используемая градиентная процедура обучения
(например, метод обратного распространения ошибки) накладывает
жесткие ограничения на способ функционирования сети. Для
расширения возможностей применения НС в устройствах управления
и их практической реализации можно использовать генетический
Временная шкала
к-2 к-1 к изменения параметров
• • • »
III Временная шкала
т Т т выполнения ГА
7"\""/\' "
1. Выбор 1. Получение новых параметров
2. Скрещивание 2. Изменение целевой функции
3. Мутация 3. Вычисление новых значений
4. Замещение жизнеспособности всех хромосом
Рис. 5.12. Динамика генетического алгоритма
239
способ определения параметров НС. Здесь веса связей и величины
порогов являются генами хромосом, а целевая функция
определяется рассогласованием желаемых и получаемых реакций
проектируемой НС. Генетический способ обучения позволяет использовать
сеть с неполносвязанной структурой, применять недифференци-
руемые энергетические функции и использовать целочисленные или
заданные диапазоном значений веса связей и величины порогов.
Формализация основных методов ИТ позволяет при
проектировании устройств управления использовать их в самых
различных сочетаниях. Если существующие методы ИТ представить как
вершины методологического треугольника, то стороны этой
фигуры будут соответствовать различным их комбинациям: НЛ+ГА,
НЛ+НС и НС+ГА. Центр треугольника соответствует
объединению всех трех базовых методов в единое целое: НЛ+ГА+НС (рис.
5.13). Комбинация НЛ+ГА нашла широкое использование в
системах поддержки принимаемых решений. Примером
использования комбинации НЛ+НС является нейро-нечеткий подход к
проектированию нечетких алгоритмов. Большие перспективы сулит
объединение НС+ГА, так как эти методы взаимно дополняют
друг друга.
Схема гибридной адаптивной системы управления (ГАСУ). Она
использует в своем составе как классические подходы, так и
методы интеллектуальных технологий. Основу схемы (рис. 5.14)
составляет традиционная система правления, состоящая из объекта
управления Р и четкого контроллера С (например, PI- или PID-конт-
роллер). Параметры контроллера С содержатся в таблице Т. Кроме
блоков реальной системы управления в состав предложенной
схемы входит ее модель, состоящая из блока С, моделирующего
контроллер С, и блока Р, моделирующего объект управления Р.
Структура модели идентична структуре реальной системы. В
процессе моделирования параметры модели С и реального контролле-
ГА+НС
Рис. 5.13. Сочетание основных методов информационных технологий
240
У
FC
e'l
У
Рис. 5.14. Схема гибридной адаптивной системы управления
ра С совпадают, что обеспечивается использованием общей
таблицы параметров Т. Адекватность реального устройства управления Р
и его модели Р" поддерживается схемой идентификации I.
Исходной информацией для блока идентификации является
последовательность вход-выходных пар {uk, yk}, где yk — выход блока
обработки информации, снимаемой с объекта управления.
Моделирование производится на входном сигнале г', имеющем вид
единичной ступеньки, что позволяет содержательно интерпретировать
возникающий на выходе модели переходный процесс у'. Его
параметры используются для определения рассогласования между
контроллером и объектом управления и последующей коррекции их
параметров. Процесс коррекции осуществляется блоком V,
который определят параметры сигнала у', и блоком FC, производящим
коррекцию параметров управления в таблице Т, с использованием
нечеткого алгоритма на основе информации о виде переходного
процесса у'.
Процедура предварительной обработки информации.
Предварительная обработка информации в предложенной схеме
выполняется для учета плохой селективности используемых датчиков и
возможных помех. Эту задачу можно представить как проблему
аппроксимации функции нескольких переменных. В настоящее
время для ее решения наиболее широко используются метод
табулирования и аппроксимация с помощью полиномов.
Метод табулирования функции характеризуется большим
объемом памяти, необходимой для хранения и передачи калибровочной
характеристики. В случае аппроксимации функций двух и более
16 — 3466 241
переменных потребности в памяти многократно увеличиваются.
Без дополнительного промежуточного сглаживания метод сильно
зависит от возможных помех.
Аппроксимация с помощью полиномов характеризуется
высокой вычислительной сложностью, отсутствием простой методики
аппроксимации функции двух и более переменных, недостаточной
гибкостью в выборе вида аппроксимирующего многочлена.
Для преодоления указанных недостатков рассмотренных
методов используют метод построения аппроксимирующих нечетких
алгоритмов. В этом случае задача аппроксимации ставится следую-
щим образом: по известному набору точек {Хк, YK}, k= l,n,
отвечающих неизвестной функции f: S -> D, где S и D состоят
соответственно из п и m соединенных интервалов:
n m
s = U(si-i'si)iD=L)(di-i»4
i=l i=l
построить отношение R: SxD -> [0,1], наилучшим образом
удовлетворяющее последовательности точек {Xk, yk}.
Выполняемая процедура преобразования имеет следующий вид:
1. Входное значение х преобразуется в нечеткое множество X на
основе следующего соотношения:
MSt) =
-м
xefSj-E^j +Е],
п в остальных случаях
2. Выполняется нечеткое преобразование с помощью
полученной в ходе процесса калибровки матрицы нечеткого отношения:
Y = XoR
3. С помощью процедуры дефазификации нечеткое множество
заключения Y преобразуется в выходную величину у.
Матрица нечеткого отношения R строится на парах {хк, ук} как
на правилах, с использованием генетической процедуры подбора
элементов.
Исследования показывают, что особенно хорошие результаты
метод дает при аппроксимации функций, сильно искаженных
шумом. Однако для аппроксимации функций двух и более
переменных этот метод требует изменений.
В связи с этим рекомендуется процедура обработки
информации, основанная на использовании искусственных НС. Для
обеспечения простоты аппаратной реализации НС ее обучение предло-
242
жено проводить с помощью генетической процедуры.
Использование НС допускает простой переход к решению задачи
аппроксимации функций двух и более переменных. Изменение количества
переменных влияет только на количество нейронов на входном
уровне, не меняя ни способа вычисления реакции сети, ни процедуры
ее обучения.
Алгоритм идентификации на основе ГА. Использование
динамических ГА с вещественными хромосомами позволяет реализовать
процедуру идентификации параметров объекта управления в
реальном масштабе времени. В качестве целевой функции можно
использовать различные меры близости, в частности хеммингово
расстояние между последовательностями значений выходной
переменной у реального устройства управления и вычисленной
последовательностью значений переменной / на i-м временном
отсчете. Форма целевой функции, заданной таким образом, имеет
ярко выраженный горб и неярко выраженный экстремум на нем
(рис. 5.15).
Для учета такой формы целевой функции в используемом для
идентификации ГА применяются генетические процедуры
нормально-линейного вещественного скрещивания и нормальной
вещественной мутации. Изменение формы целевой функции во
времени учитывается динамическим генетическим алгоритмом.
Моделирование процесса идентификации на основе ГА
показало, что:
1) процесс идентификации проходит успешно при резком
изменении внутренних параметров объекта управления. Качество
идентификации не зависит от входного воздействия;
2) при деградации одного из параметров объекта идентификация
проходит успешно только при входном воздействии,
поддерживающем в системе управления непрерывный переходный процесс.
Сравнение результатов идентификации на основе методов ИТ с
результатами, которые дают
традиционные подходы к идентификации
динамических объектов, показало, что
предлагаемый подход, проигрывая
традиционным методам в точности
определения параметров динамического
объекта, имеет преимущества в
системах управления, функционирующих в
реальном времени, и требует
существенно МеНЬШИХ ВЫЧИСЛИТелЬНЫХ За- Рис. 5.15. Форма целевой функ-
Трат. ции в алгоритме идентификации
16*
243
Нечеткий алгоритм коррекции параметров регулятора.
Основной задачей, решаемой на уровне адаптации системы
рассматриваемого типа, является коррекция параметров активного
контроллера на основе информации о характеристиках переходного
процесса, возникающего в модели при подаче на нее тестового
единичного воздействия. Возможна реализация этой процедуры на
основе нечеткой системы принятия решений, входными
воздействиями которой являются величина перерегулирования а и
относительное время нарастания т. Система содержит еще один вход, который
позволяет внешнему наблюдателю задавать степень своего доверия
решениям, принимаемым адаптивной системой. Предполагается,
что наблюдатель задает степень доверия а в виде числа из
диапазона 0-100%, а также степень уверенности в своей оценке р. Выходы
нечеткой системы — нечеткие значения коэффициентов коррекции
параметров регулятора, которые подаются на вход блока дефазифи-
кации (рис. 5.16).
Результаты моделирования показывают, что предложенная
гибридная система управления с адаптацией более устойчива к
значительным изменениям условий функционирования по сравнению с
классическим контроллером. Кроме того, алгоритмы коррекции
параметров используемого контроллера описываются в терминах,
привычных экспертам в области автоматического управления, что
существенно упрощает проектирование системы управления.
Итерационная процедура адаптации. Схема ГАСУ содержит
замкнутую цепочку T-*[C+P]-*K->I->[C' + P']-* V -*FC-* T,
осуществляющую итеративную процедуру изменения параметров
устройства управления с целью улучшения характеристик его рабо-
¦¦тт
Дефазификация
{kp, kj, kD}
{кр, к|, kD}
Размывание
Рис. 5.16. Нечеткая система принятия решений
244
ты. При такой организации адаптации нет необходимости в
получении абсолютно точных результатов каждым из входящих в
рассматриваемую цепочку блоков. Получение качественных
характеристик (тенденций) является достаточным для успешного
функционирования предлагаемой схемы адаптивной системы
автоматизированного управления (САУ).
Ключевым моментом при разработке систем управления,
использующих методы интеллектуальных технологий, является этап
моделирования. Анализ существующих систем разработки и
моделирования систем управления показал, что среда MatLab является
удобным средством для создания программного средства
моделирования гибридных адаптивных систем управления при условии ее
дополнения специализированными модулями, реализуемыми
методами интеллектуальных технологий [82].
Средства проектирования включают следующие инструменты:
1) набор компонентов ИТ;
2) набор специализированных компонентов, необходимых для
конструирования моделей гибридных систем управления
(например, блок идентификации на ГА);
3) набор средств визуализации функционирования модели.
Перечисленные средства проектирования дают возможность
специалистам в области управления использовать богатый
теоретический опыт, накопленный ИТ, и связывать отдельные
практические реализации ИТ в единое целое.
5.3. Интеллектуализация систем поддержки
принятия решений
Принятие решений особенно затруднено в условиях
неопределенности. Неопределенность в различных системах различна,
особенно она может быть большой в организационных системах. Как
уже неоднократно подчеркивалось, интеллектуализацию тех или
иных процедур необходимо начинать с оформления описания
предметной области. Для процесса принятия решений
инструментом формального описания воспользуемся математическим
аппаратом аналитической теории алгоритмов и программного
моделирования [90,91].
Формализация процесса принятия решений. Процесс принятия
решений в организационной системе управления содержательно
представляет собой выбор определенного варианта из числа альтер-
245
нативных вариантов. В качестве области возникновения
альтернатив ограничиваемся рассмотрением так называемых потенциально
алгоритмизируемых систем (ПАС).
Математической моделью ПАС можно считать совокупность
я=(КД,Ф,ОД E.1)
где К — коллектив алгоритмов; R — перечень ресурсов,
расходуемых при выполнении операторов (шагов) алгоритмов коллектива;
Ф — набор функций, описывающих расход каждого из ресурсов,
указанных в R, при выполнении каждого шага алгоритмического
процесса; О, — совокупность ограничений, налагаемых на расход
системой я каждого из ресурсов и на систему п в целом.
Понятие коллектива алгоритмов принадлежит аналитической
теории алгоритмов. Если коллектив алгоритмов, алгоритм или
операнд обозначены некоторой буквой (например, Z), то будем запись
этого объекта, выполненную на формальном языке, обозначать той
же буквой «с чертой» (например, Z), а функцию, индуцируемую
алгоритмом (или коллективом) Z, будем обозначать той же буквой
«с тильдой», т.е. «с волной» (например, Z).
Если говорить нестрого, но наглядно, то коллектив алгоритмов
К представляет собой совокупность «алгоритмов» Аь А2, ..., An
совместно перерабатывающих общий для них операнд X, причем
процесс, определяемый каждым А,, зависит только от его записи А, и
от состояния операнда Аь претерпевающего изменения,
вызываемые всеми Аь А2, ..., An. Результат совместного процесса по
определению должен быть однозначным, в чем заключается
результативность коллектива К. Слово «алгоритмов» в приведенном
описании понятия коллектива алгоритмов взято в кавычки, так как
каждый «алгоритм» имеет смысл только в составе содержащего его
коллектива, а взятый в отдельности может не быть
результативным. Учитывая сказанное, впредь кавычки, ставшие теперь
излишними, будем опускать.
Предположим, что запись операнда X состоит из
непересекающихся элементов, которые будем обозначать малыми греческими
буквами а, Р,..., е,.... Удобно считать, что на каждом
алгоритмическом шаге происходит сперва считывание (обращение по чтению)
одного или нескольких элементов операнда, а затем запись
(обращение по записи) частного результата на место одного из элементов
операнда, без изменения имени последнего элемента.
Приведем некоторые определения из аналитической теории
алгоритмов [91]:
246
Определение 5.1. Элемент е операнда X, к которому обращается
в течение всего процесса только один алгоритм коллектива или
несколько алгоритмов, но только по чтению, называется
собственным элементом.
Определение 5.2. Элемент е операнда X, к которому некоторый
алгоритм коллектива обращается по записи и хотя бы один из
других — по чтению, называется несобственным.
Определение 5.3. Шаги, на которых производятся обращения
только к собственным элементам, называются регулярными. Шаги,
на которых совершаются обращения к несобственным элементам,
называются критическими.
Определение 5.4. Нумеруя шаги каждого частного процесса Pj с
помощью чисел 1, 2, 3, ... в порядке их выполнения, мы зададим
так называемый частный порядок на процессе Pj. Если в процессе Pj
шаг h' имеет меньший частный номер, чем шаг h", то будем писать
h' < h", Pj. Равенство h' = h", Pj означает, что h' и h" — это один и
тот же шаг.
В каждом частном процессе р, шаги выполняются в
соответствии с частным порядком данного процесса и, если эти шаги
регулярны, независимо от выполнения шагов других частных
процессов. Иначе обстоит дело с критическими шагами. Если в процессе
pi наступила очередь шага h', а в процессе Pj(j * i) — очередь шага
h" и оба критических шага связаны с одним и тем же
несобственным элементом, то от последовательности, в которой они
выполняются, может зависеть окончательный результат, что
недопустимо. Вместе с тем нужно помнить, что строго одновременное
обращение разных частных процессов к одному и тому же
несобственному элементу физически невозможно. Поэтому для критических
шагов, связанных с каждым несобственным элементом, должен
существовать свой порядок выполнения (связанный с содержанием
задачи, решаемой при помощи коллектива алгоритмов).
Определение 5.5. Совокупность критических шагов, связанных с
несобственным элементом г, называется е-порцией, если:
а) взаимный порядок выполнения этих шагов не влияет на
результат совместного процесса;
б) после выполнения некоторого шага этой совокупности и до
выполнения всех ее шагов другие критические обращения к е не
должны производиться.
Замечание. Шаги различных е-порций не могут выполняться
вперемежку.
247
Определение 5.6. Совокупность нескольких перенумерованных
е-порций, таких, что шаги первой из них должны быть выполнены
раньше любого критического шага остальных порций (первая
может быть единственной), а критические шаги (i + 1)-й (i = 1,2...)
должны быть выполнены после всех критических шагов i-й (если
таковая не является последней), составляют так называемый
е-фрагмент.
Каждый е-фрагмент обозначают заглавной латинской буквой,
вслед за которой в скобках указывают наименование
несобственного элемента, например Е(е).
Всем критическим шагам i-й порции е-фрагмента присваивают
один и тот же номер i, называемый специальным.
Определение 5.7. Совокупность номеров критических шагов
фрагмента Е(е) определяет так называемый специальный порядок
шагов, принадлежащих данному фрагменту.
Если h' и h" — критические шаги фрагмента Е(е) и если
специальный номер шага h' меньше специального номера шага h", то
пишут h' < h", E(e). Запись h' = h", E(e) понимают как утверждение о
том, что h' и h" являются одним и тем же шагом, а не как
бесполезное в данном случае утверждение о равенстве специальных
номеров шагов h' и h".
Определение 5.8. Если для шагов h' и h" в каком-либо частном
процессе Pj имеет место h' < h", Pj и/или в каком-либо е-фрагменте
h' < h", E(e), то говорят, что в соответствии с общим порядком h'
предшествует шагу h" и пишут h' < h".
Определение 5.9. Сетевой схемой совокупного процесса
выполнения коллектива алгоритмов К при операнде X (и графом его
общего порядка) называют ориентированный граф с вершинами h|,
изображающими шаги совокупного процесса, ребрами (h|4,hf),
изображающими переходы между шагами в частных процессах Pj, и
ребрами (h|'',hj<>), jV j", изображающими непосредственное
следование шагов в соответствии с их специальными порядками. В
сетевой схеме каждый частный процесс Pj дополнен фиктивным шагом
hj, а последним шагом каждого процесса является h{.
Возможная сетевая схема изображена на рис. 5.17, на котором
представлены несколько критических фрагментов, связанных с
одним и тем же несобственным элементом: А(ос), В(а), С(а).
Специальные номера указаны только в одном из них, в двух других
указаны только 1-е частные номера.
248
гп-1
U>/
Н
hi
B)
(О/5
(
[ho2
[h? '
9
В(а)
«
, h
Ь
|А(а)
1
1
)
>
ч
hg-1
hg
Г \
l'C(a)
hg
Рис. 5.17. Сетевая схема совокупного процесса
Определение 5.10. Если для шагов h' и h" коллективного
процесса имеет место h' < h", то говорят, что шаг h' блокирует шаг h" (или
h" блокирован шагом h').
Определение 5.11. Совместный процесс выполнения алгоритмов Аь
А2,..., An, называется согласованным, если каждый шаг h этого
совместного процесса выполняется только после того, как все шаги,
предшествующие h в соответствии с общим порядком, уже выполнены.
Как уточнение приведенного выше нестрогого описания
коллектива алгоритмов отметим, что система алгоритмов Аь А2, ..., А*
над формальным языком L2 = {X} называется коллективом
алгоритмов только в случае, если для каждого X с L2 совместный
процесс выполнения является согласованным.
Определение 5.12. Если все первые шаги фрагмента В(е)
блокированы критическими шагами фрагмента А(е), то говорят, что
фрагмент В(е) зависит от фрагмента А(е). Если ни один из
указанных фрагментов не зависит от второго, то они называются
плавающими друг относительно друга (коротко — взаимно плавающими).
Если два взаимно плавающих фрагмента вообще не блокируют
шагов друг друга, то они называются свободно взаимно плавающими.
249
На рис. 5.17 В(а) зависит от А(а); фрагмент В(ос) и С(а)
являются свободно взаимно плавающими.
Взаимно плавающие фрагменты порождают явление
динамических изменений общего порядка и соответственно сетевых схем.
По определению фрагмента, после начала выполнения некоторого
6-фрагмента и до полного завершения его выполнения другие
фрагменты, связанные с тем же несобственным элементом,
взаимно плавающие с выполняемым, не могут начинать выполняться.
Это значит, что в момент начала выполнения хотя бы одного из
первых шагов такого фрагмента первые шаги всех взаимно
плавающих с ним становятся непосредственно следующими (по общему
порядку) за каждым из его последних шагов. Появляющиеся при
этом в сетевой схеме новые ребра называются динамическими.
Поскольку каждый шаг выполняется один и только один раз, удобно
считать, что, раз появившись, динамические ребра сохраняются до
конца совместного процесса.
Определение 5.13. Совокупность шага h, такого, что h < h, и всех
блокированных им шагов называется тупиком.
Замечание 1. В согласованном совместном процессе шаг h,
такой, что h<h, не может быть выполнен, а следовательно, не могут
быть выполнены и все блокированные им шаги. Происходит
остановка всех или некоторых частных процессов.
Замечание 2. Тупики могут возникать динамически.
Утверждение. Для наличия тупика необходимо и достаточно,
чтобы в сетевой схеме согласованного процесса либо
присутствовал, либо динамически возникал контур.
Определение 5.14. Фронтом совместного процесса, состоящего
из частных процессов рь р2,—>Рп, называется совокупность п
шагов, совершаемых различными между собой процессами. Нулевые
шаги образуют так называемый начальный фронт.
Совместный процесс удобно рассматривать как движение
фронта по сетевой схеме. При этом вступление фронта в один из
взаимно плавающих е-фрагментов ведет к появлению
динамических ребер и искривлению бегущего по сетевой схеме фронта.
Определение 5.15. Тупик, постоянно присутствующий в сетевой
схеме или динамически возникающий, но имеющий постоянную
конфигурацию, называется абсолютным. Тупик, динамически
возникающий при любом пробеге фронта, но изменяющий свою
конфигурацию, называется прыгающим. Тупик, возникающий при
некоторых пробегах фронта, тогда как другие пробеги являются бес-
тупиковыми, называется мерцающим.
250
На рис. 5.18 изображена простейшая сетевая схема с
абсолютным тупиком, фт — тупиковый фронт. На рис. 5.19 показан
простейший мерцающий тупик, возникающий, если бегущий фронт
войдет в фрагмент В(а) раньше, чем в А(а), и не возникающий в
противном случае (произойдет остановка только процесса pi). На
рис. 5.20 изображен мерцающий тупик, возникающий только если
бегущий фронт войдет одновременно в фрагменты А(ос) и В(Р). На
рис. 5.19 и 5.20 динамические ребра показаны пунктиром.
Определение 5.16. Последовательность всех положений бегущего
по сетевой схеме фронта выполнения ее шагов называется
туннелем. Туннель, заканчивающийся концевым фронтом (hE,h|,...,h?),
называется проходимым.
После пробега проходимого фронта сетевая схема
согласованного процесса примет некоторое завершающее состояние,
характерное тем, что все ее динамические ребра уже возникли и
присутствуют на ней, а все шаги выполнены.
Определение 5.17. Заключительное состояние сетевой схемы,
соответствующее проходимому туннелю т, называется проходимой
сетевой схемой и обозначается Sx.
Проходимых сетевых схем существует столько, сколько
проходимых туннелей. Именно проходимые сетевые схемы и
проходимые туннели играют важную роль в теории ПАС. Проходимые
схемы не содержат контуров, а значит и тупиков.
(О
В(а)
А(а)
Фт
A)
Рис. 5.18. Простейшая
сетевая схема с абсолютным
тупиком
Рис. 5.19. Простейший
мерцающий тупик
251
А«Х)
Рис. 5.20. Мерцающий
тупик при вхождении бегущего
фронта во фрагменты
А(сс) и В(Р)
Уже на основании
теоретико-алгоритмических рассмотрений можно
сформулировать некоторые задачи, связанные с
теорией ПАС и проблемой принятия решений
в организационных системах управления.
Задача 1. Построить коллектив К
алгоритмов, реализующий процесс
функционирования исследуемой (или
проектируемой) ПАС, т.е. некоторой
организационной системы управления. При этом
из реальных условий определить число
алгоритмов коллектива и
осуществляемые ими процессы, а также исходные
данные.
Задача 2. Определить наличие или
констатировать отсутствие абсолютных
тупиков в сетевых схемах, отвечающих
исследуемым начальным ситуациям
(исходным данным для коллектива
алгоритмов К).
Задача 3. Выявить и устранить мерцающие тупики в
коллективном процессе, корректируя К.
Примечание. Возникновение некоторых мерцающих тупиков
(например) таких, как на рис. 5.20, маловероятно при выполнении
коллективного процесса, тогда как взаимное плавание критических
фрагментов может давать некоторые выгоды в расходе ресурсов
(при пробеге в проходимом туннеле). Поэтому некоторые
мерцающие тупики иногда игнорируют, осложняя этим решение
некоторых других задач теории ПАС.
Задача 4. Найти проходимые (некоторые или все) сетевые
схемы для выбранных исходных данных исследуемой ПАС.
Исследование расхода ресурсов. В дальнейшем термин «ПАС»
будем употреблять как для обозначения исследуемой системы
управления, так и для обозначения ее математической модели E.1), делая
специальные оговорки лишь тогда, когда это необходимо.
Сразу отметим, что, исследуя или проектируя ПАС, перечень R
ресурсов, систему Q ограничений и набор Ф функций,
описывающих расход каждого ресурса при выполнении каждого шага
согласованного процесса, пользователь должен разрабатывать сам.
Поэтому получение названных составных частей ПАС само
представляет собой задачи из области принятия решений.
Зафиксируем эти задачи.
252
Задача 5. Определить перечень R ресурсов, расходуемых ПАС.
Задача 6. Определить систему (набор) Ф функций,
описывающих расход ресурсов шагами ПАС.
Задача 7. Зная R, сформулировать систему О, ограничений на
расход ресурсов ПАС.
Задача 8. Зная К, R, Ф и Q, определить область возникновения
альтернатив исследуемой ПАС, т.е. проверить, какие из
ограничений выполнены, какие не выполнены, на каком шаге и почему
происходит невыполнение ограничений.
Сделаем некоторые разъяснения. Перечень R ресурсов
представляет собой кортеж
R = r1,r2,...,rk, E.2)
где г4 — наименования используемых в ПАС ресурсов; к — их число.
Функции из набора Ф, характеризующие расход каждым шагом
h{ ПАС ресурсов из числа указанных в R, могут быть весьма
разнообразны.
Ограничимся случаем, когда каждая такая функция имеет вид
\Vl'e(h{) и каждому выполняемому шагу h{ ставит в соответствие
расход Д^ ресурса Г/, т.е. позволяет вычислить
Д{г,=Х|Л>|). E.3)
Для определения при функционировании ПАС расхода каждого
ресурса нужно кроме набора функций у*'* располагать проходимой
сетевой схемой согласованного процесса выполнения ПАС. Число
функций \|/j''(h|) равно для каждого ресурса числу частных
процессов в сетевой схеме.
Система Q ограничений, налагаемых на исследуемую или
проектируемую ПАС, кроме условий вида неравенств, которым
должны удовлетворять расходы ресурсов, должна содержать условия,
налагаемые на исходную ситуацию (на исходное данное X), и
условия, предъявляемые к самой ПАС (в частности, к коллективу
алгоритмов К). Для упрощения рассуждений можно все условия,
входящие в ?1 (а это предикаты), выписать в одну строку и между ними
поставить знаки & (конъюнкции). После этого вместо многих
условий можно рассматривать эквивалентное им одно условие,
которое в этом случае будем обозначать тоже буквой Q. Впрочем, такое
объединение условий удобно не для каждой задачи с ПАС.
253
В общем виде покажем подсчет расхода ресурсов при
функционировании ПАС. Одним из важнейших ресурсов является
системное время, с него и начнем.
1. Все ребра проходимой сетевой схемы, выходящие из шагов hj
начального фронта, пометим числом 0 (нуль). Это же число будем
считать пометкой начального фронта <р0.
2. Далее все шаги (вершины) hj, все входящие ребра которых
уже помечены, пометим числами, каждое из которых (обозначим
его t\) равно максимуму пометок ребер, входящих в h-. Числа t-
обозначают моменты начала выполнения шагов h|.
3. Каждое ребро, исходящее из вершины h{, пометим числом
t{ + \|/J,1(hj), считая, что ресурсом «время» является Т\.
Пункты 2 и 3 повторяем до тех пор, пока все вершины
проходимой схемы не окажутся помеченными. После этого вычисляем
числа t/ +\|/J,1(h|), заканчивая этим процесс счета.
Каждое число tj +\v*,l(h{) является моментом окончания
выполнения шага h{. Общее время выполнения всей проходимой сетевой
схемы равно
tE=max(tJE+Vj'1(h1E)). E.4)
l?j?n
В отличие от расчета системного времени, расчет расхода
ресурса при заданном исходном данном X (типа «деньги»,
«электроэнергия») и наличии проходимого туннеля в сетевой схеме ПАС ведется по
формулам
i=l
n (E) /с f\
j=l i=l
где dJE — расход ресурса гь частным процессом Pj, a dE — общий
расход ресурса ^ в результате всего согласованного процесса
функционирования ПАС.
Важнейшим в теории ПАС является понятие сложной системы
[91]. Предположим, что все предикаты, входящие в Q, объединены
с помощью знаков & (конъюнкции), как это было сказано выше, в
один предикат Q.
254
Определение 5.18. Пусть я = (К, R, Ф, О) есть ПАС, которая при
начальном данном X удовлетворяет условию
-Q, E.7)
т.е. Q. — ложно. Тогда я называется сложной ПАС, или коротко,
сложной системой при исходном данном X.
Определение 5.19. Если A = {Xmi,Xm2,...} —совокупность
исходных данных (исходных ситуаций), при которых ПАС я является
сложной системой, то говорят, что я является сложной системой на
множестве ситуаций Л.
Понятие сложной системы позволяет сформулировать ряд новых
задач, решение которых может потребоваться при принятии решения.
Задача 9. Имея ПАС и Л, определить, является ли ПАС
сложной системой на Л.
Задача 10. Если исследуемая ПАС сложная система
относительно Л и нужное X е Л, то преобразовать ПАС в систему не сложную
относительно X.
Задачи 9 и 10 называют двумя основными задачами теории
сложных систем. Задачу 9 решают проверкой истинности условий,
образующих Q, производя при этом расчеты расходов ресурсов. Задачу
10 решают одним из следующих четырех путей.
Путь 1. Эквивалентные преобразования коллектива алгоритмов К.
Путь 2. Замена исходной ПАС я приближенной ПАС я7 за счет
изменения операций, входящих в Ф. Этот путь называется
огрублением расчетов ресурсов.
Путь 3. Замена исходной ситуации X и всех зависящих от X
элементов ПАС. Этот путь называется огрублением исходной си-
туации.
Путь 4. Комбинация путей 1—3.
Применение методов, связанных с путями 1—4, требует
наличия определения близости ПАС. При наличии метрики для ПАС
этот способ может выглядеть как определение расстояния между
ПАС. Предположим, что существует функция р(я',я") > 0,
обладающая свойствами расстояния, т.е. такая, что
У7ф(я;я) = 0),
Уя1,я2(р(я1,я2) = р(я1,я2)),
Уя1,я2,Яз(р(я1,я3) + р(я3,я2)>р(я1,я2))&,
&(|р(я1,я2)-р(я2,я3)|^р(я1,Яз)).
255
Теоретически проблема близости ПАС еще не решена. Ее
решают эвристически, считая щ и Я2 близкими, если при малом е > О
имеет место
р^я^е. E.9)
Функциональная структура системы поддержки принятия решений
в организационной системе управления. Приведенные выше 10 задач
теории ПАС, не исчерпывая всех задач этой теории, могут служить
основой для разработки функциональной структуры системы
поддержки принятия решений (СППР).
Учитывая современный уровень разработки методов принятия
решений, СППР должна быть рассчитана на оказание помощи
пользователю в его эвристических действиях путем выполнения
наиболее трудоемких выкладок и расчетов, которые позволяли бы
решать полностью или частично задачи теории ПАС из числа
перечисленных выше. Для этого СППР должна быть интерактивной,
т.е. основанной на диалоговой форме обмена информацией с
пользователем. Кроме того, СППР должна быть открытой, т.е.
позволяющей как расширить ее функционально, так и увеличивать
объемы накопленных в ней знаний содержательного характера. Для
этого, во-первых, СППР должна быть сильно структурированным
комплексом программ, во-вторых, содержать ряд баз данных,
информационных систем и банков данных и, в-третьих, иметь
поддержку в виде группы программистов и администрации. Ввиду
разнообразия организационных систем управления СППР
целесообразно придать форму инструментальной системы.
Для удобства дальнейшего изложения будем программные средства
СППР делить на три класса: фундаментальные (основные блоки
комплекса программ), служебные и объектные. Точный смысл этих
терминов будет разъяснен ниже. Точно так же информацию, используемую
комплексом СППР, будем делить на фундаментальную
(обеспечивающую функционирование блока СППР), диалоговую и справочную.
Функциональная структура СППР схематически изображена на
рис. 5.21. Эта структура предусматривает наличие блоков: ведущий
блок (ВБ); блок диалога (БД); блок протоколирования диалога
(БПД); блок управления фондом сценариев диалога (УФС); блок
управления библиотекой служебных программ (УБСП); блок
управления фондом объектных моделей (УФОМ); блок управления
фондом нормативов (УФН)^ блок «рабочее поле» (РП); блок
исполнения работ (БИР); блок выдачи таблиц и графиков (БВТГ); блок
поддержки системы, т.е. «хаускиппинга» (БХ).
256
1
Э ,вб h"
г
2. БД
З.БП
3'. БП
4. УФС
4\ ФС
5. УБСП
~~Г~
5'. БСП
6. УФОМ
—г~
6'. ФОМ
11. БХ
7. УФН
~т~
7'. ФН
8. РП
9. БИР
10. БВТГ
Рис. 5.21. Функциональная структура интеллектуализированной СППР
Кроме перечисленных блоков функциональная структура
СППР предусматривает следующие массивы информации:
4'. Фонд элементарных сценариев диалога (ФС).
3'. Банк протоколов диалога (БП).
5'. Библиотека служебных программ (БСП).
6'. Фонд объектных моделей (ФОМ).
7\ Фонд норматива (ФН).
Как легко видеть, программные средства СППР не сводятся к
функциональным блокам. Служебные программы, такие, как
трансляторы, редактирующие программы и т.п., хранятся в БСП.
Кроме того, некоторые программы, являющиеся объектными
(описывающими функционирование ПАС), могут содержаться в ФОМ.
Чисто информационными являются ФС, ФН и БП.
Организацию всего процесса СППР осуществляет ВБ, не
решающий никаких функциональных задач ПАС, вызывающий
функциональные блоки системы посредством таблицы
фундаментальной информации, из которой он считывает информацию,
поступающую к нему от функциональных блоков, и в которой
фиксирует свои приказы функциональным блокам. Блок хаускиппинга
по приказу администратора перед началом очередного сеанса рабо-
17 — 3466 257
ты СППР «чистит» таблицу фундаментальной информации и
рабочее поле. Для пользователя и остальных блоков СППР этот блок
недоступен (в том числе и для ВБ).
Ведение диалога с пользователем осуществляют блоки БД,
УФС, БПД, используя ФС и БП. В системе предусмотрены три
формы диалога: канцелярский (типа вопрос системы — ответ
пользователя), предназначенный для идентификации пользователя и
его материалов в системе; формальный (типа приказ
пользователя — реакция системы), предназначенный для управления
системой; формализующий (типа гибкий вопрос системы, зависящий от
ранее полученных ответов, — ответ пользователя и его
формализация системой), предназначенный для получения системой новых
знаний о ПАС. Сущность и возможности гибкого формализующего
диалога осуществляются с помощью информации, накопленной в
ФС, путем компиляции вопросов из элементарных сценариев,
содержащихся там [90]. Ведение протокола диалога и его хранение в
БП требуется для обеспечения возможности перерывов в работе
пользователя и возможности выдачи документации после конца
работы с системой.
Блок управления библиотекой служебных программ и сама
библиотека (УБСП и БСП) необходимы для хранения и
использования служебных программ, не входящих в число фундаментальных,
таких, как транслятор, редактирующие программы, программы
эквивалентных преобразований коллективов алгоритмов и др. Эти
программы выполняются после их установки на рабочем поле,
производимой БИР. Результаты работы служебных программ могут
либо поступать обратно в БСП, либо поступать в ФОМ, либо
выдаваться БВТГ.
Решение задач ПАС с помощью объектных моделей
производится на рабочем поле, куда сами объектные модели из ФОМ по
требованию БИР передаются блоком УФОМ. Необходимые для работы
моделей нормативы из ФН переносятся на рабочее поле блоком
УФН. Результаты моделирования выдаются БВТГ, или в случаях,
когда они являются отдельными кодами, — на дисплей через БД.
Рабочее поле не является просто свободной частью
запоминающих устройств, а является переменным функциональным блоком
системы программ СППР и именно как блок взаимодействует с
ВБ. Блок исполнения работ (БИР), кроме вызова на рабочее поле
служебных программ и объектных моделей, осуществляет
планирование работ на рабочем поле.
258
5.4. Технологические процессы
объектно-ориентированного программирования
в проектировании интеллектуальной системы
поддержки управления
Повышение эффективности деятельности предприятия требует
качественно нового подхода к постановке задач принятия решений
в оперативно-диспетчерском управлении (ОДУ). Как показывает
опыт проектирования автоматизированных систем
оперативно-диспетчерского управления (АСОДУ), в настоящее время
наиболее перспективным представляется включение в контур
управления экспертных систем, позволяющих повысить интеллектуальный
уровень принимаемых решений.
В случае плохо формализованных задач, а именно такие чаще
всего возникают в системах ОДУ во многих предметных областях
(ПО) (таких, как горное дело, атомная энергетика, химическое
производство и т.п.), процедуры принятия оптимальных решений
обычно слабо реализуемы. Поэтому правильному принятию
решений способствует создание баз знаний, основанных на принципах
объектно-ориентированного подхода (ООП). Имеющиеся в нем
средства позволяют отображать реальные сущности предметной
области в виде объектов, которые взаимодействуют друг с другом
через сообщения. Конечный пользователь получает возможность
естественным образом работать с сущностями ПО как с объектами
(классами объектов), используемыми в его профессиональной
деятельности. Гибкое сочетание ООП и БЗ, а также использование
современных средств отображения информации позволяют
определить новый подход к постановке и решению задач принятия
решений в системах поддержки диспетчера (СПД).
Интеллектуализация ОДУ — проблема со многими аспектами, в
числе которых находятся традиционные для искусственного
интеллекта задачи, инвариантные по отношению к области применения
(поддержка принятия решений, взаимодействие с пользователем на
естественном языке и т.п.).
Задачи интеллектуализации СПД как предметной области
связаны с вопросами одновременного распознавания многих
взаимосвязанных технологических ситуаций. В большинстве
практических случаев даже быстродействующие реализации процедуры
принятия управленческих решений не способны оценить все
возможные сочетания параметров, характеризующих ситуацию, поскольку
множество их бесконечно или практически бесконечно. Кроме
того, принятие эффективных управляющих решений является
17*
259
сложной задачей для оперативного персонала из-за неполноты
информации о ситуациях, большой размерности объекта
идентификации, отсутствия формализованного описания объекта (основная
часть информации представляется в форме рекомендаций
специалистов-экспертов). Разнообразные технологические ситуации
требуют от управляющего диспетчера различных типов знаний для
принятия соответствующих решений. В настоящее время процесс
принятия решений по распознаванию ситуаций остается одной из
самых сложных задач для оперативного персонала, особенно при
возникновении нештатных ситуаций, в которых отсутствуют
запрограммированные управленческие решения.
Для создания базы знаний и механизма логического вывода
интеллектуальной СПД требуются:
• метод описания ситуаций, позволяющий структурировать
сущности предметной области в базе знаний;
• алгоритм использования диагностических знаний для
автоматической идентификации ситуации на ПЭВМ.
Эти задачи могли быть решены при помощи либо методов
искусственного интеллекта с использованием соответствующего
программного инструментария — оболочек ЭС, либо языков
представления знаний. Однако применение подобных средств осложняется
спецификой обсуждаемой предметной области: необходимостью
работы в реальном масштабе времени, большим объемом знаний и
ограниченностью вычислительных ресурсов, имеющихся в контуре
управления.
Это обусловливает применение структурных элементов
описания, предлагающих сравнительно низкий уровень абстракции
знаний, а именно причинно-следственных деревьев с задержками по
времени, называемых деревьями знаний (ДЗ) [92].
Основной единицей описания предметной области в процессе
идентификации является алгоритм обработки, который
представляет собой разветвленную последовательность логических
заключений, выполняемых на основании фактической информации о
технологическом объекте управления и приводящих к выводу о
состоянии этого объекта. Этот алгоритм реализует процедуральные
(описанные в технологических регламентах и инструкциях) и
когнитивные (субъективная модель процесса, сформированная
оператором) знания об объекте.
Условие, содержащееся в вершине ДЗ, является минимальной
единицей знаний, представляемой в процессе описания ПО.
Идентификация события заключается в проверке условия одного из
четырех описываемых ниже типов.
260
Л Анализ значения объекта
P*V±e-*Si, E.10)
где Si — идентифицируемое событие;
Р — значение объекта ( технологического параметра);
V — величина, с которой сравнивается значение Р;
* — предикатный символ (=,<>,>,>=,<,<=);
е — допустимая ошибка рассогласования, определяющая
уверенность в том, что ситуация (событие) может быть распознана.
Задание значения «е» связано с определением степени
принадлежности |x(Si) для нечеткого множества Sm на шкале [0,1].
Иными словами, «е» является функцией отображения Si на интервал
[0,1], т.е.
e:Si^[0,l] = jiSm(Si), E.11)
где Si — некоторая распознаваемая ситуация; Sm — эталонная
(полностью известная и описанная) ситуация из базы знаний.
С учетом E.11) возможна обработка нечеткой (как числовой,
так и лингвистической) информации путем введения в ДЗ
соответствующих узлов. Следовательно, появляется возможность анализа
состояния технологических объектов в нечетких условиях среды
функционирования.
С помощью узла 1-го типа можно записать правило:
ЕСЛИ значение объекта Р достигло (превысило и др., в
зависимости от предикатного символа) некоторой величины V с точностью е,
ТО имеет место событие Si.
2. Анализ изменения значения параметра
dP/dt*V±e-*Si, E.12)
где dP/dt — изменение значения технологического параметра Р за
время dt.
Приведенное высказывание E.12) означает, что в узле 2-го типа
может содержаться правило вида:
ЕСЛИ значение технологического параметра Рза время dt измени-
лось на некоторую величину V с точностью е, ТО имеет место
событие Si.
3. Анализ взаимосвязей параметров
Pk*aPl + b±e-*Si, E.13)
где Рк — значение зависимого технологического параметра;
261
PI — значение независимого технологического параметра;
а — коэффициент регрессии;
b — свободный член уравнения регрессии.
Приведенное высказывание E.13) означает, что в узле 3-го типа
может содержаться правило:
ЕСЛИ значение технологического параметра Рк изменяется в со-
ответствии с линейной зависимостью от параметра Р1 с
коэффициентами a, b и точностью е, ТО имеет место событие SL
4. Анализ диалоговой информации
•T-*Si, E.14)
где «?» — запрос у оператора недостающей информации.
Высказывание E.14) означает, что событие Si (а также
дальнейшее продвижение по ДЗ) определяется оператором. Введение
события 4-го типа вызвано отсутствием в технологической ЭВМ ряда
важных для анализа ситуации параметров и другой информации.
При обработке события 4-го типа система выдает оператору
запрос, который предполагает ответ в форме (да/нет/ не знаю) и
определяет путь дальнейшего продвижения по ДЗ.
При принятии решений в реальном масштабе времени
необходимо учитывать временной фактор. Иногда важно не только
установить факт наступления события, но и проанализировать, сколько
времени прошло с момента наступления предыдущего события.
Для учета динамических изменений объекта управления введены
временные задержки на ветвях дерева.
Итак, рассмотрена модель описания предметной области
деятельности диспетчера в виде деревьев знаний.
Под предметной областью, как и раньше, будем понимать
набор ее понятийных сущностей. Для задач распознавания ситуаций
СПД сущностями можно считать технологические параметры
состояния оборудования, технологические ситуации на объекте,
диагностируемые события, последовательность действий
оперативного персонала, анализируемые условия и др.
Модель ПО представляется в виде системы сущностей (объектов),
в качестве которых выступают данные, их атрибуты и отношения
между ними. Данные отображаются в файлах БД или БЗ; действия над
ними осуществляются прикладными программами или процедурами.
Каждая процедура (или прикладная программа) отражает некоторое
знание об определенной функции или задаче; последующая
формализация модели ПО направлена на приближение к профессиональной
терминологии пользователя. Одним из возможных способов
достижения этой цели является объектно-ориентированный подход.
262
MANAGER
TREE 1
TREE 2
ROOT
Да
Да
Нет
Нет
ROOT
Да I
Да
[Нет
TREEn
¦Алгоритм
анализа
ситуаций
Нет
Да
Нет
Рис. 5.22. Модель представления знаний в виде деревьев знаний (ДЗ)
Модель представления знаний приведена на рис. 5.22. Объект
MANAGER управляет деревьями, описывающими работу
различных подсистем. Каждое дерево — это отдельный алгоритм анализа
ситуаций, связанных по технологическим признакам, причем
ДЗ — это бинарное дерево, в каждой вершине которого содержится
определенное условие. Корневые вершины являются исходными
точками для поддеревьев (подалгоритмов) ДЗ. Вершины четырех
типов описаны выше.
Структура ДЗ на основе ООП представлена на рис. 5.23. В ней
отражены объекты сущность—атрибут—связь. Между сущностями
указаны два вида связей: обязательная, которая обозначается — <-,
и необязательная (факультативная) <—. На концах связей
указаны поименованные ассоциации сущностей.
В данной модели MANAGER, являющийся сущностью верхнего
уровня иерархии, образует обязательную связь с сущностью TREE
(т.е. ни одно дерево не существует без связи с менеджером). В свою
очередь, TREE имеет два обязательных атрибута: указатель на корень
дерева и число вершин дерева. Из схемы видно, что узлы ROOT,
FIRST, SECOND, THIRD, FOURTH обязательно связаны с
сущностью BASE и наследуют ее свойства и признаки. Сущность TREE
является «другом» BASE, т. е. все функции класса TREE имеют
доступ к закрытой части класса BASE. Кроме этого, показано, что кор-
263
MANAGER
stTimeTree
Содержит
Управляет
IpRoot
iCountNood
TREE
Содержит
Является другом
stTimeAlg
BASE
T
| iNum
sMsg
stTime
eSymbol
stAccur
lpLeft 1
IpRight 1
Наследует свойства
Содержит J
ROOT
Обязан быть
He обязан быть
IpExternVar
FIRST
"J"
SECOND
г
THIRD
т
stW
H fEstVar
HIpExNonDep\1
H iPrizn
H IpFollow
HstTimeSecond
Сод ер ж и т
FOURTH
т
szAsk
IpExtDepVar
Н fKRegr
Ч fKFree
Рис. 5.23. Структура дерева знаний
невой узел (родоначальник поддерева ДЗ) должен быть узлом первого
типа, а узел первого типа может не быть корневой вершиной. Узлы
различных типов, наследуя признаки и атрибуты базовой сущности
BASE, также имеют только им присущие атрибуты. Корневой узел
ROOT, являясь по сути узлом FIRST и наследуя его свойства, должен
добавить свой атрибут — время исполнения подалгоритма ДЗ.
Каждая используемая в процессе управления
последовательность действий при анализировании ситуаций представляет собой
отдельный объект, свойства которого как элемента класса
представлены в БЗ. Таким образом, с помощью понятия «объект»
описываются ситуации, объединенные в логические
последовательности, и атрибуты (идентифицирующие данные ситуации),
свойственные этому объекту. В результате объект TREE становится носи-
264
телем информации о значениях атрибутов, что отображает набор
экспертных правил.
Разработав соответствующий алгоритм анализа ситуации
(дерево), когнитолог заполняет БЗ, т.е. создает объект TREE в БЗ. Для
объекта задаются:
• номер или имя объекта, по которому к нему можно обратиться;
• количество вершин в дереве.
Кроме того, каждому объекту (дереву, узлу) предоставляется
некоторый набор процедур, которые запоминаются в БЗ и позволяют
производить те или иные действия над объектом. В соответствии с
этими процедурами и функциями осуществляется создание,
редактирование, загрузка, удаление, сохранение объекта, а также его
обработка: сканирование дерева, раскрытие вершин (рис. 5.24).
В ООП основные понятия описания исследуемой предметной
области, такие, как логическая последовательность действий, при
распознавании ситуаций можно обозначить объектами с общими
свойствами. В общем виде модель предметной области для задачи
распознавания нештатных ситуаций в интеллектуальной СПД
предприятия представляется в виде
МПО = {(T,N,P)/t}.
В этой модели используются объекты:
Операции
над объектами
Операции
над TREE
В
автоматизированном
варианте
Операции
над BASE
R
В оперативном
режиме
I— Загрузка
- Создание
- Редактирование
- Сохранение
— Исполнение
I—Работа
с таймером
поддерева
-Инициализация
I—Частичная
инициализация
I—Работа
с таймером
группы
узлов 2-го
типа
БАЗА ЗНАНИЙ
Рис. 5.24. Операции над объектами Д3
265
Т = {Ti}, i = l,m, T — множество задач или подсистем;
N = {NR, N1, N2, N3, N4} — множество, в котором данные
сформированы по задачам из множества Т и содержатся в узлах ДЗ:
корневом, первого, второго, третьего и четвертого типов;
Р = {PJh j = 1, j — множество процессов j-ro логического вывода
дерева знаний, t — временной фактор.
Гибкое сочетание объектно-ориентированного
программирования и баз знаний для представления реальных информационных
сущностей предметной области в виде древовидных структур
является наиболее оправданным подходом к интеллектуализации в
данной предметной области. Конечный пользователь в итоге получает
возможность естественным образом работать с сущностями
предметной области как с объектами, используемыми в его
профессиональной деятельности, а такие свойства ООП, как полиморфизм,
инкапсуляция, наследование, позволяют достигнуть компактности
программного кода системы.
Интеллектуальная объектно-ориентированная система
поддержки диспетчера существует на языке программирования С++ в
виде приложения Windows 3.1 и предназначена для установки на
ПЭВМ типа IBM PC AT [92].
5.5. Распознавание образов и анализ
изображений
Разнообразные процедуры поиска информации или случившегося
события среди множества других данных и событий, контроль
состояния сложных многопараметрических объектов и процессов, управление
в условиях неопределенности и ограниченной информации играют
большую прикладную роль в решении многих задач в различных
предметных областях. Здесь используются, как правило, методы обучения
алгоритмическим процедурам преобразования и анализа информации
для задач, алгоритмы решения которых неизвестны.
Задачи распознавания (классификации) возникают в связи с
обработкой и преобразованием на ЭВМ структур, представляющих
в программах искусственного интеллекта знания о предметной
области в целом и знания, относящиеся к конкретной задаче.
Под образом понимается структурированное приближенное
(частичное) описание изучаемого объекта или процессов, причем
частичная определенность описания является принципиальным
свойством образа. Образ допускает рекурсивное определение:
символ является образом, список символов является образом. Можно
266
допустить, что образ состоит из двух групп символов,
представляющих соответственно переменные и постоянные характеристики
объекта описания.
Описания служат для установления соответствия образов, т.е.
доказательства их идентичности, аналогичности, подобия, сходства
и т.п., осуществляемого сопоставлением. Сопоставление образов
представляет собой основную задачу как распознавания, так и
искусственного интеллекта в целом.
В различных задачах искусственного интеллекта понятию
«образ» придается различный смысл. Так, в распознавании (в
классических моделях) образ описывается вектором признаков, каждый
элемент которого представляет числовое значение одного из
признаков, характеризующих соответствующий объект. В структурной
модели распознавания в качестве образа выступает высказывание,
порождаемое грамматикой, характеризующий класс, которому
данный образ принадлежит.
Целью создания автоматизированных вычислительных систем
распознавания является автоматизация группы процессов
восприятия и познания, связанных с поиском, выделением,
идентификацией, классификацией и описанием образов на основе анализа
реальных данных. Обычно поиск и выделение образов
осуществляются на начальном этапе анализа в процессе обработки исходных
данных; следующий этап — разработка «классификатора» —
включает анализ выборочных (преобразованных) данных, синтез
модели, учитывающий изменчивость образов, выбор из заданного
набора характеристик наиболее информативных и разработку алгоритма
распознавания (классификации). На рис. 5.25 представлена общая
структура системы распознавания и ее разработки [8].
В основе гносеологического обоснования распознавания и
таких фундаментальных понятий распознавания, как образ,
класс, распознающий алгоритм, лежит представление о
структурированности мира, т.е. существовании регулярности,
проявляющейся в виде постоянных связей, закономерностей. Отправной
точкой служат объект (образ как таковой) и проблемы природы
образа, прототипа, класса. Образы рассматриваются в рамках
точного формализма, который используется в качестве основы
для синтеза и анализа образов, что способствует пониманию
того, каким способом образы строятся и обрабатываются. В
результате процедуры, обеспечивающие описание,
аппроксимацию, восстановление и распознавание образов, принимают вид
естественных следствий процедур формирования и
преобразования объектов. Основным объектом служат комбинаторные регу-
267
Объект
распознавания!
Доступная
информация
о предметной
области
Разработка системы
Анализ
объекта
ПО объекта!
Выбор признаков
и непроизводных
элементов
Измерение
Выделение
признаков
Разработка
подсистем анализа
и классификации
Классификация,
описание
Номера
классов
Описание
классов
Результаты Признаки,
измерения непроизводные
элементы
Система распознавания
Рис. 5.25. Общая структура системы распознавания и ее разработки:
тонкие стрелки обозначают обратную связь; полужирные — факторы, влияющие на синтез
системы; штриховые — возврат к предыдущему этапу разработки системы
лярные структуры (конфигурации), логические конструкции,
позволяющие определять типы регулярности. С формальной точки
зрения речь идет о построении новых объектов посредством
комбинирования заданных объектов в соответствии с
определенными правилами построения объектов. Постулируется, что
образы формируются из простых стандартных элементов (атомов),
которые выбираются в соответствии с «физической» природой
изучаемых объектов и процессов. В качестве таких элементов
могут выступать абстрактные символы, множества, отношения
или функции, но роль элементов в порождении регулярных
структур идентична.
Распознавание обычно связывают с двумя функциями:
отнесением объекта к неизвестному классификатору классу объектов и
идентификацией объекта в качестве элемента известного
классификатору класса. Первая функция представляет собой процесс
выделения новых классов — кластеризацию, а вторая — собственно
распознавание.
Основной целью распознавания является построение на основе
систематических, теоретических и экспериментальных
исследований эффективных вычислительных средств для отнесения
формализованных описаний процессов и объектов к соответствующим
классам. Задачи распознавания представляют собой дискретные
аналогии задач поиска оптимальных решений, в которых по неко-
268
торой информации требуется установить, обладает ли объект
фиксированным набором свойств.
Задачи распознавания имеют ряд специфических черт:
1. Это информационные задачи, которые решаются
применением к исходным данным преобразований, состоящих из приведения
исходных данных к стандартному виду, удобному для
распознавания, а также из собственно распознавания.
2. В них можно вводить понятие подобия между объектами
(процессами).
3. Можно оперировать набором прецедентов-примеров,
классификация которых известна.
4. Для этих задач трудно строить формальные теории и
применять классические математические методы, так как, во-первых,
уровень формализации соответствующей ПО и доступная
информация таковы, что они не могут составить основу для синтеза
математической модели и, во-вторых, математическая модель может
быть построена, однако ее синтез или изучение связаны с
большими затратами.
5. В этих задачах «по определению» существует «плохая»
исходная информация, характеризующая сложную в семантическом и
структурном отношениях ситуацию, — это ограниченная,
неполная, разнородная, косвенная, нечеткая, неоднозначная,
вероятностная информация.
Известны следующие типы задач распознавания:
1. Отнесение предъявленного объекта (процесса) по его
формализованному описанию к одному из заданных классов — задача
распознавания (обучения с учителем).
2. Разбиение множества процессов (объектов) по их
формализованным описаниям на систему непересекающихся подмножеств
(классов) — задача автоматической классификации (таксономия,
кластер-анализ, обучение без учителя).
3. Определение информативного набора признаков для
построения формализованного описания объекта распознавания;
оценка информативности отдельных признаков и их
сочетаний — задача выбора информативного набора признаков при
распознавании.
4. Построение формализованного описания объекта
распознавания — задача сведения исходных данных к виду, удобному для
распознавания.
5. Задача 1 с учетом динамичности объекта (процесса).
6. Задача 2 с учетом динамичности объектов (процессов).
269
7. Задачи 5, 6, в которых решение должно относиться к
некоторому моменту времени в будущем, — задачи прогнозирования.
Все перечисленные задачи могут решаться при заданных
исходных данных в одной из следующих форм либо в их сочетаниях:
• изображения, полученные в различных частях спектра
излучений (оптические, инфракрасные, ультразвуковые и т.д.)
различными способами (телевизионные, фотографические, лазерные,
радиолокационные) и преобразованные в цифровую форму;
• сигналы (длинные числовые последовательности);
• экспертные данные, числовые и другие виды информации;
• серии изображений («фильмы») любого из перечисленных
видов.
Математические модели распознавания образов. Среди
достаточно хорошо зарекомендовавших себя математических моделей
следует выделить следующие:
1. Модели, основанные на использовании принципа
разделения, различаются главным образом заданием класса поверхностей,
среди которых выбирается поверхность (или набор поверхностей),
в некотором смысле наилучшим образом разделяющая объекты
разных классов.
2. Статистические модели, основанные на использовании
аппарата математической статистики. Применяются в тех случаях, когда
определены вероятностные характеристики классов, например
законы распределения.
3. Модели, построенные на основе «метода потенциальных
функций» и базирующиеся на заимствованной из физики идее
потенциала, определенного для любой точки пространства и
зависящего от расстояния до источника потенциала.
4. Модели вычисления оценок (голосования), основанные на
принципе частичной прецедентное™. Анализируется «близость»
между частями описаний ранее классифицированных объектов и
объекта, который надо распознать. Наличие близости служит
частичным прецедентом и оценивается по заданному правилу
(посредством числовой оценки).
5. Модели, основанные на исчислении высказываний, в
частности на аппарате алгебры логики, в которых классы и признаки
объектов рассматриваются как логические переменные.
Появление каждого нового эвристического алгоритма можно
рассматривать как эксперимент, а со всем множеством
экспериментов и их результатов необходимо работать как с новым для
математики множеством объектов, т.е. изучать с помощью строгих
270
математических методов множество некорректных процедур
решения плохоформализованных задач.
Потребность в синтезе моделей распознавания определялась
необходимостью фиксировать класс алгоритмов при выборе
оптимальной или хотя бы приемлемой процедуры решения конкретной
задачи.
Математическая постановка задачи распознавания. Пусть дано
множество М объектов w; на этом множестве существует разбиение
m
на конечное число подмножеств (классов) ?2|, i = l,m; M= (jQj.
i=l
Разбиение определено не полностью, задана лишь некоторая
информация 10 о классах Qj. Объекты w задаются значениями
некоторых признаков X,, j = 1,N (этот набор всегда один и тот же для
всех объектов, рассматриваемых при решении определенной
задачи). Совокупность значений признаков х, определяет описание I(w)
объекта w. Каждый из признаков может принимать значения из
различных множеств допустимых значений, например: {0,1} —
признак не выполнен или выполнен; {0,1,} — информация о признаке
отсутствует; @,1, ..., d-1) — степень выраженности признака имеет
различные градации, d>2; [аь ..., аа) — признак имеет конечное
число значений; d > 2: [a, b], (a, b], [a, b), a, b — произвольные
числа или символы —«>, +оо; значениями признака х, являются
функции некоторого класса; значениями признака Xj являются функции
распределения некоторой случайной величины.
Описание объекта I(w) = (xi(w),...,xN(w)) называют стандартным,
если Xj(w) принимает значение из множества допустимых значений.
Задача распознавания со стандартной информацией состоит в том,
чтобы для данного объекта w и набора классов ?2Ь ..., Qm по
обучающей информации I0(Qi,...,Qm) о классах и описанию I(w)
вычислить значения предикатов P^wGQj), i = l,m. Информация о
вхождении объекта w в класс ЗД кодируется символами
l(w GQi),0(w G Qj),A (неизвестно, принадлежит w классу ЗД, или
нет) и записывается в виде так называемого информационного
вектора a(w) = (a {(w),...,a m (w)),a { G {0,1, A}.
Стандартной (эталонной) информацией 10(йь...,Йт) называют
совокупность множеств A^1),...,1(\0) и a(w1),...,ann (w^)
(предполагается, что среди информационных векторов нет вектора
вывода (Ai,...,Am)). Априорная информация в задаче распознавания с
непересекающимися классами часто задается в виде так
называемой таблицы обучения TNjm (табл. 5.2).
271
Таблица 5.2. Схема обучения принадлежности классам
1 Объест
| Wi
W''
w^,+l
wr,
wrn-,+l
...
Wr°
w
Признаки и их значение
X,
...
X
...
Xn
ai,i...aij...ai,N
^„l-^j-arLN
arM+l,l-arj.i+U""ari-i+i,N
ari,i-ar.j...ar.>N
arm-i+i.l-arI11-l+iJ-arni.I+i,N
ar i...a, :...аг м
'in»1 rm»J ffn»1^
bi...bj...ON
Класс
n,
a
am
a 1
Это общая постановка задачи, решение которой можно
осуществить с помощью упомянутых основных математических моделей.
5.6. Восприятие и обработка информации
Через зрительный канал в мозг человека поступает от 70 до 90%
информации. Поэтому при создании ИС, воспринимающих
информацию извне, необходимо учитывать зрительное восприятие
человека. Основными функциями зрения человека являются:
общая ориентировка в окружающей среде; узнавание объектов;
запоминание наблюдаемых сцен; обучение и получение новой
информации. Восприятие видеоданных в ИС логично рассматривать в
такой последовательности: запоминание, выделение общей
информации об окружающей среде, распознавание образов,
содержательная интерпретация наблюдаемой сцены.
В этом направлении выделяют три основных типа задач:
собственно обработку изображений, когда и исходные данные, и
результаты обработки представляются в изобразительной форме; анализ
(интерпретацию, распознавание или «понимание») изображений,
когда входные данные являются изображением, а результат
представляется в неизобразительной форме, например в виде
текстового описания наблюдаемой сцены; синтез изображений (машинную
графику), когда на входе имеется описание (алгоритм построения)
272
изображения, а на выходе по нему
строится само изображение.
Взаимосвязь трех перечисленных типов
задач показана на рис. 5.26.
В последние годы системы,
решающие достаточно сложные и
«интеллектуальные» задачи обработки и
анализа видеоданных (изображе- р и с. 5.26. Взаимосвязь
направлений), КОТОрые Обычно работают СО ний цифровой обработки изобра-
входной информацией в виде полу- жений
тоновых или многоспектральных
изображений, объединяют под общим названием
автоматизированных систем обработки изображений (АСОИз). Одно из
направлений наиболее широкого практического применения АСОИз —
обработка результатов дистанционных исследований. Среди
прикладных областей, перспективных для применения АСОИз, следует
отметить: геологию (исследование и поиск природных и ископаемых
ресурсов); сельское и лесное хозяйство (обнаружение аномалий,
слежение за состоянием участков, предсказание урожая); анализ
состояния окружающей среды и климата; метеорологию
(предсказание погоды, анализ воздушных течений и температурных полей);
гидрологию и океанографию (наблюдение за водными ресурсами,
течениями, распределениями температуры, планктона, льдов);
картографию (составление фотографических и других карт,
накопление картографических данных, теоретический анализ); слежение за
движущимися объектами наземной поверхности (транспорт,
судовождение и т.д.); биомедицинский анализ (микробиология,
цитология, рентгенология, ультразвукоскопия, идентификация
отпечатков пальцев и состояния больных и т.д.); материаловедение
(обнаружение дефектов, структурный анализ); сборочные работы
(робототехника); ориентацию и анализ обстановки в реальном времени
(для различных видов транспорта, летательных и космических
аппаратов). Практически большинство задач в перечисленных
предметных областях решаются методом геоинформационной технологии.
В области машинной графики основными областями являются:
автоматизация проектирования (построение чертежей, двух- и
трехмерных моделей деталей), дизайнерские работы в таких
областях, как автомобиле- и самолетостроение, архитектура, пошив
одежды; автоматизация исследований (отображение в визуальной
форме результатов эксперимента); организация эффективного
взаимодействия человека с ЭВМ (графические языки, интерактивная
графика); синтез картин и сцен (для тренажеров самолето- и автодви-
18 — 3466
273
жения, в машинной живописи, в компьютерных играх); синтез
динамических картин (компьютерная мультипликация и
кинематография).
Проблемно-ориентированные прикладные АСОИз используют,
как правило, достаточно богатый арсенал различных методов и
средств обработки данных, анализируют различную входную
информацию, активно используют возможности человека. Наличие
разнородных компонентов, работающих совместно для достижения
общей цели, есть признаки превращения современных АСОИз в
интегрированные системы. Интеграция является одной из главных
тенденций развития современных АСОИз.
Прежде всего, АСОИз уже нельзя рассматривать обособленно
от ее окружения — средств сбора и передачи видеоданных, систем
обработки и анализа данных других типов. АСОИз,
рассматриваемая как элемент некой метасистемы, перестает быть элементом
изолированным, приобретает богатые информационные связи с
другими элементами. Это интеграция внешняя. Показательным
примером служит здесь японский проект создания ЭВМ пятого
поколения. Согласно этому проекту система распознавания образов и
изображений (наряду с системами машинного перевода, ответов на
запросы, понимания специализированного языка и решения
прикладных задач) является базовой в обеспечении интеллектуального
интерфейса человек — ЭВМ, при этом все упомянутые системы
должны работать параллельно и одновременно над единым
потоком данных, дополняя друг друга. Интеграция приводит к
появлению в составе АСОИз развитых средств коммуникации,
подсистемы накопления и хранения как исходных данных, так и
промежуточных и окончательных результатов (рис. 5.27). Внутренняя
интеграция затрагивает различные компоненты АСОИз: средства и
методы обработки, сами обрабатываемые данные.
Процессор обработки
изображений
Коммуникационный
процессор
1 1 1 1
Устройство
ввода-вывода
Системный
интерфейс (память)
I ZZ
Процессор
баз данных
| Система распределения!
ресурсов
Устройство обработки
(хранения) информации
Базы видеоданных
Рис. 5.27. Структура интегрированной АСОИз
274
Системы анализа изображений (САИ). Можно выделить три
основных класса задач, решаемых САИ, которые определяют их
различное назначение:
1. Распознавание образов.
2. Содержательная интерпретация изображений.
3. Получение справочной информации в архивах видеоданных.
Для решения указанных задач САИ должны обеспечивать
выполнение ряда функций, среди которых основными являются
следующие:
1. Хранение и поиск формализованных знаний о предметной
области и обработке изображений.
2. Выполнение операций обработки изображений.
3. Выполнение операций логических выводов на основе
формализованных знаний и результатов обработки видеоданных,
построение и проверка гипотез.
4. Анализ промежуточных результатов работы системы и
принятие решений о дальнейших действиях, невозможности решения
задачи, необходимости дополнительной информации и др.
5. Анализ запросов пользователя, поддержка диалога,
документирование действий системы и формирование пояснений
пользователю.
6. Пополнение баз знаний и видеоданных системы новыми
сведениями, данными.
Конкретная система не обязательно выполняет все
перечисленные функции, их набор определяется назначением системы.
Современные системы довольно разнообразны по своей структуре и
организации взаимодействия ее составных частей.
На рис. 5.28 приведена упрощенная система содержательной
интерпретации изображений.
Пользователь
Блок управления
и принятия решений
Г
*
Подсистема
хранения
и обработки
изображений
¦
Внешние
данные
Область внешней памяти
*
1
База знаний
Декларативные
знания
Процедурные
знания
Рис. 5.28. Структура системы анализа изображений
275
База
знаний
Модель
мира
База
данных
Устройство ввода
информации
Пользова-Л
тель
Программа
синтеза
изображения
Устройство
отображения
графической
информации
Банк
видеоданных
Устройство
получения
твердых копий
Рис. 5.29. Структура системы машинной графики
Системы машинной графики (СМГ). Машинная графика стала
обязательной частью любой ИС, реализованной на ЭВМ. Это
связано с тем, что скорость переработки человеком информации,
представленной в графической форме, выше по сравнению со
скоростью переработки алфавитно-цифрового набора данных.
Особенно заметен этот эффект на этапе восприятия информации, так как
при этом максимально активизируется ассоциативное мышление
человека. Наиболее ярко преимущества графического
представления данных проявляются в интерактивных системах машинной
графики, подразумевающей активную обратную связь с
пользователем. Такие СМГ используются как мощная интеллектуальная
поддержка в САНИ, АСНИ, экспертных системах и т.д.
Состав типичной СМГ представлен на рис. 5.29. Схематически
работу системы можно представить следующим образом. На
основании базы знаний и банка данных ЭВМ генерирует модель
«мира». Затем эта модель преобразуется программой синтеза
изображения в удобную для восприятия человеком форму.
Сформированная таким образом информация выдается на устройство
отображения графической информации, вызывая на нем появление
соответствующего изображения, которое может быть
задокументировано с помощью устройства получения твердых копий.
Вопросы для самопроверки
1. В чем заключается содержание поисковой процедуры?
2. Каково содержание информационно-документальной базы знаний?
3. Какова структура модели пользователя?
4. В чем заключается идея алгоритма поиска информационного документа?
5. Что из себя представляет процедурно-кибернетическая модель проектно-кон-
структорской деятельности?
276
6. Каково содержание инженерно-психологической модели принятия
оперативных решений?
7. Какова модель многокритериального выбора в условиях неопределенности?
8. Какие методы интеллектуальных технологий используются в управлении
технологическими системами в условиях неопределенности?
9. Как функционирует гибридная адаптивная система управления?
10. Каковы пути формализации процесса принятия решений?
11. В чем особенности функциональной структуры интеллектуализированной
СППР?
12. На каких технологических принципах строится интеллектуализированная
система поддержки управления?
13. На чем основывается построение структуры дерева знаний?
14. В чем заключается проблема распознавания образов?
15. Какова математическая постановка задачи распознавания образов?
16. Каковы системы обработки и анализа изображений?
Глава 6
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
И ЭКСПЕРТНЫЕ СИСТЕМЫ
В течение последних десятилетий в рамках исследований по
искусственному интеллекту (ИИ) сформировалось самостоятельное
направление — экспертные системы (ЭС), или инженерия знаний. В
задачу этого направления входят исследование и разработка
программ (устройств), использующих знания и процедуры вывода для
решения задач, являющихся трудными для людей-экспертов. В
отличие от специализированных систем ИИ экспертные системы
могут быть отнесены к системам ИИ общего назначения — системам,
которые не только исполняют заданные процедуры, но на основе
метапроцедур поиска генерируют и используют процедуры решения
новых конкретных задач [1].
Огромный интерес к ЭС со стороны пользователей вызван, по
крайней мере, тремя причинами:
1. Во-первых, они ориентированы на решение широкого круга
задач в неформализованных областях, на приложения, которые до
недавнего времени считались малодоступными для вычислительной
техники.
2. Во-вторых, с помощью ЭС специалисты, не знающие
программирования, могут самостоятельно разрабатывать
интересующие их приложения, что позволяет резко расширить сферу
использования вычислительной техники.
3. В-третьих, ЭС при решении практических задач достигают
результатов, не уступающих, а иногда и превосходящих
возможности людей-экспертов, не оснащенных ЭВМ.
Особенно широкое распространение ЭС получили в
проектировании интегральных микросхем, в поиске неисправностей, в
военных приложениях и автоматизации программирования. Применение
ЭС позволяет: I) при проектировании интегральных микросхем
повысить (по данным фирмы NEC) производительность труда в 3—6
раз, при этом выполнение некоторых операций ускоряется в 10—15
раз; 2) ускорить поиск неисправностей в сложных устройствах в
5—10 раз; 3) повысить производительность труда программистов
278
(по данным фирмы TOSHIBA) в 5 раз; 4) при профессиональной
подготовке сократить (без потери качества) в 8—12 раз затраты на
индивидуальную работу с обучаемыми.
В последнее время ведутся разработки ЭС для следующих
приложений: раннее предупреждение национальных и международных
конфликтов и поиск компромиссных решений; принятие решений в
кризисных ситуациях; охрана правопорядка; образование;
медицина; планирование и распределение ресурсов; система
организационного управления (кабинет министров, муниципалитет,
учреждение) и т.д.
6.1. Назначение и особенности
экспертных систем
Знания, которыми обладает специалист в какой-либо области
(дисциплине), можно разделить на формализованные (точные) и
неформализованные (неточные). Формализованные знания
формируются в книгах и руководствах в виде общих и строгих суждений
(законов, формул, моделей, алгоритмов и т.п.), отражающих
универсальные знания. Неформализованные знания, как правило, не
попадают в книги и руководства в связи с их конкретностью,
субъективностью и приблизительностью. Знания этого рода являются
результатом обобщения многолетнего опыта работы и интуиции
специалистов. Они обычно представляют многообразие эмпирических
(эвристических) приемов и правил.
В зависимости от того, какие знания преобладают в той или
иной области (дисциплине), ее относят к формализованным (если
преобладают точные знания) или к неформализованным (если
преобладают неточные знания) описательным областям. Задачи,
решаемые на основе точных знаний, называют формализованными, а
задачи, решаемые с помощью неточных знаний, —
неформализованными. (Речь идет не о неформализуемых, а о
неформализованных задачах, т.е. о задачах, которые, возможно, и формализуемы,
но эта формализация пока неизвестна.)
Традиционное программирование в качестве основы для
разработки программы использует алгоритм, т.е. формализованное
значение. Поэтому до недавнего времени считалось, что ЭВМ не
приспособлены для решения неформализованных задач. Расширение
сферы использования ЭВМ показало, что неформализованные
задачи составляют очень важный класс задач, вероятно, значительно
больший, чем класс формализованных задач. Неумение решать не-
279
формализованные задачи сдерживает внедрение ЭВМ в
описательные науки. По мнению авторитетов, основной задачей
информатики является внедрение ее методов в описательные науки и
дисциплины. На основании этого можно утверждать, что исследования в
области ЭС занимают значительное место в информатике.
К неформализованным задачам относятся те, которые обладают
одной или несколькими из следующих особенностей:
а) алгоритмическое решение задачи неизвестно (хотя,
возможно, и существует) или не может быть использовано из-за
ограниченности ресурсов ЭВМ (времени, памяти);
б) задача не может быть определена в числовой форме
(требуется символьное представление);
в) цели задачи не могут быть выражены в терминах точно
определенной целевой функции.
Как правило, неформализованные задачи обладают
неполнотой, ошибочностью, неоднозначностью и (или) противоречивостью
знаний (как данных, так и используемых правил преобразования).
Экспертные системы не отвергают и не заменяют
традиционного подхода к программированию, они отличаются от традиционных
программ тем, что ориентированы на решение неформализованных
задач и обладают следующими особенностями:
1) алгоритм решения не известен заранее, а строится самой ЭС
с помощью символических рассуждений, базирующихся на
эвристических приемах;
2) ясность полученных решений, т.е. система «осознает» в
терминах пользователя, как она получила решение;
3) способность анализа и объяснения своих действий и знаний;
4) способность приобретения новых знаний от
пользователя-эксперта, не знающего программирования, и изменения в
соответствии с ними своего поведения (открытая система);
5) обеспечение «дружественного», как правило,
естественно-языкового (ЕЯ) интерфейса с пользователем.
Обычно к ЭС относят системы, основанные на знании, т.е.
системы, вычислительная возможность которых является в первую
очередь следствием их наращиваемой базы знаний и только во вторую
очередь определяется используемыми методами. Методы
инженерии знаний (методы ЭС) в значительной степени инвариантны
тому, в каких областях они могут применяться. Области
применения ЭС весьма разнообразны: военные приложения, медицина,
электроника, вычислительная техника, геология, математика,
космос, сельское хозяйство, управление, финансы, юриспруденция и
т.д. В настоящее время ЭС используются при решении задач сле-
280
дующих типов: принятие решений в условиях неопределенности
(неполноты информации), интерпретации символов и сигналов,
предсказание, диагностика, конструирование, планирование,
управление, контроль и др.
6.2. Структура и режимы
экспертной системы
Типичная ЭС состоит из следующих основных компонентов
(рис. 6.1): решателя (интерпретатора), рабочей памяти (РП),
называемой также базой данных (БД), базы знаний (БЗ), компонентов
приобретения знаний, объяснительного и диалогового [1].
База данных предназначена для хранения исходных и
промежуточных данных решаемой в текущей момент задачи. Этот
термин совпадает по названию, но не по смыслу с термином,
используемым в информационно-поисковых системах (ИПС) и
системах управления базами данных (СУБД) для обозначения всех
данных (и в первую очередь не текущих, а долгосрочных),
хранимых в системе.
База знаний в ЭС предназначена для хранения долгосрочных
данных, описывающих рассматриваемую область (а не текущих
данных), и правил, описывающих целесообразные преобразования
данных этой области.
Решатель, используя исходные данные из БД и знания из БЗ,
формирует такую последовательность правил, которые, будучи
примененными к исходным данным, приводят к решению задачи.
Компонента приобретения знаний автоматизирует процесс
наполнения ЭС знаниями, осуществляемый
пользователем-экспертом.
Эксперт-
пользователь
| ДИАЛОГ |
Объяснение
t
Рабочая
память (БД)
t
1 '
Приобретение
знаний
Решатель
Правила
Общие факты
Рис. 6.1. Схема обобщенной экспертной системы
281
Объяснительная компонента объясняет, как система получила
решение задачи (или почему она не получила решения) и какие
знания при этом она использовала, что облегчает эксперту
тестирование системы и повышает доверие пользователя к полученному
результату.
Диалоговая компонента ориентирована на дружелюбное общение
со всеми категориями пользователей, как в ходе решения задач, так
и в ходе приобретения знаний, объяснения результатов работы.
В разработке ЭС участвуют представители следующих
специальностей: эксперт в той проблемной области, задачи которой
будет решать ЭС; инженер по знаниям (когнитолог) — специалист по
разработке ЭС; программист — специалист по разработке
инструментальных средств (ИтС). Необходимо отметить, что отсутствие
среди участников разработки инженера по знаниям (т.е. его замена
программистом) либо приводит к неудаче в процессе создания ЭС,
либо значительно удлиняет его.
Эксперт определяет знания (данные и правила),
характеризующие проблемную область, обеспечивает полноту и правильность
введения в ЭС знаний.
Инженер по знаниям помогает эксперту выявить и
структурировать знания, необходимые для работы ЭС, осуществляет выбор
того ИтС, которое наиболее подходит для данной проблемной
области, и определяет способ представления знаний в этом ИтС,
выделяет и программирует (традиционными средствами) стандартные
функции (типичные для данной проблемной области), которые
будут использоваться в правилах, вводимых экспертом.
Уже при разработке первых ЭС стало очевидно, что наиболее
ответственным этапом является построение БЗ, для чего в общем
случае и необходим посредник — так называемый инженер по знаниям
(или аналитик), который должен обеспечить проведение
домашинных этапов разработки систем, основанных на знаниях (СОЗ),
заключающихся, как правило, в анализе предметной области,
извлечении знаний из эксперта и их структурировании.
Эти процедуры оказались самыми тяжелыми, поскольку, с одной
стороны, чрезвьиайно высок уровень требований, предъявляемых к
личности инженера по знаниям (высококвалифицированный
специалист в вычислительной науке, обладающий способностями к
контакту с экспертами, умеющий побудить эксперта поставлять
нужную информацию, умеющий отделять главное от
второстепенного и т.д.), а с другой — стали наблюдаться трудности с поисками
собственно экспертов (например, эксперт испытывает затруднения с
282
четкой формулировкой своих знаний, не всегда расположен
полностью делиться знаниями и т.п.).
Поэтому почти одновременно с появлением индустрии знаний
стали разрабатываться автономные системы, автоматизирующие
процессы получения необходимой информации от экспертов.
Позднее подобные программные средства получили название «оболочек
приобретения», а затем — инструментальных средств.
Программист разрабатывает ИтС, содержащее в пределе все
основные компоненты ЭС, осуществляет сопряжение ИтС с той
средой, в которой оно может быть использовано.
Экспертная система работает в двух режимах: приобретения
знаний и решения задач (последняя называется также режимом
консультации, или режимом использования ЭС).
В режиме приобретения знаний общение с ЭС осуществляет
эксперт через посредничество инженера по знаниям. Эксперт
описывает проблемную область в виде совокупности данных и правил.
Данные определяют объекты, их характеристики и значения,
существующие в области экспертизы. Правила определяют способы
манипулирования данными, характерные для рассматриваемой
проблемной области. Эксперт, используя компонент приобретения
знаний, наполняет систему знаниями, которые позволяют ЭС в
режиме решения самостоятельно (без эксперта) решать задачи из
проблемной области.
Важную роль в режиме приобретения знаний играет
объяснительный компонент. Именно благодаря ему эксперт на этапе
тестирования локализует причины неудачной работы ЭС, что позволяет
эксперту целенаправленно моделировать старые или вводить новые
знания. Обычно объяснительный компонент сообщает следующее:
как правильно использовать информацию пользователя; почему
использовались или не использовались данные или правила; какие
были сделаны выводы и т.п. Все объяснения делаются, как
правило, на ограниченном естественном языке или языке графики.
Отметим, что режиму приобретения знаний при традиционном
подходе к разработке программ соответствуют этапы алгоритмизации,
программирования и отладки, выполняемые программистом.
Таким образом, в отличие от традиционного подхода разработку
программ осуществляет эксперт (с помощью ЭС), не владеющий
программированием, а не программист.
В режиме консультации общение с ЭС осуществляет конечный
пользователь, которого интересует результат и (или) способ
получения решения. Пользователь в зависимости от назначения ЭС
может не быть специалистом в данной проблемной области. Тогда, не
283
умея получить ответ сам, он обращается к ЭС, чтобы либо
ускорить процесс получения результата, либо возложить на ЭС
рутинную работу. Термин «пользователь» является многозначным, так
как кроме конечного пользователя применять ЭС может и эксперт,
и инженер по знаниям, и программист. Поэтому, когда хотят
подчеркнуть, что речь идет о том, для кого делалась ЭС, используют
термин «конечный пользователь».
В режиме консультации данные о задаче пользователя
обрабатываются диалоговой компонентой, которая выполняет
следующие действия: распределяет роли участников (пользователя и ЭС)
и организует их взаимодействие в процессе кооперативного
решения задачи; преобразует данные пользователя о задаче,
представленные на первичном для пользователя языке, во внутренний
язык системы; преобразует сообщения системы, представленные
на внутреннем языке, в сообщения на языке, привычном для
пользователя (обычно это ограниченный естественный язык или
язык графики). В общем случае процесс решения задачи с
помощью ЭС в режиме консультации может быть представлен в виде
схемы (рис. 6.2) [1,43].
После обработки данные поступают в РП. На основе входных
данных из РП, общих данных о проблемной области и правил из
БЗ решатель (интерпретатор) формирует решение задачи.
В отличие от традиционных программ ЭС в режиме задачи не
только исполняет предписанную последовательность операций, но и
предварительно формирует ее. Если ответ ЭС не понятен
пользователю, он может потребовать объяснения, как ответ получен.
Конечный пользователь
. X .
Задание вопросов пользователю для формирования начальных знаний
о ситуации в проблемной области
Г
Сопоставление этих знаний с БЗ, сформированной экспертом
*
Задание вопросов (возможно, но не обязательно) с целью I
дополнения отсутствующих знаний о ситуации
*
Осуществление вывода и выдача решений (с объяснениями I
при необходимости)
г
Пользователь
Рис. 6.2. Процесс решения задачи с помощью ЭС в режиме консультации
284
6.3. Классификация экспертных систем
Экспертные системы как любой сложный объект можно
определить только совокупностью характеристик. Выделим следующие
характеристики ЭС:
A. Назначение.
Б. Проблемная область.
B. Глубина анализа проблемной области.
Г. Тип используемых методов и знаний.
Д. Класс системы.
Е. Стадия существования.
Ж. Инструментальные средства.
Перечисленный набор характеристик не претендует на полноту
(в связи с отсутствием общепринятой классификации), а определяет
ЭС как целое, не выделяя отдельных компонентов (способ
представления знаний, решения задач и т.п.).
А. Назначение определяется следующей совокупностью
параметров: цель создания ЭС — для обучения специалистов, для
решения задач, для автоматизации рутинных работ, для тиражирования
знаний экспертов и т.п.; основной пользователь — не специалист в
области экспертизы, специалист, учащийся.
Б. Проблемная область может быть определена совокупностью
параметров: предметной областью и задачами, решаемыми в
предметной области, каждый из которых может рассматриваться с точки
зрения как конечного пользователя, так и разработчика ЭС.
С точки зрения пользователя, предметную область можно
характеризовать описанием области в терминах пользователя,
включающим наименование области, перечень и взаимоотношение
подобластей и т.п., а задачи, решаемые существующими ЭС, — их
типом. Обычно выделяют следующие типы задач:
• интерпретация символов или сигналов — составление
смыслового описания по входным данным;
• предсказание — определение последствий наблюдаемых
ситуаций;
• диагностика — определение состояния неисправностей,
заболеваний по признакам (симптомам);
• конструирование — разработка объекта с заданными
свойствами при соблюдении установленных ограничений;
• планирование — определение последовательности действий,
приводящих к желаемому состоянию объекта;
285
• слежение — наблюдение за изменяющимся состоянием
объекта и сравнение его показателей с установленными или желаемыми;
• управление — воздействие на объект для достижения
желаемого поведения.
С точки зрения разработчика целесообразно выделять
статические и динамические предметные области. Предметная область
называется статической, если описывающие ее исходные данные не
изменяются во времени (точнее рассматриваются как не
изменяющиеся за время решения задачи). Статичность области означает
неизменность описывающих ее исходных данных. Если исходные
данные, описывающие предметную область, изменяются за время
решения задачи, то предметную область называют динамической.
Кроме того, предметные области можно характеризовать
следующими аспектами: числом и сложностью сущностей, их атрибутов и
значений атрибутов; связностью сущностей и их атрибутов;
полнотой знаний; точностью знаний (знания точны или правдоподобны;
правдоподобность знаний представляется некоторым числом или
высказыванием).
Решаемые задачи, с точки зрения разработчика ЭС, также
можно разделить на статические и динамические. Будем говорить, что
ЭС решает динамическую или статическую задачу, если процесс
решения задачи изменяет или не изменяет исходные данные о
текущем состоянии предметной области.
В подавляющем большинстве существующих ЭС исходят из
предположения статичности предметной области и решают
статистические задачи. Будем называть такие ЭС статическими. ЭС,
которые имеют дело с динамическими предметными областями и
решают статистические или динамические задачи, будем называть
динамическими. В последние годы стали появляться первые
динамические ЭС. Видимо, решение многих важнейших практических
неформализованных задач возможно только с помощью
динамических, а не статических ЭС. Следует подчеркнуть, что на
традиционных (числовых) последовательных ЭВМ с помощью
существующих методов инженерии знаний можно решать только статические
задачи, а для решения динамических задач, составляющих
большинство реальных приложений, необходимо использовать
специализированные символьные ЭВМ.
На рис. 6.3 представлена архитектура статической и
динамической ЭС [1,43 ]. Статическая ЭС совпадает с традиционной схемой
(см. рис. 6.1).
Решаемые задачи, кроме того, можно характеризовать
следующими аспектами: числом и сложностью правил, используемых в за-
286
Статическая ЭС
Интерфейс
с БД и/или
ппп
Диалоговый
компонент
<=>
i
Объяснительный
компонент
Рабочая
память
гО=?Н
i
Компонент
приобретения
знаний
Решатель
К=^
i
База
знаний
Динамическая ЭС
Система
Подсистема моделирования
внешнего мира
Подсистема сопряжения с внешним миром
* t t
Локальная система (контроллер)
Технические устройства
Датчики
Рис. 6.3. Архитектура статической и динамической ЭС
даче; связностью правил; пространством поиска; количеством
активных агентов, изменяющих предметную область; классом
решаемых задач.
По степени сложности выделяют простые и сложные правила.
К сложным относят правила, текст знаний которых на
естественном языке занимает 1/3 страницы и больше. Правила, текст
которых занимает менее 1/3 страницы, относят к простым.
По степени связности правил задачи делятся на связные и
малосвязные. К связным относят задачи (подзадачи), которые не
удается разбить на независимые задачи. Малосвязные задачи удается
разбить на некоторое количество независимых подзадач.
Можно сказать, что степень сложности определяется не просто
общим количеством правил данной задачи, а количеством правил в
ее наиболее связной независимой подзадаче.
Пространство поиска может быть определено, по крайней мере,
тремя подаспектами: размером, глубиной и шириной. Размер
пространства поиска дает обобщенную характеристику сложности
задачи. Выделяют малые (до 10! состояний) и большие (свыше 10!
состояний) пространства поиска. Глубина пространства поиска
характеризуется средним числом последовательно применяемых
правил, преобразующих исходные данные в конечный результат, шири-
287
на пространства — средним числом правил, пригодных к
выполнению в текущем состоянии.
Количество активных агентов существенно влияет на выбор
метода решения. Выделяют следующие значения данного аспекта: ни
одного агента, один агент, несколько агентов.
Класс решаемых задач характеризует методы, используемые ЭС
для решения задачи. Данный аспект в существующих ЭС применяет
следующие значения: задачи расширения, доопределения,
преобразования. Задачи расширения и доопределения являются
статическими, а задачи преобразования — динамическими.
К задачам расширения относятся задачи, в процессе решения
которых осуществляется только увеличение информации о
предметной области. Они не приводят ни к изменению ранее
выведенных данных, ни к выбору другого состояния области. Типичный
задачей этого класса являются задачи классификации.
К задачам доопределения относятся задачи с неполной или
неточной информацией о реальной предметной области. Цель их
решения — выбор из множества альтернативных текущих состояний
предметной области того, которое адекватно исходным данным. В
случае неточных данных альтернативные текущие состояния
возникают как результат ненадежности данных и правил, что
приводит к многообразию различных доступных выводов из одних и тех
же исходных данных. В случае неполных данных альтернативные
состояния являются результатом доопределения области, т.е.
результатом предположений о возможных значениях недостающих
данных.
К задачам пре;образования относятся задачи, которые
осуществляют изменения исходной или выведенной ранее информации о
предметной области и являются следствием изменений либо
реального мира, либо его модели.
Большинство существующих ЭС решают задачи расширения, в
которых нет ни изменений предметной области, ни активных
агентов, преобразующих предметную область. Подобное ограничение
неприемлемо при работе в динамических областях.
В. По степени сложности структуры ЭС делят на поверхностные
и глубинные. Поверхностные ЭС представляют знания об области
экспертизы в виде правил (условие -* действие). Условие полного
правила определяет образец некоторой ситуации, при соблюдении
которой правило может быть выполнено. Поиск решения состоит в
выполнении тех правил, образцы которых сопоставляются с
текущими данными (текущей ситуации в РП). Глубинные ЭС, кроме
возможностей поверхностных систем, обладают способностью при
288
возникновении неизвестной ситуации определять с помощью
некоторых общих принципов, справедливых для области экспертизы,
какие действия следует выполнять.
Г. По типу используемых методов и знаний ЭС делят на
традиционные и гибридные. Традиционные ЭС используют в основном
неформализованные методы инженерных знаний и
неформализованные знания, полученные от экспертов. Гибридные ЭС
используют и методы инженерии знаний, и формализованные методы, а
также данные традиционного программирования и математики.
Сейчас говорят о трех поколениях ЭС. К первому поколению
следует относить статические поверхностные ЭС, ко
второму — статические глубинные ЭС (иногда ко второму поколению
относят гибридные ЭС), а к третьему — динамические ЭС
(вероятно, они, как правило, будут глубинными и гибридными).
Д. В последнее время выделяются два больших класса ЭС
(существенно отличающихся по технологии их проектирования),
которые условно можно назвать простыми и сложными ЭС. Простая
ЭС может быть охарактеризована следующими основными
показателями: поверхностная ЭС; традиционная ЭС (реже гибридная);
выполненная на персональной ЭВМ. Сложная ЭС может быть
охарактеризована следующими показателями: глубинная ЭС;
гибридная ЭС; выполненная либо на символьной ЭВМ, либо на мощной
универсальной ЭВМ, либо на интеллектуальной рабочей станции.
Е. По стадиям жизненного цикла ЭС можно подразделить на
такие, которые используются при проектировании технических и
информационных объектов и применяются интегрирование с
CAD-system или САПР. На стадии технологического производства
ЭС используются совместно с CAM-system как системы
технологической подготовки производства, контроля и управления
технологическим процессом.
На стадии эксплуатации ЭС используются совместно с
CAE-system и обеспечивают интеллектуальную поддержку
технического обслуживания сложных систем.
Ж. В заключение следует отметить, что единую классификацию
всех существующих на сегодня ИтС для ЭС провести достаточно
сложно, так как, с одной стороны, можно выделить большое
количество специфических характеристик ИтС, а с другой стороны, у
разных авторов существуют значительные различия в
терминологии обозначения одних и тех же вещей.
На рис. 6.4 приведен пример классификации ИтС из ранних
работ по ЭС. В современных публикациях авторы предпочитают
все ИтС разбивать на две отдельные группы: языки программиро-
19 — 3466
289
1
ИтС
Языки
программирования
Языки инженерии
знаний
Вспомогательные
средства
Средства
поддержки
№
Проблемно-ориентированные
Языки символьной обработки
№
m
№
Скелетные
Универсальные
Приобретение знаний
Проектирование
Программирование
Объяснение
Рис. 6.4. Классификация ИтС в ранних работах по ЭС
вания искусственного интеллекта (ИИ) и собственно ИтС, и более
детально рассматривать классификацию ИтС как
специализированных программных оболочек, предназначенных для создания ЭС
[1-12, 31, 43].
В самом обобщенном виде этот подход описывается в работе
[40], где предлагается классификация ИтС на основе следующих
базовых параметров: уровень используемого языка; машина вывода
(решатель); методы описания ПО и др.; способ представления
знаний; парадигма программирования.
На рис. 6.5—6.9 показаны классификации ИтС по указанным
параметрам. На рис. 6.5 все ИтС перечислены в порядке убывания
трудозатрат, необходимых при создании ЭС с их помощью. На рис.
6.8 дана классификация ИтС по параметру, связанному не с
машиной вывода, а с общими способами рассуждений, принятыми в
конкретных предметных областях.
Машиной вывода (решателем) в ЭС, как уже упоминалось,
называют набор средств, реализующих тот или иной способ
рассуждения, технологию поиска в базе знаний, стратегию разрешения
конфликтов, обработку неопределенности и ошибок. Подавляющее
большинство совместимых статических ИтС ориентированы на
реализацию дедуктивного способа рассуждений, причем акценты
делаются на такие параметры логического вывода, как структура
процесса получения решения; методы поиска решения; стратегии
разрешения конфликтов; управление достоверностью и др.
290
ИтС
Традиционные (в том числе объектно-ориентированные)
языки программирования (С, C++ и др.)
Символьные языки программирования (LISP, Prolog
и их разновидности)
Инструментарий, содержащий многие (но не все) 1
компоненты 3C(OPS-5, ИЛИСи др.) |
Оболочки и среды разработки общего назначения, 1
содержащие все компоненты 3C(EMMYCIN, Leonardo,
ЭКО, GURU, Nexpert Object, ProKappa, Level 5 Object,
ART*Enterprise и др.)
Специализированные
оболочки
(среды)
Проблемно- специализированные
средства (ориентированные
на некоторый класс решаемых задач)
Предметно-ориентированные
средства (включающие знания
о некоторых типах
предметных областей)
Рис. 6.5. Классификация ИтС по уровню используемого языка
Конкретные значения этих параметров могут выступать как
некоторые критерии оценки машины вывода.
Следует отметить, что из всего многообразия моделей в
современных ИтС используются только правила и объекты (фреймы).
Напомним также, что ИтС, имеющие в своем составе более двух
моделей представления знаний, называются гибридными.
Комментируя классификацию, приведенную на рис. 6.9,
следует отметить, что подход на базе поверхностных знаний заключается в
извлечении из эксперта фрагментов эвристических знаний о
данной ПО, которые релевантны решаемой задаче, причем не
предпринимается никаких попыток глубинного изучения области, что
ИтС
Использующие процедурное программирование
Использующие объектно-ориентированное 1
программирование
Использующие программирование, 1
ориентированное на данные |
Использующие программирование, 1
ориентированное на правила
Рис. 6.6. Классификация ИтС по парадигмам программирования (механизм
реализации исполняемых утверждений)
19*
291
ИтС
Использующие модели представления знаний
в виде правил (продукций)
Использующие модели представления знаний
в виде фреймов или объектов
Использующие модели представления знаний
в виде семантических сетей
Использующие логические модели представления
знаний (исчисление предикатов)
Рис. 6.7. Классификация ИтС по способу представления знаний в ЭС,
характеризующемуся моделью представления знаний
предопределяет использование поиска в пространстве состояний в
качестве универсального механизма вывода. Как правило, этот
подход применяется к задачам, которые не могут быть точно
описаны, и в качестве способа представления знаний выбираются
правила. Если же задача может быть заранее структурирована или при
ее решении можно воспользоваться некоторой моделью, то такой
подход неэффективен.
Структурированный подход используется в качестве развития
поверхностного подхода в том случае, если применение
поверхностного не обеспечивает решения задачи. Используя декомпозицию
задачи на подзадачи (дерево подзадач), можно затем решать
каждую задачу на основе поверхностного или глубинного подхода, а
возможно, и их комбинации.
При использовании глубинного подхода к решению задачи
качество и компетентность ЭС будут зависеть от модели ПО, причем
эта модель может быть определена различными способами (декла-
ИтС
Поддерживающие дедуктивный способ
рассуждений
Поддерживающие индуктивный способ
рассуждений
Поддерживающие способ рассуждений 1
по аналогам или на основе прецедентов
Поддерживающие способ рассуждений 1
посредством выдвижения гипотез
Рис. 6.8. Классификация ИтС по реализации различных способов
рассуждений
292
ИтС
Реализующие подход, базирующийся
на поверхностных знаниях
Реализующие подход, базирующийся
на структурировании процесса решения
Реализующие подход, базирующийся
на глубинных знаниях
Реализующие смешанный подход, базирующийся 1
на использовании поверхностных и глубинных знаний
Рис. 6.9. Классификация ИтС по методам описания проблемных областей
ративно, процедурно). При глубинном подходе используются ИтС
с мощными моделирующими возможностями, а именно объекты
(фреймы) с присоединенными процедурами, иерархическое
наследование свойств, активные объекты, механизмы передачи
сообщений объектам и т.д.
Соотнося описанные выше подходы с типами ПО, можно более
детально классифицировать и оценивать конкретные ИтС по
данному параметру.
При проектировании ИнС перед разработчиками неизменно
встает вопрос о выборе подходящего формализма для представления
знаний. Решение этого вопроса является не только важнейшей
стратегической задачей при разработке ИнС, но и достаточно
сложной экспертной задачей.
Рассмотрим некоторые предложения (или критерии) по выбору
адекватного формализма для представления знаний. Поскольку
процесс выбора является творческой задачей и на сегодня не
существует исчерпывающих рекомендаций по ее решению, то
зафиксируем некоторые экспертные знания по этому вопросу [24,43].
Ниже представлены восемь критериев (рекомендаций) по
выбору модели представления знаний на основе учета базовых
характеристик предметной области — понятийной структуры предметной
области, отношений между принятыми моделями и способов
рассуждений, принятых в предметной области. Для удобства все
критерии сформулированы как правила вида: «Если (условие), то
(действие)».
1. ЕСЛИ понятия простые И отношения между ними
выражаются в языке исчисления предикатов И способ рассуждений
дедуктивный, ТО целесообразно использовать логические модели.
293
2. ЕСЛИ понятия являются в основном простыми И есть
небольшое число отношений на понятиях И способ рассуждений
индуктивный, ТО целесообразно использовать индуктивные модели.
3. ЕСЛИ понятия устроены сложным образом И есть большое
число отношений на понятиях И способ рассуждений —
выдвижение гипотез, ТО целесообразно использовать сетевые модели.
4. ЕСЛИ понятия устроены сложным образом И есть
небольшое число отношений на понятиях И способ рассуждений
дедуктивный, ТО целесообразно использовать наследственно-конечные
модели (типа тезаурусов).
5. ЕСЛИ понятия устроены сложным образом И большое число
отношений на понятиях И способ рассуждений по аналогии или
дедуктивный, ТО целесообразно использовать фреймовые модели.
6. ЕСЛИ понятия устроены простым образом И большое число
отношений на понятиях И способ рассуждений дедуктивный, ТО
целесообразно использовать продукционные модели.
1. ЕСЛИ понятия устроены сложным образом И структура
многих понятий не ясна И способ рассуждений — выдвижение
гипотез, ТО целесообразно использовать сетевые модели.
8. ЕСЛИ понятия устроены сложным образом И есть большое
число отношений на понятиях И способ рассуждений
индуктивный, ТО подходящий формализм отсутствует.
С точки зрения классификации знаний по «глубине» и
«жесткости» можно также предложить некоторые критерии выбора
модели представления знаний, сформулированные в виде
следующих правил.
1. ЕСЛИ представляемые знания являются поверхностными И
жесткими, ТО целесообразно использовать логические модели.
2. ЕСЛИ представляемые знания являются поверхностными И
мягкими ИЛИ жесткими, ТО целесообразно использовать
продукционные модели.
3. ЕСЛИ представляемые знания являются глубинными И
мягкими ИЛИ жесткими, ТО целесообразно использовать модели в
виде семантических сетей или фреймов (объектно-ориентированные
модели).
Вопросы для самопроверки
1. Каковы особенности ЭС?
2. Какова структура ЭС?
3. Какие существуют режимы работы ЭС?
4. Каково содержание процедуры решения задач с помощью ЭС?
294
5. Каковы основные характеристики ЭС?
6. Какие существуют классификации ЭС?
7. В чем отличие статической ЭС от динамической?
8. Каковы критерии выбора адекватного формализма для представления знаний
вЭС?
Глава 7
ПОСТРОЕНИЕ ЭКСПЕРТНОЙ СИСТЕМЫ
Разработка (проектирование) ЭС существенно отличается от
разработки обычного программного продукта. Опыт разработки
ранних ЭС показал, что использование при разработке методологии,
принятой в традиционном программировании, либо чрезмерно
затягивает процесс создания ЭС, либо вообще приводит к
отрицательному результату. Дело в том, что неформализованность задач,
решаемых ЭС, отсутствие завершенной теории ЭС и методологии
их разработки приводит к необходимости модифицировать их
принципы и способы построения ЭС в ходе процесса разработки по
мере того, как увеличивается знание разработчиков о проблемной
области.
7.1. Технология разработки
экспертной системы
Перед тем как приступить к разработке ЭС, инженер по
знаниям должен рассмотреть вопрос, следует ли разрабатывать ЭС для
данного приложения. В обобщенном виде ответ может быть таким:
использовать ЭС следует тогда, когда разработка ЭС: 1) возможна,
2) оправдана и 3) методы инженерии знаний соответствуют
решаемой задаче.
1. Чтобы разработка ЭС была возможна (для данного
приложения), необходимо одновременное выполнение, по крайней мере,
следующих требований:
• существуют эксперты в данной области, которые решают
задачу значительно лучше, чем начинающие специалисты;
• эксперты должны сходиться в оценке предлагаемого
решения, иначе нельзя будет оценить качество разработанной ЭС;
• эксперты должны уметь выразить на естественном языке
(вербализовать) и объяснить используемые ими методы, в
противном случае трудно рассчитывать на то, что знания экспертов будут
«извлечены» и вложены в ЭС;
296
• задача, возложенная на ЭС, требует только рассуждений, а не
действий (если требуется действие, то необходимо объединять ЭС с
роботами);
• задача не должна быть слишком трудной, ее решение должно
занимать у эксперта несколько часов, а не дней или недель;
• задача хотя и не должна быть выражена в формальном виде,
но все же должна относиться к достаточно «понятной» и
структурированной области, т. е. должны быть выделены основные
понятия, отношения и известные (хотя бы эксперту) способы
получения решения задач;
• решение задачи не должно в значительной степени
использовать «здравый смысл» (т.е. широкий спектр общих сведений о мире
и о способе его функционирования, которые знает и умеет
использовать любой нормальный человек), так как подобные знания пока
не удается (в достаточном количестве) вложить в системы
искусственного интеллекта.
Использование ЭС в данном приложении может быть
возможно, но не оправдано.
2. Применение ЭС может быть оправдано одним из следующих
факторов:
• решение задачи принесет значительных эффект, например,
при использовании ЭС для поиска полезных ископаемых;
• использование человека-эксперта невозможно либо из-за
недостаточного количества экспертов, либо из-за необходимости
выполнять экспертизу одновременно в различных местах;
• при передаче информации эксперту происходит
недопустимая потеря времени или информации;
• при необходимости решать задачу в окружении, враждебном
для человека.
3. Приложение соответствует методам ЭС, если решаемая
задача обладает совокупностью следующих характеристик:
• может быть естественным образом решена посредством
манипуляции символами (т.е. с помощью символьных рассуждений),
а не с числами (как принято в математических методах и
традиционных программах);
• должна иметь эвристическую (не алгоритмическую) природу,
т.е. ее решение должно сводиться к применению эвристических
правил; задачи, которые могут быть гарантировано решены (с
соблюдением заданных ограничений) с помощью некоторых
формальных процедур, не подходят для применения ЭС;
297
• должна быть достаточно сложной, чтобы оправдать затраты
на разработку ЭС, однако не должна быть чрезмерно сложной
(решение занимает у эксперта часы, а не недели), чтобы ЭС могла ее
решить;
• должна быть достаточно узкой, чтобы решаться методами
инженерии знаний, и практически значимой.
При разработке ЭС используется концепция «быстрого
прототипа». Суть ее состоит в том, что разработчики не пытаются сразу
создать конечный продукт. На начальном этапе они создают
прототип (прототипную) ЭС, который должен удовлетворять двум
противоречивым требованиям: с одной стороны, решать типовые
задачи конкретного приложения, а с другой —время и
трудоемкость его разработки должны быть весьма незначительны, чтобы
можно было максимально запараллелить процесс накопления и
отладки знаний (осуществляемый экспертом) с процессом выбора
(разработки) программных средств (осуществляемым инженером
по знаниям и программистом). Прототип должен
продемонстрировать пригодность методов инженерии знаний для данного
приложения. В случае успеха эксперт с помощью инженера по знаниям
расширяет знания прототипа о проблемной области. При неудаче
может потребоваться разработка нового прототипа или
разработчики могут прийти к выводу о непригодности методов инженерии
знаний для данного приложения.
В выходе работ по созданию ЭС сложилась определенная
технология их разработки, включающая шесть следующих этапов:
идентификация, концептуализация, формализация, выполнение,
тестирование, опытная эксплуатация (рис. 7.1).
Рассмотрим этапы разработки ЭС [1,8].
эс
Начало
Опытная эксплуатация
Идентификация
I Требования
Концептуализация^—'
Переформулирование
т
—[ Тестирование |
Завершение
Правила
Усовершенствование г=—¦
—-| Выполнение
Понятия
Переконструирование
±
Формализация
Структуры
знаний
Рис. 7.1 Технология разработки ЭС
298
Этап идентификации. На данном этапе идентифицируются
(определяются) задачи, которые подлежат решению, выявляются цели
разработки, определяются участники процесса проектирования и
их роли (эксперты и категории пользователей), ресурсы.
Идентификация задачи заключается в составлении
неформального (вербального) описания решаемой задачи. В этом описании
указываются: общие характеристики задачи; подзадачи, выделяемые
внутри данной задачи; ключевые понятия (объекты),
характеристики и отношения; входные (выходные) данные; предположительный
вид решения; знания, релевантные решаемой задачи; примеры
(тесты) решения задачи. Цель идентификации задачи —
характеризовать задачу и структуру поддерживающих ее знаний и таким
образом обеспечить начальный импульс для развития БЗ. Если исходная
задача оказывается слишком сложной с точки зрения имеющихся
ресурсов, то этап идентификации может потребовать нескольких
итераций.
В ходе идентификации задачи (задач) необходимо ответить на
следующие вопросы:
• Какие задачи предлагается решать ЭС и как они могут быть
охарактеризованы и определены?
• На какие задачи разбивается каждая задача и какие данные
они используют?
• Каковы основные понятия и взаимоотношения, используемые
при формулировании и решении задачи?
• Какие знания релевантны решаемой задачи?
• Какие ситуации препятствуют решаемой задачи?
• Как эти препятствия будут влиять на ЭС?
Идентификация целей заключается в формулировании в явном
виде целей построения ЭС. При этом важно отличать цели, ради
которых создается ЭС, от задач, которые она должна решать.
Примерами возможных целей являются:
• формализация неформальных знаний экспертов;
• улучшение качества решений, принимаемых экспертом;
• автоматизация рутинных аспектов работы эксперта
(пользователя);
• тиражирование знаний эксперта.
Определение участников и их ролей сводится к определению
количества экспертов и инженеров по знаниям, а также форм их
взаимоотношения. Обычно в основном цикле разработки ЭС
участвует не менее трех-, четырех человек — один эксперт, один или два
инженера по знаниям и один программист, привлекаемый для мо-
299
дификации и согласования инструментальных средств (ИтС). К
процессу разработки могут привлекаться и другие участники,
группа экспертов с руководителем и др. Что касается формы
взаимоотношения экспертов и инженеров, то применяются следующие
формы: эксперт выполняет роль информирующего или учителя, а
инженер роль ученика. Форма учитель-ученик больше соответствует
реальности. В процессе идентификации задачи инженер и эксперт
работают в тесном контакте.
При проектировании ЭС типичными ресурсами являются:
источники знаний, время разработки, вычислительные средства
(возможности ЭВМ и программной ИнС) и объем финансирования.
Для достижения успеха эксперт и инженер должны использовать
все доступные им источники знаний.
Этап концептуализации. Эксперт и инженер по знаниям
объясняют и выделяют ключевые понятия, отношения (упомянутые на
этапе идентификации) и характеристики, необходимые для описания
решения задачи. На этом этапе определяются следующие
особенности задачи:
• типы доступных данных;
• исходные и выводимые данные:
• подзадачи общей задачи;
• используемые стратегии и гипотезы; виды взаимосвязей
между объектами проблемной области;
• типы используемых отношений (иерархия,
причина-следствие, часть-целое и т.п.);
• процессы, используемые в ходе решения задачи; типы
ограничений, накладываемых на процессы, используемые в ходе
решения;
• состав знаний, используемых для решения задачи;
• состав знаний, используемых для оправдания (объяснения)
решения.
На данном этапе (как и на этапе идентификации) может
потребоваться несколько повторных взаимодействий между экспертом и
инженером по знаниям, что приводит к значительным затратам
времени. Опыт разработок ЭС убеждает в том, что на данном этапе
невозможно, да и не нужно добиваться корректности и полноты
разрабатываемой ЭС. Необходимо как можно раньше переходить к
следующим этапам (формализации и выполнению).
Этап формализации. На данном этапе все ключевые понятия и
отношения, введенные на этапе концептуализации, выражаются на
некотором формальном языке, предложенном (выбранном) инже-
300
нером по знаниям. Он определяет, подходят ли имеющиеся ИнС
для решения рассматриваемой проблемы или необходимы
оригинальные разработки. Выходом этапа формализации является
описание того, как рассматриваемая задача может быть представлена в
выбранном или разработанном формализме.
Процесс формализации зависит от трех основных факторов:
• структуры пространства поиска, характеризующей
особенности решаемой задачи;
• модели, лежащей в основе процесса решения задачи;
• свойств данных решаемой задачи.
Чтобы понять структуру пространства поиска, необходимо
формализовать понятия (объекты, их характеристики и значения) и
определить, как они могут связываться друг с другом при
образовании гипотез, используемых для направления поиска. При этом
необходимо ответить на следующие вопросы:
• Являются ли понятия примитивными или имеют
внутреннюю структуру?
• Необходимо ли представлять причинные или
пространственно-временные отношения между понятиями и должны ли они быть
представлены явно?
• Необходима ли иерархия гипотез?
• Относится коэффициент определенности (или другие
средства для выражения мнения) только к окончательным гипотезам, или
он необходим для промежуточных гипотез?
• Необходимо ли рассматривать понятия и процессы на
различных уровнях абстракции?
Важный шаг в процессе формализации знаний — построение
модели исследуемой задачи, так как наличие модели позволяет
генерировать решение. Могут быть использованы как
поведенческие, так и математические модели. Если эксперт использует при
рассуждении или обосновании решения хотя бы простейшую
поведенческую модель, то это позволяет выработать важные
понятия и отношения. Если же эксперт использует математическую
модель (аналитическую или статистическую), то она может быть
непосредственно включена в ЭС как для формирования решения,
так и для объяснения (оправдания) причинных отношений,
обнаруживаемых в БЗ.
Для формализации знаний весьма важно понимать природу
данных проблемной области. Необходимо определить свойства
данных, которые существенно влияют на решение исходной
проблемы. Это могут быть следующие свойства:
301
• данные объясняются или нет в терминах гипотез;
• тип отношений между данными (причинные,
определительные, корреляционные);
• знание типа отношений помогает объяснить, как
взаимосвязаны данные, гипотезы и цели в процессе решения;
• данные редки (обильны) или недостаточны (избыточны);
• данные определены или нет, т.е. требуется ли коэффициент
определенности;
• интерпретация данных зависит или не зависит от порядка их
появления во времени;
• стоимость приобретения данных; как данные приобретаются
(какие вопросы необходимо задать для получения данных);
• как необходимые характеристики объектов могут быть
извлечены из входного сообщения (сигнал, изображение, текст на
естественном языке, устная речь и т.п.);
• данные надежны (ненадежны), точны (неточны);
• данные согласованы (не согласованы), полные (неполные).
Часто на этапе формализации выясняется, что для различных
частей общей задачи нужны различные языки или ИтС.
Этап выполнения. Цель этапа — создание одного или
нескольких прототипов ЭС, решающих требуемые задачи. Затем на данном
этапе, по результатам этапов тестирования и опытной
эксплуатации, создается конечный продукт, пригодный для
промышленного использования. Разработка прототипа состоит в
программировании его компонентов или выборке их из имеющихся ИтС и
пополнении БЗ.
Приобретение знаний необходимо начинать как только
составлены или выбраны программы, позволяющие работать с
простейшими управляющими структурами, следовательно, максимально
рано следует начать выполнение отдельных подзадач и обнаружить
необходимость дополнительных знаний для их решения. Иными
словами, первый прототип экспертной системы —
демонстрационный (ЭС-1) должен появиться через несколько месяцев (обычно
два-три), а не через годы после начала работы.
Разработка прототипа — важный шаг в создании ЭС.
Некоторые программы прототипа могут войти в окончательную версию
ЭС. Однако главное, чтобы прототип обеспечил проверку
адекватности идей, методов и способов представления, выбранных при
создании данной ЭС, решаемым задачам. Создание первого прототипа
должно подтвердить, что выбранные методы решений и способы
представления пригодны для успешного решения, по крайней мере,
302
ряда задач из области экспертизы, а также показать, что с
увеличением объема знаний и улучшением стратегий поиска ЭС сможет
дать высококачественные и эффективные решения всех задач
данной проблемной области. Очевидно, что в первом прототипе
реализуется (используется) простейшая процедура вывода.
После разработки первого прототипа необходимо расширить
круг задач, решаемых системой, для того чтобы собрать пожелания
и замечания, которые будут учтены в очередной версии системы
(ЭС-2). Для этого осуществляется развитие ЭС-1 путем добавления:
• «дружественного» интерфейса;
• средств для исследования как БЗ, так и цепочек выводов,
генерируемых системой (что обеспечивает прозрачность и понимае-
мость системы разработчиком);
• средств для сбора замечаний пользователей;
• средств библиотеки задач, решенных системой.
Расширенная версия ЭС-1 может рассматриваться как
исследовательский прототип ЭС.
Для достижения эффективного функционирования ЭС
необходимо осуществить структурирование знаний. Наиболее важным
средством для этого являются абстрактные понятия промежуточного
уровня. При представлении правил в виде, понятном ЭС, особое
внимание следует уделять двум ситуациям: некоторое правило
слишком громоздко', имеется много похожих правил. Громоздкость
правила может объясняться тем, что в нем отражено несколько
фактов из данной проблемной области. Если это так, то правило
надо разбить на несколько более мелких. Вторая ситуация
возникает тогда, когда в проблемной области существует понятие, явно не
указанное экспертом, а возможно, и не имеющее имени. В этом
случае новое понятие необходимо ввести в явном виде, присвоить
ему специальное имя и, используя это понятие, сформулировать
одно правило взамен группы подобных.
Выполнение экспериментов с расширенной версией ЭС-1,
анализ пожеланий и замечаний служат отправной точкой для создания
второго прототипа (ЭС-2). Процесс разработки ЭС-2 итеративный.
Анализ результатов прогонов тестовых примеров позволяет
выявить недостатки ЭС и разработать пути для их устранения. Этот
итеративный процесс может продолжаться от нескольких месяцев
до нескольких лет в зависимости от сложности проблемной области,
гибкости выбранного представления и степени соответствия
управляющего механизма решаемым задачам (возможно, потребуется
разработка ЭС-3 и т.д.). При разработке ЭС-2, кроме перечисленных
задач, решаются следующие:
зоз
• анализ функционирования системы при значительном
расширении БЗ;
• исследование возможностей системы в решении более
широкого круга задач и принятие мер для обеспечения таких
возможностей;
• анализ мнения пользователя о недостатках систем, о том,
какую дополнительную помощь он хочет получить от ЭС и т.п.;
• разработка системы ввода-вывода, осуществляющей анализ
или синтез предложений ограниченного естественного языка, что
позволяет пользователю взаимодействовать с ЭС-2 в форме,
близкой к форме стандартных учебников для данной области.
Этап тестирования. Здесь осуществляется оценка выбранного
способа представления знаний и ЭС в целом. Как только ЭС
оказывается в состоянии обработать от начала до конца два или три
примера, необходимо начинать проверку на более широком круге
примеров, чтобы определить недостатки БЗ и управляющего
механизма (процедур вывода). Инженер по знаниям должен подобрать
примеры, обеспечивающие всестороннюю проверку ЭС.
Обычно выделяют следующие источники неудач в работе системы:
• тестовые примеры;
• ввод-вывод; правила вывода;
• управляющие стратегии.
Наиболее очевидной причиной неудачной работы ЭС являются
недостаточно показательные тестовые примеры. В худшем случае
тестовые примеры могут оказаться вообще вне проблемной
области, на которую рассчитана ЭС, однако чаще множество тестовых
примеров находится в рассматриваемой проблемной области, но
является однородным и не позволяет охватить всю проблемную
область.
Ввод-вывод можно характеризовать данными, приобретенными
в ходе диалога с экспертом, и заключениями, предъявленными ЭС
в ходе объяснений. Методы приобретения данных могут не давать
нужных результатов, так как задавались неправильные вопросы или
собрана не вся необходимая информация. Ошибки при вводе могут
возникнуть из-за неудобного для пользователя входного языка. В
ряде приложений для пользователей удобен ввод не только в
печатной, но и в звуковой форме, может понадобиться ввод и в
графическом виде.
Выходные сообщения (заключения) системы могут оказаться
непонятными пользователю (эксперту) по содержанию, либо потому,
что их слишком мало. Типичным источником ошибок в рассужде-
304
ниях являются правила вывода. Важная причина здесь — неучет
зависимостей между правилами (точнее, между их означиваниями).
Дело в том, что правила редко независимы друг от друга, хотя на
первом этапе отладки удобно считать их таковыми. Среди других
причин ошибок можно отметить ошибочность, противоречивость и
неполноту правил. Необходимо принять меры против порождения
гипотез (промежуточных заключений), которые правдоподобны
каждая в отдельности, но комбинируются в бессмысленные
последовательности (комбинации). Требуется разработать специальные
правила, препятствующие образованию ошибочных комбинаций.
Весьма часто к ошибкам в работе ЭС приводят управляющие
стратегии. Возможно, изменение стратегии необходимо, если ЭС
рассматривает сущности в порядке, отличном от «естественного»
для эксперта. Последовательность, в которой данные
рассматриваются ЭС, не только влияет на эффективность работы системы, но и
может приводить к изменению конечного результата. Например,
рассмотрение правила X до правила Y может иногда привести к
тому, что правило Y всегда будет игнорироваться системой.
Изменение стратегии необходимо и в случае неэффективной работы ЭС.
Кроме того, недостатки в управляющих стратегиях могут привести
к чрезмерно сложным заключениям и объяснениям ЭС.
Этап опытной эксплуатации. На данном этапе проверяется при-
годность ЭС для конечного пользователя. Здесь ЭС занимается
решением всех задач, возможных при работе с различными
пользователями. Пригодность ЭС для пользователя определяется в
основном удобством работы с ней и ее полезностью. Под
полезностью ЭС понимается способность ее в ходе диалога определять
потребности пользователя, выявлять и устранять причины неудач в
работе, а также удовлетворять потребности пользователя (т.е. решать
поставленные задачи). Другими словами^пользователю важно
донести «до сознания» ЭС свою информационную потребность,
несмотря на возможные ошибки, допускаемые им из-за недостаточного
знания ЭС.
Под удобством работы ЭС понимается естественность
взаимодействия с ней (общение в привычном, не утомляющем
пользователя виде), ее гибкость (способность системы настраиваться на
различных пользователей, а также учитывать изменения в
квалификации одного и того же пользователя) и устойчивость системы к
ошибкам (способность не выходить из строя при ошибочных
действиях неопытного пользователя).
20 — 3466 305
По результатам эксплуатации может потребоваться не только
модификация программ и данных (совершенствование или
изменение языка общения, диалоговых систем, средства обнаружения и
исправления ошибок, настройка на пользователя и т.д.), но и
изменения устройств ввода-вывода из-за их неприемлемости для
пользователя. По результатам этого же этапа принимается решение о
переносе системы на другие ЭВМ (например, для расширения сферы
использования ЭС и ( и л и ) снижения ее стоимости).
Взаимодействия инженера по знаниям с экспертом. Мощность
ЭС как систем, основанных на знании, зависит, в первую
очередь, от качества и количества знаний, хранимых в них. Поэтому
ясно, что процесс приобретения знаний для ЭС наиболее важный.
Так как в настоящее время не существует методов
автоматического приобретения знаний, процесс наполнения ЭС знаниями
является весьма трудоемким. Знания для ЭС могут быть получены
из различных источников (книг, отчетов, баз данных,
эмпирических данных, персонального опыта эксперта, инженера и т.п.).
Однако наиболее значимые знания приобретаются от
людей-экспертов.
Извлечение знаний из эксперта (экспертов) осуществляется в
процессе интенсивного систематического (в течение нескольких
месяцев) взаимодействия инженера по знаниям с экспертом.
Сложность извлечения знаний состоит в том, что, как правило, эксперт
либо не осознает, какими знаниями он пользуется для получения
решения, либо не может сразу эти знания вербализовать. Поэтому
инженер по знаниям должен работать с экспертом в контексте
решения конкретных задач (подзадач). Для построения ЭС важны
следующие выводы:
1. Не будьте сами себе экспертом! (Другими словами, если Вы
эксперт, то не пытайтесь описать свои знания без инженера по
знаниям, который должен убедиться в достоверности выделенных
знаний.)
2. Инженер по знаниям должен верить не тем знаниям, за
которые эксперт ручается, а тем знаниям, которые он действительно
использует для решения задач. Исследование работы экспертов
базируется на методах психологии: наблюдении и интуитивности.
Метод наблюдений реализуется следующим образом. Эксперта
при решении задач просят «думать вслух». Раздумья эксперта
оформляются в виде протокола, который затем исследуется
инженером по знаниям (с возможным привлечением эксперта).
Интуитивный метод применяется в одной из двух
модификаций. В первом случае инженер по знаниям изучает литературу и
306
взаимодействует с экспертом для того, чтобы овладеть данной
проблемной областью, т.е. он становится псевдоэкспертом. Во втором
случае сам эксперт действует как «строитель» теории своего
собственного поведения, используя интроспекцию. Некоторые приемы
по извлечению знаний из экспертов приведены в табл. 7.1.
Таблица 7.1. Приемы извлечения знаний из экспертов
1 ПРИЕМЫ
Наблюдение
Обсуждение задачи
Описание задачи
Анализ задачи
Проверка системы (прототипа)
Исследование системы
Оценка системы
ОПИСАНИЕ
Инженер наблюдает (не вмешиваясь) за тем,
как эксперт решает реальную задачу
Инженер на представленном множестве задач
неформально обсуждает с экспертом данные,
знания и процедуры решения
Эксперт описывает типичные задачи для
основных типов ответов
Эксперт решает «вслух» реальные задачи,
детализируя ход рассуждений
Эксперт предлагает инженеру перечень задач |
для решения (от простых до сложных), которые
(с использованием приобретенных знаний)
перед решением системы инженер решает
вручную
Эксперт исследует и критикует правила и
механизм вывода системы
Инженер предлагает другим экспертам
оценить решения разработанной системы
(прототипа) и решения эксперта, наполнявшего систему
Характеристики инструментальных средств. Большинство ИтС
предназначено для создания прототипов ЭС, решающих
статические задачи (обычно задачи расширения) в статических
проблемных областях. По степени отработанности ИтС выделяют
следующие стадии существования: исследовательская, промышленная,
коммерческая. Разделяют следующие типы ИтС:
• языки программирования;
• языки инженерии знаний;
• средства автоматизации разработки (проектирования) ЭС;
• оболочки ЭС.
С точки зрения потребителя, на выбор ИтС влияют моменты:
• затраты труда на построение ЭС или ее прототипа с помощью
ИтС;
• эффективность функционирования ЭС, построенной на
основе выбранного ИтС;
20* 307
• квалификация разработчика, необходимая для применения
ИтС.
Оболочки ЭС ориентированы на работу с
пользователем-непрофессионалом в области программирования. Основным свойством
оболочек является то, что они содержат все компоненты ЭС в
готовом виде и их использование не предполагает программирования, а
сводится лишь к вводу в оболочку знаний о проблемной области.
Каждая оболочка характеризуется фиксированным способом
представления знаний и организации вывода и фиксирования
компонентов, которые будут использоваться во всех положениях, где
будет применяться оболочка. Наиболее популярные оболочки
обладают следующими свойствами:
• решают задачи класса расширения в статических предметных
областях в условиях ненадежности знаний;
• представляют процедурные знания в виде правил;
• описывают предметную область в виде значений
неструктурированных переменных и утверждений, снабженных мерой их
истинности (определенности).
Желание представить разработчику ЭС разнообразные средства
для учета особенностей приложения привело к объединению в
рамках одной системы различных методов решения задач,
представления и интерпретации знаний. В их состав могут входить средства
модификации функционирования оболочки, набор компонентов,
позволяющих конструировать собственные оболочки, средства
комплексирования компонентов в виде языка высокого уровня,
развитые интерактивные графические средства общения с
пользователем. Подобные средства называют средствами автоматизации
проектирования (разработки) ЭС.
Характеристика «Универсальность» определяет возможности ИтС
в использовании различных способов представления знаний в
рабочей памяти и базе знаний и различных парадигм
функционирования системы. Наличие универсальности позволяет адекватно
отображать в системе различные типы знаний о проблемной
области. К настоящему времени в большинстве ИтС при представлении
знаний используют фреймы и сети, а в качестве механизма
функционирования, как правило, программирование, ориентированное
на правила.
Характеристика «Основные свойства» определяет особенности,
которые присущи ИтС в реализации основных программных
компонентов системы. Для решателя наиболее важны способы
сопоставления и основной способ планирования вычисления (построение
цепочек вывода от данных или от целей). Задача сопоставления со-
308
стоит в том, чтобы определить, какое из правил, хранящихся в БЗ,
может быть применено к текущему состоянию предметной
области, хранимой в РП. Способы сопоставления в значительной мере
зависят от: типа ссылки на объекты РП, используемого в правиле;
вида данных РП, сопоставляемых со ссылками; вида проверок,
выполняемых в ходе сопоставления.
Выделяют следующие типы ссылок:
• конкретная, когда ссылка (идентификатор) в условии
правила является адресом конкретного элемента РП;
• абстрактная, когда ссылка (идентификатор и его описание) в
условии правила именует не конкретный, а любой элемент в РП,
свойства которого сопоставляются с описанием ссылки, указанным
в правиле (т.е. описание определяет класс элементов РП).
Существующие ИтС допускают следующие виды данных РП:
константы; переменные, имеющие значения; сложные структуры
(типы фрейм), логически объединяющие множество переменных. В
них используются либо тривиальные виды проверок, сводящиеся к
проверке наличия (отсутствия) указанных элементов в РП, либо
сложные, требующие вычисления некоторых соотношений между
значениями ссылок, указанных в условиях правил. Таким образом,
в первом приближении способ сопоставления определяется
используемым типом ссылок и видом данных РП.
Средства приобретения знаний в существующих ИтС
можно оценивать с точки зрения допустимых способов формирования
БЗ. Выделяют следующие способы формирования БЗ:
• редакторы;
• средства отладки;
• средства индуктивного вывода новых знаний.
Редакторы позволяют отображать и модифицировать БЗ,
возможно, в графическом виде, поддерживая ее целостность. Средства
отладки обеспечивают анализ содержимого БЗ, переформирование и
отображение его результатов пользователю. Средства индуктивного
вывода осуществляют формирование новых знаний (правил) на
основе вводимых пользователем примеров ситуаций с их решениями.
В существующих ИтС диалог организуется в двух видах: в
фиксированной структуре и структуре, формируемой при генерации
ЭС. Среда функционирования ИтС определяет тип ЭВМ,
используемую операционную систему (ОС) и язык программирования. По
типу используемых ЭВМ ИтС можно разделить на три класса: для
персональных ЭВМ (ПЭВМ); для символьных ЭВМ и
интеллектуальных рабочих станций.
309
Характеристики экспертных систем. С точки зрения
назначения большинство ЭС создается для тиражирования знаний
экспертов и ориентировано либо на специалистов, стремящихся
повысить свои знания, либо на неспециалистов, чтобы оказать им
помощь в решении сложных задач.
По характеристике «проблемная область» ЭС обобщенно можно
определить так: предметная область является статической (как
правило, с неточными знаниями); решаемые задачи являются
статическими (как правило, задачи расширения и реже задачи
доопределения). Приложения, реализуемые с помощью ЭС, различаются по
количеству возможных решений, по сложности
(структурированности) проблемной области, по методам решения задач, по типу
используемых знаний.
С точки зрения глубины анализа проблемной области
большинство существующих ЭС являются поверхностными, что
обеспечивает их высокую эффективность. Однако для многих приложений
необходимо создание глубинных ЭС, реализация которых требует
существенных вычислительных ресурсов, что препятствует их
широкому распространению. По типу используемых методов и знаний
ЭС делятся на традиционные и гибридные. Большинство
существующих ЭС традиционные. Тенденцией является создание
гибридных ЭС путем выделения в неформализованной задаче
формализуемых подзадач и реализации их методами традиционного
программирования (т.е. в виде БД и ППП). Гибридизация ЭС значительно
усложняет процесс управления системой, увеличивает количество
неявно представленных знаний, что ухудшает ее объяснительные
возможности и сужает номенклатуру используемых методов
инженерии знаний. С точки зрения класса ЭС большинство существующих
ЭС являются простыми (в США из общего числа продаваемых ЭС
90% простые).
На рис. 7.2 представлена более удобная для восприятия (по
сравнению с рис. 7.1 ) схема стандартной технологии разработки ЭС.
Характерной особенностью подобной технологии являются
многочисленные возвраты к любому этапу и пересмотр принятых
там проектных решений, что достаточно удобно для быстрого
создания небольших автономно функционирующих ЭС (концепция
«быстрого прототипирования» [1—3]), однако модель жизненного
цикла (ЖЦ), соответствующая такой технологии, затруднена для
промышленного использования из-за низкой эффективности
разработки конкретной системы, она важнее для исследовательских
целей и как ЭС-1.
310
ИНЖЕНЕР ПО ЗНАНИЯМ, ЭКСПЕРТ,
ПРОГРАММИСТ, ПОЛЬЗОВАТЕЛЬ
1
{ Проблема
Концептуализация знания
Получение
знаний
1
J Структурирование
знаний
| Поле знаний
Формализация знаний
т
База знаний на языке
представления знаний
Реализация прототипа
т
Текущий прототип
(программная система)
ь upuiuiniia
Уточнение
' Дополнительное извлечение
знаний, модификация
| поля знаний
*
Переформализация |
Перепрограммирование |
Рис. 7.2. Стандартная технология разработки ЭС
Технология создания ЭС, предложенная в работах [22,23],
включает три фазы: проектирование, реализацию и внедрение, а
ЖЦ разработки состоит из шести этапов:
• исследование выполнимости проекта;
• разработка общей концепции ЭС;
• разработка и тестирование серии прототипов;
• разработка и испытание головного образца;
• разработка и проверка расширенных версий системы;
• привязка системы к реальной рабочей среде.
Сравнивая данные технологии между собой, можно заметить,
что первые два этапа промышленной технологии соответствуют
этапу идентификации, а следующие три этапа — этапам
концептуализации, формализации и тестирования. Единственное
отличие — наличие этапа привязки ЭС к реальной рабочей среде.
7.2. Представление знаний. Достижение цели
Экспертные системы представляют собой одно из направлений
в области искусственного интеллекта. Эти системы, с одной
стороны, используют большое количество знаний, передаваемых им
специалистами, а с другой — способны вступать в диалог и объяснять
311
свои собственные выводы. Это предполагает наличие
эффективного управления большой по объему и хорошо структурированной
базой знаний, строгое разграничение между различными
уровнями знаний, наличие множества удобных представлений для
правил, схем предикатов или прототипов и четко определенный
процесс обмена информацией между различными источниками.
База знаний содержит знания в символьной форме. Точнее
говоря, в нее могут входить также таблицы чисел, диапазоны
значений величин и, где это требуется, некоторые вычислительные
процедуры. Однако основное содержание БЗ — факты и эвристики.
В состав фактов БЗ входят описания объектов, их
признаки и соответствующие числовые данные для области, в которой
предполагается применять ЭС. Например, для систем управления
технологическими процессами в состав фактических знаний могут
быть включены описания конкретного предприятия или его части,
характеристики отдельных компонентов, значения, получаемые от
датчиков, состав запасов и т.д.
Эвристики, или правила, представляют собой пути вынесения
суждений на основании фактов для решения конкретной
проблемы. Эти знания базируются на прошлом опыте; эксперты
постоянно пользуются ими, но часто держат их в тайне. Инженерию
знаний можно охарактеризовать как некий процесс, в ходе которого
информация «добывается и обогащается» создателями экспертных
систем. Для систем управления технологическим процессом эти
знания могут содержать набор правил, которые позволят
оптимизировать весь производственный процесс.
Ценность ЭС для коллективов специалистов, начиная от
лабораторий и кончая целыми фирмами, проявляется в нескольких
аспектах:
а) сбор, уточнение, кодирование и распространение экспертных
знаний («Эксперт под рукой»);
б) решение проблем, сложность которых превышает
человеческие возможности;
в) решение проблем, требующих объема знаний, которого один
человек не в состоянии охватить;
г) решение проблем, для которых требуются экспертные
знания из нескольких областей («сплав» знаний);
д) сохранение наиболее уязвимой ценности коллектива —
коллективной памяти;
е) обеспечение высокой конкурентоспособности за счет
применения новой технологии.
312
Создание комплексных баз знаний открывает широкие
возможности, которые обусловлены безошибочностью и тщательностью,
присущими машине, и синтезом знаний нескольких экспертов.
Если же БЗ объединяет информацию по нескольким дисциплинам,
такой «сплав» знаний приобретает дополнительную ценность.
Выделим восемь основных типов знаний по следующим
признакам:
1. Базовые элементы, объекты реального мира. Они связаны с
непосредственным восприятием, не требуют обсуждения и
добавляются к нашей базе фактов в том виде, в котором они получены.
2. Утверждения и определения. Они основаны на базовых
элементах и заранее рассматриваются как достоверные.
3. Концепции. Они определяют собой перегруппировки -или
обобщения базовых объектов. Для построения каждой концепции
используются свои приемы.
4. Отношения. Они выражают как элементарные свойства
базовых элементов, так и отношения между концепциями. Кроме того,
к свойствам отношений относятся их большее или меньшее
правдоподобие, большая или меньшая связь с данной ситуацией. Еще
раз отметим, что представление знаний в ЭС близко к моделям,
используемым в БД. Таким путем построена реляционная
(обобщенная) модель БД в некоторых ЭС. Пара понятий
«свойство—значение» хорошо известна в семантических сетях; фреймы и скрипты
являются не чем иным, как наиболее простыми бинарными
отношениями. Некоторые ЭС в качестве базы фактов используют уже базы
существующих данных.
5. Теоремы и правила перезаписи. Они являются частными
случаями продукционных правил с вполне определенными свойствами.
Теоремы не представляют никакой пользы без экспертных правил
их использования. Явное присутствие теорем ЭС представляет
главное отличие от систем управления классическими базами данных
(СУБД), в которых они либо отсутствуют, либо программируются.
Модификация или добавление новых теорем является весьма
трудоемкой, хотя и необходимой процедурой, так как нужно обеспечить
хорошее структурированное управление БД и оптимизировать
получение ответов.
6. Алгоритмы решений. Они необходимы для выполнения
определенных задач. Во всех случаях они связаны со знанием
особого типа, поскольку определяемая ими последовательность
действий оказывается оформленной в блок, в строго
необходимом порядке, в отличие от других типов знания, в которых эле-
313
менты информации могут появляться и располагаться без связи
друг с другом.
Очевидно, что очень трудно работать с длинными
процедурами, состоящими из большого числа различных действий.
Использование чистых алгоритмов ограничено очень частными
случаями, большая часть которых имеет дело с обработкой числовой
информации. ЭВМ должна рассматривать и неалгоритмические
ситуации.
7. Стратегии и эвристика. Этот тип представляет врожденные
или приобретенные правила поведения, которые позволяют в
данной конкретной ситуации принять решение о необходимых
действиях. Он использует информацию в порядке, обратном тому, в
котором она была получена. Например, рассуждения типа: «Я знал,
что это действие приводит к такому-то результату (информация
типа в п. 4), поэтому, если я хочу получить именно этот результат,
я могу рассмотреть это действие». Человек постоянно пользуется
этим типом знаний при восприятии, формировании концепций,
решении задач и формальных рассуждениях. Появление ЭС
связано с необходимостью принятия в расчет именно этого
фундаментального типа человеческих знаний.
8. Метазнание. Без сомнения оно присутствует на многих
уровнях и представляет собой знание того, что известно и
определяет значение коэффициента к этому знанию, важность
элементарной информации по отношению ко всему множеству
знаний. Кроме того, сюда же относятся вопросы организации
каждого типа знаний и указаний, когда и как они могут быть
использованы. Метазнание представляет собой любое знание о
знании. Оно является фундаментальным понятием для систем,
которые не только используют свою БЗ такой, как она есть, но и
умеют на ее основе делать выводы, структурировать ее,
абстрагировать, обобщать, а также решать, в каких случаях она может
быть полезна.
Приведем краткий список наиболее распространенных
методов представления знаний. Фундаментальное различие
между ними состоит в простоте модификации знания. В табл. 7.2
они приведены в порядке от наиболее процедурного (наиболее
застывшего, структурированного) до наиболее декларативного
(наиболее открытого, свободного, неупорядоченного). Такая
классификация является несколько грубой, но правильно
отражает идею.
314
Таблица 7.2 Методы представления знаний
Г Модели знаний
[ Процедурные «закрытые»
Декларативные «открытые»,
«неупорядоченные»
Методы
Конечный автомат
Программа
Скрипт (схема)
Семантическая связь
Фрейм (прототип)
Графы, сети
Формальная спецификация <
Исчисление предикатов
Теоремы, правила перезаписи
Продукционные правила
Предложения на языке
Следует отметить, что конечные автоматы, программы,
исчисление предикатов и системы с продукционными правилами с
теоретической точки зрения эквивалентны друг другу, поскольку их
можно свести к универсальной машине Тьюринга, хотя их
«Эксплуатационные характеристики» сильно различаются.
Такие формальные понятия, как фреймы, скрипты,
семантические сети, возникли из реальных потребностей ИИ и приносят
большую помощь в понимании языка.
Фреймы (или прототипы) предложены Минским в 1975 г. и
представляют собой сложные структуры данных, описывающих
какую-либо типичную ситуацию. Фрейм состоит из позиций (слотов)
для размещения объектов, характеризующих данную ситуацию.
Позиция может быть передана другому фрейму. Кроме того, он
содержит информацию о выполняемых действиях (заполнение
позиций, присвоение значений по умолчанию, активизация), о том, как
следует поступать в типичных и нетипичных случаях, о влиянии
соседних фреймов.
Скрипт, или схема, представляет собой описание стереотипного
сценария действий с участием определенных объектов. Они могут
вызывать другие скрипты и обладают большими, чем фреймы,
возможностями для описания динамических аспектов знания.
Семантические сети — это графы, которые часто представляют
собой объединение двух предыдущих понятий и объектом
описания которых являются элементы окружающего мира и связи между
ними. Они имеют много общего с реляционными моделями БД.
При формализации предметной области и реализации
конкретных ЭС возникает задача тестирования и отбора специалистов,
которые могли бы выступить в роли экспертов. Для этих целей
целесообразно создавать специальный блок, который формировал бы
315
модель «идеального» эксперта (личностного портрета) в виде
набора критериев, которым должен удовлетворять человек,
претендующий на роль эксперта по решению конкретного класса задач
[43,48].
В табл. 7.3. представлены 14 критериев (требований), на основе
которых может быть произведен отбор специалистов-экспертов.
Критерии приводятся в произвольном порядке, т. е. не проранжи-
рованы по степени важности с точки зрения разработки ЭС.
Процесс ранжирования предлагается осуществить самостоятельно по
своему усмотрению.
Таблица 7.3. Критерии отбора специалиста-эксперта
Требования
Можете ли Вы...
Эксперт четко осознает границы своих познаний
Всегда ли Вы...
Эксперт может ответить на поставленный вопрос, если
вопрос поставлен в этих границах
Как часто Вы ошибаетесь?
Эксперт обычно не ошибается
Можете ли Вы...
Эксперта можно попросить оценить значение некоторого
параметра, не поддающегося прямому измерению, и доев-
мять этой оценке
Обладаете ли Вы...
Эксперт обладает некоторой (хотя бы неявной) моделью
предметной области, поэтому его ответы на различные
вопросы всегда согласованы между собой
Всегда ли Вы можете...
Эксперт может объяснить причины и/или мотивы своих
решений, ответов, рекомендаций
Важна ли для Вас степень детализации...
Чем подробнее задаваемые эксперту вопросы, тем больше
он выдает информации
Трудно ли для Вас...
Эксперт может сравнивать несколько ситуаций
(вариантов, альтернатив и т.д.), находить в них различия и
отличать, принципиальны ли они и к чему приводят
Способны ли Вы...
Эксперт способен учесть одновременное воздействие
нескольких независимых или взаимозависимых факторов,
параметров, критериев и тд.
Возможные
варианты ответов
Да
Нет
Не уверен
Всегда
Не всегда
Иногда
Часто
Редко
Иногда
Могу
Нет
Затрудняюсь ответить
Да
Нет
Очень приблизительно
Всегда
Не всегда
Иногда
Важна
Нет
Не очень важна
Трудно 1
Не трудно
По-разному
Да
Нет
Затрудняюсь ответить
316
Продолжение табл. 7.3
Требования
Можете ли Вы о себе сказать, что Вы...
Эксперт рационален и последователен в своих
предпочтениях, поэтому принимаемые им решения разумны и
поддаются автоматизации
Важен ли для Вас...
Ответ эксперта не зависит от формы и последовательности
задаваемых вопросов
Вы всегда искренны в Ваших ответах?
Искренность ответов эксперта не позволяет вводить в
заблуждение тех, кто задает вопросы
Вы беспристрастный человек?
Эксперт должен быть беспристрастным
Вам удобно работать в группе?
Эксперт не возражает против работы в группе экспертов,
что позволяет обобщать, согласовывать и интегрировать
несколько мнений. Это приводит к повышению качества
экспертизы
Возможные
варианты ответов i
Да
Нет
Затрудняюсь ответить
Да
Нет
В отдельных случаях
Да
Нет
Не всегда
Да
Нет
Не всегда
Да
Нет
Терплю
Следует обратить внимание на то, что все требования,
предъявляемые к «идеальному» эксперту, даны в утвердительной
форме, однако для облегчения разработки соответствующего блока в
таблице приведены и возможные варианты вопросительных
конструкций, с помощью которых необходимо перефразировать все
критерии.
Кроме того, перед началом тестирования желательно
предусмотреть специальный вопрос типа:
«Хотите ли Вы узнать, каким должен быть «идеальный»
эксперт?»
«Система предлагает провести тестирование на предмет отбора
специалистов-экспертов для Вашей задачи» и т.д.
Варианты ответов тестируемого на задаваемые вопросы
необходимо проранжировать и наложить «пороги» (сумму баллов)
приближения к «идеальному» эксперту, используя, например, пять
градаций, на основе которых будут оформляться результаты
тестирования:
1. Вы идеальный эксперт для разработки ЭС, связанной с...(очень
хорошая степень приближения).
2. Мы готовы воспользоваться Вашими услугами в качестве
эксперта для данной задачи (хорошая степень приближения).
317
3. В принципе мы можем попробовать начать нашу работу
(средняя степень приближения).
4. К сожалению, наше сотрудничество при разработке ЭС будет
затруднительным (плохая степень приближения).
5. Извините, Вы нам не подходите (очень плохая степень
приближения).
В заключение добавим, что тестирование с использованием
приведенных 14 критериев можно значительно усложнить, если
оценивать еще и влияние реальных условий на «идеального»
эксперта.
Приведем перечень так называемых «шумовых» личностных
особенностей эксперта, от которых зависит искренность ответов
тестируемого:
• профессиональная гордость;
• чрезмерная любезность;
• зависимость ответа от контекста и формы вопроса;
• умолчание;
• недопонимание;
• конформизм, страх «не угадать»;
• когнитивная защита;
• собственные интересы эксперта;
• зависимость ответа от состояния эксперта;
• усталость;
• торопливость.
Однако это задание не является обязательным, поскольку здесь
требуется введение более тонких механизмов проставления
оценочных коэффициентов, выбора шкал, построения диалога с
тестируемым и т.п.
7.3. Продукционные экспертные системы
Продукционное правило представляет собой выражение вида
А-»В,
в котором левая часть А описывает определенную ситуацию,
представленную в соответствии с правилами рабочего пространства, а
правая часть В представляет собой действие, выполнение которого
предполагается в случае обнаружения соответствующей ситуации.
Такое правило очень похоже на теорему, а цепочка правил, связан-
318
ных через заключения В, А и посылки, напоминает силлогизм. В
ЭС используются множества таких правил.
Метод обработки информации с помощью продукционных
правил не является формальным аналогом приемов, применяемых в
системах с использованием традиционных процедур.
Таким образом, продукционная ЭС состоит из множества
несвязных между собой правил продукций Р*: А -> В («если А, то
В») и множества фактов, накапливающихся по мере
функционирования ЭС в рабочей области БЗ или глобальной БД. База знаний
ЭС состоит из конечного набора правил
П = {Рь...,Рт}
и конечного набора фактов
А={аь...,ап},
таких, что условие применимости любого из правил Р4 состоит в
одновременном наличии фактов ап,...,аь. Тогда любая продукция
Pi из П имеет вид
Pi ^ЛадА^Ла*-^,
где л — знак конъюнкции; ат — новый факт, выведенный из
фактов-условий aii,...,ais.
Заметим, что если ат — заключение, вытекающее из условий
аь...,ап, то продукция представляет собой декларативное
(актуальное) знание. При этом факт ат по-прежнему заключен в исходном
множестве фактов А. Появление действительно новых
фактов — результат исследований в данной предметной области,
расширяющих множество А. Применение продукции может быть
связано с некоторым действием (процедурой). В этом случае факт
ат — сообщение об окончании этого действия. Продукционная
система в этом случае представляет собой своеобразную систему
программирования. Заметим, что различные факты из А могут
быть содержательно связаны друг с другом. Может быть, что из ai
вытекает аг (например, отрицающие друг друга ai — объект
исправен, 2l2 — неисправен) или, например, а3 совпадает либо с а5, либо с
а7, т.е. один и тот же факт назван по-разному. Для того чтобы
сохранить главное свойство продукционных ЭС -— независимость
применения отдельных продукций, связь между фактами следует
описать отдельно. На рис. 7.3 приведены примеры вывода в такой
системе.
319
f Продукционные правила
(Р,) aj-^
(Р2) а2->а4
(рз) a8->ai
(Р4) а5ла7->а3
(Р5) а5ла9-+а2
(Р6) а4ла5ла9->а3
(Р7) а5Лй9лР-^а1
Решение задачи при заданных а8
а8->а,
а,-»а5
а5ла9—>а2
а2->а4
й^ля^ла^-*Лу
и а^
(Рз)
(Р.)
(Ps)
(Р2)
(Рб)
Рис. 7.3. Примеры вывода при движении по цепочке вперед
Посылка аь а2, ... могут быть простыми логическими
предложениями типа «истина или ложь» или предикатными с переменными
или еще какими-либо соотношениями.
Система состоит из базы знаний, которая содержит множество
продукционных правил, рабочее пространство (или базы фактов) и
программный интерпретатор. Рабочее пространство в начале работы
содержит формулировку поставленной задачи, а затем в нем
появляется множество фактов, которые программа могла установить к
текущему моменту времени. Это пространство играет роль
кратковременной памяти, а факты, которые оно содержит, являются
утверждениями, касающимися статистического описания задачи и
различных способов обращения к долговременной памяти.
Последняя содержит базу динамических знаний, которая состоит из
операторов преобразования, выраженных в форме правил.
Эти правила могут содержать переменные, значения которых
уточняются и приводятся в соответствие с известными фактами с
помощью процедур «квазиунификации» или «фильтрации» в
процессе каждого сеанса работы интерпретатора.
Интерпретатор является основной частью системы и полностью
управляет порядком вьгоода, выполнение которого всегда можно
представить в виде последовательности похожих друг на друга
элементарных циклов (рис. 7.4).
Различие между продукционными ЭС заключается в том, что в
одних системах новая информация, полученная с помощью
выводов, просто прибавляется с разрушением и замещением уже
присутствовавших там фактов.
320
—I
а) ОПРЕДЕЛЕНИЕ
Определить правила и относящиеся к ним факты
путем унификации (сопоставление с образцом)
т
б) ВЫБОР
Выбрать такие правила, которые следует
выполнить для эффективного решения задачи
I
в) ВЫВОД
Выполнить действие, используя результаты этапа а).
Построить новую базу фактов
Рис. 7.4. Элементарный цикл интерпретатора
Движение к цели при работе ЭС происходит естественным
образом (как при доказательстве теоремы) и может быть легко
представлено с помощью И/ИЛИ (рис. 7.5).
В действительности дерево может быть пройдено в одном из
двух направлений: или от фактов к заключению, или от
заключения, которое в этом случае рассматривается как предположение, к
фактам. В первом случае говорят о движении по цепочке вперед
(см. рис. 7.3). Чаще всего выбирается второе решение, так как оно
лучше учитывает структуру фактов, которые, с одной стороны, не
являются независимыми, а с другой — часто не относятся к
рассматриваемой проблеме, т. е. такой подход позволяет прежде всего
избежать комбинаторного взрыва числа возможных цепочек, так
как лишь в немногих случаях заключения можно заранее
предвидеть и как-то ограничить перебор вариантов.
Заключение, полученное из правил
с многими посылками:
Несколько различных
ИЛИ продукционных правил:
&~%)-*узея ИЛИ
цель
Рис. 7.5. Дерево вывода при движении по цепочке назад (те же данные,
что и на рис. 7.3)
21—3466
321
Большую часть вычислительной работы в этом случае выполняет
интерпретатор (например, Лисп) с помощью рекурсивных процедур.
Общая схема системы приведена на рис. 7.6. Заметим, что хороший
интерпретатор должен давать возможность проходить по цепочке
правил вперед или назад в зависимости от практических потребностей.
Отметим, что для описания продукционных систем
существует классический язык, специально созданный для моделирования
человеческих рассуждений — это язык математических логик. На
самом деле правило продукций «ситуация — возможное
следствие» представляет собой теорему, несколько необычно
формализованную: это логическое выражение, состоящее из утверждений,
которые могут быть интерпретированы как истинные или
ложные. Единственное различие состоит в том, что все экспертные
правила заранее допустимы (аксиомы) даже в том случае, если
их невозможно доказать. Таким образом, правила продукций
очень близки к правилам преобразований, известным в
математике: формальным преобразованиям выражений,
преобразованиям в полугруппах в формальных грамматиках, в логарифме
Маркова. Для лучшего понимания ЭС представляется
привлекательным использовать формализм, принятый в логике.
Системы поддержки знаний. Если рассматривать ЭС с
информационной точки зрения, то ее можно представить,как это сделано на
рис. 7.7. В нее входят следующие компоненты.
БАЗА ЗНАНИИ
МАШИНА ВЫВОДА РАБОЧАЯ ПАМЯТЬ
ПРАВИЛА
Внутреннее представление
продукционных правил
Фактические знания
Эвристические знания
Концепции
Интерференционные сети
Управление «активными»
фактами и правилами
МЕТАПРАВИЛА
Стратегия решения
Метод арбитража правил
Модель правил
Правила накопления
новых правил
Правила поддержки
коэффициентов
уверенности
ПРАВИЛА
Символьные и числовые
данные
Текущие гипотезы
УНИФИКАЦИЯ
Разрешение конфликтов
Распространение ограничений
Управление приоритетами
Доступ к памяти
ЗАПИСНАЯ КНИЖКА
Правила, ожидающие
своей очереди
Текущий план
Список подзадач
Метаправила
Рис. 7.6. Общая схема современной продукционной ЭС
322
Центральная окружность на рисунке показывает базу знаний
фактов и правил вывода, являющуюся сердцем ЭС. В отличие от
обычной информационной БД, в ней хранятся не только факты, но
и правила, позволяющие вывести новые факты.
Внешняя окружность показывает три класса операторов ЭС:
1) пользователи обращаются к системе за советом по
специальным проблемам в узкой области, представляя ей специфические
факты и свои гипотезы о следствиях или целях;
2) эксперты обращаются к системе, чтобы передать ей свои
знания по частной проблеме, а также общепринятые факты и
процедуры вывода;
3) инженеры действуют как промежуточные звенья между
экспертом и системой, помогая первому зондировать свои знания и
проверяя работу законченной ЭС.
Рис. 7.7. Информационная структура ЭС
21*
323
Кольцо в средней части рисунка показывает оболочку ЭС,
которая представляет собой ИтС, используемые для приложения БЗ с
целью выработки решения задачи:
• прикладная система в нижней части рисунка проверяет
гипотезы пользователя или ищет пути достижения поставленных целей
путем вывода последовательности фактов о конкретной ситуации со
слов пользователя, а также используя общие факты и правила вывода,
представленные экспертом и введенные в ЭС инженером по знаниям;
• система обоснования, на рисунке слева внизу, отвечает на
вопросы о том, каким способом были выведены факты, на основе
какой информации и каких правил вывода;
• система приобретения, на рисунке слева вверху, представляет
ИтС для опроса эксперта с целью получения его словаря, а также,
с использованием последним, общих фактов и правил вывода;
• система отображения, в верхней части рисунка, обеспечивает
необходимыми ИтС для представления БЗ в понятной форме, а также
связей между фактами и правилами вывода, содержащимися в БЗ;
• система редактирования, на рисунке справа вверху, содержит
ИтС для компоновки и редактирования БЗ, сохраняя при этом ее
целостность при помощи словаря, переменных и применяемых
операций;
• система проверки, на рисунке справа внизу, содержит ИтС
для испытаний и предохранения БЗ от специфических историй с
известными последствиями.
Информационные оболочки большинства современных ЭС:
• предлагают определенную БЗ, представленную посредством
правил, продукций и фреймов;
• имеют некоторые прикладные возможности, ограниченные в
выводе следствий и испытании утверждений;
• дают простые объяснения посредством используемых фактов
и правил;
• не имеют способностей интегрированного сбора знаний;
• имеют ограниченные возможности по отображению БЗ, в
частности, в графической форме;
• имеют такой интерфейс пользователя с редактором БЗ,
который требует понимания внутренних структур данных;
• представляют ограниченные контролирующие возможности и
не имеют объединенной БД, фактических историй.
Однако в последние годы происходят быстрые положительные
изменения в сторону улучшения методов представления знания,
получения выводов, их обоснования, отображения и обучения ЭС —
все это благодаря интенсивному развитию инженерии знаний.
324
Проблемы инженерии знаний можно сформулировать
следующим образом. Приобретение знания является узким местом в
построении ЭС. Инженер по знаниям имеет меньшее знание
области, чем эксперт, возникающие проблемы связи препятствуют
процессу превращения экспертизы в программу. Словарь,
используемый экспертом при разговоре с новичком о предметной области,
часто не годится для решения проблемы; таким образом, инженер
по знаниям и эксперт должны работать вместе, чтобы обновить и
расширить его. Один из наиболее трудных аспектов деятельности
инженера по знаниям заключается в оказании помощи эксперту в
разработке структуры знания предметной области, в определении
и формализации основных концепций этой области.
Это узкое место является главным препятствием на пути
применения ЭС и реализации их полного рабочего потенциала.
Автоматизация приобретения и передачи знания стала главной целью
многих исследований. Уменьшение стоимости аппаратных и
программных средств поддержки ЭС вывело рассматриваемую
технологию инженерии знаний на массовый спрос гораздо раньше, чем
ожидалось. В то же время движение в направлении
интенсификации человеческого труда, которое наблюдается в инженерии
знаний, противоречит основным тенденциям современной
промышленности. Все это усилило интерес к разработкам систем
поддержки знания, способным автоматизировать инженерию знания как
процесс прямого воздействия между экспертами и ЭВМ.
На рис. 7.8 показана классическая парадигма конструирования
систем дополненная схемой получения проектной информации от
человека-оператора. Очевидным подходом является анализ беседы,
который и был использован во многих исследованиях. Анализ
текстов из руководства оператора представляет собой другой важный
источник информации и его поведении. Очевидно, что эти методы
являются только частью всей иерархии методологии передачи
знания, определяя лишь те области приложения инженерии знания,
которые апробированы. На рис. 7.9 представлена эта иерархия в
увязке с базовой архитектурой ЭС [52].
В центре, как и прежде, находятся база знаний, факты и
правила вывода.
В нижнем овале — операционная система для приложения БЗ к
поддержке знания:
• система вывода определяет следствия фактов по конкретной
ситуации;
325
Классическая
парадигма
проектирования
системы
Приборная
система
Сбор
данных
Определение
модели
Система
управления
и принятие
решений
ПАРАДИГМА
проектирования ЭС
Анализ
текста
Анализ беседы
(интервью)
Анализ
поведения
Проект ЭС
Рис. 7.8 Парадигма проектирования ЭС
• планирующая система выбирает оптимальный способ
использования системы выводов для достижения поставленных целей;
• поясняющая система дает сведение о том, на какой основе
сделаны выводы.
В верхнем овале находятся процессы передачи знания, которые
могут применяться при формировании базы знаний:
• система генерирования знания реализует сбор знания
способом грубой индукции моделей, без культурной поддержки;
• система моделирования экспертизы осуществляет
приобретение знания методом имитирования поведения эксперта;
• система пополнения характеристик принимает знание по
линиям обратной связи;
• система извлечения знания накапливает знание в процессе
диалога с экспертом;
• система структурирования знания получает новые знания,
основываясь на аналогиях;
• система основных законов осуществляет выбор знаний путем
построения моделей, как это делается в моделирующих языках;
326
ПОЛУЧЕНИЕ ЗНАНИЙ
Множество систематических
принципов, теория категорий
Система основных
законов, моделирование
Система структурирования
знания, аналогия
Система извлечения
знания, выражение
Система пополнения
характеристик, обучение
Система моделирования,
экспертизы, имитирование
Система генерирования
знания, индукции
БАЗА ЗНАНИЙ, ФАКТЫ,
ПРАВИЛА
Система вывода,
неопределенная логика
Система планирования,
цели
Поясняющая система,
почему и как?
ПРИЛОЖЕНИЕ ЗНАНИЙ
Рис. 7.9 Иерархия методологий получения знания
• система систематических принципов берет знания путем их
вывода из абстрактных принципов.
На рис. 7.9 база знаний и оболочка объединены с методологиями
приобретения знаний, показывая тем самым естественные взаимосвязи
между ними. Раньше структура оболочки и поиск методов получения
знания трактовались как совершенно раздельные области исследования.
327
Структура систем поддержки знания (СПЗ). Перечислим вначале
общие требования для СПЗ, назначение которых заключается в
сборе знаний для ЭС:
• ИтС СПЗ должны быть независимыми от предметной области;
• эксперты должны пользоваться ИтС непосредственно, без
промежуточного звена;
• ИтС должны обладать способностью воспринимать знание из
разнообразных источников, включая тексты, беседы с экспертами
и наблюдения за поведением экспертов;
• СПЗ должна охватывать многообразие перспектив, включая
частичные или противоположные входные данные от различных
экспертов;
• система должна уметь охватывать разнообразные формы
знания и взаимоотношений между знаниями;
• система должна обладать способностью представлять знание
из разнородных источников с достаточной ясностью в отношении
его получения, следствий и структурных связей;
• пользователям СПЗ должна быть представлена возможность
приложить знание во многих предметных областях, а также
возможность свободно экспериментировать с его применением;
• система должна иметь средства для изучения их обоснованности;
• работа системы в максимальной степени должна
основываться на хорошо разработанных и понятных теориях сбора знаний и
их представления;
• по мере разработки СПЗ она должна приближаться к
интегрированной системе.
Технологические комплексы для разработки баз знаний.
Технологические комплексы (ТК) предназначены для разработки
проблемно-ориентированных БЗ различных типов, ТК-ОВМ — для
построения процессов обобщенных вычислительных моделей
(ОВМ-процессоров). Первый комплекс базируется на концепции,
которую можно специфицировать как «семантическая сеть плюс
система продукций», предназначен для разработки БЗ
продукционно-сетевого типа. В основе второго комплекса лежит понятие
ОВМ, обогащенное фреймами специального вида. Его парадигма
может быть определена как «функциональная сеть плюс фреймы»;
ТК-ОВМ поддерживает процесс разработки БЗ расчетно-логиче-
ского типа. Вместе ТК-СП (СП — системы продукции) и ТК-ОВМ
образуют первую версию интегрально технологического комплекса
ТК-БЗ. Комплексы имеют примерно одинаковую архитектуру.
Каждый из них представляет собой параметризованную БЗ соответст-
328
вующего типа, окруженную подсистемами спецификации ее
структуры и проблемного наполнения. Комплексы представляют
пользователю удобную среду для формирования, редактирования и
отладки специфицируемых компонент БЗ. После завершения
спецификации формирования БЗ отторгается от комплекса и может быть
использована как ядро или один из компонентов разрабатываемой
ЭС. Разработка такой системы включает следующие этапы:
1) выбор подходящей парадигмы представления знаний на
основе анализа постановки задачи и характера предметной области;
2) разработка модели предметной области;
3) спецификация структуры процессора, создаваемого на
основе комплекса, с учетом особенности данной модели;
4) настройка формируемого процессора на предметную область
(ввод и отладка модели предметной области);
5) отторжение готового процессора на включение его в состав
разрабатываемой ЭС (в простейшем случае подключение
специализированной интерфейсной оболочки).
Комплексы ТК-СП и ТК-ОВП поддерживают этапы 3 и 4.
Известные текущие версии комплексов функционируют на ПЭВМ в
операционной системе UNIX [52].
Итак, ТК-СП предназначен для создания
проблемно-ориентированных продукционных моделей, в которых роль базовой памяти
выполняет семантическая сеть (СемС). Модули данного типа
будем называть семантическими процессорами, или С-процессорами.
ТК-СП поддерживают технологию, при которой С-процессоры
функционируют в результате спецификаций его структуры и
проблемного наполнения. Известный подобный комплекс реализован
на языке ПАСКАЛЬ с использованием Автокада ГАММА-1,
отдельные компоненты — на языке С. Общий объем его
программной части около 20 тыс.строк.
К настоящему времени средствами комплекса разработано
несколько демонстрационных ЭС продукционного типа. Первая из
них — МАРШРУТ является «экспертом» по правилам дорожного
движения: в ходе подготовки системы к работе пользователь на
готовой схеме автомобильных дорог (например, города) может по
собственному усмотрению расставить дорожные знаки, после чего
система сама проложит маршрут, оптимальный по качеству и
продолжительности между любыми точками схемы. Система ТЕЩА
«знает все» о родственных отношениях. Функционально она
соответствует логической БД, «разбирающейся» в системе
родственных связей типа «родители», «золовка», «теща», «брат», «сестра»
и т.п.
329
Рассмотрим архитектуру ТК-СП, схема которой приведена на
рис. 7.10. Типовой С-процессор включает компоненты двух типов:
постоянные и специфицируемые. К постоянным относится
процессор свойств, интерпретатор команд интерфейсного модуля
(ИКИМ), машина для оперирования СемС (С-машина) и
процессор систем продукций (СП-процессор). Специфицируемыми
компонентами являются система постановок и сценарий исполнения
СП (СИСП), интерфейсного модуля, комплекс СП, комплекс
свойств СемС. Интерфейсный модуль выполняет функцию связи
С-процессора с конечным пользователем или внешними
подсистемами: анализирует входной поток команд, поступающих в
С-процессор, и отдает их исполнение соответствующему модулю —
СП-процессору, С-машине или процессору свойств. СП-процессор
организует исполнение комплекса СП, С-машина предназначена
для оперирования семантической сетью, являющейся основной
памятью С-процессора, процессор свойств осуществляет коррекцию
семантической сети в соответствии с ее свойствами.
Рассмотренная схема типового С-процессора соответствует
максимальной конфигурации. Обязательными его компонентами явля-
Спецификатор
комплекса
СП
Спецификатор
подстановок
и СИСП
Спецификатор
свойств
СемС
Интерфейсный
модуль
Система
подстановок
СИСП
ИКИМ
Комплекс СП
t \
СП-процессор
/^ /
>/^ / |_
^^
С-машина
i
\
СемС
_ '
1 Комплекс
1 свойств СемС
*
J Процессор свойств
С-процессор
Рис. 7.10. Общая структура ТК-СП
330
ются лишь интерфейсный модуль (без специфицируемых
компонент), С-машина и СемС. Они образуют С-процессор
минимальной конфигурации — базовый. Базовый процессор в зависимости
от потребностей пользователя может выполняться следующими
наборами компонентов в произвольном сочетании: комплекс СП и
СП-процессор, возможно, совместно с СИСП; система
подстановок; комплекс свойств СемС и процессор свойств.
Перечисленные средства (наряду со средствами комплексирова-
ния и отладки) объединены в общую систему на уровне
конструкторского монитора (К-монитора), обеспечивающего высокую
технологичность процесса производства проблемно-ориентированных
С-процессов.
Базовые средства, образующие С-процессор минимальной
конфигурации, представлены базовой семантической сетью (БСС),
С-машиной и интерфейсным модулем. БСС представляет собой
совокупность элементарных компонент (помеченных бинарных
отношений) следующего вида
m: r(argl, arg2),
где т — метка отношений; г — имя отношения; argl, arg2 —
аргументы отношения. Особенностью БСС является то, что метка m
однозначно именует соответствующий ей экземпляр бинарного
отношения и может быть использована для ссылки на него.
Элементарные компоненты, несмотря на свою простоту, обладают
достаточной выразительностью и гибкостью; они позволяют, в
частности, представлять в сети многоместные отношения, моделировать
вложенность и дизъюнктивность.
В базовой С-машине основным типом данных является БСС.
Кроме БСС, она обрабатывает данные следующих типов: числа,
строки, логические значения (ИСТИНА, ЛОЖЬ и НЕОПРеделен-
ность), кортежи, множества, имена, элементарные компоненты,
фрагменты, образцы, числа, строки, логические значения.
Кортежи и множества являются данными виртуальной машины
ГАММА-1. Имя — это последовательность символов,
начинающаяся с буквы, используется для обозначения элементов БСС (при
конструировании элементарных компонентов). Часть имен,
выделяемых для использования в качестве переменных (будем называть
их С-переменными), трактуется командами С-машины особым
образом. Фрагмент представляет собой совокупность (множество)
элементарных компонентов.
331
Образец есть структура (кортеж), состоящая из двух элементов
(второй может отсутствовать): фрагмента и кортежа фрагментов.
Любой из фрагментов, входящих в образец, может включать С-пе-
ременные.
С-машина поддерживает исполнение трех групп команд:
команды общего назначения, команды оперирования БСС, а также
команды описания и редактирования данных. Команды первой
группы служат для организации управления в программах
(условные и безусловные переходы, вызов подпрограмм и т.д.), а также
работы с такими традиционными типами данных, как числа,
строки, множества и кортежи. Для оперирования БСС С-машина
предоставляет следующие команды: команды поиска по образцу,
команды редактирования и команды для работы с архивом СемС,
который входил в состав С-машины. По команде поиска по
образцу выполняется поиск в сети фрагментов, удовлетворяющих
указанному образцу. При этом первый элемент образца
рассматривается как фрагмент поиска, именно он сопоставляется с
сетью, а второй — как отрицательный контекст для первого (ни
один фрагмент отрицательного контекста не должен быть
сопоставлен ни с одним фрагментом БСС). Команды редактирования
позволяют добавлять в БСС фрагменты, исключать из нее
вершины и фрагменты (заданные явно или с помощью образца),
склеивать и отождествлять вершины. Команды для работы с архивом
позволяют сформировать в архиве новую сеть, уничтожить уже
имеющуюся, настроить С-машину на работу с выбранной сетью
(переписать ее в БСС). Команды описания и редактирования
данных предназначены для описания и редактирования образцов и
фрагментов, которые могут создаваться не только из элементарных
компонентов, но и из многоместных (n-местных) отношений,
определенных при спецификации свойств сети. При отображении в
БСС каждый экземпляр n-местного отношения представляется
как п+1 элементарный компонент.
Интерфейсный модуль реализован с учетом использования в
составе любой конфигурации С-процессора. Он предоставляет
пользователю достаточно удобный набор директив для
оперирования семантической сетью (поиск информации, редактирование
сети) в диалоговом или пакетном режиме, отображаемых в
соответствующие команды С-машины, СП-процессора и процессора
свойств. Одно из основных достоинств интерфейсного
модуля — обеспечение возможности автоматического вызова и
исполнения СП во время выполнения директив в соответствии с
введенным сценарием.
332
Каждый из модулей спецификации имеет собственную архивную
систему и предоставляет пользователю специализированный язык:
ТИС —язык спецификации свойств семантической сети или
ЯСП — язык спецификации СП, а также средства настройки
интерфейсного модуля.
Для спецификации комплекса СП, включаемого в С-процессор
для организации логического вывода, служит ЯСП, представляя
средства для спецификации продукционных правил и схем их
активации, позволяя организовать взаимодействие СП, входящих в
комплекс.
С помощью языка ТИС строится проблемно-ориентированная
семантическая сеть с заданными свойствами лишь на уровне
внешних спецификаций, обеспечивающая более высокий уровень
представления информации и контроль за ее правильностью.
Язык ТИС включает средства, с помощью которых конструктор,
формирующий С-процессор, может выполнять следующие
технологические операции:
1. Вводить классы отношений и объектов (допускается
пересечение и вложение классов), а также определять, элементы каких
классов могут выступать в качестве тех или иных аргументов
отношений. Класс вершин может быть задан либо перечислением
входящих в него вершин, либо конструированием новых классов из
уже созданных с помощью традиционных
теоретико-множественных операций: объединения, пересечения, дополнения. Кроме
того, конструктор имеет возможность указать, что в сети могут
использоваться только объекты и (или) отношения, введенные в
описания сети.
2. Предписывать отношению одно или несколько свойств (при
условии, что они непротиворечивы) из следующего набора:
Симметричность, ТРАНзитивность, РЕФлексивность, ЭКВивалент-
нось, АНТИСИМметричность, АНТИРЕфлектность, УНИКаль-
ность и Функциональная Зависимость (ФУНКЗ). Семантика
первых шести свойств понятна из их названия, поэтому поясним только
семантику двух последних. Свойства УНИК и ФУНКЗ накладывают
ограничения на второй аргумент отношения R. Так, при наличии в
сети отношения R(A,B) добавление в сеть отношения R(A,C)
вызывает АВОСТ, если R приписано свойство ФУНКЗ, и отождествление
(склейку) вершин В и С, если R приписано свойство УНИК.
Перечисленные выше свойства могут быть приписаны только бинарным
отношениям или классам бинарных отношений, определенным с
помощью технологической операции 1.
333
3. Задавать интерпретации отношений в виде пакета
продукционных правил. Прагматически интерпретация отношения
представляет собой последовательность действий по модификации сети,
выполняемую при добавлении в нее конкретного экземпляра такого
отношения (при вводе информации через интерфейсный модуль
или в процессе исполнения комплекса СП).
4. Определить начальное наполнение сети в виде некоторого
стандартного фрагмента. Такой аргумент может содержать,
например, некоторые значения о предметной области и (или)
специальные знания, которые невозможно или нецелесообразно
представлять с помощью других средств спецификации.
Настройка интерфейсного модуля предполагает спецификацию
подстановок и СИСП. Средствами сценария с любым оператором
пользовательского монитора может быть соотнесена СП, которая в
рамках С-процессора будет исполняться при каждом обращении к
данному оператору. Механизм подстановок аналогичен макросам в
языках программирования. Благодаря ему пользователь при работе в
СимС получает возможность манипулировать макроотношениями.
При спецификации СИСП пользователь может связать с любой
введенной ранее СП один из следующих признаков, определяющих
«время» их исполнения:
ДОБ — добавление фрагмента; ИСКЛ — удаление фрагмента;
СКЛ — склейка вершин; МОД — любая модификация сети;
ПОИСК — перед поиском по образцу; ДЕЖ — при любом
обращении к сети; НЕТ — СП не имеет признака и может быть вызвана
только явно (по команде пользовательского монитора
ВЫПОЛНИТЬ СП или с помощью функции ВЫЗОВ языка ЯСП).
Вопросы для самопроверки
1. В чем заключается технология разработки ЭС?
2. Каково содержание этапа идентификации?
3. Каково содержание этапа концептуализации?
4. Каково содержание этапа формализации?
5. Каково содержание этапа выполнения?
6. Каково содержание этапа тестирования?
7. Каково содержание этапа опытной эксплуатации?
8. Каковы основные характеристики инструментальных средств?
9. Как представляются знания в ЭС?
10. Каковы методы представления знаний в ЭС?
11. По каким критериям отбираются специалисты-эксперты?
12. Каковы особенности продукционных ЭС?
13. Как осуществляются выводы при движениях по цепочке вперед и назад?
14. Какова информационная структура ЭС?
15. Какова парадигма проектирования ЭС?
16. Какие существуют технологические комплексы для разработки баз знаний?
Глава 8
ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕДУР ВЫБОРА
В ЭКСПЕРТНЫХ СИСТЕМАХ ПРОГНОЗИРОВАНИЯ
В настоящее время очевидно, что при столь разнообразных
объектах контроля, управления и прогнозирования даже в одной
отдельно взятой предметной области, а также при наличии
множества различных алгоритмов прогнозирования неэффективно
подходить к созданию автоматизированных систем прогнозирования
(АСП) с позиций оценки состояния только отдельного объекта
(процесса) и только с помощью одного метода (алгоритма).
Необходимо стремиться к процедурам, близким к универсальным, т. е.
на основе существующих вычислительных средств создать такие
инструментальные средства, которые позволят самостоятельно
осуществлять выбор методов, алгоритмов и программ из созданных
экспертами библиотек при решении конкретной практической
задачи из исследуемой предметной области. Иными словами, в АСП
необходима интеллектуальная поддержка при принятии решения,
какой алгоритмический вариант (или коллектив вариантов)
выбрать при реализации поставленной задачи.
8.1. Содержательное описание
процедурной модели прогнозирования
Несмотря на многообразие вариантов алгоритмического
решения задач прогнозирования, оно имеет общую процедурную модель
процесса получения результата, которая содержит три наиболее
общих этапа: ретроспективный анализ, диагностический анализ и
прогнозный анализ (рис. 8.1.). Содержание всех видов анализа и их
этапов состоит в интерпретации прошлого, определении
настоящего и оценке будущего. Суть этапов в виде библиотек приемов и
методов может существенно отличаться в зависимости от предметной
области исследования, а также от контролируемых объектов и
сопровождающих их деградационных процессов.
Раскроем назначение каждого этапа процедурной модели, хотя
содержательная направленность очевидна из их названия.
335
A
X
П
s
Постановка задачи.
Описание предметной
области
Параметрический,
структурный,
надежностный и другие
анализы
прогнозирования
X
Формирование базы
знаний о
контролируемом объекте
и процессах деградации
X
Выбор моделей
и разработка алгоритмов
прогнозирован ия
X
Обучение моделей
прогнозирования
X
Планирование процесса
прогнозирования
±
Интерпретация
прогноза и принятие
решения
Оценка точности
и эффективности
Непосредственно
прогнозирование
Идентификация выбранной
модели прогнозирования
по текущим данным
Организация диалоговой
системы
Регистрация данных
диагностирования
S
х
«
3
х
о
о,
С
х rt
u
S
Диагностическое
обеспечение
(методы и средства)
'
г
Диагностические
измерительные приборы
и датчики
/
i
Объект прогнозирования
Рис. 8.1. Процедурная модель процесса прогнозирования
Постановка задачи играет большую роль при решении любой
задачи. Однако в данном случае этот этап особенно важен, так как
во многом предопределяет весь ход процесса прогнозирования,
поскольку именно постановка задачи оговаривает ту часть
предметной области, в которой «живет» контролируемый объект, и то
методическое, алгоритмическое и программное обеспечение, которое
может быть привлечено к решению задачи. Этот этап дает
описание предметной области, очерчивает контуры базы знаний,
которую необходимо создать или привлечь для обеспечения
фундаментальных основ решения задачи. Предметная область определяется
тем классом объектов, которые подвергаются контролю, средой, в
которой они функционируют, и видом деградационных процессов,
определяющих изменение работоспособности объекта.
336
Анализ объекта прогнозирования предполагает исследование
объекта с различных сторон: физической,
конструктивно-структурной, надежностно-параметрической, функциональной,
информационной, диагностической и т.д. Если все эти аспекты анализа
представить в формализованном йиде, желательно в аналитической
фюрме — в виде математических моделей, или в виде словесного
описания, конструктивных или функциональных блок-схем,
чертежей и номограмм, логических схем и др., а также в виде их
семантической взаимосвязи и отношения, то это и будет составлять
основу базы знаний. Поскольку интерес вызывает изменение
технического состояния объекта, то необходимо изучить процессы,
характеризующие эти изменения. Процессы исследуются как с
физической (фундаментальной), так и статистической (прикладной)
стороны, после чего выбирают показатели (характеристики или
параметры), являющиеся наиболее информативными для описания
процесса изменения технического состояния. С этой целью
используются методы и алгоритмы, позволяющие оценить характер и
степень нестационарности этих процессов.
Формирование базы знаний о контролируемом объекте и
процессах деградации предполагает, прежде всего, и организацию базы
данных априорной информации об изменении работоспособности
объекта. Эта информация необходима для решения многих
вопросов по выбору моделей прогнозирования и их обучению для
решения прикладных задач. Априорная информация может быть
получена путем машинного моделирования деградационных процессов
и старения объектов на основе знания их физического механизма,
по результатам производственных испытаний и по данным
эксплуатации этих объектов. Вся информация о процессах и объектах
хранится в БД, как составной части БЗ.
Особенности представления знаний в ЭВМ рассмотрены в
главах 1 и 2.
Выбор моделей и разработка алгоритмов прогнозирования
зависят от множества рассмотренных ниже факторов и представляют
собой достаточно сложную интеллектуальную задачу. Каждый из
приведенных факторов и его варианты по-разному влияют на
выбор метода прогнозирования. Однако оптимальный выбор модели
можно осуществить на основе созданной достаточно полно базы
знаний и процедуры выбора из этой БЗ наилучшей модели
прогнозирования, удовлетворяющей требованиям поставленной задачи.
Обучение моделей прогнозирования по априорной информации
требует проверки работы алгоритма по известным процессам
изменения состояния объектов. Обучение как математическая задача L
22 — 3466
337
может быть отнесено к классу оптимизационных проблем поиска
описаний. Индивидуальная оптимизационная задача есть пятерка
L = <XL, YL, рь Fl> IL>,
где XL, YL — множество входных и выходных записей;
pL?XLxYL — отношение (или функция р : XL -» YL); FL —
множество отношений (fL?XLxYL для всех fL g Fl), называемых
описаниями; IL — оператор качества FL, показывающий для
каждого fL € FL степень его близости к pL. Задача состоит в отыскании
оптимального по IL описания fL* из FL.
Таким образом, при обучении необходимо создать методы
формирования условий задачи по описанию проблемной области или
по наблюдению за этой ситуацией, научиться переходу от
известного решения частных задач (примеров) к решению общей задачи,
создать приемы декомпозиции исходной для автоматизированной
системы задачи на более мелкие так, чтобы они оказались для
системы уже известными, разработать нормативные и декларативные
модели самого процесса обучения, создать теорию
подражательного поведения.
Планирование процедуры прогнозирования заключается в выборе
плана проведения диагностического анализа (выборе временных
интервалов, числа измерений контролируемых параметров и т.д.).
Иными словами, результатом этапа должен быть план
действий — частично упорядоченная совокупность действий. Такой
план напоминает сценарий, в котором в качестве отношения
между вершинами выступают отношения типа: «цель-подцель»,
«цель-действие», «действие-результат» и т.п. Любой путь в этом
сценарии, который ведет от вершины, соответствующей текущей
ситуации, в любую из целевых вершин, определяет план действий.
К этапу диагностического анализа в рамках рассматриваемой
процедуры не предъявляется каких-либо особых требований. Здесь
прежде всего, необходима разработка диагностического
обеспечения: нужно иметь набор (библиотеку) методов и моделей
диагностирования, инструментальные средства диагностирования,
позволяющие оценить текущее техническое состояние объекта с
необходимой точностью.
Организация диалоговой системы подразумевает организацию
процедуры общения ЛПР с ЭВМ как основы АСП. Поскольку
процесс контроля и прогнозирования можно интерпретировать как
«запрос-ответ», «запрос на производство прогнозирования —
выдача результата прогноза», то диалог заложен в самой природе про-
338
цесса контроля и прогнозирования. При этом диалог существует
всегда вне зависимости от объема решаемой задачи и для всех
классов задач. Поэтому важна организация диалогового процесса с
разработкой ее теоретических и практических основ.
Идентификацию выбранной модели и непосредственно
прогнозирование по текущим данным осуществляют по алгоритмам,
проверенным на стадии обучения по априорным данным, т. е. это
чисто счетно-вычислительные действия.
Поставленная задача прогнозирования требует оценки
точности получаемых результатов (прогноза) и эффективности
прогнозирования.
Принятие решения является заключительным этапом и
представляет основу для процесса управления, целью которого могут
быть действия, направленные на оптимизацию функционирования
диагностируемого объекта или улучшения показателей
контролируемого процесса.
8.2. Описание предметной области
при выборе моделей прогнозирования
Очевидно, что в автоматизированной системе упреждающего
контроля центральным моментом процесса прогнозирования
является выбор математической модели, которая бы учитывала все
специфические особенности поставленной задачи. При этом следует
рассматривать автоматизированно такие вопросы, как:
• оперирование (манипулирование) знаниями из той базы
знаний, которая образована, предполагающее использование моделей
рассуждений и обобщения, создание методов достоверного и
правдоподобного вывода решения (заключения);
• общение оператора с системой, что требует формирования
методов построения лингвистических процессоров,
вопросно-ответных систем, диалоговых систем и др.;
• восприятие или распознавание требований, которые
выдвигаются в задаче как в виде символьной (текстовой), так и зрительной
(образной) информации;
• поведение системы в некоторой информационной среде на
основе модели целесообразного поведения, нормативного
поведения, ситуативного поведения и т.п.
Исследование подобных задач проблемного характера требует
определенного уровня интеллектуализации АСП.
22*
339
Естественно, здесь предполагается, что необходимые
инструментальные средства: программное обеспечение, технические
средства (ЭВМ) и др. входят в систему.
Очевидно, что существует определенный уровень
интеллектуализации, который определяет границы использования ИнС для
решения задач в такой предметной области, как прогнозирование и
управление сложными объектами.
Поскольку функция прогнозирования — это определенные
действия, обеспечивающие процесс решения одной задачи, то она
может быть представлена количеством данных, которые необходимо
вводить в систему для управления процессом вычислений и
получения решения отдельной задачи. В простейшем случае уровень
интеллектуальности АСП можно оценить отношением [93]:
н-
где
q p
F = 2mi, F3 = F + Fr, Fr = ]>]mj;
i=i j=i
F3, F, Fr — соответственно функции прогнозирования и
управления всеми задачами системы, только АСП и
человеком-оператором; ть nij — количество данных, используемых для выполнения
функции прогнозирования и управления i-й задачи АСП и j-й
задачи оператором; q, p — число задач, выполняемых системой
прогнозирования и оператором соответственно.
Поскольку в нашем случае речь идет об интеллектуализиро-
ванной АСП, то следует дополнительно ввести класс задач,
решаемых совместно системой и оператором. Это выразится
введением функции F3r, и приведенное выражение в некоторой
степени усложнится.
Перейдем непосредственно к описанию предметной области, в
которой необходимо осуществлять выбор модели прогнозирования
(МП) в соответствии с требованием задачи. В данном случае
проблемная область выбора представляет собой перечень всех тех
факторов, которые влияют на определение МП и соответственно
процесс прогнозирования.
На рис. 8.2 показана иерархическая сеть всех атрибутов
проблемной области выбора, вершины которой <0,П,И,Л,3> не
подчинены друг другу иерархически и их последовательность опреде-
340
лена из соображений удобства рассмотрения и такой точки зрения:
объект, процесс — первичен, а результат есть следствие
исследования объекта [116].
Рис. 8.2. Иерархическая сеть предметной области прогнозирования
341
Итак, упомянутая пятерка факторов представляет собой
следующие категории:
О — объект прогнозирования и управления;
П — процесс изменения технического состояния О;
И — информация, поступаемая в результате текущего контроля
О и имеющаяся в базе знаний;
Л — модель прогнозирования, влияющая на состав алгоритма и
содержание программного обеспечения;
3 — результат прогнозирования или прогноз, т. е. в каком виде
его требуется получить в решаемой задаче.
Категория — объект упреждающего контроля и управления. Ее
влияние на выбор модели является основополагающим и
определяется четырьмя факторами:
0 = {S,I,V,H}.
Здесь S — стадии жизненного цикла (СЖЦ), которых практически
для любого объекта в обобщенном виде три: Si —
проектирование, S2 — изготовление, S3 — эксплуатация, т. е. S:(Si, S2, S3).
Влияние фактора S на постановку задачи прогнозирования
является принципиальным, так как стадия проектирования требует
совершенно других алгоритмов прогнозирования, чем стадия
производства или эксплуатации. На стадии Si используют априорную
информацию и ту часть базы знаний, относящуюся к
фундаментальной, а также имитационное моделирование по
математическим и алгоритмическим моделям. На S2 и S3 появляется текущая
информация и формируется прикладная сторона БЗ. Строятся
модели и алгоритмы по текущим данным, и они являются уже
основными для принятия решения о результатах прогнозирования,
а априорные данные используются для обучения и корректировки
моделей. Стадии производства и эксплуатации также существенно
отличаются по конечным целям задачи прогнозирования и
возможным объемам текущей информации. Все существующие
различия между стадиями, а их достаточно много, здесь упомянуты
только основные, влияют на выбор моделей и алгоритмов (ВМА)
прогнозирования.
Целевое использование I:(ib i2, i3> может быть
однократным — ib двух-, трехкратным,... — i2, и многократным — i3. В
первом случае резко ограничено поступление текущей информации, а
в некоторых случаях невозможно ее получение, поэтому варианты
ii и i2 также сильно влияют на процесс ВМА.
Вид контроля V:(vb v2, v3) может быть однократным — vb
периодическим — v2, непрерывным — v3. He трудно увидеть, что
342
влияние на ВМА этого фактора очевидно, так как У
непосредственно формирует базу данных, а объем текущей информации
оказывает влияние не только на ВМА, но и, что существенно, на
точность и эффективность прогноза.
Прикладное назначение объекта упреждающего контроля H:(hi,
h2, h3) прежде всего требует учета, где и как будет
функционировать объект: hi — автономное использование, h2 —
производственные процессы, h3 — научные исследования и др. Это также
откладывает отпечаток на постановку задачи, на конечные цели и
средства их достижения.
Конкретный вариант объекта может быть довольно
разнообразным, однако общее число v можно определить для приведенного
иерархического уровня как v = т\*9 где ? = 4 — число видов
фактора, а т| = 3 — число подвидов, т.е. v = 81. Как видим, даже на
одном классе категорий процесс ВМА не прост.
Категория — процесс изменения технического состояния объекта.
Любой процесс, протекающий во времени, можно количественно
представить в виде временного ряда. Однако на этом сходство
между различного рода процессами может окончиться.
Рассматриваемые временные процессы — это, прежде всего, случайные
процессы, содержащие, как правило, несколько составляющих.
Поведение этих составляющих в отдельных временных сечениях (законы
распределения), с течением времени (стационарность или
нестационарность), их многомерность и тому подобное принципиально
влияют на формальное описание процесса.
В общем случае это влияет и на ВМА прогнозирования в виде
совокупности четырех видов факторов:
П = {X,Q,N,P},
где X — описывает характер процесса; Q — его мерность; N —
характер нестационарности; Р — вид процесса.
В свою очередь, каждый из видов факторов имеет свои
подвиды, как это видно из иерархической сети, и они имеют следующий
смысл. Характер протекания процесса изменения технического
состояния X:(xi,x2) может быть монотонным (хО и флюктуационным
(х2). Процесс может анализироваться и оцениваться Q:(©b©2) как в
одномерном (©О, так и в многомерном (со2) вариантах. При этом
характер нестационарности N:(ni,n2) может быть линейным (щ) и
нелинейным (п2). Особенно разнообразен фактор — вид процесса
Р-(РьР2>—)» однако для формального рассмотрения можно выде-
343
лить два вида — гауссовский (рО и негауссовский (р2). Понятно,
что р2 можно разбить на множество других законов: Вейбуллов-
ский, Релея, Симпсона и т.д.
В зависимости от конкретного вида процесса, например, он
может быть таковым: П = {x2,(Oi,n2,Pi}, соответственно и модель
прогнозирования будет одна, а в другом варианте другая. Если
разбиение каждого вида фактора будет осуществлено только на два
подвида (а это необязательно), то число вариантов процессов равно 2*,
где ? — число видов факторов (в нашем случае I = 4 и 21 = 16).
Соответственно и число моделей должно быть не менее этой цифры.
Категория — информация о деградационном процессе. Ее влияние
сказывается прежде всего на объеме и формировании базы данных
и базы знаний. Это влияние отражается прежде всего четырьмя
факторами:
И = {Т,С,А,В},
где — T:(ti,t2) характеризует объем текущей информации в
количестве, достаточном — ti и ограниченном —t2 (порог между ti и t2
должен быть определен для каждого направления
прогнозирования); С:(с1,с2,сз) — характер поступления информации, который
может быть непрерывным (ci), периодическим (с2), однократным
(сз); А:(аьа2) — наличие априорной информации (ai — имеется,
а2 — отсутствует); B:(bi,b2) — вид информации (bi — обработанная,
Ь2 — необработанная).
Влияние информации на ВМА приводит к тому, что число
вариантов v моделей упреждающего контроля колеблется от 24 до З4,
т. е. от 16 до 81. В общем виде можно записать выражение для v:
v = (л + *д?,
где б = 1 для i-ro фактора (в данном случае i = 2) и е = 0 для j * i.
Это выражение справедливо для рассматриваемого уровня, а в
общем случае ej может быть и отличной от единицы.
Категория — математическая модель процесса изменения
состояния объектов. Она может быть основой для модели
прогнозирования, так как формализованно описывает изменение
работоспособности контролируемого объекта или так называемые деградацион-
ные процессы. Выделим виды факторов, определяющие модель
прогнозирования
Л: {K,R,W},
344
где К:(кьк2) характеризует зависимость модели от коэффициентов
(ki — линейная, а к2 — нелинейная зависимости); R:(rbr2) —
описывает зависимость от знания закона распределения (п — закон
известен, г2 — неизвестен); W показывает влияние математического
вида модели (wi — регрессионная модель, w2 — интерполяционная
и т.д.).
В рассматриваемом варианте имеем v = 23 = 8 различных видов
влияния на решение задачи прогнозирования.
Категория — результат прогнозирования (прогноз). Она может
быть различной в зависимости от трех видов факторов:
3 = {D,M,E},
где D:(dbd2) — вид прогнозирования (di — экстраполяция, d2 —
статистическая классификация); M:(mi,m2) — характеризует срок или
дальность прогноза (mi — краткосрочный, а т2 — долгосрочный
прогаозы); Е:(еье2) — способ прогнозирования (ei — прямой, е2 —
обратный). Здесь также может быть (при принятом числе подвидов
факторов) v = 8 вариантов модели.
Таким образом, не трудно увидеть, что на процедуру
прогнозирования влияют: пять категорий: <0,П,И,Л,3>; 18 видов
факторов: {S,I,V,H,X,fi,N,P,T,C,A,B,K,R,W,D,M,E}; 41 подвид
факторов (они видны из рис.8.2). Каждый из подвидов факторов
предъявляет свои требования к процедуре прогнозирования, и
процесс ВМА должен учитывать эти требования, которые
заложены в БЗ. Так, для конкретной задачи кортеж требований {f}
может иметь вид
<s3,i3,v2,h1,x1,a)i,ni,Pi,tbC2,a1,bi,ki,ri,w2,d1,m2,e1>. (8.1)
Учет этих требований ввиду их многочисленности превращает
задачу выбора модели и алгоритма процесса прогнозирования в
большую самостоятельную проблему, для решения которой
необходимо создавать элементы экспертной и диалоговой систем с
интеллектуальной поддержкой принятия решений, иными словами,
требуется создать интеллеюуализированную систему, способную
решать задачи прогнозирования.
Под созданием ИнС предполагается разработка
инструментальных средств, которые включают в себя программное обеспечение и
технические средства (ЭВМ и др.). Под разработкой следует
понимать определенную исследовательскую и проектно-конструктор-
скую деятельность.
345
8.3. Продукционные модели в ДСП
Как известно, в продукционных моделях осуществляется вывод
на знаниях. При решении поставленной задачи необходимо в
зависимости от требований множества факторов {f} сделать вывод о
выборе соответствующих модели и алгоритма, т. е. продукционные
модели могут быть использованы для процесса ВМА.
В общем виде под продукцией понимается выражение
следующего вида
0); Q; Р; А^В; N,
где j — имя продукции, с помощью которого данная продукция
выделяется из всего множества продукций; Q — элемент,
характеризующий сферу применения продукции, например процесс ВМА.
Основным элементом продукции является ее ядро: А=>В.
Интерпретация ядра продукции может быть различной и зависит от того,
что стоит слева и справа от знака секвенции =>. Обычное
прочтение ядра продукции выглядит так: ЕСЛИ А, ТО В, более сложные
конструкции ядра допускают в правой части альтернативный
выбор, например ЕСЛИ А, ТО Вь ИНАЧЕ Вг. В процессе ВМА
продукцию можно использовать на каждом иерархическом уровне,
например на первом S=>I, если S3, то 'ь, иначе i3 и т.д.
Элемент Р есть условие применимости ядра продукции.
Обычно Р представляет собой логическое выражение (как правило,
предикат). Когда Р принимает значение «истина», ядро продукции
активизируется. Если «ложно», то ядро продукции не может быть
исполнено. Например, если стадия жизненного цикла —
проектирование, то, естественно, не может быть многократного
использования и периодического контроля и т.д.
Элемент N списывает постусловия продукции. Они
актуализируются только в том случае, если ядро продукции реализовалось.
Постусловия продукции описывают действия и процедуры,
которые необходимо выполнить после реализации В. Например, после
того, как установлено, что объем текущей информации И
достаточен, необходимо шаг ti считать пройденным и в кортеже вида
(8.1) перейти к следующему шагу или к другому ядру продукции.
В память АСП закладывается целый набор продукций,
образующих систему продукций. В системе продукций задаются
специальные процедуры управления продукциями, с помощью которых
происходит актуализация продукций и выбор для выполнения той
или иной продукции из числа актуализированных. В ряде ИнС
346
используются комбинации сетевых и продукционных моделей
представления базы знаний (в нашем случае — база знаний
иерархической сети).
Рассмотрим возможные классификации ядер продукции,
которые прежде всего делятся на два больших типа:
детерминированные и недетерминированные. В детерминированных ядрах при
актуализации ядра и при выполнимости А правая часть ядра
выполняется обязательно; в недетерминированных ядрах В может
выполняться и не выполняться. Таким образом, секвенция => в
детерминированных ядрах реализуется с необходимостью, а в
недетерминированных ядрах — с возможностью. Интерпретация ядра
в этом случае может, например, выглядеть так: ЕСЛИ А, ТО
ВОЗМОЖНО В.
Возможность определяется некоторыми оценками реализации
ядра. Если задана вероятность выполнения В при актуализации А,
то продукция (в простейшем случае продукция состоит лишь из
ядра) будет такой: ЕСЛИ А, ТО С ВЕРОЯТНОСТЬЮ Р
РЕАЛИЗОВАТЬ В. Оценка реализации ядра может быть
лингвистической, связанной с понятием терм-множества лингвистической
переменной, например: ЕСЛИ А, ТО С БОЛЬШОЙ ДОЛЕЙ
УВЕРЕННОСТИ В. Существуют и другие способы задания оценки
реализации ядра.
Детерминированные продукции могут быть однозначными и
альтернативными. Во втором случае в правой части ядра
указываются альтернативные возможности выбора, которые оцениваются
специальными весами выбора. В качестве таких весов могут
использоваться вероятностные оценки, лингвистические оценки,
экспертные оценки и т.п. (например, ЕСЛИ А, ТО ЧАЩЕ ВСЕГО
НАДО ДЕЛАТЬ Вь РЕЖЕ В2).
Особым типом являются прогнозирующие продукции, в
которых описываются последствия, ожидаемые при актуализации А,
например: ЕСЛИ А, ТО С ВЕРОЯТНОСТЬЮ Р МОЖНО
ОЖИДАТЬ В.
Дальнейшую классификацию ядер продукций, которые
применимы в ИнС типа АСП, можно провести, опираясь на типовую
схему системы (рис. 8.3). Если х и у обозначить любой из блоков
рисунка (СО, БД, БЗ, ЛБ), то ядро АХ=>ВУ означает, что
информация об А берется из блока х, а результат срабатывания продукции В
посылается в блок у. Комбинации х и у, осмысленные с точки
зрения АСП, отмечены в табл. 8.1. знаком «+».
347
Таблица 8.1
А/В
СО
БД
БЗ
1 ЛБ
со
+
+
+
БД
+
+
БЗ
+
+
+
ЛБ
+
+
+
+ j
Рассмотрим часто встречающийся тип продукции Абз=>Вбз. В
этом случае АБз и Вбз представляют собой определенные
фрагменты информации, хранящейся в базе знаний. При сетевом
представлении это могут быть фрагменты семантической сети, при
логических моделях — формулы того или иного исчисления. Тогда смысл
продукции АБЗ=>ВБз состоит в дополнении или замене одного
фрагмента БЗ другим. Для актуализации этой продукции
необходимо, чтобы в БЗ существовал фрагмент, совпадающий с А. При
поиске в БЗ А играет роль образца, а процедура такого поиска
называется поиском по образцу.
Для иллюстрации поиска по образцу положим, что в БЗ для
представления знаний используется семантическая сеть (рис. 8.4, а)
и продукция (рис. 8.4, б). Поиск А в БЗ организуется различными
способами. Можно сначала искать вершину а. Если в БЗ такой
вершины нет, то поиск по образцу заканчивается неудачей. Если
вершина а найдена, то можно найти все выходящие из нее дуги,
помеченные отношением R3, так как в образце справа от этой дуги сто-
f Предметная >^
( область )
V (внешняя среда)у
Г Система
1 общения (СО)
\
1
1 1
1
_
1 Логический блок
| (ЛБ) решатель
'
i
1
{
1
ЭВМ
База
данных (БД)
i
^
i
*
База
знаний (БЗ) |
*
i
i
Рис. 8.3. Типовая схема интеллектуализированной системы
прогнозирования
348
ит вершина х, на месте которой в БЗ может находиться любая
вершина. Если из а не выходит ни одной дуги, помеченной
отношением Яз, то поиск по образцу заканчивается неудачей. Но если такие
R2 в
Рис. 8.4. Семантическая сеть и продукция в БЗ АСП
349
дуги есть, то происходит переход во все вершины, с которыми
вершину а связывает отношение R3, т.е. возникает параллельный
процесс поиска. В примере произойдет переход от вершины а к
вершинам b и f, из которых начнется поиск выходящих из них дуг,
помеченных отношением Rb ведущих в любую вершину, так как в
образце далее стоит вершина, которой соответствует свободная
переменная у. Далее процесс продолжается аналогичным образом. В
примере поиск по образцу оказывается успешным. После
нахождения А в семантической сети происходит замена, которая
определяется правой частью образца. В результате возникает
трансформированная сеть для решения поставленной задачи (рис. 8.4, в).
Продукция Абз^Вбз соответствует процедуре нахождения
закономерностей по эмпирическим данным. Логический блок на
основании просмотра и анализа данных выдвигает гипотезы о наличии
закономерностей и, убедившись в их приемлемости и достаточной
обоснованности, записывает в БЗ. Аналогично можно
интерпретировать и иные типы продукций из табл. 8.1.
При выполнении в АСП условия применимости ядер
продукции для группы продукций возникает вопрос выбора той
продукции, которая в данной ситуации будет активизирована. Решение
этой задачи возлагается на систему управления комплексом
продукций. Если АСП как ИнС реализована на ЭВМ с параллельной
архитектурой, то из фронта готовых продукций может выбираться
не одна продукция, а столько, сколько параллельных ветвей может
одновременно в данной ситуации выполнять ЭВМ. Но независимо
от количества актуализированных продукций задача
альтернативного выбора остается. Задача управления системой продукций
может решаться двумя путями [8, 94, 95]: централизованным и
децентрализованным. При централизованном управлении выполнением
продукций решение об актуализации принимается специальной
системой управления, а при децентрализованном определяется
складывающейся в этот момент ситуацией. Если порядок
выполнения продукций произволен, то решение определяется текущей
ситуацией или системой управления; если порядок важен, то в
продукциях должна содержаться информация о требованиях к этому
порядку. Если в постусловиях продукций указывается имя
продукции, которая должна выполняться после данной, система
продукций превращается в обычную программу для ЭВМ, т. е. реализует
некоторый алгоритм.
Существует несколько стратегий (часть из них уже
упоминалось) управления выполнением продукций:
350
1. Принцип «стопки книг». Основан на идее, что наиболее часто
используемая продукция является наиболее полезной. Готовые
продукции как бы образуют «стопку», в которой порядок
определяется накопленной частотой использования продукций в прошлом.
На самом верху «стопки» находится продукция, которая
использовалась чаще всех. При актуализации некоторой совокупности
продукций для исполнения выбирается та продукция, у которой
частота использования максимальна.
2. Принцип наиболее длинного условия. Заключается в выборе из
фронта готовых продукций той, у которой стало истинным
наиболее «длинное» условие выполнимости ядра. Этот принцип
опирается на соображение «здравого смысла», что частные правила,
относящиеся к узкому классу ситуаций, важнее общих правил,
относящихся к широкому классу, так как первые учитывают больше
информации о ситуации, чем вторые. Трудность использования
данного принципа состоит в том, что надо заранее упорядочить
условия по вхождению друг в друга по отношению «частное-общее».
3. Принцип метапродукций. Основан на идее ввода в систему
продукций специальных метапродукций, задачей которых является
организация управления в системе продукций при возможности
неоднозначного выбора из множества готовых продукций.
4. Принцип «классной доски». Основан на идее спусковых
функций [94]. При реализации принципа «классной доски» в
АСП вьщеляется специальное рабочее поле памяти — аналог
классной доски, на которой мелом пишут объявления и стирают
их при необходимости тряпкой. Как правило, на «классной доске»
выделены специальные поля для формирования условий
применимости ядер продукции, различные для разных сфер
применения продукций, специальные поля для записи результатов
срабатывания продукций и для записи постусловий, если они
адресованы другим продукциям.
5. Принцип приоритетного выбора. Связан с введением
статических и динамических приоритетов на продукции. Статические
приоритеты могут формироваться априори на основании сведений о
важности продукционных правил в данной проблемной области.
Эти сведения, как правило, представляют собой информацию,
извлекаемую из эксперта. Динамические приоритеты
вырабатываются в процессе функционирования системы продукций и могут
отражать, например, такой параметр, как время нахождения
продукции во множестве готовых продукций.
351
6. Управление по именам. Основано на задании для имен
продукций, входящих в некоторую систему, некоторой формальной
грамматики или другой процедуры, обеспечивающей сужение
совокупности готовых продукций и выбор из нее очередной
продукции для выполнения.
Пусть система продукций представлена четырьмя простейшими
продукциями, состоящими лишь из ядерных частей: (а) А=>В; (б)
B&D=>A; (в) AvB=>D; (г) D=>C. В таком виде система продукций
явно недетерминированна. Если выполняется А, то множество
готовых продукций включает продукции с именами (а) и (в), а если
выполняется В и D , то три последние продукции. Для устранения
подобной недетерминированности может быть введена некоторая
грамматика для имен продукций: (а)=>(б); (в)=>(б); (а)=>(г). Тогда
если в некоторый момент была выполнена продукция с именем (б),
то новые продукции выполняться не будут. Если же в некоторый
момент выполнялась продукция с именем (а), то после нее смогут
выполняться продукции с именем (б) или (г). Но левые части ядер
в этих продукциях таковы, что неоднозначность возникает лишь в
случае, когда В и D одновременно выполнены. С помощью
грамматики для имен продукций можно задать однозначный
алгоритмический процесс.
Стратегии управления выполнением продукций могут
комбинировать различные принципы. Для АСП, в частности, наиболее
приемлемо сочетание пятого и шестого принципов. Следует
отметить, что продукционным моделям не хватает строгой теории [8] и
пока в них царит эвристика. При задании модели проблемной
области в виде совокупности продукций нельзя быть уверенным в ее
полноте и непротиворечивости. Поэтому ее необходимо дополнять
элементами экспертных систем и диалоговых процедур. В этом
случае в динамическом режиме удается использовать
перестраивающийся алгоритм управления, тогда система продукций
становится адаптивной или системой продукций реального времени.
Так, для АСП первую продукцию можно записать в виде
(DjQ-OjP^S3-^; S^tNb
где Вт={0,1; 0,1; 0,1}; Ni означает переход к соответствующему I
(например, s3=>i3) в зависимости от того, какое B(P(sb s2, s3) = I) равно
«I»; Ni означает, к какому виду использования надо переходить;
B); Q ^ О; Р2 :13 - В2; I=> V; N2 и т.д.
Если воспользоваться пятым принципом управления
продукциями, то, используя логические функции, можем записать:
352
i3 As3 Av2 A(hj Vh2)=* Wjj
(X{ VX2)AC01 Л(П! Vn2)Ap! => W^
tj A(C! Vc2)Aa! Аф{ vb2)=>Wj;
k{ A(rt Vr2)ACO! => WjJ
c^ A(mj Vm2)Ae2 =* wle
Хранение конкретных продукций в приведенном виде
существенно облегчает процесс ВМА при решении конкретных задач в
диалоговом режиме.
8.4. Представление знаний
и концептуальное моделирование
при автоматизации процесса выбора
моделей в АСП
Даже только общий перечень факторов, включенных в
иерархическую сеть (см. рис. 8.2) и влияющих на процесс ВМА, говорит о
необходимости автоматизации этого процесса. Существенная
мощность множества факторов, их разнообразные категории
(количественные и качественные) и мерность приводят к необходимости
создания требуемой базы знаний и целесообразности
моделирования на концептуальном уровне.
Анализ эволюции автоматизации
производственно-технологических интеллектуальных процессов позволил определить ее
основные этапы — от позадачной реализации отдельных
информационных процессов до комплексной автоматизации взаимосвязанных
производственных процессов. При позадачной реализации
эффективность автоматизации была максимальной, так как
автоматизировали, в первую очередь, хорошо формализуемые
производственные интеллектуальные процессы: сбор и хранение информации,
статистическую и сложную вычислительную обработку.
С увеличением сложности автоматизируемых
производственных задач эффективность автоматизации падала из-за сложности и
разнообразия представлений предметных задач, из-за трудности их
формализации и огромных затрат на их согласованное
взаимодействие в вычислительной среде. Это явилось одной из причин того,
что в развитии систем автоматизации интеллектуального труда, в
том числе проектно-конструкторской деятельности, наметилась
тенденция, связанная со сменой стратегии автоматизации: если в
восьмидесятые годы отмечался подход к комплексной автоматиза-
23 — 3466
353
ции, то в девяностые наметилась тактика постепенных
усовершенствований [96].
К причинам такой тенденции можно отнести то, что создание
автоматизированных комплексов и систем выполняется в
основном на базе их производства. То есть для их жизненного цикла
характерны только две основные фазы — изготовление и
эксплуатация. Переход к промышленному способу производства
автоматизированных систем и комплексов сдерживается следующими
факторами:
• отсутствием такого универсального модельного их
представления (аналогичному языку чертежей и схем у технических
объектов), которое бы позволило выделить в самостоятельную фазу
процесс проектирования автоматизированных систем;
• недостаточностью фундаментальных и прикладных
исследований в области изучения закономерностей интеллектуальной и
познавательной деятельности;
• наличием комплекса проблем, связанных с представлением и
интеграцией знаний и отображением их в вычислительную среду.
Одним из решений этого комплекса проблем, в том числе и
проблемы передачи представлений о задаче от предметного
специалиста к создателям автоматизированных систем, является
методология автоматизации интеллектуального труда (МАИТ),
базирующаяся на семиотическом подходе и его развитии [97].
Семиотический подход обеспечивает переход от естественно-языкового (ЕЯ)
представления предметных знаний к их формально-языковому
(ФЯ) представлению. Идея семиотического подхода заключается в
определенной связности выделенных уровней исследования задач
реального мира: знаковая форма отражает реальный мир через
определенную смысловую конструкцию — концептуальный элемент
(концепт) (рис. 8.5).
Применение семиотического подхода к решению указанной
проблемы позволяет согласовать знаковые формы знаний
различных специалистов на единой смысловой основе (рис. 8.6).
Развитие семиотического подхода осуществлялось в
направлениях учета уровней абстрагирования (т.е. выделения разных
уровней обобщения знаний: конкретный, объектный, абстрактный) и
учета множественности моделей представления
автоматизированной системы в ее жизненном цикле. Поэтому представленная на
его основе методология создает основу автоматизированных систем
и теоретически связывает все этапы их создания в единое целое.
Суть методологии в получении последовательности отображений
предметной задачи в виде формализованных моделей (инфологиче-
354
Концептуальный
уровень
ФизическийХ I \ \ Знаковый
уровень \" х" уровень
ЕЯ-представление
предметной задачи
ФЯ -представление
предметной задачи
Рис. 8.5. Применение семиотического подхода к решению проблемы
автоматизации интеллектуального труда
ской — ИЛМ и датологической — ДЛМ) на основе первоначально
формируемой концептуальной модели.
Схематично методология представлена на рис. 8.7. При этом
соответственно ИЛМ автоматизируемой предметной задачи есть
нечто иное, как модель-конструкция или проект автоматизируемой
процедуры, а ДЛМ есть модель-реализация или технологическая
подготовка реализации этой же процедуры, ориентированная на
конкретные программно-техническую среду и средства.
Построение концептуальной модели предметной задачи позволяет выявить
основу для интерпретации множества данных, используемых при
ее решении, и обеспечивает смысловое единство для всех
формально-языковых представлений этой задачи.
Из такого схематического представления МАИТ видна роль
концептуального моделирования на абстрактном уровне (КМ1) для
эффективной организации вычислительной среды (ДЛМЗ)
автоматизированных систем. Особенность концептуальной модели
абстрактного уровня (КМ1) состоит в том, что в ней следует отразить
семантику интеллектуальных процессов с достаточно общих
позиций, но в то же время она должна охватывать и множество частных
Естестве н но -я зыковое
представление
предметной задачи
Формально-языковое
представление
предметной задачи
Система знаний
предметной задачи
Рис. 8.6. Укрупненное представление методологии автоматизации
интеллектуального труда
23*
355
КМ1 -*-ИЛМ1 —ДЛМ1
/1 I I
ЕЯ <-— KM2 — ИЛМ2 —ДЛМ2
\ i i i
KM3 -^ИЛМЗ -*-ДЛМЗ
Рис. 8.7. Уточненная методология автоматизации интеллектуального труда
(КМ — концептуальная модель; ИЛМ — инфологическая модель;
ДЛМ — датологическая модель);
Уровни абстрагирования: 1 — абстрактный; 2 — объектный; 3 — конкретный
моментов практической производственной деятельности. Для
разрешения этого противоречия необходимо исходить из наиболее
общих законов познания и закономерностей познавательной
деятельности, из анализа философских понятий, связанных с
производственной средой.
К методологическим основаниям концептуального
моделирования или представления знаний в системах автоматизированного
создания АСП следует отнести методологию создания машин и
механизмов [98].
Основные положения методологии создания систем контроля и
управления включают следующие моменты:
• центральным понятием методологии является понятие
«изделие» и понятие «жизненный цикл» изделия, поэтому любая
система и ее составные части должны рассматриваться с позиций их
жизненных циклов: любое изделие в процессе своего развития (от
возникновения идеи до ликвидации) проходит через множество
взаимосвязанных этапов на базе промышленного способа
производства; управление жизненным циклом изделия предполагает
структуризацию управленческих функций и согласованное
управление всеми этапами жизненного цикла;
• реализация жизненного цикла любой АСП определяется
сформированным уровнем потребности общества в ней и наличием
определенных экономических условий;
• если рассматривать производство, обеспечивающее
реализацию жизненного цикла, как многоэтапный процесс
преобразований представлений системы прогнозирования, то все этапы ее
создания в качестве содержательной (концептуальной) основы
включают описание ее функционального назначения или процесса ее
перспективного функционирования. При этом каждый этап
создания АСП (и ее составных частей) инициируется заданием, в
котором зафиксированы: целевые характеристики функционирования
356
систем, особые условия или ограничения на процесс и среду
функционирования, ограничения, связанные с процессом и средой
изготовления, и т.д.;
• качество производства любой АСП определяется качеством и
согласованным взаимодействием проектной, технологической и
производственной сред ее реализации, что требует увязки
жизненных циклов разнородных объектов: системы, среды и ее
компонентов, организационных элементов и др.;
• декомпозиция этапов жизненного цикла АСП на
производственные задачи определяется сформулированной
организационно-функциональной структурой предприятий, реализующих
определенный этап, что связано с необходимостью фиксации
ответственности за результаты принятия решений.
Эти положения задают методологическую основу для
представления баз знаний конструкторов, технологов, программистов, т. е.
экспертов для интеграции этих баз.
Таким образом, главной проблемой автоматизации проект-
но-конструкторской деятельности при создании таких систем, как
интеллектуализированные АСП, является переход от
ЕЯ-представления знаний экспертов, зафиксированных на традиционных
носителях и в человеческой памяти, к ФЯ-представлению тех же
знаний в вычислительной среде.
Как уже отмечалось, используя методологию автоматизации
интеллектуального труда с семиотическим подходом в ее основе,
можно обеспечить синонимичность (адекватность) формируемых
языковых представлений автоматизируемых задач на основе
единого концептуального представления.
Концептуальное моделирование проектных задач позволяет
обеспечить однозначную интерпретацию данных при реализации
этих задач в вычислительной среде.
К теоретическим основам концептуального моделирования
следует отнести:
• особенности представления информации и знаний о
производственно-технологических (интеллектуальных) процессах,
вытекающих из методологии создания АСП (одной из существенных
является необходимость единообразного представления любых
производственно-технологических процессов с любой степенью
детализации);
• анализ философских понятий и категорий;
• теоретические принципы и закон цикличности в области
искусственного интеллекта [99].
357
Концептуальное моделирование в рамках МАИТ
осуществляется на нескольких уровнях абстрагирования:
1) абстрактном, обеспечивающем общее представление системы
знаний (знания о том, как устроена любая система знаний);
2) объектном, обеспечивающем представление специфики
системы знаний предметных задач;
3) конкретном, описывающем множество фактов, событий,
явлений реального мира в процессе решения предметных задач.
Такое расслоение семантического представления предметных
задач по уровням абстрагирования предопределяет возможность
его интеграции на объектном и конкретном уровнях.
При этом под концептуальной моделью любого уровня будем
понимать:
а) множество элементов (понятий или категорий);
б) множество структурных связей на этих уровнях;
в) множество ограничений на связи и элементы.
Исходя из такого определения концептуальной модели, ее
формальное представление на i-м уровне абстрагирования имеет вид
КМ^МьТВД),
где Mi = {my} — множество категорий этого уровня; THi —
множество статических отношений на категориях; Fi — множество
динамических отношений на категориях
THi = (Ti,Hi),
где Ti с М4 х Mi — множество бинарных отношений на Mi;
Hi с Mi х М4 х Mi — множество тернарных (тройственных)
отношений на Mi;
Fi = (Vi,FVi),
где Vj = {vuj — множество ограничений (зависимостей) i-ro уровня
абстрагирования; FVi с Vt x Vi — множество бинарных отношений
HaVj.
В принципе можно ввести отношения и более высокого
порядка (четвертные и т.д.), однако это приведет к механическому
усложнению задачи. Выбранные уровни достаточно полно
иллюстрируют подход к концептуальному моделированию для решения
задачи ВМА.
Существует функциональное или декларативное отношение на
подмножестве множества М4 в виде {ту} -> \&.
358
Исходя из общего формального представления для
концептуальной модели абстрактного уровня, имеем описание (табл. 8.2)
КМ! = (MbTHbFj),
где
Mi = М = {mi} — множество информационных категорий;
Ti = {тьгп,} — бинарные связи информационных категорий;
Hi = {(шьт^т*)} — тернарные связи информационных категорий;
Vi = V = {Vn} — множество классов зависимостей;
FVi = {(vn,vm)} — бинарные связи классов зависимостей;
Vi = {(mj,nij) & (mj,mj)} — отношение между категориями и
ограничениями.
Множество информационных категорий сформировано в
результате исследования особенностей представления информации
и знаний о производственных процессах и включает следующие
элементы-категории: цикл — ть процесс — т2, задача — т3,
компонент — пц, объект — т5, признак — т^, значение — т7.
Концептуальная модель объектного уровня формально может
быть описана (см. табл. 8.2) следующим образом:
KM2 = (M2,TH2,F2),
где
М2 = А = {aim} — множество предметных категорий;
Т2 = {(aik,ajn)} — бинарные связи предметных категорий;
Н2 = {(&щ,&т,&кт)} — тернарные связи предметных категорий;
V2 = W = {wjm} — множество типов зависимостей;
FV2 = {(wni,wnj)} — бинарные связи типов зависимостей;
wu == {(agi,...,ajq) & Qit} — отношение между категориями и
ограничениями, где Qu — условие, определяющее особые связи
структурных и контекстуальных предметных категорий.
И наконец, концептуальная модель конкретного уровня
формально представляется в виде (см. табл. 8.2)
KM3 = (M3,TH3,F3),
где
М3 = В = {bijr} — множество экземпляров предметных категорий;
Тз = {(biks,ajnt)} ~ бинарные связи экземпляров предметных
категорий;
Нз = {(biis,bjnt,bkmp)} — тернарные связи экземпляров предметных
категорий;
V3 = Р = {Pknq} —- множество экземпляров зависимостей;
FV3 = {(PnibPnjs)} ~ бинарные связи экземпляров зависимостей;
359
Pitv — {(bjix,.-»bjq2) & Hitv} — отношение между категориями и
ограничениями;
Hitv — условие, определяющее особые связи экземпляров
структурных и контекстуальных предметных категорий.
Таблица 8.2. Состав концептуальных моделей
Абстрактный уровень
Mi : Информационные
категории (ИК)
Т,:
Упорядочивание
ИК-j
Состав ИК—j
Компоновка ИК — j
Н,:
Контекстуальная
ИК-j
Структурная
ИК-j+l
Монадическая
HK-j+2
Vi : Классы зависимостей
(КЗ)
IFV,:
Упорядочивание
КЗ-j
Состав КЗ—j
Компоновка КЗ — j
Объектный уровень
Предметные категории
(ПК)
Упорядочивание
ПК-п
Состав ПК — п
Компоновка ПК — п
Контекстуальная
ПК-п
Структурная
ПК-п+1
Монадическая
ПК - п+2
Типы зависимостей (ТЗ)
Упорядочивание
ТЗ-п
Состав ТЗ — п
Компоновка ТЗ — п
Конкретный уровень
Экземпляры предметных
категорий (ЭПК)
Упорядочивание
|ЭПК-т
Состав ЭПК —т
Компоновка ЭК — т
Контекстуальная
ЭПК-т
Структурная
ЭПК-т+1
Монадическая
ЭПК - т+2
Экземпляры типов
зависимостей (ЭТЗ)
Упорядочивание
ЭТЗ - m
Состав ЭТЗ — m
Компоновка ЭТЗ — m
Закономерность формирования структур в концептуальных
моделях охватывает формирование бинарных и тернарных связей
между категориями на каждом уровне абстрагирования.
В основе процесса формирования бинарных связей между
категориями на каждом уровне абстрагирования лежит механизм
абстракций. Результатом процесса является фиксация бинарных связей
вида «состав», «упорядочивание», «компоновка» для определенной
пары категорий.
Закономерность формирования бинарных связей раскрывается
через применение абстракций определенного вида на каждом
уровне абстрагирования. На абстрактном и конкретном уровнях
выполняется процедура синтеза на основе абстракций «обобщение» и
«агрегация», на объектном — процедура анализа на основе
абстракций «уточнение» и «декомпозиция» (рис. 8.8).
360
^ Цикл
Агрегация
\
Р Процесс
Обобщение
V
* Задача
Агрегация
Ч
* Компонент -
Обобщение
V
* Объект
Агрегация
Ч
4f Признак
Обобщение
ч
Значение ¦
{Предметный цикл-i}
Декомпозиция
У
{Предметный процесс-j}
Уточнение
У
{Предметная задача-k} ч
Декомпозиция
У
{Предметный компонент-1}
\
Уточнение
У
{Предметный объект-m} ч
Декомпозиция
У
{Предметный признак-п}ч
Уточнение
У
• {Предметное значение-р}
Абстрактный Уточнение
уровень
Объектный уровень
Рис. 8.8. Закономерность
Предметный цикл-i —>{Экземпляр предметного
/ цикла-i} \
Декомпозиция Агрегация
V J
Предметный процесс-j —> {Экземпляр предметного
/ процесса-j) ^
Уточнение Обобщение
V J
, Предметная задача-k —> {Экземпляр предметного
/ объекта -т} Л
Декомпозиция Агрегация
V J
, Предметный компонент-1 -> {Экземпляр предметной х
/ задачи-k} Л
Уточнение Обобщение
V /
• Предметный объект-m —> {Экземпляр предметного ч
/ компонента-lj л
Декомпозиция Агрегация
V /
/ Предметный признак-п —>{Экземпляр предметногоч
/ признака-n} д
Уточнение Обобщение
V /
Предметное значение-р —>{Экземпляр предметного
значения-р}
ч»
v ' ' v
Объектный уровень Уточнение Конкретный уровень
бинарных связей концептуальных структур
В процессе формирования бинарных связей между категориями
на каждом уровне абстрагирования наблюдается повторение
применения абстракций, что является проявлением закона
цикличности. Повторяемость абстракций разбивает множество категорий на
триады. Таким образом, формирование тернарных (тройных)
связей базируется на наличии бинарных связей между категориями
триады. При этом в триаде каждой категории отводится
определенная роль (в соответствии с функциональными уровнями закона
цикличности): контекстуальная, структурная, монадическая. Для
структурных категорий отличительным свойством является их
разнородность, поэтому при синтезе они подлежат агрегации в
контекстуальную категорию, а при анализе они являются результатом
декомпозиции контекстуальной категории. Цикличность
проявляется в том, что контекстуальная категория одной триады может
рассматриваться как монадическая категория вышестоящей триады
(что реализует процедуру формирования сложных понятий через
простые) (рис. 8.9).
Результатом формирования статических отношений является
концептуальная структура, которая отражает «родословную»
признаков объектов реального мира.
Закономерность формирования ограничений на
концептуальные структуры охватывает процесс формирования ограничений на
каждом уровне и взаимосвязь ограничений разных уровней.
Методологическим основанием существования ограничений является
«неполнота» контекстуальных категорий (как «неполнота»
атрибутов) и «неполнота» структурных категорий (как «неполнота области
допустимых значений атрибутов) (рис. 8.10).
К Цикл
I
С Процесс
I
М Задача К Задача
I
С Компонент
I
М Объект К Объект
I
С Признак
I
М Значение К
Рис. 8.9. Закономерность формирования тернарных связей концептуальных
структур абстрактного уровня
362
Неполный =-*¦— Неполный
предметный предметный
цикл цикл
¦ Неполный
предметный
процесс
Неполная =¦- Неполная
предметная предметная
задача задача
¦ Неполный
предметный
компонент
Неполный =-*— Неполный
предметный предметный
объект объект
¦ Неполный
предметный
признак
=-*— Неполное
предметное
значение
Рис. 8.10. Закономерность формирования ограничений на концептуальные
структуры (для объектного уровня)
В силу закона цикличности эти ограничения подчинены
закономерности, т. е. повторяемости на каждом уровне
абстрагирования. На каждом уровне абстрагирования множество категорий
может быть сопоставлено с определенными ограничениями V| = {vaJ
и {my} -» Ул. На множестве Vi может быть задано бинарное
отношение FVi с Vi х Vj.
В основе взаимосвязей концептуальных моделей различных
уровней абстрагирования лежит также механизм абстракций.
Поскольку переход от абстрактного уровня к конкретному основан на
анализе («от абстрактного мышления — к практике»), то для
каждой пары моделей их взаимосвязь определяется абстракцией
«уточнение» (см. рис. 8.8). То есть концептуальная модель абстрактного
уровня уточняется концептуальной моделью объектного уровня, а
концептуальная модель объектного уровня уточняется
концептуальной моделью конкретного уровня. Схематично это можно
представить:
KMi -> KM(i +1) и соответственно,
Mi -> M(i +1) — для элементов моделей,
THj -> TH(i+1) — для статических отношений,
Т* -> T(i + о — для бинарных структур,
Hi -> H(i +1) — для тернарных структур,
Fj -> F(i +1) — для динамических отношений,
363
Vi -> V(i +1) — для зависимостей,
FVj -> FV(i +1) — для бинарных структур зависимостей.
В основе формального представления взаимосвязей моделей
разных уровней абстрагирования лежит аппарат реляционной
алгебры: построение допустимых структур обеспечивается
применением операции естественного соединения к отношениям,
представляющим уточнение элементов и заданной структуры более
высокого уровня абстрагирования.
Пусть отношение GMiM(i + i) описывает переход от Mi к Mi+i,
тогда для перехода
от Mi к М2 имеем правило: mi -> {au},
от М2 к М3 имеем правило: ац -> {Ь^}.
Пусть отношение GTi описывает заданную статическую
структуру, тогда допустимая структура (И-1)-уровня определяется:
G'(Ti+1) = GMi (Mi+1 )ооСТ>ОМ> <МЖ).
Для перехода от Ti к Т2 имеется следующее ограничение:
допустимое представление концептуальной структуры объектного уровня
GT2 получается в результате уточнения представления
абстрактного уровня
GT2 =GM1M2ooGTiooGM1M2,
где GMiM2 — отношение, описывающее уточнение
информационных категорий предметными; GTi — отношение, описывающее
бинарные связи информационных категорий; оо — операция
естественного соединения.
И правила перехода для бинарных структур имеют вид
(mi,mj) -» {(au,ajn)}.
Для перехода от Т2 к Т3 имеем ограничение: допустимое
представление концептуальной структуры конкретного уровня СТз
получается в результате уточнения представления объектного уровня:
G'T3 =GM2M3ooGT2ooGM2M3,
где GM2M3 — отношение, описывающее уточнение предметных
категорий их экземплярами; GT2 — отношение, описывающее
бинарные связи предметных категорий для определенной предметной
задачи.
И правила перехода следующие:
(aji,ajn) -> {(bus^jnt)}.
364
Увязка тернарных структур обусловлена увязкой
соответствующих бинарных структур, и ролевое свойство категории
«наследуется» при уточнении информационных категорий предметными, а
предметных категорий — их экземплярами. Взаимосвязь систем
ограничений осуществляется также на основе механизма абстракций
и формально описывается аналогичными алгебраическими
операциями над отношениями.
Пусть отношение GW(i + d описывает переход V4 -> V(i +1}, тогда
для перехода:
от Vi к V2 имеем: Vi -> {wu},
от V2 к V3 имеем: wu -* {р^}.
Пусть отношение GFVi описывает заданную динамическую
структуру, тогда допустимая структура A+1)-уровня определяется:
G'FV(i+1) = GV, V^ooGFV.-GV, V0+1).
Для перехода от FVi к FV2 имеем: допустимое представление
системы ограничений объектного уровня G'FV2 получается в
результате уточнения системы ограничений абстрактного уровня:
G'FV2 =GV1V2ooGFViooGV1V2,
где GViV2 — отношение, описывающее уточнение классов
зависимостей множеством типов; GFVi — отношение, описывающее
бинарные связи классов зависимостей и соответственно правила
перехода — (Vi,Vj) -> {WucWja}.
Для. каждой зависимости объектного уровня, кроме указания
категорий-аргументов и категорий-функций, следует фиксировать
и степень ее формализации: аналитическая, статистическая,
эмпирическая. По соотношению аналитических, статистических и
эмпирических зависимостей в системе ограничений объектного
уровня можно судить о степени формализации определенной
предметной области.
Для перехода от FV2 к FV3 имеем: допустимое представление
системы ограничений конкретного уровня G'FV3 получается в
результате уточнения представления системы зависимостей
объектного уровня:
G'FV3 =GV2V3ooGFV2ooGV2V3,
где GV2V3 — отношение, описывающее уточнение типов
зависимостей множеством реализаций зависимостей; GFV2 — отношение,
описывающее бинарные связи типов зависимостей и правила
перехода — (WucWjn) -> {(Pikr,Pjnq)}.
365
Методика концептуального моделирования, использующая
вышеперечисленные теоретические положения, позволяет создать
основу реализации процесса выбора методов и алгоритмов
упреждающего контроля в проектируемых АСП. Концептуальное
моделирование предметных задач выполняется после проведения
анализа традиционного процесса решения задач и предполагает
представление результатов анализа в определенном виде. Методика
концептуального моделирования включает в себя следующие
основные этапы для каждой предметной задачи:
• формирование концептуальной модели задачи;
• анализ полученной модели;
• синтез полученной модели с обобщенной концептуальной
моделью.
Формирование концептуальной модели i-й предметной задачи
включает в себя следующие подэтапы:
• формирование концептуальной структуры предметной задачи;
• формирование системы ограничений для задачи;
• формирование концептуальной модели предметной задачи и
дополнительная ее обработка.
Формирование концептуальной структуры предметной задачи,
в свою очередь, включает:
• формирование множества предметных категорий М^;
• формирование множества бинарных связей Т^;
• формирование множества тернарных связей H2i.
При формировании концептуальной структуры выполняется
последовательность шагов, каждый из которых позволяет
осуществить переход от сложных предметных понятий к более простым, т. е.
проанализировать явление или событие, представленное сложным
понятием. Построение концептуальной структуры для каждой из
подзадач процесса проектирования интеллектуализированной
АСП, т. е. создание системы выбора методов и алгоритмов по
каждому из факторов (см. рис. 8.2) на каждом шаге проектирования,
есть описание разных состояний процесса ВМА при последующем
функционировании АСП.
Анализ такого сложного понятия, как процесс
функционирования АСП, позволяет выделить множество ее задач и для уточнения
задачи выделить компоненты, играющие в ней определенную роль:
условие, процесс, цель, средство. Те компоненты, которые
представляют инструментальные средства (программные и
технические), разделяются соответственно на подсистемы с
определенными связями между ними. Для каждой подсистемы фиксируется на-
366
бор признаков, которые отражают функциональные,
информационные, временные, стоимостные и другие характеристики и
используются при решении предметных задач.
Формирование ограничений для предметной задачи включает:
формирование множества зависимостей V2i и формирование
множества бинарных связей между ними FV2i.
Основой для формирования системы ограничений для задачи
является ее декомпозиция, выполненная на этапе анализа
традиционного процесса ее решения. Описание зависимостей (связей)
включает наименование, тип, степень формализации, аргументы,
функцию и т.д.
Объединение результатов этих двух подэтапов позволяет
окончательно сформировать концептуальную модель предметной
задачи: наложить систему ограничений на концептуальную структуру,
классифицировать предметные зависимости по типам, вьщелить
подмножество статистических зависимостей V2ci, расслоить
концептуальную структуру на постоянную и переменную
составляющие соответственно под постоянную и проектную информацию
решаемой задачи.
Анализ получаемой концептуальной модели предполагает
проверку связности концептуальной структуры и системы
зависимостей, отвечающих условиям:
GT2iCGT2,
GFV2i CG'FV2.
Синтез концептуальных моделей (полученной и обобщенной)
предполагает последовательное объединение элементов модели:
м2о=им*
i
i
V2o - UV2i
i
FV* = |jFV2i
i
В заключение следует отметить:
367
• применение методологии автоматизации интеллектуального
труда к задачам проектирования систем прогнозирования
позволяет создавать системы автоматизации проектирования открытого
типа (т.е. всегда можно дополнить программный продукт новыми
файлами и т.п.);
• процесс концептуального моделирования даже для
небольших предметных задач достаточно трудоемок и может быть
автоматизирован на базе самой методологии;
• концептуальное моделирование предметных задач позволяет
намечать области научных исследований по формализации этих
задач.
Вопросы для самопроверки
1. Что из себя представляет процедурная модель прогнозирования?
2. Что входит в описание предметной области задачи выбора моделей и
алгоритмов прогнозирования?
3. Как оценить уровень интеллектуальности информационной системы?
4. Как строятся продукционные модели в АСП?
5. В чем особенности построения интеллектуализированной системы
прогнозирования?
6. Какие стратегии используются при управлении выполнениями продукций?
7. В чем смысл семиотического подхода при осуществлении автоматизации
интеллектуального труда?
8. Каково содержание концептуального моделирования и его роль в
интеллектуализации задач проектирования?
9. Какова закономерность формирования бинарных связей между категориями
на каждом уровне абстрагирования?
10. Какие этапы включает в себя методика концептуального моделирования?
Глава 9
ДИАЛОГОВЫЕ СИСТЕМЫ КАК СРЕДСТВО
ИНТЕЛЛЕКТУАЛИЗАЦИИ ИНФОРМАЦИОННО-
ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСОВ
Диалоговые информационные системы (ДИС) определяют
основные особенности современной индустрии обработки
информации, и применение их в ИнС существенно расширяет круг
решаемых интеллектуальных задач. Они представляют собой сложный
комплекс технических, программных, информационных и
организационных средств, обеспечивающих централизованное
накопление и коллективное использование информации. ДИС организуют
управление и принятие решений на основе новой технологии
обработки информации, принципиально отличающейся от
традиционной и практически исключающей использование обычных
бумажных документов. ДИС существенно повышает качество, полноту и
точность, достоверность и своевременность принимаемых решений.
9.1. Классификация диалоговых систем
С появлением ЭВМ третьего и последующих поколений,
располагающих видеотерминальными устройствами и допускающих
мультипрограммный режим работы, появились принципиальные
возможности включения проблемного пользователя в качестве
активного звена вычислительного процесса. При этом подобное
включение осуществляется в тех звеньях процесса, в которых
возникает необходимость принятия решения о выборе дальнейшего
хода вычислений в так называемой точке ветвления, на основе
анализа некоторой промежуточной информации. Вмешательство
человека на таком этапе информационно-вычислительного
процесса позволяет сократить возможный перебор вариантов вычислений
на основе накопленного пользователем опыта и, более того, внести
в вычислительный процесс элементы, связанные с эвристическими
аспектами задачи, не поддающимися алгоритмизации и решаемы-
24 — 3466 369
ми обычно на основе интуиции, т.е. элементы, связанные с
человеческим интеллектом и не поддающиеся формализации.
Общие тенденции развития автоматизированных
информационных систем (АИС) в направлении интеллектуализации нашли свое
отражение и в диалоговых системах (ДС). Однако АИС
формулировались как пакетные системы, и вначале диалог играл в них
подчиненную роль. Так, в первых диалоговых АИС он использовался
для повышения наглядности, увеличения комфортности интерфейса
АИС с пользователем. В частности, характерным было то, что
механизм информационно-вычислительного процесса в первых
диалоговых АИС не менялся по сравнению с пакетным вариантом, а
видеотерминальная техника использовалась лишь для управления
набором операций системы.
Эволюция диалоговых АИС шла в основном в двух
направлениях: упрощение общения проблемного пользователя с системой и
развитие возможностей работы пользователя с информационными
моделями, заложенными в системе [115].
В соответствии с этим и различаются ДС по следующим
основным признакам:
• концепции реализации диалоговой системы и его
программного обеспечения;
• методы и средства реализации диалоговых процедур;
• структура, форма и типы реализации информационных
моделей диалоговых процедур;
• состав и структура языка общения «человек—ЭВМ», а также
степень приближения языка диалоговых процедур к естественному.
Методы реализации программного обеспечения ДС
заключаются в подходе к использованию средств интерактивного
взаимодействия, обеспечивающих работу с различными предметными
областями. Указанное позволяет производить такую классификацию ДС:
• системы замкнутого типа, обеспечивающие работу с
конкретным классом задач;
• системы генерации прикладных программ и пакетов
прикладных программ;
• системы интеллектуального типа, предназначенные для
использования их в различных предметных областях.
Система замкнутого типа используется в конкретных
предметных областях и поэтому для перехода в другой класс задач
необходимо перепрограммировать программно-языковые диалоговые
процедуры. Такие ДС разрабатывались на начальном этапе
разработок диалоговых процедур и носят название проблемно-ориенти-
370
рованных. Системы замкнутого типа позволяют проводить отладку
программ, написанных на проблемно-ориентированных языках,
обучение (система ПЕДАГОГ), осуществлять операции по
взаимодействию с банком данных (например, ИНЕС-2М). Примерами
таких систем являются:
• инструментальная ДС крупноблочного программирования
для генерации диалоговых маршрутных систем (ДИСУППП);
• система для разработки больших программных комплексов
(СИРИУС);
• метасистема (СТ ЭЛЗ);
• система для автоматизированного изготовления программных
агрегатов из разноязыковых модулей (АПРОП);
• система программирования (ПРИЗ);
• система автоматизированного конструирования (ППП ВИЛЬНЮС);
• система по реализации общей части интегрированной
системы программирования (ИСП);
• инструментальный комплекс генерации
проблемно-ориентированных систем обработки данных (ИК ПОИСК).
При решении задач из специализированных областей
доминирующая роль принадлежит пакетам прикладных программ,
оказывающим действительную помощь пользователю в нахождении за
установленное время необходимого решения при условии
оперирования небольшим числом параметров и используемых методов.
Генерация пакетов прикладных программ, инвариантных
относительно включающих программных комплексов, позволяет
конструктивно реализовать часто используемые компоненты типа
управления данными, организации диалогового обслуживания,
редактирования текстов и т.д. Создание инструментального аппарата
крупноблочного профаммирования, предназначенного для составления
версий проблемно-ориентированных систем из ряда
блоков-компонент, реализуется в диалоговых системах генерации пакетов
прикладных программ.
Диалоговые системы генерации прикладных программ и
пакетов прикладных программ, ориентированные на конкретную
информационную систему, позволяют тем не менее включать
программы различного функционального назначения. Примерами
таких систем служат:
• универсальная система для диалогового формирования,
исполнения, редактирования программ и заданий (DIAFOR);
• ДС подготовки заданий для ЭВМ, предназначенная для
отладки программ в различных операционных системах.
24*
371
Третий тип ДС зачастую называют системами открытого типа.
Такие системы предоставляют пользователю базовые диалоговые
средства для проектирования проблемно-ориентированных ДС. На
базе диалоговых средств таких систем разработчик может в
достаточно короткие сроки спроектировать и отладить
проблемно-ориентированную ДС. Основной принцип конструирования таких
систем заключается в проектировании диалоговых процедур в виде
графа, составления описания вводимых и выводимых на дисплей
сообщений и включения спроектированных таким образом
диалоговых процедур в ДС. Примером такой системы может служить
система проектирования рациональной формы диалогового
взаимодействия и обеспечения коллективного ведения диалогов
различных категорий пользователей с информационными системами,
обеспечивающими оптимальную организацию процесса
выполнения пакетов ППП независимо от их целевого назначения
(ДИСКОП).
Обратимся теперь к формам диалога, реализованным в ДС.
Наиболее распространенными в существующих и разрабатываемых
ДС являются следующие типы диалога:
• простейший диалог вида «выбор меню»;
• ординарный (обыкновенный) диалог;
• диалог на основе директивного языка;
• диалог на основе проблемно-ориентированных языков типа
БЕЙСИК, ФОРТРАН, PL1, ПАСКАЛЬ, DELFY и др.;
• диалог на ограниченном естественном языке.
Простейший диалог вида «выбор меню» представляет
пользователю возможность выбора между рядом предлагаемых системой
вариантов решения задачи, заранее заложенных в систему.
Существуют различные способы ответов пользователя на предложенные
системой варианты действий:
1. Пользователь отвечает ДА/НЕТ, набирает далее номера
пунктов задания или мнемоническое название операций на клавиатуре,
заполняет специально отмеченные позиции информацией или
подгоняет туда курсор, выбирая группу вариантов, предложенных
системой.
2. Пользователь выбирает группу вариантов с установлением
логических отношений между вариантами.
Такая форма диалога применяется в достаточно простых
системах. Преимущество таких систем состоит в том, что они дают
возможность проводить расчеты и исследования проблемным
пользователям, не имеющим глубоких специальных знаний.
372
Ординарный диалог получил наиболее широкое
распространение. Инициатором диалога, в большинстве случаев, является
система, пользователю же предоставляется возможность
приостанавливать и перезапускать систему. Ответами на запросы являются
указания, выраженные в символьно-цифровой форме. Система
общается с пользователем в специально назначенных точках, а число и
регламент ответов пользователя заранее определены. Примером
таких систем является программная система диалогового анализа
экспериментальных данных (ДИАНЭД).
Диалог на основе директивного языка характеризуется тем, что
запросы системы поступают в виде развернутых сообщений и в
виде мнемонических кодов, идентифицирующих совокупность
вероятностных состояний системы. Это могут быть требования на
ввод исходных данных, подключение различных устройств
ввода-вывода, указания на ошибки пользователя и сбои системы.
Пользователь формирует запросы в виде команд-директив,
имеющих определенный синтаксис. Системы такого типа
характеризуются смешанной инициативой. Это значит, что, помимо системы,
пользователь также может быть инициатором диалога. Эта форма
диалога осуществляется в режиме с разделением времени и, в
отличие от первых двух форм, требует специального математического
обеспечения: монитор ввода-вывода и интерпретатор директив
языка запросов пользователя. Монитор обнаруживает запрос,
определяет состояние устройств ввода-вывода, инициирует
интерпретатор расшифровки запросов и выполняет их. Эта форма диалога
является более совершенной и реализована в ряде зарубежных и
отечественных систем. Директивный язык позволяет программировать
процесс решения задачи и многовариантно (гибко) использовать
его в процессе диалога [112].
Примерами системы с директивным входным языком могут
служить:
• системы автоматизации научных исследований СИРИУС и
ПИОНЕР;
• система ИНЕС-2М, предназначенная для обеспечения
доступа к банку данных в диалоговом режиме;
• диалоговая интерпретирующая система автоматизации
моделирования ДИСАМ;
• система DIAFOR.
Система ИНЕС-2М представляет собой совокупность
программных средств и правил работы с информацией. Система
включает средства общения системы с внешней средой, средства хране-
373
ния данных, а также средства управления работой системы и
обработки информации.
Диалог обеспечивает наглядный и быстрый поиск информации
в дереве информации банка данных, для которой предусмотрены, в
частности, процедуры корректировки и уничтожения.
Пользователь общается с системой на директивном диалоговом языке,
включающем конструкции естественного языка. Доступ в системе
ИНЕС к диалоговым средствам осуществляется с помощью
специального языка описания сценария диалога (ЯСД). Диалоговые
средства включают транслятор с ЯСД, управляющую диалоговую
программу, организующую диалог в системе в соответствии со
сценарием, и интерпретатор. Выводимые сообщения на экран
задаются на ЯСД с помощью макетов.
Отметим, что диалоговые средства ИНЕС позволяют
следующее:
• вывод на экран и редактирование макетов экранных
сообщений;
• вывод с экрана макетов в память процедуры обработки
сообщения;
• переход к следующему или другому, выбранному
пользователем, пункту сценария;
• вызов загрузочных модулей.
Диалоговые средства ИНЕС представляют пользователю
универсальные средства в виде набора макрокоманд для
программирования необходимого диалога.
Система ДИСАМ позволяет в диалоговом режиме реализовать
на ЭВМ модели объектов, составленных по модульному принципу,
и относится к системам с директивным языком.
Система программирования и подцержки обслуживающих и
обучающих курсов (СПОК) относится к системам с директивным
входным языком. СПОК представляет собой ДС реального времени
и выполняет функции хранения, накапливания, поддерживания
диалоговых курсов. Авторы диалогового курса производят
методическую проработку содержания курса, разработку сценария и
программы диалога, написание программы на языке описания курсов,
ввод ее в библиотеку и отладку.
Диалог на основе проблемно-ориентированных языков типа
БЕЙСИК, ФОРТРАН, PL1, ПАСКАЛЬ, DELFY с расширенными
возможностями языка путем включения в него подпрограмм
характерен тем, что процесс общения сводится к написанию программ
на этом языке в диалоговом режиме.
К системам такого типа можно отнести следующие:
374
• система ГАММА;
• система ЭВМ ОИЯИ;
• система моделирования клеточных модулей AISSP,
использующая проблемно-ориентированный язык имитации GSSL;
• обучающая система моделирования OPS-3, использующая
входной язык фортраноподобного типа;
• система SIMSON, ориентированная на описание процессов
моделирования;
• система построения, отладки и исследования моделей OPS-4.
Наиболее характерным представителем интерактивных систем
взаимодействия на естественном и ограниченном естественном
языке является диалоговая логико-семиотическая система
моделирования сложных динамических процессов ДИСИМ (внутренний
язык — синтетический язык семантических сетей и язык фреймов)
и несколько проблемно-ориентированных версий ДИСИМ для
моделирования процессов принятия решений, развития структур
сложных систем и оперативного управления дискретными
производственными процессами.
9.2. Языки описания диалоговых систем
Язык общения проблемного пользователя с системой
определяет такие характеристики, как оперативность, активность, мощность
и универсальность диалоговых систем. Входной язык ДС может
быть формализованным и естественным. Существуют ДС с
формализованным языком директивного и алгоритмического типа.
Системы общения на естественном языке различаются по степени
приближения к естественному языку, например, системы с
диалогом на ограниченном естественном языке и естественном языке без
каких-либо ограничений [34].
Диалоговые системы с формализованным входным языком
типа директивного представляют пользователю возможность
ведения диалога в виде набора директив. Введение пользователем
директив осуществляется по требованию системы. Директивы
подразделяются на директивы с позиционным форматом и с
использованием ключевых слов.
Диалоговые системы с директивным входным языком являются
наиболее распространенными.
Укажем следующие наиболее характерные системы такого рода:
• ИНЕС-2М — система доступа к банку данных;
• ДИСАМ — система моделирования;
375
• DIAFOR — система формирования и выполнения программ в
диалоговом режиме;
• ДИСПЛАН — система планирования в диалоговом режиме;
• ДИСПРО — система решения задач дискретной
оптимизации.
К системам с входным алгоритмическим языком можно
отнести ДС взаимодействия проблемного пользователя с системой
управления базами данных (в частности, с СУБД POREL, ASS),
применяемую для технических и коммерческих расчетов.
Пользователь имеет возможность обращаться к библиотеке прикладных
программ и базе данных, используя прикладной дескрипторный
язык, описывающий прикладную задачу.
Находят применение и расширенные версии существующих
алгоритмических языков. Например, язык КОДИАЛ предназначен
для написания диалоговых обучающих и обслуживающих
программ. Для пользователей, не обладающих специальными
познаниями в программировании, создан язык СОАВТОР, являющийся
транскрипцией языка КОДИАЛ в области программирования.
Диалоговая система управления структурами многомодульных
комплексов ДИСУС обладает также входным алгоритмическим
языком. Она предназначена для автоматизированного
планирования вычислительных задач, состоящих из большого числа
автономных модулей, и последующей реализации вычислений по
составленной системной схеме в интерактивном режиме.
Выделение ДС с ограниченным естественным языком связано с
резким возрастанием числа пользователей — непрограммистов. В
таких системах диалоговые процедуры реализуются на языке с
упрощенной грамматикой и ограничены профессиональной
лексикой. В настоящее время разработаны следующие
экспериментальные диалоговые системы такого типа: MARGE, SHRDLU, TORUS,
GUS, SAM, ДИЛОС, ДИСИМ.
Диалоговая информационно-логическая система ДИЛОС
относится к новому классу программных систем, предназначенных для
интеллектуального посредничества между стандартным
программным обеспечением ЭВМ и пользователем при решении
прикладных задач. Система ориентирована на
пользователей-непрограммистов и в основе своей опирается на Ф-язык — специальный
формальный язык. Информация от проблемного пользователя
поступает в виде печатного текста на естественном языке (русском,
английском и др.), который в результате работы лингвистического
процессора переводится на внутренний язык — Ф-язык.
376
Система ДИЛОС реализует следующие функции:
• формирование понятий, словарей, схем вычислений;
• опрос и модификацию модели предметной области;
• запросы по запуску прикладных программ;
• запросы по обращению к стандартным базам данных.
Промышленная ДС осуществляет общение пользователя с
базой данных на ограниченном естественном языке в условиях
жестких временных ограничений. Система рассчитана на объем словаря
до 100 000 лексем.
Диалоговая информационно-справочная система планирования
и управления в транспортных системах ДИСПУТ относится к
системам с входным языком, близким к естественному. ДИСПУТ
позволяет вести поиск информации в вопросно-ответном режиме,
оперативное обновление информации в базе данных системы и
работу системы с моделями задач планирования и управления.
ДИСПУТ представляет также возможность поиска оптимальных
или рациональных решений в процессе планирования и
управления с использованием математических моделей объектов
планирования. Интерактивный режим в системе реализуется по
фиксированному сценарию диалога.
Система РЕТ/Р7000 также относится к диалоговым системам
рассматриваемого типа. В системе автоматизирован процесс
разработки тестов для проверки разрабатываемых программ и
синтаксического анализа введенного текста на ограниченном
входном языке.
Система USL обеспечивает общение пользователя с банком
данных на входном языке, близком к естественному (из некоторого
подмножества предложений немецкого языка). Система USL
включает грамматику подмножества немецкого языка, содержащего
1000 правил, и программы синтаксического анализа (около 100
процедур), осуществляющих перевод входных предложений на
естественном языке, а также текст запросов, написанный на
системном формальном языке.
К этому классу систем относятся также следующие:
• система, основанная на использовании сетей перехода Вудса;
• РЕГЕНД -— реляционный генератор программ и данных;
• ТЬЮЛИПС — обучающая система, использующая в условиях
неопределенности теорию множеств;
• ДИСИОР — система решения многокритериальных задач
ранжирования объектов произвольной природы по степени их
предпочтительности.
377
Сценарий диалога в системе ДИСИОР описывается с
использованием элементов одного из вариантов дескрипторной модели
поведения оператора. Введение диалога осуществляется на
директивном языке.
Создаваемые в настоящее время ДС на ограниченном
естественном языке наиболее перспективны при разработке
методов и средств решения задач обработки неформализованной
информации.
Системы с использованием естественного языка в качестве
входного языка предполагают общение с пользователем на
естественном языке без каких-либо ограничений. Создание таких систем
предполагает наличие универсального лингвистического
процессора с эффективным синтаксическим и семантическим анализатором
и является исключительно сложной задачей. Аналоги таких систем
в настоящее время находятся на начальных стадиях разработки.
9.3. Структура информационных моделей
диалоговых систем
Информационные модели, встречающиеся в ДС принятия
решений, используют различную практику общения проблемного
пользователя с ЭВМ.
Одними из типов систем, которые получили в последнее
время большое распространение, являются такие, в которых
интерактивное взаимодействие происходит на языке модели мира. Для
организации диалога в таких системах информация во вводимых
пользователем фразах должна иметь стандартизованное
представление, согласованное с представлением знаний в модели мира.
Подобная стандартизация происходит на основе спецификацион-
ных списков [35].
Наиболее типичным представителем таких систем является
инструментальная система крупноблочного программирования
ДИСУППП, в которой использован язык спецификаций или язык
перечисления параметров.
Более широкими возможностями обладают системы,
использующие идею дескриптов. Это означает, что в системе
предусмотрены процедуры, связанные с учетом местоположения дескриптора
в фразе. Отметим, что качественный уровень функционирования
этих систем фактически определяется мощностью списка
дескрипторов, имеющихся в распоряжении системы.
378
Более сложны диалоговые системы тезаурусного типа. Наиболее
характерной их чертой является наличие системы отношений
между дескрипторами. Функционирующие в настоящее время системы
допускают между дескрипторами родовидовые отношения.
Например, автоматизированная информационно-поисковая
система научно-технической информации (АСНТИ) относится к
тезаурусным системам, использующим дескрипторный
информационно-поисковый язык. Тем не менее для развитых ДС принятия
решений вышеуказанные системы обладают ограниченными
возможностями.
Более перспективны для развития диалоговых возможностей
человеко-машинного взаимодействия системы, использующие
лингвистические процессоры, реализующие семантический анализ
языка общения.
Отметим также следующее обстоятельство. Известно, что
конечной целью любой ДС является решение тех или иных
прикладных задач. Поэтому любую систему можно представить в виде двух
программных модулей, имеющих языковое и прикладное
назначение. Целью первого из них является перевод языка сообщений
пользователя на язык, доступный второму, и наоборот. Второй же
модуль выполняет те процедуры, которые пользователь указал во
входном сообщении. Наличие двух модулей в структуре ДС
приводит к наличию двух подходов к построению систем интерактивного
взаимодействия:
разработка языкового модуля под определенный прикладной
модуль, решающий ограниченный класс задач;
разработка универсального языкового модуля для широкого
класса прикладных модулей.
При первом подходе естественный язык жестко ограничен
кругом задач, решаемых прикладным модулем. Такой подход
характерен для узко специализированных систем, таких, как диалоговая
вопросно-ответная система для энергетики (ДВОЭ), ДС для
планирования и управления на транспорте (ДИСПУТ). Достоинством
такого подхода является сравнительно несложный анализ языка,
малый объем знаний для этого анализа, несложная семантическая
обработка языковой информации. Недостатком является узкая
специализация языкового модуля систем, исключающая их
использование для каких-либо иных прикладных модулей.
Примером систем, основанных на принципах второго подхода,
является диалоговая информационно-логическая система ДИЛОС
и многоцелевая интеллектуальная вопросно-ответная система
МИВОС. Характерной особенностью системы ДИЛОС является
379
наличие развитого языка семантического представления для
отображения семантики текстов, организации поиска информации,
поведения операций обобщения и классификации данных.
В системе МИВОС создается универсальная метаязыковая
среда — система программирования, содержащая средства
построения, сопровождения и реализации языковых модулей для
произвольных прикладных модулей.
9.4. Функциональная специализация
диалоговых систем
По степени специализации ДС можно разделить на три типа:
информационные, обучающие и системы прикладных проблемных
процедур, или проблемно-ориентированные. Информационные
диалоговые системы обеспечивают доступ к данным различных
информационных систем, а также поиск, хранение, обновление и другие
виды обработки и анализа данных в диалоговом режиме.
Информационные ДС представляют собой совокупность
программно-языковых средств для работы с информацией при общении с внешним
миром, для обработки данных и управления работой системы.
Примерами таких систем являются ИНЕС-2, ДИСАМ, ДИСУС,
ДИЛОС, USL, PET/P7000, ПЕДАГОГ, ГЕОГРАФ.
Информационной системой является АСНТИ по документам ГАФ бывшего
СССР. Система использует информационно-поисковый язык деск-
рипторного типа, а основу математического обеспечения
составляет диалоговый пакет прикладных программ ПЕГАС-Д. Система
АСНТИ организует ретроспективный поиск и корректировку базы
данных. Предполагается применение ДС в подсистеме редакцион-
но-издательских работ для автоматизации подготовки и выпуска
справочников и указателей [111].
Диалоговая многотерминальная система ДИАМС — также
информационная система для создания и ведения баз данных.
Система представляет пользователю язык интерпретирующего типа.
Обучающие системы обеспечивают обучение пользователя
некоторой предметной области, например, языками программирования
или средствами общения с конкретной ДС. Система СПОК
применяется, например, для обучения студентов английскому языку,
языку ФОРТРАН, курсу арифметических и логических основ ЭВМ.
На базе системы СПОК разработан курс изучения
функционирования СУБД ОКА, а также средств манипулирования с базой данных.
380
Система ДИПРОФОР также является системой обучающего
типа и успешно применяется при обучении диалоговому
программированию на языке ФОРТРАН. Система ОСКАР является
обучающей системой открытого типа и позволяет вводить любые
курсы для обучения. В числе зарубежных обучающих систем можно
назвать систему COUREWRITER фирмы IBM, TUTOR фирмы
СДС, PILOT фирмы HEWLET-PACKARD, MATHLAB,
MACSYMA, SKETCHPAD, IAM, REDUCE, КОДИАЛ, ДС
моделирования OPS-3, SIMPLE, с помощью которых можно выполнять
двумерный вывод информации, строить таблицы и графики. В
системах REDUCE и MACSYMA осуществляется семантическое
сопоставление моделей аналитических выражений, посредством
которых генерируются новые правила упрощения выражений.
Проблемно-ориентированными системами называются ДС
замкнутого типа, предназначенные для выполнения определенного
набора функций в соответствии с конкретной областью
приложения — предметной областью. В качестве примеров можно привести
такую систему, как ДС обработки спектров, предназначенную для
обработки данных при проведении физических экспериментов.
Система строится на базе пакетов прикладных программ,
последовательность выполнения которых задает пользователь в режиме
диалога на проблемно-ориентированном языке. Интересна система
МИМ для разработки и исследования сложных имитационных
моделей, написанных на языке высокого уровня ФОРТРАН.
Основной задачей МИМ является управление процессами
моделирования и автоматизацией отладки и выключения новых программ и
модель.
Основным недостатком проблемно-ориентированных систем
является замкнутость их структур.
К прикладным системам относятся системы для решения задач
определенного класса, такие, как:
• ДИСПУТ;
• DIAFOR — многоцелевая система формирования и
выполнения программ в диалоговом режиме;
• ПИОНЕР — ДС интерактивной оптимизации не
релаксационными методами, предназначенная для решения практических
задач и для проверки принципов и форм организации работ в
диалоговом режиме;
• ДИСПЛАН — система планирования и ДИСПРО — система
для решения задач оптимизации, использующие функциональные
возможности системы СПОК;
381
• ДС решения многокритериальных задач линейного
программирования для формирования производственного плана;
• ДИСКАОД и АКАОД — системы автоматизированного
конструирования алгоритмов решения задач;
• ИМПАКС —ДС имитационного моделирования ДИМОД,
используемая для расширенной версии программы имитационного
моделирования;
• AISSP — ДС имитационного моделирования клеточных
моделей.
Рассмотрим теперь формы сценария ДС. Диалоговые системы
делятся по форме сценария диалогового процесса на два типа: системы
с фиксированным сценарием диалога и самообучающиеся системы.
Системы первого типа функционируют на базе сценария
диалогового процесса, заранее определенного и описанного по правилам
внутреннего языка системы. Этот сценарий представляет собой
схему решения задачи и реализуется с помощью метаалгоритма,
программы диалоговых процедур или другого аналогичного
инструмента.
Самообучающиеся системы отличаются от систем первого типа
тем, что на основании заранее разработанной формы диалога
порождаются новые процедуры по типу старых путем генерации уже
существующих процедур с последующим подключением новых
процедур в состав обеспечивающих программ системы и базы знаний.
Системы второго типа применяются шире, хотя системы
первого типа проще при создании, применении и освоении.
Можно рассмотреть уровни интеллектуальности ДС, точнее,
степени «интеллектуальности» ДС, которые делятся на
вопросно-ответные системы, системы принятия решений и системы с
искусственным интеллектом.
Вопросно-ответные системы — это системы с примитивным
«интеллектом», возможности которых заключаются в
«запоминании» вопросов входного языка и умении формировать конкретные
вопросы и отвечать на них. Это вопросно-ответная система для
энергетики ДВОЭ.
Диалоговые системы принятия решений — системы
формирования решений в разнообразных ситуациях, требующих
вмешательства пользователя. В ДС такого типа реализуются функции
поведения высококвалифицированного пользователя-оператора,
управляющего процессом решения задачи в сложных ситуациях, для
того, чтобы облегчить работу менее квалифицированного
пользователя-оператора. Примером таких систем является модель ДС
принятия решения по подбору участников экспедиции (с кооператив-
382
ным взаимодействием), реализованная в Институте кибернетики
РАН и выполненная на базе системы ПРОЛОГ-ЭС.
Диалоговые системы с искусственным интеллектом являются
равноправными партнерами с пользователями, ведущими общение
с ними. Трудности практической реализации таких систем
объясняют тот факт, что в настоящее время аналогии таких систем
начинают только интенсивно разрабатываться.
Классификация диалоговых систем по типу пользователя. Можно
выделить несколько типов пользователей. Собранные при этом
данные обобщены в табл. 9.1, в которой следующим образом
определяют введенные типы пользователей [115]:
1. Параметрические пользователи, взаимодействие которых с
базой данных есть составная часть их работы, выполняемой
повседневно, регламентированной четкими правилами и
соответствующей вполне определенной области деятельности.
2. Аналитики и исследователи, взаимодействие которых с базой
данных также является составной частью их работы, но
потребности которых совершенно непредсказуемы.
3. Случайные пользователи, взаимодействие которых с базой
данных не обусловлено их работой или общественной ролью, но
диалоги их также непредсказуемы, как и у аналитиков или
исследователей.
Кроме того, можно выделить:
1) пользователей, не зависящих от структуры, обычно
характеризующихся отсутствием интереса к структуре хранилища данных
и интересом к определенным значениям данных, а иногда к
отдельным атрибутам элементов метаданных (данных о данных);
2) пользователей, параметрически зависящих от структуры,
характеризующейся ограниченностью доступных им данных
(конечное подмножество банка данных) и числа способов, которыми они
желали бы структурировать или ассоциировать данные;
3) пользователей, зависящих от структуры, которых, в
основном, интересует физическая или логическая структура данных (и
их характеристики и атрибуты) и которых совсем не интересуют
или в малой степени интересуют какие-либо значения данных.
В публикации фирмы ИБМ различают системных
программистов, прикладных программистов и конечных пользователей.
Конечные пользователи — это люди, которые хотят справляться со
своими задачами более эффективно и экономично, используя
машинные средства за диалоговым терминалом. Неспециалисты,
работающие с ДС, названы наивными пользователями.
383
Таблица 9.1
Источник
классификации
Код и Дейт
Альтулери
Плагман
ИБМ
ПАЛМ
Долоттаи
др.
Мартин
Типы пользователей
Случайный
пользователь
Пользователь,
не зависящий
от структуры
«-
<-
Случайный
пользователь
Необучаемый
пользователь
Непрограммист
Параметрический
пользователь
Пользователь,
параметрически
зависящий от
структуры
Конечный
потребитель
Наивный
пользователь
Конечный
пользователь
Аналитики и
исследователи
<-
->
>
Прикладные
программисты
Пользователь,
зависящий от
структуры
Прикладной
программист
(Прямой конечный
пользователь)
тель-профессионал
Обученный
пользователь
Системные
программисты
->
Системный
программист
Пользователь,
обслуживающий
систему 1
* |
Программист
->
Примечание. Сплошная стрелка — указание диапазона; штриховая — неопределенный
диапазон.
При этом указаны три (нечетко разделенные) группы
пользователей. Конечные пользователи — это люди, получающие
информацию от ДС как прямые конечные пользователи, непосредственно
пользующиеся терминалами, как промежуточные конечные
пользователи, имеющие контакт с системой через посредников, и как
косвенные конечные пользователи, которые имеют дело с
информацией от ДС, но не имеют никаких связей с самой системой.
Первый тип конечных пользователей — прямые конечные
пользователи — перекрывается со следующими двумя типами
пользователей: промежуточный пользователь, отвечающий за интерпретацию
потребностей конечного пользователя адекватными процедурами
обслуживания по обработке данных, и пользователь-системщик,
исполняющий обязанности системного программиста.
Различаются обученные и необученные пользователи,
программисты и непрограммисты, профессионалы и непрофессионалы.
384
Пользователем-профессионалом называется тот, кто большую
часть дня проводит за терминалом.
Все эти типы пользователей по большей части
классифицируются по их возможностям работы с системой и по частоте и
продолжительности ее использования.
Иногда различают пользователей в зависимости от
применяемого ими программного обеспечения. Но этот подход, вместо того
чтобы приспосабливать систему к пользователю, ведет к описанию
пользователя посредством существующих системных средств.
Существует подход, ориентированный на цели пользователя, где
«тип пользователя» рассматривается как набор информационных
потребителей, а не как группа людей. Пользователи определяются
своими запросами к машине. При таком рассмотрении отдельный
пользователь может принадлежать к разным типам пользователей.
Эти два типа классификации пользователей: либо по
поведению в работе с ЭВМ, либо по запросам — не вполне подходят для
наивного пользователя, его следует рассматривать только как
неспециалиста по диалогу. Но нужно учесть, что ему свойственны
различные потребности, возможности и характеристики.
Эмпирические тесты показывают, что различие индивидуальных качеств
перекрывает черты «типичного пользователя».
Вместе с тем, существует мнение, что точное определение
типов само по себе мало помогает исследованию пользователей.
Гораздо важнее узнать что-либо об индивидуальных характеристиках
пользователей, их предпочтениях и потребностях.
Выделим три компонента, описывающих элементы диалога на
уровне базовой структуры. Это инициатор и тип инициирования,
возможности выбора и однозначность спецификации задачи.
Их комбинирование приводит к абстрактным типам
человеко-машинного взаимодействия, характеристики которых отражены
в табл. 9.2.
В частности, простой запрос (тип диалога 1) является сокращенным
вариантом для выражения: простой вопрос системе с заранее заданной
интерпретацией входного сообщения. У пользователя нет выбора,
функция предписана системой, пользователь может только ввести объекты,
которые будут интерпретироваться определенным образом. В литературе
этот тип диалога упоминается в связи со сбором данных.
В случае предложения для выбора (тип диалога 3) пользователь
выбирает из набора альтернативных задач, предложенных
системой. Задачи определены заранее, система может ограничить
возможности выбора для пользователя, предлагая только часть
функций, возможных в текущем состоянии диалога. Предложение авто-
25 — 3466
385
магически гарантирует однозначное истолкование входного
сообщения. В литературе можно встретить два варианта этого типа
диалога: меню и вопросы, требующие ответа да/нет.
В случае запроса с указанием синтаксиса ответа (тип диалога
9) — это запрос системы, на который пользователь должен
реагировать синтаксически ограниченным входным сообщением.
Пользователь должен выбрать одну из функций, которые он может выразить
в этом синтаксисе, поэтому его возможности выбора ограничены и
входное сообщение автоматически оказывается однозначным.
Таблица 9.2
Инициатор и тип
инициирования
1. Инициировано
системой/ предложение
2. То же
3. »
4. »
5. »
6. »
7. Инициировано
системой /запрос
8. То же
9. »
10. »
11. »
12. *
13. Инициировано
пользователем
14. То же
15. »
16. »
17. »
18. »
Возможности выбора
Фиксированы
Тоже
Ограничены
Тоже
Не ограничены
Тоже
Фиксированы
Тоже
Ограничены
Тоже
Не ограничены
Тоже
Фиксированы
Тоже
Ограничены
Тоже
Не ограничены
Тоже
Однозначность
формулировки задачи
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Автоматически
Возможна, но не
автоматически
Название типа диалога
Простой запрос
* 1
Предложение для
выбора
* |
* 1
* 1
* 1
* 1
Запрос с
синтаксисом для ответа
* 1
* 1
Запрос для
свободного ответа
* 1
¦ 1
* 1
* 1
Команды 1
Фраза на
квазиестественном языке 1
Примечание. Звездочкой помечены сочетания с противоречивыми значениями
компонентов; эти типы диалога невозможны.
386
В случае запроса свободного ответа (тип диалога 12) система
требует от пользователя фразу, относящуюся к некоторому
специальному вопросу. Пользователь может произвольно выбирать ответ
на квазиестественном языке. Таким образом, ему представлен
неограниченный выбор среди всех функций, доступных в текущем
состоянии диалога, однако он должен быть готов к тому, что
компьютер не поймет задачу с первого раза (или вообще). В литературе
этот тип диалога упоминается в связи с типом диалога 18. Они
различаются лишь первыми компонентами (инициатором).
В случае команды (тип диалога 17) она включает все структуры
шагов диалога, в которых пользователь специфицирует свои задачи
и объекты в соответствии с предписанным синтаксисом, позволяя
системе прямо преобразовывать входное сообщение в
последовательность работ. Пользователю предоставляется свободный выбор
его действий. В литературе этот тип диалога называется командой,
инструкцией или мнемонической командой.
В случае фразы на квазиестественном языке (тип диалога 18)
этот тип диалога налагает наименьшее ограничение на
пользователя. Ему предоставляется возможность свободно выбирать задачу,
т.е. он обладает неограниченными возможностями выбора,
используя знакомый язык; он только должен быть готов к тому, что ЭВМ
не распознает его задачу с первого раза (или вообще). Этот тип
диалога называется «квазиестественным языком», чтобы
подчеркнуть, что рассматриваются только те свойства естественного языка,
которые реализованы в системе. Однако это ограничение менее
затруднительно, чем ограничения в других типах диалога, так как
диалог с системой базы данных всегда относится к очень
ограниченной предметной области.
Вопросы для самопроверки
1. Что такое диалоговая система (ДС) в информационно-вычислительных
комплексах?
2. Какие существуют классификации ДС?
3. Какова эволюция ДС?
4. Каковы языки описания в ДС?
5. Какие формы диалога реализуются в ДС?
6. Какова функциональная специализация ЭС?
25*
Глава 10
СОДЕРЖАНИЕ ДИАЛОГОВЫХ ПРОЦЕДУР
Современный этап развития системы контроля и управления
характерен насыщенностью среды функциональными и
аппаратурными средствами, обеспечивающими диалог человека с ЭВМ.
Однако просто обеспечивать человеко-машинное взаимодействие в
вычислительной среде сегодня уже недостаточно. Необходимо
найти методы и средства, оптимизирующие диалог «человек — ЭВМ»,
управление на уровне простых и эффективных в реализации
диалоговых процедур «человек —- ЭВМ».
Трудность решения указанной проблемы усугубляется тем, что
между пользователем-специалистом в той или иной предметной
области и вычислительной системой возникает языковой и
информационный барьеры. В основном это обусловлено формулировкой
запросов пользователя на языке предметной области, а не на языке
системы. При этом должно обеспечиваться оперативное
проведение диалога «пользователь — ЭВМ», адекватного
информационно-вычислительному процессу в базе данных системы, а также
оптимальное использование вычислительных ресурсов [102—105].
10.1. Графовая модель диалоговых процедур
Заметим, что на первых этапах развития вычислительной среды
в системах управления включение пользователя в
информационно-вычислительный процесс имело место только в рутинных
фрагментах обработки информации.
Это было связано с тем, что системы обработки информации
создавались гораздо раньше, чем проектировался диалоговый
режим. Поэтому структура диалога была весьма примитивной и
использовалась зачастую лишь для увеличения комфортности
интерфейса систем обработки с пользователем. В последующем
происходило наращивание диалоговых возможностей, однако в
подавляющем числе случаев интеллектуальные возможности пользователя
при принятии решений, тем более их аргументации^ограничива-
388
лись из-за несовершенства диалоговых процедур
«человек — ЭВМ».
Между тем информационно-вычислительные возможности
современных ЭВМ направлены на реализацию
информационно-логических процедур и вычислительных процедур, а также
непроцедурных алгоритмов обработки информации.
Указанное создает предпосылки для использования
специализированных модельных и языковых средств, значительно
снижающих порог требований к пользователям, взаимодействующим с
вычислительной средой систем контроля и управления.
Решение проблемы предполагается осуществлять на двух
уровнях: теоретическом и предметном (инженером) [ПО].
На первом этапе реализуется следующая последовательность
итераций по решению теоретических проблем:
• определение требований к моделям человеко-машинного
взаимодействия, информационному, языковому и программному
обеспечению;
• разработка информационной модели диалога и графовой
модели диалоговых процедур «человек — ЭВМ» (ГДП);
• разработка языка, грамматики, синтаксиса и семантики
описания ГДП;
• разработка алгоритмов автоматизированного синтаксического
и семантического анализа языка описания диалоговых процедур
(ЯОДП).
На предметном уровне выполняется следующая
последовательность шагов:
• разработка технологии реализации диалоговых процедур,
ориентированных на вычислительную среду;
• разработка технологии реализации программной системы
контроля и управления, функционирующей в диалоговом режиме;
• разработка библиотеки методов, средств и алгоритмов
реализации диалоговых процедур в вычислительной среде систем
контроля и управления.
Основой для решения проблемы диалогового взаимодействия
служит такая модель описания механизма человеко-машинного
общения, которая адекватна логике поведения пользователя в
предметной области, и используют ГДП для построения ЯОДП,
осуществляющего ввод и обработку модели в ЭВМ.
В работах разработаны основы такого подхода, рассмотрен ряд
направлений его развития. Прежде чем изложить его основное
содержание, приведем несколько понятий.
389
Шагом диалога назовем законченную процедуру
интерактивного человеко-машинного взаимодействия, а структурой
диалога—полную схему всех связей, заданную на счетном множестве
шагов диалога.
Сценарий диалога — законченная последовательность шагов
диалога, заданная на конечном множестве шагов диалога в
какой-либо предметной области. Конечное множество шагов диалога
порождает конечное множество сценариев человеко-машинного
взаимодействия.
Цепочкой диалога назовем множество директив, команд,
сообщений и т.п., которыми обмениваются пользователь и ЭВМ в
процессе интерактивного взаимодействия.
Перейдем к описанию вербальной модели диалоговых процедур
человеко-машинного взаимодействия. Исходным в модели
является фазовое пространство X, состоящее из счетного множества
шагов диалога.
Процесс взаимодействия графа диалоговых процедур (ГДП)
G(X,F) имеет в составе X элементы Xin, соответствующие
инициализации диалога, и элементы Хоит, соответствующие окончанию
человеко-машинного взаимодействия. Сам по себе графовый
формализм, применяемый для описания диалога, не самоцель,
поскольку такой аппарат применялся и ранее. Особенностью
излагаемого подхода является то, что на множестве ГДП вводится ряд
макроопераций, описываемых структурами универсальных алгебр в
рамках дискретной математики, что позволяет структуру и
сценарий диалога рассматривать в единой взаимосвязи. Выше уже
подчеркивалось, что простейший диалог, как правило, играет
подчиненную роль, и поэтому для его описания достаточно какой-либо
конкретной графовой структуры. Сценарий такого диалога
реализуется в жестких рамках этой структуры и описывается несложным
древовидным графом. Такой диалог соответствует директивному
типу, а его сценарий, в большинстве случаев, типа «меню». Однако
такой диалог не удовлетворяет потребностям широкой группы
пользователей. В связи с этим необходимо иметь аппарат гибкой
модификации структуры диалога, подбора сценариев для всего
множества пользователей.
Это приводит к такой схеме проектирования диалога, когда
различная ориентация пользователей в предметной области,
выраженная в виде соответствующей структуры интерактивного
взаимодействия, сама порождает нужный механизм человеко-машинного
взаимодействия. Тогда проектирование диалога сводится к
разработке соответствующего алгоритма ее композиции из так называе-
390
мых базовых или простейших диалоговых процедур. В конечном
итоге, диалоговый режим человеко-машинного взаимодействия
становится гибким, что практически решает проблему
сбалансированности потребностей пользователей с возможностями
информационно-вычислительных процессов системы. Часто из-за
неразрешимости этих проблем пользователям приходится изучать тома
рабочих проектов, обращаться к администраторам БД или сильно
ограничивать набор.
На практике возможны случаи, когда диалог связан с такой
информационной задачей, решение которой не поддается полностью
алгоритмизации. Тогда в процесс построения структуры диалога, в
стратегию перемещения от одного шага диалога к другому вносятся
элементы неопределенности, связанные с эвристикой
пользователя. В этом случае правомерна модель вероятностного диалога, в
которой переход от одного шага к другому задается некоторой
случайной функцией. Большое практическое значение имеет также
нечеткая модель диалога, в которой весомость перехода от одного
шага диалога к другому суть лингвистическая вероятность.
Соответствующие множества ГДП образуют полугруппы, а их
факторизация по конгруэнции устанавливает связь между динамической
(детерминированной) моделью диалога и ее вероятностной и
нечеткой модификациями. Очень интересна стохастическая модель
диалога, в которой информационно-вычислительный процесс
соответствует сетевому ГДП, что позволяет решить следующие две
задачи. Первая — это «уложить» интерактивное взаимодействие в
заданное число шагов диалога, а вторая — реализовать диалог в
заданное время, при этом расход вычислительных ресурсов среды
будет минимальным, а доход пользователя от реализации заданной
последовательности шагов диалога — максимальным.
10.2. Определение графа диалоговых
процедур
Пусть задана интерактивная человеко-машинная система
контроля и управления М. Совокупность всех актов интерактивного
взаимодействия «человек—ЭВМ» в системе М характеризуется
счетным множеством X = {хь Х2, ..., хп}. Выделим в X» конечное
множество X = {хь х2, ..., хп}, состоящее из следующих подмножеств
X = Хш
391
где Xq — элементы, соответствующие ХшсХ-стадии
инициализации интерактивного взаимодействия; Xmt с X —
информационно-вычислительному процессу в ходе человеко-машинного
общения; Xout с X — стадии окончания взаимодействия; Xtcr cz X —
терминальным элементам [112].
Определение 10.1. ГДП G(X,F) задается отображением F: Х-»Х
и 0, где Xj е {F(Xi)}, если существует шаг диалога, задаваемый
траекторией Xi -> Xj.
Заметим, что пустое множество участвует как образ
терминальных элементов Xter с X ГДП G(X,F)
информационно-вычислительных и логических процедур, с которыми необходимо работать,
пренебрегая аспектом локальности обмена информацией пользователя
с системой, выражающей интересы широкого круга пользователей,
а также преодолевая принципиальные трудности при работе с
информацией в режиме реального времени. В таком случае
правомерна проблема соотношения между схемой и подсхемой БД, что
соответствует вложению структуры диалога пользователя в структуру
информационно-вычислительных возможностей системы.
Алгебраический эквивалент этой проблемы — построение морфизма
соответствующих категорий.
Проблема гибкости диалоговых процедур человеко-машинного
взаимодействия может быть сведена к проблеме обеспечения
гибкости интерфейса между пользователем любого уровня и
системой контроля и управления. Оптимальная последовательность
кадров сценария пользователя может быть выражена в
топологических терминах. Именно ГДП, реализующий поведение
пользователя в предметной области, и ГДП, отображающий характер
информационно-вычислительных процессов, связаны между собой
топологической операцией замыкания траекторий. Это позволяет
решать на качественном уровне проблему соответствия мощности
информационно-вычислительных процессов, БД и разрешимости
задач пользователей, работающих в разных предметных областях.
Один из ключевых вопросов организации человеко-машинного
взаимодействия — это построение сложных сценариев общения
«человек — ЭВМ». На структурном уровне можно построить
простейшие ГДП, из которых в дальнейшем можно компоновать сколь
угодно сложные структуры диалога. Множество ГДП с
фиксированным числом шагов диалога является полугруппой (с единицей),
роль которой выполняет так называемый пустой ГДП.
Директивный диалог, задаваемый древовидным ГДП, образует подполугруп-
392
пу в полугруппе всех ГДП. Отметим, что особенно ценным в
излагаемом подходе является то, что можно применить все множество
теоретико-множественных, алгебраических, логических,
семантических и прочих операций на множестве ГДП, получить те или
иные структуры, алгоритмы как декомпозиции, так и композиции
произвольных структур, а потом производить их анализ на
соответствие информационно-вычислительным, семантическим,
логическим и прочим процессам в вычислительной среде.
Можно решить проблему инвариантности ГДП, следовательно,
сценария интерактивного взаимодействия относительно
преобразований ГДП, приводящих к перенумерации шагов диалога. Введя
метрику «близости» двух различных ГДП, можно ее сделать биин-
вариантной относительно действия справа и слева группы Sn(X),
переставляющей шаги диалога. Такая метрика позволит вводить
топологию на всем множестве ГДП, так называемую топологию
«соседства».
Представляют практический интерес операции над ГДП с
различными множествами шагов диалога {xi}j, i = l,n; j = l,m.
Операции подобного типа названы операциями свертки суперпозиции и
связки, имеют прямые аналогии в реляционных БД в виде
операций соединения отношений, проекции на множество общих
атрибутов, сужения, композиции и т.п. В каждом отдельном случае
удается найти эквивалентные простейшие компоненты (базовые
информационно-вычислительные процедуры), которые указывают на
перспективные связи между алгеброй множества ГДП и
информационной алгеброй реляционного типа. Так как такой тип
отношений может быть распространен на базы знаний, в которых строятся
системы отношений предикатов, то возможно обобщение
вышеуказанных операций над ГДП, что будет способствовать развитию
теории решающих предикатов (вопросы на ответы в условиях
нехватки данных).
Мощность ГДП G задается мощностью множества |х|. ГДП
G(X, F) можно также задавать бинарным отношением на
X: Xj ~ х, о х, = F(Xi) или же подмножеством прямого
произведения X х X. В ряде случаев ГДП G(X, F) удобно характеризовать
матрицей инцидентности AG = {а^},1 < i, j < n, где
? fl.XjGF^),
*ij [O^-eF^).
393
Класс ГДП с фиксированным X обозначим через Ф(Х). Будем
различать два вида пустых ГДП: I, если X = 0 и F(x) = 0, и I, если
Х*0, aF(x) = 0.
Поскольку граф диалоговых процедур представляет собой
множество шагов диалога, то к нему могут быть применены все
операции над множествами и даны соответствующие определения,
которые в рамках диалоговых процедур приобретают свой
оригинальный смысл [103—105].
Определение 10.2. ГДП Gn(X,F) назовем n-полным, если |х|= п
и в нем реализованы все возможные интерактивные связи между
элементами множества X.
Заметим, что n-полный ГДП задается на всем множестве ХхХ.
Определение 10.3. ГДП A(X,F), где {(х, х)/хбХ} с X х X, назовем
диагональным.
Определение 10.4. ГДП L назовем универсальным, если все акты
интерактивного взаимодействия, реализуемые для данной
предметной области, содержатся в L.
Определение 10.5. Глубиной d(x) произвольного элемента хеХ
ГДП G(X,F) назовем минимальную длину траектории,
проведенной из какого-либо входного элемента Xo € XiN в х.
Определение 10.6. ГДП G назовем транзитивным замыканием
ГДП G, если имеет место соотношение
А d(G)
6=0°П-
n=l
Здесь d(G) — глубина ГДП G и d(G) =maxd(x Д
Xj€X
Определение 10.7. Носителем ГДП G(X,F) назовем следующее
подмножество:
sup<;(X) = {xGX/ F(x) * vF'l(x) = 0}.
Определение 10.8. ГДП G(X, F) и G'(X', P) считаются
эквивалентными, если
G~G'osupG(X^ = X;F/X = F'/X.
Определение 10.9. Морфизмом двух ГДП G(X, F) и G'(X', P)
является однозначное отображение <р: Х->Х', такое, что диаграмма
приведенная на рис. 10.1, коммутативна.
394
Для двух ГДП G(X, F) и H(Y, F) имеем еле- F
дующие соотношения [109]: i ** 1
1. GuH задается подмножеством GwHyc т I
с (XuY) х (XuY); х ~х'
2. GnH задается подмножеством GxoHyc рис 101 0бьяс
с (XnY) х (XnY); нение морфизма
3. GxH задается подмножеством Gx x Ну с ^у* ГДП
c(XxY)x(XxY).
Операции суммы + и композиции ® ГДП можно выразюъ через
операции и и х, используя в качестве операндов ГДП специального
вида. В частности, сумма G + Н ГДП G€0(X) и НеФОО задается
соотношением G + Н = (G x A(Y)) u (А(Х) х Н).
Введем в рассмотрение n-полные ГДП П(Х) и П(У), заданные
на множествах ХхХ и YxY. Тогда операция композиции ГДП
ОеФ(Х) и НеФ(Х) задается формулой G® Н = (Gxn(Y))u
и (П(Х) х Н).
Зафиксируем в множестве вершин X ГДП G и Y ГДП Н
подмножества Х'с X и Y'c Y. Введем ГДП П(Х, X'), заданный
подмножеством ХхХ'сХхХ, и n(Y,Y'), заданный подмножеством
YxY'cYxY. Тогда для операции объединяющего и
пересекающего типа имеет место следующая интерпретация:
GoH = (Gxn(Y,Y'))U(n(X,X')xH),
GoH = (Gxn(Y,Y'))U(n(X,X')xH).
Операцию суперпозиции определим следующим образом.
Введем ГДП П(Х,{х}), заданный подмножеством {Хх{х}}СХхХ.
Пусть GeO(X) и НеФ(У) и элементами Х€Х индексировано
представление ГДП Н в виде объединения ГДП Нх е O(Y), Н= (JHX с
хех
тем же множеством вершин Y. Тогда ГДП Z = G * НбФ(Х х Y),
имеющий вид Z = (J(G П П(Х,{х} х Нх)), будет являться суперпози-
хЕХ
цией ГДП G и Н. Дадим критерий разложимости ГДП Z € Ф(Х х Y)
в суперпозицию ГДП GeO(X) и НеФОО. Для элемента (х,х')еХ х X
введем ГДП |i(X,X')(z)^(Y), задаваемый подмножеством {(у^Е
GYxYK^^x^y^GZ^y}.
395
Предложение 1. ГДП ZeO(X x Y) представляется в виде
суперпозиции некоторых ГДП G и Н тогда и только тогда, когда не
зависит от х.
В случае разложимости ГДП Z = G*H в суперпозицию ГДП G и
Н, элементы G и Н по Z определяются однозначно. В числе
свойств операций u, n, x над ГДП необходимо отметить
дистрибутивность операции х относительно и и п. Следует также отметить
свойство ассоциативности операции х, непосредственно
вытекающее из ее определения. Таким образом, множество ГДП с
операциями и, п, х образует ассоциативный, коммутативный кольцоид.
Дадим также критерий разложимости ГДП ZeO(X x Y) в
прямое произведение ГДП G€<I>(X) и НеФ(У). Для этого введем
операцию проекции ГДП. Определим nx(Z) как ГДП, задаваемый
подмножеством {(х,х')бХ х X | (y,y')eY x Y, (х, у, х', y')eZxxv}.
Предложение 2 Для произвольного ГДП ZeO(XxY) всегда
имеем |Z| < |rcx(Z)||rcy(Z)|, причем равенство имеет место только в том
случае, когда Z представляется в виде прямого произведения ГДП
GeO(X) и НеФ(У). В последнем случае G и Н определяются по Z
однозначно, а именно G = nrfZ) и Н = щ(Т).
Указанный критерий позволяет построить алгоритм разложения
ГДП в прямое произведение, основанный только на оценке
мощности ГДП, и не требует сравнения подматриц матрицы ГДП.
Следствие 7. Если |z| — простое число, то ГДП Z неразложим
по операции прямого произведения (неприводим).
Заметим, что класс ГДП G(X, F) имеет структуру полугруппы.
Здесь полезно вернуться к способу задания ГДП посредством
отображений. Для элементов {G,H}eO(X), G(X, F), H(X, *F)
определим G,H=K(X, F, *F). Полугруппа Ф(Х) имеет единицу А(Х) и не
является инверсной. В множестве Ф(Х) всех ГДП полезно
выделить подмножество, состоящее из ГДП, изображающимся
древовидными графами Г(Х). Такие ГДП представляют собой диалог с
жесткой структурой — директивный диалог.
Для Ge(X) построим ГДП 1(G), граф которого получается из
графа ГДП G путем обращения ребер. Легко проверить, что 1(G) не
является инверсным по отношению к G в полугруппе Ф(Х), однако
1(G) ёГ(Х). ГДП 1(G) задается однозначным отображением
множества X.
Предложение 3. Соответствие I : G-»I(G) является
антиизоморфизмом полугрупп Г(Х) и Ф(Х) преобразований множества X.
396
Используя теорему Досса о регулярности полугруппы Ф(Х),
получим следующее следствие.
Следствие 2. Полугруппа Г(Х) ГДП, представляющих
директивные диалоги, регулярна.
Ниже дано достаточное условие регулярности ГДП [112].
Теорема 1. Пусть ГДП G(X,F) удовлетворяет условию: для
любого элемента хеХ в множестве прообразов {F(x)}",
упорядоченных по включению их образов относительно отображения F,
существует минимальный элемент, т.е. существует такой у(х) = F_1(x),
что для любого y'GF-1(x) имеет место соотношение F(y')=>F(y).
Тогда элемент G регулярен в полугруппе Ф(Х).
Существуют ГДП с более сложной, чем древовидная,
структурой, которые являются регулярными в полугруппе Ф(Х).
Назовем ГДП гибким первой степени, если в G(X,F)
отображение F удовлетворяет условию: для любой пары элементов {х,х'}€Х
множества F(x), F(x') либо совпадают, либо не пересекаются.
Очевидно, что подобные ГДП удовлетворяют условию теоремы 1.
Как было отмечено выше, полезно иметь набор базовых ГДП,
произведение которых представляет ГДП достаточно общего вида.
Ниже это в качестве примера проделано для директивных ГДП.
Введем в рассмотрение следующие директивные ГДП.
Допустим для определенности, что элементы X пронумерованы X = {хь
Х2, ..., хп}. Обозначим через Ту ГДП, заданный перестановкой
вершин Xi и Xj. Обозначим также через Р^ ГДП, заданный
отображениями F(Xi) = {xi, ..., Xi+k_i}, F(xi+S) = 0 для i < s < k—1 и F(Xj) = Xj для
je{i, ..., i+k— 1}. Обозначим также через Pi ГДП, заданный
отображением F(Xj) = Xj для 1 < j < i и F(Xs) = 0 для S > 1.
Теорема 2. Произвольный ГДП GeT(X) представляется в виде
Гг—Т Т Р1 Pki+1 pk,+...+ks_l+lpk1+k2+...+kgT T
^- 1«1р1 • ~1asps*k1*k1 'rks V 4*1 "'Ча-
Здесь набор чисел Кь Кг, ..., К* по разлагаемому ГДП G
определен однозначно. Заметим, что для директивного ГДП базовые
ГДП вида Р,[, Р1, фигурирующие в приведенном разложении,
коммутируют между собой.
Аналогичное утверждение справедливо для гибких ГДП первой
степени, если в качестве базовых ГДП взять ГДП вида VrktsSl,
заданные отображениями F(xj) = {Xg, Хе+Ь ..., xt) для K^j<S, F(x,) = x,
для jg{Kb Ki+1, ..., Si}u{ei, si+1, ..., tj, F(Xj) = 0 для всех
остальных j. Соответствующая теорема более сложна, так как фигурирую-
397
щие в разложении гибкого ГДП первой степени базовые ГДП не
коммутируют между собой.
Анализ составляющих ГДП, в особенности переходов между
фрагментами ГДП, приводит к следующей структуре, которую в
дальнейшем будем называть нечетким ГДП. Нечеткий ГДП G(X)
представляется взвешенным графом, где в матрице А = {ай} ГДП G
число 2у — суть вес, приписанный ребру, соединяющему х4 с Xj.
Условимся также считать, что в случае нулевого веса а^ вершины х* и
Xj не соединены ребром. Введем следующее ограничение на
матрицу А, потребуем, чтобы ^ай <1, V{i,j} = l,n. To есть суммарный
j
вес ребер, выходящих из фиксированной вершины, не должен
превосходить единицы.
На множестве расплывчатых G(X) введем операцию
умножения, соответствующую обычному умножению матриц ГДП.
Теорема 3. Множество расплывчатых ГДП {G(X)} является
полугруппой с единицей относительно операции умножения.
В полугруппе расплывчатых ГДП {G(X)} можно выделить
следующие подполугруппы:
1. {G(X)}*, состоящую из таких ГДП G, матрицы которых
удовлетворяют условию ^ау = ^ау©, V(i,i, j)e = "Пп.
j j
2. {G(X)}1, состоящую из таких ГДП G, матрицы которых
удовлетворяют условию ^а^ = 1, V{i, j} = 1,п. Для ГДП G G {G(X)}* обо-
j
значим через X(Gy величину у?аг
j
Предложение 4. Для ГДП {Gi}e{G(X)}* имеет место
соотношение X(d G2) = A.(Gi) A,(G2).
Введем на множестве {G(X}}* отношение эквивалентности р.
Положим Gi p G2, если X(G\) = A,(G2). Из предложения 4
немедленно вытекает:
Следствие 3. Отношение эквивалентности р задает
конгруэнцию на полугруппе (G(X)}*, причем фактор полугруппа (G(X)}*/p
есть мультипликативная полугруппа вещественных чисел из
отрезка [0, 1].
Если рассмотреть множество взвешенных ГДП Г(X), где ребрам
приписаны веса из отрезка [0, 1], то на этом множестве нельзя
задать полугрупповую операцию, являющуюся продолжением опера-
398
ции умножения с G(X) как подмножества Г(X). Однако на Г(X)
можно ввести структуру полугруппы со следующей операцией.
Для ГДП {G,H}eF(X) определим ГДП 0©Н следующим
образом. Пусть А, В — матрицы ГДП G, Н. Положим Cij=maxaiebg и
допустим, что Су являются элементами матрицы С ГДП G©H. Тогда
имеет место теорема 4.
Теорема 4. Класс ГДП Г(Х) относительно операции © является
полугруппой с единицей.
Выскажем также ряд соображений о топологической
интерпретации ГДП [108].
Рассмотрим ГДП G(X, F), где F: Х->Х отображение, задающее
процесс диалога. С каждым ГДП G свяжем топологию то на
множестве состояний X. Топологию то удобно задать, определив класс
замкнутых множеств. Условимся считать замкнутыми такие
подмножества ФсХ, что из условия хеФ, yeF(x) следует, что уеФ.
Иначе говоря, замыкание совпадает с операцией транзитивного
замыкания в смысле бинарного отношения на X, связанного с ГДП.
Полезно установить связь между диалоговыми процессами и
топологическими пространствами на категорном уровне.
Предложение 5. Морфизму у ГДП G и Н соответствуют
непрерывные в смысле топологий xG и тн отображения.
Теорема 5. Класс ГДП с введенным выше понятием морфизма
образует категорию (неабелеву).
Утверждение 1. Соответствие т, строящее по ГДП G(X,F)
топологическое пространство (X,xG), является контравариантным
функтором из категории ГДП в категорию топологических пространств
на конечных множествах.
Опишем в топологических терминах класс директивных ГДП,
задаваемых древовидными графами (рис. 10.2—10.4)
Предложение 6. Пусть задан директивный ГДП G(X, F). Тогда
топология то удовлетворяет условию: для любых двух точек
(х,х'}еХ имеет место либо х е X, либо х' € X', либо же X п X' = 0
Корневые точки ГДП G — суть компоненты связности
топологического пространства (X,xg). Заметим, что терминальными
вершинами в любом ГДП G соответствуют замкнутые в топологии xG
точки.
Топология xG однозначно не определяет ГДП G, так как граф
определяется по топологии с точностью до транзитивного
замыкания.
399
X0 G(X,F)
X,
G(X,F),
Xi
Рис. 10.2. Базовый
директивный ГДП с
глубиной 1
Рис. 10.3. Базовый
директивный ГДП —
транспозиции с глубиной 1
G(X,F)
Рис. 10.4. ГДП с
неприводимыми элементами
для директивных ГДП
Теорема 6. Пусть G(X,F) — ГДП с транзитивно замкнутым
графом связей. Тогда G определяется по топологии то однозначно.
Именно для хеХ множество F(x) есть замыкание точки х в
топологии xG.
Отметим, что .для древовидного ГДП граф, построенный
транзитивным замыканием, не обязательно древовидный.
Ниже будут рассмотрены различные операции над ГДП,
вообще говоря, с различными множествами X шагов интерактивного
взаимодействия. В связи с этим введем в рассмотрение
универсальную алгебру ГДП Q.
Элементами алгебры П являются ГДП G(X,F)cXcX00, 1X1 ох>.
Предложение 7. Универсальная алгебра ГДП Q является ГДП
полугруппой (с единицей).
Предложение 8. Интерактивное взаимодействие, задаваемое
ГДП G, является директивным тогда и только тогда, когда ГДП G*
задается подмножеством Х*сХ х X, являющимся графом.
Выделим также важный класс ОТ гибких ГДП, задаваемых
соотношениями следующего типа.
Элемент G(X,F) еСГ может быть представлен в виде
композиции
G = garGpi-ga2-Gp2
ёап-°ря>
где gai — ГДП-подстановки, т.е. такие, которые задаются
перестановкой элементов х* и х,, а GPj — ГДП, не содержащие циклов, т.е.
не допускающие траекторий вида
Xil -*Xi2 -*•••-* Xik "*Xil-
Здесь все элементы в цепочке попарно различны.
400
10.3. Информационные модели диалоговых
процедур
Пусть ? = {i} — не пустое конечное множество (словарь)
терминальных символов, из которых состоят сообщения,
циркулирующие между системой и пользователем (составляющие
интерактивного процесса взаимодействия). Введем в рассмотрение функцию
q>(i), отображающую составляющие натурального ряда чисел в
элементы множества Е: <p(i) = ai5 i = 1, 2, ... . Тогда кортеж о и аг, ..., ап
представляет собой последовательность символов из словаря Е
[107, 109].
Однако для реализации s-x диалоговых процедур существенно
не только то, какие сообщения а* входят в подмножество V , но и
в каком порядке они следуют в рассматриваемом процессе
интерактивного взаимодействия. Этот порядок опишем бинарным
отношением Rs, являющимся подмножеством декартова произведения
Иначе говоря, цепочки а* и о* находятся в отношении Rs или
a*Rsa*, если за сообщением а* следует сообщение а*. Далее,
каждой упорядоченной паре (с*,с*) поставим в соответствие
характеристическую функцию ц = {цу}, где щ Rs fjj9 что соответствует
интерпретации бинарного отношения Rs квадратной матрицей \х = |||Лу||.
Определение 10.10. Пару Ms =( V ,RS) назовем информационной
моделью интерактивного процесса взаимодействия с индексом S.
Отметим, что построенная модель характеризует в основном
системы с директивной структурой интерактивного
взаимодействия, а чтобы рассмотреть аспект гибкости интерактивного
взаимодействия, необходимо расширить структуру полугруппы
сообщений.
С этой целью введем в рассмотрение два типа отношений,
выражающих гибкость интерактивного взаимодействия с точки
зрения структуры сообщений.
Отношение синонимии в интерактивных взаимодействиях.
Определение 10.11. Отношение эквивалентности р на множестве
+
, согласованное с полугрупповой операцией, назовем
отношением синонимии. Здесь afpcrt va?pa* =» а*а?ра*а*.
2
26 — 3466
401
Такого рода отношения выражают тот факт, что при
реализации интерактивного взаимодействия могут возникнуть синонимы,
выражающие один и тот же фрагмент процесса
человеко-машинного общения. Более того, заметим, что подобный тип гибкости
может быть присущ и директивному взаимодействию, сценарий
которого жестко регламентирован. В этом случае необходимо
ввести фактор-объект ^ = ^ / р, являющийся полугруппой, но
характеризующий не внешний набор сообщений «человек—ЭВМ», а
те внутренние коды, в которые интерпретируются эти сообщения.
Отметим, что отношение синонимии должно быть согласовано
с отношением следования сообщений R*. Именно, если
<at,at)GRs, а также <ра]" и а]ра+, To«,a+>GRs.
В частности, можно построить фактор-отношение Rs С ^ х ^ ,
выражающий следование кодов сообщений.
Базовое множество и константуэта модели. Пусть максимальная
длина цепочки а* Е V ограничена числом Nmax, тогда число
моделей {Ms}, которое можно построить в рамках моноида,
порожденного словарем Z, будет ограниченным [102, 107, 111].
Если максимальная длина цепочек af G ^ не ограничена, то
множество моделей {MS}=M будет счетным.
Определение 10.12. Подмножество ^ С ^Г всех сообщений s-й
информационной модели назовем базовым множеством данной модели.
Далее заметим, что при разработке информационных моделей
для созданной предметной области в различных диалоговых
процедурах интерактивного взаимодействия будут встречаться
адекватные элементы, причем часть из них будет одинаковой для всех
процедур рассматриваемого класса.
Определение 10.13. Множество одинаковых элементов
информационных моделей для заданной предметной области назовем кон-
стантуэтой.
Рассмотрим пересечение s-й области множества V :
2ГПГ-
S
Пусть V * 0. Далее, поскольку константуэта V содержится
как неизменный (постоянный) компонент в базовых множествах
402
V моделей Ms, то его реализация в составе интерактивной
человеко-машинной системе должна осуществляться набором
системных средств, используемых в той или иной степени при
организации различных диалоговых процедур.
Таким образом, базовое множество Ms можно представить в
виде
где ^ =2 / ^ представляет собой разность множеств ^Г (для
модели с индексом S); V — константуэты базового множества для
системы модели Ms.
Иначе говоря, составляющая V Е V представляет собой
переменную часть базового множества модели с индексом S (рис.
10.5).
Константуэта и переменная части отношения следования. По
аналогии _с предьщущим определим константуэту Rn и переменную
часть Rs отношения следования Rs (рис. 10.6).
Определение 10.14. Константуэтой Rn отношения следования
назовем следующее подмножество
Отметим, что в модели Ms с
индексом s и базовым множеством V
используется часть константуэты Rn, a
именно RJ CRn. В таком случае для
Rn,Rs и Rs справедливо следующее
соотношение
Rs=RsnURs.
Если же учесть выражения,
полученные для переменных и постоянных
Рис. 10.5. К определению
константуэты и переменной части
базового множества модели с
индексом
26*
403
Rf с R(n)
Рис. 10.6. К определению константуэты и переменной части отношения
информационной модели
частей базового множества, и отношения следования, то можно
записать следующее:
i»S^-2f.R;uR.-Ri.
Определение 10.15. Постоянной составляющей модели с индексом s
назовем М*, а переменной составляющей той же модели назовем Ms.
Постоянные {М*} реализуются внутрисистемными средствами
как совокупность инварианта множества сообщений V. с2 и
инварианта отношения следования Rn с Rs. В качестве примера
таких сообщений можно рассматривать реакцию системы на такие
типичные ситуации, как диагностические сообщения
операционной среды, протокола и пр.
Композиция моделей. При композиции интерактивного
взаимодействия в зависимости от конкретных задач, решаемых
проблемным пользователем, необходим тот или иной анализ
информационных моделей. В связи с этим рассмотрим проблемы, связанные с
композицией указанных моделей в различных схемах
человеко-машинного общения. Введем понятия модели [106, 107, 113].
404
Определение 10.16. Простой информационной моделью
интерактивного взаимодействия назовем модель вида М^ =( V ,RS).
Определение 10.17. Композиционной моделью 0i назовем
объединение в определенной последовательности заданных фрагментов
простых моделей {М*}.
Другими словами,
G^QMi, iGl9i, I0j={U,...,N}.
Здесь Q определяет способ выделения фрагментов из простых
моделей {Mi}, а также порядок их следования.
Под фрагментом М{ простой модели Mi будем понимать часть
модели, удовлетворяющей условиям
/а \
Mi =
?>4'2ie2^*iCRi'ieI
Таким образом, композиционная модель представляет собой
пару
где {М4} — набор фрагментов простых моделей.
Заметим, что индексы i в I8i могут повторяться, что дает
возможность выделить в одной модели несколько различных
фрагментов. Предыдущую формулу можно переписать следующим образом:
rae2eTy3?Rs=<Ribie/v
Отсюда следует, что композиционная модель в* определяется
множеством сообщений V и двумя отношениями следования,
заданными на V
Отношение Rs определяет порядок следования цепочек
сообщений, a Re — порядок следования фрагментов простых моделей в
виде последовательности сообщений.
405
Рассмотрим теперь следующий аспект гибкости диалоговых
процедур, основанный на использовании понятий фрагмента
простой модели.
Зададимся отношением эквивалентности между фрагментами
простых моделей MixMj, которое согласовано с отношением Re.
следования фрагментов. Именно, если имеет место М^М^М^М]
и MjRq.Mj, to имеет место и MjReMj.
Введем фактор-объекты V и R6y, где V = х) / т и
соответственно R0v = Re /т. Тогда фактор-модель представляется следую-
/ ~
щей тройкой 0Т =
20'^Деу
Соотношение между моделями 8V
/
и 0V выражает тот аспект гибкости диалоговых процедур, что
разные последовательности сообщений могут определять идентичные
акты человеко-машинного общения в процессе интерактивного
взаимодействия. Это возможно в случае, когда для разных
категорий и типов проблемных пользователей система предлагает свой
вариант набора сообщений.
Возможны ситуации, когда сами сообщения, а также
производимые в ответ на них операционной средой действия различны, но
конечный результат, являющийся следствием двух различных
последовательностей сообщений, один и тот же.
Структура композиционных моделей. Использование
композиционных моделей, наряду с простыми моделями, позволяет
формировать модели информационных связей и отлаживать их описания по
частям для типовых и часто встречающихся элементов диалоговых
процедур, а также накапливать такие элементы в соответствующих
библиотеках и строить новые процедуры на их основе.
Структура композиционных моделей отличается большим
разнообразием и возможными вариантами [109, ПО, 111].
Последовательная композиционная модель представляет собой
наиболее простой, в структурном отношении, вариант таких
моделей (рис. 10.7).
Для него характерно то, что фрагменты М!,М2,...,МП моделей
Mi,M2,...,Mn совпадают с самими этими моделями, т.е. М{ sM„
М2 s М2,...,МП = Мп. Это означает, что и модели Mi5 i = ПН,
объединены в цепочку, причем модели М» обрабатываются в порядке
следования их номеров.
406
Ч~м7Н~мГЬ—>^м7Ь
Рис. 10.7. Последовательная композиционная модель
Частично последовательная композиционная модель (рис. 10.8)
является разновидностью последовательной композиционной
модели, в которой для некоторых (или даже для всех) значений
индекса i Gle не выполняется соотношение М{ =М4, т.е. фрагмент
М| не совпадает со своей моделью. Фрагменты моделей М4
обрабатываются в порядке следования их номеров.
Рис. 10.8. Частично последовательная композиционная модель
Циклическая композиционная модель (рис. 10.9) представляет
собой обобщение двух предыдущих случаев, когда матрицы
отношения Re. модифицируются таким образом, чтобы за фрагментом
Мп следовал вновь фрагмент М{ модели М\. Возможен случай, ко-
гда переход производится не к фрагменту М{ модели Мь а к
какому-либо другому фрагменту этой модели.
pi ™1 И ™2 I-» - -1 мп |-1
Рис. 10.9. Циклическая композиционная модель
Иерархическая композиционная модель (рис. 10.10)
представляет собой специальный вид композиционных моделей, в которых
модель Mi выделяется из фрагментов М{, i = Т7п. После обработки
фрагмента М{ производится переход к обработке фрагмента Мп+1,
вьщеленного из модели М2, после обработки фрагмента Мп+1
производится переход к обработке фрагмента Мп+2, вьщеленного из
модели М3, и т.д.
Одновременно возможен вариант иерархической
композиционной модели с несколькими уровнями иерархии.
Рассмотренные четыре разновидности композиционных
информационных моделей диалоговых процедур далеко не
исчерпывают всего их разнообразия. Более сложные модели могут быть по-
407
'м.
1^71
f
м,
...
Щ\
1—Н Mi 1 1
| М2| [~№
1
3
Рис. 10.10. Иерархическая
композиционная модель
Рис. 10.11. Пример
композиционной модели, полученной
путем объединения
элементарных моделей
лучены комбинированием различными способами вышеуказанных
моделей (рис. 10.11).
Лингвистика моделей диалоговых процедур. Рассмотрим
лингвистический аспект гибкости диалоговых процедур в интерактивных
человеко-машинных системах. Это обстоятельство связано с тем,
насколько свободным может быть набор сообщений, которыми
обмениваются проблемный пользователь и ЭВМ в процессе
интерактивного взаимодействия.
Зададимся исходным алфавитом ^j={i,,i2,...,in}H полугруппой
сообщений V = U у), где V = 0, на котором задано отношение
к=0
эквивалентности р, обладающее тем свойством, что если хру, то
для любых {u,w} Е V имеет место соотношение uxwpuyw.
Приведенное свойство характеризует свойство независимости
сообщений в некоторой точке хеХ ГДП G(X, F) от
лингвистического контекста цепочки сообщений, в которую оно погружено.
Иначе говоря, это означает наличие единого понятия синонимии
сообщений для всех актов процесса интерактивного
взаимодействия. Отсюда следует следующее предложение.
Предложение 9. Моноидальное пространство "д = У) /Р можно
представить в виде набора интерпретирующих сообщений.
Определим некоторую топологию на цепочках сообщений, в
которой окрестностью элемента z G jjj являются всевозможные
символьно расширенные цепочки, приводящие в z.
408
Иначе говоря,
D(z) = {an/aG^U{l}}.
Далее для ограничения возможного следования цепочек
сообщения введем понятие G-структуры.
Определение 10.18. Сужение окрестности элемента z, d(z) с D(z)
такое, что цепочки вида ап принадлежат к классу допустимых, т.е.
если Z — допустимо, a anz e d(z), то совокупность допустимых
сообщений с возможными левыми расширениями является G-струк-
турой.
С учетом отношения следования сообщений в процессе
интерактивного взаимодействия цепочку сообщений можно
проинтерпретировать как d траектории. Это такие цепочки сообщений
ai,...,am, у которых ai+1 e d(ai), так как для пары соседних
элементов цепочки соблюдено отношение следования.
Обратимся к стадии инициализации интерактивного
взаимодействия. Очевидным требованием к этой стадии является то, чтобы
от сообщения инициализации к любому допустимому сообщению
можно было перейти по некоторой цепочке. Если отождествить
сообщение инициализации с нейтральным элементом 1 полугруппы
I*, то набор сообщений интерактивного взаимодействия будет
составлять некоторую структуру на исходном моноидальном
пространстве
М = (Е, р).
Такую структуру назовем s-структурой. Отметим, в частности,
что терминальные сообщения, циркулирующие в процессе
интерактивного взаимодействия, интерпретируются граничными
точками на s-структуре.
Если задаться целью нахождения сообщений интерактивного
взаимодействия, в которые можно перейти только путем
изменения цепочки сообщений, то этому обстоятельству будут
соответствовать понятия предграничных точек на s-структурах.
Допустим теперь, что в процессе человеко-машинного общения
возникла необходимость изменения цепочек сообщений. В
простейшем случае эта процедура будет соответствовать добавлению
новых терминальных сообщений к уже имеющимся цепочкам.
Очевидно, что эти добавления должны быть согласованы с
отношением следования сообщений.
Такого рода конструкция расширения лингвистического
аспекта интерактивного взаимодействия приводит к понятию префикс-
409
ного отношения между s-структурами dl, и d2, выражающими
соответственно исходный и расширенный вариант
человеко-машинного общения.
Заметим, что вышеуказанные аспекты отражают в основном
«автономные» свойства интерактивного взаимодействия. Они
соответствуют схеме реализации диалоговых процедур из некоторой
исходной простейшей путем последовательного наращивания
многообразия свойств интерактивного процесса.
Для дальнейшего развития соображений, указанных выше,
введем понятие s-покрытия, как частичного отображения моноидаль-
ного пространства Ер, на которое конечное подмножество s
распространено. В терминах интерактивного взаимодействия это
соответствует расслоению полугруппы сообщений по множеству X ГДП
G(X, {F}). Универсальный класс подобных покрытий, как и
отображение s-структуры, обозначим через С : S(M) -> SIp.
Введем также понятие граф акцептора, физический смысл
которого следующий. Известно, что существует класс интерактивных
систем, построенных по принципу меню, в которых каждому
элементу хбХ соответствующего ГДП ставится в соответствие
переключающаяся функция. Действия же проблемного использователя
фактически сводятся к выбору переключающей метки. Используя
методы, разработанные в теории автоматов, можно свести р-пере-
ключающие функции к 2-переключающим.
С другой стороны, это означает, что соответствующие ГДП
можно свести к 2-графам или к бинарным деревьям. Более того,
введенные выше префиксные отношения позволяют задать
частичное упорядочение для этого класса отображения интерактивного
взаимодействия в информационной базе. В таком случае
правомерен метод отображения сложных диалоговых процедур,
основанный на процедуре линеаризации. Иначе говоря — это отображение
сложных процедур путем последовательного наращивания
возможностей некоторой исходной простой процедуры.
Рассмотрим еще один аспект интерактивного
человеко-машинного взаимодействия, непосредственно связанный с
представлением ГДП в информационной базе. Это связано с тем, что
ориентация проблемного пользователя в информационной базе
обеспечивается, как правило, при помощи системы подсказок типа «меню».
Однако такой подход, являясь более доступным, имеет тот
основной недостаток, что максимально отслеживаются так называемые
«вертикальные» связи с ГДП, т.е. допустимые переходы — шаги
интерактивного взаимодействия от элемента Xi к х,. Между тем «го-
410
ризонтальные» переходы, т. е. характеристика того, насколько
глубоко проблемный пользователь продвинется в ГДП, никак не
отражается в этих подсказках.
В то же время в ряде задач принятия решений, особенно в
таких, где нет полной формализации возможного движения
пользователя по ГДП, полезно иметь аппарат, позволяющий
констатировать его текущее положение в рамках информационной базы.
Это приводит к концепции рассмотрения процесса движения
по ГДП, как срабатывание системы переходов-актов,
увеличивающих глубину продвижения. В частности, для указанного подхода
удобна «автоматная» концепция ГДП, т. е. концепция, аналогичная
машине Тьюринга, в которой в метках ленты состояний находятся
не стринги над исходным алфавитом, а некоторые графы.
Подобная концепция позволяет интерпретировать ГДП как систему эво-
люционизирующих графов, а последующая автоматизация
описанного подхода позволила бы реализовать схему «горизонтальной»
ориентации проблемного пользователя в процессе интерактивного
взаимодействия без введения новых траекторий в ГДП.
Указанное весьма актуально и с точки зрения организации
реляционной информационной базы. В самом деле, таким средствам
можно было бы реализовать большую гибкость интерактивного
взаимодействия за счет автоматизации цепочек переходов как
автоматных операций над ГДП.
В частности, интерактивный процесс можно представить в виде
цепочки
Go-^G,—^K,—^-*Gn =Gn,
где Go — ГДП, инициализирующий диалоговые процедуры
человеко-машинного общения, aGn- n-полный ГДП системы.
Очевидно, что в зависимости от уровня пользовательских задач
принятия решении система может предлагать ему ускоренные
схемы реализации вида
Gsi-Sn ^^ S„...Si2
и i, i2
Кроме того, храня в системе протокол операции развертки
процесса интерактивного взаимодействия Si ..., Sn, всегда по мере
необходимости можно вернуть систему к одному из исходных
состояний вида
G0 >G,.
411
Это обстоятельство может оказаться решающим, если на
каком-то этапе интерактивного взаимодействия проблемный
пользователь обнаружит, что для него существенна та или иная
информация, которая содержалась на более ранних этапах интерактивного
взаимодействия.
Сделаем еще ряд замечаний относительно лингвистики
диалоговых процедур. Они касаются характера элементов хеХ ГДП G(X,
{F}). Заметим, что в первом приближении элементы X можно
разделить на два крупных класса: на функциональные и управляющие.
В управляющих вершинах пользователь в ответ на вопрос
системы вводит сообщение из некоторого фиксированного конечного
множества сообщений {Qb ..., Qn}, что соответствует сценариям
человеко-машинного общения типа «меню».
В функциональных же вершинах пользователь вводит
определенную информацию, необходимую для поддержания
интерактивного процесса.
В качестве последней могут выступать запросы к базе данных
или какие-либо фрагменты, связанные с заданием критерия
смыслового соответствия в рамках запроса. В качестве таковых могут
выступать также вновь вводимые данные, корректируемые
значения, некоторые характеристики выдачи информации и т.п.
Отметим, что для вершин управляющего типа набор ответов
«меню» всегда можно свести к двум элементам {да, нет} путем
реорганизации ГДП. Иначе говоря, соответствующим образом
преобразуется система переключающих функций, определяющих логику
переходов.
В частности, от полученной конструкции ГДП с
дифференцированными вершинами может оказаться удобным переход к сетям
Петри как средство представления интерактивного процесса
взаимодействия.
В этом случае управляющие вершины ГДП трактуются как
переходы в смысле сети Петри, а функциональные
вершины — как места. В свою очередь, разметка сети Петри может
определять некоторую стадию реализации диалоговых процедур. А
веса переходов в смысле сети Петри можно рассматривать как
одно из возможных средств управления на ГДП. Именно
варьируя веса переходов, можно разрешать или запрещать те или иные
траектории в ГДП.
Отметим также, что для представления интерактивного
процесса может оказаться более удобной не исходное определение сети
Петри, а одно из многочисленных модификаций типа
сети-процессы, конкурентные сети и т.п.
412
Фактически переход к сетям Петри для представления
интерактивного процесса означает выделение в самостоятельную сущность
подкласса управляющих вершин ГДП с развитием
соответствующего аппарата для оперирования им в рамках групп элементов ГДП.
10.4. Адаптивный фактор диалоговых процедур
Расширение целевого назначения диалога «пользователь-
ЭВМ» может осуществляться в двух основных направлениях:
• создание системы вложенных сценариев диалога в рамках
директивного диалога;
• создание гибкой структуры диалога, легко адаптирующейся к
различным пользователям.
В первом случае сценарий диалога может быть промоделирован
древовидными ГДП G(X,F), в которых корневой элемент ХоеХ
ГДП G(X,F) является точкой инициализации диалога, а
терминальные элементы — точками выхода, причем каждый из
терминальных элементов соединен с точкой инициализации ровной
траекторией. Такая структура диалога упрощает работу пользователя с
системой, предоставляя возможность выбирать пользователю
ответы в кадрах-меню, выдаваемых интерактивной системой.
Недостаток подобной схемы диалога в том, что не учитывается
эвристика пользователя, уровень его знакомства с системой,
профессиональная подготовка и т.п.
Более перспективной представляется адаптивная структура
диалога, реализующего целевую функцию пользователя различными
цепочками кадров, что соответствует сетевым ГДП [107, 108, ПО,
111].
Таким образом, с одной стороны, пользователь приобретает
свободу в выборе цепочки кадров сценария диалога, а с другой
стороны, каждой траектории сетевого ГДП можно приписать
категорию пользователей интерактивной системы. Наконец, следующий
шаг — предложить такую схему адаптации диалога, когда в
процессе взаимодействия человека и ЭВМ меняется сама структура
интерактивного общения, т.е. модифицируется ГДП.
Рассмотрим проблему адаптации диалоговых процедур с разных
точек зрения, выявим некоторые особенности и сделаем
соответствующие обобщения, а также построим математическую модель
процесса адаптации.
413
Синтез гибкого адаптивного диалога. Выше было показано, что
ГДП директивного типа можно разложить на базовые
(элементарные), используя операцию «произведение». Именно, произведение
ГДП Gi(Xi, Fi) и G2(X2, F2) сводится к произведению задающих их
отображений Fi и F2. Отметим, что такое разложение определено
однозначно.
Рассмотрим теперь следующий подход к проектированию
адаптивной структуры диалога. Определим такую операцию над ГДП,
которая позволяет синтезировать гибкий ГДП из директивных с
учетом лингвистического аспекта. Для этого включим в модель
ГДП списки сообщений, которыми обмениваются система и
пользователь в процессе диалога.
Пусть задан ГДП G(X, F), где X — конечное множество шагов
диалога, a F: Х->Х функции перехода от одного шага к другому.
Далее поставим каждому хеХ в соответствие список Sk{S*,...,S?},
где S? — i-й вопрос со стороны системы, выдаваемый на шаге х. С
другой стороны, каждой дуге (xi} x,), где F(Xi) = Xj, поставим в
соответствие сообщение 9/ — ответ пользователя, инициирующего
переход от элемента Xr-wc,, причем сообщение 9- может состоять из
списка синонимичных элементарных сообщений-ответов.
Можно выделить класс систем, в котором кадры, выдаваемые
пользователю, построены по принципу меню. В этом случае ответ
пользователя в состояние (кадр) х4 сводится к идентификации
строки-вопроса {S?} в меню Sk.
Таким образом, в последнем случае ставится в соответствие
вопросу {Sj} дуга (Xi, X,), определяющая переход из состояния х4 в
состояние Xj. Назовем систему с указанным свойством лингвистически
однородной.
Обобщим следующим образом операцию свертки на случай гра-
фо-лингвистической модели. Пусть заданы ГДП G(X, F, Sx) и H(Y, *F,
RY), причем G и Н предполагаются лингвистически однородными, а
Sx и Sy обозначают соответствующие множества кадров-меню.
Положим
G * H=M(Z, Q, Tz),
где Z = XuY, П: Z->Z определяются так же, как и в случае свертки
ГДП, a Tz — результирующее множество меню, определяемое
следующим образом:
414
Tz =
sx,zex\Y
Ry,z6Y\X
SxlRv,zEXnY
Здесь в качестве операции Sx±Ry предполагается такой вариант
объединения множества вопросов Sx и Ry, когда вопросы {S*} и {гД
связанные с переходом в один и тот же кадр, отождествляются и
заменяются только одним из вопросов подобной пары. Это может
быть {SJX} или {г^}, либо же по паре ({S?},{i/}j) генерируется новый
вопрос на естественном языке {qf }j, синтезирующий семантику
вопросов {S;x}j и {г/}.
Заметим, что момент, связанный с необходимостью
синтезирования вопросов из кадров системы, участвующих в операции
свертки ГДП, приводит к проблеме искусственного интеллекта,
поскольку требуется смысловая идентификация перехода. Отметим,
что на данном этапе рассмотрения этой проблемы не
представляется возможным решить ее чисто автоматическими средствами.
Таким образом, в указанном звене действий, связанных с
синтезированием гибкого адаптивного диалога, одним из возможных
решений может быть подключение интеллекта пользователя.
Это может быть достигнуто, если синтезатор диалога будет сам
функционировать как система метауровня. Примеры подобного
рода приводятся в [ПО].
В нашем случае на систему метауровня переносятся те
лингвистические аспекты синтеза структуры диалога, которые не
поддаются полной формализации и автоматизации. Конструктивно это
реализуется путем разработки редактора диалога, который мог бы
выполнить основные функции по модификации
лингвистически-структурной схемы гибкого сценария диалога. Наряду с
традиционными командами такой редактор (интеллектуальный
редактор) включает операции, выражающие определенные
семантические процессы перестроек ГДП в нужном для пользователя
направлении.
Обобщение графо-лингвистической модели. С учетом
построенной графо-лингвистической модели диалога можно сделать ряд
обобщений, связанных с проектированием адаптивного диалога.
Процедуру проектирования такого диалога под заданный
сценарий можно интерпретировать следующим образом.
415
1. Имеется набор информационно-вычислительных процессов
Рь Р2,..., Рк, каждый из которых поименован фразой естественного
языка из набора сообщений Sb S2, ..., Sk.
2. Задана последовательность обхода процессов {P}j, i,j = T3c,
причем среди PJ допускаются и повторяющиеся процессы.
3. На каждом из к шагов мы должны обеспечить либо
выполнение процесса Р*, либо осуществить переход к процессу Pf+1.
4. Требуется создать такой ГДП Go, который включал бы
требуемую Go траекторию.
Здесь можно указать два метода решения поставленной задачи:
• спроектировать n-полный ГДП, в котором имеется сводное
меню всех возможных сообщений {S}i, i = 1,N, и допускаются
переходы из любого процесса Ра в любой Рр;
• спроектировать бинарный ГДП B-граф), в котором каждый
кадр сценария содержит лишь одно сообщение Sa, причем система
на k-м шаге запрашивает, выполнять ли процесс Ра, а ответом
пользователя являются Да или Нет.
Хотя сценарии для обоих случаев и дают формальное решение
поставленной задачи, однако на практике они могут оказаться
недостаточно эффективными, ибо n-полный ГДП может потребовать
слишком большого (необозримого) кадра-меню, а это приведет
2-граф к слишком растянутым последовательностям кадров.
Целесообразно поэтому рассмотреть промежуточный более
рациональный класс сценариев, представленных Р-графом, а также
ввести процедуры перестройки любых сценариев в Р-графовое
представление.
Ниже рассмотрен несколько более общий, чем хорошо
известный класс Р-графов, а именно класс ГДП, у которых имеется
симметрия степеней исходных вершин, находящихся на одной глубине
в рамках сценария. Физически указанный класс ГДП может
представлять набор сценариев, у которых на заданном удалении от
точки инициализации имеются равномощные наборы альтернативных
меню, которые будем называть равномощными.
Синтез универсального сценария. Исследуем проблему
построения универсального сценария директивного диалога минимальной
сложности.
Допустим, что из точки инициализации Хо в данную точку
можно попасть единственным путем (траекторией), причем он состоит
из k(k ? 0) дуг, что соответствует к шагам диалога «человек—ЭВМ».
Будем говорить тогда, что данный кадр сценария k-й кратности.
416
Длину наибольшей траектории dx, соединяющей Хо с хк по всем к,
назовем глубиной сценария директивного ГДП (X,F).
Будем говорить, что сценарий В вложен в сценарий А, ВсА,
если множество траекторий сценария В мономорфно множеству
траекторий сценария А, при условии, что элементы
инициализации у обоих сценариев совпадают.
Сценарий S назовем равномощным, если число траекторий,
выходящих из элементов одной и той же кратности, одинаково.
Сценарий, содержащий только точку инициализации диалога,
будем также считать равномощным.
Каждому равномощному сценарию S глубины к ? 1 припишем
набор (vb v2, ..., vk), где у4 — соответствует числу траекторий,
исходящих из произвольного элемента (i — 1), i = "рс; к — кратности.
Предложение 10. Пусть S — равномощный сценарий с набором
(vi, v2,..., vk). Сценарий S будет вложен в равномощный сценарий с
набором (ць ц2, ...» Цп) тогда и только тогда, когда к < г и Vj < |jj,
i = Т^, j = ТТг.
Следствие 4. Два равномощных сценария, имеющих
одинаковые номера, изоморфны.
Предложим формулу для расчета числа <т(п) равномощных
сценариев с конечным числом шагов диалога п. Очевидно, что
количество равномощных сценариев с числом шагов диалога <п и
таких, что из точки инициализации диалога выходит в точности v,
v = 1,п- 1 дуг, равно а([п - 1/v]).
Суммируя по всему и учитывая одноэлементный равномощный
сценарий, получим следующую рекуррентную формулу:
оA) = 1,а(п) = 1 + а(п-1) + а(|^|) + К + а
Зададимся равномощными сценариями S и Т, у которых
одинаковая глубина К, с соответствующими наборами (vb v2, ..., vk) и (ць
Цг, — t Цп). Назовем сценарий S короче сценария Т, S < Т, если
номер (vb v2,..., vk) меньше номера (\i\, ц2,..., цп) справа в
лексикографическом смысле, т.е. i = max, для которого Vj ф щ, такого, что Vi < щ.
Зададимся теперь произвольным сценарием S и определим А с
произвольным числом шагов диалога. Вычислим число попарно
неизоморфных вложенных в А равномерных сценариев.
Утверждение 7. Для равномощного сценария S, вкладываемого
двумя различными способами в А, существует равномощный
сценарий Т, такой, что Т с А и Т =э S.
27 — 3466 417
т
Теорема 7. Число шагов диалога сценария А равно числу
попарно неизоморфных равномощных сценариев, вложенных в А.
Алгоритм построения N-полного сценария. Построим N-полный
сценарий, покажем, что он является минимальным, а также
исследуем возможность построения универсального сценария для
произвольного конечного множества равномощных сценариев.
Пусть N — множество всех директивных сценариев с одной
вершиной инициализации и счетным множеством шагов диалога п,
n = TTN.
Определение 10.19. N-полным назовем такой сценарий, что
всякий сценарий из этого множества вложим в N.
Построение N-полного сценария будем производить
индуктивно. Пусть Wi сценарий, состоящий только из элемента
инициализации. Пусть для каждого k < n уже есть сценарий Wk. Сценарий
строим следующим образом.
Шаг 1. Из точки инициализации диалога хо проведем п— 1
траекторий к элементам хь х2, ...., хп-ь
Шаг 2. Положим сценарий Wn(Xi) равным сценарию
для каждого i,l < i ^ n — 1. Тогда имеет место следующая теорема:
Теорема 8. Число элементов а(п) минимального универсального
N-полного сценария равно числу равномощных сценариев с
числом шагов диалога <п.
Обозначим через aN конечное множество равномощных
сценариев. Найдем минимальный универсальный сценарий для aN.
Рассмотрим множество R, состоящее из элемента
инициализации хо, и множества наборов (vb v2, ...., vk), характеризующих те
равномощные сценарии, которые могут быть вложены в
какой-либо сценарий из aN. Проведем далее траектории из Хо в (vb v2, ....,
vk), полагая, что набор (vi, v2, ...., vk+1) продолжает набор (vb v2, ....,
vk). Обозначим сценарий такого типа через A(an).
Теорема 9. Сценарий A(an) является искомым универсальным
сценарием для множества an. При этом для an с aN имеем
включение A(an)cA(aN), а для одноэлементарных сценариев а\ = {R},
A(oi) изоморфно R.
Генерация адаптивного диалога. Пусть имеется заданная
последовательность информационно-вычислительных процессов,
определяемая ходом диалога: Рь Р2, ..., Рп, где Р*еП, а П—некоторое
исходное множество процессов. Заметим, что в последовательности
могут быть совпадающие члены.
418
i^\
Да
Да
Каждый процесс Р* е П идентифицируется
сообщением ^ е S, где S некоторое множество
возможных сообщений в интерактивной системе. Отметим,
что в системах с синонимическими сообщениями S
могут представлять собой список возможных
идентификаторов.
Необходимо построить схему диалога, которая
обеспечивает последовательное прохождение
процессов Р*, причем на k-м шаге процесс Р* может
быть выполнен с параметрами, задаваемыми на этом
шаге диалога, либо пройден с опущением
(макропроцесс).
Сформулированная задача является
постановочной для генерации универсальной схемы диалога.
Решение данной задачи можно построить при
помощи ГДП Г, вид которого представлен на рис. 10.12.
Здесь Хо — точка инициализации диалога.
Построение ГДП дает решение задачи генераций
структур диалога под заданную последовательность
информационно-вычислительных процессов.
Однако это решение, как правило, не является достаточно
эффективным из-за сравнительно большой длины
траектории ГДП Г.
Поэтому удобно для сокращения длин
траекторий ввести процедуру перестройки указанного ГДП Да
в Р-граф. Поскольку при этом нельзя нарушить
упорядочение процессов, то этим определяется ряд
требований к указанному Р-графу (рис. 10.13).
Здесь каждая из вершин Р* с уровнем глубины к
в ГДП переместилась на уровень глубины
Да
Рис. 10.12.
Генерация
универсальной
схемы диалога
T=(logpk)+l. A0.1)
Кроме того, введена возможность перемещения
между вершинами одного уровня глубины, т.е. расширен
допустимый набор траекторий.
Если перейти от класса Р-графов к более широкому классу
графов, у которых количество вершин исхода постоянно только в
пределах вершин одного уровня глубины, то уравнение A0.1)
преобразуется к виду
d(P*) = t + l,
27*
A0.2)
419
1 2... Р 1 2... Р 1 2... Р 1 2... Р
Рис. 10.13. Перестройка траектории ГДП в Р-граф
где t — такое целое число, что
?{• Р2 • ...• Pt_! < к < Р, • Р2 • ...• Pt.
Здесь Pt — количество вершин исхода на уровне глубины t.
Исходя из уравнения 10.1 и 10.2, можно построить алгоритм
перестройки универсального ГДП (рис. 10.14).
Каждому набору из Р-вершин Р-графа уровня к можно
поставить в соответствие один кадр-меню на вершине уровня к-1,
являющегося директивным для упомянутых Р-вершин.
Предложенная операция дает возможность перестраивать граф,
уменьшая глубины вершин, реализующих конкретные процессы Ра
и тем самым сокращая длины траекторий, проходимых в ГДП в
процессе диалога.
Свойства симметрии рассматриваемых типов графов (Р-гра-
фов или равномощных) позволяют упростить алгоритм пере-
2 "^
S^i >ф{ >ф<
Рис. 10.14. Алгоритм перестройки универсального ГДП
420
стройки исходного универсального ГДП в ГДП с траекториями
меньшей длины.
Шаг 1. Используя ЮЛ или 10.2 (в зависимости от выбора типа
перестраиваемого ГДП для каждой вершины Р*), вычисляем
глубину t в формируемом ГДП.
Шаг 2. В соответствии с упорядоченностью процессов Р*
производим агрегирование вершин-процессов в группы и каждой
группе процессов глубины t: P/,P22,...,Рд поставим на уровне t — 1 в
соответствие меню S},S2,...,S„ в вершине-директиве этой группы
вершин.
Представляет интерес также задача построения по заданной
последовательности процессов такого ГДП, глубина которого
ограничена заданным числом m (т.е. максимальная длина от корневой до
терминальной вершины).
Пусть М —общее количество процессов. Рассмотрим сначала
случай Р-графа. Имеем m = [logpN] + 1. Поскольку Мит
считаются заданными, из этого соотношения находим
Для случая равномощного ГДП его характеристики РьРг, ..., Ра
находятся из уравнения
P1P2-...Po4<N<P1P2-...Pa.
Очевидно, что в последнем случае выбор {Ра} осуществляется
неоднозначно.
Вопросы для самопроверки
1. Каково содержание ДС?
2. Что такое граф диалоговых процедур (ГДП) в ДС?
3. Каковы математические основы модели ГДП?
4. Каковы свойства ГДП?
5. Что из себя представляет информационная модель диалоговой процедуры?
6. Отношение синонимии в интерактивных взаимодействиях?
7. Как осуществляется композиция моделей?
8. Структура композиционных моделей?
9. Лингвистика моделей диалоговых процедур?
10. Какими бывают адаптивные факторы диалоговых процедур?
11. Как осуществляется синтез универсального сценария?
12. Основы генерации адаптивного диалога?
421
Заключение
Поскольку одним из наиболее актуальных и важных
направлений современной науки является теория управления сложными
информационными системами, объединяющими в себе
технические, экономические, биокибернетические и
социально-организационные типы систем, то с учетом масштабности и сложности
задач создания и применения современных информационных
систем можно считать, что разработка методов, алгоритмов и
программных средств синтеза автоматизированных интеллектуальных
информационных систем и решение на их основе задач
управления, контроля, анализа данных, поиска, выбора, обучения и
принятия решений являются целым комплексом первостепенных
проблем, представляющих сферу исследований не одному поколению
ученых.
В последние годы в различных областях получили широкое
применение разнообразные интеллектуальные системы: поддержки
принятия решений, экспертные, обучающие, тренажерные и др.,
являющиеся в своей основе системами обработки знаний. Системы
обработки знаний (или основанные на знаниях) ориентированы,
прежде всего, на решение плохоформализуемых,
слабоструктурированных задач управления, свойственных человеку и
характеризующихся некоторой нечеткостью, неопределенностью,
противоречивостью поступающей информации, субъективизмом процесса
принятия решений.
С точки зрения информационных технологий
интеллектуальных систем на сегодняшний день наиболее распространенными
являются: экспертные системы, нейросетевые структуры, системы с
ассоциативной памятью и нечеткой логикой, системы с
параллельными технологиями вычислений и распределенных мультимодуль-
ных интеллектуальных систем.
Так как в последнее время созданию сложных программных
продуктов, имеющих длительный жизненный цикл и требующих
квалифицированного сопровождения, уделяется пристальное
внимание, возникает необходимость создания интеллектуальных
систем диалогового типа, обеспечивающих сопровождение
программных продуктов, в том числе когда оно носит проблемный
характер.
422
Другим направлением, интенсивно развивающимся сейчас,
является разработка и интеграция баз технических знаний в
комплексные системы проектирования, производство и контроль
технических объектов. Необходимо определение принципов
построения и основ функционирования интеллектуальных систем в
области сложных производственных технологий, без которых
затрудняется развитие систем автоматизированного проектирования
и производства (CAD/CAM System), а также комплексных систем
управления качеством.
Безусловно, наиболее перспективнейшим использованием
интеллектуальных информационных систем является разработка и
применение экспертных систем различного назначения. Дело в
том, что они могут быть использованы на всех основных стадиях
жизненного цикла объектов (процессов): проектировании,
производстве (изготовлении) и эксплуатации — и могут решать
практически весь комплекс задач, встречающихся на этих стадиях. Кроме
того, они могут быть применены в большинстве проблемных
областей человеческой сферы деятельности.
Подытоживая основные направления развития
интеллектуальных информационных систем, можно выделить ряд областей, в
которых существуют проблемы, требующие своего решения. На
стадии исследования и проработки находятся вопросы: адаптации,
создания интеллектуальных компонентов диагностики
деятельности предприятия, методов прогнозирования состояния объектов
управления, разработки гибридных моделей экспертных систем,
технологий извлечения знаний, определения закономерностей и
группировки информационных данных, интеллектуального
имитационного моделирования, создания новых методов
проектирования и эксплуатации информационных систем, интеллектуальных
человеко-машинных интерфейсов, создания нейрокомпьютеров и
нейроимитаторов для применения в информационных системах.
И наконец, повышение требований, предъявляемых к уровню
профессионализма выпускников высших учебных заведений в
области информационных технологий, рост трудоемкости обучения,
потребность в индивидуализации и интенсификации процесса
обучения приводят к необходимости и формированию системы
интеллектуальных умений в области практической информатики.
Таким образом, интеллектуальные информационные
системы — это динамически развивающаяся проблемная область
информатики, имеющая свою функциональную основу и прикладную
надстройку, которые в различной степени будут обновляться и
совершенствоваться.
423
СПИСОК ЛИТЕРАТУРЫ
1. Попов Э.В. Экспертные системы. — М.: Наука, 1987. — 283 с.
2. Хейес-Рот Ф., Уотерман Д. Ленат Д. Построение экспертных систем. — М.:
Мир, 1987.
3. Уотерман Д. Руководство по экспертным системам. — М.: Мир, 1989.
4. Стефанюк ВЛ. Некоторые аспекты теории экспертных систем//Известия АН
СССР. Техн. кибернетика. - 1987. - №2. - С. 85—91.
5. Форсайт Р. Экспертные системы. Принципы работы и примеры. — М.: Радио
и связь, 1987.
6. Поспелов ДА. Ситуационное управление: Теория и практика. — М.: Наука,
1986.
7. Элти Дж., Кумбс Н. Экспертные системы: концепции и примеры. — М.:
Финансы и статистика, 1987.
8. Искусственный интеллект: Справочник: В 3 т. — М.: Радио и связь, 1990.
9. Экспертные системы для персональных компьютеров: Справочное пособие.
Минск: Вышэйшая школа, 1990.
10. Таунсенд К., Фохт Д. Проектирование и программная реализация
экспертных систем на персональных ЭВМ. — М.: Финансы и статистика, 1990.
И. Нейлор К. Как построить свою экспертную систему. — М.: Энергоатомиздат,
1991.
12. Искусственный интеллект. Применение в интегрированных
производственных системах/Под ред. Э.Кьюсиака. — М.: Машиностроение, 1991. — 544 с.
13. Приобретение знаний/Под ред. С.Осуги, Ю.Саэки. — М.: Мир, 1990.
14. Представление и использование знаний/Под ред. Х.Уэно, М.Исидзука. — М.:
Мир, 1989.
15. Осуга С. Обработка знаний. — М.: Мир, 1989.
16. Хорошевский В.Ф. Автоматизация программирования экспертных систем:
Учеб. пособие. - М.: МИФИ, 1988.
17. Хорошевский В.Ф. Механизмы вывода решений в экспертных системах:
Учеб. пособие. - М.: МИФИ, 1988.
18. Рыбина Г.В. Технология проектирования прикладных экспертных систем:
Учеб. пособие. — М.: МИФИ, 1991.
19. Берестова В.И., Рыбина Г.В. Технология проектирования систем,
основанных на знаниях, на базе инструментальных средств ИНТЕР-ЭКСПЕРТ и
ЛЕОНАРДО: Лабораторный практикум. — М.: МИФИ, 1992.
20. Стефанюк В.А. Консультирующая экспертная система с локальной организа-
цией//Всесоюз. конф. по проблемам разработки и внедрения экспертных
систем. - М.: ВНИИНС, 1989. - С. 33-39.
21. Стефанюк В Л. Экспертные системы и их применение: Курс лек-
ций/САИИ-ИППИ АН СССР. — М.: НПО «Центрпрограммсистем», 1990.
22. Микулич Л.И. Промышленная технология создания систем, основанных на
знаниях: Курс лекций/САИИ-ИППИ АН СССР. — М.: НПО «Центрпрограммси-
стем», 1990.
23. Микулич Л.И. Промышленная технология создания систем, основанных на
знаниях//Материалы семинара «Экспертные системы на персональных
компьютерах». — М.: МДНТП им. Ф.ЭДзержинского, 1990. — С. 16—21.
424
24. Магазов С.С., Осипов Г.С. Типы предметных областей и модели знаний//Сб.
трудов «ИИ'89». Теория и применение искусственного интеллекта/Второй
международный научный семинар. (Болгария, Сазопол) — 1989. — Т. 2. — С. 225—228.
25. Осипов Г.С. Метод формирования и структурирования модели знаний для
одного типа предметных областей//Изв. АН СССР. Техн. кибернетика. — 1988. —
N° 2. - С. 3-12.
26. Scott А.С., Clayton I.E., Gibson EX. A Pratical Guide to Knowledge Acquisition/
Addision-Wesley Publishing Company. — Inc. 1991.
27. Молокова О.С. Программные системы приобретения знаний//Новости
искусственного интеллекта. — 1992. — № 4. — С. 6—45.
28. Гаврилова Т.А., Червинская К.Р. Извлечение и структурирование знаний для
экспертных систем. — М.: Радио и связь, 1992.
29. Берестова В.И., Рыбина Г.В. Анализ и выбор инструментальных средств
проектирования экспертных систем методом многокритериальной оптимизации для
интегрированных САПР//Тр. МДНТП им. Ф.Э. Дзержинского. — М, 1990. — С.
79-83.
30. Маслов СВ. Метод выбора инструментального средства для построения
экспертных систем//Материалы семинара «Экспертные системы. Базы знаний и
данных» МДНТП им. Ф.Э. Дзержинского. М., 1992. — С. 68—77.
31. Гринберг С.Я. Обзор средств построения экспертных систем. — Препринт. —
1993. (РосНИИ ИИ. ВЦ СО РАН, № 1).
32. Martin A. Law R.K.H. Expert system for selecting expert system shell//Information
and software technology. — 1988. — Vol. 3. — P. 579—586.
33. Beach S.S., Gavarter W. Standart for evaluting expert system tools//Expert
Systems with Applications. — 1991. — Vol. 2. — № 4. — P. 259—267.
34. Осипов Г.С. Информационные технологии, основанные на знаниях//Ново-
сти искусственного интеллекта//АИИ. — 1993. — № 1. — С. 7—41.
35. Заволович О.В., Рыбина Г.В. Средства автоматизации приобретения знания в
экспертных системах: классификация, современное состояние, сравнительный
анализу/Программные продукты и системы. Software & Systems. — Тверь, 1993. — N° 1. —
С. 54-58.
36. Белкин А.Р. Учет когнитивных и поведенческих особенностей
человека-эксперта при построении систем искусственного интеллекта//Программные процедуры
и системы. Software & Systems. — Тверь, 1993. — № 2. — С. 13—18.
37. Readings in Knowledge acquisition and learing-Edited by B.G.Buchanan &
D.C.Wilkins. Morgan Kaufmann Publishers, Inc. San Mateo, California, 1993.
38. Рыбина Г.В. Принципы создания автоматизированной технологии
проектирования интегрированных экспертных систем//Новости искусственного интеллек-
та/АИИ. - 1993. - № 4. - С. 105-116.
39. Хорошевский В.Ф. PIES-технология и инструментарий PIES WORK BENCH
для разработки систем, основанных на знаниях//Новости искусственного интеллек-
та/АИИ. - 1993. - N> 2. - С. 7-64.
40. Попов Э.В., Фоминых И.Б., Кисель Б.Б. Статические и динамические
экспертные системы (классификация, состояние, тенденции). Методический
материал. - М.: ЦРДЗ, 1995.
41. Попов Э.В. Экспертные системы реального времени//Экспертные системы
реального времени: Материалы семинара — М.: ЦРДЗ, 1995. — С. 5—22.
42. Попов Э.В. Искусственный интеллект-95. Состояние и тенденции//Динами-
ческие интеллектуальные системы в управлении и моделировании: Материалы
семинара. - М.: ЦРДЗ, 1996. - С. 5-14.
425
43. Рыбина Г.В. Проектирование систем, основанных на знаниях: Учеб.
пособие. - М.: МИФИ, 2000. - 104 с.
44. Микони СВ. Модели и базы знаний. Учебное пособие. — СПб.: СПГУПС,
2000. - 155 с.
45. Страбыкин Д.А. Логический вывод в системах обработки знаний. — СПб.:
СПГЭТУ, 1998. - 164 с.
46. Макетирование, проектирование и реализация диалоговых информационных
систем/Под ред. Е.И. Ломако/Л.И. Гуков, Е.И. Ломако, АВ. Морозова и др. — М.:
Финансы и статистика, 1993. — 320 с.
47. Вопросы формализации и интеллектуализации процессов проектирования в
машиностроении/Под ред. Р.И. Солыпщева и ЕЛ. Соложенцева. —
Препринт. - СПб.; 1992. - 48 с. (ИПМАШ РАН, № 66).
48. Рыков А.С. Методы системного анализа: многокритериальная и нечеткая
оптимизация, моделирование и экспертные оценки. — М.: Изд-во «Экономика», 1999.
- 191 с.
49. Рыков АС Методы системного анализа: оптимизация. — М.: Изд-во
¦Экономика», 1999. — 255 с.
50. Лорьер Ж. — Л. Системы искусственного интеллекта. — М.: Мир,
1991.-568 с.
51. Искусственный интеллект: применение в химии/Д.Смит, Ч. Риз, Дж.Стюарт
и др. Под ред. Т. Пирса. — М.: Мир, 1998. — 430 с.
52. Финн В.К. Философские проблемы логики интеллектуальных систем//Ново-
сти ИИ/ЦНИИЭуголь - 1999. - № 1.
53. Гаврилова Т.А. Состояние и перспективы разработки баз знаний
интеллектуальных систем//Новости ИИ. — М.: ЦНИИЭуголь. — 1996. — JNfe 1.
54. Поспелов Д.А. Логико-лингвистические модели в системах
управления. — М.: Энергоиздат, 1981.
55. Горский Д.П. Вопросы абстракции и образования понятий. — М.: Изд-во АН
СССР, 1961.
56. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. —
Новосибирск: Изд-во института математики, 1999.
57. Шрейдер ЮЛ., Шаров А.А Системы и модели. — М.: Радио и связь,
1982. - 152 с.
58. Микони СВ. Общие диагностические базы знаний вычислительных
систем. - СПб.: СПИИРАН, 1992.
59. Микони СВ. Методы и алгоритмы принятия решений: Учеб.
пособие. - СПб.: ПГУПС, 1995. - Ч. 1.
60. Нильсон Н. Искусственный интеллект. Методы поиска решений. — М.:
Мир, 1973.
61. Курейчик В.М. Методы генетического поиска: Учеб. пособие. — Таганрог:
ТГРУ, 1998. - Ч. 1.
62. Логический подход к искусственному интеллекту. — М.: Мир, 1990.
63. Ларичев О.И. Теория и методы принятия решений. — М.: Логос, 2000.
64. Микони СВ., Баушев АН. Методы и алгоритмы принятия решений: Учеб.
пособие. - СПб.: ПГУПС, 1996. - Ч. 2.
65. Прикладные нечеткие системы. — М.: Мир, 1993.
66. Кириллов В.И., Старченко АА Логика. — М.: Высшая школа, 1982.
67. Кулик Б.А Логические основы здравого смысла. — СПб.: Политехника,
1997.
426
68. Вагин В.Н. Дедукция и обобщение в системах принятия решений. — М.:
Наука, 1988.
69. Осипов Г.С. Приобретение знаний интеллектуальными системами. — М.:
Наука, 1997.
70. Осипов Г.С, Куршев Е.П., Комаров СИ. Интеллектуальная технология для
построения экспертных систем: Учеб. пособие. — Рыбинск: РГАТА, 1997. — Ч. 1,2.
71. Блинов А.Н., Воронов М.В. Разработка экспертных систем в
инструментальной среде: Учеб. пособие. — СПб.: СПГУТД, 1998.
72. Микоян СВ. Взаимодействие базы знаний и системы выбора//Докл. конф.
«Интеллектуальное управление». — Переславль-Залесский: ИПС РАН, 1999.
73. Поспелов Д.А. Моделирование рассуждений. — М.: Радио и связь, 1989.
74. Ковальски Р. Логика в решении проблем. — М.: Наука, 1990. — 290 с.
75. Цалепко М.Ш. Моделирование семантики в базах данных. — М.: Наука,
1989. - 287 с.
76. Малнас Дж. Реляционный язык и его применение. — М.: Наука, 1990. — 464 с.
77. Геловани В.А., Ковригин О.В. Экспертные системы в медицине. — М.:
Знание, 1987. — 32 с.
78. Жигалов ВА. Об опыте разработки системы построения ЕЯ — интерфейсов
к базам данных//Тр. междунар. семинара «Диалог'98 по компьютерной лингвистике
и ее приложениям». — Казань, 1998. — С. 801—808.
79. Жигалов В.А, Романов Л.Г. Система построения естественно-языковых
интерфейсов к реляционным базам данных//Вестник МГТУ. — 1999. — С. 71—79.
80. Чепайкин А.О. Использование нечеткой логики в описании предметной об-
ласти//Вычислительные машины, комплексы и сети: Межвузовский сборник
научных трудов. — Рязань. — РГРТА, 1998. — С. 136—140.
81. Чепайкин А.О. Семантическая сеть-модель представления знаний//Управле-
ние образовательным процессом в высших учебных заведениях: Межвузовский
сборник научных трудов. — Рязань, 1997. — С. 25—28.
82. Архипова Н.В., Добряков А.А., Оразбеков Б.П. Методы интеллектуализации
поисковых процедур/уТехника. Экономика. Сер. Автоматизация проектирова-
ния/Всерос. науч.-исслед. ин-т межотраслевой информации. — 1994. — Вып.4. — С.
29-38.
83. Добряков АА. Методы интеллектуализации САПР. — М.: Наука, 1992. — 287 с.
84. Заде Л.А. Понятие лингвистической переменной, его применение к
принятию приближенных решений. — М.: Мир, 1976. — 77 с.
85. Кофман А. Введение в теорию нечетких множеств. — М.: Радио и связь,
1982. - 324 с.
86. Вентцель Е.С Исследование операций. — М.: Наука, 1980. — 155 с.
87. Емельянов СВ., Ларичев О.И. Многокритериальные методы принятия
решений. — М.: Знание, 1985. — 245 с.
88. Гаспарский В.Т. Праксеологический анализ проектно-конструкторских
разработок. — М.: Мир, 1988. — 170 с.
89. Белинский С.Г., Вдовичев СВ., Рения Г.И. Среда проектирования и
моделирования систем автоматического управления и поддержки принятия решений в
среде MatLab//Te3. докл. межвуз. НТК «Микроэлектроника и информатика-98». — М.,
1998. - Ч. 2. - С. 10.
90. Крнницкий Н.А. О проблеме интеллектуального автоматизированного про-
граммирования/ДТрограммирование. — 1986. — № 5. — С. 3.
427
91. Криницкий НЛ-, Федотова Р.Э., Кринипкий В.Н. Интеллектуальная
автоматизированная система поддержки принятия решений//Программирование. —1992.
- >fe 6. - С. 3-12.
92. Федунец Н.И., Фомичева О.Е. Технология объектно-ориентированного
программирования в проектировании интеллектуальной системы поддержки диспетче-
ра//Программные продукты и системы. — 1994. — № 3. — С. 36—40.
93. Хетагуров ЯЛ. Проблема определения рационального уровня
интеллектуализации автоматизированных систем управления//Судостроительная
промышленность. Сер. Вычислительная техника. — 1991. — Вып. 29. — С. 3—7.
94. Поспелов ДА. Введение в теорию вычислительных систем. — М: Сов. радио,
1972. - 280 с.
95. Варшавский В.И., Поспелов Д.А. Оркестр играет без дирижера. — М.: Наука,
1984. - 208 с.
96. Nflsson N. Probalistic logic//Artitf.InteU. - 1986. - vol. - 28. № 1. - P. 71-87 с.
97. Волкова Г.Д. Концептуальное моделирование при создании САПР
машиностроительного назначения//Техника. Экономика. Сер. Автоматизация
проектирования/Всероссийский НИИ межотраслевой информации. — 1994. — Вып. 4. —
С. 6-15.
98. Соломинцев Ю.М. Конструкторско-технологическая информатика и
автоматизация производства. — М.: Станкин, 1992. — 127 с.
99. Meder N. Artifical Intellegence as a Tool of classification, on Network of
Language Games as Cognitive Paradigm//Inf. Classif,12. —1985. — № 3. — P. 128—132.
100. Воронин ЮЛ. Теория классифицирования и ее приложения. —
Новосибирск: Наука, 1985. — 231 с.
101. Клиффорд JI., Престон Г. Алгебраическая теория полугрупп. Т. 1. — М.:
Мир, 1982. - 360 с.
102. Фейс К. Алгебра: кольца, модули и категории. Т. 1. — М: Мир, 1977. — 688 с.
103. Бурбаки И. Теория множества. — М.: Мир, 1968. — 455 с.
104. Свами М., Тхуласираман К. Графы, сети и алгоритмы. — М.: Мир, 1984. —
455 с.
105. Майника Э. Алгоритмы оптимизации на сетях и графах. — М.: Мир,
1981.-307 с.
106. Карповский Е.Я. Надежность специального математического обеспечения
управления. — Киев.: Вища школа, 1982. — 152 с.
.107. Араксян В.В. Алгоритмическая структуризация диалоговых систем
принятия решений//Изв. АН СССР. Техн. кибернетика. — 1984. — № 3. — С. 136—140.
108. Араксян В.В. О топологических обобщениях графа диалоговых процес-
сов//Изв.АН СССР. Техн. кибернетика. - 1985. - № 1. - С. 144-146.
109. Араксян В.В. Алгоритм декомпозиции вероятностного графа диалоговых
процедур//Изв. АН СССР. Техн. кибернетика. — 1986. — № 2. — С. 209—213.
110. Араксян В.В., Горский Л.К. Оценка алгоритмов разложения графов
диалоговых процедур по алгебраическим операциям//Архитектура и проектирование
вычислительных систем. — Рига: РПИ. — 1984. — С. 151—159.
111. Араксян В.В. Модель реализации диалоговых процедур в интерактивных
системах //Изв. АН СССР. Техн. кибернетика. — 1987. — № 5. — С. 19—28.
112. Араксян В.В. О некоторых свойствах директивных графов диалоговых про-
цедур//Изв. АН СССР. Техн. кибернетика. — 1987.— № 2. — С. 99—102.
113. Довгялло А.М. Диалог пользователя и ЭВМ и место средств искусственного
интеллекта в его реализации//Кибернетика. — 1979. — № 2. — С. 102—109.
428
114. Гаскаров В.Д. Диалоговые процедуры в системах упреждающего контроля и
управления//Информационные работы на транспорте.: Сб. науч. тр. — СПб.:
СПГУВК, 1996. - С. 248-258.
115. Араксян В.В., Гаскаров Д.В. Диалоговые системы в решении задач водного
транспорта. — Л.: Изд-во ЛИВТа, 1985. — 36 с.
116. Надежность и эффективность в технике: Справочник. Т. 9. Техническая
диагностика/Под ред. В.В. Клюева, П.П. Пархоменко. — М.: Машиностроение,
1987. - 352 с.
117. Розова С.С. Классификационная проблема в современной науке. —
Новосибирск: Наука, 1986. — 223 с.
118. Средства интеллектуализации кибернетических систем. Сб. научн. тр./Ин-т
кибернетики им. В.М. Глушкова. АН УССР. — Киев, 1989. — 115 с.
119. Логический подход к искусственному интеллекту: от классической логики к
логическому программированию/АТейз, П.Грибомон, Ж.Лун и др.; Пер. с
франц. — М.: Мир, 1990.
120. Вагин В.Н., Луцкий К.В. Абдуктивный вывод в системах принятия реше-
ний//Сб. научн. тр. национальной конференции с междунар. участием
«Искусственный интеллект-94». — Рыбинск, 1994. — Т. 4.
121. Ершов ЮЛ., Памотин ЕЛ. Математическая логика. — М.: Наука, 1987.
122. Стерлинг Л., Шапиро Э. Искусство программирования на языке Пролог:
Пер. с англ. — М.: Мир, 1990.
123. Малпас Дж. Реляционный язык Пролог и его применение: Пер. с англ./Под
ред. В.Н. Соболева. — М.: Наука, 1990.
124. Хант Э. Искусственный интеллект: Пер. с англ. — М.: Мир, 1978.
125. Гаврилова ТА., Хорошевский В.Ф. Базы знаний интеллектуальных
систем. — СПб.: Питер, 2000. — 348 с.
ОГЛАВЛЕНИЕ
Предисловие 3
Введение 5
Глава 1. Интеллектуализация информационно-вычислительных процессов 8
1.1. Определения и классификации в теории интеллектуализированных
систем 8
1.2. Проблемная область искусственного интеллекта 1 6
1.3. Представление данных и знаний 24
1.4. Данные 28
1.5. Знания 39
Вопросы для самопроверки 44
Глава 2. Методы формализации знаний о предметной области 45
2.1. Понятийная структура предметной области 45
2.2. Формализованное представление базы знаний 64
2.3. Процедурные модели представления знаний 75
2.4. Приобретение знаний 87
Вопросы для самопроверки 108
Глава 3. Методы устранения неопределенностей и пополнения знаний 109
3.1. Методы работы с нечеткими знаниями 109
3.2. Пополнение знаний 124
3.3. Методы логического вывода пополнения знаний 137
3.4. Обобщение и классификация знаний 147
Вопросы для самопроверки 164
Глава 4. Задачи компьютерной логики и компьютерной лингвистики (проблема
общения) 165
4.1. Уровни понимания 166
4.2. Понимание текстов на естественном языке 171
4.3. Построение естественно-языковых интерфейсов 179
4.4. Когнитивная компьютерная графика 204
Вопросы для самопроверки 2 09
Глава 5. Интеллектуализация процедур поиска, управления и контроля
(восприятие информации и модели обучения) 210
5.1. Интеллектуализация поисковых процедур 210
5.2. Методы интеллектуальных технологий в управлении техническими
системами 234
5.3. Интеллектуализация систем поддержки принятия решений 245
5.4. Технологические процессы объектно-ориентированного
программирования в проектировании интеллектуальной системы поддержки
управления 259
5.5. Распознавание образов и анализ изображений 266
5.6. Восприятие и обработка информации 272
430
Вопросы для самопроверки 276
Глава 6. Искусственный интеллект и экспертные системы 278
6.1. Назначение и особенности экспертных систем 279
6.2. Структура и режимы экспертной системы 281
6.3. Классификация экспертных систем 285
Вопросы для самопроверки 294
Глава 7. Построение экспертной системы 296
7.1. Технология разработки экспертной системы 296
7.2. Представление знаний. Достижение цели 311
7.3. Продукционные экспертные системы 318
Вопросы для самопроверки 334
Глава 8. Интеллектуализация процедур выбора в экспертных системах
прогнозирования 335
8.1. Содержательное описание процедурной модели прогнозирования ... 335
8.2. Описание предметной области при выборе моделей прогнозирования 339
8.3. Продукционные модели в АСП 346
8.4. Представление знаний и концептуальное моделирование при
автоматизации процесса выбора моделей в АСП 353
Вопросы для самопроверки 368
Глава 9. Диалоговые системы как средство интеллектуализации информационно-
вычислительных комплексов 369
9.1. Классификация диалоговых систем 369
9.2. Языки описания диалоговых систем 375
9.3. Структура информационных моделей диалоговых систем 378
9.4. Функциональная специализация диалоговых систем 380
Вопросы для самопроверки 387
Глава 10. Содержание диалоговых процедур 388
10.1. Графовая модель диалоговых процедур 388
10.2. Определение графа диалоговых процедур 391
10.3. Информационные модели диалоговых процедур 401
10.4. Адаптивный фактор диалоговых процедур 413
Вопросы для самопроверки 421
Заключение 422
Список литературы 424