/
Текст
НОВОЕ В ЗАРУБЕЖНОЙ
ЛИНГВИСТИКЕ
ВЫПУСК XII
прикладная лингвистика
Составление В. А. ЗВЕГИНЦЕВА
Переводы с английского языка
под редакцией и с предисловием
Б. Ю. ГОРОДЕЦКОГО
МОСКВА
«РАДУГА»
1983
Рецензенты: доктор технических наук проф. Г. Г. БЕЛОНОГОВ,
доктор филологических наук проф. Э. Ф. СКОРОХОДЬКО.
доктор филологических наук | Б. В. ЯКУШИН I
Редактор издания М. А. Оборина
Статьи сборника посвящены наиболее актуальным проблемам
прикладной лингвистики, связанным с оптимизацией общения
человека и машины. Ведущие зарубежные специалисты знакомят
читателя с результатами теоретических и экспериментальных
исследований в области моделирования процессов понимания и построения
текста на естественном языке.
Книга адресована лингвистам разных профилей, а также всем
специалистам, которые интересуются лингвистическими аспектами
создания систем класса «искусственный интеллект».
© Составление, перевод на русский язык, вступительная статья,
издательство «Радуга», 1983
Н 0300?Ôl7-83 |7,МВ 4602000000
АКТУАЛЬНЫЕ ПРОБЛЕМЫ
ПРИКЛАДНОЙ ЛИНГВИСТИКИ
I.
История научного исследования языка являет собой
сложнейший процесс разнонаправленных исканий. Если в
основу их систематизации положить принцип конечной цели,
то мы обнаружим, что в языкознании, по существу, всегда
(в качестве тенденций) наличествовали три глобальных
исследовательских направления: теоретическое,
описательное и прикладное. Все три приводят к получению знаний
об одном и том же объекте (языковых системах и процессах),
но создаваемые при этом модели имеют различный статус.
Теоретическое моделирование направлено на объяснение
языковых систем и процессов, описательное — на их
конкретное описание, прикладное — на их
совершенствование. "Системы и процессы" здесь понимаются широко: они
охватывают в своей совокупности все физические и
интеллектуальные ресурсы (отдельных индивидов и общества в
целом), обеспечивающие возможность использования языка
в разнообразных сферах социальной деятельности,
ориентированных (в той или иной степени) на естественный
язык.
Указанные направления получают всё более
определенное развитие в современной лингвистике, что совершенно
необходимо иметь в виду для четкой постановки целей и
адекватной оценки результатов каждого конкретного
исследования, для упорядочения всего свода лингвистических
знаний, для успешного внедрения научных. результатов в
практику. Вместе с тем различение этих направлений не
означает их изоляции. Наоборот, правильнее, в идеале,
говорить о триединой направленности всей лингвистики.
Более того, в составе собственно прикладного исследования
5
всегда присутствуют элементы теоретического. И жизнь
требует углублять процесс органического соединения
фундаментальных (теоретических и описательных)
исследований с прикладными. Вторые при этом оказывают влияние
на первые путем постановки новых актуальных проблем.
Роль теоретической лингвистики для описательной и
прикладной вытекает из общефилософского "метода
восхождения от абстрактного к конкретному"1.
Все большее число ученых задумывается над сущностью
того разрыва, который сегодня всё еще имеет место между
прикладной и "чистой" лингвистикой. Дискуссии на эту
тему отражены и в материалах 5-го Международного
конгресса по прикладной лингвистике. Наиболее полную и во
многом убедительную, на наш взгляд, характеристику
понятия "прикладной лингвистики" представил на этом
конгрессе Р. Бугарский. В его докладе "Некоторые замечания
о структуре и приложениях лингвистики" 2 основные
подходы к толкованию указанного понятия распределяются
по двум классам в зависимости от того, в каком смысле
употребляется термин,— прагматическом или теоретическом.
На прагматическом уровне прикладная лингвистика,
будучи отражением социальных потребностей, охватывает
широкое поле совместной деятельности представителей
различных наук, занятых решением чрезвычайно важных
(но при этом весьма разнородных) практических задач.
Попытки же определить прикладную лингвистику на
теоретическом уровне, то есть как научную дисциплину,
имеющую свой предмет и находящуюся в определенном
отношении к лингвистике в целом, наталкиваются на ряд
трудностей. Прикладная лингвистика не имеет ни особого объекта,
ни особых методов исследования и не может считаться
отдельной дисциплиной, составляющей часть лингвистики.
По мнению автора, следует говорить об общей прикладной
ориентации всей лингвистики — ориентации на решение
внешних задач. Такая направленность подтверждается всей
историей языкознания, и можно не без основания
утверждать, что по мере развития нашей науки первый компонент
1 Mаркс К. Введение (из экономических рукописей 1857—1858
годов).— К. Маркс и Ф. Энгельс. Сочинения, изд. 2-е, т. 12,
с. 727.
2 В кн.: "Models of Crammar, Descriptive Linguistics and Pedagogical
Grammar". Papers from the 5th International Congress of Applied
Linguistics. Montreal (1978), Heidelberg, 1980,
6
термина "прикладная лингвистика" будет становиться все
более и более избыточным.
Таким образом, прикладная лингвистика в
определенном смысле существовала всегда, но, конечно, разные
моменты развития разных обществ выделяли различные
практические функции языка, различные стороны языковой
способности, подлежащие усилению, совершенствованию.
Исследовательское пространство, покрываемое термином
"прикладная лингвистика", сегодня необычайно широко.
О пестроте ее проблематики можно судить хотя бы по
докладам, представляемым на международные конгрессы
по прикладной лингвистике, а также по программам
деятельности национальных центров прикладной лингвистики
или соответствующих подразделений в академиях наук и
университетах. Она включает, по существу, любые
практические задачи, требующие лингвистических знаний:
начиная с такого классического предначертания лингвистики,
как обучение родному или иностранному языку, и кончая
автоматизацией процессов управления.
Но это не просто задачи, а научно-практические области
с соответствующими теоретическими основами. К числу
наиболее интенсивно развивающихся таких областей
относятся: лингводидактика, лексикография, практическая
стилистика, теория перевода, терминоведение, теория
искусственных языков, прикладная риторика, теория массовой
коммуникации, текстология, нормирование языка и
языковое планирование, полевая лингвистика, теория
письменности, методы лечения речевых расстройств и другие.
Особо следует выделить ту область прикладной лингвистики,
само возникновение которой составляет примечательную
черту именно современного этапа в развитии
языкознания,— это автоматическая обработка речевой информации
(в ее письменной или устной форме).
Данный сборник, весьма скромный по своему объему,
не стремится быть представительным в плане иллюстрации
различных применений лингвистики. Его статьи
ориентированы прежде всего на новейшие приложения, подводимые
под общую формулу "оптимизация общения в системе
человек — машина — человек". Однако это видимое сужение
тематики на деле оборачивается выигрышем в широте
постановки таких теоретических проблем, которые
представляют несомненный интерес, если не для всех, то для
7
большинства других приложений лингвистики. И это
естественно: "общение" с машиной, обучение её выполнению
некоторых функций человеческого интеллекта
предъявляют особые требования к лингвистической теории.
Именно в данной исследовательской ситуации получает
мощный импульс для своего развития тот подход к описанию
языка, который теоретически провозглашался многими
видными языковедами, а именно подход к языку не как к
мертвому продукту, а как к деятельности. Механизмы и
процессы этой деятельности должны получить строгое
(формальное) описание в виде таких структур, которые
„встроены" в целостную операционную систему, выполняющую
заданную функцию. Выделенную часть прикладной
лингвистики можно приближенно назвать "структурной и
прикладной лингвистикой" (термин, утвердившийся в нашей
стране) или "вычислительной лингвистикой" (термин,
имеющий международное хождение: раз в два года проводятся
одноименные конференции, очередная из которых
состоялась в 1982 г. в Праге) г.
Теоретическая новизна данного подхода заключается
в том, что вычислительная лингвистика стремится строить
модели, которые, во-первых, непосредственно воплощают
диалектическое единство знаменитых трех аспектов
языковых явлений — языковой системы, речевой деятельности и
языкового материала 2 — и, во-вторых, отображают
конкретные процессы речемыслительной деятельности индивида
в конкретной жизненной ситуации.
Диапазон настоящего сборника можно уточнять и
дальше: поскольку главные проблемы общения машины и
человека связаны с трудностями семантического характера,
то наибольшее внимание ученых привлекает
вычислительная семантика (что отражает и состав
настоящего сборника). Именно так называется коллективная
монография, вышедшая в 1976 г. и переизданная в 1978 г.,
из которой пять глав в виде статей вошли и в настоящий
сборник (см. статьи Ю. Чарняка, Й. Уилкса, Г. Скрэгга).
Этой области в обязательном порядке посвящаются отдель-
* Ср. также название журнала: "American Journal of Computational
Linguistics".
2 Щерба Л.В. О трояком аспекте языковых явлений и об
эксперименте в языкознании.— В кн.: Л. В. Щерба, Языковая система и
речевая деятельность, Л., 1974, с. 24—26,
8
ные главы в монографиях по искусственному интеллекту 1.
Проблемы вычислительной семантики, имеющие в
конечном счете большое народнохозяйственное значение, в
настоящее время активно исследуются советскими
учеными 2. Каковы же теоретические предпосылки прикладной
лингвистики, рассматриваемой в указанном аспекте?
Каковы те общие рамки, которые должны помочь осмыслению
роли и места каждого отдельного результата, получаемого
в данной области?
Самая общая проблема вычислительной семантики —
формальное моделирование семантической способности
человека. Частные проблемы связаны с моделированием
отдельных аспектов этой способности. В собственно
прикладном плане речь идет о построении
автоматизированных систем обработки текста —
АСОТ. Такие системы моделируют способность человека
понимать текст (это анализ текста), строить текст,
выражающий данный смысл (это синтез текста), а также хранить и
перерабатывать информацию на некоторых внутренних
промежуточных семантических метаязыках (языках
представления знаний). Да и анализ и синтез сводятся, по
существу, к перезаписи информации на некоторых
метаязыках. Поэтому можно считать, что две важнейшие проблемы
вычислительной семантики — это разработка
семантических алгоритмов и семантических
метаязыков. Из алгоритмов наибольшее
практическое значение имеют алгоритмы анализа (модели
понимания). Недаром системы типа АСОТ в теории искусст-
1 См., например, переведенные на русский язык: Xант Э.
Искусственный интеллект. М., 1978; Уинстон П. Искусственный
интеллект. М., 1980; Рафаэл Б. Думающий компьютер. М., 1979; ср.
также тематику статей в журнале "Artificial Intelligence".
2 См. СкороходькоЭ. Ф. Лингвистические проблемы
обработки текстов в автоматизированных ИПС.— "Вопросы
информационной теории и практики", № 25. М., 1974; БелоноговГ. Г.,
Новоселов А. П. Автоматизация процессов накопления, поиска и
обобщения информации. М., 1979; Поспелов Д. А.
Логико-лингвистические модели в системах управления. М., 1981; Ершов А. П.
Методологические предпосылки продуктивного диалога с ЭВМ на
естественном языке.— "Вопросы философии", №8, 1981; сборники
"Представление знаний и моделирование процессов понимания". Новосибирск,
1980; "Логико-семантические вопросы искусственного интеллекта".
Тарту, 1980; "Вычислительная лингвистика". М., 1976;
"Современное состояние теории и практики машинного перевода и
автоматизации информационных процессов". М., 1977; Попов Э. В. Общение
с ЭВМ на естественном языке. М., 1982.
9
венного интеллекта часто именуются "системами понимания
естественного языка". Ю. Чарняк (см. настоящий сборник)
начинает свою статью указанием на то, что с точки зрения
вычислительной семантики «язык — это то, как он
действует», и говорить о понимании безотносительно к какой-
либо практической задаче бессмысленно. Знаменательно,
что еще Л. В. Щерба придавал особое значение "громадной
и мало исследованной проблеме понимания" 1.
Через посредство различных типов АСОТ лингвистика
оказывается существенным компонентом
научно-технической революции в нашей стране и непосредственно
участвует в рационализации трудовой деятельности человека.
«Ведь создание и обслуживание ЭВМ, без которых
немыслимо современное производство, требуют решения также
экономических, психологических, логических и
лингвистических задач... Построение искусственных языков,
систематизация терминов и символов, создание систем
моделирования — новая область лингвистики — науки, практическое
применение которой прежде ограничивалось вопросами
обучения человека родному или иностранному языку,
перевода с одного языка на другой, имевшими лишь отдаленную
связь с непосредственным производственным процессом» 2.
Здесь уместно пояснить понятие
"совершенствования" (применительно к языковым системам и
процессам), о котором говорилось при определении прикладной
лингвистики. Именно такая направленность прикладной
лингвистики соответствует общей тенденции развития науки
и техники. К. Маркс писал: «Впоследствии естествознание
включит в себя науку о человеке в такой же мере, в какой
наука о человеке включит в себя естествознание: это будет
одна наука» 3. Одновременно К. Маркс указал на
необходимость рассматривать и технику в связи с самой сущностью
человека, историю техники — как историю проявления
действующих "человеческих сущностных сил" 4.
Актуальность этого научного предвидения для лингвистики ясна
из того факта, что язык (и особенно его содержательная
сторона) составляет один из важнейших специфических аспек-
1 Щерба Л. В. О трояком аспекте..., с. 26.
2 Укреплять взаимосвязь общественных, естественных и
технических наук.— "Коммунист", № 1, 1977, с. 61.
3 Маркс К. Экономическо-философские рукописи 1844 года.—
Маркс К- и Энгельс Ф. Из ранних произведений. М., 1956, с. 596.
4 Там же, с. 595—596,
IO
tob человека. Следовательно, и эта функция человеческого
интеллекта должна подвергнуться совершенствованию с
применением технических средств и приемов. Как писал
К. Маркс, машины по сути представляют собой "созданные
человеческой рукой органы человеческого мозга",
"овеществленную силу знания", овеществленную науку х. Процесс
производства будущего характеризуется как
"экспериментальная наука, материально-творческая и
предметно-воплощающаяся наука" 2. Таким образом, и прикладная
лингвистика должна внести свой вклад в совершенствование
процессов пользования языком в различных материально-
соци альных системах.
Вычислительная лингвистическая система (АСОТ)
может работать в автономном режиме или входить в надсис-
тему, решающую те или иные задачи управления и
интеллектуального моделирования. Это могут быть такие типы
задач, как: общегосударственное управление и
планирование, научно-техническая, социально-политическая,
патентно-лицензионная, правовая информация,
классификация изданий и автоматическое библиотечное обслуживание,
машинный перевод, ведение систем стандартов и
кодирование информации, учет и проверка исполнения решений на
отраслевом и низших уровнях управления,
прогнозирование и оптимизация решений, информационное обеспечение
проектирования, управление роботом, диалог ЭВМ с
пользователями и многие другие. С чисто лингвистической
точки зрения процессы, осуществляемые в машине при решении
всех упомянутых задач, сводятся к перезаписи информации
на тех или иных (естественных и искусственных) языках,
каково бы ни было разнообразие входных текстов (статьи,
отчеты, рефераты, заголовки, приказы, резолюции,
стандарты, анкеты, каталоги изданий, законодательные акты,
запросы, команды, условия задач, описания ситуаций
и т. д.). Прикладная семантика и призвана способствовать
существенному улучшению параметров и повышению
эффективности всех систем, использующих естественный
язык 3.
1 Mаркс К. [Из неопубликованных рукописей К. Маркса].—
"Большевик", 1939, №№ 11—12, с. 63.
2 Там же, с. 65.
3 В последние годы по данной проблематике в нашей стране был
проведен целый ряд всесоюзных и международных конференций. См.,
например: "Труды IV Международной объединенной конференции по
11
В рамках вычислительной семантики получают новую
интерпретацию многие традиционные проблемы
лингвистической семантики (о чем наглядно свидетельствуют материалы
настоящего сборника — см. Предметный указатель). Под
воздействием требований прикладного моделирования в
лингвистической семантике проявляются следующие
существенные тенденции: расширение круга
объясняемых языковых фактов; включение семантики в состав
общей теории языка; трактовка семантики как
центрального звена в системе лингвистических дисциплин; введение
экспериментальных критериев истинности; повышенное
внимание к семантическим отношениям; формальное
моделирование семантических явлений; разработка семантических
метаязыков для представления содержания текста;
признание нескольких уровней глубины семантического
представления; разработка разнообразных типов семантических
словарей; исследование не только семантической структуры
языка, но и семантических процессов речевой деятельности;
установление связей между лингвистической и
экстралингвистической семантикой.
Термин "семантика" (в разных осмыслениях)
используется сегодня в целом ряде смежных с лингвистикой наук.
Среди них можно назвать: философию, логику, психологию,
социологию, антропологию, эстетику, историю культуры,
литературоведение, теорию связи, теорию и практику
искусственного интеллекта, психиатрию, терминоведение
отдельных наук и другие. Иногда употребляется термин,
объединяющий этот комплекс дисциплин, интересующихся
организацией человеческого знания,— "когнитивные науки"1.
Участие в таком сотрудничестве (а прикладные задачи
заставляют это делать все чаще и чаще) коренным образом
меняет облик лингвистики.
Несмотря на молодость вычислительной семантики, она
уже пережила несколько поколений систем (см. об этом
статьи Й. Уилкса, Р. Шенка) и дает основания для
обобщений и выводов на будущее (именно таков характер на-
искусственному интеллекту", тт. 1—10 и "Дополнительные материалы".
М., 1975; "Международный семинар по машинному переводу". Тезисы
докладов. М., 1979; "Семантика естественных и искусственных языков
в специализированных системах". Л., 1979; Тезисы докладов
"Диалоговые и фактографические системы информационного обеспечения". М.,
1981; "Семантические вопросы искусственного интеллекта". Киев, 1978.
1 См., например, журнал "Cognitive Science",
12
стоящего сборника). Попытаемся сформулировать наиболее
существенные, на наш взгляд, идеи, вытекающие из опыта
отечественных и зарубежных работ в этой области (а при
широком подходе такой опыт охватывает и ранние
исследования по машинному переводу, и разработки по
созданию простейших информационно-поисковых систем)1.
Прежде всего стало очевидным существование
различных видов понимания языкового сообщения.
В настоящее время мы можем говорить лишь о некоторых
предпосылках будущей типологии понимания. Исходный
вопрос такой типологии сводится к следующему: какие
факторы и в какой мере задействованы в процессе
понимания? Человек использует два основных класса когнитивных
средств: собственно языковые и прагматические. Первый
класс — это знания, закрепленные в семантике языка,
а второй — это цели, направляющие использование вне-
языковых знаний в сочетании с языковыми. Упомянутая
многофакторность понимания и его
активность составляют фундаментальные свойства
рассматриваемого процесса.
Прагматические факторы понимания
охватывают место и роль текста в составе интеллектуальной
и практической деятельности, включающей данную речевую
ситуацию. Та или иная экстралингвистическая задача
заставляет человека руководствоваться при понимании
текста определенной целеустановкой. Основные виды
целеустановок: определить тему текста, ознакомиться с новыми
фактами, установить связь фактов, понять мнение автора
текста о сообщаемом, выработать решение о практических
действиях, получить эстетическое наслаждение, определить
смысловую близость данного сообщения и некоторого дру-
1 См., Звегинцев В. А. Проблема "искусственного интеллекта"
с точки зрения лингвистики.— "Вопросы философии", № 3, 1979;
Звегинцев В. А. Язык и знание.—"Вопросы философии", № 1, 1982;
Леонтьева H. Н. Семантика связного текста и единицы
информационного поиска.— "Научно-техническая информация", серия 2, № 1, 1981;
Белецкий М. И. Об информационно-логическом языке для
проектирования автоматизированных систем обработки данных.— "Научно-
техническая информация", серия 2, № 3, 1979; Перцова H.H.
Автоматические системы типа "вопрос — ответ", работающие с естественным
языком: история, современное состояние, перспективы.— "Прикладная
лингвистика", вып. 18. М., 1976; Городецкий Б. Ю.
Семантические проблемы построения автоматизированных систем обработки
текстовой информации.— "Вычислительная лингвистика", М., 1976.
13
гого текста, найти нужный класс сведений, вывести
некоторое множество умозаключений, свернуть сообщение,
перифразировать текст, задать по нему вопросы, ответить на
вопросы по данному тексту, предсказать его продолжение,
перевести его на другой язык. Возможна, следовательно,
разная степень точности/приблизительности понимания.
Разной бывает и оценка слушающим того внеречевого акта,
который стремится осуществить посредством данного текста
говорящий. Понимание текста оказывается связанным с
такими сторонами человеческого интеллекта, как память,
целеполагание, планирование деятельности, эвристики
и т. д.
Другой круг идей вычислительной семантики касается
выбора тех или иных альтернативных средств описания.
Здесь стала ясна необходимость четко различать в
лингвистике объяснительные и прикладные
модели: они выполняют разные функции и поэтому
должны подчиняться разным требованиям и оцениваться
с точки зрения разных критериев. Объяснительные модели
связаны с построением и проверкой гипотез об устройстве
языковой реальности, и главный критерий их оценки —
адекватность по отношению к этой реальности.
Прикладные модели должны оцениваться с точки зрения
эффективности в достижении практических целей, и здесь речь идет
о прикладной адекватности — по отношению к решаемой
задаче.
Прикладные семантические модели (АСОТ в целом или
ее компоненты) характеризуются следующими
специфическими чертами (принципами): моделирование
узкопрофессиональных аспектов речевого поведения; строго ограниченное
использование данных тех или иных уровней языка;
большее внимание к анализу, чем к синтезу; более высокая (чем
в объяснительных моделях) степень формализации; выбор
конкретных инструментов моделирования в соответствии
с заданной совокупностью практических требований;
привязка к ограниченному подъязыку (или комплексу
подъязыков); конкретность всех элементов модели (их полная
интерпретированность), вытекающая из обязательной
предварительной семантической инвентаризации подъязыков;
выбор в качестве рабочего объекта анализа различных
текстовых образований (отнюдь не обязательно
предложения); отражение лишь тех семантических явлений, которые
представляют практический интерес; введение стольких
14
уровней глубины семантического представления, сколько
требуется для обеспечения данного вида понимания текста;
сочетание лингвистической и экстралингвистической
семантики (экспликационный и информационный анализ) с
преобладанием последней; приближённый характер
моделей (сужение и огрубление семантической реальности).
Перечисленные принципы связаны с тем фактом, что не
существует универсальной АСОТ, применимой к решению
любых интеллектуальных задач. Тем не менее существуют
некоторые универсальные принципы и методы построения
конкретных систем. Так, весьма важен принцип
гибкости и многоэтапности анализа. Успешное
применение общих методов должно опираться на
обследование семантической реальности не только через тексты,
но и путем психолингвистических экспериментов с
носителями языка (и здесь мы опять можем вспомнить идеи
Л. В. Щербы).
Вычислительной семантике еще предстоит решить
множество сложных проблем. Назовем несколько самых крупных:
типология АСОТ, типология семантических метаязыков,
взаимозависимость метаязыков и алгоритмов, создание
библиотек стандартных семантических подалгоритмов (для
решения типовых частных задач), принципы их
комбинирования, влияние комплекса требований на выбор типа
АСОТ, определение эффективности различных
семантических методов (таких, как компонентный,
пресуппозиционный, коммуникативно-прагматический, дистрибутивный,
трансформационный, статистический анализ лексики и
многие другие подходы).
Опыт показывает, что лингвистическая семантика
должна участвовать в создании и таких систем, где естественный
язык не присутствует в явном виде: ведь он в любом случае
есть первичный и универсальный способ организации
знаний, объективная основа совместимости различных систем.
Это тем более важно, если иметь в виду, что в перспективе
мы стремимся к автоматизации всех процессов обработки
информации.
II.
Принципы и методы, содержащиеся в статьях данного
сборника "Новое в зарубежной лингвистике'', являются
новыми в узком смысле этого слова: они разработаны в
последние пять лет на основе критического анализа и экспе-
15
риментальной проверки моделей, предложенных в
предыдущем пятилетии. Это идеи и методы, образующие базу
автоматической обработки языковых данных в начале 80-х
годов. Надо надеяться, что с опытом зарубежных коллег с
пользой для себя смогут ознакомиться как практические
работники в области автоматических систем, так и
исследователи теоретического профиля — языковеды, психологи,
логики, философы. Разумеется, трудно дать гарантии того,
что изложенные в статьях выводы сохранят в полном виде
свою силу по истечении очередных пяти-семи лет 1.
Новизна представленных в сборнике обобщений
касается во многих случаях расстановки акцентов в различных
по своей эффективности инструментах обработки текстовой
информации 2. Несмотря на проявляющуюся в ряде мест
методологическую нечеткость в трактовке проблемы
понимания 3, а также разграничения между объяснительными
и прикладными моделями (в тех аспектах, которые
рассмотрены нами выше), фактически все авторы настоящего
сборника исходят из двух важных стратегических
предпосылок, обеспечивающих результативность прикладного
исследования. Первая из таких предпосылок — это убеждение
в том, что наибольшая эффективность практических
вычислительных систем может быть достигнута лишь при ус-
1 Общее состояние зарубежной прикладной лингвистики, часто
сводимой лишь к проблемам лингводидактики, отражено в следующих
изданиях: "On the Scope of Applied Linguistics". Ed. by R. В. Kaplan.
Rowley (Mass.), 1980; Corder S. P. Introducing Applied Linguistics.
Harmondsworth, Middlesex, 1977; "A Survey of Applied Linguistics".
Ed. by Wardhaugh and H. D. Brown. Ann Arbor, 1976; "The
Edinburgh Course in Applied Linguistics". Vol. 1—4. Ed. by J. P. B. Allen
and S. P. Corder. L.—Oxford, 1973—1977; "Manuel de linguistique
appliquée". Ouvrage collectif coordonnée par F. Marchand, T. 1—2. P.,
1978.
2 Большинство предлагаемых семантических методов применимо к
обработке как письменных, так и устных сообщений. О специфических
сложных проблемах, связанных с созданием систем анализа звучащей
речи, см. "Trends in Speech Recognition". Ed. by W. A. Lea. Englewood
Gliffs, N. J., 1980; "Understanding Spoken Language". Ed. by D. E.
Walker. N. Y., 1978; Nash-Webber B. The Role of Semantics in
Automatic Speech Understanding.— In: "Representation and Understanding".
N. Y. etc., 1975.
3 В связи с данной проблемой см. также: "Computer Models of
Thought and Language". Ed. by R. C. Schank and K. M. Colby. San
Francisco, 1973; Марксистский анализ проблем сознания и понимания
см. в работах: Леонтьев А. Н. Деятельность. Сознание.
Личность. М., 1975; Смирнов А, А. Проблемы психологии памяти.
М., 1966,
16
ловии машинного моделирования реальных процессов ре-
чемыслительной деятельности. Вторая предпосылка — это
стремление (надо сказать, небезуспешное) к практическому
формальному описанию того комплексного, но единого
механизма, который осуществляет взаимосвязь восприятия,
мышления и языка — этих трех китов человеческого
интеллекта.
Новыми являются, далее, следующие обоснованные в
теории и вполне оформившиеся на операционном уровне
рабочие, методические принципы вычислительной
семантики:
1) ситуативность (лексическое значение
соотносится с ситуациями, концептуальные слепки которых
автоматически извлекаются из памяти и тем самым вносят
свою лепту в формирование смысла текста);
2) процедурность (описанием значения слова
является процедура, которая осуществляется над
семантическим представлением целого текста);
3) огрубление (смысл текста всегда понимается
с некоторой долей огрубления, с определенной степенью
приближенности, люди замечают в тексте лишь то, что их
интересует в данный момент с учетом общей целеустановки
акта коммуникации).
Последний момент, особенно существенный с
прикладной точки зрения, можно проиллюстрировать следующим
гримером: "Военный двухмоторный самолет, на котором
летели президент и его охрана, разбился при посадке в
аэропорту Тегерана" (ср. статью Шенка и др.). В данном
сообщении читателя заинтересуют, скорее всего, четыре
основных слова: "самолет", "разбился", "посадке", "Тегерана".
Интерпретация текста в целом будет во многом выводиться
с помощью тех ситуаций, которые ассоциированы в памяти
читающего с указанными словами (принцип ситуативности).
Дополнение полученной интерпретации текста в случае
необходимости может осуществляться посредством
заполнения "пустых мест" в соответствующем сценарии с помощью
вывода умозаключений и вызова дополнительных сценариев
(принцип процедурности).
Подчеркнем, что, хотя указанные принципы были
названы нами рабочими, в их основе лежат действительные
закономерности свойственного человеку умения понимать
прочитанное или услышанное быстро, экономно и без
педантичного буквализму
17
В открывающей сборник статье Татьяны Слама-Казаку
подчеркивается характерная для конца 70-х годов
теоретичность прикладной лингвистики. В изложении
автора рассмотренная нами выше область вычислительной
лингвистики оказывается органически связанной со всем
спектром приложений языкознания. Прикладная лингвистика
в целом — это та сторона лингвистики, которая
обеспечивает ее связи с другими науками.
Статья У. Чейфа вносит новый вклад в обоснование
оптимального пути вычислительного моделирования процесса
производства текста человеком, причем автор подходит к
этой теме со стороны психолингвистического эксперимента.
Каким образом ситуация внешнего мира трансформируется
в языковой текст? У. Чейф показывает, что вербализация
носит не жесткий, алгоритмический характер, а является
интерпретирующим процессом. В нем выделяются три
стадии. Во-первых, это расчленение на эпизоды,
в ходе которого опыт интерпретируется на основе схем,
образцов, уже имеющихся у нас в уме. Далее следует про-
позиционализация (или, иначе,
построение суждения), состоящая в вычленении из ситуации
участвующих в ней объектов и приписывании им ролей.
Завершающим этапом является категоризация,
затрагивающая процесс именования, в составе которого
различаются две стороны: индивидуализация и типизация
объектов. Все эти этапы носят творческий характер. В
частности, критерии выбора того, что должно, а что не должно
отразиться в создаваемом тексте, зависят от установки
говорящего. Тем самым постулируются разные типы
вербализации. Для каждого такого типа характерен свой
выбор включаемых в текст эпизодов. При этом используется
свойство выделенности эпизодов, связанное с тем, что одни
события являются более неожиданными, чем другие.
Достаточность включения в текст лишь некоторых событий
обосновывается и тем, что на их базе можно предсказывать
другие события, имевшие место. Именно так можно
объяснять способность человека к разной степени сжатия текста.
Например, вспоминая об одном и том же опыте, говорящий
может выбрать тот или иной уровень детализации:
"Мальчик съехал с горки"; "Потом мальчик подходит к горке. Он
взбирается по лесенке и съезжает вниз"; "Потом мальчик
подходит к горке. Он взбирается на горку по лесенке, са-
18
дится и затем съезжает с горки. Достигнув земли, он встает
и снова продолжает свой путь в том же направлении, что и
раньше".
Ч. Филлмор тоже рассматривает значение слова и
значение текста в их теснейшей связи, но в центре его
внимания не процесс синтеза, а процесс анализа, понимания
текста. Он вводит понятие сцены-прототип а,
которая ассоциируется со словом. Все рассуждение ведется в
рамках вопроса: какова сцена, которую говорящий хотел
бы активизировать в сознании слушающего в данной точке
дискурса? Иначе говоря, слушающий производит
вычисление того, о чем же ведет речь говорящий. При этом
используются убеждения, ожидания, память, личный опыт,
которые должен привлечь слушающий в процессе анализа
текста. Автор разграничивает целый ряд понятий, необходимых
для моделирования ситуаций на разных уровнях
психического отражения. Метаязык Филлмора включает такие
термины, как сцены, схемы, фреймы, модели говорящего,
текстовые модели. Из своего реального опыта по наблюдению
сцен в действительном мире люди извлекают для себя
концептуальные схемы, при этом последние отчасти опираются
на языковые фреймы, и при восприятии некоторого нового
текста слушающие, используя свои схемы, строят текстовую
модель, то есть модель мира, совместимую с данным текстом.
Аппарат сцен позволяет автору по-новому осветить
традиционные семантические понятия, такие, как полисемия,
синонимия, семантические поля, речевые метафоры.
Статья Т. Винограда "К процессуальному пониманию
семантики" представляет собой попытку создателя ряда
действующих компьютерных моделей языка изложить свои
лингвистические взгляды в максимально общей форме. Под
процедурным, или процессуальным, подходом имеется в
виду такой взгляд на язык, согласно которому основные
черты его структуры полностью определяются природой
процессов производства и понимания языковых
высказываний. Этот подход основан на признании весьма
существенных сходств между психологическими процессами,
связанными с использованием языка, и вычислительными
процессами, осуществляемыми с помощью машинных программ.
Производство и понимание высказываний происходит в
рамках мыслительных процессов, включающих как
языковой, так и неязыковой элементы. Значение многомерно и
формализуемо лишь с учетом целей и знаний говорящего и
19
слушающего, оно не может быть представлено ни одной
статической структурой. Значение высказывания есть
множество структур, которые строятся и модифицируются
говорящим и слушающим в ходе общения. Следовательно, и
при машинном моделировании в центре нашего внимания
должна быть последовательность структур и система
изменений, их связывающих. Разграничиваются уровни
структур: слова и фразы; пропозиции и дескрипции; планы. Роль
и взаимодействие разных уровней иллюстрируется путем
новой трактовки некоторых трудных проблем
лингвистической семантики, и особенно проблем определенной и
неопределенной референции.
Следующие пять статей взяты из коллективной
монографии „Вычислительная семантика", носящей характер
введения в данную область 1. Вместе с тем каждая из статей,
знакомя читателя с историей вопроса (начиная с конца
60-х — начала 70-х годов), выбирает те аспекты
„классических систем", которые позволяют критически оценить
достижения прошлого и на основе практического опыта, часто
горького, определить пути будущих направлений
искусственного интеллекта. Статьи в сборнике упорядочены таким
образом, чтобы при последовательном чтении
неподготовленный читатель мог получить связное описание добытых
в данной области знаний. Мы же суммарно охарактеризуем
роль обеих статей Ю. Чарняка, обеих статей Йорика
Уилкса, а также Г. Скрэгга.
В статьях Ю. Чарняка на опыте конкретных
реализованных на машине систем показано, как воплощается на
практике принцип целенаправленного понимания
языкового текста. Автор на многочисленных примерах разъясняет,
почему в процессе понимания языка необходим вывод
умозаключений. Разграничиваются два основных
подхода к решению вопроса о том, в какой момент должен
включаться аппарат умозаключений: в момент, когда системе
задается вопрос, или в момент первичного чтения текста.
На этом основании разграничиваются принцип
направленного и ненаправленного вывода. Автор убедительно
показывает непригодность классических средств
математической логики для вывода умозаключений при понимании
естественного языка. Стремление классической математики
1 Другие главы этой монографии посвящены направлениям
формализации семантики, которые во многом отражены в сб. "Новое в
зарубежной лингвистике", вып. X,
20
к полноте доказательств не согласуется с масштабами
реального времени. Системы, ориентированные на учет
человеческого фактора, должны быть неполными. Основные
средства, используемые для вывода умозаключений в ходе
понимания текста, связаны с предсказуемостью фактов, с
моделированием возможных миров (ср. методики подбора
образцов, вызова „демонов" упорядочения фактов во времени).
Ни одна из предложенных систем не дает, однако,
критериев для определения того, каково должно быть
содержание знаний, необходимых и достаточных для понимания
текста, а также того, какова целесообразная репрезентация
этих знаний.
Г. Скрэгг, рассматривая семантические сети,
учитывает в равной степени и статический, и активный
аспекты памяти. Здесь своеобразно преломляется спор о
соотношении данных и процедур при моделировании
понимания языка. Обосновывается компромиссное решение
проблемы: как показали эксперименты, семантическая сеть
может одновременно интерпретироваться и как хранилище
данных, и как программа для осуществления процедур.
Й. Уилкс, используя соображения предыдущих двух
авторов по вопросам логической силы систем и
целесообразных типов метаязыков, сосредоточивает свое внимание
па анализе "сырого" текста. Он показывает
несостоятельность грамматики непосредственных составляющих как
основы автоматизации анализа текста. Необходимо сразу
ориентировать анализ на получение достаточно богатых
семантических структур. Автор уделяет много внимания
средствам разрешения основных типов
неоднозначности: лексической, структурно-падежной и место-
именно-референционной. Показано использование для этой
цели так называемых шаблонов и системы предпочтений.
Статья Г. Хендрикса „Вопросы инженерной психологии
при организации диалога на естественном языке в
прикладных системах" описывает вычислительные механизмы,
которые эксплуатируются не в экспериментальном, а в
промышленном режиме. Эти средства обеспечивают
пользователю удобство диалога с ЭВМ.
Особый интерес представляет статья Р, Шенка, М. Ле-
бовица, Л. Бирнбаума "Интегральная понимающая
система". Р. Шенк — видный теоретик в области лингвистических
проблем искусственного интеллекта, автор целого ряда
действующих моделей. В данной статье он выдвигает, по
21
существу, принципы, определяющие создание понимающих
систем третьего поколения. Так называемый модульный
подход, господствовавший в системах второго поколения,
подвергается сокрушительной критике. В статье показана
полная несостоятельность отрыва синтаксического анализа
от процесса понимания. Авторы ставят во главу угла
понятие интереса. Лишь интересные для читателя слова
подвергаются полной обработке в процессе понимания
текста. Со ссылкой на существеннейший для оперативного
общения фактор времени авторы доказывают, что многие
слова в тексте вообще пропускаются. Интересные же слова
активизируют сценарии или их части. Шенком создан так
называемый интегральный частичный
анализатор, работающий на базе двух тысяч слов.
Различаются типы словарных статей в зависимости от вида
обработки слова. Одни слова обрабатываются немедленно,
другие — записываются в оперативной памяти и
пропускаются, а третьи — пропускаются безвозвратно. Основной
инструмент анализа — сценарии, которые заполняются с
помощью ожиданий в форме запросов 1.
При оценке достоинств и недостатков различных
разделов данного сборника следует учитывать те
методологические положения и принципиальные разграничения,
которые изложены в первом разделе настоящей
вступительной статьи и которые задают определенную перспективу
в многотрудном продвижении лингвистики по пути
практического освоения тайн человеческого языка. В целом
статьи, включенные в сборник, подобраны и
расположены в такой последовательности, чтобы наглядным образом
показать, как теоретические исследования
подготавливают решение практических задач и составляют их основу.
При этом большинство предлагаемых вниманию читателя
работ отличаются таким важным свойством, как
экспериментальная проверка гипотез на вычислительной машине
(а в исследовании Чейфа — и в психолингвистическом
эксперименте), что в прикладной лингвистике весьма
немаловажно.
Б. Ю. Городецкий
1 Кроме задачи автоматического реферирования на английском
языке, Шенком осуществлялись также машинный перевод на китайский
язык, а также автоматическое реферирование на русском языке. См.:
Schank R. С. Natural language, philosophy, and artificial
intelligence.—In: "Philosophical Perspectives in Artificial Intelligence". Ed. by
M. Ringle. Brighton, 1979,
22
Т. С лама-Казаку
МЕСТО ПРИКЛАДНОЙ лингвистики
В СИСТЕМЕ НАУК:
ОТНОШЕНИЕ ПЛ К «ЛИНГВИСТИКЕ» *
О. Учитывая тот факт, что мы обычно употребляем
термин "прикладная лингвистика" (ПЛ) без уточнения ее
отношения к "лингвистике", мы полагаем необходимым
рассмотреть сначала это отношение, что поможет нам также
определить ПЛ.
1.0. Если рассматривать лингвистику как науку с очень
широкой сферой исследования, имеющую дело с изучением
языка вообще, тогда ПЛ следует считать одной из областей
лингвистики (см. рис. 1).
Рис 1
1.1. Если действительно полезно выделять ПЛ как
специальную область в пределах лингвистической науки, то
в этом случае возникает существенная проблема: каковы,
с точки зрения соотношения "теоретического" и "приклад-
* Tatiana Slama-Cazacu. The place of applied linguistics in
the system of sciences: AL in relation to "Linguistics".— "Revue
Roumaine de Linguistique", 1980, t. XXV, No 3, p. 153—160.
23
ного" аспектов, особенности "других" областей лингвистики
и какова характерная черта ПЛ? Существуют ли "чисто"
теоретические (или так называемые "чистые") и собственно
прикладные области?
Следует заметить, что при внимательном рассмотрении
такого подхода к пониманию ПЛ и ее соотношения с
другими „областями" лингвистики окажется, что практически
любая другая область обладает как прикладным, так и
фундаментально-теоретическим аспектом и что если мы
попытаемся перечислить компоненты лингвистической сферы, то
различные ее дисциплины (такие, как изучение грамматики,
словаря, стилистики и т. д.) нельзя рассматривать в отрыве
от ПЛ, так же как и целиком включать в нее. Изучение
словаря предполагает, с одной стороны, систематизацию,
приводящую к выявлению общих принципов и построению теорий
структурирования слов в языке, а также к исследованиям
компаративного порядка, посредством которых
устанавливаются взаимовлияния и связи языков (проблемы
лексических заимствований и происхождения слов), или даже к
типологическим констатациям касательно некоторых
универсалий человеческого языка. Однако, с другой стороны,
лексические исследования могут также быть направлены на
составление словарей, на достижение тем самым некоторых
прикладных целей (установление значений, этимологии,
формальных вариантов слов и т. д. для удовлетворения
практических интересов читателей различных категорий —
от школьников до взрослых, от обычного читателя до
специалиста-лингвиста). Таким образом, прикладные задачи не
могут быть решены без предварительных исследований
теоретического характера, приводящих к формулированию
общих принципов, а получаемые результаты (явно
практического порядка) могут затем использоваться в качестве
исходных оснований для теоретических построений.
Аналогичное положение имеет место и при составлении
грамматики языка: мы можем отнести это либо к ПЛ (если мы имеем
в виду учебник грамматики, который будет использован для
преподавания в школе родного или иностранного языков),
либо к области фундаментального лингвистического
исследования; в том и другом случае оба аспекта изучения языка
тесно переплетаются, и лишь конечная цель разделяет их.
1.2. Таким образом, чтобы определить ПЛ и найти
подобающее ей место в системе наук, представляется более
целесообразным избрать в качестве критерия не произволу
24
ные корреляции и субординации 1, а задачи различных
исследовательских лингвистических работ: ПЛ есть область
изучения языка с определенной прикладной целью,
подчиненной непосредственно и специально решению
определенной практической задачи (например, составлению
грамматики французского языка для изучения его как родного
языка в 4-м классе начальной школы или как иностранного
языка в англоязычной аудитории).
В таком случае следует признать существование в
лингвистике непосредственно прикладной "области" 2 (имеющей
в свою очередь определенные теоретические основания) и
"области", относительно которой в предварительном плане
мы можем только сказать, что она имеет преимущественно
теоретический или фундаментальный характер (ниже мы
еще будем иметь возможность подчеркнуть, что эта
последняя также служит или должна служить практическим
целям, но косвенным образом). Для нее трудно подыскать
подходящее наименование, особенно если мы серьезно
задумаемся над ее сущностью в связи с так называемыми
"неприкладными" задачами, которые она может решать. Пожалуй,
наиболее правильным будет называть ее "фундаментальным
лингвистическим исследованием", имея в виду
направленность на установление некоторых общих теоретических
принципов, относящихся к отдельным аспектам
конкретного языка или к феномену "языка" вообще.
1 См. также Spillner, 1977, р. 156: не существует
"иерархических" отношений между различными отраслями, которые он
называет "теоретической лингвистикой" [наименование, которое может
ввести в заблуждение.— Прим. Т. С. /С.], "ПЛ" и "совокупностью
применений" (то есть практическими приложениями как таковыми). Р.
Бугарский (Bugarski, 1977, р. 7) также признает наличие единой
лингвистики, которая может получать то или иное применение: «лингвистика
сама по себе не является ни "чистой", ни "прикладной": вся
охватываемая ею область в принципе может подвергаться как теоретической
разработке, так и исследованию с точки зрения всевозможных применений».
О Бэк (см. Back, 1970, р. 23, 25), рассуждая о значении,
придаваемом ПЛ, различает, например, субординацию ПЛ по отношению к
"лингвистике" и "опосредование" ПЛ как промежуточное звено между
"практической деятельностью" и "чисто теоретической наукой". Оба эти
отношения представляются мне искусственными.
2 Я предпочитаю именовать прикладную лингвистику "областью",
в которой могут превалировать различные "подходы" (таким образом,
в этом случае я не буду различать "область" и "подход", что придавало
бы ПЛ, как полагает Р. Бугарский (см. Bugarski, 1977, р. 11),
статус "потенциального подхода").
25
Это вовсе не означает, что прикладная лингвистика
должна "выделиться" из "лингвистики" вообще; или что
специалисты по ПЛ могут игнорировать связи с другими
отраслями (скорее, наоборот; об этом см. в пункте 2.1). Но в то же
время я не хочу утверждать, что ПЛ — это то, что
"прикладывается" к лингвистике, в том смысле, который, вероятно,
имел в виду П. Кордер в своей иронической формулировке:
«нельзя прилагать то, чем не владеешь» 3 (см. Р.
Corder, 1973, р. 7).
2.0. Здесь, следовательно, необходимы некоторые
коррективы, и предшествующие рассуждения подводят нас к
этим уточнениям, имеющим чрезвычайно важное значение,
тогда как их игнорирование приводило и все еще приводит
к множеству ошибок как в области ПЛ, так и в области
лингвистики, обычно именуемой "общей", "теоретической"
или даже, что совершенно неправомерно, "чистой".
2.1. Связь между ПЛ и фундаментальным исследованием.
Обе области лингвистических исследований, такие разные
по своим непосредственным
задачам, находятся в отношении
корреляции, тесно связаны (ниже мы
обратимся к характеру этого
отношения) и опираются (или
должны опираться) каждая друг на
друга (рис. 2), так что в логиче-
связь
ПЛ -*- ФУНДАМЕНТАЛЬНОЕ
ИССЛЕДОВАНИЕ
Рис. 2
ской схеме они выступают как два главных аспекта в
рамках лингвистики (рис. 3).
В адекватной концепции "языка" (как человеческого
феномена,— отражающего особенности человека и функциони-
3 Иными словами, необходимо располагать некоторым знанием
лингвистики, которое и можно прилагать. Нечто подобное имел в виду
К. Готтвальд (см. Gottwald, 1977, p. 57), когда он проводил в ПЛ
различие между "двумя уровнями приложения": "приложимость
теорий" (релевантность их результатов в более сложных видах
исследования) и "практическая полезность" теории (возможность приложения
теоретических знаний к практическим процедурам).
Рис. 3
26
рующего в условиях реальной жизни,— который нельзя
рассматривать лишь как некую абстрактную систему в
отрыве от реальных обстоятельств человеческого
существования) естественно ожидать, что все, находящееся в пределах
лингвистики и, следовательно, соотносящееся с
изоморфными фактами, должно обладать аналогичными свойствами.
По этой причине используемые методологические
процедуры, хотя и могут быть различными как инструменты
исследования, должны учитывать, однако, специфические черты
феномена, аналогичные в х и в хх. Именно этим принципом
обусловливается эффективность связи двух областей,
имеющих характер взаимного влияния: исследования в области
ПЛ служат фундаментальному изучению языка, а
фундаментальное изучение языка является обязательной
предпосылкой для ПЛ. Если в хх используется иная модель "языка",
чем в х (где представляется более вероятным понимание
"языка" как конкретного феномена), то могут возникнуть
искажения при экстраполяции из одной области в
другую, несоответствия, конфликты, несопоставимые
результаты и, в конечном счете, отсутствие эффективности
исследования в каждой из двух областей. Поэтому я и не
рассматриваю ПЛ как "подход" в пределах "чистой" лингвистики;
такая модель не только ставила бы ПЛ в подчиненное
положение, но и изолировала бы "чистую лингвистику",
превращая ее в отдельную область, полностью оторванную от
реальности.
2.2. Конечная цель, общая для обеих областей
лингвистики. Если лингвистика устанавливает для обеих областей
один и тот же объект — язык с его человеческими
особенностями, употребляемый в ситуациях реальной жизни,—
это приводит к тому, что конечные цели исследования в
обеих областях должны обладать качеством сходимости
(converging), то есть учитывать, что происходит в
практической или конкретной реальности, в условиях которой
"язык" употребляется. Если в ПЛ проблема
исследовательской задачи формулируется четко, то в других областях
лингвистики ученые редко задумываются над тем, какова
их конечная задача, то есть цель всей их деятельности в
общей системе наук. Возможно, это замечание вызовет
раздражение, однако мы должны все же сказать, что большинство
лингвистов не выказывает никакого интереса к final cul
prodest (то есть к реальной практике) и не соотносит
последовательным образом свои гипотезы о языке с действитель-
27
ной сущностью языка. Видимо, по этой причине никогда не
возникало идеи о присуждении Нобелевской премии за
открытия в лингвистике.
Фундаментальные исследования существуют и в физике,
химии, биологии или геофизике, и большинство этих
исследовательских работ, устанавливающих общие принципы,
расширяют наши знания о материальном мире, так что
человечество распространяет свою власть над ним, прилагая
общие принципы к отдельным конкретным ситуациям —
в этом и проявляется их конечная практическая цель. Даже
теоретическая физика, формулирующая свои теории так
называемым "чисто" дедуктивным образом, учитывает
установленные данные о реальности, и, выдвигая те или иные
теоретические построения, не проявляет индифферентности
по отношению к действительности, которую она еще не
познала, но с которой должны сверяться подобные
теоретические конструкты. Так или иначе, наиболее важные
открытия в этих науках имели в виду познание реальной природы
как таковой. Таким образом, конечная цель (то есть
итоговый результат лингвистического исследования) как в
области х, так и в области хх, должна быть единой (см.
рис. 4): более глубокое познание реального феномена
„языка" в его реальном функционировании, имеет ли оно в виду
непосредственно прикладную цель (для х: улучшение
преподавания языка, речевую терапию и т. д.), либо
опосредованную прикладную задачу (то есть непрямым образом
обслуживая ПЛ), либо, наконец, приложение к задаче
изучения самой сущности языка с учетом его субстанции 4 (то
есть более глубокое познание компонентов языка в его
реальности — таковы исследования грамматики или
лексики; или определение способов комбинирования языковых
фактов для создания стилистических эффектов в
произведениях того или иного писателя — такова стилистика; или
более основательное понимание связей между ситуациями
социального порядка и модальностями коммуникации —
такова социолингвистика; или установление отношений
между литературным языком и местными диалектами, а
4 Мы считаем, что не всегда имеет место стремление к конечному
результату в указанном смысле, поскольку существуют
лингвистические направления и методы, которые игнорируют (часто эксплицитно)
реальное функционирование языка,
28
также состояния диалекта в определенный момент —
такова диалектология и т. д.) 5.
2.3. Специфичность целей (задан) в ПЛ. Мы установили,
что задача ПЛ носит непосредственно и специфически
прикладной характер. Иными словами, данная спецификация
^^ ОБЩАЯ КОНЕЧНАЯ ЦЕЛЬ ^^
НЕПОСРЕДСТВЕННО _- »—КОСВЕННО
ПРИКЛАДНАЯ ЗАДАЧА ПРИКЛАДНАЯ ЗАДАЧА/ПРИЛОЖЕНИЕ К
(х) (XX) ИЗУЧЕНИЮ
СУЩНОСТИ ЯЗЫКА
Рис. 4
обусловливается тем фактом, что конечным назначением
ПЛ является соотнесение с конкретными условиями
жизни 6. Разумеется, исследования общего характера также
необходимы для ПЛ — в виде теории ПЛ 7,— они должны
точно определять, например, общие принципы обучения
языку или обучения какому-либо конкретному
иностранному языку (например, определять общие черты этого языка,
которые оказывают влияние и на его усвоение) или
лингвистические принципы речевой терапии. Но реальное
применение этих принципов не может иметь места вне данного
конкретного контекста. Могут быть выработаны общие
принципы составления учебников по иностранным языкам
(и такая работа относится к ПЛ), но составление учебника
для преподавания английского как иностранного языка не
может игнорировать родного языка (например, француз-
5 Уточнение, предлагаемое М. Холлидеем (см. Halliday и др.,
1964, р. 5) («нет ни "чистых", ни прикладных наук, но лишь применение
исследования либо к практическим, либо к иным целям»),
представляется неясным, так как невозможно установить различие между
"практическим" и "прикладным". Получается, что все лингвистические
исследования являются "прикладными", но одни исследования имеют
практическую задачу (это мы здесь разумеем под "непосредственно
прикладным ), а другие нет. В то же время в другом месте (р. 138) авторы
подчеркивают, что описание языка ради его познания не представляет собой
"приложения к лингвистике". ПЛ начинается тогда, когда «описание...
предпринимается... для дальнейших целей, лежащих за пределами
лингвистики».
6 О специфическом характере целей ПЛ см. также Strevens.
1976, р. 83 и 1977, р. 39.
7 См. также Spillner, 1977, р. 154; некоторые идентифицируют
"теорию" с "теоретической лингвистикой" и заключают, что ПЛ не может
иметь теории,
29
ского) студента, который изучает английский, так как —
и это хорошо известный общий принцип теоретических
положений ПЛ — родной язык является базовым языком,
оказывающим влияние на процесс изучения: отсюда
следует, что учебник должен учитывать типичные ошибки,
допускаемые франкоязычными учениками (в этом состоят
трудности, возникающие у них при изучении английского
языка).
Очевидно, здесь мы обнаруживаем также отношение
взаимодействия: требуется, чтобы наряду с теоретическими
принципами, выработанными гипотетически или на основе
ранее установленных данных, было сначала определено
(посредством изучения реальных ситуаций с различными
базовыми и изучаемыми языками), что из себя представляют
те самые "общие принципы", которые следует учитывать
при составлении учебников. Следовательно, любое
изыскание или изучение не может проводиться в ПЛ in abstracto,
необходимо постоянно обращаться к действительности, к
которой прилагаются эти принципы, а практические
результаты (учебники, методы преподавания и т. д.) также
должны обладать весьма конкретными, то есть
специфическими признаками.
Необходимо также подчеркнуть одно чрезвычайно
важное обстоятельство, которое должно спасти от
вульгаризации или от дилетантских попыток работу в области, которая
должна рассматриваться со всей серьезностью.
Исследования ПЛ нельзя смешивать также и с рутинной
деятельностью в различных практических сферах 8. "Преподавание
языка", например, осуществляется в широком
педагогическом контексте, который лишь частично совпадает с
лингвистикой 9. ПЛ нельзя сводить к „прикладным методикам",
к преподаванию языка как таковому 10, так же как и к
работе вычислительной машины, осуществляющей автомати-
8 См. также Spillner, 1977, р. 156; это как раз тот случай, когда
этот автор (р. 154) приписывает термину ПЛ неправильную
интерпретацию, определяя ПЛ как "простое применение лингвистики" (другие
авторы критикуют этот термин по другим причинам).
9 См. Stern, 1967, p. 91.
10 Подобное определение, данное П. Кордером (см. Corder,
1973, р. 137; см. также Janssen and Stammer Johann (eds.),
1975, p. 31, 38), в соответствии с которым ПЛ «является "деятельностью",
но "не теоретическим исследованием"», может направить ПЛ по
неправильному пути.
30
ческий перевод, или к разного рода процедурам,
применяемым при лечении речевых расстройств. Разумеется,
абсолютно необходимо, чтобы специалисты по прикладной
лингвистике находились в непосредственном контакте с
практической деятельностью и — по мере того как они добывают
необходимые знания — могли высказывать свои
рекомендации, накапливать данные и проверять свои гипотезы и
результаты, принимая участие в преподавании языка, или
применять те или иные процедуры при лечении афазии.
Однако прикладная лингвистика — это область специального
прикладного исследования, к которому подготовлен не
всякий преподаватель языка. Точно так же лингвист,
который „знает" лингвистику, и только ее, не сможет
работать в области ПЛ, если у него нет контактов с фактами
("аудитория", клиника афатических заболеваний и пр.)
и хотя бы элементарных знаний из разнообразных областей
(педагогики, психологии и пр.) 11, а также опыта
исследовательской работы, непосредственно связанной с
конкретной действительностью.
2.4. В современной науке можно выделить два
фундаментальных направления: с одной стороны, глубокая
специализация в отдельных отраслях (как результат открытия
новых аспектов, требующих более глубокого их познания
адекватными средствами), а, с другой стороны, стремление
к меж- или мультидисциплинарному подходу (как результат
стремления найти комплексные средства изучения явлений,
многосторонность которых раскрывается в процессе
эволюции наук, и как желание достичь "единства во
множественности"). Отсюда и трудности в попытках сохранить связь
между специализацией и разъединением областей,
совпадающих по своим объектам, проблемам, методам или
интерпретациям 12.
Ситуация с положением ПЛ в системе наук
характеризуется тем, что, будучи областью, которая использует
собственно лингвистические данные, прикладная лингвистика
11 Как это ни кажется чрезмерным, но данное требование
представляется естественным и отнюдь не отменяющим того, что ПЛ продолжает
оставаться "лингвистикой" (в конце концов, всякий лингвист,
работающий в области "стилистики11, должен обладать также некоторыми
знаниями "истории", "литературной критики", "теории литературы" и т. п.).
12 См. также "Введение" Т. Слама-Казаку к сборнику T. Slama-
Cazacu (ed.), 1973, p. 9, 10.
31
должна обращаться ко многим другим Дисциплинам 13 или
даже к мультидисциплинарным научным образованиям (то
есть она должна заимствовать данные и методы у
других дисциплин или наук и спаивать их в нечто целое).
При составлении учебника немецкого языка для
иноязычных детей необходимо учитывать психолингвистические
данные (влияние родного языка
пределение материала в соответствии с
возможностями человеческой памяти, возрастными особенностями
и т. д.), педагогико-дидактические данные (соотнесение в
учебном плане с другими предметами, уже пройденными
или же одновременно изучаемыми), методические (отбор
методов преподавания, ориентированных на содержание
каждого урока и т. д.), социокультурные,
социолингвистические данные и др. При решении проблем автоматического
перевода ПЛ не может игнорировать кибернетику,
математику, вычислительную технику, программирование и пр.
А при установлении процедур лечения афазии иногда трудно
решить, то ли врачи "делают" прикладную лингвистику, то
ли лингвисты "делают" неврологию. Точно так же
проблемы и методы ПЛ в значительной степени находятся в такой
тесной связи с проблемами и методами прикладной
психолингвистики, что они перекрывают друг друга, и бывает
трудно определить, идет ли речь о прикладной лингвистике
или же о прикладной психолингвистике.
Главная ошибка, допускаемая, таким образом, в
прикладной лингвистике, заключается в стремлении решить про-
13 Б. Спиллиер (см. Spillner, 1977, р. 156) называет их
"нелингвистическими дисциплинами", но он не видит необходимости их
интеграции посредством ПЛ (см. рис. 5 и 6).
32
блему исключительно лингвистическими средствами 14 (и
часто такими лингвистическими средствами, которые исходят
из понимания „языка" как абстрактного феномена).
Поскольку же отправной точкой для понимания „языка"
является истолкование „языка" как человеческого 15 феномена,
то из этого должны быть сделаны все выводы и мульти-
дисциплинарный подход не должен знать никаких
ограничений 16. В подобной ситуации не так важно подобрать
точное наименование для области или предмета, к которым
"принадлежит" то или иное исследование или деятельность,
как важно сохранить специфическую черту объекта —
понимание языка как человеческого феномена.
ЛИТЕРАТУРА
Back, .О. Was bedeutet und was bezeichnet der Ausdruck
"angewandte Sprachwissenschaft"? — «Die Sprache», 1970, 16, S. 21—53.
Bugarski, R. A pica for integration in linguistics [Paper
prepared in advance for Burg Wartstein Symposium «Dilemmas of focus in
linguistics», 1977]. New York, Wenner — Gren — Foundations for
Anthropological Research.
Corder, P. Introducing Applied Linguistics. Harmondsworth,
Penguin Books, 1973.
14 См. также Spolsky, 1970, p. 154: «Лингвистика имеет лишь
косвенное отношение к преподаванию языка». Ее данные должны
быть интегрированы «в разумную теорию языковой педагогики». Следует
заметить, что термин «языковая педагогика» значительно раньше
употреблен Палмером (см. Palmer, 1917, р. 24). Именно потому, что
некоторые лингвисты понимают, что в ПЛ включаются данные также
других наук, они считают этот термин неадекватным и даже "вводящим в
заблуждение" (возможно, приводящим к недоразумениям; см.
Halliday и др., 1964, р. 169). Однако рассматривать ПЛ как
мультидисциплинарную область вовсе не значит смешивать ее с "педагогикой"
и тем более отказываться от термина как такового.
15 Как подчеркивает Б. Мальмберг (см. Malmberg, 1971, р. 17),
«никакой другой вид деятельности человека не является более
человеческим, чем язык и [...], следовательно, никакая другая наука не может
быть более фундаментальной для планирования лучшего мира». Но, с
моей точки зрения, значение и польза лингвистики не в том, что, как
говорит Б. Мальмберг, «никакая другая наука не дает большего для
познания нас самих», а в наличии у нее прикладных аспектов, то есть в
существовании ПЛ, которая реально способствует улучшению
человеческой жизни во всех ее аспектах, стимулирует межчеловеческое
общение, распространяет знания, создает интра- и интерчеловеческое
равновесие, в котором так нуждается современный мир.
16 Относительно мультидисциплинарного характера ПЛ, о котором
нужно упомянуть при определении ПЛ, см. также Strevens, 1977,
р. 38; мы также учитываем эту черту ПЛ в нашем определении ПЛ.
2 № 534
33
Gottwald, K. Applicational levels in applied linguistics.—
«IRAL», 1977, 15, no. 1, p. 55-63.
Halliday, M. A. K., Mcintosh A., Strevens P. The.
linguistic sciences and language teaching. London, Longmans, 1964.
Janssen, H., Stammerjohann, H. (eds.). Handbuch
der Linguistik. München, Nymphenburger, 1975.
Malmberg, В. The applications of linguistics.-— In: G.
Perren, J. Trim (eds). Applications of linguistics. London — Cambridge,
Cambridge University Press, 1971, p. 3—18.
Palmer, H. E. The scientific study and teaching of languages.
London, Oxford University Press, 1968 [ed. I 1917].
Slama-Cazacu, T. (ed.) Cercetäri asupra comunicärii
(Research on communication). Bucure§ti, Ed. Acad., 1973.
Spillner, B. On the theoretical foundations of applied
linguistics.— «IRAL», 1977, 15, no. 2, p. 154—157.
Spolsky, В. Linguistics and language pedagogy, applications or
implications? — In: J. Alatis (ed.). Linguistics and the teaching of
standard English to speakers of other languages or dialects. Washington,
Georgetown University Press, 1970, p. 143—155.
Stern, H. H. Linguistics in language teaching: an assessment.—
In: M. Donoghue (ed.). Foreign Languages and the Schools.
Dubuque, Brown, 1967, p. 90—98.
Strevens, P. On defining applied linguistics.— In: «Proceedings
of the IVth Int. Congress of Applied Linguistics» (ed. G. Nickel.
Stuttgart, Hochschulverlag, 1976, vol. 1, p. 81-84).
У. Л. Чейф
ПАМЯТЬ И ВЕРБАЛИЗАЦИЯ
ПРОШЛОГО ОПЫТА *
Очень часто мы видим, слышим или иным образом
воспринимаем происходящее вокруг нас, а позднее вспоминаем
все это, и та или иная причина побуждает нас использовать
язык для передачи другим людям того, что мы помним.
Иными словами, мы часто ведем беседу об опыте, извлеченном
из памяти. Когда мы это делаем, мы переводим в
вербальную форму то, что изначально имело, быть может полностью
или частично, невербальный статус. Как мы делаем это?
Каким образом нам удается воспринять невербальный опыт,
отложить его на время, а затем вспомнить о нем и облечь
в слова, которые позволят другим людям понять, каков был
этот опыт? Если бы я рискнул ответить на этот вопрос, это
значило бы, что я претендую на разрешение загадки, над
которой бились исследователи человеческого интеллекта
на протяжении тысяч лет. Мои намерения гораздо
скромнее: я пытаюсь показать, что данный вопрос является
важным для лингвистов и заслуживает внимательного
рассмотрения, что мы не можем ожидать новых успехов в
понимании устройства языка без глубокого целеустремленного
изучения тех "проклятых проблем", которые в связи с этим
возникают.
Для начала необходимо иметь некоторую модель, хотя
бы и несовершенную, на которой могли бы основываться
наши рассуждения. В качестве такой упрощенной модели
предлагается схема на рис. 1, где, правда, опущен ряд
факторов, которых я не буду здесь касаться. Слева на этой схе-
* Wallace L. Chafe. The recall and verbalization of past
experience.— In: "Current Issues in Linguistic Theory", ed. by R. W. Cole.
Bloomington and London, 1977, p. 215—246.
© 1977 by Indiana University Press.
2*
35
ме находится блок с надписью "стимул". Он обозначает
физические данные, поступающие в наши органы чувств при
первичном восприятии события, которое позднее явится
предметом нашего повествования. От этого блока идет
стрелка к блоку.
обозначенному как "сознание". Этот второй блок
представляет наше феноменологическое осознание воспринимаемого
опыта, или, если угодно, наличие некоторой информации,
относящейся к этому опыту, в нашей кратковременной
(оперативной) памяти. Стрелка названа "восприятие", и этим
названием я хотел подчеркнуть следующее: то, что
поступает в сознание, не является точной копией стимула (каков
бы он ни был), но есть его интерпретация. Возьмем простой
известный пример. Когда мы смотрим на чертеж типа того,
который изображен на рис. 2, мы склонны видеть не набор
горизонтальных, вертикальных и диагональных линий (что
в некотором смысле ближе к объективному составу
физического стимула), а прозрачный куб. Приложив некоторое
усилие, мы можем также интерпретировать этот куб в двух
различных перспективах: либо обращенным передней (к
нам) гранью влево и вниз, либо вправо и вверх.
Это — две различные интерпретации, которые наше
сознание может дать одному и тому же физическому стимулу.
То, что находится в сознании, является своего рода
убеждением (belief) относительно того, что находится во внешнем ми-
36
ре. Это убеждение связано, безусловно, с тем, что
предоставлено в распоряжение органов чувств, но оно подвергается
и сильному воздействию контекста ситуации, а также
культурной и индивидуальной предрасположенности. Все это,
Рис. 2
вместе взятое, создает в нашем уме некоторую
интерпретацию происходящего во внешнем мире. Ключевая идея для
нас здесь сводится к следующему: восприятие является
интерпретирующим. (См. Hochberg, 1964, где дан
хороший обзор вопроса.)
Возможности сознания с точки зрения его емкости,
видимо, очень ограничены (ср. Miller, 1956, гипотезу о
количестве информации, которую мы можем удерживать в
сознании единовременно). В каждый данный момент мы
можем осознавать только узкий круг явлений. Но по крайней
мере часть информации, находящейся в сознании, может
поступить, в соответствии со стрелкой "накопление
(информации)", в блок под названием "память". Использование
различных блоков для представления сознания и памяти может,
правда, вводить в заблуждение, так как оно дает основание
для предположения, что речь идет о двух различных
областях мозга. Но, во всяком случае, представляется
целесообразным различать здесь два разных состояния, в которых
может находиться информация (т. е. знание) в различные
моменты времени. Мне представляется, что "содержимое
сознания" является знанием, которое активизируется, или
"высвечивается", в любой данный момент времени, а содер-
37
жимое памяти не активно, не "высвечено" в данный момент,
но все же некоторым образом "присутствует" в уме.
Еще одна стрелка идет в обратном направлении — от
памяти к сознанию — и показывает, что информация может
быть "извлечена", или реактивирована. Следовательно,
существуют два входа в сознание: один через восприятие и
один через извлечение из памяти (recall). Когда мы впервые
наблюдаем событие, мы, несомненно, осознаем его через
восприятие. Но когда мы рассказываем о нашем опыте
позднее, оно попадает в наше сознание посредством извлечения
его из памяти. Хотя иногда мы можем говорить о том, что
воспринимается нами в данный момент, такая речь довольно
необычна; в большинстве случаев мы говорим о вещах,
извлеченных из памяти. О большей части опыта
рассказывается в прошедшем времени, которое употребляется для
передачи информации, прошедшей по стрелке "извлечение
(информации) из памяти" (см. рис. 1).
Как лингвистов нас, вероятно, должна более всего
интересовать стрелка "вербализация", покрывающая все те
процессы, посредством которых невербальная информация
переводится в слова. Некоторые читатели могут оспаривать
изображение стрелки "вербализация" как выходящей из
"сознания" и означающей, следовательно, что, когда мы
говорим, мы осознаем невербальный материал. Очевидно,
здесь существуют индивидуальные различия. Многие,
когда они говорят об извлеченном из памяти опыте, осознают
мыслительные образы, относящиеся к опыту. Для них
расположение стрелки "вербализация" на рис. 1
представляется правильным. Другие утверждают, что осознают
только язык как таковой. В этом случае может казаться,
что память содержит только уже вербализованный материал
и что процесс извлечения опыта из памяти сводится к
введению в сознание уже сформированной вербализации.
Ниже я вернусь к некоторым соображениям, которые могут
оказаться релевантными для данного вопроса. В первой
половине статьи, однако, я хочу обсудить те процессы,
которые, как мне кажется, причастны к вербализации.
Грубо говоря, процессы вербализации могут быть
разделены на три основных типа. Во-первых, это процессы,
связанные с организацией содержания. Для вербализации
необходимо, чтобы говорящий определенным образом
структурировал сам извлекаемый опыт. Во-вторых, это процессы,
связанные с оценкой говорящим состояния ума адресата в
38
текущий момент и его рабочих возможностей в пределах
конкретного контекста речи. В другой своей работе (Chafe,
1975) я объединил эти процессы под названием "упаковка",
подразумевая под этим, что говорящий должен как бы
"завернуть" передаваемое содержание эффективным
образом, чтобы адресат мог легко его усвоить. Упаковка
включает такие задачи, как различение данной и новой
информации, принятие решения о том, должно ли
существительное подаваться как определенное или как неопределенное,
установление субъекта и темы (vs. ремы) и т. п. В-третьих,
каждый язык навязывает различные более или менее
произвольные синтаксические процессы, которые также
должны быть использованы при вербализации. Например,
один язык может требовать согласования глагола с
подлежащим в лице, числе и роде, тогда как в другом языке такое
требование может отсутствовать.
Я думаю, что это трехчленное разграничение между
процессами, относящимися к содержанию, упаковке и
синтаксическим структурам, отражает реальные различия
между процессами, происходящими во время
вербализации. В последующей части работы я сосредоточусь только
на процессах, связанных с содержанием. Они, в свою
очередь, могут быть подразделены на три основных подтипа,
каждый из которых я подробнее рассмотрю ниже. Коротко
говоря, они заключаются в следующем. Во-первых,
говорящему необходимо разбить большой эпизод * на меньшие
части. Процесс такого рода я буду называть довольно
непривлекательным термином "расчленение эпизода на под-
эпизоды" (subchunking). Во-вторых, когда достигнут
оптимальный размер эпизода, говорящему необходимо выбрать
пропозиционную структуру, которая определит различные
роли объектов, участвующих в эпизоде. В этом случае я
буду говорить о "пропозиционализации" (или "построении
суждения"). В-третьих, должны быть найдены подходящие
слова и фразы для передачи идей как об объектах, так и
о событиях. Здесь будет уместным употребить термин
"категоризация".
После того как я последовательно рассмотрю
расчленение, пропозиционализацию и категоризацию, я попытаюсь
* В оригинале употребляется термин chunk ol content, который
можно перевести как "кусок содержания". В переводе, как правило,
используется, пожалуй, более адекватный термин — "эпизод*4. На него
ориентируются и все его производные образования.— Прим. перев.
39
обосновать положение, которое, пожалуй, лучше всего
пояснить, обратившись снова к рис. 1. Выше я отмечал,
что процессы восприятия носят интерпретирующий
характер, что информация, поступающая через восприятие в
сознание, а затем в память, является не точной копией
исходного стимула, но его интерпретацией. На мой взгляд,
имеются веские доказательства в пользу того, что
вербализация тоже носит интерпретирующий характер. Языковой
продукт процессов вербализации не является копией
входных данных этих процессов, в равной мере он и не
детерминируется алгоритмически этими входными данными.
Ближе к истине такое представление, согласно которому,
когда люди говорят, они постоянно выбирают наилучшие
способы выражения того, о чем они думают. Отсюда
следует, что ко всему содержащемуся в памяти применимы
дальнейшие процессы интерпретации. Интерпретация
происходит не только во время восприятия; она имеет место также
в то время, когда мы говорим. Справедливость сказанного
станет очевидна, я думаю, прежде всего при обсуждении
категоризации. Я попытаюсь показать также, что при
расчленении эпизода и построении суждения тоже может
иметь место интерпретация; что эти процессы не всегда
определяются содержимым памяти, а могут определяться в
процессе вербализации и осуществляться по-разному одним
и тем же говорящим при различных обстоятельствах.
В нескольких местах я буду ссылаться на источник
данных, который я назову "фильм". Это пятиминутная
картина о жизни маленького мальчика в деревне. Она была
показана нескольким группам студентов колледжа в 1972 г.
После просмотра фильма их попросили написать, о чем был
фильм, а некоторых попросили сделать это снова восемь
недель спустя. Таким образом было проверено, как люди
вербализуют свой извлеченный из памяти опыт (субститут
реального опыта) вскоре после наблюдения и после того,
как он сохранялся некоторое время в памяти.
РАСЧЛЕНЕНИЕ ЭПИЗОДА
Наша память, по-видимому, содержит представления
дискретных эпизодов опыта, которые могут быть "большими"
или "маленькими" с точки зрения
пространственно-временной протяженности, а также по количеству деталей,
которые вспоминаются в пределах эпизода. Так, на уровне
40
очень крупных "кусков" я могу вспомнить вещи, которые
можно обозначить "мое детство" или же "вторая мировая
война". На некотором промежуточном уровне возможны
воспоминания о "кусках" опыта типа "мое путешествие в
Бостон в прошлом году" или "попытки покушения на Джорджа
Уоллеса". Но я также могу извлекать из памяти такие
мелкие события, как "утром порвался шнурок ботинка" или
мгновенное выражение лица какого-нибудь политика во
время передачи новостей по телевизору. Я имею в виду
не значительность или тривиальность этих событий, а их
"размер"; последний можно было бы измерять в терминах
числа подсобытий, на которые говорящий может в принципе
эти события разлагать.
Поскольку мы рассуждаем сейчас с точки зрения
человека, извлекающего нечто из памяти с целью вербализации,
лучше всего, видимо, взять пример, где начальный эпизод
по своему размеру сравним с эпизодами типа "случай,
происшедший со мной в прошлом месяце" или "моя поездка в
Бостон". Весьма маловероятно, что я начну фрагмент
разговора с фраз "давайте я расскажу вам о второй мировой
войне" или даже "о моем детстве". Возможно, существуют
типичные размеры эпизодов, обычно вводимых в речь с
различными целями, но пока мы знаем об этом очень мало. Во
всяком случае, часто оказывается возможным
вербализовать этот начальный эпизод в целом, обозначив его как
"происшедший со мной случай", "моя поездка в Бостон"
или "то, что я вчера услышал от Джо". Такие обозначения
передают слушающему некоторую самую общую идею о
содержании эпизода и, по предположению, устанавливают
некоторые рамки того, что может ожидать слушающий. Как
правило, эти обозначения являются своего рода заявками
на продолжение рассказа, в котором говорящий будет
стараться передать те детали, которые он может вспомнить
в пределах этого начального эпизода.
Таким образом, важным аспектом вербализации
является процесс разбиения больших эпизодов извлеченного из
памяти опыта на меньшие эпизоды; вербализация последних
позволит слушающему достигнуть того уровня детализации,
который был бы недоступен, если бы вербализовался лишь
самый крупный эпизод в целом. Этот процесс "расчленения
эпизода" является в значительной степени иерархическим.
Начальный, глобальный эпизод сначала разбивается на
эпизоды довольно большие, они, в свою очередь,— на более
41
мелкие, и т. д., пока не будет достигнут тот уровень, когда
нужно остановиться. Так, рассказывая вам о своем
путешествии в Бостон, я могу начать с разбиения этого события
на: (1) приезд туда, (2) что со мной случилось, пока я там
был, и (3) возвращение домой (я не утверждаю, что это
единственно возможный или наиболее обычный способ
организации отчета о подобном путешествии, но такой способ
является возможным). Далее я могу разбить "приезд туда"
на: (1) приезд в аэропорт, (2) путешествие в самолете и (3)
как меня встретили по приезде (или что-нибудь в этом роде).
Путешествие в самолете может быть разбито на: (1) посадку
в самолет, (2) чтение в самолете, (3) еду, (4) просмотр
плохого фильма, (5) опять чтение или что-нибудь еще.
Конечно, могут быть и отклонения от иерархической
структуры. Любой отдельный эпизод или какой-нибудь
элемент эпизода может заставить говорящего вспомнить об
эпизоде, лежащем за пределами основной иерархии, но который
говорящий решает в данный момент вербализовать.
Например, при изложении одного эпизода, запомнившегося из
фильма про мальчика, один из опрашиваемых написал:
«Он шел по каким-то тропинкам и подошел к старой,
выщербленной детской горке. Мне нравится эта сцена,
потому что в ней показаны красочная горка, красная
пожарная машина и водонапорная башня на фоне сельского
пейзажа. Итак, мальчик на этой горке.." Комментарий
пишущего о том, что ему нравится эта сцена, находится вне
основной иерархии событий, которые он описывал. Этот
комментарий образует вставной эпизод, который нельзя
точно согласовать с основным иерархическим деревом.
(Интересно заметить, что употребленное здесь словечко
"итак" служит способом возвращения к основной иерархии.)
Отступления такого рода обычны. По-видимому,
существуют значительные индивидуальные различия, касающиеся
того, в какой степени говорящие следуют связной иерархии
расчленения эпизода (в противоположность нагромождению
отступлений друг на друга). Но даже "самые
организованные" вербализаторы склонны время от времени вставлять
отступления.
Когда мы разбиваем большой эпизод на меньшие, мы
делаем это не произвольным образом — мы находимся под
влиянием уже существующих в нашем уме определенных
стереотипных моделей. Например, какой-то из больших
"кусков" своего опыта я могу интерпретировать как отдель-
42
ный случай путешествия на самолете. Поскольку раньше я
уже совершил несколько путешествий на самолете, данный
случай не является для меня уникальным опытом.
Действительно, интерпретация этого случая как путешествия на
самолете означает, что у меня в уме уже имеется
соответствующая модель: модель, которая включает в себя некий тип
разбиения на подэпизоды (и отношения между ними). Я буду
называть такую модель "схемой", употребляя термин,
введенный приблизительно в том же значении Бартлеттом
(Bartlett, 1932). (Недавно для аналогичных понятий
были предложены такие термины, как "фрейм"
(Goffman, 1974; Minsky, 1974) или "сценарий" (Schank
and Abelson, 1975)).
Схема, таким образом,— это стереотипная модель, с
помощью которой организуется опыт, и в более
специфическом значении — модель, которая диктует способ
расчленения определенного большого эпизода на меньшие.
Представляется правдоподобным, что опыт по большей части
интерпретируется с помощью схем. Иными словами, с нами
происходит довольно мало такого, что мы бы не
интерпретировали в терминах моделей, уже имеющихся у нас в уме.
Эти схемы определяют нашу концептуальную организацию
опыта, наше отношение к нему, связанные с ним ожидания,
а также то, как мы будем о нем рассказывать. Поскольку
последнее имеет для нас первостепенное значение, было бы
неплохо рассмотреть поближе ряд данных, которые имеют
место в области употребления языка и касаются подобных
схем.
Следующий ниже текст является отрывком из истории,
рассказанной мне Сэди Бедока Уэллером из Анадарко
(Оклахома) (в оригинале эта история существует на языке кад-
до). Вот перевод первой части:
«Говорят, что однажды, давным-давно, мистер Дикий
Кот выкапывал корни, чтобы разбить сад. Вскоре он
услышал, как кто-то разговаривает. Рядом стоял мистер Индюк.
Мистер Индюк сказал:
— Ну-ну. Я вижу, ты занят. Что ты делаешь?
— Я выкапываю корни, чтобы разбить сад. А ты что
делаешь?
— Ничего. Я просто брожу вокруг.
— Ты мне мешаешь,— сказал мистер Дикий Кот,
поймал его, ощипал и сказал: "Иди ко мне домой, там моя жена.
Скажи ей, чтобы она тебя поджарила, и я съем тебя на обед".
43
Мистер Индюк пошел и пришел к миссис Дикой Кошке. Она
качала колыбель и напевала. Мистер Индюк сказал: "Там
твой муж, он послал меня сказать тебе, что ты должна
поджарить для меня зерна. Когда ты это сделаешь, я пойду
своей дорогой". Она быстро приготовила ему зерно, и он
ушел.» (Как это ни грустно, но несмотря на свою
находчивость, индюк в конце концов был съеден диким котом, но
это уже другая часть рассказа.)
На определенном уровне расчленения эпизода мы можем
сказать, что подобная история состоит из "сцен", каждая
сцена — это нечто, происходящее в известном месте в
известное время, наподобие сцен в пьесе. Между сценами
наблюдается резкий переход либо к новому месту действия,
либо к новому времени действия, а чаще всего — и к тому,
и к другому. Выборка, приведенная выше, показывает
организацию происходящего в виде двух сцен, одной — в
поле, а другой — в доме дикого кота.
Каждая сцена организована, по-видимому, согласно
одной и той же схеме. Можно заметить, что в начале каждой
сцены (когда поднимается занавес) на подмостках
находится некто, чем-нибудь занятый. В первой сцене это мистер
Дикий Кот, выкапывающий корни, во второй — миссис
Дикая Кошка, качающая колыбель и напевающая
колыбельную. Затем следует приход гостя, в обоих случаях —
индюка, далее ведется разговор между гостем и персонажем,
находящимся там с самого начала которого я буду
называть хозяином. Потом хозяин делает что-нибудь для гостя
или против него, в первой сцене — ощипывает его, а во
второй — снабжает его приготовленным жареным зерном.
Наконец, гость уходит. Эта схема, следовательно, состоит
из следующих общих типов эпизодов:
Фоновое действие
Приход гостя
Разговор между гостем и хозяином
Действие хозяина, направленное на гостя
Уход гостя.
Та же схема обнаруживается в ряде историй каддо, где,
конечно, могут развертываться совсем иные конкретные
события. Эта схема может даже составлять организационный
принцип создания эпизодов на более высоком уровне,
то есть для рассказа в целом, а не только для отдельных
сцен внутри его. Например, есть история, в начале которой
несколько уток заняты такой игрой: они бросают свои глаза
44
в реку, ныряют за ними и выныривают у другого берега
уже с глазами на своем месте. Хотя этот эпизод
соответствует по "размеру" (по объему вербальной разработки)
целой сцене, он относится к фоновому действию, которое
образует лишь начальный сегмент схемы, которая была
проиллюстрирована выше. Затем приходит Волк и далее
следует разговор между ним и утками. В конце Волк сам
включается в игру, но утки похищают его глаза под водой
и подменяют их желтыми плодами под названием "костяная
крапива". Это действие хозяина, направленное на гостя.
Потом Волк, ослепленный, уходит. Итак, схема, с помощью
которой в предыдущей истории формируется базис
нескольких отдельных сцен, здесь выступает как базис для целой
сказки.
Схемы являются не только способом организации речи;
они также являются способом интерпретации опыта,
почерпнутого из окружающего нас мира, и способом
организации поведения. Каддо, как и другие группы
американских индейцев, по традиции значительную часть своего
времени уделяют тому, чтобы навещать друг друга. Хождение
в гости — это стереотипная модель поведения, которая
играет важную роль в повседневной жизни. Можно заметить,
что схема, проиллюстрированная на примере народных
сказок, приведенных выше, на самом деле является схемой
такого визита. В то время когда хозяин чем-то занят,
приходит гость, далее следует разговор, затем имеет место
действие, направленное на гостя, обычно угощение, после
которого гость уходит. Таким образом, данная схема лежит в
основе одного из самых обычных событий в жизни каддо
и предопределяет то, что можно ожидать при подобном
событии.
ПОСТРОЕНИЕ СУЖДЕНИЯ
Процесс разбиения больших эпизодов на меньшие не
является бесконечным; в то же время он и не приводит еще
к уровню языковых форм. Говорящий начинает с большого,
объемлющего эпизода, извлеченного из памяти, и путем
его расчленения приходит к небольшим, менее крупным
эпизодам. Но эти меньшие эпизоды по своему характеру
не отличаются от более крупных: все они являются
воспоминаниями о ситуациях и событиях. Это еще не язык, а
"идеи". Прежде чем в итоге будет достигнут языковой уро-
45
вень, должны быть применены еще некоторые процессы
иного характера.
Следующий шаг в направлении к языку — "построение
суждения" (propositionalizing). Он отличается от
расчленения эпизода тем, что дает на выходе такой материал,
который отличается по своему характеру от того, что
был на входе. Чтобы пояснить это положение, необходимо
разграничить, с одной стороны, события и ситуации (или
представления о них), а с другой стороны, предметы (или
представления о них). Разница между ними может быть
определена в терминах пространства, времени и конкретности
(particularity). События (типа того, которое можно
вербализовать как "Собака опрокинула стул") или ситуации
("Собака находится под стулом") конкретны в плане и
пространства, и времени. Подобное событие привязано к единственной
уникальной, ограниченной части пространства и к
единственному уникальному, ограниченному сегменту времени.
(Я воздерживаюсь от рассмотрения здесь родовых
представлений, которые вербализуются во фразах типа "Собака
черная", что требует особого рассмотрения, которое увело
бы нас слишком далеко.) Предмет (object), с другой
стороны, по-видимому, определен в пространстве, но не во
времени. Конкретная собака, конкретный стул, которые
упоминались в вышеприведенных примерах,
характеризуются продолжающимся существованием во времени, чего
нельзя сказать о конкретном событии или ситуации.
Поэтому один и тот же предмет обычно включается в большой и
неограниченный набор различных событий. Конкретное
опрокидывание стула — видимо, только одно из большого
числа событий, в которых участвовала конкретная собака.
Каждое событие занимает относительно малый конкретный
сегмент времени. Собака присутствует во всех таких
событиях, и поэтому считается, что ей свойственно
продолженное существование во времени на всем протяжении того
множества временных интервалов, когда мы не знаем, что она
делает, не знаем конкретных событий, в которых она
участвует.
К тому, что сказано выше, должно быть добавлено
множество оговорок. Например, конкретные собаки или стул
все-таки занимают определенный сегмент времени в том
смысле, что в какой-то момент они появляются на свет, а в
какой-то другой момент перестают существовать. На свете
довольно мало предметов, у которых нет определенного
46
"времени жизни" в этом смысле. Но такие сегменты времени
в большинстве случаев соотносятся с человеческим опытом
совершенно иначе, чем сегменты времени, занятые
событиями. Грубо говоря, я думаю, правомерно утверждать, что
промежуток времени, занятый типичным событием,
укладывается в промежуток сознательного внимания. Вероятно,
большинство событий, с которыми мы сталкиваемся, можно
охватить во всей их полноте на уровне того, что я в другом
месте назвал "поверхностной памятью" (Chafe, 1973),
когда в сознании удерживается целый сегмент времени от
начала до конца, без отсылки к более глубоким уровням
памяти. Хотя, очевидно, это верно не для всех событий,
мне кажется, что именно так обстоит дело с событиями,
рассматриваемыми на стадии расчленения эпизода,— стадии, на
которой и происходит построение суждения. И, возможно,
данный факт тесно связан с нашим представлением о том,
что такое событие (в смысле прототипа). Мне кажется, что
типичное время жизни предмета — величина иного
порядка, чем типичный сегмент времени, занимаемый событием,
и мы поэтому представляем себе эти два явления как
разнородные. Насекомое, чье время жизни измеряется долей
секунды, в непосредственно понятийных терминах
может трактоваться скорее как событие, чем как предмет.
Если мы все же представляем это насекомое как предмет, то
только по аналогии с типичной формой жизни животного,
период существования которого значительно дольше
периода существования насекомого.
Все это рассуждение потребовалось нам для того, чтобы
подвести к утверждению, что пропозиционализация
заключается отчасти в выделении из события (или ситуации)
предметов, в нем участвующих. Предположим, например, что я
думаю об определенном событии. Я могу вербализовать мое
знание этого события в виде "Потом я съел сандвич", выбрав
для вербализации два предмета — себя и сандвич. То же
самое исходное событие я могу вербализовать как "Потом
я поел", с выделением только субъекта, себя, или,
возможно, как "Потом я съел салями в сандвиче", где салями
включено в качестве третьего предмета. Обычно существуют
несколько различных способов, с помощью которых объекты
могут быть выделены из события, это и есть один из
аспектов интерпретации события говорящим.
В некоторой степени описанный здесь процесс
аналогичен процессу разбиения больших эпизодов на меньшие эпи-
47
зоды, но между ними есть два различия. Во-первых,
объекты, выделяемые из события,— это явления иного рода, чем
само событие. Во-вторых, само событие не теряется при этом
процессе. В конечной вербализации событие обычно
представлено глаголом, например словом "съел" в
предложениях, приведенных выше. Таким образом, если рассуждать
в терминах последовательных подстановок, то при
расчленении эпизодов больший эпизод заменяется сочетанием
меньших эпизодов, а при пропозиционализации эпизод
заменяется сущностью иного рода: структурой, состоящей из
события (или ситуации) плюс — в качестве отдельных
элементов — предметы, которые говорящий выбрал для
вербализации в качестве участников события. Подобная
структура примерно соответствует тому, что традиционно
называется суждением (proposition), и мы можем представить
ее, например, как „съел (я, сандвич)" или другими
эквивалентными способами нотации.
Но это еще не все, что можно сказать о подобной
структуре. Важно отметить, что каждый из предметов, выбранных
для отдельной вербализации, играет свою особую роль в
событии или ситуации. Главный вклад так называемой
падежной грамматики заключается в осознании существования
и значения этих ролей. Так, предложение "Потом я съел
сандвич" содержит не только вычлененные из целостного
события идеи "меня" и "сандвича", но также и решение
рассматривать "меня" как "агенса" события, а "сандвич" — как
"пациенса". Имена, которые мы даем этим ролям, не
являются предметом обсуждения настоящей статьи;
единственно, что хочется заметить, это то, что предметы,
ассоциируемые с событием, участвуют в нем по-разному. Стандартная
нотация, принятая для суждений, является неполной,
потому что не дает фиксированного способа указания на эти
роли. Я не буду больше говорить здесь о том, какие бывают
конкретные роли или каким способом их лучше всего
обозначать. Я полагаю, что необходим новый способ выделения
падежных ролей, но тот факт, что они существуют и важны
для вербализации, не подлежит сомнению.
Короче говоря, когда в результате расчленения
достигнут эпизод оптимального для вербализации размера,
говорящий должен интерпретировать его через посредство
суждения. Построение суждения включает: (1) выделение
предметов из события или ситуации, охватываемой эпизодом,
48
и (2) приписывание ролей этим предметам в рамках данного
события или ситуации. Но пока еще мы не достигли уровня
языка.
КАТЕГОРИЗАЦИЯ
Возможно такое положение, когда в уме присутствует
некоторый формат суждения, однако еще не принято
решение по поводу того, какие конкретные слова нужно
употребить, чтобы передать представление о событии и
представления о предметах, которые были интерпретированы
как участники этого события. Например, представим
себе, что говорящий интерпретировал какое-то событие как
"перемещение", то есть как событие, при котором обладание
определенным предметом переходит от одного индивидуума
к другому. К этому моменту он не должен был еще решить,
передать ли свою идею этого события глаголом "дать",
или глаголом "вручить", или, может быть, каким-нибудь
другим глаголом, например "передать". Более того, он не
должен был еще решить, выражать ли идею первого
обладателя, назвав его "Дуг", "высокий парень", "ваш сын",
"мальчик слева" или каким-нибудь другим образом,
соответствующим данному случаю. Следовательно, итоговое
предложение может иметь форму: "Дуг дал другому
мальчику книгу", "Высокий парень передал словарь Стиву", а также
ряд других вариантов, ни один из которых не обязан был
предопределяться решением, принятым ранее о характере
суждения, выражающего данное событие. Мы можем
представить себе любое число предложений с такой же
пропозициональной структурой — бенефактивный глагол, агенс,
пациенс, бенефициарий,— но с разными словами или
фразами, используемыми для передачи представлений о каждом
из этих элементов.
Некоторые конкретные объекты имеют свои метки —
имена собственные, как мы их называем. Это относится,
вероятно, к определенным типам объектов, особенно к
лицам и местам, которые нам знакомы и о которых нам
приходится неоднократно говорить. Но давайте
сконцентрируем наше внимание на том, что происходит, когда
говорящий имеет в виду конкретный предмет или событие, которые
не имеют собственного названия. Важный момент, на
котором будет основываться дальнейшее рассуждение, состоит
в следующем: чтобы передать подобного рода идею,
говорящий должен ее „категоризовать". Он должен принять реше-
49
ние, в соответствии с которым данный предмет или событие
будут интерпретироваться как отдельное проявление какой-
либо категории, которая в благоприятном случае
предоставит в его распоряжение слово, более или менее
удовлетворительно передающее то, что он имеет в виду. Так,
категоризация конкретного объекта как отдельного случая
категории X позволит мне назвать его "блюдо" или "это блюдо".
Категоризация конкретного события как отдельного случая
категории Y позволит мне передать его как "ест", "съел"
и т. д.
Пожалуй, лучше всего подойти к проблеме
категоризации, обратившись к примеру обозначений цвета, которые
изучены более тщательно, чем какой-либо другой тип
категоризации. Хорошо известно, что цветовой спектр по
крайней мере с физической, доинтерпретационной точки зрения,
представляет собой континуум, в пределах которого имеет
место варьирование по нескольким измерениям.
Большинство исследователей цветообозначений сосредоточивалось
на двух измерениях: на измерениях тона и светлоты. При
предъявлении цветовой карты в форме прямоугольника,
где тон непрерывно меняется слева направо, а светлота
меняется по вертикальной оси, обнаруживается, что человек
обычно легко обозначает некоторые точки подобной карты.
В этом случае говорят, что эти конкретные цвета обладают
"высокой кодируемостью" (Brown and Lenneberg,
1954). Для наших целей интересно отметить, что легкость
обозначения проявляется четырьмя разными способами
(Браун и Леннеберг упоминают и пятый: количество слогов
в используемом слове). Во-первых, разные люди приходят
к общему соглашению относительно того, как называется
определенный цвет; каждый назовет тот или иной цвет
"красным", "оранжевым" или "синим". Во-вторых, сохраняется
устойчивость (consistency) называния; у одного и того же
человека нет расхождений в разных случаях. Назвав цвет
"красным" один раз, он назовет его "красным" и в другой
раз. В-третьих, скорее всего, он назовет его одним словом
типа "красный", а не с помощью длинной фразы типа
"темный красновато-коричневый". В-четвертых, если он
говорит, а не пишет, он, как правило, произнесет название
немедленно, без колебания.
Будем называть точки с высокой кодируемостью в
пределах спектра "фокусом" различных цветовых категорий.
Таким образом, определенная точка может рассматриваться
50
как фокус категории, который позволяет говорящему
назвать любой отдельный экземпляр одного цвета
"красным". По мере удаления от этих фокусов кодируемость
понижается и в большей части спектра находятся цвета с
относительно низкой кодируемостью. Для цветов, по крайней
мере, нет четкой границы между категориями, но есть
постепенное удаление от фокуса одной категории или
постепенное приближение к фокусу другой. Признаки низкой
кодируемости, конечно, противоположны перечисленным
выше: (1) согласованность между разными людьми по
поводу названия цвета будет меньшей; (2) один и тот же человек
скорее всего назовет цвет по-разному в разных случаях;
(3) более вероятно, что будет употреблена фраза, а не слово
и (4) говорящий перед вербализацией будет, как правило,
колебаться. Эти признаки усиливаются с удалением от
фокуса любой категории.
Это же самое свойство фокусности, очевидно,
присутствует и в категориях иных, чем цветовые (Rosch, 1973);
представляется несомненным, что относительная
кодируемость — довольно общее явление. Мы упоминали об этом
ранее в связи с событием, когда мальчик съехал (slid) с
горки (slide). Мы можем сказать, что воспоминание о
предмете, с которого он съехал, обладало в нашем эксперименте
высокой кодируемостью, доказательством чему служит тот
факт, что 99 процентов людей, которые вербализовали эту
часть знания, употребили слово slide; далее, тот факт, что
наблюдалась стопроцентная устойчивость, когда один и
тот же человек вербализовал свое знание одного и того же
предмета восемь недель спустя; и, наконец, тот факт, что
среднее количество модификаторов, используемое во всех
вербализациях, составляло 0,33, что является довольно
низкой цифрой. Поскольку вербализация в этом случае
происходила в письменной форме, никаких данных
относительно колебаний нет. Однако последующая работа над
записанными на магнитофон рассказами обнаружила
значимость колебаний (или их отсутствие) как дополнительный
показатель степени кодируемости.
Мы можем сравнить этот предмет с высокой
кодируемостью — slide — с другим предметом, который
появляется в том же фильме. Этот предмет не характеризуется
высоким процентом согласованности при назывании; он получил
в эксперименте много разных названий (см. табл. 1).
Устойчивость наименования этого предмета составила 65%.
51
Таблица î
Употребленное название
structure 'сооружение'
tower 'башня'
platform 'платформа'
jungle gym 'устройство с перекладинами для
детских игр'
construction 'конструкция'
scaffold(ing) 'строительные леса'
monkey bars 'сооружение для лазанья'
frame 'рама'
playhouse 'домик для игры'
apparatus 'приспособление'
stand 'стойка'
tree house 'бревенчатый домик'
kiddy climb 'стенка на детской площадке'
building 'здание'
monolith 'монолит'
bandstand 'эстрада'
set-up 'устройство'
equipment 'оборудование'
contraption 'хитроумное приспособление'
set of bars 'набор брусков'
swing-set 'шарнирное устройство'
maze 'лабиринт'
practice pole 'вышка для упражнений'
Процент лиц,
употребивших
данное название
28
20
17
12,5
5,5
5
2
1
1
<1
<1
<1
<1
<1
<1
<1
<1
<1
<1
<1
<-1
<1
<1
Это значит, что люди, которые дали объекту
определенное имя сразу после просмотра фильма, употребляли то же
имя 8 недель спустя в 65 процентах случаев. Это, а также
другие наблюдения показывают, что для предметов с низкой
кодируемостью устойчивость имени имеет тенденцию
находиться в пределах, не намного превышающих 50 процентов,
тогда как для предметов с высокой кодируемостью она
приближается к 100 процентам. Можно предполагать, что
довольно высокое значение величины устойчивости у пред-
52
метов с низкой кодируемостью объясняется тем, что многие
люди помнят, как они назвали данную вещь в первый
раз. Прежний выбор, вероятно, предопределяет то, что
говорится в последующих случаях. Среднее количество
модификаторов, использованных для данного объекта,
составляло 1,39, в противоположность 0,33 для "горки" с высокой
кодируемостью, упомянутой выше.
Конкретные события также могут обладать высокой или
низкой кодируемостью. Категоризация событий, вероятно,
осуществляется вполне аналогично категоризации
предметов, по крайней мере в рассматриваемом аспекте. Так, по
Таблица 2
Употребленный глагол
climb 'взбираться'
walk 'идти, шагать'
play 'играть'
crawl 'ползти'
clamber 'карабкаться'
explore 'исследовать'
scramble 'взбираться, карабкаться'
inspect 'изучать'
made his way 'направляться'
go 'идти'
run 'бежать'
investigate ' обследовать'
step 'шагать'
bounce 'скакать'
meander 'брести'
jump 'прыгать*
pause 'задержаться'
fool around 'болтаться'
move 'двигаться'
mess 'бездельничать'
rummage 'рыться'
proceed 'продолжать идти'
Процент лиц,
употребивших
глагол
39,5
20
17,5
3
2,5 1
2,5
2,5
2
2
1,5
1
1
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
53
поводу события на горке согласованность в употреблении
глагола slide 'Скользить, съезжать, скатываться' была
равна 86%. (Выбирались также следующие глаголы: go
'поехать', come 'приехать', glide 'скользить', float
'спускаться', shoot 'мчаться', take off 'соскакивать'. Обычно
употреблялся глагол из двух слов, в котором только что
упомянутое слово уточняло способ передвижения, а второе
слово — направление. В 98% случаев вторым словом было
down 'вниз'. Относительно высокая кодируемость этого
события проявлялась также в устойчивости, с которой один
и тот же человек употреблял одно и то же слово 8 недель
спустя. Устойчивость составляла 83% для слова,
выражающего способ передвижения, и 91% для слова, выражающего
направление.)
Мы можем сравнить данное событие с другим событием
из того же фильма, которое включает в себя действия
мальчика на старой заброшенной пожарной машине. То,
что он делал, грубо говоря, заключалось в том, чтобы
залезть на машину сзади и двигаться вдоль нее по
направлению к передней части. Употребленные глаголы перечислены
в таблице 2.
Таблица 3
Второй употребленный элемент
on 'на'
through 'через, сквозь'
over 'по'
around 'вокруг'
to the front 'вперед'
the length of 'до конца'
in 'в'
across 'поперек'
along 'вдоль'
forward 'дальше, вперед*
from back to front 'от задней к передней
части'
with 'с, у'
Процент лиц,
употребивших
второй элемент
26,5
26
17,5
7
6
4,5
4
2,5
2,5
1,5
1,5
0,5
54
Обычно здесь тоже употреблялся глагол из двух слов, со
вторым элементом, выражающим направление движения,
и выбор этого второго элемента также отличался
довольно низкой согласованностью (см. табл. 3). В этом
случае устойчивость в выражении способа передвижения
составила 53% по прошествии 8 недель, а для направления
движения — 50%.
Описываемые результаты можно наглядно представить
с помощью рис. 3 и рис. 4.
знание/ ассоциированное
с концептуальной единицей
концептуальная единица
вербальное выражение
горка
Рис. 3
Точка, обозначенная через X на рис. 3, должна
представлять знание говорящим конкретного предмета в той
мере, в какой это знание является цельной сущностью —
единым, дискретным кусочком знания. Маленький кружок
сверху, с которым связан X, должен представлять то, что
говорящий знает об X: возможно, его различные свойства,
а, возможно, и аналогический тип знания, который нельзя
описать в терминах одних суждений и который, по
крайней мере для иных говорящих, проявляется в сознании
в виде мысленного образа X.
55
Предположим, что говорящий построил суждение о
каком-то событии таким образом, что он хочет выразить
X как один из предметов, участвующих в событии. Тогда он
должен найти слово или фразу, которые установят связь
с X в уме слушающего (или создадут в нем соответствующий
X). Будем считать, что в этом примере слушающий не имеет
предварительного знания X, так что одним из результатов
произнесения говорящим синтезируемого им предложения
будет создание X как новой единицы знания в уме
слушающего. В таком случае необходимо передать знание X таким
образом, чтобы слушающий получил достаточное
представление о том, что такое X, то есть говорящий хотел бы, чтобы
у слушающего возникла идея X, содержание которой в
некоторой степени приближалось бы к содержанию,
представленному маленьким кружком над X в нашей схеме. Скорее
всего, содержание, полученное слушающим, не будет столь
же богато, как содержание у говорящего, но ему
необходимо получить содержание, достаточное для понимания
ситуации. Чтобы предоставить слушающему такое содержание,
говорящий прежде всего должен интерпретировать X как
проявление некоторой категории.
Точка, обозначенная А, должна представлять
определенную категорию в том смысле, в каком категория может
рассматриваться в качестве дискретной понятийной
единицы. Большой круг сверху, с которым связано А, должен
представлять содержание этой категории, которое, как я
предполагаю, имеет и дискретные, и аналогические
свойства. Мы можем предположить, что в уме говорящего имеется
очень большое число подобных категорий и что задачей
говорящего при категоризации его представления об объекте
X является возможно большее приближение содержания X
(маленький круг) к фокусу какой-то категории. Мы вполне
можем считать, что содержание большинства категорий, как
и то, которое представлено здесь большим кругом, имеет
фокус и постепенное "обесцвечивание" по мере удаления от
фокуса, как в случае цветовых категорий, исследованных
в этом отношении лучше всего. Другими словами,
маленький круг можно рассматривать как аналог цветового
осколка, для которого кто-то пытается подобрать подходящую
цветовую категорию. Большой круг представляет (часто
неясно определенную) границу категории, и мы можем
допустить, что где-то внутри него находится фокус, аналогичный
фокусу, например, категории красного цвета.
56
В этом случае мы считаем, что X обладает высокой коди-
руемостью, или, иначе говоря, что X близок к фокусу
некоторой категории,, а именно категории А. Тогда X будет
интерпретироваться как проявление категории А с высокой
степенью согласованности, устойчивости и отсутствия
колебаний, а модификаторы окажутся ненужными.
Предположим, что в этом случае главный результат указанной
интерпретации будет заключаться в том, что X можно назвать
"горкой". Когда слушающий
слышит, что X назван этим именем,
он вводит в свой ум новую единицу,
соответствующую X, содержание
которой соответствует тому, что
задается фокусом категории горки в
его собственном знании. При
оптимальных обстоятельствах, когда X
обладает высокой кодируемостью
и когда содержание
рассматриваемой категории очень сходно у
говорящего и у слушающего,
говорящий достигнет цели передачи
содержания, очень близкого к
содержанию, с которого он начал,
а именно содержания X. Во
многих случаях передача не будет
столь эффективной, но очень часто
расхождения оказываются незна- tower
ЧИТеЛЬНЫМИ. 'башня'
Рис. 4 показывает, что происхо- рис. 4
дит при низкой кодируемости.
Единица знания, которую необходимо передать, обозначена
через Y.
Будем считать, что в процессе поиска в категориальном
пространстве такой категории, содержание которой имеет
фокус, близкий к содержанию Y, говорящий не достигает
цели. Лучшее, чего он в состоянии достичь,— это
категория В, но содержание Y лежит на периферии содержания
этой категории, а не близко к фокусу. Предположим, что
категория В предоставляет в его распоряжение слово tower
'башня', для обозначения конкретных вещей, которые
интерпретируются как отдельные проявления этой категории.
Беда в том, что, называя Y 4башней', говорящий передает
содержание, близкое к фокусу категории башни — прото-
67
типической башни. Но в этом случае говорящий имеет
в виду содержание, которое значительно отличается от
этого фокуса, как это наглядно показано расположением
маленького кружка (над Y) у края большого круга над В.
Эта ситуация и будет называться ситуацией низкой
кодируемости, которая отличается меньшей согласованностью
и меньшей устойчивостью при категоризации; при такой
ситуации человек скорее всего будет колебаться, а число
используемых модификаторов возрастет.
На этом фоне легко оценить функцию модификаторов.
Рис. 5 иллюстрирует действующий здесь принцип.
Прилагательное или другой модификатор обусловливает
содержание, пересекающееся с содержанием исходной категории.
Зона, определяемая этим пересечением, является в
некотором смысле новой, ad hoc, категорией, она. создана
говорящим со специальной целью более точной передачи
содержания, которое существует в его уме.
В этом примере мы можем допустить, что
неудовлетворенность говорящего категоризацией Y как отдельного
случая категории "башни" за-
ставила его употребить
модификатор С —
"разноцветная" и модификатор D —
"деревянная". Пересечение
содержания Си De
содержанием В определяет
единицу, более близкую к
той, которую говорящий в
уме связывает с Y.
Намерение говорящего состоит
в том, чтобы слушающий,
слыша выражение
'разноцветная деревянная
башня', формировал в своем
уме содержание, близкое
к мысли говорящего.
Могут быть употреблены,
конечно, и более сложные
конструкции из
модификаторов. Если говорящий
произносит "высокая
красно-белая платформа, похожая на платформу для перевозки
скота, только более высокая", он создает пересечение, кого-
multicolored wooden tower
'разноцветная деревянная башня'
Рис. 5
58
рое более узко ограничивает нужное содержание. Я думаю,
что функция прилагательных, относительных придаточных
предложений и других модификаторов должна пониматься
в этих терминах.
Можно заметить, что поиск подходящей категории для
представления человека о предмете или событии должен
являться аналогической процедурой, как и подбор нужной
зоны спектра для цветового образца. Он обязательно
включает в себя сравнение одного мысленного представления
с другим — содержания конкретной сущности с
содержанием категории. Этот подбор не является результатом
решения типа "да" или "нет", это вопрос степени.
Конкретная сущность может обладать большей или меньшей
кодируемостью, то есть ее содержание может в большей или
меньшей степени подходить к содержанию некоторой
категории. Такая ситуация, по-видимому, требует, чтобы
мысленное представление соответствовало прототипу либо
непрерывным, либо ступенчатым образом. В этом, очевидно,
заключается сущность аналогического представления,
в противоположность уровню суждений.
ТВОРЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ
Как уже вкратце говорилось в начале настоящей статьи,
многие люди, вспоминая, что они видели раньше или в чем
участвовали (или даже то, о чем им рассказывали),
испытывают субъективное ощущение, что они вновь переживают
первоначальный опыт, причем так, что полная идентичность
отсутствует, хотя и сохраняется много важных сходств.
Этот тип субъективного опыта называют мыслительными
образами. Он не обязан быть, конечно, только визуальным;
слуховые и кинестетические образы, например, также
довольно обычны. Существует старый, но все еще не
разрешенный спор о природе, роли и значении мыслительных
образов в мышлении и языке. Видимо, существуют
некоторые реальные индивидуальные различия в способности
к образному мышлению, которые, может быть, имеют
отношение к разногласиям, еще бушующим в этой области. (См.
Galton, 1907 — о старой, но все еще вызывающей
интерес дискуссии по поводу индивидуальности различий,
а также Pylyshyn, 1973 и Paivio, 1974 — о
современной полемике). Во всяком случае, те люди, у которых
59
сильно образное мышление, во время рассказа о том, что
им вспоминается, испытывают нечто вроде проигрывания
первоначального опыта. Другие, очевидно, в меньшей
степени обладают подобным чувством или даже совершенно
отрицают его наличие, утверждая, что они осознают только
языковые формы.
Важно понять, что предмет, здесь обсуждаемый,— это
природа и роль осознаваемого опыта, извлеченного из
памяти, и что данный вопрос может иметь, а может и не
иметь прямого отношения к фундаментальному вопросу
о том, как знание хранится в подсознательной памяти. При
рассмотрении этого последнего вопроса одно (лишь одно)
из возможных релевантных соображений определяет
степень, в которой этот субъективный опыт образного
мышления, испытываемый многими из нас при извлечении
информации из памяти, должен приниматься всерьез, как ключ
к содержимому памяти. Одна из возможных точек зрения
сводится к тому, что субъективный опыт должен серьезно
изучаться, хотя бы в той мере, в какой память обладает
"аналогическими" свойствами. Согласно другой точке
зрения, образное мышление — вторичное и вводящее в
заблуждение явление, которое дает очень мало или не дает
вообще ничего для изучения того, как в действительности
происходит накопление знания.
Те, кто занимают эту последнюю позицию (напр.,
Pylyshyn, 1973), склонны указывать на то, что образное
мышление, каким бы оно ни было, вне всякого сомнения,
сильно отличается от первоначальных сенсорных стимулов.
Образы, говорят они,— и все, кто размышляет на эту тему,
должны с ними согласиться,— это не "картины" в том
смысле, что процессы интерпретации, применяющиеся при
восприятии, могут быть применены и к ним. Образное
мышление, без сомнения, является, по крайней мере отчасти,
продуктом интерпретации, а не сырым исходным
материалом. Содержимое памяти, а поэтому естественно и то, что
извлекается из памяти, должно быть уже пропущено
через фильтры процессов восприятия. Образное мышление,
по-видимому, никак не может быть прямой копией
первичных сенсорных стимулов. Вы можете практически
проверить это на себе, если посмотрите на некоторую сцену
короткое время и затем отвернетесь. После небольшого
интервала времени попробуйте вспомнить все, что было в сцене —
предметы, отношения и события. Вы обнаружите, что ваше
60
воспоминание и наблюдение самой сцены — вещи
совершенно разные. В частности, я думаю, вы не сможете
"индивидуализировать" — различить в качестве дискретных
единиц — предметы или события, которые не были
индивидуализированы, пока вы смотрели на саму сцену. Хотя я не
знаю о психологических экспериментах, специально
направленных на выяснение этого вопроса, но, по крайней
мере интуитивно, кажется правдоподобным, что
индивидуализация объектов и событий — это нечто, происходящее
только при наличии стимула. Если в это время
индивидуализация не завершена, то она не может быть завершена и
позже. Конечно, вполне вероятно, что мы вспомним или
введем при вербализации предметы, которых не было в
первоначальной сцене. Память прекрасно может быть
конструктивной в том смысле, что она добавляет те вещи, которых
изначально не было (см. Bartlett, 1932;
Münsterberg, 1909) Но извлечение из памяти всего того, что
соответствует действительности, того, что получено от
первоначального стимула, не допускает последующей
индивидуализации, которая не была бы уже завершена ранее.
Но это еще далеко не все. Индивидуализация — не
единственный из процессов интерпретации, применяемых к
сенсорному материалу. Одно дело — идентифицировать,
например, наличие в сцене некоторого дискретного предмета.
Совсем другое — определить, что этот предмет выступает
как проявление некоторой категории, например, что он
является таким предметом, который может быть назван
животным, или собакой, или далматским догом.
Категоризация, по-видимому,— особый случай такого рода
обработки, который я за отсутствием лучшего термина назову
"типизацией". Основная идея состоит в том, что мы постоянно
считаем необходимым интерпретировать конкретные
предметы, ситуации и события, каждое из которых выступает
как отдельный "элемент" в качестве проявлений (instances)
общего типа. И хотя кажется вероятным, что
индивидуализация происходит только во время восприятия, может
оказаться, что типизация происходит либо при восприятии,
либо при вербализации. Несомненно, процесс типизации
происходит во многом в то же время, когда предмет
находится на стадии индивидуализации. Например, когда я
различаю что-нибудь в сцене в качестве дискретного
предмета, я могу также одновременно идентифицировать этот
предмет как отдельный пример того типа (категории), кото-
61
рый позволит мне назвать его собакой. Или в то время,
когда я выделяю дискретное событие, я могу
идентифицировать его как отдельный пример бега. Но, как мы уже
видели в случае категоризации, значительная часть
типизации происходит также и при вербализации — во время
процесса говорения.
Я думаю, что для познания принципов действия языка
важно осознать, что многое из происходящего во время
преобразования мыслей в слова зависит от характера
интерпретации этих мыслей; мы не просто трансформируем
глубинные структуры в поверхностные, и при этом
глубинные структуры якобы уже содержат все необходимые
понятийные интерпретации. Рассказ о чем-то,
извлеченном из памяти,— это творческая деятельность в том
смысле, что рассказчик во многих местах должен делать
выбор, который будет отражать специфическую
интерпретацию его мыслей, лежащих в основе рассказа. В то же
время это по необходимости искажающий процесс, потому что
такой выбор скорее всего не отразит мысли говорящего
абсолютно адекватным образом. Говорящего, вероятно, не
оставит ощущение, что слова, которые он произнес, не
передали точно то, что он имел в виду. И, рассказывая о том же
самом позднее, он, вероятно, будет делать другие выборы —
вербализовать информацию хотя бы частично по-иному.
Короче говоря, по-видимому, есть два основных типа
процессов, участвующих в обработке человеком стимулов,
поступающих к нему из внешнего мира: индивидуализация
и типизация. В то время как индивидуализация
происходит, по-видимому, только при восприятии, типизация
может иметь место либо при восприятии, либо при
вербализации. Последняя возможность говорит о том, что
употребление языка — процесс гораздо более творческий, чем это
обычно считается. Пока мы специально рассматривали
творческую природу только категоризации. Но выше
обсуждались и два других типа процессов вербализации:
расчленение эпизода и построение суждения. Интересно
поэтому было бы рассмотреть, является ли способ их
применения при употреблении языка тоже творческим по своему
характеру. Есть ли, например, какие-либо свидетельства
того, что говорящие делают выбор при расчленении эпизода
или пропозиционализации во время процесса говорения, как
это имеет место в случае с категоризацией. Если это так, то
мы можем заключить, что, как и категоризация, эти типы
62
интерпретаций не обязательно составляют необходимую
часть знания или памяти, а могут осуществляться в ходе
построения рассказа о том, что человек знает и помнит.
ТВОРЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ ПРИ РАСЧЛЕНЕНИИ
ЭПИЗОДА
Рассказывая об одном и том же в разное время,
говорящий, вполне вероятно, не будет каждый раз применять
одинаковые операции расчленения эпизода. Могут
возникать различия нескольких типов. Например, когда
говорящему дан большой эпизод, он может разбить его
в одном случае на один набор меньших эпизодов, а в
другом — построить набор, частично отличающийся от
первого. Иногда он даже может использовать в разных
случаях разные схемы, так что получаются отличные друг от
друга понятийные интерпретации. Я не буду пытаться
иллюстрировать здесь подобные случаи, но хочу обсудить
только некоторые аспекты того очевидного факта, что
различные подэпизоды в пределах большого эпизода имеют
не эквивалентный статус.
В одной из сцен фильма показано, как мальчик
съезжает с горки. Подэпизоды в пределах этой сцены, которые
были вербализованы хотя бы один раз, включают:
1. arriving at the slide 'подойти к горке'
2. climbing up the back 'забраться сзади'
3. reaching the top 'достичь верха'
4. standing at the top 'стоять наверху'
5. hitching up his pants 'подтянуть штанишки*
6. sitting down 'сесть'
7. sliding down 'съехать'
8. landing at the bottom 'приземлиться внизу'
9. jumping off 'спрыгнуть'
10. standing up 'встать'
11. walking away 'уйти'
He было ни одного человека, который упомянул бы
все эти события, и только (1), (2) и (7) упоминались очень
часто. Рис. 6 показывает относительную частотность
упоминаний. Почти все вербализовали (7) — "съехать".
Больше, чем половина, упомянули (1) и (2), "подойти" и
"забраться" на горку. Остальные события были упомянуты
только некоторыми людьми. Есть искушение приписать
63
эти различия в частотности упоминаний фактору, который
может быть назван "выделенностью" (salience). Поступая
так, мы, конечно, захотели бы сделать нечто большее,
чем просто дать название наблюдению. В частности, мы
хотели бы иметь независимые данные об относительной
1 234 56 78 9 10 11
Рис. 6
степени выделенности среди событий (с учетом конкретной
популяции). Я надеюсь, что в конечном счете убедительные
данные такого типа скоро появятся, но в данный момент
я могу только сделать несколько потенциально
релевантных предположений.
Наблюдалось интересное явление среди людей, которые
описывали фильм вскоре после просмотра и которых
попросили снова описать его через восемь недель. В
позднейших описаниях событие "съехать" по-прежнему
упоминалось почти всеми, в то время как частота упоминания
событий "подойти" и "забраться", ранее превосходившая 50%,
позднее стала меньше 50%. Остальные события, за одним
исключением, вообще не упоминались. Исключение
составляло "уйти", которое было еще упомянуто несколькими
испытуемыми.
Чем же объясняется это ослабление в вербализации
всех подсобытий, за исключением "съехать"? Одно из
возможных объяснений заключается в том, что
выделенность влияет на память, а также на вербализацию и что
через 8 недель вспоминаются только наиболее характерные
события. Другой вариант этого объяснения — все, что
вспоминалось через 8 недель, сводилось к тому, что данная
64
сцена представляла собой реализацию схемы "съезжания",
и эта схема сама обусловила тип реконструкции события.
Согласно этой точке зрения, схема скорее всего определяет
упоминание эпизодов "подойти", "забраться", "съехать" и,
возможно, "уйти". Остальные события, либо являясь
периферийными, либо вообще находящимися целиком вне
схемы, реконструируются с меньшей вероятностью. Такое
объяснение находится в соответствии с теорией памяти
Бартлетта (Bartlett, 1932, pp. 197—214). Еще одно
возможное объяснение заключается в том, что по
прошествии восьми недель люди менее расположены включать в
свое описание второстепенные детали, вне зависимости
от того, помнят ли они их или нет. В условиях более
слабой мотивированности вербализуются только наиболее
выделенные единицы. Приведенные различные
объяснения не являются взаимоисключающими, и на данной
ступени нашего знания мы можем предполагать, что все эти
факторы играют свою роль. Главное, что стоит сейчас
заметить, это то, что на основе рис. 6 можно предсказывать,
какие элементы будут упомянуты в последующих
вербализациях той же сцены.
Последняя из упомянутых выше возможностей, а именно
что человек может выбрать для вербализации только
наиболее выделенные элементы, даже если он помнит и
больше, говорит о тесной связи между выделенностью и
сжатым изложением содержания (резюмированием).
Предположим, что на рис. 6 представлен профиль горной цепи
и что она покрыта туманом, скрывающим все, кроме
наиболее высокого пика. Тогда вербализатор скажет только:
"Он съехал с горки", и этим единственным утверждением
охватит всю сцену. Представим теперь, что туман несколько
опустился и стали видны две следующие высокие вершины.
Тогда вербализатор может сказать: "Потом он подходит
к горке. Он забирается по лесенке и съезжает вниз". Или
представьте, что туман почти совсем рассеялся и
показались некоторые или все низкие вершины. Возможно, тогда
вербализатор скажет: "Потом мальчик подходит к горке.
Он взбирается на горку по лесенке, садится и затем
съезжает с горки. Достигнув земли, он встает и снова
продолжает свой путь в том же направлении, что и раньше". (Все
эти примеры взяты из действительно осуществленных
вербализаций.) Расчленение эпизода, другими словами,
обычно дает говорящему возможность выбирать тот или
3 JST» 531
65
иной уровень детализации, то есть решать, сколько под-
эпизодов вербализовать, но человек не может выбирать
наугад, а должен руководствоваться приоритетами с учетом
выделенности (заметности). Если ситуация позволяет
довольствоваться минимумом деталей, говорящий
вербализует только наиболее выделенный (заметный) эпизод.
В таком случае мы, вероятно, скажем, что он представил
"резюме" того, что было охвачено большим эпизодом.
Включая постепенно все менее и менее выделенные
элементы, он сможет представить возрастающее количество
деталей. Было бы интересно узнать, какие факторы влияют
на решение говорящего о выборе и количестве деталей,
которые, как ему кажется, стоит включить.
Чем определяется выделенность? В конечном счете
недостаточно сказать, что различные эпизоды, определяемые
схемой или возникающие при разбиении большого эпизода,
обладают разной степенью выделенности. Также
недостаточно будет обнаружить различные, по крайней мере
частично независимые методы измерения выделенности.
Более полное понимание этой проблемы требует от нас
решения следующего вопроса: почему один элемент более
характерен, чем другой? Каким бы ни оказался ответ,
он, видимо, будет комплексным; мы не можем ожидать,
что все сводится только к одному фактору.
Один из факторов — это, вероятно, информативная
значимость рассматриваемого элемента — степень его
неожиданности в смысле теории информации. Можно считать,
что повседневный опыт имеет нечто вроде основной линии,
включающей в себя представление о том, что должно
происходить с наибольшей вероятностью. Если бы жизнь
никогда не поднималась выше этой линии, она была бы
крайне монотонна. Но часто жизнь, хочется надеяться,
не такова. В жизни случаются вещи, плохие или хорошие,
до некоторой степени неожиданные, и в той же степени
выделенные (заметные). Но выделенность — это нечто
большее, чем простая неожиданность. Например, мальчик
мог и не подтягивать штанишки на вершине горки, и тем
не менее это событие нельзя, видимо, отнести к
чрезвычайно заметным. Чтобы событие могло считаться в высокой
степени выделенным, оно должно каким-то образом
произвести впечатление на говорящего как событие
интересное или значимое. Возможно, это вопрос о связи
восприятия и предубеждений говорящего, касающихся значи-
66
тельности и тривиальности, но в настоящее время
трудно сказать об этом что-либо еще.
Можно также подозревать, что релевантным фактором
является учет собственного ego говорящего. Например, в
другом эксперименте попросили нескольких людей описать
происшествие, во время которого, помимо всего прочего,
одному человеку завязали глаза. Этот человек был в то
же время одним из вербализаторов, и он заявил, что
повязка неудачна, и ее пришлось завязать заново. Из-за
того, что он сначала мог видеть, а потом лишился этой
возможности, "завязывание заново" было для него заметным
фактом. Зрители же были в ином положении, никто из
них не упомянул о завязывании заново, и, возможно,
только некоторые из них вообще заметили этот факт.
Наконец — и это относится к фактору неожиданности,—
выделенность как-то связана со степенью обусловленности
ряда элементов, предопределяемых данным элементом.
Съезжание с горки было наиболее характерным событием сцены,
потому что оно предсказывало большинство других
событий. Чтобы съехать с горки, нужно к горке подойти,
взобраться на нее и т. д. Основываясь на этом, легко понять,
почему упоминание лишь одного этого события
обеспечивает хорошее резюме всей сцены: это все, что нужно знать,
чтобы узнать все остальное.
Итак, можно считать, что способ разбиения говорящим
больших содержательных эпизодов на меньшие может
меняться при разных вербализациях, он не определяется
алгоритмически "тем, что известно" о данном материале.
Более того, эпизоды, на которые может быть разбит
большой эпизод, значительно отличаются степенью
выделенности. Так, даже если иерархическая схема расчленения
эпизода была адекватной как первое приближение к
представлению о накоплении знания, ее узлы должны быть
маркированы таким образом, чтобы была видна степень
их выделенности. И эта степень должна
предположительно соотноситься некоторым аналогическим образом со
все еще мало изученными факторами выделенности,
которые обсуждались выше.
ТВОРЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ ПРИ ПРОПОЗИЦИОНАЛИЗАЦИИ
Я закончу свою работу примером, показывающим, как
при вербализации одного и того же события, извлеченного
из памяти, человек может принимать в разных случаях
з*
67
различные решения не только в отношении категоризации
и расчленения эпизода, но также и пропозиционализации.
Пример, который я приведу, уже упоминался в моей
статье (Chafe, 1976), но я хочу изложить более подробно
некоторые моменты, рассмотренные там лишь очень бегло.
Вскоре после просмотра фильма один из опрашиваемых
описал одну из сцен следующим образом:
Не picked up some hay and lifted it over the corral fence
and into the corral. All of the animals eagerly went after and
began eating the hay. 'Он поднял охапку сена и перебросил
ее через ограду в загон. Все животные живо подошли и
начали есть сено.'
Вначале у говорящего в уме должен был быть эпизод,
включающий в себя все происшествие (но это был, конечно,
только подэпизод некоторого низкого уровня в пределах
большого эпизода, включающего в себя весь фильм).
Назовем этот начальный эпизод С1. Учитывая разделение
на два предложения и переход от одного субъекта (мальчик)
к другому (животные), мы можем сказать, что C1 сначала
был разбит на два подэпизода С2 и С3, соответствующие
двум предложениям. В пределах С2 имеются три
минимальных события: "поднять", "перебросить через" и
"бросить в". Однако оказывается, что два последних события
в противоположность первому объединены вместе, потому
что имеют общий глагол и объект ("перебросил ее"). На
этом основании мы можем сказать, что С2 сначала был
расчленен на С4 (поднять) и С5, а С5 затем расчленен на С6
и С7. С3 (выраженный вторым предложением) содержит
два минимальных события, которые могут быть обозначены
как С8 (идти за сеном) и С9 (есть его). Вся схема
расчленения эпизода показана на рис. 7.
Помимо расчленения эпизода, говорящий должен
превратить в пропозицию каждый из минимальных
эпизодов — С4, Св, С7, С8, С9. Давайте сосредоточимся на первом
из них. Рис. 8 показывает один из способов представления
пропозиционной структуры при вербализации Не picked up
some hay Юн поднял охапку сена'. Говорящий
интерпретирует это событие в терминах структуры агенс —
пациенс, приписывая роль агенса объекту, обозначенному
через Oi, а роль пациенса — объекту, обозначенному
через О2.
Приняв такое решение, говорящий приступает к
категоризации Oi и О2, а также самого С4. Не помеченные
е>8
стрелки, направленные вверх, показывают результаты
этих категоризации. Говорящий предположил, что Ог уже
находится в сознании слушающего и поэтому представлен
просто местоимением he 'он' (Chafe, 1974). С4 был ин-
С1 {вся сцена)
С2 (действия мальчика) С3 (действия животных)
С4 (поднять) С5 (перебросить) С8 (подойти) (¾ (есть)
С6 (перебросить через) С7 (бросить в)
Рис. 7
терпретирован как проявление категории, которая
находит свое выражение в словах pick up 'поднять', а объект
О2 был интерпретирован как проявление категории,
которая находит свое выражение в словах some hay 'охапка
сена'.
Интересен тот факт, что говорящий, которому
принадлежит только что описанная вербализация, появившаяся
почти сразу после просмотра фильма, через восемь недель
вербализовал ту же сцену так: Не threw some hay over
the top rail of the corral fence to the animals inside. 'Он
кинул охапку сена
чепе pick up hay
'он' 'поднять' 'сено1
А
рез верхнюю
перекладину ограды загона
животным, находившимся
внутри.'
При сравнении двух
вербализаций можно
отметить несколько
моментов. Во-первых,— и
это касается
расчленения эпизода, — во второй раз говорящий провел
пропозиционализацию всей сцены как единого эпизода, а не
разбивал ее таким образом, как показано на рис, 7,
Следовательно, по сравнению с первой вербализацией, он
построил резюме. Во-вторых, он выбрал совсем другой формат
суждения, как это показывает рис. 9. Этот формат
более сложный, чем первая вербализация, как будто
отсутствие разбиения компенсируется более сложной
структурой суждения. Новый формат содержит не только роли
агенса и пациенса, но и еще две роли, обозначенные здесь
просто стрелками,— over 'через' и to 'к'. В этой пропози-
ционной структуре (или структуре суждения) роли
распределены между четырьмя различными объектами — Оъ
Рис. 9
О2, 08 и О4. Нужно особо заметить, что роль, приписанная
О4 (животные), здесь роль бенефициария, полностью
отличная от той роли, которая была приписана О4 при первой
вербализации, когда животные интерпретировались в
качестве агенса, а не бенефициария.
Начав с одного и того же эпизода, Сь находящегося
в памяти, говорящий вербализовал его в двух случаях
совершенно по-разному как с точки зрения процесса
расчленения эпизода, так и с точки зрения
пропозиционализации. Возможно, что представление, хранящееся
в его памяти, подверглось за восемь недель некоторым
изменениям в логическом плане, так что О4 поменял
роль агенса на роль бенефициария. На мой взгляд, однако,
наиболее интересен и наиболее вероятен такой вариант
70
объяснения, согласно которому представление, хранящееся
в памяти, не предрешает вопроса ни об одной из этих
ролей, а его природа позволяет нам выбрать любую из
них. Это заставляет нас сомневаться в соответствии
стрелок agent 'агенс', patient 'пациенс', over 'через' и to 'к'
(см. на рис. 9) истинной структуре содержания
долговременной памяти. И действительно, указанные факты
заставляют сомневаться в адекватности представлений на
рис. 7, 8 и 9 с точки зрения их способности охватить
глубинное знание события у говорящего. В лучшем случае
они, вероятно, содержат только конкретные решения,
принятые в процессе отдельных конкретных вербализаций.
Они показывают не то, что было известно о событии, а
только некоторые аспекты того, как о нем говорилось.
Говорящий принимал также решения о категоризации.
Что касается события Ci, то он интерпретировал его в
схеме на рис. 9 как проявление категории, которая находит
свое выражение в значении слова throw 'кидать'. Сделал
ли бы он то же самое восемью неделями ранее, если бы
захотел вербализовать это событие непосредственно, а не
разбивать его предварительно на меньшие эпизоды, узнать
невозможно. Категоризации нескольких объектов,
участвующих в Сь незначительно изменились после восьми
недель, хотя О8 и получил слегка отличающееся толкование.
Если раньше он был назван the corral fence 'ограда загона',
то затем он получил название the top rail of the corral fence
'верхняя перекладина ограды загона'. Вообще, можно
сказать, что предметы отличались высокой кодируемостью,
судя по устойчивости их категоризации в речи. Тем
не менее, мы знаем из других примеров, что говорящие
часто непоследовательны и подвержены колебаниям при
категоризации и что многие объекты имеют низкую коди-
руемость. Таким образом, не помеченные стрелки,
представляющие категоризацию на рис. 9, в принципе
являются элементами такого рода, которые говорящий может
выбирать по-разному при разных вербализациях одного
и того же события. Эти стрелки также не обязательно
должны представлять содержимое памяти, но только
решения, принятые в процессе вербализации. Подытоживая
сказанное, можно утверждать, что ни одна из стрелок на
рис. 7, 8 и 9 не обязана в принципе представлять то, что
известно о событии, но только решения, касающиеся его
вербализации. Природа знания должна допускать возмож-
71
ность множества интерпретаций такого рода. Наиболее
приемлемый вывод, я думаю, заключается в том, что знание
вообще не обязательно должно иметь формат суждений:
во многих случаях оно принимает формат аналогического
порядка, позволяющий проводить различные его
интерпретации в терминах структуры суждений.
Лингвистика же должна принять к сведению, что четко
определенной или автономной семантической структуры,
лежащей в основе речи (или предложения), не может
существовать. Речь — это творческий процесс, посредством
которого лежащее в ее основе знание, в значительной
степени аналогическое по своей природе,
выкристаллизовывается в пропозиционные и языковые структуры. Правда,
некоторые (возможно, многие) из этих кристаллизации
возникают в первый момент получения знания. Но далеко не
всегда. И для того чтобы объяснить те явления, которые
мы обнаруживаем в языковом употреблении,— такие, как
непоследовательность и колебания при расчленении
эпизода, пропозиционализации и категоризации, и даже такое
фундаментальное явление, как использование
модификаторов,— необходимо осознать, что большая часть нашего
знания находится в еще не выкристаллизовавшемся
состоянии. Если мы как лингвисты заинтересованы в понимании
того, как в действительности работает язык, мы рано или
поздно должны будем расширить наши горизонты, чтобы
включить в круг рассмотрения эти очевидным образом
наблюдаемые аспекты языкового употребления.
ЛИТЕРАТУРА
Bartlett, F. С. Remembering. Cambridge: Cambridge
University Press, 19â2.
Brown, R. W., and Lenneberg, E. H. A study in language
and cognition.— «Journal of Abnormal and Social Psychology», 49, 1954,
p. 454—462.
Chafe, W. L. Language and memory.— «Language», 49, 1973,
p. 261—281.
Chafe, W. L. Language and consciousness.— «Language», 50,
1974, p. 111—133.
Chafe, W. L. Givenness, contrastiveness, definiteness, subject,
topic, and point of view.— In: С L i (ed.). Subject and Topic. New York:
Academic Press, 1975.
Chafe, W. L. Creativity in verbalization and its implications for
the nature of stored knowledge.— In: R. O. Freedle (ed.). Discourse
Production and Comprehension. Hillsdale, N. J.: Lawrence Erlbaum, 1976.
72
Galton, F. Inquiries into Human Faculty and Its Development,
2d ed. London: J. M. Dent and Sons, 1907.
Goffman, E. Frame Analysis: An Essay on the Organization of
Experience, Cambridge: Harvard University Press, 1974.
Hochberg, J. E. Perception. Englewood Cliffs, N. J.: Prentice-
Hall, 1964.
Miller, G. A. The magical number seven, plus or minus two: some
limits on our capacity for processing information.— «Psychological
Review», 63, 1956, p. 81—97.
Minsky, M. A framework for representing knowledge.— In: A. I.
Memo 306, Massachusetts Institute of Technology Artificial Intelligence
Laboratory, 1974.
Münsterberg, H. On the Witness Stand: Essays on Psychology
and Crime. New York: Doubleday, Page, 1909.
Paivio, A. Images, propositions, and knowledge. — In:
«Research Bulletin», 309, The University of Western Ontario, Department of
Psychology, 1974.
Pylyshyn, Z. W. What the mind's eye tells the mind's brain:
a critique of mental imagery.— «Psychological Bulletin», 80, 1973, p. 1—
24.
Rosch, E. H. On the internal structure of perceptual and semantic
categories.— In: T. E. Moore (ed.), Cognitive Development and the
Acquisition of Language. New York: Academic Press, 1973.
Schank, R., and Abelson, R. Scripts, plans, and
knowledge.— In: «Proceedings of the 4th International Joint Conference on
Artificial Intelligence», 1975.
Ч. Филлмор
ОСНОВНЫЕ ПРОБЛЕМЫ
ЛЕКСИЧЕСКОЙ СЕМАНТИКИ *
ЛЕКЦИЯ ПЕРВАЯ
1. Задача настоящих лекций — предложить
неформальный интуитивный подход к описанию значения слова и
значения текста. Моей главной целью является изложение
единой концептуальной основы, в рамках которой могли
бы рассматриваться: значения слов, построение смысла
предложений, интерпретация текстов, а также процессы
выражения и понимания.
Я полагаю, что лингвист в своем стремлении к познанию
проблем семантической теории только выиграет, если будет
исследовать эти проблемы с более широкой точки зрения
построения и понимания текстов. Прежние традиции
семантического анализа тяготели к сужению предмета
анализа в силу своей приверженности к более ограниченным
задачам. Некоторые лингвисты, например Косериу,
прилагали огромные усилия для доказательства того, что
нельзя выходить за пределы собственно и чисто
лингвистических явлений, свободных от всяких связей со знанием,
относящимся к культуре, системам представлений или
фактам мира действительности. Антропологическая
семантика, или так называемая когнитивная семантика,
сосредоточивала свои усилия на раскрытии и представлении
систем противопоставлений в различного рода
таксономиях, и ее стремление к обнаружению простейших способов
* Charles J. Fillmore. Topics in lexical semantics.— In:
"Current Issues in Linguistic Theory" (ed. by Roger W. Cole). Bloomington and
London, 1977, p. 76—138.
© 1977 by Indiana University Press.
Настоящая работа представляет собой изложение содержания
лекций, прочитанных Ч. Филлмором в 1975 г. во время работы летней
школы Лингвистического Института США. Работа приводится с
сокращениями.— Прим. сост.
74
представления таких систем изначально определялось
желанием обнаружить уникальную в культурном отношении
базу данной таксономии в данной языковой общности.
Ученые, придерживавшиеся структуралистских традиций,
согласно которым главный упор делался на выявление
общего значения для любой данной языковой формы, главным
мотивом своей деятельности считали, по-видимому,
объяснение единства языковой формы, сохраняющегося во
времени. В генеративной традиции основное внимание
уделялось системам записи и обусловливалось оно
стремлением получить в конечном счете оптимальное количество
признаков (или абстрактных предикатов — в зависимости
от той или иной школы в рамках этой традиции). Это
одновременно должно было служить своеобразным
индикатором в системе семантических правил для языка —
например правил установления истинности и синонимии,—
а также базой для теоретизирования относительно
языковых универсалий семантики. В противоположность всему
этому свою задачу я вижу в том, чтобы исследование
значения осуществлять в рамках более широкой теории
развития языка, и главным вопросом, на котором
сосредоточу свое внимание в данной работе, будет понимание
текста.
Мне бы хотелось начать свое изложение с рассмотрения
различных ступеней процесса понимания. Одно из
развлечений, которым увлекаются исследователи, занимающиеся
интерпретацией текста, заключается в подборе или
сочинении некоторого текста, который ставит перед теорией
особенно серьезные проблемы и с которым каждая из
сторон предлагает справиться другой стороне. Результатом
таких демонстраций обычно — и вполне закономерно —
было возникавшее обычно чувство пессимизма
относительно перспектив законченной теории текста. Поскольку
мои интересы в настоящее время направлены на раскрытие
этапов процесса интерпретации, а не на объяснение всего
процесса в целом, я предлагаю свой пример сложного текста
с чистой совестью. Я не чувствую себя готовым излагать
безупречную теорию в ее окончательной форме.
Мой текст легко понять. Его сложность заключается
в описании процесса понимания. Он взят из недавнего
выпуска "Signature" — журнала, ежемесячно рассылаемого
владельцам кредитных карточек Diners Club. Статья, по
замыслу явно юмористического характера, касается пуб-
75
личной карьеры профессионального игрока в бейсбол по
имени Пит Роуз. Она в основном содержит описание
забавных событий, случившихся с Роузом во время его
публичных выступлений после окончания спортивного
сезона. Я сосредоточу свое внимание только на одном
предложении из этой статьи, но сначала я хочу рассказать
вам о предшествующем контексте.
Роуз произносил речь в атлетическом клубе в
Цинциннати. Поскольку Цинциннати — родной город Роуза, в
клубе присутствовал его четырехлетний сын. Во время
речи Роуза, незаметно для него, его ребенок пробрался к
трибуне и встал около отца. Роуз, продолжая речь, по
ходу ее произнес остроту, вызвавшую смех, а за ним
последовала короткая пауза. И тут... Вот предложение,
к которому я хочу привлечь ваше внимание:
At precisely that moment a small but amplified voice
notified the entire room, in the most lucid of idioms, of a
common childhood emergency. 'Как раз в этот момент
тонкий, но многократно усиленный голосок известил все
помещение в предельно ясных выражениях об обычной
детской нужде.'
Каждому взрослому человеку, понимающему
английский язык, конечно, ясно, что тонкий голосок принадлежал
ребенку, что на столе был микрофон, явившийся причиной
усиления голоса ребенка, что именно из-за этого усиления
все помещение было "извещено", что в действительности
не "все помещение", а люди, собравшиеся в помещении,
услышали слова ребенка, а также что автор употребил
слово "известил" не в его точном буквальном смысле,
учитывая, что мы догадываемся о возможных
потребностях четырехлетнего ребенка. Далее, по собственному
опыту мы знаем, в чем заключалась нужда ребенка, а из
фразы "в предельно ясных выражениях" мы даже можем
представить себе, какие конкретные слова употребил
ребенок.
Но это не все, что мы знаем относительно данного
фрагмента текста. На другом уровне понимания мы осознаем,
почему этот эпизод был включен в статью. Иначе говоря,
мы знаем, почему читатели найдут его забавным. Мы знаем,
какого рода события вызывают замешательство; мы знаем,
что, когда они случаются с кем-либо другим, а не с нами,
они представляются нам забавными; и мы знаем, что
замешательство не носит серьезного характера, а наше удо-
76
вольствие простительно, поскольку конфуз произошел с
маленьким ребенком.
На следующем уровне мы понимаем, почему автор
описывает этот эпизод непрямым образом. Он не сообщает
нам открытым текстом, что же именно сказал ребенок;
он заставляет нас вычислить это для себя. Возникающий
при этом эффект Роберт Гаскинс — студент университета
в Беркли — назвал теорией смекалки маленького Джека
Хорнера *. Юный Хорнер, обнаружив в пироге изюм,
остался доволен главным образом собой и лишь во вторую
очередь (если он вообще об этом вспомнил) — пекарем.
(Не put in his thumb. And pulled out a plum. And said "What
a good boy am I!" 'Он засунул свой палец, выковырнул
изюминку и сказал: "Какой я хороший мальчик!"') Если
бы изюминка лежала на верхушке пирога, не требуя для
своего обнаружения особого ума или умения со стороны
того, кто лакомился пирогом, то награда и наполовину не
выглядела бы столь заслуживающей одобрения.
2. Как показывает этот пример, когда мы подвергаем
интерпретации сказанное или написанное кем-либо, мы
должны ответить на четыре вопроса:
(I) Что он сказал?
(II) О чем он говорил?
(III) Почему он вообще сказал это?
(IV) Почему он сказал это именно таким образом?
Только первый из этих вопросов, а именно — "Что
он сказал?" — занимает традиционную лингвистику. В
соответствии со своими профессиональными интересами
лингвисты уделяют внимание лишь тому, что было сказано, и
считают свою работу более или менее законченной, когда
разработана система категорий и контрастов, создана
система нотации и, быть может, генеративная теория, что
дает им возможность систематизировать отдельные части
сказанного.
Третий вопрос — "Почему он сказал это?" — приводит
нас в область теории речевых актов и логики высказываний.
(Если кто-то сказал что-либо, то для этого должны быть
какие-то основания. Например, он хотел ознакомить нас
* "Маленький Джек Хорнер" — персонаж детского стиха.— Прим.
пер ев.
77
с информацией, которой располагал. Если это так, то он
полагал, что нам еще не известна эта информация.
Поскольку он сказал это в определенное время, следует
думать, что это находилось в связи с тем, что занимало нас
тогда. Примерно так протекают рассуждения, которые
учитываются в различных версиях теории речевых актов.)
Четвертый вопрос — "Почему он сказал это именно таким
образом?" — относится к области риторики.
Я намереваюсь сосредоточиться на втором вопросе —
"О чем он говорил?" Под этим я разумею не просто предмет
дискурса или части рассматриваемого дискурса, а то, что
мы можем сказать относительно "сцены", или "ситуации",
или "истории", или "мира", или "образа", или чего-то
подобного, что говорящий хотел, чтобы слушающий воссоздал
в данный момент развертывания дискурса.
Проводя неформальный анализ процесса интерпретации
взятого нами для примера предложения, мы можем сказать
следующее. В предшествующей части текста упоминается
банкет в атлетическом клубе и идентифицируется наш
персонаж как почетный гость, произносящий
послеобеденную речь. Мы примерно представляем себе, как это должно
было выглядеть, по собственному опыту. Приведенное
предложение направляет наше внимание на ребенка. Мы
знаем, как звучат детские голоса, а поэтому наше знание
о присутствии ребенка делает возможным заключение о
том, кому принадлежит "тонкий голосок". Наше знание о
микрофоне и его использовании делает понятным
упоминание об усилении звука; мы знаем также, что громкие
звуки могут быть слышны на более далеком расстоянии
и, следовательно, большим количеством людей. Наши
представления о возможных потребностях четырехлетних
детей и о характере отношений, которые могут
существовать между маленьким ребенком и другими людьми,
позволяют нам с определенностью установить, что глагол
"известить" употребляется в данном тексте отнюдь не
серьезным образом. Наши знания о детских потребностях и их
настоятельности — бесспорно, часть нашей общей системы
представлений о маленьких детях — позволяют нам
заключить, к чему сводилась проблема нашего ребенка.
А наше знание альтернативных способов упоминания о
функциях человеческого организма, знание их
социальной окраски позволяет нам понять, что некоторые из
этих оборотов могут быть более прямыми и более "ясными",
78
чем другие. Это позволяет нам угадать, что могло быть
сказано в данном случае.
3. Здесь, конечно, неизбежно возникнет вопрос, в
какой мере уместно говорить о подобных вещах в рамках
лингвистики. Какое отношение к лингвистике как таковой
имеют окружающая обстановка, представления,
предположения, воспоминания о личном опыте и какую роль
играют все эти вещи в процессе "вычисления" того, о чем
идет речь?
Доказательство того, что все эти вопросы имеют прямое
отношение к лингвистике, базируется на следующих
фактах: во-первых, суждения и стратегия интерпретации,
составляющие часть этих процессов, явным образом
оказывают влияние на выбор конкретных лингвистических форм
и категорий; во-вторых, существуют определенные различия
между языками в способах, какими языковой материал
воспроизводит конкретные образы или опытные данные, и,
наконец, в-третьих, все эти понятия делают возможным
формулирование некоторых обобщений относительно
стратегии интерпретации текста человеком. Таким образом,
возможные аргументы сводятся к тому, что приведенные
факты увязаны с выбором языкового материала,
варьированием его от языка к языку и с соответствующими
обобщениями, то есть с вопросами, которые лингвисты, если не
"лингвистика" в узком смысле, должны уметь решать.
При интерпретации текста на естественном языке мы
используем разнообразные суждения и знания. Нам
должен быть известен характер осуществляемого
коммуникативного акта. Нам следует использовать наши знания того,
имеет ли данная коммуникация серьезный или шутливый
характер, сопровождается ли она какими-либо действиями
ее участников и т. д. Например, в разбираемом нами случае
мы используем знание того, что текст сообщает по замыслу
автора о забавных событиях, предназначен для
развлечения и будет прочитан скорее всего в часы досуга.
В любой момент дискурса интерпретатору должны быть
известны сцены, образы или содержащиеся в памяти
данные, которые, так сказать, "активизируются в данный
момент", о чем подробно писал в своей статье У. Чейф 1.
Ранее, в статье из "Signature" мы узнали, что ребенок
присутствовал на банкете. Непосредственно перед рассматри-
1 Имеется в виду статья У. Чейфа: Chafe, W. Language and cons-
. ciousness,— "Language", 1974, Vol« 50, No 1, p, 111—133,
79
ваемым нами предложением указывалось далее, что
ребенок находился вблизи Роуза и что Роуз не знал об этом.
В своем сознании мы рисуем себе сцену послеобеденной
речи, частью которой являются отец и сын, стоящие рядом
друг с другом.
Иногда мы обращаемся к зафиксированному нашей
памятью опыту, иногда — к текущим событиям, иногда —
к процедурам освоения опыта. Память о конфузах в
детстве и о переживаниях, связанных с ними, то есть о
сопровождающем эти конфузы чувстве беспомощности и
зависимости, помогает нам понять, что произошло в данном
случае. Знание происходящего необходимо для
понимания предложений типа "Поставьте это сюда, а это туда".
Мы должны видеть, что говорящий делает, когда он просит
нас сделать это. Что касается процедуры освоения опыта,
то она необходима, например, для понимания предложений
из поваренной книги Джеймса МакКоли, в которой
читатель инструктируется, как месить тесто, «пока оно
не станет по плотности похожим на ушную мочку» 2.
Мы часто должны располагать знанием того, что
специалисты по искусственному интеллекту называют
"сценариями",— знанием условных или обычных
последовательностей поступков, в терминах которых мы анализируем
отдельные "крупные" события через посредство более
"мелких" их частей 3. Мы располагаем, например, сценарием
того типа послеобеденных речей, которые характерны для
атлетических клубов. Мы знаем, что такая речь обычно
состоит (полностью или по крайней мере частично) из
множества шуток, что за шутками следуют паузы, во время
которых аудитория смеется, что общее настроение — во
всяком случае, для идеальной послеобеденной речи —
окрашено хорошим веселым юмором и т. д.
2 Из беседы с Дж. Лакоффом, который сообщил мне об этом факте.
3 См. Abelson, R. The structure of belief systems. —- In:
Roger Schank and Kenneth M. С о 1 b y (eds.)/; Computer Models of
Thought and Language. San Francisco: Freeman, 1973; Charniak, E.
He will make you take it back: a study in the pragmatics of language.
(Technical Report. Istituto per gli studi semantici e cognitivi). Castagnola,
Switzerland, 1974; Minsky, M. A framework for representing
knowledge.— In: P. H. Winston (ed.). The Psychology of Computer
Vision. New York: McGraw-Hill, 1975; Schank, Roger. The structure
of episodes in memory.— In: Daniel G. Bobrow and Allen
Collins (eds.). Representation and Understanding: Studies in Cognitive
Science. New York: Academic Press, 1975,
80
Наконец, мы должны располагать определенными
стратегиями для построения — на основе фрагментов текста
нашего знания мира и нашей оценки авторских целей —
некоторого единого и связного представления о том, что
происходит, то есть некой, хотя, возможно, и комплексной,
но цельной сцены, или истории, или картины мира, которую
мы сможем признать как соответствующую данному
конкретному тексту.
4. Мне могут напомнить, что эта серия лекций носит
название "Основные проблемы лексической семантики".
И в действительности я намереваюсь говорить прежде
всего об использовании упомянутых идей для целей
описания отдельных лексических единиц. Описание значения
лексических единиц, как мне кажется, должно проводиться
таким образом, чтобы была ясна их роль в осуществлении
процессов того рода, о которых я только что говорил.
Иллюстрацию сказанного я начну с рассмотрения наших
знаний о глаголе write 'писать', знаний, которые
позволяют нам понимать последовательности, содержащие этот
глагол, и образуют базу, на основе которой мы
конструируем значение текста и выносим суждения о его
осмысленности.
Глагол write в том своем значении, которое я называю
"прототипным", описывает деятельность, заключающуюся
в том, что кто-то водит по некоторой поверхности
определенным заостренным инструментом, оставляющим следы.
Я полагаю — и, думаю, все согласятся со мной,— что эта
сцена-прототип, связанная с данным глаголом, более или
менее полно определяет то основное содержание, которое
вкладывается в глагол, если при этом отсутствует какая-
либо добавочная информация. Писание в воздухе пальцем
или каким-либо инструментом является отклонением от
этого прототипа и будет понято в тексте соответствующим
образом, если только для этого будет дана ясная
информация или если интерпретатор текста обладает весьма
специфическими знаниями о контексте.
Прототипная сцена, связанная с глаголом write
Писать', следовательно, должна включать индивидуума,
который пишет, инструмент, которым он пишет, поверхность,
на которой осуществляется процесс писания, и продукт
написания, то есть ту или иную конфигурацию следов на
данной поверхности.
Если единственное, что мы знаем о тексте, это то, что
81
он содержит глагол write, сцена, которую мы можем
построить в этом случае, будет вырисовываться лишь на
уровне общих очертаний и включать позиции упомянутых
мною величин, но без всяких добавочных деталей. Однако
мы никогда не имеем дела только с одним словом — оно
всегда включается в текст.
Предположим, я сказал вам Harry has been writing
Тарри (все время) писал'. Вам будет ясно, что сцена,
которую я прошу воссоздать, представляет собой событие
реального мира и что я предполагаю, что вы знаете, кто
такой Гарри. Таким образом, сцена писания, которую
вы воссоздаете в своем уме, включает Гарри как лицо,
осуществляющее данное действие, то есть оперирующее
инструментом, который оставляет следы. Эта сцена отчасти
определяется употреблением длительной формы глагола.
Если бы я сказал Harry wrote Тарри написал', вы
почувствовали бы, что я не закончил того, что собирался
сказать, так как, употребляя форму претерита, мы имеем дело
с законченным актом, а не с продленной во времени
деятельностью, и поэтому у вас есть основания ожидать, что
должно последовать указание того, что именно Гарри
написал. Если бы я сказал Harry writes. Тарри пишет.',
то у вас были бы основания подумать, что я отвечаю на
вопрос о том, чем зарабатывает Гарри себе на жизнь. Как
показывают эти примеры, знания, которыми располагают
пользующиеся данным языком относительно отдельных
слов, могут создавать различные сцены для разных
языковых контекстов — эти различия иллюстрируются здесь
выбором временных и видовых форм глагола. А элементы,
находящиеся в конкретных грамматических отношениях
со словом — такие, как субъект глагола,— каждый по-
своему вносят свой вклад в детализацию сцены, которую
создает для себя слушающий, выступающий в качестве
интерпретатора.
Разумеется, может быть и так, что знание, которое
разделяют говорящий и слушающий относительно Гарри,
уже дает вам в руки готовую рамку, в которую
укладывается информация о занятии Гарри писанием.
Предположим, например, вам известно, что Гарри пишет
диссертацию (дошел до ее середины) и при этом всегда использует
пишущую машинку. Тогда, если вы располагаете
подобными сведениями о Гарри, вы обнаруживаете это в репликах
в следующих диалогах: я говорю вам: "Harry has been
83
writing." Тарри пишет.*, а вы отвечаете: "Has he finished
chapter seven yet?" 'Он еще не закончил седьмую главу?',
или я говорю: "Harry has been writing." Тарри пишет.',
а вы отвечаете: "I thought his typewriter was broken." 'Я
думал, у него сломана пишущая машинка.' Эти ответные
реплики показывают, каким образом описанная типовая
сцена, конкретизированная в предложении, согласуется
с тем конкретным миром представлений, которым владеет
интерпретатор текста.
Если мы не располагаем готовыми сценами, в которые
можно включить описываемую текстом или фрагментом
текста типовую сцену (outline scene), то в этой сцене,
ассоциируемой с текстом, многие "позиции" остаются, так
сказать, пустыми. Я полагаю, что один из способов
исследования значения слова заключается в установлении
того, какие вопросы могут возникать в тот момент, когда
мы восприняли и подвергли обработке последние фрагменты
текста, и в какой мере этот "потенциал вопросов"
определяется наличием (и выбором) рассматриваемого слова.
Вопросы, которые я имею в виду, предназначаются для
заполнения пустых мест в той типовой сцене, которая
находится в процессе воссоздания. Если глагол write
интерпретируется так, как я сделал это выше, то
необходимы чрезвычайно специфические контексты, чтобы
признать связными такие диалоги: кто-то говорит мне: "Harry
has been writing." Тарри пишет.', а я отвечаю: "What time
is it?" 4Сколько сейчас времени?' или: "When do you think
I should go home?" 'Как вы думаете, когда мне пойти
домой?' Наверняка осмысленными могут быть лишь вопросы
типа What did he write? 'Что он писал?', What was he
writing on? 'На чем он писал?' или What was he writing
with? 'Чем он пишет?'. Именно подобного рода вопросы
идентифицируют позиции в схематической сцене,
активизируемой глаголом write 'писать'.
Я уверен, что сделанные мною замечания
представляются не очень убедительными и происходит это потому,
что в описании этого глагола пропущено нечто, абсолютно
необходимое для его интерпретации. Сцена-прототип,
ассоциируемая с процессом "писать", разумеется, включает
некое лицо, которое водит тем или иным инструментом,
оставляющим следы на поверхности, но эта сцена содержит
в себе нечто большее. Когда мы употребляем глагол write,
предполагается также, что и продукт этого действия носит
83
языковой характер, то есть он передает языковые формы.
Поскольку это является обязательной частью сцены,
ассоциируемой с глаголом write, то после сообщения о том,
что Гарри писал, вполне осмысленными являются такие
вопросы: "На каком языке он писал?" или "Что значит
написанное им?" Короче говоря, мы можем спросить обо
всем, что является обязательной частью сцены,
включающей в свой состав некоторые письменные сообщения. Этот
последний аспект слова write отличает английский глагол
от японского глагола kaku, который обычно — и, чаще
всего, правильно — переводится глаголом write.
Японский глагол не диктует тех требований к природе продукта,
о которых говорилось выше. Результатом действия kaku
может быть слово, предложение или буква, но также и
картина, рисунок или какая-нибудь фигура. (Правда,
следует отметить, что при написании данного слова-
используются разные китайские иероглифы в зависимости от
выбора одного из этих двух смыслов.)
Будем считать, что мы тем самым получили
удовлетворительные результаты по первым двум тестам, которые
я предложил как способ установления соответствий между
текстами и сценами (для лингвистики). Первый тест
состоит в том, что выбор и характер конкретных сцен может
быть соотнесен с выбором определенных языковых
элементов; второй — в том, что языки могут отличаться друг от
друга такими чертами, прояснить которые можно путем
обращения к сценам и их особенностям. Первый из них
был проиллюстрирован выбором глагола, его временных и
видовых форм, а также конкретного грамматического
субъекта, а второй — различиями между английским и
японским глаголами.
5. Лозунг, которому я следую в своем подходе к
семантике, гласит: значения соотнесены со сценами (meanings
are relativized to scenes). В своем изложении я употребляю
слово сцена в техническом смысле, включающем не только
обычное его значение, но и многое другое. Я разумею под
ним любое доступное выделению (individuatable)
осмысленное восприятие, воспоминание, переживание (опыт),
действие или объект. Некоторые сцены строятся из других
сцен, другие не поддаются разложению — их надо просто
знать; они могут быть продемонстрированы или познаны
на личном опыте, но не объяснены. Я хочу сказать, что
большое количество слов и фраз нашего языка могут быть
84
поняты, если мы нечто знаем заранее, и это нечто не всегда
поддается анализу. Если вы знаете, как выглядят птицы,
тогда я могу идентифицировать определенную часть про-
тотипной птицы и сказать вам, что эта часть называется
beak 'клюв'. Чтобы понять значение таких глаголов, как
wink 'моргать', sneeze 'чихать', crawl 'ползти', yawn
'зевать' и т. д., необходимо знать, что из себя представляет
тело, и особенно человеческое тело, что можно совершать
с его помощью и какого рода внутренние вещи могут с ним
происходить. Чтобы понять, что такое heartburn
'изжога', необходимо испытать определенного рода телесное
ощущение. Чтобы понять, что значит déjà vu (франц. 'уже
виденный'), надо обладать определенным ментальным
опытом.
Слово, появляющееся в тексте и интерпретируемое кем-
либо, кто понимает его, активизирует некоторую сцену и
указывает на определенную часть этой сцены. Слово beak
'клюв' вызывает сцену птицы и идентифицирует
определенную часть птицы.
Пока мои "сцены" носили статический (или почти
статический) характер. Для ряда глаголов или
прилагательных, указывающих на временные состояния, слово
концентрирует наше внимание на единичном периоде или этапе,
но этот единичный период должен пониматься как часть
более "крупной" сцены. Это похоже на то, как будто мы
смотрим на один из кадров киноленты, но при этом мы,
хотя бы в общих чертах, охватываем взглядом и все
остальные кадры киноленты (или некоторую их часть).
В соответствии со сказанным рассмотрим следующую
ситуацию. Два неразличимых близнеца — назовем их Марк
и Майк — находятся в больнице. Они помещены в
соседних комнатах, и, когда мы в сопровождении няни проходим
мимо их комнат, мы замечаем, что каждый из них сидит
на краю своей кровати в одном и том же положении. По
случайному совпадению они приняли одинаковые позы и
одеты абсолютно одинаково. Фотографии этих двух сцен
различить невозможно.
Фактические визуальные сцены, таким образом,
неразличимы. И тем не менее, когда няня проходит мимо
комнаты Марка, она говорит: "I see that Mark is able to sit up
now." 'Я вижу, что теперь Марк может подниматься и
сидеть.', а когда она проходит мимо комнаты Майка, она
говорит: "I see that Mike is able to sit down now." 'Я
85
вижу, теперь Майк может садиться, опускаться и
сидеть.'
Сказать о Марке, что он может уже подниматься и
сидеть (sit up), значит поместить сцену, которую мы
наблюдали, в рамки определенной истории, причем
предшествующая часть этой истории говорит о том, что Марк
лежал. Сказать же о Майке, что он может опускаться и
сидеть (sit down), значит поместить наблюдаемую нами
сцену в рамки другой истории, причем в предшествующей
ее части Майк стоял.
Если мы знаем о Марке и Майке все то, что знает няня,
тогда мы воспримем ее высказывание как суждение, которое
мы могли бы сделать и сами. Но если мы только услышали
ее замечания, тогда мы, вероятно, должны будем обратиться
к стратегии обработки текста и задаться вопросом "Почему
она сказала это?''. Мы догадываемся, что мальчики
находятся в больнице из-за каких-то неполадок со здоровьем.
Мы знаем, что в больнице состояние здоровья пациентов
обычно изменяется и изменяется оно, как правило, к
лучшему. Эти фрагменты знания позволяют нам воссоздать
более широкие сцены, часть которых составляет то, что мы
увидели. Мы можем сделать вывод, что наблюдаемые позы
обоих мальчиков отражают улучшение в состоянии их
здоровья. А это позволяет нам предположить, что у Марка
была болезнь, которая не позволяла ему приподниматься
и сидеть (sit up), а у Майка такая болезнь, которая мешала
ему опускаться и сидеть (sit down). Мы приходим к
довольно детальному, но все еще только очерченному в общем
виде представлению о пребывании мальчиков в больнице
и значении их теперешнего состояния. И когда позднее мы
узнаем, что один из них страдал мононуклеозом, а
другой — геморроем, мы уже имеем готовую рамку, в пределы
которой легко включить эту новую информацию, и, в
частности, едва ли мы спутаем, какой мальчик страдает той
или иной из названных болезней. (...)
6. Я должен ввести ряд понятий, которые понадобятся
для рассмотрения процессов коммуникации и понимания.
Мне еще трудно дать точное определение этих понятий,
и поэтому я просто обращусь к ряду примеров, чтобы
показать, как я трактую значение и понимание.
Значения отдельных лексических единиц лучше всего
можно понять с точки зрения их вклада в процесс
интерпретации текста. Как я уже указывал, это требует обращения
86
не только к значениям, содержащимся непосредственно
в тексте, но и к памяти, знаниям и чувственному опыту
интерпретатора, а также применения ряда процедур для
определения оснований, обеспечивающих осмысленность
текста. Слово, фраза, предложение или текст задают
некоторую сцену и выдвигают на передний план (или
высвечивают) определенную ее часть. Следует помнить, что
выделение сцены можно осуществлять на любом количестве
уровней. Некоторое событие, например, может состоять
из ряда подсобытий и в свою очередь представлять только
часть более крупного события или ситуации. Для всех
них я употребляю слово сцена.
Иногда мы располагаем, можно сказать, готовой
сценой, построенной из наших общих знаний, воспоминаний,
воображения или чего-либо иного, что заполняет в данный
момент наше сознание; но иногда можно говорить и о
конструировании сцены и, в ходе осуществления этого
акта, о придании смысла тому, что мы читаем, или тому,
что нам рассказывают. Сцены, к которым привязываются
значения языковых форм, выделяются способами,
носящими частично естественный, частично условный и
частично идеосинкразический характер. Во всяком случае,
мы можем говорить о выделимости сцен в терминах их
способности подходить под определенный прототип или
парадигматический образец. (Большая часть исследований
Элеоноры Рош, психолога из Беркли, посвящена
фактически раскрытию механизма формирования сцен в моем
смысле; ее более ранние исследования касались прото-
типных понятий естественных видов, цветовых
представлений, форм и базисных уровней артефактов; в настоящее
время она занята рассмотрением путей, какими в процессах
категоризации определяются характер и
взаимосвязанность событий и ситуаций.) 4
Данная сцена реального мира воспринимается в той
степени, в какой она соответствует парадигматической или
прототипной сцене. Прототипные сцены следует понимать
как сцены, взятые из простых миров, миров, признаки
которых не отражают всех фактов мира действительности.
Прототипные сцены объясняют простейшие случаи,
идеальные примеры. Очень часто, однако, использование
4 Rosch, Eleanor. Natural categories,— "Cognitive Psychology",
4, 1973, p. 326-350.
87
языка заставляет нас обращаться к словам,
активизирующим прототипные сцены, даже если содержание нашего
разговора отклоняется от прототипа. Вдова — это
женщина, муж которой умер. Прототипный "сценарий" вдовы
не включает случаи, когда женщина убила своего
супруга, или когда она имела трех мужей и осталась только
с двумя, или когда процесс развода женщины завершился
в день смерти ее супруга. Если мы не уверены, можно
ли в подобных случаях употребить слово вдова, это
происходит не потому, что мы не знаем значение этого слова,
а потому, что прототипная сцена, обусловливающая наше
знание слова вдова, просто не покрывает всех таких случаев.
Последнее из рассматриваемых здесь мною понятий я
назову "перспективой". В каждый момент анализа текста
мы рассматриваем сцену в определенной "перспективе";
это значит, что в то время, когда мы охватываем взором
всю сцену, мы, так сказать, фокусируем наше внимание
лишь на некоторой ее части.
Таким образом, категории, которые я намереваюсь
использовать в настоящем изложении, включают сцену,
прототип, активизацию и перспективу. Некоторые другие
будут введены в последующих лекциях.
7. Выше я выделил сцену, где некто совершал действие,
в результате которого оставались следы на некоторой
поверхности. Я указывал, что английский глагол write
'писать' привносит в сцену информацию о том, что продукт
этой деятельности имеет языковой характер. Слово sketch
'набрасывать', напротив, содержит сведения о том, что
продукт в этом случае является изобразительным —
набросок, рисунок или диаграмма чего-либо — и включает
информацию о том, что при этом используется инструмент
особого рода: это, например, не кисть. Draw 'рисовать'
более или менее похоже на sketch, но оба эти глагола
отличаются от paint 'красить, писать красками' (мы берем
употребления, когда прямой объект называет продукт),
поскольку, хотя последний глагол и означает создание
художественного произведения, но оно не обязательно
носит изобразительный характер. Кроме того, как мы
знаем, глагол paint подразумевает использование
определенных материалов. Printing 'печатание' в своем значении,
связанном с нашей прототипной сценой (в
противоположность действию печатного пресса), предполагает понимание
того, что продукт состоит из элементов алфавита особой
88
формы. Есть, правда, более общий глагол write 'писать',
но в противопоставлении printing 'печатание' и writing
'писание' слово write ' писать' соотносится с
деятельностью, продуктом которой являются письменные, а не
печатные формы.
В том особом случае, когда продукт представляет имя
пишущего — в письменной, а не в печатной и к тому же
в индивидуализированной форме,— может быть
употреблен глагол sign 'подписывать'. И далее, только тогда,
когда продуктом действия является образец чьей-либо
подписи, создаваемый для кого-то в качестве сувенира,
можно использовать глагол autograph 'давать автограф'.
Продукт действия 'писать' может быть назван с
помощью имени существительного, и если это сделано,
вводится новая сцена, сцена, ассоциируемая с продуктом. Это
может быть имя любой единицы языкового продукта,
например: слово, фраза, предложение, параграф; или книга,
статья, поэма, очерк; или письмо, предисловие,
посвящение, некролог, исповедь — и многое другое; или это может
быть подпись, то есть индивидуализированное изображение
имени пишущего, или автограф, то есть подпись, сделанная
на память.
Существуют глаголы, усиливающие детали
динамического аспекта сцены и дающие, например, представление
о манере письма. Сюда относятся глаголы scribble
'небрежно или быстро писать' или scrawl 'писать каракулями',
а также print 'писать печатными буквами', указывающий
на тщательную манеру письма плюс упомянутая выше
природа продукта, и jot down 'кратко записать',
обозначающий сжатую запись короткого текста.
Другие глаголы отражают особенности используемого
инструмента. Это в первую очередь относится к глаголам,
образованным непосредственно от имен инструментов,
таких, как реп 'ручка' и pencil 'карандаш', а также к
глаголу type 'печатать на машинке'.
Некоторые глаголы активизируют сцены с
обязательным наличием источника или модели того, что
воспроизводится. У глагола transcribe 'транскрибировать' моделью
является произношение, у глагола сору 'копировать' —
графическое изображение (оно не обязательно носит
языковой характер), у глагола trace 'копировать,
калькировать' модель предполагается помещенной непосредственно
под прозрачной поверхностью.
89
У всех этих глаголов грамматический субъект в своей
глубинной форме представляет собой агенс, лицо,
осуществляющее действие, которое оставляет следы. Во многих
случаях прямой объект является описанием продукта.
Таковы Не penned his answer. Юн написал свой ответ.',
Не scribbled а роет. 4Он нацарапал поэму.', Не drew а
picture. 'Он нарисовал картину.', Не signed his name.
'Он подписал свое имя.' и Не wrote his name. 'Он написал
свое имя'. В случае глагола write 'писать' можно
использовать его без обозначения имени продукта, если
предполагается, что им является письмо, которое должно быть
послано какому-то лицу. При этих условиях косвенный
объект выступает в качестве единственного эксплицитного
дополнения глагола. Так, в предложениях She wrote to
me twice. 'Она писала мне дважды' или I'll write you more
about this later on. 'Я напишу еще вам об этом позднее.'
ясно, что имеется в виду писание письма. Такие употреб1
ления невозможны для других глаголов, например: Не
drew me. 'Он нарисовал мне.' или Не scribbled to me. 'Он
нацарапал мне.'
В случае с sign 'подписывать' прямым объектом может
быть наименование документа, который приобретает
официальный характер в результате акта его подписания.
Здесь продукт трактуется как подпись, но дополнительным
аспектом всей сцены является обстоятельство, в
соответствии с которым получение подписи на конкретном
документе делает его действительным. Так, я могу сказать:
I signet the contract. 'Я подписал контракт.', The king
refused to sing the treaty. 'Король отказался подписать
договор.' и даже — учитывая особый характер
автографа — Не signed my copy of his book. 'Он подписал мой
экземпляр своей книги.'. Следует обратить внимание на
то, что в подобных случаях продуктом всегда является
подпись пишущего.
Глагол autograph 'ставить автограф' включает в себя
понятие подписи. В случае с sign 'подписывать' можно
сказать Не signed his name. 'Он подписал свое имя.', но
нельзя сказать Не signed his signature. 'Он подписал свою
подпись.'. Что касается write 'писать', то можно сказать
Не wrote his name. 'Он написал свое имя.' и Не wrote his
signature. 'Он написал свою подпись.'. Когда употреблено
autograph, нет возможности выразить продукт действия,
а можно указать только имя объекта, на котором постав-
90
лена подпись. Так, можно сказать Не autographed my
football. 'Он поставил автограф на моем футбольном мяче.',
или the menu 'на меню', или my copy of his book 'на моем
экземпляре его книги'.
Иногда цель подписания носит очень специфический
характер, и для этих случаев создаются отдельные
специальные термины для акта подписания. В качестве примера
можно привести endorse 'индоссировать, делать
передаточную надпись', например в выражении endorse a check
'индоссировать чек'.
В высшей степени специфическим глаголом из области
"писать" является глагол address 'адресовать', в качестве
своего прямого объекта этот глагол допускает только имена
вещей, которые можно послать по почте, вроде письма,
бандероли или почтовой карточки. Имеется в виду,
разумеется, написание на них места назначения. Глагол address
специфичен не только в отношении содержания продукта,
но также и его цели. Этот глагол не употребляется в таком,
например, случае, когда я проставляю свое имя и адрес в
заявлении о выплате моих доходов или в заявлении о
приеме на работу.
8. Приведенные примеры дают нам представление о
том, что необходимо для нотационных систем в
лексиконе. Применительно к каждому слову нужно знать, какая
сцена или совокупность сцен активизируется им; каким
образом оно в данном значении, связанном с данной сценой,
должно объединяться с другими лексическими элементами
и в каких грамматических отношениях они будут
находиться друг с другом. А это, как мы видели в случае с
примером write, обусловливает выбор конкретных
временных и видовых форм. Когда, например, глагол write
обозначает деятельность, он совместим с формой длительного
вида; когда он обозначает акт, он совместим с претеритом.
Но он может обозначать и профессию или призвание,
и тогда более всего он совместим с формой простого
настоящего времени. Такого рода информация, по моему
мнению, необходима при описании языковых средств,
пригодных для отдельных сцен. Таким образом, учитывая
семантическую силу грамматических времен и видов, мы
можем уяснить себе, какая из этих форм совместима с тем
или иным значением глаголов.
Теория лексикона должна указывать для каждого
глагола (применительно к каждой соотносимой с ним
91
сцене) то, что мы, следуя Теньеру и ряду европейских
лексикологов, можем назвать "валентностью" 5, причем
понятие валентности должно пониматься в
расширительном смысле, одновременно охватывая и уровень
поверхностной формы предложений с данным глаголом, и уровень
элементов и аспектов ассоциируемых с ним сцен. В сцене
писания, например, имеются пишущий, инструмент,
поверхность и продукт. Для всех глаголов из данной сферы
пишущий выступает в качестве субъекта. В одних случаях
продукт реализуется как прямой объект, в других —
прямой объект оказывается именем поверхности, на которой
появляется продукт. Если в предложение, соотносимое со
сценой письма, вводится инструмент, это осуществляется
посредством именной группы с with *. Для ряда
специальных сцен, в которых акт написания служит более широкой
цели, обладающей своей доминирующей сценой,
структурирование предложений будет определяться фактами этой
более широкой сцены: здесь стоит вспомнить структуру с
косвенным объектом, где write понимается как ' писать
письмо'.
Другая часть вопросов, примыкающих к описанию
"валентности", соответствует тому, что иногда именуют
"селекционными ограничениями". Имеется в виду то
обстоятельство, что существуют слова, соотносимые с
чрезвычайно специфическими сценами, в результате чего
ограничивается круг других слов, возможных в данной
структуре. Информацию подобного рода я предпочитаю
связывать с описанием сцены, а не с установлением особого
вида отношений между словами и классами слов в
определенных грамматических конструкциях. Об этом еще будет
сказано в следующей лекции.
9. В дальнейших лекциях я расскажу о семантической
роли субъектов и объектов, связанных с глаголом, об
относительной выделенности аспектов сцен, определяющей,
какие части сцены реализуются в тех или иных
грамматических конституэнтах, об отношении лексически
определенных сцен к непосредственному контексту и, далее, о
проблемах дейксиса и прагматики, об использовании
данного рода семантики для описания традиционных семан-
5 Tesniere, Lucien. Elements de syntaxe structural. Paris, 1959;
Helbig, Gerhard and Schenkel, Wolfgang. Wörterbuch zur Valenz
und Distribution deutscher Verben. Leipzig: Verlag Enzyklopädie, 1973.
* В русском языке формами творительного падежа.— Прим. перев.
92
тических понятий. Будет дан также обзор лексических
проблем. В заключение я выскажу несколько
предположений и признаний относительно будущего семантического
исследования в описанных мною рамках.
ЛЕКЦИЯ ВТОРАЯ
(...)
2. Сцены, которые мы строим на основе текстов,
частично обусловливаются лексическим и грамматическим
материалом текста, а частично — вкладом самого
интерпретатора, причем последний базируется на том, что он
знает о соответствующем контексте, что он знает о мире
вообще и как он понимает намерения говорящего.
Лексическая информация, необходимая для описания
деятельности языка, включает не только информацию о
природе ассоциируемых сцен. Она включает и информацию
о грамматической форме предложений, в которых
лексическая единица может появиться. В частности, если
лексическая единица является глаголом, нам нужно знать,
какая из возможного множества отдельных единиц в
ассоциируемой сцене будет реализована как субъект глагола,
какая будет выступать как прямой объект (если он должен
быть) и в каком грамматическом облике появятся другие
элементы.
Несколько лет назад я высказал свое мнение о том,
каким образом следует решать эту проблему 6.
Предлагалось использовать форму репрезентации значений
предложения, более глубинную, чем глубинная структура,
предусматривающую введение различных ролей, которыми
могут характеризоваться элементы ситуаций или
событий,— ролей типа агенс, пациенс, инструмент, цель,
экспериенцер, местонахождение и т. д. Далее, устанавливались
ранги, или иерархия, среди данных понятий, а также
формулировался ряд принципов, названных правилами выбора
субъекта. Я трактовал понятия ролей как падежи на
уровне глубинной структуры. Я утверждал, что любое
простое предложение (clause) может быть представлено
глаголом, указывающим на природу события или ситуа-
6 См. Fillmore, Charles J. The case for case.— In: Emmon
Bach and Robert Harms (eds.). Universals in Linguistic Theory.
New York, 1968. [См. перевод на русск. в сб. "Новое в зарубежной
лингвистике", вып. X, М., 1981, с. 369—495.]
93
ции, совместно с набором именных групп, помеченных
показателями падежной роли каждой единицы, реализуемой
как именная группа. Я полагал, что субъектно-объектное
структурирование предложения на поверхностном уровне
может быть обеспечено правилами формирования субъекта
и правилами формирования прямого объекта.
Предложенная концепция устанавливала один вид организации
предложения на семантическом или концептуальном уровне
и другой вид — на уровне поверхностной структуры, без
всякого промежуточного уровня, соответствующего
понятию "глубинной структуры" Хомского.
Из большого количества страниц, появившихся в
журналах и полученных мною по почте и осуждающих
Падежную грамматику (так я назвал свою систему), самыми
суровыми были страницы, написанные Стивеном
Андерсоном на тему о семантической роли глубинной
структуры 7. Андерсон указал на ряд семантических обобщений,
которые можно сформулировать простым образом только
на уровне глубинной структуры, поскольку они должны
учитывать семантические роли глубинных субъектов и
объектов. Стивен Андерсон придерживался той точки
зрения, что именные группы, функционирующие как субъекты
и объекты в глубинной структуре, имеют холистическую
интерпретацию, отсутствующую у имен, которые не
выступают в предложении в качестве субъектов или объектов.
Я еще буду иметь возможность вернуться к этому вопросу.
Тем временем П. Постал, Д. Перлмуттер и Д. Джонсон
предложили свою структуру, лежащую в основе
грамматики. В ней понятия субъекта, объекта и непрямого
объекта должны восприниматься как первичные
грамматические отношения, которые первоначально фиксированным
образом приписываются глубинным репрезентациям, а
затем могут модифицироваться по соответствующим
правилам. Они называют свою систему Реляционной
грамматикой 8. В их терминологии элементы, которые являются
7 Anderson, Stephen R. On the role of deep structure in semantic
interpretation.—"Foundations of Language", 6, 1971, p. 197—219.
8 Johnson, David. On the role of grammatical relations in
linguistic theory.—In: "Papers from the 10th Regional Meeting of the Chicago
Linguistic Society", 1974, p. 269—283; он же: "Toward a theory of
relationally based grammar" (докторская диссертация, University of
Chicago), 1974; Perlmutter, David and Postal, Paul. Linguistic
Institute Lectures on Relational Grammar, MS, 1974,
94
субъектами, объектами и непрямыми объектами,
называются термами (другие составляющие предложений
оказываются нетермами), и термам присваивается ранг, а именно
1, 2 и 3 — для субъекта, объекта и непрямого объекта
соответственно. Предлагается большое количество
обобщающих утверждений относительно грамматики, которые,
как они считают, наиболее простым образом можно
формулировать как операции над термами; эти операции
включают смену рангов и лишение статуса терма. Эта
система тоже признает различие между глубинными
субъектами и объектами и поверхностными субъектами и
объектами. Другие ученые, и, в частности, Эдвард Кинэн и
Бернард Комри, работая независимо, предложили ввести
ряд типологических принципов, а также огромное
количество процессов универсально-языкового характера и
ограничений на грамматические правила, в которых
понятия субъекта, объекта и непрямого объекта играют
центральную роль 9.
Многое в этих работах я признаю заслуживающим
серьезного внимания и готов принять на вооружение нечто
подобное понятию представления глубинной структуры,
по меньшей мере — понятие приписывания (по особым
правилам) субъектов и объектов к глубинным предикатам.
Замечания Андерсона, бесспорно, можно формулировать
в терминах реляционной грамматики. Это значит, что форма
грамматики, в пользу которой мы в конечном счете
принимаем решение, не обязательно должна быть такой, при
которой грамматические отношения определяются лишь
в виде конфигураций древесных структур, что, как мне
представляется, для Андерсона, следующего Хомскому,
является предпочтительным.
3. Поскольку, как я указывал, мы можем говорить о
сценах, лежащих в основе текста,— и, в частности, сценах,
лежащих в основе простых предложений текста,— мы
должны уметь исследовать принципы, в соответствии с
которыми аспекты сцен получают грамматическую
репрезентацию и определяют субъектно/объектную структуру
предложений.
9 Keenan, Edward and Comrie Bernard. Noun phrase
accessibility and universal grammar, MS, 1972; Keenan, Edward. Some
universal of passive in relational grammar.— In: "Papers from 11th
Regional Meeting of the Chicago Linguistic Society", 1975, p. 340—352.
95
Я буду именовать ту часть предложения, которая
содержит предикатное слово и связанные с ним
грамматические термы, ядром предложения, а все остальное
периферией предложения. Нам необходимо ответить на два
вопроса, касающихся отношений между сценами и
простыми предложениями, которые активизируют эти сцены
(или активизируются ими). Первый вопрос: „Какие из
единиц сцены реализуются в связанном с ней предложении
в качестве членов ядра?" В упрощенном виде этот вопрос
принимает форму: „Что входит в ядро?" Второй вопрос —
„Если два или более элементов сцены реализуются в
связанном с ней предложении как члены ядра, существуют ли
какие-либо общие принципы, которые определяют, какой
из них является субъектом, или первым термом, и какой —
объектом, или вторым термом?" (Я здесь не принимаю в
расчет косвенный объект, или третий терм.) По-другому
второй вопрос можно формулировать как: „Что
определяет ранг термов в ядре?"
Понятно, разумеется, что ответы на эти вопросы будут
различными для разных языков. Если это действительно
так, мы должны задаться вопросом, в какой мере термы
реляционной грамматики можно толковать как
семантические примитивы, что как раз Постал и Перлмуттер имеют
в виду. Допустимо ли, чтобы особенности универсально-
языкового характера — в том роде, что предлагают
Постал, Перлмуттер, Кинэн и Комри,— можно было
обнаружить в категориях, которые сами определяются
конкретно-языковым образом? По своему существу эта
возможность не выглядит нелепой, поскольку семантики
обнаруживают принципы, универсально применимые для
всех систем родства, хотя самое основное отношение в
пределах такой системы — отношение детей и родителей —
может пониматься в различных культурах по-разному.
4. Ответы на первый вопрос затрагивают главным
образом проблему семантической нагрузки функции прямого
объекта. В английском языке каждое предложение должно
иметь субъект, и поэтому вопрос о том, есть или нет у
предложения субъект, менее интересен, чем вопрос о наличии
у него объекта. А этот вопрос, очевидно, становится
релевантным только тогда, когда значение глагола указывает,
что в ассоциируемой сцене представлены две единицы,
одна из которых должна стать субъектом, а другая может
стать или не стать прямым объектом.
96
Есперсен писал: «Понятийные отношения между
глаголами и их объектами настолько многообразны, что не
поддаются никакому анализу и классификации» 10. И
действительно, задача обнаружения обобщений относительно
семантической нагрузки прямого объекта трудна, но, быть
может, не безнадежна, если мы посмотрим на нее с
несколько иной точки зрения. Я думаю, что мы должны
задаваться вопросом не о том, какого рода отношения
связывают объекты с их глаголом, а о том, какие свойства
сцен определяют, будет ли такой-то элемент реализован
в качестве прямого объекта. Некоторые из примеров,
особенно интересовавшие Есперсена, являются следствием
поверхностных процессов слияния, и их, по-видимому,
можно игнорировать. Я по крайней мере не буду
придавать особого значения предложениям типа She laughed her
thanks. 'Она засмеялась в знак благодарности.' или Не
nodded his acquiescense *. 'Он кивнул в знак своего
согласия.', пока не выясню, нельзя ли применить к ним
принципы, управляющие ясными случаями.
5. Обращаясь ко второму вопросу, нам необходимо
рассмотреть четыре ситуации: (1) Когда глаголы могут
реализовать в качестве прямого объекта любой из двух
элементов, а остающийся элемент становится периферийным,
получая выражение в виде предложной группы. Пример
данной ситуации дает глагол blame 'обвинять'. Мы можем
сказать Не blamed the accident on me. 'Он обвинил в
аварии меня.'или Не blamed me for the accident. 'Он обвинил
меня в аварии.' **. (2) Когда глаголы могут реализовать
в качестве прямого объекта любой из двух элементов, но
с тем ограничением, что остаточный элемент вообще может
не получить выражения. Примером этого второго случая
служит глагол sign 'подписывать'. Мы можем сказать Не
signed his name. 'Он подписал свое имя.' или Не signed
the contract. 'Он подписал контракт.', но, хотя мы можем
сказать Не signed his name on the contract. 'Он подписал
свое имя под контрактом.', мы не можем сказать Не sig-
10 Jespersen, Otto. A Modern English Grammar, Vol. III.
London, 1927, p. 230.
* Букв. 'Она посмеяла свою благодарность', 'Он кивнул свое
согласие'.— Прим. перев.
** Русский глагол обвинять в данном отношении отличен от blame,
и русские переводы предложений не передают соотношения английских
грамматических структур.— Прим. ред.
4 л\ 534
97
ned the contract with his name. 'Он подписал контракт
своим именем.'. (3) Когда глаголы могут включать
несубъектное имя как в ядро, так и в периферию. Здесь
примером является глагол shoot 'стрелять'. Мы можем
сказать либо She shot him. 'Она застрелила его.', либо She
shot at him. 'Она выстрелила в него.'. (4) Когда
существует пара глаголов, близких по значению, но
отличающихся друг от друга выбором того, что входит в ядро, а
что — в периферию. Глаголами, иллюстрирующими
четвертую ситуацию, являются глаголы put 'класть' и cover
'покрывать'. Мы можем сказать как Не put a towel over
the alarm clock. 'Он положил полотенце на будильник.',
так и Не covered the alarm clock with a towel. 'Он покрыл
будильник полотенцем.' При том, что здесь выражается
одна и та же ситуация, в одном предложении прямым
объектом является полотенце, а в другом — будильник.
Вопрос, который я изучаю, отличается от вопроса о
причинах введения поверхностных субъектов и объектов,
хотя, может быть, и связан с ним. Поверхностные субъекты
могут образовываться посредством пассивизации,
поднятия (raising) в позицию субъекта, перемещения позиций и
т. д., а поверхностные объекты могут образовываться
посредством перемещения в позицию дательного, поднятия
в объектную позицию, редукции дополнений и т. д. Меня
интересует вопрос о том, как происходит выбор термов,
определяемый лексическими свойствами глаголов и
предшествующий применению грамматических процессов,
способных подвергнуть предложение
переструктурированию.
Глагол hit 'ударять' подходит к сценам, где имеет место
резкий контакт одной вещи с другой, причем часто некий
агенс манипулирует первым из этих объектов. Когда в
сцене удара наличествуют три элемента, агенс, или кау-
затор, данного события выступает как субъект, а любая
из двух других единиц может реализоваться в качестве
прямого объекта. Иными словами, мы можем сказать либо
I hit the cane against the fence. 'Я ударил палкой по
забору.' либо I hit the fence with the cane. 'Я ударил забор
палкой.'. (Кстати, этот пример демонстрирует
необходимость различия между тем, что является ядром
предложения, и тем, что является обязательными
составляющими предложения. Как представляется, глагол hit
'ударять' должен сопровождаться упоминанием того предмета,
98
по направлению к которому что-то движется, хотя этот
предмет не обязательно должен выступать в виде прямого
объекта. Другими словами, тогда как вполне допустимы
фразы 'Я ударил забор палкой.' и 'Я ударил по забору.',
применительно к той же сцене реального мира мы можем
сказать 'Я ударил палкой по забору', но не 'Я ударил по
палке' (для той же сцены). Противопоставление между
ядерными и периферийными элементами не равнозначно
противопоставлению между обязательными и
факультативными составляющими предложения.)
Используя понятия семантических падежей, мы можем
сказать, что элементы, попавшие в ядро, в каждом
предложении включают Агенс; в одних случаях включается
также Пациенс, в других — Цель; и мы можем добавить,
что репрезентация Цели является обязательной для
активной формы любого из этих предложений. На
интуитивном уровне мы можем рассматривать решение о включении
тех или иных элементов в ядро предложения как решение
о выборе конкретной перспективы в некоторой сцене.
Когда я говорил о перспективе, я имел в виду
фокусирование внимания на части сцены, возможно, в силу особой
выделенности этой части, не упуская из вида вместе с тем
и остальной части сцены. Однако такое понимание трудно
применить к только что рассмотренным нами примерам,
поскольку трудно представить себе контексты, в которых
в фокусе внимания оказалась бы палка, а не забор, и
наоборот.
Все же можно по крайней мере представить себе, каким
образом вне перспективы может быть оставлен Агенс.
Предположим, перед нами сцена, в которой Агенс
размахивает палкой у забора. Рассмотрим два предложения:
Harry swung the cane wildly. It hit the fence. Тарри дико
размахивал палкой. Она ударила по забору.' Здесь, хотя
мы и понимаем, что Гарри все еще держал палку во время
удара, во втором предложении нам удалось оттеснить
действие Агенса на задний план, и в фокусе внимания
оказался контакт между палкой и забором. Здесь в ядро
входят два физических объекта, но не Агенс.
Теперь рассмотрим, каким образом можно увеличить
относительную выделенность Пациенса или Цели в сцене,
для которой в перспективу включен Агенс. На этот раз
возьмем глагол beat 'бить', который похож на глагол
hit 'ударять', но предполагает, что Агенс продолжает
4*
99
держать орудие на протяжении всего действия, в то время
как глагол hit совместим со сценой, в которой Агенс может
отпустить инструмент. (Обратимся к примеру: Standing
on the ground, I hit the third-storey window with a brick.
'Стоя на земле, я ударил кирпичом по окну на третьем
этаже.' Здесь перед нами действие либо необычно высокого
человека, либо человека, бросившего кирпич.)
Поскольку мы как человеческие существа больше
заинтересованы в человеческих существах и в человеческих
реакциях, чем в том, что происходит с неодушевленными
предметами, одним из способов изменения перспективы
является включение в сцену другого человеческого
существа. Рассмотрим предложения I beat the stick against
Harry. 'Я бил палкой о Гарри.' и I beat Harry with the
stick. 'Я бил Гарри палкой.' В сцене для первого
предложения говорящий как бы не считает Гарри живым
существом. Второе предложение более соответствует сцене,
когда Гарри воскликнет "Ой!" Иначе говоря, когда целью
действия 'ударять' или 'бить' является человеческое
существо, то есть нечто, серьезно затрагиваемое данным
событием, это придает выражающему Цель элементу
достаточную выделенность, чтобы быть включенным в ядро.
Если это объяснение правильно, то отсюда следует, что
если существительное в роли Пациенса обозначает
человеческое существо, а существительное в роли Цели — нет,
то выбор Пациенса в качестве прямого объекта
представляется более естественным. Я считаю это утверждение
правильным, хотя в случае глагола beat при анализе
реакций на тестовые предложения довольно трудно
отделить чисто языковые факторы от всех прочих. Суть дела
в том, что I beat Harry against the corner of the building.
'Я бил Гарри об угол здания.' звучит как бы более
уважительно, чем предложение I beat the corner of the building
with Harry. 'Я бил угол здания посредством Гарри.'
По-видимому, одно из условий, способствующих
включению элемента в пределы ядра, состоит в том, что этот
элемент есть чувствующее существо, подвергающееся
воздействию в описываемом событии и вызывающее сочувствие.
Отсюда следует, что, если в сцене наличествует два
человеческих существа, в нашем распоряжении нет никаких
данных для предпочтения одного или другого. Так,
предложения I hit Harry against Bill. 'Я ударил Гарри по
Биллу.' и I hit Bill with Harry. 'Я ударил Билла посред-
100
ством Гарри.' должны быть и являются в равной мере
эксцентрическими.
Для ситуаций, в которых данное имя может находиться
либо в ядре, либо на периферии, условием,
способствующим включению в ядро, является то обстоятельство, что
подвергающийся воздействию объект претерпевает тот или
иной вид изменений. Так, если я воздействую на что-то
и если в результате моего действия это что-то изменяется,
оно приобретает статус выделенности, который
обеспечивает его включение в ядро предложения.
(...) Предположим, например, что я пытаюсь что-то
тащить, а вещь не поддается. Я могу сказать: I pulled at
it. 'Я тащил ее.' * или I tried to pull it. 'Я пытался тащить
ее.', но не просто I pulled it. 'Я потащил ее.'. Но если,
однако, вещь в результате сдвинулась в направлении моих
усилий, тогда я имею право сказать I pulled it. Если вы
прилагаете усилия к чему-либо и в результате ваших
действий вещь движется, то я хочу повторить, она
приобретает выделенность, позволяющую ей реализоваться
в качестве прямого объекта.
Здесь наблюдается нечто вроде качества "отмеченности".
Если я говорю I pushed the table. 'Я толкнул стол.', у
вас есть основания полагать, что мне удалось сдвинуть его.
Если же я скажу I pushed against the table. 'Я толкал стол.'
(букв. 'Я толкал на стол.'), я не передаю информации о
результате действия, если только здесь не имеет места
особый контекст, устанавливающий, был или нет в
действительности сдвинут стол.
Глагол break 'разбивать' может использоваться для
передачи сцены, включающей три элемента и имеющей
следующее содержание: кто-то приводит одну вещь в
контакт с другой и одна из них разбивается, то есть ее
целостность нарушается в результате удара. В позиции прямого
объекта может оказаться существительное — как в роли
Пациенса, так и в роли Цели, но только если оно
обозначает ту вещь, которая разбивается. Представим себе,
например, что я с размаху ударяю молотком по вазе, и
ваза разбивается. В этом случае я могу сказать: I broke
the vase with the hammer. 'Я разбил вазу молотком.' Так
же, как и в рассмотренных выше предложениях с глаголами
* В английском предложении есть предложная группа at it,
свидетельствующая о том, что к вещи прилагались усилия, но не
обязательно с положительным результатом.— Прим. ред.
101
hit 'ударять' и beat 'бить', объект, которым
манипулируют, когда он находится на периферии, помечается
предлогом with. А теперь предположим, что я с размаху
ударяю молотком по вазе и разбивается молоток. В этом случае
я должен сказать: I broke the hammer on the vase. 'Я
разбил молоток о вазу.' И на этот раз существительное в роли
Цели (vase), находящееся вне ядра, маркируется
предлогом, дающим информацию о направлении действия.
Иногда составляющая, имеющая роль Источника, Цели
или Сферы (Range), завершает предложение таким образом,
что действие, описываемое предложением, приобретает в
целом некоторую особую выделенность, позволяющую
ассоциируемой несубъектной именной группе выступать
в качестве прямого объекта. Если прыжок через что-либо
не рассматривается как особый подвиг, мы говорим, что
человек перепрыгнул через что-то; если же такой поступок
приобретает некоторую специальную выделенность в силу,
скажем, того факта, что вещь, через которую прыгает
человек, представляет препятствие, тогда мы говорим, что
человек перепрыгнул вещь. Так, можно сказать, что некто
"перепрыгнул через стену" или "перепрыгнул стену",
поскольку прыжок через стену может оцениваться как
важное свершение; но в то время как мы говорим
"перепрыгнуть через черту" (начерченную на тротуаре), трудно
придумать сцену, которая соответствовала бы предложению
"Он перепрыгнул черту". (...)
Обратимся теперь к примерам, которые использует
Андерсон в качестве аргументов в поддержку уровня
глубинной структуры в смысле стандартной теории Хомского.
Имеются в виду знакомые пары типа I loaded the truck with
hay. 'Я нагрузил грузовик сеном.' и I loaded hay onto the
truck. 'Я нагрузил сено на грузовик/ или I sprayed paint
on the wall. 'Я намазал краску на стену.' и I sprayed the
wall with paint. 'Я намазал стену краской.' * Существует
естественный немаркированный выбор прямого объекта,
а именно — существительное в роли Пациенса, но только
если не собираются сообщать ничего специального
относительно Цели. Однако, если действие, рассматриваемое
относительно Цели, получает выделенность в силу того,
* В английских предложениях употреблен глагол spray
'распылять, разбрызгивать'. В переводах его функции поясняются с помощью
русского 'намазать'.— Прим. ред.
102
что оно в том или ином смысле оказывается "полным",
тогда имя Цели включается в ядро. Так, в отношении
приведенных примеров можно утверждать, что "загрузка
грузовика сеном" наиболее естественно трактуется как
"заполнение" грузовика сеном, а "намазывание стены
краской" наиболее естественно воспринимается как "покрытие"
стены краской. Такова холистическая интерпретация
Андерсона. Согласно Андерсону, мы начинаем с субъектов и
объектов, определяемых конфигурациями фразовой
структуры, а затем семантический компонент приписывает
холистическую интерпретацию определенным именам в
определенных контекстах и только тогда, когда они
находятся в позиции субъекта или объекта. С моей точки зрения,
глагол способен получить свое субъектно-объектное
структурирование отнюдь не единственным путем, и такие
свойства выделенности, как тотальность или
законченность, оправдывают включение определенных имен в
ядерную структуру — в зависимости от их глубинной падежной
роли.
Отсюда следует, что могут существовать глаголы,
отражающие сцены с встроенными в них тотальными или
холистическими интерпретациями. Это, например, можно
обнаружить у глаголов cover 'покрывать' и fill 'наполнять',
глаголов, использованных мною выше для объяснения
условий выделенности. Так, Не covered the alarm clock
with the towel. 'Он покрыл будильник полотенцем.'
представляется абсолютно приемлемым, тогда как Не covered
the towel over alarm clock. 'Он покрыл полотенце на
будильник.* — нет. Точно так же Не filled the jar with ink.
'Он наполнил чернильницу чернилами.' является
приемлемым, а *Не filled ink into the jar. 'Он наполнил чернила
в чернильницу.' — нет. Напротив, глаголы place
'помещать' и pour 'лить' требуют фокусировки внимания на
манипуляции объектами, а не на тех частях сцены, которые
отмечают результирующее состояние. Они позволяют
строить предложения типа Не placed the records on the shelf.
'Он поместил пластинки на полку.', но не *Не placed the
shelf with records. 'Он поместил полку пластинками.*
или Не poured ink into the jar. 'Он налил чернила в
чернильницу.', но не *Не poured the jar with ink. 'Он налил
чернильницу чернилами.' Следует подчеркнуть, что здесь
играют роль и идеосинкразические лексические
особенности. (...)
103
Короче говоря, можно утверждать, что решение о
включении существительных в ядро предложения или
оставление их на периферии определяется, по крайней мере
частично, не столько пониманием самого действия, сколько
представлением о выделенности деятельности в целом или
выделенности, значимости конкретных единиц,
принимающих участие в сцене, которые делают одну из частей сцены
заслуживающей того, чтобы она оказалась в фокусе
внимания. Я допускаю, что свое воздействие здесь оказывают
также и некоторые исторические факторы, но я честно
признаюсь, что не знаю абсолютно чистого (без порочных
кругов) способа изложения того, что я имею в виду. (. . .)
6. Второй вопрос относительно отражения сцен в
глубинной структуре связан с установлением ранга
элементов, отобранных в ядро. Я полагаю, что здесь существует
Иерархия выделенности, служащая различным целям в
грамматике. Во-первых, поскольку каждое предложение
должно иметь субъект, то элемент сцены, обладающий
наивысшим рангом, реализуется как субъект. Во-вторых,
если в ядро, или перспективу, попадают два элемента, то
роли первого и второго термов распределяются в
соответствии с их относительной позицией в иерархии. И,
наконец, в-третьих, иерархия налагает ограничения на то,
что у одного и того же глагола может оказаться в ядре и
что на периферии. Если перед нами глагол, который в
качестве прямого объекта может иметь каждый из двух
элементов, то выигрывает тот, который занимает более
высокое положение в иерархии выделенности.
Пока это всего лишь чистые рассуждения п. Вводимое
здесь понятие должно заменить Падежную иерархию из
11 Характер "иерархии", описанный в настоящих лекциях,
несколько отличается от того, который был изложен в другой моей работе "The
case for case reopened" («Syntax and Semantics», Vol. VII. New York,
1977). [Перевод на русск. см. в сб.: "Новое в зарубежной лингвистике",
вып. X. М., 1981, с. 496.] Точка зрения, представленная в этой работе,
более или менее тождественна той, которая представлена в моей работе
"The case for case" (1968) [См. перев. на русск. в сб.: "Новое в зарубежной
лингвистике", вып. X, с. 369]. Согласно этой точке зрения, роли
именных групп определяются их соответствием предварительно
установленной иерархии типов ролей, их относительный ранг определяется
структурой рангов, обусловленной этой иерархией. Теперь, однако, я
полагаю, что такие вещи, как селекция субъектов ("немаркированного"
порядка), может определяться упорядоченным набором соображений
относительно структуры рангов. У меня нет никаких оснований для пред-
104
моей работы по падежной грамматике. Теперь я считаю,
что нам следует иметь дело со сценой, некоторая часть
которой выделена в качестве перспективы. Иерархия
выделенности, обеспечивающая принцип соответствия
между этой перспективой и структурой предложения в
терминах грамматических отношений, выглядит примерно
следующим образом:
1. Активный элемент выше по рангу, чем неактивный
элемент.
2. Причинный элемент выше по рангу, чем непричинный
элемент.
3. Человеческий (или одушевленный) экспериенцер выше
по рангу, чем другие элементы.
4. Измененный элемент выше по рангу, чем
неизмененный элемент.
5. Цельный или индивидуализированный элемент выше
по рангу, чем часть элемента.
6. "Фигура" выше по рангу, чем "основа".
7. "Определенный" элемент выше по рангу, чем
"неопределенный" элемент.
Использовать данную иерархию надо в том порядке,
в каком перечисляются эти утверждения. Так, активный
элемент выше по рангу, чем все другие; причинный
элемент выше по рангу, чем все остальные, за исключением
активного элемента, и т. д.
Если два элемента в сцене обладают одинаковым
рангом в иерархии выделенности, то включать в перспективу
можно любой из них. Так, в акте коммерческой сделки
можно включить в перспективу либо покупателя, либо
продавца, рассматривая другой элемент либо как
Источник, либо как Цель, но не как Агенс. При локализации
одного элемента относительно другого можно
рассматривать один как фигуру, а другой как основу. Так, мы можем
говорить о положении на стене карты под картиной или
же о положении картины над картой. Действительная
физическая сцена не определяет этот выбор, и здесь играет
роль лишь потребность говорящего брать один из этих
объектов в качестве объекта номинации. (...)
почтения той или другой из предложенных иерархий. Главное
преимущество той, которая предлагается в настоящих лекциях, заключается в
том, что она устраняет необходимость установления "конечного,
правильного" списка падежей.
105
ЛЕКЦИЯ ТРЕТЬЯ
(...)
9. Продемонстрированный мною вид анализа
представляет собой интерпретацию текста с точки зрения
слушающего, не принимающего непосредственного участия в
коммуникативном акте. С учетом возможного
недопонимания, все, что я излагал, можно истолковывать как
попытку построения теории "компетенции" дискурсивной
семантики. Задача заключается в определении того, что
мы можем узнать о значении и контексте высказывания,
располагая лишь тем, что содержится в самом
высказывании. Если, например, кто-либо произнесет предложение
"Теперь вы можете слезть с дерева, сэр", мы можем вывести
много заключений относительно того, что, собственно,
сообщается, в каком отношении находятся участники
коммуникативного акта друг к другу в физическом и
социальном пространстве и т. д.
Многие считают такого рода исследования лишенными
смысла, так как при этом игнорируется контекст реального
мира. Я думаю, что единственное преимущество реального
контекста сравнительно с конструируемым заключается
в том, что он заставляет вас учитывать вещи, о которых
вы никогда бы не подумали, если бы навсегда оставались
в своей качалке. Меня тоже интересует употребление
языка, но всякий раз, когда я слышу предложение в
контексте, я тотчас начинаю спрашивать себя, что бы
произошло, если бы контекст подвергся некоторому изменению,
если бы было употреблено иное слово, если бы предложение
было произнесено с иной интонацией и т. д. Другими
словами, я снова возвращаюсь к подходу в русле теории
"компетенции".
Целью дискурсивного анализа с точки зрения
случайного слушателя является обнаружение базисного общего
знаменателя среди набора возможных ассоциируемых сцен
и контекстов. Каждое конкретное употребление
предложения удовлетворяет некоторым или всем пресуппозици-
онным условиям, конкретизирует некоторые или все не-
уточненные выборы и т. д. Единственным единообразным
описанием, которое может получить данный текст
независимо от контекстов, является такое, где характеризуется
в наиболее общем виде набор контекстов, допускающих
его употребление.
10. С позиции интерпретационного процесса прагмати-
106
ческое знание может мыслиться как знание, посредством
которого мы оказываемся способными построить сцену
обстановки, в которой был создан текст, то есть контек-
стуализировать его. Если текст имеет форму диалога,
тогда прагматическое знание позволяет получить некоторое
представление об обстановке, об участниках диалога, о
месте диалога и, может быть, кое-что о позах и жестах
участников диалога. (...)
ЛЕКЦИЯ ЧЕТВЕРТАЯ
0. Система понятий и обозначений *, которую я
изложил в этих лекциях, способна представлять
последовательность событий во времени, одновременность явлений,
выбор из контрастивного набора, "обстановку" или аспекты
сцены, остающиеся константными на протяжении
существования сцены, перекрестные ссылки в случаях
соглашений и контрактов, а также условия включения в сцену
представления самого коммуникативного акта, текст
которого подвергается анализу в рамках данной сцены.
В этой заключительной короткой лекции я намереваюсь
сделать три вещи: изложить проблему репрезентации
противоречащих друг другу моделей мира, рассмотреть
возникающие при этом терминологические проблемы и дать
обзор в принятых нами терминах некоторых
традиционных понятий и проблем семантической теории.
1. Одной из проблем представления является
демонстрация того, каким образом модель мира одного
человека может включать информацию о модели мира другого
человека. Данная проблема представления имеет дело с
включением (embedding) сцен. Традиция комиксов дает
условные обозначения, которые могли бы быть
использованы, например изображение мыльного пузыря, в котором
представлены речь и мысли персонажей, но проблема
включения становится серьезной как раз потому, что возможны
включения неограниченной глубины. Для того чтобы
проанализировать предложение типа "Джулия думает, что
ее папа был честен", необходимо выразить идею, что модель
говорящего для Джулии включает модель Джулии для
* В настоящем переводе в связи с сокращением статьи опущены
схемы и их описания.— Прим. ред.
107
ее отца, а эта последняя включает модель отца для мира,
которая совместима с той моделью для мира, которая
получает отражение в его высказываниях. Проблема понятности
содержания мыльного пузыря, помещенного над
персонажем комикса и включенного в другой мыльный пузырь,
помещенный над другим персонажем, входящим в
некоторый фрейм, настолько очевидна, что не требует
иллюстраций. Больше об этой проблеме я говорить здесь не
буду.
2. Другая часть интересующих меня примеров
касается лексики, выражающей человеческие эмоции.
Некоторые эмоциональные слова, думается, могут быть
охвачены единичными сценами в том смысле, что называемые
ими эмоциональные состояния относительно просты и
обладают свойствами, которые могут проявляться в
некоторый данный момент времени. В качестве таких
связанных с единичными сценами эмоций можно назвать
excitement 'возбуждение', anger 'гнев', peacefulness
'спокойствие', joy 'радость'.
Эмоции, связанные с несколькими сценами,— это те
эмоции, которые неизбежно влекут за собой целую историю.
Для ряда слов, обозначающих эмоции, правильное
употребление и понимание обеспечивается лишь в том случае,
если переживание данной эмоции рассматривается как
один из этапов некоторой истории. Указанный аспект
эмоциональной лексики подчеркивается, в частности,
Анной Вежбицкой 12 в работе, из которой я и заимствую
свои примеры. Используемое Вежбицкой стандартное
описание эмоции имеет форму: The way someone feels when...
'Способ, каким кто-либо чувствует, когда...' В наших
терминах эмоциональная лексика обозначает конечную
сцену в истории, при условии, что испытывающий эмоцию
(experiencer) реагирует на эту историю нормальным, или
прототипным, образом.
Прототипная характеристика слова disappointment
'разочарование' может выглядеть примерно следующим
образом: disappointment описывает чувство, которое испытывает
тот, кто хотел, чтобы нечто произошло, у кого были
основания полагать, что это произойдет, и кто обнаружил,
что ожидаемого события не произошло. (...)
12 Wierzbicka, Anna. Emotion.—In: "Semantic Primitives",
Frankfurt: Athenäum, 1972, pp. 57—70.
108
Вот еще несколько слов, которые можно толковать
аналогичным образом. Значение слова frustration
'разочарование, расстройство' мы можем описать как чувство,
которое испытывает тот, кто хотел добиться чего-то,
неоднократно предпринимал попытки сделать это и только что
осознал, что это сделать невозможно. Surprise 'удивление'
описывает чувство, испытываемое тогда, когда ожидается
А, а происходит не-А. Чувство, называемое suspense
'беспокойство, тревога', испытывает тот, кто хочет знать,
произойдет ли определенное событие, кто осознает, что
ему нужно еще долго ждать, прежде чем он это узнает.
Во всех этих случаях дефиниции слов, обозначающих
эмоции, требуют понимания конфликта между миром и
моделью мира, которая имеется у какого-то человека.
Либо мир, которого кто-либо желает, не таков, каким он
его видит, либо мир, в который кто-либо верил,
оказывается отличным от того, с которым он столкнулся в
действительности.
3. Из этих примеров явствует, что мое предшествующее
изложение ситуативной семантики не дает еще всех
необходимых разграничений. В частности, я предоставил слову
сцена слишком широкие полномочия. Ниже следуют
некоторые разграничения, которые представляются мне важными.
В первую очередь нам необходимо учитывать сцены
реального мира, в терминах которых люди научились
осуществлять категоризацию и благодаря которым приобрели
свои первичные сведения об объектах и ощущениях,
предоставляемых реальным миром, так же как необходимо
учитывать и сцены реального мира в качестве контекста
и побудительных причин для текущего восприятия и
поведения.
Во-вторых, следует учитывать находящиеся в
сознании людей (и прошедшие определенную обработку)
воспоминания о сценах реального мира, которые могут
подвергаться переструктурированию, обусловленному
вхождением людей в определенную общность, когда некоторые
аспекты сцен забываются или подавляются, а другие
усиливаются.
В-третьих, существуют схемы понятий, стереотипы
знакомых объектов и актов, стандартные сценарии для
знакомых действий и событий, о которых можно говорить
независимо от опыта, сохраняющегося в памяти данного
конкретного индивидуума.
109
В-четвертых, существуют воображаемые сцены
говорящего, оказывающие воздействие на формулирование им
текста. В-пятых, существуют воображаемые сцены
интерпретатора, дающие о себе знать, когда он стремится
построить модель мира, соответствующую тексту, который
он интерпретирует.
И наконец, существуют совокупности языковых
выборов, предоставляемых данным языком, и способы,
посредством которых они активизируют конкретные
концептуальные схемы (или, наоборот, активизируются этими
схемами).
Все это весьма сложные понятия, и я, как и многие
другие, никогда не испытывал чувства ясности по поводу
совокупности всех этих понятий. Именно для этой сложной
области исследователи, занимающиеся разработкой систем
понимания языка в русле проблемы искусственного
интеллекта, предложили термины сцена, фрейм, схема,
описание, шаблон, сценарий, прототип, модуль и модель.
Можно предложить следующие терминологические
разграничения. Мы можем использовать термин сцена, когда
имеются в виду почерпнутые из реального мира опытные
данные, действия, объекты, восприятия, а также
индивидуальные воспоминания обо всем этом. Мы можем
использовать термин схема, когда имеется в виду одна из
концептуальных систем или структур, которые
соединяются в нечто единое при категоризации действий,
институтов и объектов, а также для обозначения различных
репертуаров категорий, обнаруживаемых в наборах
противопоставлений, прототипных объектах и т. д. Мы можем
употреблять термин фрейм, когда имеется в виду
специфическое лексико-грамматическое обеспечение, которым
располагает данный язык для наименования и описания
категорий и отношений, обнаруженных в схемах. И мы
можем использовать термин модель, когда разумеем точку
зрения конкретного человека на мир или то представление
о мире, которое строит интерпретатор в процессе
интерпретации текста. Под моделью текста можно разуметь ансамбль
схем, созданный интерпретатором и обусловленный его
знанием фреймов в тексте, который в конечном счете
моделирует некоторый набор потенциальных сложных сцен.
Об интеграции этих понятий можно сказать следующее:
из опыта, охватываемого сценами реального мира, люди
черпают концептуальные схемы; при усвоении схем для
110
обозначения тех или иных их частей иногда выучиваются
единицы языковых фреймов; слова из языкового фрейма
активизируют в сознании говорящего весь фрейм и
ассоциируемую с ним схему; схемы могут быть использованы
в качестве инструмента построения блоков для
конструирования (на основе слов в тексте) модели текста, то есть
модели мира, совместимой с текстом.
Мы можем разуметь под схемой, как здесь уже
указывалось, стандартный набор условий или концептуальную
структуру, характеризирующую идеальные или
прототипные образцы определенной категории. Будучи людьми, мы
можем интерпретировать опыт, если нам удастся приписать
ему ту или иную концептуальную схему, или, иными
словами, локализировать опыт как образец схемы. Во многих
случаях такого рода приписывание осуществляется "до
известной степени", то есть оказавшаяся под рукой сцена
может не совсем точно соответствовать схеме, но
аппроксимировать ее с определенной степенью точности.
Мы можем беседовать о некотором опыте, если мы можем
приписать ему схему и если мы знаем языковой фрейм,
подходящий к этой схеме. Люди смогут понять то, что мы
говорим, если их языковой репертуар активизирует такие
же или сходные схемы и если их опыт по освоению этих
схем сравним с нашим. Наши собеседники могут понять то,
что мы говорим, если они способны состыковать в единый
ансамбль схемы, введенные нами в модель потенциальной
сцены, которая соответствует модели, сообщаемой им нами.
Короче говоря, процесс интерпретации текста мыслится
как процесс, включающий набор процедур для построения
связной модели возможного мира.
Один из видов возражений против концепции
интерпретации текста, основанной на построении мира или
построении образа, касается трактовки отрицательных
предложений. Каким образом, могут нас спросить, следует
вообразить мир или сцену, которые соответствовали бы
предложению "Сегодня в моей кухне нет слонов"?
Довольно просто представить себе кухню без слонов, но в
такой кухне нет ничего такого, что делало бы ее более
соответствующей данной сцене, чем бесконечное множество
других отрицательных предложений, совместимых с той же
сценой. Мой ответ требует, естественно, учитывать
различие между внутренней и внешней контекстуализацией
текста. Иными словами, сцена должна содержать произне-
111
сение данного предложения и понимание, которое мы
имеем в виду,— это понимание тех типов ситуаций, в
которых было бы уместно произнести это конкретное
отрицательное предложение. Такие ситуации предполагают —
в тривиальном случае — использование подобного
предложения в качестве примера при обсуждении какой-либо
образной теории значения в ходе преподавания философии
или лингвистики, или — в более интересном случае —
ситуацию, когда кто-либо упомянул в разговоре
возможность пребывания в прошлом или в будущем некоторого
количества слонов в кухне, о которой идет речь. Другими
словами, в отношении некоторых отрицательных
предложений конструируемая интерпретатором сцена содержит
не только обстоятельства, подходящие к самому
предложению, но также и обстоятельства, связанные с контекстом,
в котором предложение может быть осмысленно
употреблено.
4. Моя последняя задача — показать, что тот подход
к значению, который я изложил здесь, способен
предоставить в распоряжение исследователя достаточно
продуктивный метод или, во всяком случае, не менее продуктивный,
чем более традиционные семантические теории, для
рассмотрения традиционных семантических понятий.
4.1. Начнем с понятия неоднозначности. Мы можем
утверждать, что предложение неоднозначно, когда
некоторая лингвистическая форма соотносится с двумя
различными фреймами. Предложение My desk drawer is ten
inches deep. 'Ящик моего стола имеет глубину 10 дюймов.'
двусмысленно, потому что слово deep 'глубокий' входит
в два различных набора противопоставлений, совместимых
с ситуацией измерения, которая здесь наличествует. В
одном из своих смыслов оно противопоставляется слову
schallow 'мелкий', и оба они составляют полярную оппозицию,
причем слово deep используется при описании результатов
измерений. В этом смысле предложение может быть
понято как указание на размер ящика в направлении сверху
вниз. В другом смысле слово deep противопоставляется
слову wide 'широкий', и оба образуют пару для
измерения какого-либо продолговатого объекта либо в
направлении от одной стороны к другой (wide), либо — от
передней стороны к задней (deep). В этом смысле наше
предложение может быть понято таким образом, что оно указывает
на размер ящика от передней стороны до задней.
112
4.2. Предложение является неопределенным (vague) в
той мере, в какой постепенен переход от сцен, явно
соответствующих активизируемому фрейму, к сценам, которые
явно ему не соответствуют. Предложение My desk drawer
is deep. 'Ящик моего стола глубок.' и неопределенно и
неоднозначно. Оно неопределенно, поскольку нет четкой
границы между глубоким и неглубоким — в обоих смыслах
слова deep.
4.3. Слово является относительно общим по своему
характеру, а не конкретным, если описание ассоциируемой
с ним сцены относительно менее детализировано, чем для
любого другого слова, привлекаемого для сравнения.
Отсюда следует, что детализированных сцен,
соответствующих слову, больше для общих терминов, чем для более
конкретных. Однако одно лишь это условие не покрывает
понятия общности значения. Слово calf 'теленок' может
быть использовано для обозначения детеныша коровы,
гиппопотама или слона, а поэтому я не склонен
утверждать, что оно является более общим, чем если бы оно
относилось лишь к детенышу коровы. Характеристика слова
calf с помощью единичного фрейма, если бы она оказалась
возможной, должна была бы включать информацию о
том, что это слово не применимо к детенышам лошадей,
волков и т. д.
4.4. Два слова являются синонимами, если допустимы
различные лексические выборы для одного и того же
элемента в одном и том же фрейме. Очевидно, eye doctor
'глазной врач' и oculist 'окулист' являются в этом смысле
синонимами; точно так же обстоит дело с furze 'дрок' и gorse
'дрок'.
Более интересной, чем полная синонимия, является
частичная синонимия. Слова являются частичными
синонимами, если некоторые части фреймов, в которых они
употребляются, идентичны, а другие части различны.
Promise 'обещать' и guarantee 'гарантировать' — частичные
синонимы. Оба слова совпадают в том, что
обеспечивают в будущем совершение определенного действия.
Но гарантия дополнительно предоставляет человеку
определенные права по отношению к дающему гарантию,
если обещание не будет выполнено. Signature 'подпись'
и autograph 'автограф' — также частичные синонимы, где
последний отличается от первого теми деталями сцены,
113
которые связаны с мотивами и интересами личности,
получающей подпись.
4.5. Понятие селекционных ограничений (или
ограничений на совместную встречаемость) может истолковываться
в терминах языковых фреймов, ассоциируемых с данными
схемами. Некоторые слова ограничены определенным кругом
схем, активизируемых ими, и могут, следовательно,
сочетаться только с теми словами, которые принадлежат к
фреймам, соответствующим таким схемам. Таким образом,
понятие селекционного ограничения может быть
формулировано в терминах свойств фреймов и схем, а не обычным
способом, то есть в терминах подбора имманентных и
дистрибутивных признаков лексических единиц.
4.6. Понятие антонимии более или менее полно
покрывается понятием контрастивного набора,
затрагивавшегося выше в связи с тем, что я называл выбором. Если фрейм
допускает один выбор из набора взаимно исключающих
категорий, то последние образуют антонимичный набор.
В обычном смысле антонимия покрывается ситуацией, в
которой антонимичный набор содержит ровно два
категориальных члена.
4.7. Понятие категориальных границ слов следует
пересмотреть в терминах понятия прототипа. Исследования
Лабова относительно границ таких понятий, как чашка,
кувшин, стакан и т. д., предоставляют отличную
возможность обсуждения стратегий, посредством которых
субъекты используют прототипные элементы в схемах. Схемы
набора вещей, которые можно найти в кухне, включают
прототипы чашки, кувшина и стакана. Если субъекты
выносят суждения относительно необычного вида чашки,
представленной им в экспериментальной обстановке, они
в действительности решают не вопрос о границах
категории чашки, а скорее пытаются установить, в какой мере
новый объект достаточно близок к тому, чтобы быть
кухонной принадлежностью и выдержать сравнение со
схемой кухни — это в первую очередь, а затем уже
определяется, насколько этот объект близок к тому или иному
прототипу, чтобы классифицировать его как образец
данного типа, а не другого. Эксперименты с категориальными
границами в действительности являются экспериментами,
направленными на установление стратегий, которые
используются людьми при переходе от прототипа к
непрототипному образцу категории.
114
4.8. Понятие семантического поля может быть
интерпретировано посредством обращения к понятию схемы, а
родственное понятие лексического поля можно отождествить
с понятием фрейма и с различными видами связок между
фреймами. Установленная человеком схема цветов
идентифицирует семантическое поле цветовых терминов; схема
коммерческой деятельности лежит в основе лексического
поля продажи и покупки и т. д.
Схема и связанные с ней языковые фреймы, относящиеся
к человеческому телу, обусловливают поле наименований
частей человеческого тела, а также словарь для
обозначения положений и движений тела. Я полагаю, что виды
определений, которые иногда даются тем или иным формам
телесной деятельности, могут иметь осмысленный характер,
если только мы признаем существование связанной с телом
схемы и если она интерпретируется, как я предлагаю, в
терминах прототипов. Ю. Найда предложил анализ
определенных видов телесной деятельности, который можно
представить следующим образом. Обозначим через Л одну
человеческую ногу и через П — другую и допустим, что
употребление этих символов означает, что обозначенная
тем или иным символом нога соприкасается с землей. А
через О обозначим период, когда ни одна, ни другая нога не
касается земли. Тогда hop 'скакать' мы можем определить
формулой ЛОЛОЛО..., skip 'прыгать' —формулой
ЛОЛОПОПОЛОЛОПОПО, a run 'бежать' — через ЛОПОЛОПО...
и walk 'ходить' — через ЛПЛПЛП... Хочу, однако,
отметить, что эти определения могут быть приемлемы только
при условии постулирования прототипного понятия для
человеческих движений. Другими словами, я уверен, что
вполне возможно удовлетворить условиям определения
какого-то из этих слов и тем не менее совершать действие,
которое нельзя будет квалифицировать как тип движения,
которое обычно обозначают выбранным словом. Короче
говоря, я думаю, что только в том случае, если мы уже
располагаем представлением о том, как обычно люди
двигаются, и если мы держим в уме набор возможных здесь
выборов, эти определения могут правильно и четко
отделять друг от друга различные типы движений.
4.9. Семантическое понятие конверсивности может
интерпретироваться следующим образом. Если наличествуют
два слова в предикатной функции, принадлежащих к
одному и тому же фрейму, но использующихся в синтакси-
115
ческих структурах, которые требуют того, чтобы единицы
ассоциируемой схемы упоминались в разном порядке,
тогда эти два слова являются конверсивами друг друга.
Конверсивами в этом смысле являются покупать и
продавать, так же как выше чем и ниже чем или муж и жена.
4.10. Я думаю, что традиционное лингвистическое
понятие основного значения (Grundbedeutung) языковой формы
может получить ясное истолкование в предлагаемых мною
здесь терминах. Целью лингвиста, стремящегося
сконструировать или раскрыть основное значение языковой
формы, является установление такого описания ее
употреблений, которое покрыло бы все случаи. Цель,
следовательно, заключается в сведении к минимуму полисемии.
Мне представляется, что эта цель вообще непригодна для
лингвистической семантики. Возвратимся к примеру со
словом calf 'теленок'. Я бы сказал, что в этом случае мы
имеем дело с членом нескольких языковых фреймов, и,
возможно, добавил бы, что в каждом из этих фреймов его
отношение к ассоциируемой схеме тождественно, а не стал
бы пытаться формулировать в качестве значения слова calf
одно-единственное утверждение, которое бы точно покрыло
все случаи его употребления. Другими словами, я полагаю,
что наиболее полезную информацию о лексической единице
дает набор фреймов, в которых она играет определенную
роль, и определение позиции, которую она занимает в
каждом из этих фреймов. Те или иные подробности, которые
теряются при таком подходе, могут быть представлены в
форме исторического очерка эволюции языковой системы,
то есть в терминах перехода слова из одного фрейма в
другой на протяжении истории языка.
Предположим, например, что кто-либо задался целью
определить основное значение слова short 'короткий',
независимо от его употребления в качестве
противопоставления слову long 'длинный' или слову tall 'высокий'.
Поскольку семантические описания английского языка
все равно должны сообщать информацию о том, что это
слово употребляется в двух контрастивных наборах,
решение искать единую формулировку ничего не добавит
к нашему пониманию языка. Рассмотрим для примера серию
прилагательных high 'высокий' — low 'низкий' — tall
'высокий' — short 'короткий' — long 'длинный' — wide
'широкий' — deep 'глубокий' — shallow 'мелкий'.
Получается, что каждое из "срединных" слов в этом списке отно-
116
сится к разным контрастивным наборам по сравнению со
словом, находящимся справа, и словом, стоящим слева
от него. Мы можем, например, говорить о низких и
высоких облаках (low and high clouds), высоких и низких
строениях (tall and low buildings), низких и высоких людях
(short and tall people), длинной и короткой проволоке (long
and short wires), широких и длинных столах (wide and long
tables), длинных и широких участках земли (deep and
wide plots of land), мелких и глубоких плавательных
бассейнах (shallow and deep swimming pools). Попытка
представить каждое из прилагательных, находящихся внутри
списка, с помощью одной-единственной формулировки его
значения полностью затемнит связи с большим
количеством различных контрастивных наборов,
проиллюстрированных выше, и весьма мало будет способствовать
уточнению нашего знания о том, каким образом организован
словарь английского языка.
4.11. Часто предметом дискуссий среди семантиков
является вопрос о том, где и как следует проводить
демаркационную линию между языковой информацией о
значении слов и почерпнутой из реального мира информацией
о свойствах вещей. Этот вопрос обычно принимает
следующую форму: "В чем заключается разница между
словарем и энциклопедией?" Знаменитое определение
Испанской Академией слова собака как вида животных, у которых
самец, когда мочится, поднимает ногу, или обычные
словарные определения слов левый и правый, отождествляющих
их с южной и северной сторонами в случае, когда человек
смотрит на запад, отнюдь не представляют собой
концептуальный анализ определяемого, а скорее выступают в
качестве опознавательных критериев для тех, кто
намеревается установить, какого рода вещи обозначаются этими
словами. Исследователи, работающие в области
лингвистической семантики, часто признают, что их задача
состоит в установлении чисто лингвистической информации
относительно значений слов и что в принципе вполне
возможно провести разграничения между словарем и
энциклопедией. Более реалистической точкой зрения
является следующая: в мире существуют вещи, типичные
виды наблюдаемых событий, институты и культурные
ценности, делающие возможной интерпретацию человеческих
поступков; для большей части словаря наших языков
единственная форма, в которой может даваться опреде-
117
ление, заключается в указании на эти вещи, действия и
институты и в установлении слов, обозначающих и
описывающих их части и виды.
Я не считаю, что нельзя разграничить роли
лексикографа и составителя энциклопедий. Но я также не считаю,
что все, что говорящий знает о значении и употреблении
слова, может быть собрано и представлено в словарной
статье. Наиболее полезный практический словарь во
многих случаях будет обращаться просто к знанию читателя
о мире, предоставляя ему достаточно информации, чтобы
он сам тем или иным образом добывал добавочную
информацию в том случае, когда он не в состоянии понять
предложения, содержащего данное слово, а словарное
определение не может помочь ему.
Во всяком случае, ясно, что любая попытка соотнести
знание человеком значений слова со способностью
интерпретации текстов неизбежно приведет к признанию
важности внеязыковой информации в процессе интерпретации.
Мы даем различную интерпретацию предложений "Муха
на стене" и "Кот на стене" именно потому, что знаем о
возможности этих существ занимать устойчивое положение,
а также потому, что мы знаем, что одно и то же слово стена
может использоваться для обозначения вертикальной
поверхности комнаты или здания и для отграничения части
местности. Обычно считается, что снятие подобного рода
двусмысленности может быть осуществлено с помощью
семантической компетенции, но в приведенном случае
неизбежно приходится обращаться к информации такого
рода, которая не может быть инкорпорирована в
определение соответствующего слова.
4.12. Другим семантическим понятием, для которого
различие между языковой и энциклопедической
информацией оказывается релевантным, является понятие
метафоры. Акт интерпретации метафоры требует понимания
схемы социального общения такого рода, в пределах
которого говорящий ожидает от слушающего особого
конструирования того, что произнес говорящий, а это в свою
очередь нуждается в понимании того, каким образом
установление несоответствия между буквальным значением
сказанного и конструируемым миром текста может
стимулировать эти "конструкторские" усилия. Если мы
услышим нечто вроде "Гарри — прыщ на лице общественности",
мы не станем использовать собственно языковую инфор-
118
мацию для интерпретации сказанного. Мы располагаем
достаточными знаниями о прыщах, людях и
общественности, чтобы понять, что, если толковать предложение
буквальным образом, мы не сможем сконструировать
осмысленной сцены. Установив наличествующее здесь
несоответствие, мы понимаем, что должны использовать
психокультурную информацию о том, что люди обычно бывают
недовольны, хотят избавиться от прыща, и предполагается,
что говорящий стремится внушить нам, что все члены
общества испытывают подобные же чувства по отношению
к Гарри.
Обычно используемый в лингвистике подход к
объяснению процесса метафоризации сводится к определению
опознавательных признаков мира и созданию формализма
для демонстрации того, каким образом признаки,
соответствующие одному миру, могут быть приписаны
совокупности признаков, связанных с другим миром или
группой слов в той же самой конструкции. Я думаю, что
большинство метафор, включая и наиболее интересные, не имеют
ничего общего с таким объяснением.
4.13. Понятие абстракции всегда было трудно
объяснимым для лингвистической семантики. Абстракции не
являются именами вещей, но они также и не простые
предикаты или предикации. Скорее всего их надо
рассматривать как имена сложных ситуаций, и часто они
используются в предложениях, содержащих определенный
комментарий к этим сложным ситуациям. (...)
У меня нет каких-либо новых предложений относительно
природы абстракции, но я по крайней мере могу указать на
необходимость для семантической теории признать
допустимость разнообразного применения единичного
абстрактного концепта или же различных точек зрения при его
использовании. Например, относительно прототипной
абстракции charity Милосердие' мы, независимо от любого
конкретного употребления этого слова, знаем, что кто-то
дал что-то кому-то, что при этом дающий делал это не по
обязанности. Получатель в результате акта милосердия
также не брал на себя какие-либо обязательства по
отношению к дающему, и дающий при этом полагал, что его
действие выгодно для получающего. После того как мы
охарактеризовали ситуацию подобным образом, иногда
оказывается необходимым обратиться к чрезвычайно
сложным процедурам для интерпретации предложений, содер-
119
жащих данное слово, процедурам, не просто
ориентированным на ситуацию в целом.
Например, когда мы интерпретируем предложение,
подобное Charity is a virtue. Милосердие — это
добродетель.', мы разумеем, что в акте милосердия говорящий
расценивает дающего как хорошего человека. Если мы
интерпретируем предложение Charity is degrading.
'Милосердие унижает.', мы догадываемся, что получатель дара
рисуется как испытывающий чувство ущемленности из-за
своей нужды и чувство унижения, поскольку он принимает
помощь. Если же нам встретится предложение Charity
is unnecessary in an ideal society. 'Милосердие не нужно
в идеальном обществе.', мы можем сказать относительно
этого "идеального общества", что в нем нет места для
ситуаций, которые подходили бы к схеме милосердия. А
предложение типа Не did it out of charity. 'Он сделал это из
милосердия.' раскрывает нам нечто о внутренней жизни
дающего в момент вручения дара — нам как бы
сообщается, что дающий не испытывал никаких внешних стимулов
делать то, что он сделал, что он не ожидал никакой
награды за это и что он чувствовал, что его поступок окажет
кому-то помощь.
4.14. Важным вопросом, часто возникающим в
лексической семантике, является вопрос о мотивации
лексикализации. Почему, спрашивается, одно и то же содержание
выражается одним словом, а не аналитическим образом?
Конкретно, когда, например, предпочитают сказать kill
'убить' вместо cause to die 'заставить умереть'?
В нашем общем понимании языка, по-видимому,
существует схема лексикализации, смысл которой
заключается в том, что акт лексикализации некоторого содержания
является актом представления его как установившейся
категории человеческого мышления. Другими словами, если
существует лексическая единица, она должна существовать
как некоторая часть фрейма и должна соответствовать
некоторой части схемы. Слово вегетарианец не просто
обозначает человека, который употребляет только
вегетарианскую пищу. Если бы каждый так поступал или если
бы все существа на земле поступали так, то не было бы
потребности для такого понятия, а, следовательно, и
потребности в соответствующем слове. Такое слово существует
потому, что есть люди, которые едят мясо, и в
противоположность им есть люди, которые намеренно не едят мяса.
120
Именно в силу этого контраста слова типа вегетарианец
могут функционировать в нашем языке. (...)
4.15. Примеры функционального сдвига можно рассмат
ривать как примеры особого рода процесса лексикали
зации. Существуют различные условия, при которых в
английском языке имя может употребляться как глагол.
Такими словами являются hammer 'молоток' или spoon
'ложка'. В соответствии с самым простым правилом
описания этого деривационного процесса имя, обозначающее
инструмент, посредством которого совершается
определенное действие, может использоваться в качестве глагола,
обозначающего выполнение указанного действия
посредством данного инструмента. Важно, однако, отметить, что
глагол hammer 'ударять молотком; молотить' имеет в виду
не только удары по чему-либо молотком, а и удары по
чему-либо вовсе не обязательно молотком, но таким
способом и с такой целью, как это обычно делается
посредством молотка. Точно так же глагол spoon 'черпать ложкой
или чем-то подобным' используется не только для
обозначения процесса переноса чего-либо с одного места на
другое с помощью ложки, но и для обозначения наиболее
типичного способа использования ложки в таком действии
и, в частности, использования ложки в таких видах
действий, для которых ложки были изобретены.
5. В этой последней лекции я хотел рассказать о том,
каким образом модель "сцены" можно использовать в
областях, о которых я не имел возможности упоминать в
первых трех лекциях. Я старался описать ряд
разграничений, которые следует учитывать семантической теории
и теории интерпретации текста описанного порядка.
И я хотел показать, что данный подход к семантике
сопоставительно с более традиционными формальными ее
моделями не делает нас менее способными осмысленно
рассуждать о традиционных понятиях и проблемах
семантической теории.
В заключение мне хотелось бы подчеркнуть, что выводы,
сделанные мною в этих лекциях, равно как и
терминология и нотация, имеют предварительный характер. В
многочисленных беседах, которые я имел с учеными,
использующими термины фрейм, схема, сцена и прототип,—
психологами, философами, лингвистами и специалистами
по вычислительной технике,— меня поразило, во-первых,
различие в истолковании этих терминов, а, во-вторых,
121
некоторое изменение в использовании данных терминов
мною самим в результате этих бесед. Это — дурные
признаки. Возможность недопонимания меня оказывается
равнозначной возможности забвения мною того, что я говорил
месяц тому назад. Тем, кто знаком с моими прошлыми
работами, 'необходимо поэтому проявить известную
осторожность.
Т. Виноград
К ПРОЦЕССУАЛЬНОМУ
ПОНИМАНИЮ СЕМАНТИКИ*
Часть I. ОБЩИЕ ОСНОВЫ ПРОЦЕССУАЛЬНОГО ПОДХОДА К
СЕМАНТИКЕ
1. Исходные допущения.
2. Мыслительные символические системы.
2.1. Интеллект как материальная символическая система.
2.2. Язык мысли.
3. Процессуальная модель языкового употребления.
4. Диапазон семантической теории.
4.1. Семантика vs. прагматика.
4.2. Компетенция vs. употребление.
4.3. Язык vs. коммуникация.
4.4. Речевые акты vs. значения.
Часть II. ПРОЦЕССУАЛЬНЫЙ ПОДХОД К НЕКОТОРЫМ
СПЕЦИАЛЬНЫМ ПРОБЛЕМАМ СЕМАНТИКИ
5. Природа лексических значений.
5.1. Проблема определения границ значений.
5.2. Слова как символы абстрактных ситуативных типов.
5.3. Неформальная прототипная семантика.
5.4. Процессуальная основа для прототипной семантики.
6. Проблемы референции.
6.1. Определенная и неопределенная референция.
6.2. Употребление фраз с определенной референцией.
6.3. Основы процессуальной теории определенной референции.
6.4. Проблема идентификации концептуальных сущностей.
7. Эксплицитные процессуальные модификаторы и союзы.
* Terry Winograd. Towards a procedural understanding of
semantics.— Revue Internationale de Philosophie", No 117—118, Fase.
3—4, Bruxelles, 1976, p. 260—303.
123
Часть III. ЦЕЛИ ПРОЦЕССУАЛЬНОГО ОПИСАНИЯ ЯЗЫКА
8. Центральные проблемы лингвистической теории.
8.1. Основы процессуальной теории.
8.2. Уровни объяснения.
8.3. Аксиоматические дедуктивные теории.
8.4. Понимание устройства сложной системы.
8.5. Верификация гипотез.
8.6. Более широкие рамки, в пределах которых понимается язык.
Термин "процессуальная семантика" (procedural
semantics) * употребляется в самых разных смыслах, не всегда
совместимых и не всегда понятных. В данной работе я
обозначаю этим термином широкую парадигму изучения
семантики (а фактически — и всей лингвистики). Эта
парадигма сложилась в контексте создания машинных
программ, использующих естественный язык, но она не
является собственно теорией машинных программ или методов
программирования. Она названа "процессуальной" потому,
что, согласно ее исходным постулатам, следует считать,
что форма лежащей в основе языка структуры
определяется в основном природой процессов производства и
понимания языка. Она базируется на убеждении, что существует
объяснительный уровень, на котором обнаруживается
значительное сходство между психологическими процессами
употребления языка человеком и вычислительными
процессами машинных программ, которые мы можем составлять
и изучать. Ее задача — разработать для этого уровня
основы теории. Такой подход приводит к отказу или же к
модификации некоторых общепринятых доктрин, включая
распространенные трактовки разграничений между
"семантикой" и "прагматикой" и между "употреблением"
(performance) и "компетенцией" (competence).
Работа включает три главных раздела. В первом
разбираются общие предпосылки данной парадигмы, которые
обусловливаются указанной задачей, и излагается модель
деятельности мышления и употребления языка. Затем
показывается, каким должен быть процессуальный подход
к некоторым конкретным семантическим проблемам, а также
производится сравнение процессуального подхода с
формально-структурным и истинностным подходами. В заклю-
* Из двух возможных переводов слова procedural —
'процедурный' и 'процессуальный' — выбран второй вариант в связи с тем, что
этот вариант лучше отражает стремление автора моделировать
процессы, происходящие в мозгу носителя языка.— Прим. ред.
124
чительной части обсуждаются задачи лингвистической
теории и природа лингвистического объяснения.
Большая часть наших рассуждений — это
размышления о сущности парадигмы, которую еще предстоит развить.
Эта работа ставит своей целью скорее стимулировать
постановку некоторых вопросов, чем дать окончательные
выводы; скорее выразить нашу интуицию, чем
сформулировать веские аргументы, которые обосновывают
превосходство этого подхода над другими. Она выполнит свою задачу,
если предложит некоторые пути рассмотрения языка,
которые ведут к более глубокому его пониманию.
ЧАСТЬ I.
ОБЩИЕ ОСНОВЫ ПРОЦЕССУАЛЬНОГО ПОДХОДА К СЕМАНТИКЕ
1. исходные допущения
Каждая наука начинает с набора вопросов, касающихся
некоторого круга явлений, и с допущений о природе тех
объяснений, которые должны быть в конечном итоге
найдены. Последующие допущения составляют основу
процессуального подхода к лингвистике и вводят ряд понятий и
терминов, подлежащих дальнейшей разработке в данной
статье.
1.1. При исследовании человеческого языка в центре
внимания должны находиться механизмы, лежащие в
основе производства и понимания высказываний в языковом
и прагматическом контекстах.
1.2. Основные свойства языка отражают структуру
сознания говорящего на естественном языке, включая
мельчайшие детали структуры памяти, алгоритмы
обработки знаний и врожденную ограниченность
вычислительных способностей.
1.3. Производство и понимание высказываний
происходит в рамках структуры процессов текущей мыслительной
деятельности, которые включают как языковые, так и
неязыковые элементы. Отдельные высказывания могут
пониматься только с учетом той роли, которую они играют
в этом более широком контексте. Формализованное
понимание языковых процессов — это часть более широкой
формализации мыслительных процессов.
125
1.4. Каждое высказывание строится для того, чтобы
реализовать определенную комбинацию коммуникативных
целей с помощью элементов и выборов, предоставляемых
данным языком. "Значение" многомерно, формализуемо
только в терминах целого комплекса целей и знаний,
имеющихся и у говорящего и у слушающего (соответственно,
у пишущего и читающего).
1.5. Формализмы, наиболее подходящие для
построения теорий мышления и языка, должны быть эксплицитно
связаны со структурой знания, в том виде, как оно
хранится в системе операционных процессов мышления, и со
структурой процессов, которые используют это знание.
Некоторые из фундаментальных свойств этих процессов
зависят от того, как распределяются конечные возможности
такой обработки.
1.6. Символьные структуры и оперирующие ими
процессы играют главную роль в формализации мыслительной
деятельности. Не существует единой статичной структуры,
которая могла бы представить "значение" высказывания.
В действительности имеется набор структур, которые
строятся и модифицируются говорящим и слушающим в
процессе коммуникации, и мы должны рассматривать
последовательность структур, а также природу происходящих
изменений.
2. мыслительные символические системы
Принципы § 1 разработаны в рамках когнитивной науки
("науки о мышлении"), имеющей дело с широкой областью
мыслительных структур и процессов, включая восприятие,
запоминание, решение задач, равно как и явления языка.
В пределах этой работы невозможно дать полную картину
современного состояния когнитивной науки. Она переживает
период бурного развития и активно обращается к
материалу целого ряда дисциплин, включая такие, как
психология мышления, вычислительная математика и
искусственный интеллект. В последующих параграфах разбираются
некоторые положения, более всего влияющие на подход
к языку, описанный в данной работе. С процессуальной
точки зрения "семантику" следует понимать как изучение
отношений между языковыми объектами и психическими
состояниями и процессами, участвующими в их
производстве и понимании. "Окружение" и "значение" высказываний
126
формулируются в терминах гипотетических мыслительных
структур, которые не являются специфической
принадлежностью одной лишь лингвистики.
2.1. Интеллект как материальная символическая
система.
Когнитивная наука базируется на двух допущениях:
2.1.1. Человеческий интеллект может с успехом
изучаться как материальная символическая система.
«Материальная символическая система состоит из
некоторого множества сущностей, называемых символами,
которые являются материальными образованиями и могут
выступать в качестве компонентов образований другого
типа, называемых выражениями (или символьными
структурами). Таким образом: символьная структура строится
из ряда вхождений (или проявлений) символов,
связываемых друг с другом некоторым материальным образом
(например, вхождение одного символа следует за вхождением
другого). В любой данный момент времени система будет
содержать какой-то набор таких символьных структур.
Помимо этих структур, система также содержит набор
процессов, которые оперируют выражениями и строят другие
выражения: процессов создания, модификации,
воспроизведения и разрушения. Материальная символическая
система — это своего рода машина, которая порождает
развертывающийся во времени набор символьных структур.
Такая система существует в мире объектов, более широком,
чем совокупность этих символьных выражений самих по
себе». (Newell and Simon, 1976, p. 116.)
2.1.2. Возможно и нужно изучать свойства
материальной символической системы на таком уровне анализа,
который позволяет абстрагироваться от физических деталей
реализации индивидуальных символов и структур, а также
физических механизмов, производящих операции над ними.
Эти допущения ставят ряд важных философских и
эмпирических вопросов. Некоторые критики (например,
Dreyfus, 1972; Weizenbaum, 1976) утверждают,
что есть такие аспекты человеческого опыта, которые не
поддаются анализу в терминах какой бы то ни было
формальной системы; другие считают, что ведущую роль в
мыслительных процессах играют аналоговые (а не
символические) представления информации о мире. Исследования в
области когнитивной науки (и, в частности,
процессуальные подходы к семантике) отнюдь не основываются на том
127
утверждении, что анализ интеллекта как материальной
системы символов обеспечивает полное понимание
человеческого мышления, или на утверждении, что все
материальные системы символов должны обладать идентичными
свойствами. Для того, чтобы признать данную парадигму
представляющей научную ценность, необходимо только, чтобы
наличествовали важные аспекты мышления и языка,
которые с пользой можно понять посредством аналогии с
другими системами символов, способы построения которых нам
известны.
Среди лингвистов часто встречается мнение, что создание
общей теории мышления невозможно. Хомский (см.
Chomsky, 1975, р. 17, 138 и сл.) высказал сильное сомнение
относительно того, можем ли мы, по крайней мере как
ученые, узнать достаточно много о механизмах, которые
соотносят условия-стимулы с поведением, даже если мы будем
располагать моделью данного мыслительного состояния.
Он называет эти явления "мистериями", противопоставляя
их "проблемам", возникающим в процессе изучения
формальной структуры языковых объектов. Очерчивая область
семантической теории, Фодор и Кац выдвинули возражение
против включения в эту область "окружения" (в
социофизическом мире) предложения, поскольку:
«. . . [построение] законченной теории такого рода
невозможно в принципе, потому что для выполнения
указанных выше необходимых условий [что в ней должны быть
представлены все возможные релевантные аспекты
окружения] потребуется, чтобы эта теория охватывала ВСЁ
знание говорящих о мире... Такая теория стерла бы
различия между знанием говорящего собственного языка (его
языковой способностью) и знанием говорящего о мире (его
пониманием мира действительности)». (Katz and Fodor,
1964.)
Такой взгляд демонстрирует тот тип ошибок, при котором
теорию смешивают с фактами. Действительно, невозможно
изложить все то знание, которое говорящий на языке
может привлечь при производстве или понимании
предложения, или определить все факторы, влияющие на какой-то
конкретный образец поведения. Но в такой же степени
невозможно точно установить форму и местонахождение
всех частиц в любом материальном сегменте мира или
определить все воздействующие на них силы. Такой взгляд не
является предпосылкой физики. Цель когнитивной науки —
128
определить природу механизмов, имеющихся в
распоряжении человека в процессе мышления, восприятия и
понимания. Цель процессуальной семантики — понять
специфические механизмы, связанные с употреблением языка,
и способы, которыми они взаимодействуют с прочими
аспектами функционирования мышления. Речь не идет ни
о полном отображении человеческого знания, ни об
исчерпывающем представлении структуры мышления отдельного
индивида.
2.2. Язык мысли.
В литературе, посвященной описанию современных
исследований в когнитивной науке, используется ряд
терминов, необходимых для описания набора символьных
структур, которые существуют в данное время в некоторой
материальной системе символов (компьютерной или
нервной системе). Они включают такие слова, как
"представление", "знание" и "модель", которые имеют точные значения
в различных областях науки и философии и которые
принимают в некоторой степени иное значение в нашем
контексте. Существует ряд допущений о системе символов,
используемой человеком, которые образуют основу
большинства современных исследований.
2.2.1. Правила построения, применимые для объяснения
внутренних символьных структур говорящего, не обязаны
быть точно такими же, что и правила естественного языка.
Символьные структуры образуют "язык" в том же смысле,
что и язык математики или машинный язык,— они
составляются из символов в соответствии с точными правилами
построения. Процессы, оперирующие ими, не идентичны
процессам коммуникации на основе естественного языка.
Их детализированная форма не предполагает прямого
отражения языка, хотя в них и могут быть найдены
интересные соответствия.
2.2.2. Не все единицы, представляемые символьными
структурами, соответствуют материальным, или "реальным",
объектам, и поэтому они не обязаны отражать какую-либо
последовательную онтологию. Они включают абстракции,
которые соответствуют таким сущностям, как:
физические и социальные объекты;
воспринимаемые свойства;
события;
абстрактные категоризации объектов, свойств и событий;
сложные концептуальные объекты, свойства и события,
5 № 634
129
построенные из дескрипций, сформулированных в
терминах других мыслительных сущностей;
языковые объекты, такие, как слова и выражения;
гипотетические интерпретации сущностей, имеющихся
в символических системах других людей.
Процессуальный подход к семантике не предлагает
никакого решения старых проблем онтологии и гносеологии.
Начальное допущение заключается только в том, что
существует четко определенный набор процессов,
оперирующих символами, и способы построения структур символов
на основе опыта. С процессуальным подходом вполне
согласуется взгляд, согласно которому многие
концептуальные сущности предшествуют и логически, и во времени
любому употреблению языка, тогда как другие
первоначально создаются в качестве соответствия некоторому
слову, а впоследствии новые их свойства постепенно
добавляются к ним на основе опыта. Естественный язык может
обеспечить часть материала для языка мысли, но при
этом дело не сводится к существованию заранее заданных
сущностей.
2.2.3. Многие символьные структуры соответствуют
суждениям относительно сущностей, представленных
составляющими их символами. Многие операции над этими
структурами порождают другие структуры, которые в общих
чертах могут быть охарактеризованы как результаты
"мышления" или "рассуждения" относительно этих сущностей и
суждений. Полный набор структур часто трактуется как
"модель мира'', даже если это лишь частичное описание.
Слово "модель" употребляется здесь не строго и обозначает
только намерение обеспечить соответствие реальному миру;
слово "мир" также употребляется в нестрогом смысле и
является столь же широким по значению, что и слово
"сущность", как оно было описано в предыдущем параграфе.
Модель, имеющаяся у человека, соответствует миру только
в той степени, в какой процессы создания символьных
структур на основе опыта и процессы деривации их из других
структур являются точным соответствием воспринимаемых
фактов и приводят к обоснованным предсказаниям. В
процессуальной семантике операции над символьными
структурами не обязаны соответствовать обоснованным
логическим выводам о представляемых ими сущностях; они
должны соответствовать лишь типам рассуждений, проводимых
людьми. Процессуальный подход опирается на точку зре-
130
ния, сильно отличающуюся от точки зрения более
традиционного логического подхода. Процессы
манипулирования символами как таковыми являются первичными, а
логические и математические правила рассматриваются как
абстракция, надстроенная над ограниченным
подмножеством этих процессов.
2.2.4. Хотя набор символьных структур, вовлеченных в
языковые процессы носителя языка, часто трактуют как
его "знание", это еще не значит, что они доступны
сознательному самоанализу. Модель мира может включать
модель структур внутреннего знания как таковых, но
соответствие последней модели реальным структурам столь
же относительно, как и соответствие между остальной
частью модели и реальным состоянием мира.
з. абстрактная процессуальная модель
языкового употребления
Процессуальный подход к языку близок к генеративному
взгляду на язык в том отношении, что он рассматривает
прежде всего мыслительные способности, а не сами
высказывания. Он отличается от генеративистики использовани
ем моделей процессов производства и понимания
предложений как организующих рамок для теорий и
детализированных описаний языковых явлений. Придание особой роли
мыслительным структурам, а не абстрактному отображению
форм высказываний на формальные семантические
структуры или условия истинности усиливает значение
контекста (и языкового, и прагматического) при интерпретации
высказываний.
В этом разделе представлена абстрактная модель
языкового употребления, основанная на принятом за образец
словесном взаимодействии, когда говорящий адресует свои
высказывания единственному слушателю в ситуации
непосредственного общения. Подобная концепция может быть
естественным образом распространена на другие формы
языка, такие, как письменная речь или невысказанная
вербализованная мысль (см. § 4.3.).
3.1. Имеется два участника: "говорящий" и
"слушающий".
3.2. Каждый из участников вовлечен в процесс
использования языка, являющийся частью более широкого мы-
5*
131
слительного процесса, который включает в себя
восприятие и интерпретацию окружения, формулирование целей,
а также составление и приведение в исполнение планов для
достижения этих целей.
3.3. Каждый участник, приступая к осуществлению
своего коммуникативного намерения, располагает рядом
способностей, включающих следующие ниже факторы.
3.3.1. Общую способность к мыслительной обработке
информации, которая предусматривает (помимо всего
прочего) систему символов и средства накопления знания в
символьной форме, как это было описано в § 2.
3.3.2. Набор различных специфических форм
представления, способов обработки и стратегий, используемых при
выполнении различных задач восприятия, действия,
рассуждения и понимания. С точки зрения языкового
употребления здесь существенны представления языковых
объектов на различных уровнях анализа, таких, как
фонологические последовательности и синтаксические структуры.
3.3.3. Совокупность специфических представлений
(выражаемых символьными структурами на основе особых форм
репрезентации), которая составляет индивидуальную
"модель мира". Для целей анализа языкового употребления
выделяются такие релевантные части этой модели;
совокупность знаний о языке, включающих синтаксическое
структурирование, лексические значения, условия речевого
акта и проч.; анализ (на многих уровнях) хода диалога со
стороны носителя языка; модель собеседника, включая его
(ее) знание, цели на данном этапе и состояние этапа
обработки данных; модель целей и знания самого носителя
языка.
3.4. Каждое высказывание является конечным
результатом конструктивного процесса, когда говорящий
вырабатывает языковую структуру, которая могла бы отвечать
комбинации коммуникативных целей, используя
предоставляемые языком ресурсы.
3.4.1. Не существует единого формального объекта,
который являлся бы "значением" или "первичным
намерением" высказывания. Обобщенное значение — это
абстракция, покрывающая все цели. Многие из целей находятся
на метакоммуникативном уровне, имея дело с личным
взаимодействием говорящего и слушающего, а не с
предполагаемым содержанием высказываний. Цели какого-то одного
высказывания могут включать:
132
каузацию действия в вербальной либо в невербальной
форме со стороны слушающего;
каузацию осуществления слушающим некоторых
выводов или переживания им определенных эмоциональных
реакций, относящихся либо к предмету разговора, либо к
взаимодействию говорящего и слушающего;
передачу информации о сущности, наличие которой в
модели мира слушающего уже считается установленным
фактом;
стимулирование создания слушающим новой
концептуальной сущности, соответствующей некоторой сущности,
наличествующей в модели мира говорящего;
направление внимания слушающего на некоторую
сущность или на отдельные свойства известной сущности
(возможно, с целью создания контекста для последующих
высказываний). Некоторые из этих целей выступают как
подцели других целей (например, введение обозначения
некоторого объекта с целью изложения какого-то факта о нем),
в то время как могут быть и цели, по крайней мере частично
независимые (например, констатация факта, привлечение
внимания слушающего к какой-либо сущности, передача
общего отношения к слушающему).
3.4.2. Как и любой сложный конструктивный процесс,
конструирование высказывания осуществляется не как
простая последовательность отдельных этапов. Оно может
включать процесс обратной связи, когда сначала принима.
ется решение, а затем оно меняется на основе анализа его
последствий. В значительной степени этот процесс является
бессознательным и предполагает использование всего
знания говорящего, включая модель слушающего на данный
момент времени, знание об описываемых сущностях и
знание языка. Каждое высказывание является частью
большей последовательности, и часть конструктивного процесса
должна учитывать соображения, касающиеся
последовательности в целом. Поскольку язык действует в составе более
широкой системы мышления и коммуникации, существуют
и другие аспекты этой тотальной системы (например,
ментальные состояния говорящего, обратная связь со стороны
слушающего), воздействующие на форму высказывания,
так что не все в этой форме можно прямо связать с
эксплицитными коммуникативными целями.
3.4.3. В ходе конструктивного процесса структуры
строятся на различных уровнях абстракции — некоторые пред-
133
ставляют языковые объекты, такие, как слова и фразы,
другие имеют дело с суждениями и дескрипциями, а третьи
представляют планы коммуникации. Не существует
единой структуры, которая могла бы быть интерпретирована
как статичный "моментальный снимок", отображающий
значение в целом, поскольку в процессе построения
структуры подвергаются изменениям.
3.5. В процессе понимания высказывания слушающий
не просто "декодирует" языковые структуры говорящего,
но осуществляет более широкий процесс анализа и
вывода, имеющий общие элементы с процессом, используемым
при осмыслении и других данных восприятия.
3.5.1. Языковые формы выступают как начальная точка
процесса анализа (опять-таки по большей части
неосознанного), в ходе которого строится ряд концептуальных
сущностей на различных уровнях. Результаты этого
анализа включают:
Установление точек соприкосновения моделей мира
говорящего и слушающего посредством поиска или создания
концептуальных сущностей, которые предположительно
соответствуют сущностям, имеющимся в распоряжении
говорящего.
Осуществление выводов, к которым говорящий хотел бы
подвести слушающего.
Осуществление выводов, основывающихся на содержании
высказывания и не предусмотренных специально
говорящим. Это включает в себя поиск моделей более широкого
плана, согласующихся с детализированным
пропозиционным содержанием.
Осуществление выводов, касающихся состояния
говорящего на данном этапе, включая цели высказывания,
фокус его внимания, состояние его знания (включая его
знание о слушающем).
3.5.2. Результаты анализа со стороны слушающего
представляют объединенный продукт:
высказывания (включая такие аспекты, как интонация и
тон голоса),
знания, которыми обладает слушающий, включая его
модель релевантного "мира" и модель, описывающую
говорящего,
состояния слушающего в данный момент, включая
непосредственный фокус внимания и модель
предшествующего данному высказыванию разговора,
134
ограниченной способности слушающего к обработке
информации, включая пределы имеющихся возможностей
обработки высказывания. Сюда следует отнести
ограничения со стороны других, одновременно решаемых задач
и со стороны подачи на вход следующего высказывания.
3.5.3. При анализе принимаются во внимание и
"синтагматический контекст", в котором выступает
высказывание, и "парадигматический контекст" — альтернативы
всех выборов, которые говорящий осуществил в процессе
построения данного высказывания. Во многих случаях
наиболее значимая часть сообщения передается тем фактом,
что определенная альтернатива НЕ была выбрана. Один
из центральных аспектов структуры языка заключается
в навязывании конечных систем выбора.
4. диапазон семантической теории
Существует ряд разграничений, обычно проводимых в
лингвистической теории, которые теряют свою силу в
рамках процессуальной парадигмы. Невозможно
рассмотреть их здесь детально, но они могут послужить основой
для обсуждения границ того, что следует включать в
семантическую или лингвистическую теорию.
4.1. Семантика vs. прагматика.
В вышеописанных положениях по большей части
игнорировалось традиционное разграничение между
"семантикой" и "прагматикой". Это разграничение составляет
основную отличительную черту подхода, который
преобладает в лингвистической литературе по семантике. Этот
"формально-структурный" подход к семантике
основывается на рассмотрении только структурных отношений между
словами и высказываниями, которые берутся независимо
от контекста их употребления и могут быть формализованы
с помощью математической логики. Типичные
формулировки центральной задачи семантической теории в ее узком
толковании излагаются примерно так:
«Довольно бесспорным является положение о том, что
адекватное семантическое описание должно позволить нам
определять для каждого из бесконечного числа
предложений языка, является ли оно аналитически истинным,
является ли оно противоречивым или аномальным, с
какими предложениями вступает оно в полные либо
частичные парафразовые отношения и с какими предложениями
135
оно находится в отношении следования». (Wilson, 1975,
р. 3.)
«. . . [наиболее трудной] проблемой является
определение тех аспектов приемлемости, которые связаны с
условиями неистинности. Они представляются мне явно
неоднородными и включают соотнесенность с социальными
установлениями, правилами дискурса, психологическими
соображениями и контекстуальными факторами самого
различного порядка. Более того, они представляются мне в
своем большинстве, если не во всех случаях, явно
нелингвистическими и, конечно, не относящимися к компетенции
говорящего —слушающего. По этим причинам я хотел бы
принципиально исключить их из семантического описания».
(Wilson, 1975, р. 14.)
Аспекты значения, которые взаимодействуют с
контекстом (социальным, текстуальным или психологическим),
переадресуются в сферу "прагматики". При таком подходе
довольно трудно и даже невозможно ставить вопросы,
обсуждаемые во второй части данной работы (см. ниже,
раздел II). Даже если бы мы должны были согласиться с
заведомо ограниченными задачами, вытекающими из
игнорирования контекста, нет никаких априорных оснований
утверждать, что теория, определяемая таким образом,
возможна. Уже было высказано много критических замечаний
(см., например, Bolinger, 1965) по поводу попытки
сведения лексического значения к формальным структурам,
основанным на комбинировании элементарных маркеров.
Процессуальный подход не проводит резкого
разграничения между символьными структурами, которые
представляют "знание языка", "знание языкового употребления"
и "знание мира" Он начинается с гипотезы, что многое
может быть достигнуто изучением того общего, что имеют
между собой эти различные области знания, с точки
зрения репрезентации и обработки информации.
4.2. Компетенция vs. употребление.
Современная лингвистическая теория тщательно
избегала процессуального подхода к языку. Это обусловлено
в значительной степени догмой, согласно которой теории,
основывающиеся на рассмотрении использования языка
или мыслительных процессов, являются теориями
"употребления" и, следовательно, по природе своей
вторичными по отношению к более фундаментальным теориям
"компетенции". Многие лингвисты принимают эту схему доволь-
136
но некритично. Она основана на том наблюдении, что
существует много факторов, влияющих на различные детали
языкового употребления, которые не связаны с основной
структурой языка. Теории должны стремиться
абстрагироваться от покашливания, запинок и переключения
внимания, которые прерывают нормальное использование
языка человеком, точно так же, как простая теория
механики постулирует существование воображаемого мира, где
отсутствует трение.
Совершенно избегая моделей обработки информации,
такие теории принимают довольно спорное допущение,
что можно сформулировать описание языковой структуры
независимо от процессов языкового употребления и что
полученное описание будет более простым и логически
первичным по отношению к любому описанию, эксплицитно
основывающемуся на процессах обработки информации.
Истинность этой гипотезы — вопрос эмпирический —
аналогичное утверждение верно для одних наук и неверно для
других. Есть некоторое основание считать, что она верна
для тех аспектов синтаксиса, которые обусловливают
грамматически правильные суждения (хотя открытым является
вопрос для тех областей, где подобные суждения являются
размытыми), но нет никаких свидетельств того, что она
верна для языка в целом, особенно когда принимается во
внимание значение.
При процессуальном подходе динамические концепты
используются с целью объяснения структуры языка на
уровне абстракции, который находится еще далеко от
мелких подробностей конкретного "употребления", не
релевантных для первого уровня понимания основных процессов.
На каждой стадии развития теории необходимо решать,
какие аспекты процесса обработки релевантны, а какие
можно игнорировать для упрощения проблемы. Но на
каждой стадии нужно сосредоточиться на наборе "способностей'',
которые формируют компетенцию человека в
использовании языка. В этом смысле такая теория может быть
названа теорией "компетенции". Многие из этих способностей
носят процессуальный характер — они включают
алгоритмы обработки воспринимаемых входных данных и
хранящейся в памяти информации, стратегий получения
выводов и способы представления накопленного знания в
символьных структурах. В этом смысле такая теория
учитывает "употребление". Разграничение "компетенция — упо-
137
требление" является бессмысленным, ибо оно основывается
на том допущении, будто языковую компетенцию можно
охарактеризовать с помощью формализмов, которые не имеют
отношения к языковому употреблению, а такое допущение
вполне может оказаться ложным.
4.3. Язык vs. коммуникация.
По вопросу об отношении между языком и
коммуникацией существует обширная философская литература.
Иногда утверждают (например, Chomsky, 1975, р. 57 и сл.),
что нет смысла брать коммуникацию в качестве отправной
точки при исследовании языка, поскольку есть такие
случаи его использования, которые не предполагают наличия
одного определенного слушающего, а также и такие, в
которых языковые формы существуют лишь в уме их
создателя.
Модель, описанная в § 3, приложима к "говорящему"
и "слушающему" и в более общем смысле, чем просто в
смысле общения "лицом к лицу" (этот случай приводился
нами в качестве примера). Прежде всего говорящий может
иметь в виду аудиторию, о которой он (или она) прямо не
осведомлен (например, круг читателей газеты или
слушателей радиопередачи). Детальный характер высказываний
будет при этом иным, так как модель слушающего
оказывается менее точной и более абстрактной. Допущения,
касающиеся общих моментов контекста, должны быть
ограничены вещами, принадлежащими к области
общекультурной либо прямо представленными в тексте. В этом случае
нет никакой прямой лингвистической или
паралингвистической обратной связи с состоянием получателя в данный
момент времени, и, следовательно, конструирование
высказываний должно базироваться на умозаключениях о том,
как потенциальный получатель может осваивать
высказывания. Однако общая природа используемого знания и
процесса построения высказывания остается, в основном,
той же.
В том особом случае, когда языковые структуры (во
кализованные или невокализованные) предназначаются
только для использования их создателем, применение
данной модели происходит довольно похожим образом. Прежде
всего, акт построения внутренних высказываний может
быть шагом к отбору и накоплению информации, доступной
для носителя языка. Попытка кодирования мыслей с
помощью ограниченного набора категорий и реляционных
138
форм, которыми располагает естественный язык,
модифицирует содержание этих мыслей. В одних случаях этот
процесс может отсортировать те аспекты мысли, которые не
поддаются языковому кодированию, и тем самым
изменить фокус внимания индивида. В других случаях этот
процесс может прояснять и расширять содержание мысли
в результате дополнительного рассуждения и принятия
решений, которые должны осуществляться при отборе
лексических единиц и синтаксических структур.
Далее, многие межличностные цели, обсуждавшиеся в
§ 3, приемлемы в качестве внутренних целей в системе
обработки информации. Например, специальные языковые
формы могут служить для стимулирования дальнейших
выводов, эмоциональных реакций и ассоциаций, которые
не могли бы быть вызваны еще не сформулированной мыслью.
При мышлении в формах языка человек может оказывать
позитивное воздействие и на другие области своей
мыслительной деятельности.
4.4. Речевые акты vs. значения.
Иногда дискуссия о "языке" и "коммуникации"
формулируется как проблема разграничения между "значением"
высказывания и "речевыми актами", осуществляемыми в
процессе его употребления. Уделяя основное внимание
процессу, в котором участвуют говорящий и слушающий,
процессуальный подход в значительной степени
ориентирован на анализ речевого акта. И только второе место
отводится более ограниченному понятию "значения" как
формальному пропозиционному содержанию, присущему
высказыванию, независимо от его употребления (при таком
понимании "значение" — это одна из многочисленных
символьных структур, обрабатываемых говорящим или
слушающим).
Процессуальная семантика отличается от некоторых
теорий речевых актов (см., например, Searle, 1970;
Sadock, 1974) тем, что внимание сосредоточивается на всем
комплексе целей говорящего, а не на единичном
"внеречевом акте", взятом как первичная сущность. Высказывание
анализируется с точки зрения того, как оно удовлетворяет
одновременно целому набору коммуникативных и
межличностных целей, проявляющихся разными способами,
которые используют механизмы языка и паралингвистическое
взаимодействие. Важно отличать эту многомерность
значения (все разные уровни значения могут быть в одина-
139
ковой мере обоснованными и одновременно присутствовать
в намерениях говорящего) от неоднозначности, когда
должно выбираться лишь одно из возможного множества
значений.
Цели речевого акта отображаются на содержании
высказывания далеко не всегда простым образом. Они часто
требуют сознательного вывода со стороны слушающего
(см. § 3, 4). Такие умозаключения могут быть основаны на
знании, которое охватывает широкий диапазон вариантов —
от условностей языка (вроде, например, стандартной
интерпретации How do you do? 'Как поживаете?', букв. 'Как
вы делаете?') и таких высказываний, которые также
условны, но имеют некоторые прагматические основания (как,
например, Can you pass the salt? 'He сможете ли вы передать
соль?' и т. п., обсуждаемых в Gordon and Lakoff,
1971; Searle, 1970, и др.), до умозаключений,
требующих специального знания мира (как в случае, когда
родители говорят ребенку, который плохо себя ведет: "Do
you remember that the circus is coming to town next week?"
'Ты помнишь, что цирк приезжает в город на следующей
неделе?'). Во многих случаях речевой акт передает
информацию на совершенно ином уровне, чем это видно из его
наблюдаемой формы (как в случае, когда говорят: "Oh,
you're here" ('А, вы здесь?') — при обращении к человеку,
которому и без этого сообщения известно его собственное
местонахождение).
ЧАСТЬ И
ПРОЦЕССУАЛЬНЫЙ ПОДХОД
К НЕКОТОРЫМ СПЕЦИАЛЬНЫМ ПРОБЛЕМАМ СЕМАНТИКИ
5. природа лексических значений
5.1. Проблема определения границ значения.
Слово bachelor * фигурировало во многих дискуссиях
по семантике, поскольку (если оставить в стороне нечеткие
значения, соотнесенные с морскими млекопитающими и
средневековым рыцарством) оно, как кажется, имеет формально
фиксируемое значение, которое может быть
перифразировано следующим образом: "взрослый человек, мужчина,
который никогда не был женат". Традиционные теории се-
* Bachelor в английском языке имеет четыре основных значения:
1) 'холостяк', 2) 'бакалавр', 3) 'рыцарь (особенно молодой)', 4) 'морской
котик, оставшийся без пары в период брачного сезона',— ÏIpuMt перев,
140
мантики имеют дело с такими задачами, как, например,
определение аналитичности предложения (My bachelor
uncle is unmarriçd 'Мой холостой дядя не женат'). При
реальном употреблении слова возникает много проблем,
которые не так просто поставить и формализовать.
Рассмотрим следующий диалог:
Хозяин: "На следующей неделе у меня будет
большой вечер. Вы не знаете каких-нибудь симпатичных
холостяков, которых я мог бы пригласить?"
Друг: "Да, я знаю такого парня X..."
Проблема, которая должна быть разрешена
(применительно, например, к нижеприводимым фактам), состоит
в выяснении того, для каких значений X ответная реплика
будет являться закономерным ответом в свете обычного
значения слова bachelor. Возможен простой тест — спросить,
применительно к какому из этих фактов хозяин может с
полным основанием посетовать: «Вы солгали. Ведь вы
сказали, что X — холостяк!"
А: Последние пять лет Артур счастливо живет с Алисой.
У них двухлетняя дочка, но они никогда не были
официально женаты.
В: Брюса должны были призвать в армию, поэтому он
и его приятельница Барбара попросили мирового судью
поженить их, чтобы Брюс был освобожден от службы. Они
никогда не жили вместе. Он встречается со многими
женщинами и хочет развестись, как только найдет себе
подходящую жену.
С: Чарли 17 лет. Он старшеклассник, живет дома со
своими родителями.
D: Дэвиду 17 лет. Он ушел из дому, когда ему было 13,
начал свое небольшое дело, и сейчас он — преуспевающий
молодой делец, живет в собственном особняке, ведет
вольный образ жизни.
Е: Файзале, по закону его страны (Абу Дхаби),
разрешается иметь трех жен. У Файзалы сейчас уже две жены,
и он хотел бы встретить еще одну потенциальную невесту.
F: Отец Грегори — епископ католического собора в
Гротоне на Темзе.
5.2. Слова как символы абстрактных ситуативных
типов*.
* В оригинале — exemplar; по смыслу изложения более подходит
термин ситуативный тип. Автор иногда отождествляет его с термином
прототип.— Прим. редч
141
Набор примеров, данных в § 5.1, может быть продолжен
до бесконечности, и в каждом случае возникают проблемы,
связанные с допустимостью и уместностью применения
слова bachelor. При обычном употреблении слово не передает
четко определенной комбинации элементарных суждений,
а вызывает в памяти ситуативный тип, обладающий рядом
свойств. Этот ситуативный тип не есть какой-то
конкретный индивидуум из области опыта говорящего, но является
более абстрактным, представляя собой объединение
типичных свойств. Прототип слова bachelor может быть
описан как:
1. человек
2. мужчина
3. взрослый
4. в данный момент официально не женат
5. не находится в жизненной ситуации, эквивалентной
браку
6. потенциально способен жениться
7. ведет холостяцкий образ жизни
8. ранее не был женат
9. имеет намерение, по крайней мере временное, не
жениться.
10. . . .
Каждый из мужчин, описанных выше, отвечает
некоторым, но не всем указанным характеристикам. За
исключением употребления в узких юридических контекстах, не
существует критериев, по которым можно было бы выделить
какое-то подмножество этих характеристик в качестве
"основного значения" данного слова. На самом деле, среди
носителей английского языка не существует единства по
поводу того, может ли человек, который когда-то был женат,
называться "холостяком", и в то же время имеется достаточно
четкое мнение, что такое название неприменимо к тому, кто
не собирается никогда жениться (например, принявший
обет безбрачия).
Этот список не только открыт, но и отдельные его
характеристики сами по себе не определимы в терминах
элементарных понятий. Сводя значение слова bachelor к формуле,
включающей маркеры "взрослый" или "потенциальный
жених", мы оказываемся перед необходимостью описывать
таковые тоже в терминах ситуативных типов. Понятие
142
"взрослый" не может быть определено с помощью
возрастных критериев — разве только со специальной
юридической целью, но и в этом ограниченном смысле оно
определяется для разных правовых аспектов по-разному. Фразы
типа "ситуация, подобная брачной" и "холостяцкий образ
жизни" отражают в своей синтаксической форме скорее
намерение передать стереотипные ситуативные типы, чем
формальные определения. Делались попытки использовать
количественные и статистические методы для более точной
формализации "размытых" понятий. Лабов (Labov, 1974),
например, попытался выделить характеристики таких
ситуативных типов, как "чашка" и "стакан", с точки зрения
различения их в некоторой группе говорящих в ходе
эксперимента, когда объективные характеристики
описываемого стимула варьировались по нескольким измерениям.
Однако в результате получилась слишком одинаковая для
разных по своим характеристикам объектов математическая
структура.
В каждом ситуативном типе совмещаются различные
виды характеристик, оказывающих совершенно четкое
воздействие на выбор лексических единиц. Существует,
например, интуитивное ощущение, что значение слова
bachelor включает в себя некоторые абсолютно необходимые
условия, но может подвергаться метафорическому
расширению, когда оно применяется к индивидуумам,
нарушающим эти условия (как в разговоре о "моей холостой тете"
(my bachelor aunt) или в ответе на вопрос "У вашего пса
были когда-нибудь щенки?" — "Нет, он холостяк"). Но
даже для кажущихся простыми предикатов типа "человек"
и "мужчина" легко придумать примеры, где понятия
элементарной предикации не являются адекватными
(например, в ситуациях, в которых участвуют евнухи или
человекоподобные чудовища).
Существует тенденция (как указал Дж. Лакофф
(Lakoff, 1972)) употреблять "ограничители" при
использовании термина в случаях, когда ставится цель передать
характеристики, являющиеся типичными, но не
существенными. ("Жена Энтони так часто бывает в деловых
разъездах, что он у нас периодически холостяк" или "Этот случай
с Сарой утвердил меня во мнении, что Карл — настоящий
холостяк".) Способы, с помощью которых различные
"ограничители" подчеркивают различные характеристики,
весьма сложны, и невозможно провести резкую границу между
143
"основными" и "вторичными" или "определяющими" и
"характеризующими" свойствами.
Сложность всех этих проблем должна оказать влияние
на природу семантической теории. Теория, которая их
игнорирует, не может претендовать на исчерпывающую
экспликацию значения слов. Разобранный случай вовсе не
патологичен: по сути дела, bachelor был использован в
качестве примера потому, что по сравнению со словами типа
"друг" (friend) и "игра" (game) его значение кажется более
четко определенным.
5.3. Неформальная прототипная семантика.
Идея семантики, основывающейся на ситуативных типах,
развивалась Филлмором (Fillmore, 1975) и другими
лингвистами. Они обычно избегают строгой формализации
теории, но зато пытаются достичь максимальной широты
в отборе данных, привлекаемых для анализа.
Исследования подобного рода носят в основном анекдотический
характер: в них описываются примеры и выделяются
интересные феномены, связанные со способами употребления
слов. Однако проделана уже большая работа по
прототипам в психологии (см., например, Rosch, 1975), а в
философской литературе по этому поводу уже многие годы
ведутся дискуссии, начиная с анализа Витгенштейном слова
игра (Wittgenstein, 1953).
5.4. Процессуальная основа для прототипной семантики,
связанная с набором описаний (дескрипций).
Пока не существует полностью развитого
процессуального подхода к лексическому значению, но уже имеются
начала теории, использующей ряд вычислительных идей,
применимых к случаям, когда происходит "подбор"
(matching) ситуативных типов к индивидуальным явлениям.
Понятие подбора соотносится с проверкой истинности
набора пропозиций, применимых к некоторой сущности, но в
то же время отличается от стандартных понятий теории
истинности тем, что эксплицитно имеет дело с ресурсами
обработки и дифференциальной доступностью информации,
ассоциируемой с накопленными сущностями и с состоянием
(в данный момент) пользователя языка. В силу
эксплицитного учета объема вычислительной работы, подбор нельзя
свести к понятиям условий истинности, разве что в случае,
если представить себе попытку аксиоматизации в
мельчайших деталях поведения всей когнитивной обрабатывающей
системы.
144
Многие современные исследования в области
когнитивной науки (см., например: Bobrow and Winograd,
1977; Norman, Rumelhart and the LNR group,
1975; Minsky, 1975; Newell and S i m о n, 1972)
имеют дело с этими проблемами. Последующее изложение
будет касаться лишь тех аспектов, которые имеют
отношение к лексическому выбору. Аналогичные понятия подбора
могут быть применены и в других частях языковых
процессов, включая определение подразумеваемой референции
предложения, о чем идет речь в § 6.
5.4.1. В памяти носителя языка, хранящей его
языковые знания, для произвольного слова может храниться
ассоциированная с ним сущность, являющаяся
ситуативным типом, который описан в терминах того же
представления, что используется и для других понятийных сущностей
(например, объектов реального мира). Не все слова
обладают простыми ситуативными типами (например, такие
функциональные слова, как the, и логические связки типа
although 'хотя'), а некоторые слова имеют более одного.
При отборе лексической единицы говорящий ищет такое
слово, ситуативный тип которого лучше всего подходит для
передачи информации. Слушатель выбирает (или создает)
понятийную сущность, которая лучше всего соответствует
полученному в результате выбору. С обеих сторон понятие
"наилучшего соответствия" связано с актуальным
контекстом. Осуществляя лексический выбор, говорящий
использует свою модель слушателя, чтобы выбрать единицу,
способную привести к заданным умозаключениям на всех
уровнях, а не только в процессе подбора правильной
понятийной сущности (например, в случае употребления слова
головорез, а не нападающая сторона при описании грабежа,
или заткнитесь у а не успокойтесь при формулировании
просьбы).
5.4.2. Существует класс когнитивных процессов
«подбора», которые оперируют описаниями (символьными
структурами), имеющимися для двух сравниваемых сущностей,
и устанавливают соответствия и различия между ними.
Эти процессы используются в ходе осуществления самых
различных мыслительных операций и не являются
специфическими именно для языкового использования. На самом
простом уровне подбор соответствует проверке того,
тождественно ли некоторое описание (состоящее из символьных
структур) тому, которое ассоциировано с данной сущностью.
145
Так, если взять понятие "холостяк", возможно, что
говорящий или слушающий располагает хранящейся структурой,
которая непосредственно предицирует данное понятие
применительно к некоторому индивиду. На следующем уровне
могут включаться вторичные процессы. Например, два
описания могут успешно сочетаться в результате процесса
подбора, если одно из них содержит информацию,
непосредственно выводимую из общих знаний и информации, в
явном виде содержащейся в другом описании. Одна из
распространенных форм вторичной обработки заключается в
сопоставлении двух сущностей, играющих аналогичные
роли в двух исходных описаниях. При сравнении, например,
описаний двух действий процесс подбора может включать
сравнение ранее известных свойств двух деятелей
(агенсов этих действий).
5.4.3. Результатом процесса подбора является не
простой ответ типа "истинно/ложно". В самой общей форме он
может быть сформулирован следующим образом: «При
данном наборе альтернатив, подлежащих моему рассмотрению
(в силу конкретного контекста, включающего мою модель
другого участника речевого акта), при данном объеме
процессов обработки, который может быть уделен выбору одной
из альтернатив (в свете всех других мыслительных
процессов, как лингвистического, так и нелингвистического
порядка), рассматривая по порядку те хранящиеся в моей
памяти структуры, обращение к которым представляется
наиболее естественным в данном контексте, я прихожу вот
к такому-то наилучшему варианту подбора, устанавливаю
такую-то степень соответствия, указываю такие-то
конкретные места, в которых точное соответствие обнаружить
не удалось».
5.4.4. Процесс подбора обладает лимитированными
ресурсами (см. Bobrow, 1975, где подробно говорится об
этом). В каждом отдельном случае процесс происходит на
протяжении конечного времени, накапливая данные о том,
осуществим ли указанный вариант подбора. В одних
случаях мы получаем достаточно обоснованные позитивные
или негативные результаты, а в других случаях — лишь
примерное "взвешивание". Одни и те же исходные данные
в процессе подбора могут привести к различным (даже
весьма противоречивым) результатам в случае различия в объеме
ресурсов обработки. Например, между двумя описаниями
может существовать явное несоответствие, но оно может
146
быть локализовано в той части символьной структуры,
которая не будет проверена на начальных этапах обработки.
И в этом случае любой процесс, который не располагает
ресурсами, чтобы проникнуть в эту часть, выдаст
заключение о высокой степени соответствия.
5.4.5. Набор структур, ассоциируемых со словом или
понятийной сущностью, не является однородным с точки
зрения их доступности. Существуют различия, которые
являются отражением не истинности и не степени
убежденности относительно релевантных суждений, а широкого
круга иных факторов, имеющих дело с мотивациями,
историей запоминания и употребления, эмоциями и т. д.
5.4.6. Выбор порядка, в каком будут сравниваться
подструктуры описания, является функцией их относительной
доступности в данный момент, зависящей как от формы их
хранения в памяти, так и отданного контекста.
Относительная доступность двух структур может быть сколь угодно
различна для разных состояний процессора (например,
конкретных целей, фокуса внимания, набора слов,
недавно услышанных, и т. д.).
5.4.7. При осуществлении подбора контекст может
предупреждать принятие кажущихся «естественными»
отрицательных решений относительно того, какие свойства
ситуативного типа следует принимать во внимание и как
разрешать возникающие противоречия. Например, при
опознавании метафорических употреблений и лексических
ограничителей слушающий находится в состоянии, когда
очевидные несоответствия трактуются не как сигнал того, что
подбор в целом невозможен, но как указание на то, что его
следует проводить более тщательно (подыскивая интересные
умозаключения) на основе других свойств.
6. проблемы референции
В этом разделе процессуальный подход к семантике
противопоставляется более принятым понятиям, связанным с
условиями истинности и референцией. Как и в примерах § 5,
речь будет идти не о наилучшем решении поставленных
ранее проблем, а о попытке заново определить природу и
структуру релевантных проблем. Морган (см. Morgan,
1975) анализирует проблемы референции в направлении,
очень близком к процессуальному подходу, и некоторые
примеры заимствованы у него. В рамках общей системы про-
10*
147
цессуального подхода оказывается возможным дать
формальную трактовку многих предложенных им неформальных
понятий.
6.1. Определенная и неопределенная референция.
(6—1) When we got home, the sherbet was gone, and the
empty carton was in the sink. ' Когда мы пришли домой,
шербет исчез, а пустая коробка была в мусорном ведре.'
(6—2) The reason I didn't do it was that I got a phone
call. 'Причиной того, что я не сделал этого, был телефонный
звонок.'
(6—3) Examining the cabinet, we noticed that a door
was marred. 'Осматривая кабинет, мы заметили, что одна
из дверей была повреждена.'
(6—4) When the presidential plane arrived at Dulles
airport, the reporters were greeted by {a/the} sullen and
snappish Henry Kissinger. 'Когда президентский самолет
прибыл в аэропорт Далласа, репортеров приветствовал
угрюмый и раздраженный Генри Киссинджер.'
(6—5) The unicorn is a mythical beast. 'Единорог —
мифическое животное.'
В рамках условно-истинностной трактовки семантики
соответствующие вопросы имеют дело с условиями
истинности (предъявляемыми к моделям, а не к состоянию носителя
языка), при которых употребление конкретного показателя
определенности — неопределенности будет правильным.
Рассел (см. Russell, 1919) высказал предположение,
что «. . . утверждения относительно "определенного того-то
и того" (the so-and-so) всегда предполагают
соответствующие утверждения относительно "некоторого того-то и того"
(a so-and-so) с оговоркой, что существует не более одного
«того-то и того"». (См. Rosenberg and Travis,
p. 172.) Это применимо к таким выражениям, как
"президентский самолет" (the presidential plane) в предложении
6—4, но, как было отмечено Стросоном (см. Strawson,
1950) и Доннеланом (см. Donnellan, 1966), такое
обобщение неадекватно для объяснения других случаев,
представленных в этих примерах. В большинстве случаев
употребления либо показателя определенности the, либо
показателя неопределенности а значение существенно
изменится, или же предложение станет неприемлемым, если
будет употреблен противоположный показатель (для
множественного числа и партитивов — подходящая форма
выражения неопределенности).
148
Проблема состоит в том, чтобы найти формальный способ
описания условий (включая фокус внимания и цели,
наличествующие в. умах говорящего и слушающего в данный
момент) — условий, которые влияют на выбор и
интерпретацию определителей. Большинство философских
работ, рассматривавших фразы с определенной референцией,
не уделяли внимания этим более тонким аспектам
определений референции, основываясь на том допущении, что они
отражают вторичные употребления такого средства,
которое имеет более простую базисную структуру, и что на
глубинном уровне это средство можно описывать в терминах
условий истинности, не делая явных ссылок на
коммуникативное намерение говорящего или на состояние знаний
слушающего.
6.2. Употребление фраз с определенной референцией.
Предложения в § 6.1. используют показатель
определенности для передачи следующих видов информации:
6.2.1. Соотнесенность с объектами, обусловленная
стандартным знанием. Один из самых обычных типов
использования фраз с определенной референцией иллюстрируется
выражениями the empty carton 'пустая коробка' (6—1),
the sink 'мусорное ведро' (6—1), the reporters 'репортеры''
(6—4). В каждом из этих случаев наличествует фрагмент
знаний о мире, который позволяет слушающему выделить
некоторую сущность (она может иметь и статус множества),
сделать обоснованное заключение, что он существует и
что именно ее имеет в виду говорящий. Слушающий не
нуждается в предварительном знании о данном объекте
(например, о коробке), нет надобности и в особой его
спецификации — в большинстве домов имеется более одного
мусорного ведра, но можно легко сделать заключение, что
имеется в виду мусорное ведро, находящееся на кухне в
данной квартире.
6.2.2. Соотнесенность с предварительно установленным
контекстом. Часто употребление выражений с определенной
референцией предполагает, что имеется предварительно
установленный контекст и говорящий полагает, что
слушающий знает его. Выражения the sherbet 'шербет' (6—1) и
the cabinet 'кабинет' (6—3) употреблены в таком
контексте, что подразумеваемая соотнесенность для них неясна
без дополнительной информации о том, в какой ситуации
было произнесено данное предложение. Этот комплексный
контекст мог включать предварительное прямое знание
149
(например, слушающий присутствовал при покупке
шербета) или речевой контекст (например, ранее произнесенное
предложение: «На прошлой неделе перед нашей поездкой
мы купили целый галлон клубничного шербета..."). Но
это, однако, не является частью предполагаемого у
носителя языка знания, независимого от ситуации.
6.2.3. Предполагаемая единственность. При
употреблении выражения The reason I didn't do it 'причиной того,
что я не сделал этого' (6—2) говорящий передает некоторую
новую информацию, а именно, что существует лишь одна
причина. В выражении a door was marred 'дверь была
повреждена' решение не употреблять показатель
определенности указывает на то, что данный конкретный кабинет имеет
более одной двери. Понятие уникальности распространяется
и на выбор того или иного показателя в выражениях the
sullen and snappish Henry Kissinger и a sullen and snappish
Henry Kissinger 'угрюмый и раздраженный Киссинджер'.
Выбор показателя неопределенности предполагает, что
референт не подается как единственный, то есть что
существует более одного Генри Киссинджера (или более одной
маски, которую он надевает) и что данное предложение
имеет в виду одного из них. В результате фокус внимания
сосредоточивается на отличительных характеристиках данной
конкретной маски, чем и достигается эффект, к которому
стремился говорящий.
6.3. Основы процессуальной теории определенной
референции.
6.3.1. Как говорящий, так и слушающий имеют наборы
предварительно установившихся ментальных сущностей.
Они могут соответствовать реальным объектам и событиям
действительности, выдуманным или воображаемым
объектам и событиям, абстракциям и т. д. (см. § 2.2.).
6.3.2. Для каждой из этих сущностей человек имеет
набор символьных структур, представляющих описания,
которые, как он полагает, применимы к данной сущности.
Это те структуры, которые используются в процессах
подбора, описанных в § 5.4.
6.3.3. Используя языковое знание и общее знание о
мире, слушающий может сделать заключение о том, что
описание, содержащееся в каком-то выражении, применимо
к ментальной сущности, уже имеющейся в модели, или же
необходимо добавить к ней новую сущность.
6.3.4. Как говорящий, так и слушающий обладают
150
моделью (частичной и не обязательно правильной)
множества сущностей, описаний и мыслительных процессов,
имеющихся в распоряжении партнера. Эта модель меняется
в процессе общения под влиянием того, что было сказано,
и общего ситуационного контекста.
6.3.5. Решив использовать фразу с определенной
референцией, говорящий тем самым сообщает слушающему
следующую информацию: «В моем ментальном мире имеется
уникальная сущность, о которой я намереваюсь кое-что
сказать. Данная описательная фраза достаточна для того,
чтобы вы могли найти или создать некоторую уникальную
сущность в вашей модели мира, используя весь контекст и
общее знание (относительно мира, правил речевого
общения и моего собственного состояния), о наличии которого у
вас я делаю предположительный вывод на основе моей
модели о вас в настоящий момент».
Это определение привязано к процессуальному подходу
в том отношении, что оно апеллирует к "текущему
контексту" говорящего и слушающего. Умозаключения, которые
с точки зрения говорящего может сделать слушающий,
зависят не только от логических суждений, но и от внимания,
возможностей обращения к памяти и от целей, как уже
говорилось в предшествующем разделе. Это определение
учитывает также больше эксплицитных формальных уровней,
чем обычные понятия теории истинности. Во-первых, оно
описывает определенную референцию в терминах
сообщения, передаваемого слушателем говорящему относительно
сущностей и дескрипций в соответствующих ментальных
мирах, а не суждения об объектах реального мира.
Во-вторых, оно эксплицитно ссылается на тот факт, что в процессе
понимания совершается некоторый интерпретирующий
процесс,— говорящий может делать выбор определителей на
основе заключений о процессах, которые использует
слушатель при интерпретации данной фразы, а слушающий
может основывать свою интерпретацию на умозаключениях
относительно состояния и деятельности говорящего. Это
особенно важно в случаях, подобных, например,
употреблению выражения a door 'дверь' (6—3), где отказ от
использования определенной референции может быть истолкован
как указание на тот факт, что существует более одной двери ;
В простейших ситуациях определение, данное в этом
разделе, тождественно референционному определению, Так,
имеется объект, в самом деле существующий в мире дей-
151
ствительности. И говорящий и слушающий располагают
некоторой ментальной сущностью, которая ему
соответствует, и описаниями, соответствующими его
действительным свойствам. То описание, которое фигурирует во фразе
с показателем определенности, приложимо только к этой
сущности и ни к какой другой в мире действительности
или в ментальном мире слушающего и говорящего.
При анализе других употреблений словосочетаний с
определенной референцией сложность процедурной модели
становится гораздо более оправданной и необходимой.
В преобладающем большинстве употреблений выражений с
показателем определенности положение не таково, что
«дескриптивное выражение применимо к единственному
объекту», а таково, что «оказывается достаточно дать слушателю
возможность установить некоторый единственный объект...,
используя весь контекст и общее знание,..». Некоторые из
приведенных выше примеров иллюстрируют данное
утверждение. С этой точки зрения многие из классических
рассуждений по поводу смысла и референции получают
прямую реинтерпретацию. Предложения Утренняя звезда
является вечерней звездой или Скотт является автором
"Ваверлея" могут высказываться говорящим, который держит
в своем уме одну концептуальную сущность с двумя
дескрипциями и модель слушающего, согласно которой
последний держит в своем уме две различные сущности,
ассоциируемые с этими дескрипциями. Предложение Единороги
никогда не существовали может быть высказано тем, кто
держит в своем уме концептуальную сущность "единорогаи
и ассоциируемую с ней дескрипцию, гласящую, что такого
рода животные в действительности не существуют, и
располагает также моделью слушающего, обладающего
соответствующей сущностью, лишенной этой дескрипции.
В случае изложения чужих мыслей (или выражения
модальностей, относящихся к другим возможным мирам)
могут возникнуть двусмысленности, обусловленные
множественностью моделей. Двусмысленность предложения
Джон думалу что убийцей был отец Билла обусловливается
тем, что дескрипция отец Билла может быть связана с
концептуальной сущностью либо в модели мира говорящего,
либо в той модели говорящего, которая характеризует
модель мира Джона.
Референционное и приписывающее употребления
номинативных словосочетаний, обсуждаемые Стросоном
(Stra152
wson, 1950), различаются соответствием между
сущностями в концептуальном мире говорящего и сущностями в
реальном мире.. Выражение типа король Франции
соотносится с уникальной сущностью в концептуальном мире
говорящего, независимо от того, существует ли в
действительности король Франции, и от того, верит ли говорящий в его
действительное существование. Легко вообразить ситуацию,
когда может быть употреблено указанное словосочетание,
но не будут выполняться названные условия (если и будет,
то лишь одно из них). Например, возможны случаи типа
Кем считает себя де Голль — королем Франции?, когда и
говорящий, и слушающий не признают существование
данной сущности, но могут делать выводы о ее свойствах
на основе ее дескрипции.
Проводимое Доннеланом различие между
референционным и атрибутивным употреблением более ориентировано
на сформировавшийся концептуальный мир слушающего.
Он утверждает (в Rosenberg and Travis, p. 211),
что «при референционном употреблении в
противоположность атрибутивному объективно существует правильный
референт, который должен быть выбран слушающими, и его
способность быть правильным референтом — не просто
функция соответствия дескрипции». Атрибутивная
референция достигает цели, если слушающий создает
подходящую концептуальную сущность, соответствующую
концептуальной сущности говорящего, в то время как
референционное употребление того же самого выражения оказывается
успешным только в случае, если концептуальная сущность
для слушающего соответствует тому же объекту реального
мира, что и концептуальная сущность, которую имеет в
виду говорящий.
В экстремальном случае верить в применимость
дескрипции не обязан ни говорящий, ни слушающий. Доннелан
приводит пример, когда на троне сидит самозванец, и то,
что это самозванец, известно и дворцовой страже, и
посетителю, который спрашивает: "Король у себя в казне?" *
Этот пример показывает, что при объяснении явлений,
связанных с определенной референцией, главная проблема
заключается не в установлении условий истинности, при-
* В оригинале Is the king in his countinghouse?, обыгрывающее
строку из детского стиха The King was in the countinghouse, counting
all his money 'Король был в казне и пересчитывал все свои деньги'.—
Прим. перев.
153
менимых к миру, а в установлении соответствия между
концептуальными сущностями в умах говорящего и
слушающего. С этого положения начинается процессуальный
подход.
Можно представить себе приложение идей теории
истинности к когнитивным моделям говорящего и слушающего,
если допустить введение предикатов над когнитивными
сущностями и построить набор аксиом, формализующих
природу этих сущностей и их отношения к объектам и
предикатам, описывающим мир. Процессуальный подход
формализует такие понятия, как "данный контекст", "можно
ожидать заключения" и "фокус внимания", в терминах
процессов, изменяющих когнитивное состояние по мере того,
как человек понимает или строит высказывания. Эти
процессы взаимодействуют комплексным образом, испытывая
на себе влияние со стороны факторов ограниченности
ресурсов и дифференциальной доступности, как это было
описано в § 5.4. Аксиоматизация, приводящая к
эквивалентным результатам при определении значения референ-
ционных словосочетаний, должна будет включать в себя
теорию процессора человеческого языка.
6.4. Проблема идентификации концептуальных
сущностей.
Анализ определенной референции в терминах
процессуального подхода не разрешает фундаментальных
эпистемологических и онтологических проблем, вытекающих
из понятия "концептуальной сущности". Некоторые
очевидные соображения на этот счет таковы:
6.4.1. Концептуальные сущности не обязаны
соответствовать сущностям реального мира (примером могут
служить вымышленные и образные персонажи).
6.4.2. В случаях, когда концептуальная сущность
соответствует некоторой сущности из области реального мира,
дескрипции, приписываемые ей человеком, могут быть
не всегда приложимы к соответствующему объекту
реального мира.
6.4.3. Два человека могут обладать концептуальными
сущностями, которые, по их убеждению, соответствуют
одному и тому же объекту (то есть каждый из них располагает
ментальной моделью другого, которая включает
соответствующую концептуальную сущность), даже если при этом
не существует никакого соответствующего реального
объекта. Например, два человека могут согласиться, что они
154
говорят об одном и том же Моисее или Санта Клаусе, хотя
у них нет идентичных или даже совместимых моделей.
В случаях нарушения взаимопонимания они могут иметь
сущности, соответствующие различным объектам, не
сознавая этого факта.
6.4.4. Человек может иметь в виду
концептуальную сущность, которая, по его убеждению, соответствует
единственному в своем роде индивидууму, сознавая при
этом, что он не знает, что это за индивидуум реального
мира; мы наблюдаем это, например, в случае неясной
интерпретации определенной референции в предложении The man
that I marry will like taking care of children. 'Человек, за
которого я выйду замуж, будет охотно заботиться о детях'.
6.4.5. Концептуальная сущность может соответствовать
не конкретному объекту, а абстрактному прототипу (как
the unicorn 'единорог' в предложении 6—5).
6.4.6. Специфическая манифестация или маска
индивидуума может быть отдельной концептуальной сущностью,
как в предложении 6—4.
Впрочем, эти проблемы не являются проблемами
определенной референции или даже языкового употребления.
Это проблемы представления, которые решаются при
построении когнитивных моделей весьма разными способами
и находятся в центре многочисленных исследований в
когнитивной науке. Существуют, однако, и специфические
лингвистические проблемы, связанные с отграничением
случаев определенной референции от других выражений,
которые используют некоторые из тех же диагностических
слов (типа the в Peaches are selling for three dollars the bushel
'Персики продаются по три доллара за бушель').
7. эксплицитные процессуальные модификаторы и союзы
В этом разделе рассматриваются некоторые сентенци-
онные союзы и наречия в качестве заключительного
примера из области семантических проблем, подлежащих решегнию
на основе процессуального подхода. Нижеприводимые
предложения от 7—1 до 7—5 содержат слова, значения которых
могут быть выражены только через посредство
эксплицитной ссылки на модели, составленные говорящим и
слушающим друг о друге.
(7—1) He's a politician, but he's honest. 'Он политик,
но он честен.'
155
(7—2) Even Gerald understood what the memo implied.
'Даже Джеральд понял, что имеет в виду меморандум.'
(7—3) Не even made his bed. 'Он даже постелил свою
постель.'
(7—4) If you encourage him some, he'll explain his whole
theory. 'Если вы его несколько приободрите, он разъяснит
всю свою теорию.'
(7—5) If you encourage him any, he'll explain his whole
theory. 'Если вы как-либо приободрите его, он разъяснит
всю свою теорию.'
В каждом из этих предложений часть сообщаемого
значения состоит из утверждения говорящего о слушающем.
But 'но' может быть истолковано так: "Следующее
утверждение противоречит заключению, кстэрое, мне думается,
вы сделаете". Even 'даже' передает следующую
информацию: "Существуют другие выводимые из контекста
сущности, которые могут быть поставлены вместо той, к которой
относится в данном предложении 'даже'". Вы скорее
ожидаете, что верным будет замещенное утверждение, а не
"фактически представленное". В предложениях типа 7—3
необходимо проанализировать, что утверждается
способами, которые могут быть ортогональными по отношению
к стандартной логической декомпозиции (так разделяются
модальность ("Он сделал нечто") и последующая
детализация данного события). Как и в случае с примерами §§ 5 и 6,
это не изолированная проблема, имеющая отношение к
употреблению языка; она связана с более общими проблемами,
имеющими дело со способами, какими факты и события
репрезентируются в человеческой символической системе.
В 7—4 и 7—5 выбор говорящим some 'несколько' или any
'как-либо' передает информацию относительно того,
советует ли говорящий слушающему предпринимать
предполагаемое действие. Эта скрытая информация, а не
констатация логического условия фактически является первичной
для данного высказывания.
Формирование неформальных толкований слов и
конструкций, приведенных выше, является полезным лишь
тогда, когда такие выражения, как Я ожидаю, что вы
сделаете заключение..., могут получить точное значение в
терминах процессов и символьных структур. Такая
формализация когнитивного контекста является одной из главных
задач процессуальной семантики.
156
ЧАСТЬ III
ЦЕЛИ ПРОЦЕССУАЛЬНОГО ОПИСАНИЯ ЯЗЫКА
8. центральные проблемы лингвистической теории
Подход, предлагаемый в настоящей работе,
противоречит многим канонам принятой метатеории современной
лингвистики. Главной отправной точкой в нем является особое
внимание к когнитивному процессу, а не к производимым
и интерпретируемым языковым объектам. Форма и
значение высказывания анализируются в терминах целей и
ментальных состояний говорящего и слушающего. Некоторые
лингвисты (см., например, Morgan, 1975) также
предлагали осуществить этот сдвиг от формальных описаний
языковых объектов в сторону создания формальных средств
представления когнитивной деятельности пользователей
языка; но такой сдвиг еще не является составной частью
нынешних стандартных теорий. Настоящий раздел посвящен
способам, посредством которых процессуальная перспектива
языка создает основу для объяснительных суждений.
8.1. Основы процессуальной теории.
Основные положения I и II частей, касающиеся в
конечном счете природы приемлемых лингвистических
теорий, можно суммировать следующим образом:
8.1.1. Предпочтительное внимание теории языка
должно сосредоточиваться на когнитивном процессе, а не на
производимых и интерпретируемых языковых объектах.
Конкретная структура и содержание доступных
наблюдению высказываний важны, но играют вторичную роль,
как часть данных, возникающих и используемых в ходе
осуществления соответствующих процессов.
8.1.2. Контекст имеет первостепенное значение, и лучше
всего его формулировать в терминах когнитивных структур,
а не языкового текста или фактов относительно ситуации, в
которой производится высказывание. Косвенно (через
посредство моделей говорящего и слушающего) оно
включает те аспекты контекста, которые традиционно
именуются лингвистическими, социальными и прагматическими.
8.1.3. Вполне возможно научное изучение процессов,
принимающих участие в мыслительной деятельности и, в
частности, в употреблении языка. § 2 содержит изложение
общих очертаний этой теории и обоснование ее
возможности.
157
8.1.4. Существует несколько различных уровней
анализа механизмов деятельности языка. Ни один из них
невозможно свести к набору следствий, вытекающих из
принципов организации расположенных ниже уровней. Многие
современные теоретические аргументы базируются,— по
меньшей мере, имплицитно,— на выделении одного, уровня
как "теоретически интересного'', отводя остальным
положение вторичных.
8.2. Уровни объяснения.
Представим себе группу ученых-инопланетян,
прибывших на Землю и задавшихся целью понять принципы
действия моторизованных средств передвижения. Ввиду
отсутствия у них соответствующих инструментов они не
могут поднять капот и заглянуть внутрь, вследствие чего
должны основывать свои теории на наблюдении внешней
стороны поведения наших машин. Они имеют в своем
распоряжении несколько машин, над которыми могут
экспериментировать, но эти эксперименты должны
ограничиваться лишь манипулированием внешне наблюдаемыми
переменными: какие нажимаются педали и кнопки и в какой
последовательности, что и в какие отверстия наливается,
и-т. д. Они даже располагают опытом наблюдения над
машинами, поврежденными в результате аварии, функции
которых частично нарушены. Какова же будет природа
"автомобильной теории", которую они постараются
разработать?
С первого взгляда может показаться, что искомые теории
будут физического порядка. Автомобиль, как и все
физические устройства подобного размера, действует в
соответствии с принципами ньютоновской механики и
классической термодинамики. Но этого явно недостаточно для того,
чтобы объяснить, как работает автомобиль. Физик с его
полным набором релевантных теорий едва ли будет
способен разобраться в "поведении" автомобиля. Проблема
заключается не в том, что ему будет недоставать какого-либо
физического принципа, а в том, что совокупное
функционирование автомобиля есть результат взаимодействия
многих механизмов.
У физика нет того уровня объяснения, каким
располагает автомеханик,— каковы детали автомобиля, как они
сочетаются друг с другом и как они должны
функционировать. Механик может объяснить действие автомобиля на
совершенно ином уровне, несводимом к физике, и по край-
158
ней мере столь же важном для объяснения поведения
данного конкретного класса изучаемых объектов. Этот
уровень включает описание как форм, так и функций различных
частей и подсистем. Он может включать также
альтернативные концептуализации того, как следует разлагать
систему на части. В одном случае основой разложения может
служить расположение частей на шасси, в другом —
разделение гидравлических, механических и электрических
подсистем, в третьем — разграничение между силовой
передачей и тормозной системой и т. д.
Но, помимо уровней объяснения, соответствующих
физическим явлениям и механическим конструктивным
спецификациям, существуют и другие, относящиеся к более
крупным системам, более широким, чем отдельный
автомобиль. Многие его черты могут быть "объяснены" лишь в
терминах эволюционных процессов, в которых
появлялись новые материалы и новые соображения, вызывавшие
модификации конструкций. У автомобиля много таких
свойств, которые не имеют смысла, если не учитывать
контекста истории, на протяжении которой такие факторы, как
контроль за загрязнением атмосферы, оказывали прямое
воздействие на изменение, казалось бы, стабильных
конструктивных деталей. Многие глобальные объяснения,
относящиеся к специфическим характеристикам размеров
автомобиля, используемого им горючего и т. д., следует
формулировать в терминах социальных и экономических
систем, в контексте которых он создавался. Характер дорог,
ресурсы горючих полезных ископаемых, структура
человеческой семьи — все это нашло свое видимое отражение в
физической внешности конструкции автомобиля.
Совершенно очевидно, что в такой более широкой перспективе
имеет место взаимное воздействие. Природа автомобиля во
многом повлияла на надсистему, но и сама обусловливается
ею.
Если применить эту аналогию к языку, то следует
констатировать, что потенции человеческого языка
сопоставимы с комплексным искусственным объектом,
функционирование которого получает объяснение в терминах как
общих, лежащих в его основе принципов, так и
специфических конструктивных особенностей данного механизма.
Большая часть исследовательской работы в области
процессуальной семантики имеет дело с устройством системы
и структурой процессов, происходящих в уме носителя че-
159
ловеческого языка. При этом предполагается, что
большинство доступных наблюдению регулярностей должны
получать объяснение именно на этом уровне, а не как следствия,
выводимые из базовых принципов. Роль общих теорий,
схожих с теориями физики, рассматривается ниже.
8.3. Аксиоматические дедуктивные теории.
Модель, занимающая господствующее положение в
науке, носит характер аксиоматической дедуктивной теории,
как это демонстрирует классическая физика (или по
меньшей мере распространенное представление о ней). Ученый
открывает небольшой набор фундаментальных аксиом или
"законов", действующих в пределах некоторого формализма
("исчисления") и служащих для описания условий и
событий. Если нам дано описание некоторого набора условий,
то законы могут использоваться для того, чтобы
предсказывать, как эти условия будут изменяться во времени, или
для спецификации других, сопутствующих им условий.
Сила и изящность такой теории состоят в том, что в основе
ее лежит небольшой набор законов, а сложность
функционирования обусловливается комплексностью контекстов, в
пределах которых используются законы.
Эта модель оказала огромное влияние на лингвистику с ее
стремлением к экономичным процедурам описания
лингвистических механизмов. Физическая теория, описывающая
движение планет или падение земных тел посредством
единого набора механизмов, бесспорно, превосходит такую
теорию, которая требует раздельных аналитических
процедур. Большинство доказательных аргументов,
используемых в лингвистике при построении теории, имеет форму:
«Эта теория предпочтительнее, потому что она способна
посредством единого механизма дать объяснение
следующим наблюдениям...» или «Эти теоретические предпосылки
предпочтительнее, так как они используют только один
тип ограничений на применение правил, вместо того,
чтобы...».
Разумеется, надо стремиться к простоте и к построению
наиболее экономичных теорий. Но когда подлежащий
изучению феномен является результатом взаимодействия
сложных механизмов, шкала ожидаемой сложности теорий
должна быть пересмотрена. Представим себе, что перед нами стоит
задача установить зависимость скорости автомобиля от силы
давления на акселератор и от времени. Реальные данные
будут иметь комплексный характер, будучи связаны с ха-
160
рактеристиками двигателя, которые сами по себе являются
нелинейными; с типом трансмиссии и устройствами,
которые регулируют изменения трансмиссии в зависимости
от переменных, включающих давление акселератора,
вакуум в двигателе и скорость; с действием механизма
контроля за загрязнением, регулирующим скорость вращения
мотора так, чтобы попытаться уменьшить выброс веществ,
загрязняющих атмосферу.
Любая попытка проанализировать данные не будет
успешной, если ученый будет исходить из положения, что
наблюдаемые регулярности непосредственным образом
отражают глубинные принципы. Данные являются результатом
взаимодействия между различными механизмами, каждый
из которых в свою очередь представляет собой сложный
механизм. Теории механики и термодинамики являются
релевантными только для самого низшего уровня структуры.
Один из способов уменьшить сложность такого рода
заключается в усреднении данных большого количества
наблюдений и приложении к полученным результатам
математических формул. Существует много "теорий" такого
порядка в психологии (например, бихевиористская "теория
обучения") и, в меньшей мере, также и в лингвистике. Такой
подход оказывается полезным в тех областях (например,
в экономике), где главный исследовательский интерес
сосредоточен на изучении поведения с внешней стороны,
причем на уровне крупных блоков, а более мелкие механизмы,
обеспечивающие его, находятся вне пределов достижимости
используемых методик. В лингвистике этот подход может
найти применение при изучении широкомасштабных
феноменов типа словарных дистрибуций или языковой
эволюции, но он не в состоянии дать ответ на вопросы о
сущности пользования человеческим языком, что является
главным для процессуального подхода.
В случае сложного явления предпочтительней
комбинировать анализ на уровне аксиоматической
теории с анализом на уровне "плана" изучаемой системы.
Другие науки о комплексных биологических системах
осмысляют их в терминах "физиологии" и "анатомии", прибегая
к детальному описанию наблюдаемых структур и процессов.
Представляется маловероятным, что когнитивная теория
может существовать без подобного же детального
отображения механизмов. Попытки познания человеческого существа
как химического и физического устройства привели к за-
6 №534
161
ключению, что оно во много раз сложнее, чем сделанные
рукой человека устройства вроде автомобиля. Любое
адекватное объяснение языка и мыслительной деятельности
будет основываться на теориях и механизмах, которые
в свою очередь на несколько порядков сложнее, чем теории
и механизмы, используемые для объяснения деятельности
почки или кровеносной системы. Представляется в высшей
степени маловероятным, что существуют обособленные
механизмы, подчиняющиеся единому "типу правил", или
информация, сводимая к небольшому количеству
независимых "компонентов" или "способностей".
Интересные (и экономичные) общие теории будут
относиться к уровню пересечения вычислительной,
коммуникативной и мыслительной деятельности. Такое
специфическое устройство, как языковой процессор, находится в
таком же отношении к этим теориям, как и автомобиль к
физике. Физика не интересуют предсказания на уровне
детального "поведения" автомобиля, поскольку это всего
лишь специфическая идеосинкретическая комбинация
более глубоких принципов. Изучение языка отличается тем,
что, хотя языковая способность человека также является
всего лишь некоторым специфическим устройством,
которое обнаруживает поведение, основанное на более глубоких
принципах, оно вместе с тем представляет для нас особый
интерес и является единственным в своем роде устройством
такой высокой степени сложности из числа доступных
нашему изучению.
8.4. Понимание устройства сложной системы.
При изучении автомобиля ученый нуждается s
гипотезах относительно различных составляющих системы —
двигателя (мотора), цепи силовой передачи, системы подачи
горючего, тормозной системы и т. д. Существуют некоторые
естественные подразделения, обусловленные внешними
различиями (например, различными педалями) и поведением
(замедлением или ускорением хода). Однако эти
подразделения не изоморфны четким функциональным или
анатомическим подразделениям механизма.
Проблема нахождения правильного набора моделей
является центральной для построения модели
пользователя человеческим языком. Наша цель состоит в разделении
системы на модули, объяснение которых упрощалось бы
раздельным описанием их внутреннего структурирования
и взаимодействия. Не может быть отдельных "семантиче-
162
ских" или "синтаксических" механизмов или даже
отдельной "языковой способности", как предполагает Хомский
(см. Chomsky, 1975). Эти категории могут служить лишь
как первые шаги с целью упрощения анализа, но остается
открытым эмпирический по своей природе вопрос о том,
представляют ли они такое разделение, которое способно
помочь последовательному описанию значительно более
крупной системы — системы языковой и мыслительной
деятельности.
8.5. Верификация гипотез.
В стремлении познать строение комплексной системы
необходимо расширить круг традиционных понятий,
применяемых при проверке гипотез и постановке
экспериментов. Обычно невозможно сформулировать отдельную часть
теории, найти критический эксперимент, потенциально
способный отвергнуть ее, и затем осуществить сам
эксперимент. До экспериментов, имеющих целью разработать
правильную модель, необходимо в качестве первого шага
определить потенциально адекватные модели. На данной
стадии науки мы еще не готовы сделать выбор среди
выделенных альтернатив и только начинаем приближаться
к представлениям о том, как могли бы выглядеть
соответствующие механизмы. Стратегия, которой придерживается
процессуальный подход, состоит в построении
искусственных (базирующихся на компьютере) систем, выполняющих
задачу ограниченного понимания языка. Они обеспечивают
тест на экспериментальную проверку адекватности,
который показывает как силу, так и недостатки гипотетических
механизмов. Этот вид теста имеет дело с более крупной
системой, в рамках которой должны стыковаться различные
компоненты, поскольку предположительный механизм
одного из компонентов (например, синтаксиса) должен
согласовываться с его использованием в реальных языковых
процессах.
Полученные имитационные модели не следует
рассматривать как буквальные модели деятельности человеческого
мозга. Как было указано выше, задача состоит в
построении моделей деятельности, совпадающих с моделями
носителя языка на некотором естественном уровне описания.
Успешная модель может отличиться в деталях или
параметрах описания, но в то же время быть достаточно
идентичной на таком уровне структуры, который затрагивает
главные компоненты и их взаимосвязи. Обоснованность
6*
163
модели не измеряется, следовательно, в терминах простого
соответствия.
Искомый уровень описания может пересекать
разграничение между физической и концептуальной структурами.
Один из фундаментальных принципов вычислительной
теории гласит, что между данными и процессами нет четкой
разграничительной линии. В любой физической
символической системе существует уровень "железок", уровень
встроенного процессора, оперирующего данными, структура которых
определяется природой машины. Однако эта система может
использоваться в качестве интерпретатора, оперирующего
структурами данных, которые конструируются из
имеющихся первичных элементов, и таким образом имитировать
машину с другим набором процессов и другой
организацией данных. Некоторые из наиболее глубоких
результатов вычислительной теории относятся к эквивалентности
машин в упомянутом смысле (см. Minsky, 1967). Здесь
не представляется возможным обратиться к достаточно
полному обсуждению последствий указанной двойственности.
(Подробнее об этом см. Newell, 1972).
Языковой процессор человека обладает врожденными
свойствами, накладывающими ограничения на способы
используемой репрезентации, типы стратегии обработки,
лимиты внимания, природу доступного научения и на многие
другие конкретные характеристики. Исчерпывающая
когнитивная теория должна включать объяснение всех этих
деталей. Однако можно детально имитировать природу
физической символической системы посредством построения
другой системы, с иными физическими характеристиками.
Поступая таким образом, необходимо, однако, учитывать,
что могут возникнуть фундаментальные различия,
отражающиеся на природе вычислительного процесса. Но на данной
стадии разработки главные различия, бросающиеся в
глаза, принимают форму таких частных характеристик
процессов, как относительное время и усилия,
необходимые для осуществления различных операций, или
появление различного рода ошибок.
Если процессуальный подход окажется успешным,
появится возможность описания механизмов на таком уровне
детализированности, который обладает доказательным
соответствием с многими аспектами человеческой
деятельности. Проведен ряд пробных экспериментов по проверке
некоторых частных моделей (см., например, Kaplan,
164
1975), но в нашем распоряжении в настоящее время нет
еще объяснений, которые покрывали бы деятельность языка
в целом, включая значение. При таком положении
разработка более детализированных тестов рискует увести
анализ в неправильном направлении. Можно представить себе
детальные эксперименты (включающие тщательное
измерение времени, сил и т. д.) над автомобилями с включением
зажигания и наблюдением за их "поведением" без
заправки их бензином. Это можно рассматривать как
"упрощенную" экспериментальную ситуацию. Однако детали
взаимодействия между трансмиссией, стартером и компрессией
приведут лишь к созданию не поддающихся пониманию
явлений и не будут способствовать уяснению более широкого
контекста, в пределах которого функционируют эти
механизмы.
При невозможности проведения точной
экспериментальной верификации гипотез необходимо прибегать к иным
критериям для отбора и исключения альтернатив. Главный
эвристический прием заключается в "независимом
обосновании". В генеративной лингвистике это понятие
рассматривается под рубрикой "объяснительной адекватности"—
понятия, определенного довольно плохо. Если единый
механизм объясняет набор различных феноменов, он более
высоко оценивается, чем тот, который порождается лишь
для того, чтобы обрабатывать только одну часть данных.
Так, постулирование молекул в физике приобрело большое
значение ввиду их полезности для явлений как химии, так
и термодинамики.
Процессуальный подход отличается от большинства
работ по современной генеративной лингвистике широтой
феноменов, к которым применима его эвристика. Некоторый
механизм, применимый к обработке синтаксических данных,
получает более высокую оценку, если он может быть исполь-
зозан и для обработки семантических феноменов.
Аналогично, некоторая гипотеза относительно производства или
понимания высказываний приобретает большую
значимость, если она может быть использована также для
объяснения других когнитивных процессов — таких, например,
как восприятие или принятие решений. Мы еще далеки от
обладания небольшим набором понятий, полезность
которых столь же широка, как полезность понятий молекул
или волновых движений. Будущее когнитивной науки
в том, чтобы найти их.
165
8.6. Более широкие рамки, в пределах которых
понимается язык.
Наше объяснение языка было бы незавершенным даже
при полном анализе (как на уровне материала, так и на
уровне лежащей в его основе когнитивной теории)
процессов, происходящих в отдельном взрослом пользователе
языка. Существуют более широкие контексты, в которые эти
процессы должны быть включены — каждый со своим
типом объяснения.
8.6.1. Теория врожденных ограничений.
Следуя Хомскому (см. Chomsky, 1965), многие
современные теоретики-лингвисты видят конечную цель своих
исследований в открытии "формальных лингвистических
универсалий", которые характеризуют абстрактные
условия, подлежащие удовлетворению всякой порождающей
грамматикой. Работы этого типа нередко обращаются к
результатам исследований в области формальных
грамматик и вычислительной теории. В качестве ориентира в
поисках наилучшей характеристики языковой компетенции
используют формальные результаты в области изучения
порождающей силы грамматик.
Опыт вычислительной науки (отличающейся от
абстрактной теории автоматов) показал, что эти абстрактные
характеристики вычислительной "силы" не являются
перспективным источником для объяснения свойств комплексных
вычислительных систем. Любая представляющая интерес
система — теоретически универсальна, и ее интересные
свойства определяются ее специфической структурой, а не
ее потенциальными абстрактными ограничениями.
Возвращаясь к аллегории с автомобилем, можно
представить себе теории, которые устанавливают абстрактные
ограничения на потенции автомобилей. Ни одна машина не
может передвигаться быстрее скорости света или ускорить
свое движение, не испытывая воздействия извне и не
расходуя части своей массы. Эти результаты имеют огромное
научное значение, подобно теореме Гёделя об
универсальности машин Тьюринга. Но они не образуют основы для
объяснения действия автомобиля, так же как
математические обобщения в области изучения формальных систем
не создают общей основы для объяснения действия языка.
8.6.2. Функциональные объяснения устройства.
ПрЦ изучении системы, представляющей собой
технологический артефакт, ее устройство связывают ç некоторым
166
множеством эксплицитных решений, основанных на
функциях, которые она должна выполнять. Тот или иной
специфический механизм "объясняют" посредством
установления того, почему он был предусмотрен и почему он был
создан именно таким, а не другим образом. При изучении
естественных систем часто приписывают природе (и
эволюционным процессам) такого же рода мотивации.
Отдельный механизм рассматривается с точки зрения выполнения
полезных целей в совокупном функционировании
организма. Но "объяснить" все детали системы на функциональной
базе невозможно. Какой резон в том, что человек имеет на
руках ровно десять пальцев, или почему слова dog 'собака'
и day 'день' начинаются с одной и той же фонемы. Но, с
другой стороны, существует много случаев, когда строение
механизмов обусловливается потребностями, которым ойи
призваны служить.
Процессуальный подход по своей сути ближе к
функциональным объяснениям, чем генеративная лингвистика,
поскольку он имеет дело с процессами. Впрочем,
существуют независимые уровни объяснения, относящиеся к рангу
возможных альтернативных систем и сил, формирующих
точный вид языковой системы человека. Некоторые
лингвисты (например, чешская школа и те, кто представлен в
Grossman, San and Vance, 1975) занимаются
анализом именно такого рода, и он является дополнительным
по отношению к процессуальному подходу. Традиционные
исследования лингвистов в области языковых
сопоставлений и поисков универсальной грамматики также
призваны объяснить специфические особенности языкового
употребления в более широком контексте.
8.6.3. Эволюция и усвоение языка.
Многие в высшей степени интересные факты, связанные
с языком, касаются способа его изменения во времени,
происходящего как у отдельного индивида, так и в обществе
в целом. Многие детали человеческого языкового процессора
могут быть поняты лишь в контексте усвоения языка и его
изменения, так же как и многие физиологические и
анатомические детали организма получают объяснение в
терминах онтогенеза и филогенеза. Пока сделано очень мало
для исследования связей между макропроцессами и
процессуальными деталями языкового употребления. Что
касается функционального анализа, то представляется, что его
преимущественная ориентация на когнитивные процессы
167
делает эти связи более естественными и перспективными,
чем в случае использования формализмов, разработанных
до сих пор. Взаимодействие идет в обоих направлениях —
подобная модель языкового употребления может служить
в качестве рамки, которая позволяет увидеть, какие
изменения происходят во времени, а наблюдения над языковыми
изменениями и становлением языка у ребенка могут
выступать как хорошая эвристика для развития
соответствующих моделей.
8.6,4. Общий интуитивный взгляд.
Чаще всего употребление фразы типа "Я не понимаю,
как работает эта вещь" свидетельствует о том, что есть
некоторая глобальная связь, которую человек не смог
ухватить. Часто говорят о больших системах (например,
компьютерах или космических ракетах), что они настолько
сложны, что их никто не в состоянии понять. Это сильнее, чем
утверждение, что никто не может запомнить полный список
их компонентов. Оно является отражением невозможности
симультанно держать в памяти многочисленные базовые
элементы и формы их взаимоотношений, образующих
структуру системы как системы.
На уровне объяснения, имеющем дело со строением
когнитивной системы, вполне возможно, что никто не будет в
состоянии познать все строение в целом. Критики
утверждают, что если бы оказалось возможным располагать
компьютерной программой, которая полностью
воспроизводила бы языковые способности человека, то и тогда мы не
имели бы теории языка. Нужно было бы создать теорию
программы, чтобы понять ее. Это утверждение, возможно,
правильно, и оно указывает на необходимость создания
лучших концептуальных инструментов для исследования
комплексных систем разного рода — как естественных, так
и искусственных. Теория систем (см., например,
Bateson, 1972) указывает, что наша современная научная
методология доказывает свою полезность только в тех
областях, где наличествуют небольшие, тесно связанные
наборы феноменов и можно изучать изолированные
механизмы, не учитывая больших систем, в состав которых они
входят. Языковое употребление и мыслительная деятельность,
бесспорно, оказываются в пределах сферы биологических
систем, и приложение к ним более системно
ориентированного подхода может дать объяснения, которые выведут
семантику из пределов "мистерий" Хомского.
168
ЛИТЕРАТУРА
Bateson, О. Steps Toward an Ecology of Mind. Ballantine, 1972.
Bobrow, D. G. and Collins, A. M. (eds.). Representation and
Understanding: Studies in Cognitive Science. New York: Academic Press,
1975.
Bobrow, D.G., Winograd, T. An overview of KRL, a
knowledge representation language.-—"Cognitive Science", 1:1, 1977.
Bolinger, D. The Atomization of meaning.— "Language", 41, 1965,
pp. 555—573. [Перев. на русск. яз. см.: "Новое в зарубежной
лингвистике", вып. X. М., 1981, с. 200—234].
Chomsky, N. Aspects of a Theory of Language. Cambridge: MIT,
1965.
С homsky, N. Reflections on Language. New York, 1975.
Donnellan, K. S. Reference and definite descriptions.— "The
Philosophical Review", LXXV, No., 3, 1966, pp. 281—304. Перепечатано
в: Rosenberg and Travis (eds.). Readings in the Philosophy of
Language, Prentice-Hall, 1971.
Dreyfus, H. L. What computers can't do: a critique of artificial
reason. New York: Harper and Row, 1972.
Fillmore, С Against a checklist theory of meaning.— In:
"Proceedings of the First Annual Meeting of the Berkeley Linguistics Society",
Institute of Human Learning, Berkeley, 1975.
Gordon, D. and Lakoff, G. Conversational postulates.— In:
"Papers from Seventh Regional Meeting", Chicago Linguistic Society,
Chicago: University of Chicago Linguistics Department, 1971.
Grossmann, R. E., San L. J., and Vance T. J. (eds.).
Papers from the Parasession on Functionalism. Chicago. Linguistic Society,
1975.
Kaplan, R. On process models for sentence analysis.— In:
Norman, D. A. et al. Explorations in cognition. San Francisco: Freeman,
1975.
Katz, J. J., and Fodor J. A. The Structure of a semantic
theory.— In: F о d о г, J. and Katz, J. (eds.). The Structure of Language,
Prentice Hall, 1964.
Labov, W. The boundaries of words and their meanings.— In:
Bailey, C.-J. N. and Shuy, R. (eds.). New Ways of Analyzing
Variation in English. Georgetown Univ., 1973.
Lakoff, G. Hedges: A study in meaning criteria and the logic of
fuzzy concepts.— In: "Papers from the Eighth Regional Meeting", Chicago,
Linguistics Society, Chicago: University of Chicago Linguistics
Department, 1972.
Minsky, M. Computation: Finite and Infinite Machines, MIT, 1967.
Minsky, M. A framework for representing knowledge.— In:
Winston, P. (eds.). The Psychology of Computer Vision. McGraw-Hill, 1975.
Morgan, J. L. Some remarks on the nature of sentences.— In:
Grossman, San and Vance (eds.). Papers from the Parasession
on Functionalism, Chicago Linguistic Society, 1975.
Newell, A. A note on process-structure distinctions in development
psychology.— In: "Information Processing in Children", Sylvia
Famham-Diggory (ed.), Academic, 1972.
Newell, A. and Herbert, S. A. Human Problem Solving.
Prentice Hall, 1972,
169
Newell, A. and Herbert, S. A. Computer science as an
empirical inquiry: symbols and search.— "Communications of the ACM", 19 : 3
(March 1976), pp. 113—126.
Norman, D. A. and Bobrow, D. G. On data-limited and re-
sourcelimited processes.— "Cognitive Psychology", 1975, 7, pp. 44—64.
Norman, D. A., Rumelhart, D. E. and the LNR Research
Group. Explorations in cognition. San Francisco: Freeman, 1975. ,
Rosen, E. Cognitive representations of semantic categories.—
"Journal of Experimental Psychology: General", 104, 1975, pp. 192—233.
Russell, B. Introduction to Mathematical Philosophy. London:
Allen and Unwin, 1919. Chap. XVI. Перепечатано в: Rosenberg
and Travis (eds.), Readings in the Philosophy of Language, Prentice-
Hall, 1971.
Sadock, J. M. Toward a Linguistic Theory of Speech Acts.
Academic, 1975.
Searle, J. R. Speech Acts. Cambridge, 1970.
Strawson, P. F. On referring.—"Mind", LIX, No. 235, 1950,
pp. 320—344. Перепечатано в: Rosenberg and Travis (eds.).
Readings in the Philosophy of Language. Prentice-Hall, 1971.
Weizenbaum, J. Computer Power and Human Reason. San
Francisco: Freeman, 1976.
Wilson, D. Presuppositions and Non-Truth-Conditional
Semantics. Academic, 1975.
Winograd, T. Understanding Natural Language. New York:
Academic Press, 1972. [Перев. на русск. яз.: Виноград, Т.
Программа, понимающая естественный язык. М. 1976.]
Wittgenstein, L. Philosophical Investigations. Oxford:
Blackwell, 1953.
Ю. Чарняк
УМОЗАКЛЮЧЕНИЯ И ЗНАНИЯ
(ЧАСТ ь 1*)
Область искусственного интеллекта (ИИ) связана с
разработкой машинных программ, способных решать задачи,
которые обычно требуют умственных усилий,— начиная от
игры в шахматы и кончая медицинской диагностикой.
Многие задачи такого рода связаны с использованием
естественного языка, в связи с чем ИИ попадает в список
дисциплин, имеющих отношение к проблемам понимания языка.
Вычислительная семантика (так мы называем исследование
языка, основанное на методах ИИ) рассматривает язык с
точки зрения того, как он действует при осуществлении
процессов автоматического перевода, построения ответов
на вопросы по тексту и т. п. При этом подходе предпола?
гается, что "сущность языка — это то, как он действует".
Нельзя считать, что эта мысль была неизвестна другим
направлениям лингвистики и психологии, однако только
вычислительная семантика считает ее основой для
исследования языка. Сторонники такого подхода полагают, что
в лучшем случае нежелательно, а в худшем —
бессмысленно говорить о понимании естественного языка
безотносительно к той или иной задаче, в рамках которой язык
используется,—будь эта задача очень узкой
(например, заполнение пустых мест во фразах при
интеллектуальном тестировании) или весьма расплывчатой
(например, флирт на вечеринке).
Таким образом, исследование языка надо начинать с
вопроса о том, как он используется. Может показаться, что
* Eugene Charniak. Inference and Knowledge. Part 1.—In:
E. Charniak and Y. Wilks (eds.). Computational Semantics»
Amsterdam etc., 1978, p. 1—21.
© North-Holland Publishing Company (1976),
171
в этом случае, прежде чем начать исследование языка, надо
расширить объект, включив в него все случаи и аспекты
"использования" языка — от тестирования до поведения
на вечеринках. На самом деле, ни одна дисциплина не
может надеяться на успех при рассмотрении вопросов такого
широкого диапазона. Для решения проблемы следует
выделить некоторые признаки, общие для большинства
случаев использования языка, и изучать уже только их, лучше
всего на примере одной-двух задач, в которых эти признаки
выступают особенно рельефно. Рассмотрим, например,
ответы на простые вопросы по такому рассказу:
(1) One Saturday Jack decided he wanted some cereal for
breakfast. However he had to go to the supermarket,
where after finding the shelf where the milk was, he
payed for it and left. When he got home he found
that the milk was sour. "Why do these things always
happen to me", thought Jack.
'Однажды в субботу Джек решил, что ему хочется
на завтрак каши. Поэтому ему пришлось пойти в
универсам, где, найдя полку, на которой было
молоко, он заплатил за него и ушел. Когда он
пришел домой, он обнаружил, что молоко скисло.
"Почему со мной всегда случаются такие вещи?",—
подумал Джек.'
Вопросы: Why did Jack go to the supermarket?
'Почему Джек пошел в универсам?'
What did Jack pay for?
'За что заплатил Джек?'
By the last line had Jack finished his cereal?
'Съел ли Джек кашу к концу рассказа?'
What was Jack complaining about?
'На что жаловался Джек?'
Хотя ответы на вопросы кажутся нам очевидными, в
самом рассказе, как можно заметить, они в явном виде не
содержатся. На самом деле, мы можем отвечать на подобные
вопросы только потому, что знаем следующие факты:
"Кашу обычно едят с молоком".
"В универсамах продается, прежде всего, пища".
"Скисшее молоко невкусное".
"Кроме особых случаев, человек быстро перестает
есть невкусную пищу".
Но одного только знания подобных фактов недостаточно,
поскольку требуется еще умение выбрать из всей совокуп-
172
ности своих знаний те факты, которые релевантны для
данного текста, а затем объединить эти релевантные факты с
информацией рассказа для того, чтобы получить ответы
на вопросы.
Умение такого рода требуется и при решении других
задач, связанных с языком. Например, если бы нам
потребовалось перевести текст (1) на немецкий язык, нам нужно
было бы установить, что it во второй фразе замещает не
shelf 'полка', a milk 'молоко', поскольку в немецком
соответствующие существительные замещаются разными
местоимениями. (Отметим, что здесь нельзя опираться только на
то, что milk — это последнее по порядку существительное,
упоминавшееся до it, поскольку эту часть фразы можно
заменить следующей, эквивалентной ей: after finding the
milk on the shelf 'найдя молоко на полке'.) Это умение
нужно и для такого вида обработки текста, как его
реферирование. Понимание того факта, что в (1) может
отсутствовать упоминание о субботе, но обязательно упоминание
о каше, требует знания причинных связей в тексте и
наблюдения, что "суббота" никакой роли в (1) не играет, тогда как
"каша" служит мотивом большинства следующих событий.
Но причинные связи в (1) явно не выражены и поэтому
должны выводиться из общих знаний человека,
воспринимающего данный текст.
Таким образом, мы предполагаем, что важной
чертой, общей для большинства случаев использования языка,
является применение к тексту или к отдельному
высказыванию предварительно накопленных знаний для выведения
умозаключений. Исследование этих процессов может
помочь объяснению широкого круга способов языкового
поведения. Наша гипотеза получает дальнейшее подтверждение,
когда мы замечаем, что многие процессы, которые мы
обычно называем языковыми, требуют применения
умозаключений. Например, лингвистика занимается проблемами
синтаксических структур. Рассмотрим, однако, фразу:
Waiter, I would like spaghetti with meat-sauce and wine.
'Официант, я бы хотел спагетти с мясным соусом и вина.'
Вы не ожидаете, что принесенные вам спагетти будут
плавать в мясном соусе и вине. Другими словами,
предполагается, что наименование заказанной еды представимо
структурой (2), а не (3):
173
spaghetti meat-sauce meat-sauce wine
Отметим, однако, что если вы заказываете спагетти с маслом
или чесноком, то соответствующей фразе отвечает
структура (3). Подобные фразы мы называем "структурно
неоднозначными". Таким образом, официант, принимая ваш заказ,
должен "разрешить неоднозначность", используя свои
знания о еде для выведения умозаключения.
Аналогичная проблема встает в связи с тем, что слова
часто имеют более одного значения (или "смысла"), как в
примере:
The pen is in the next room.
'Ручка/детский манеж находится в соседней комнате.'
В этом предложении pen может означать либо 'ручка для
письма', либо 'детский манеж'. Рассмотрим теперь
предложение:
The baby picked up a pen.
'Младенец поднял ручку.'
Мы выводим нужное значение слова реп, располагая
знаниями о силе ребенка.
И, наконец, умозаключения часто необходимы для
восстановления антецедентов местоимений. Мы уже видели это
в примере (1), где местоимение it во фразе he payed for it
'он заплатил за него/нее' относится к молоку, поскольку
мы полагаем, что Джек хотел купить именно молоко, а не,
скажем, полку, на которой молоко стояло.
Подобные примеры подкрепляют наше решение
исследовать использование языка путем рассмотрения более
узкой проблемы: каким образом используются знания для
выведения умозаключений в процессе понимания
естественного языка.
Полное решение этой проблемы потребовало бы ответа
на пять следующих вопросов. (Здесь мы формулируем эти
вопросы кратко; их точный смысл прояснится при
постоянных обращениях к ним на протяжении этой статьи, а также
нашей второй статьи в настоящем сборнике.)
1. СЕМАНТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ. Какие по-
174
нятия (и в каких комбинациях) нужны для представления
а) знаний, которыми мы пользуемся при обращении с
естественным языком, и б) семантического содержания самих
высказываний на естественном языке. Проблема
семантического представления будет подробно рассмотрена в других
статьях, поэтому здесь о ней будет говориться очень мало.
2. ПРИМЕНЕНИЕ УМОЗАКЛЮЧЕНИЙ. При каких
условиях и по каким причинам мы применяем
умозаключения? Например, когда производятся умозаключения —
при поступлении новой информации или в отдельных
конкретных случаях, когда в этом возникает необходимость,
например при поступлении соответствующего вопроса?
3. ОРГАНИЗАЦИЯ. Предположим, что нам надо
произвести умозаключение. Как мы узнаем, где хранится нужная
для этого информация? Общий ответ на этот вопрос состоит
в том, что имеются "указатели" к информации. Тогда встает
следующий вопрос: как организованы эти указатели? Так,
можно предположить, что определенные части информации,
например сведения об универсамах, сгруппированы вместе.
Группировка может означать наличие указателя от
некоторой центральной темы к каждой локальной части
информации.
4. МЕХАНИЗМ ВЫВОДА УМОЗАКЛЮЧЕНИЙ.
Определив место хранения некоторого факта, как мы
определяем целесообразный способ его использования? Например,
в исчислении предикатов, о котором речь пойдет ниже,
существуют "правила вывода", согласно которым
устанавливается, какие умозаключения могут быть выведены из
данного набора фактов.
5. СОДЕРЖАНИЕ. Каковы те знания о мире, которые
позволяют нам понимать естественный язык? Отметим, что,
если ответы на другие вопросы (не считая, может быть,
первого) могут быть успешно найдены без обращения к
культуре, знания, которыми мы располагаем, очевидным
образом зависят от культуры и даже являются
идиосинкратичными.
ИСЧИСЛЕНИЕ ПРЕДИКАТОВ ПЕРВОГО ПОРЯДКА
Ниже мы частично ответим на поставленные вопросы
с помощью двух инструментов — языка исчисления
предикатов первого порядка (ИППП) и языка программирования
PLANNER.
175
ИППП было разработано для выяснения того, что же,
в сущности, делают математики: они "доказывают"
утверждения, но каков точный смысл термина "доказательство"?
Именно для ответа на подобные вопросы и возникло ИППП.
Более того, ИППП может быть определено столь точно, что
становится возможным доказывать факты о нем самом.
В ИИ, однако, ИППП не использовалось ни для той, ни для
другой цели. Скорее предполагалось, что программа,
базирующаяся на ИППП, может обладать такой способностью
к выводу умозаключений, которая нужна, например, при
понимании естественного языка. Поскольку мы не
собираемся доказывать теоремы относительно ИППП, мы не
обязаны давать точные определения и можем ограничиться
пояснениями на интуитивном уровне.
язык ИППП
Грубо говоря, ИППП состоит из языка для выражения
фактов и правил для вывода новых фактов из старых. Этот
язык располагает следующими элементами.
КОНСТАНТЫ. Константы — это некоторые "вещи",
которые могут быть предметом разговора, например ФИДО.
В дальнейшем изложении мы будем обычно обозначать их
символами "a", "b" и "с", а иногда собственными именами,
записанными прописными буквами (ФИДО, ДЖОН).
ПЕРЕМЕННЫЕ. Переменные могут заменять разные
"вещи" в разное время. Ниже мы будем обозначать их
буквами "х", "у", "z".
ПРЕДИКАТЫ. Запись СОБАКА (ФИДО) означает, что
предикат СОБАКА является истинным для константы
ФИДО, или, в более привычной записи, утверждается, что
"ФИДО — СОБАКА". У предиката может быть один или
несколько аргументов. В примере СОБАКА (ФИДО) предикат
имеет один аргумент, и он принимает значение ФИДО.
ДАВАТЬ (a, b, с) имеет три аргумента, которые обычно
интерпретируются: "[некто] а ДАЛ [нечто] b [кому-либо] с".
Предикаты могут быть истинными или ложными. Другими
словами, ФИДО может либо быть собакой, либо не быть
собакой.
ФУНКЦИИ. Функцией мы называем нечто, позволяющее
вычислять значение. Так, значением функции МЕСТО
176
РОЖДЕНИЯ (а) считается (если выбрано некоторое
конкретное имя) название населенного пункта, где родился a.
Подобно предикатам, функции имеют аргументы, и число
аргументов у каждой данной функции фиксировано, хотя
(как и в случае предикатов) ограничений на величину этого
числа не налагается. Отметим, что функция может служить
аргументом предиката, например, в случае, когда мы хотим
сказать, что выражение СОБАКА (МЕСТО РОЖДЕНИЯ
(а)) всегда является ложным (это равносильно утверждению,
что место рождения не может быть собакой). В то же время
предикат не может быть аргументом функции (или другого
предиката). Иными словами, выражение МЕСТО
РОЖДЕНИЯ (СОБАКА (а)) бессмысленно, поскольку СОБАКА (а)
не принимает того или иного значения в том смысле, в
котором его принимает функция, а просто является либо
истинным, либо ложным.
ЛОГИЧЕСКИЕ СВЯЗКИ. К логическим связкам
обычно относятся:
И (часто обозначается знаком "д", как в (АдВ).
Назвать составное высказывание БОГ(а) И
ЧЕЛОВЕК^) истинным — это значит сказать, что истинны
оба высказывания, входящие в его состав, то есть
что a — это одновременно и бог, и человек.
ИЛИ (часто обозначается знаком "V"). Составное
высказывание БОГ(а) ИЛИ ЧЕЛОВЕК(а) означает,
что a — либо бог, либо человек, либо одновременно
бог и человек. Отметим, что логические связки подобны
предикатам в том отношении, что высказывания с
логическими связками являются либо истинными, либо
ложными. Другими словами, утверждение, что a
является одновременно богом и человеком, либо истинно,
либо ложно.
НЕ (часто обозначается знаками ""]" или "~",
например " "| А"). Высказывание НЕ (БОГ(а)) означает,
что a — не бог.
ИМПЛИКАЦИЯ (часто обозначается знаком "=>").
Сказать, что ЧЕЛОВЕК (х) ИМПЛИЦИРУЕТ
ГРЕШНЫЙ (Y),— это значит сказать, что если х — человек,
то он грешен. Отметим, однако, что по определению
логической импликации, если х не является человеком,
то высказывание, содержащее импликацию, в целом
177
считается истинным независимо от того, грешен х или
нет. Таким образом, высказывание, содержащее
импликацию, является ложным тогда и только тогда,
когда вторая его часть [следствие] является ложной,
а первая часть [посылка] истинной, то есть если х —
человек и х не является грешным.
КВАНТОРЫ. Когда мы рассматривали высказывание
ЧЕЛОВЕК 00 ИМПЛИЦИРУЕТ ГРЕШНЫЙ 00, мы
неявно предполагали, что оно является истинным для
любого значения аргумента x. Это предположение выражается
квантором всеобщности:
ДЛЯ ЛЮБОГО (часто обозначается знаком "у").
Таким образом, более точная запись рассматриваемого
высказывания имеет вид ДЛЯ ЛЮБОГО (х)
(ЧЕЛОВЕК (х) ИМПЛИЦИРУЕТ ГРЕШНЫЙ 00).
Имеется и другой квантор — квантор существования:
СУЩЕСТВУЕТ (часто обозначается знаком "а").
Утверждение о том, что "существует некий бог",
записывается как СУЩЕСТВУЕТ (х) (БОГ (х)). Иначе
говоря, имеется такое значение переменной х, что БОГ
(х) истинно. Утверждение о том,
что "все люди владеют собаками", записывается: ДЛЯ
ЛЮБОГО 00 (СУЩЕСТВУЕТ (у) (ЧЕЛОВЕК
(х) ИМПЛИЦИРУЕТ (СОБАКА (у) И ВЛАДЕЕТ
(х, у)))), то есть "для любого человека существует
собака, такая, что этот человек владеет этой
собакой".
Когда выше мы пользовались одним и тем же
обозначением переменной (например, переменной "х" и в
высказывании "все люди владеют собаками", и в высказывании
"существует бог"), мы предполагали, что читатель не станет
смешивать эти переменные и не будет думать, что бог
и владельцы собак — это одно и то же. Читателю помогает
в этом его интуиция, а ИППП располагает для избежания
смешения такого рода определенными формальными
средствами. Предполагается, что каждая переменная имеет
определенную область действия. Внутри этой области
действия каждое вхождение одного и того же имени переменной
означает обращение к одной и той же переменной. Однако
мы можем пользоваться одним обозначением для разных
переменных в разных высказываниях при условии, что их
178
области действия не пересекаются. Для этого мы
пользуемся соглашением, в соответствии с которым областью
действия переменной считается заключенная в скобки часть
высказывания, непосредственно следующая за квантором,
вводящим эту переменную (при этом скобки при других
кванторах не учитываются). Таким образом, для
высказывания ДЛЯ ЛЮБОГО (х), ДЛЯ ЛЮБОГО (у) (Р (х) И
Q (у)) областью действия обеих переменных — х и у —
является высказывание Р (х) И Q (у).
Отметим, что многие из названных понятий могут быть
переопределены друг через друга. Пользуясь приведенными
выше интуитивными определениями, читатель может
убедиться, что
(4) А ИМПЛИЦИРУЕТ В — то же самое, что НЕ (А)
ИЛИ В
(5) ДЛЯ ЛЮБОГО (х) (Р(х)) — то же самое, что НЕ
(СУЩЕСТВУЕТ (х) (НЕ (Р(х))))
(6) А И В — то же самое, что НЕ (НЕ (А) ИЛИ НЕ (B))
правила вывода умозаключений
Располагая лишь перечисленными выше интуитивными
определениями, мы можем сделать ряд логических выводов.
Например, из того, что А И В — истинно, можно вывести,
что А — истинно. Однако использование ЭВМ требует
полной формализации всех операций, поскольку ЭВМ не
обладает интуицией. В связи с этим нам необходимы
формальные правила вывода, например такие:
(7) Можно вывести А ИЛИ В из А.
Можно вывести А из А ИЛИ А.
Можно вывести (А ИЛИ В) ИЛИ С из А ИЛИ
(В ИЛИ С).
Можно вывести В ИЛИ С из А ИЛИ В и НЕ (А)
ИЛИ С.
Эти правила приближаются к формальным
определениям наших интуитивных представлений о ИЛИ и НЕ. Чтобы
завершить определение, следует ввести еще одно правило
(называемое "логической аксиомой"): НЕ (А) ИЛИ А всегда
истинно. Для доказательства различных утверждений
полезно такое правило вывода: если, допустив А, мы можем
доказать В, то А ИМПЛИЦИРУЕТ В — истинно. Предпо-
179
ложим, что мы хотим доказать, что (X ИЛИ Y)
ИМПЛИЦИРУЕТ (Y ИЛИ X). Доказательство имеет следующий
вид:
1. (X ИЛИ Y) допущение
2. НЕ (X) ИЛИ X логическая аксиома
3. (Y ИЛИ X) из 1, 2 в соответствии
с четвертым правилом
в (7)
4. (X ИЛИ Y) ИМПЛИЦИ- по правилу, которое
РУЕТ (Y ИЛИ X) мы только что ввели
Пункт 3 нашего доказательства не очевиден, поэтому
рассмотрим его более подробно. Согласно правилу вывода,
из А ИЛИ В и НЕ (А) ИЛИ С следует В ИЛИ С.
мы имеем: X ИЛИ Y и НЕ (X) ИЛИ X.
Отождествляя X с А и С, a Y с В, получаем Y ИЛИ X.
доказательство теорем на основе принципа резолюции
Выведение новых фактов из известных с помощью
системы, описанной выше, сопряжено с рядом затруднений.
Первое и самое очевидное затруднение состоит в том, какие
именно правила вывода следует выбирать из набора
имеющихся правил. Более того, читатель не должен упускать
из вида и определенные натяжки в приведенном выше
доказательстве. На стадии 2 мы ввели НЕ (X) ИЛИ X без
всяких обоснований, просто потому, что это выражение нам
понадобилось для доказательства. ЭВМ не в состоянии
опираться на данные такого рода: для нее требуется более
четкая система вывода. Одним из возможных выходов из этого
затруднения может явиться использование
принципа резолюции. Поскольку принцип резолюции включает
лишь одно правило вывода, отпадает и вопрос выбора
правил.
Доказательство теорем на основе принципа резолюции
было изобретено в середине 60-х годов, и тогда казалось,
что тем самым решена и проблема вывода. Во второй
половине 60-х годов многие работали над применением принципа
резолюции к таким задачам, как разработка диалоговых
систем, автоматическое составление программ и т. п.
(Типичным примером такого подхода может служить работа
[Green, 1969].) Однако по причинам, о которых будет ска-
180
зано ниже, все эти проекты потерпели провал, и сейчас,
по-видимому, можно утверждать, что лишь немногие
специалисты в области ИИ все еще верят, что доказательство
теорем на основе принципа резолюции позволит решить
проблему вывода умозаключений.
Общая идея принципа резолюции состоит в том, чтобы
свести все высказывания к специальной форме, называемой
дизъюнктивной нормальной формой (clause form).
Выражение в дизъюнктивной форме (clause) — это просто список
предикатов, причем считается, что они соединены связкой
ИЛИ, и перед каждым из них допустимо отрицание. Так,
уже упомянутое правило вывода "из А ИМПЛИЦИРУЕТ
В и А следует В" представимо в форме:
НЕ: {А) ИЛИ В
В
где НЕ (А) и А взаимно уничтожаются. (Напомним, что,
согласно (4), А ИМПЛИЦИРУЕТ В эквивалентно НЕ (А)
ИЛИ В.)
Приведение высказываний к дизъюнктивной форме.
Можно доказать, что каждое высказывание ИППП
представимо в дизъюнктивной форме, но соответствующее
доказательство мы опускаем. Вместо этого мы покажем на простом
примере, каким образом высказывание можно привести
к дизъюнктивной форме. Мы начнем с высказывания,
примерно соответствующего утверждению о том, что все люди
владеют собаками:
ДЛЯ ЛЮБОГО (х) (СУЩЕСТВУЕТ (у) (ЧЕЛОВЕК (х)
ИМПЛИЦИРУЕТ (СОБАКА (у) И ВЛАДЕЕТ (х, у)))).
Первый шаг достаточно нетривиален: требуется
заменить все кванторы существования так называемыми
"функциями Сколема". Чтобы получить общее представление о
функциях Сколема, попробуем разобраться, что, в сущности,
означает приведенное высказывание. Как было указано, мы
хотим выразить мысль "Все люди владеют собаками". Мы
181
можем выразить эту мысль и несколько иначе, следующим
образом: "Каждому человеку может быть сопоставлена
собака, которой он владеет". Введем функцию "СОБАКА-
ЧЕЛОВЕКА" (она является функцией Сколема). Если а —
человек, то значением функции СОБАКА-ЧЕЛОВЕКА (а)
будет та собака, которой владеет а. В соответствии с этим
рассматриваемое высказывание представимо в форме:
ДЛЯ ЛЮБОГО (х) (ЧЕЛОВЕК (х) ИМПЛИЦИРУЕТ
(СОБАКА (СОБАКА-ЧЕЛОВЕКА (х)) и ВЛАДЕЕТ (х,
СОБАКА-ЧЕЛОВЕКА (х)))).
Это высказывание имеет форму Сколема, оно означает
"Если х — человек, то значением функции
СОБАКА-ЧЕЛОВЕКА (х) является та собака, которой этот человек
владеет".
Последующие шаги приведения высказывания к
дизъюнктивной форме довольно просты. Отметим, что на данной
стадии все переменные (в нашем случае переменная "х")
связаны квантором всеобщности, поскольку мы заменили
все кванторы существования функциями Сколема. Поэтому
мы можем опускать квантор всеобщности, предполагая его
наличие перед каждым высказыванием. Получаем:
ЧЕЛОВЕК (х) ИМПЛИЦИРУЕТ (СОБАКА (СОБАКА-
ЧЕЛОВЕКА (х)) И ВЛАДЕЕТ (х, СОБАКА-ЧЕЛОВЕКА
(х))). Теперь преобразуем ИМПЛИЦИРУЕТ по правилу
(4), заменив А ИМПЛИЦИРУЕТ В на НЕ (А) ИЛИ В.
НЕ (ЧЕЛОВЕК (х)) ИЛИ (СОБАКА
(СОБАКА-ЧЕЛОВЕКА (х)) и ВЛАДЕЕТ (х, СОБАКА-ЧЕЛОВЕКА (х))).
На этой стадии высказывание имеет общий вид А ИЛИ
(В И С). Заменим это высказывание на два отдельных
высказывания: А ИЛИ В и А ИЛИ С. (Читателю следует
убедиться самостоятельно, что этим мы не изменили
первоначальный смысл высказывания.) В результате получаем два
высказывания:
(8) НЕ (ЧЕЛОВЕК (х)) ИЛИ СОБАКА(СОБАКА-ЧЕ-
ЛОВЕКА (х))
(9) НЕ (ЧЕЛОВЕК (х)) ИЛИ ВЛАДЕЕТ (х, СОБАКА-
ЧЕЛОВЕКА (х))
Грубо говоря, в (8) утверждается, что если х — человек,
то значением функции СОБАКА-ЧЕЛОВЕКА (х) будет
182
собака, а в (9) — что этой собакой владеет человек. Оба
высказывания — (8) и (9) — имеют дизъюнктивную форму.
Использование принципа резолюции. Теперь, когда наше
высказывание приведено к дизъюнктивной форме, легко
дать примеры доказательств. Пусть нам известно, что
Джон — человек:
(10) ЧЕЛОВЕК(ДЖОН)
Мы задаем вопрос: "Владеет ли Джон чем-нибудь?".
(11) СУЩЕСТВУЕТ (у) (ВЛАДЕЕТ(ДЖОН, у))
Чтобы ответить на этот вопрос, используя принцип
резолюции, мы предполагаем, что ответом на него является "нет",
а затем пытаемся показать, что такой ответ приводит к
противоречию. Для доказательства противоречия мы
используем ''пустой дизъюнкт" (null clause). Это означает, что
с помощью принципа резолюции мы постоянно приводим
предложения к взаимному уничтожению: так, если мы
докажем, что А — истинно и (НЕ А)—тоже истинно, то мы
можем уничтожить А и НЕ А, получив ( ), или пустой
дизъюнкт. Поясним это на примере вывода (11). Отрицание
(11) имеет вид:
НЕ (СУЩЕСТВУЕТ (у) (ВЛАДЕЕТ (ДЖОН, у))).
Однако это высказывание представлено не в дизъюнктивной
форме, в частности потому, что в нем имеется квантор
существования. Для приведения высказывания к
дизъюнктивной форме используем правило (5), согласно которому
ДЛЯ ЛЮБОГО (х) (Р (х)) — то же самое, что НЕ
(СУЩЕСТВУЕТ (х) (НЕ (Р (х)))). Применение этого правила
дает:
ДЛЯ ЛЮБОГО (у) (НЕ (ВЛАДЕЕТ (ДЖОН, (у))))
Снятием квантора всеобщности получаем (12):
(12) НЕ (ВЛАДЕЕТ (ДЖОН, (у)))
Теперь мы можем "резольвировать" (resolve) (12) и (9), то
есть уцичтожить в них предложения вида А и НЕ А:
(9) НЕ (ЧЕЛОВЕК (х)) ИЛИ ВЛАДЕЕТ (х,
СОБАКА-ЧЕЛОВЕКА (х))
(12) НЕ (ВЛАДЕЕТ (ДЖОН, у))
183
Имея х = ДЖОН и СОБАКА-ЧЕЛОВЕКА (ДЖОН) = у,
можно уничтожить два предложения с предикатом
ВЛАДЕЕТ, в результате чего получаем (13):
(13) НЕ (ЧЕЛОВЕК (ДЖОН))
Таким образом, (13) — это то, что остается от (9) после
уничтожения предложения с ВЛАДЕЕТ и замены х на ДЖОН.
Если теперь мы резольвируем (13) и (10), то получим
нулевой дизъюнкт:
(13) НЕ (ЧЕЛОВЕК (ДЖОН))
(10) ЧЕЛОВЕК (ДЖОН)
( )
Итак, мы показали, что Джон чем-то владеет, доказав, что
соответствующее отрицание не может быть истинным, в чем
и состояла наша задача.
Ответ на пять вопросов. Теперь, после краткого
экскурса в область ИППП, попытаемся выяснить, как может
помочь ИППП при ответе на пять вопросов,
сформулированных в начале статьи.
СЕМАНТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ. Может ли
ИППП задать нужные нам предикаты? По существу, не
может. Как мы видели, ИППП допускает использование
любых предикатов, которые мы выберем, накладывая на
них лишь немногие ограничения. Так, ИППП не дает
рекомендаций относительно того, следует ли иметь в
семантическом представлении предикат ПРОДАВАТЬ (w, х, у, z),
означающий, что w дал х у'у за z, или надо разбивать
ПРОДАВАТЬ на более мелкие семантические элементы.
Один из возможных способов разбиения предложен Р. Шен-
ком (см. статью Скрэгга в наст, сб.):
(14) ПЕРЕДАВАТЬ (w, w, х, у) (w являлся деятелем в
передаче х от себя к у)
(15) ПЕРЕДАВАТЬ (у, у, z, w) (у дает z w)
КАУЗИРОВАТЬ ((14), (15))
((14) и (15) взаимообусловлены)
КАУЗИРОВАТЬ ((15), (14))
(Строго говоря, два высказывания с предикатом
КАУЗИРОВАТЬ не являются правильными выражениями ИППП,
однако их легко преобразовать в правильные выражения.)
Итак, единственный ответ, который дает ИППП, состоит в
184
том, что полезно использовать такие единицы, как И, ИЛИ
и НЕ, но в остальных отношениях ИППП ничем не помогает
исследователю.
ПРИМЕНЕНИЕ УМОЗАКЛЮЧЕНИЙ. Какие
рекомендации относительно того, когда и каким образом
выводить умозаключения, дает ИППП? На этот вопрос трудно
ответить однозначно, поскольку здесь возможна
определенная вариативность, однако общая идея, вытекающая
из ИППП, состоит в том, что вывод умозаключений можно
начинать только при поступлении конкретного вопроса. На
данном этапе изложения это ограничение не кажется
важным, однако несколько позже мы увидим, что оно весьма
существенно.
ОРГАНИЗАЦИЯ. Как мы находим место хранения
нужных нам фактов в ИППП? На этот вопрос мы вообще
не получаем никакого ответа. Доказывая, что Джон чем-
либо владеет, мы не объяснили, почему мы используем
именно данные сведения, а не какие-то другие. Причина этого
состоит в том, что ИППП вообще и доказательство теорем
на основе принципа резолюции, в частности, весьма далеки
от этой темы. В действительности этот вопрос очень важен,
и к нему мы скоро вернемся.
МЕХАНИЗМ ВЫВОДА УМОЗАКЛЮЧЕНИЙ.
Предположим, что мы каким-то образом нашли нужные нам
факты. Тогда помогает ли ИППП использовать их? На этот
вопрос ответ, несомненно, положителен, особенно если
использовать принцип резолюции. Единственный способ
использования принципа резолюции состоит в выведении новых
фактов с помощью операции сравнения известных фактов.
Когда мы доходим до этой задачи, мы видим, что ИППП
представляет собой, по преимуществу, теорию механизма
вывода умозаключений.
СОДЕРЖАНИЕ. ИППП ничего не говорит о том,
какими именно сведениями о мире мы должны располагать.
Единственная связь между ИППП и содержательными
сведениями о мире состоит в том, что некоторые факты трудно,
если вообще возможно, записать на языке ИППП.
Суммируя сказанное, можно заключить, что ИППП
способно предложить сильный аппарат вывода умозаклю-
185
чений, но не дает почти никаких
рекомендаций относительно семантического представления.
Как мы видели, основная проблема, связанная с ИППП,
состоит в том, что на большинство интересующих нас
вопросов это исчисление не дает ответа.
комбинаторный взрыв
Как было отмечено, ИППП не содержит рекомендаций
относительно нахождения фактов, нужных для вывода.
Применительно к принципу резолюции это означает, что
ИППП не дает информации о том, какие именно
предложения следует резольвировать относительно друг друга.
Предположим, что мы просто будем брать все возможные
комбинации предложений. Предположим также, что у нас есть
10 предложений и что для кратчайшего вывода нужно
применить резолюцию 10 раз (то есть пустой дизъюнкт будет
получен при десятом применении резолюции). На первом
шаге имеется 10 вариантов выбора одной из резольвент
(резольвентами будем называть предложения,
подвергающиеся резолюции) и 10 вариантов выбора второй, то есть
всего 100 (=102) резольвент. Естественно, резольвировать А
относительно В — это то же самое, что резольвировать В
относительно А, поэтому нам понадобится около половины
операций. (На самом деле, нам нужно ровно 55 операций.
Однако для арифметических подсчетов 50 — более удобное
число, а результат получится столь огромным, что наше
огрубление не имеет существенного значения.) На втором
100 100 100 / ю4\
шаге-о-вариантов дадут—- х -о- ( = -—- J возможных
комбинаций для первой и второй резолюций, вместе взятых.
(Мы снова округляем результат. На самом деле при второй
резолюции возможны 11 вариантов: 10 исходных
предложений плюс предложение, полученное в результате
первого применения резолюции). Продолжая таким обра-
1020
зом, к десятому шагу мы получим -—^ ~1017 возможных
способов осуществления десяти резолюций. Естественно, не
исключена возможность того, что пустой дизъюнкт
получится более одного раза, однако эта разница с лихвой
компенсируется произведенными округлениями. Чтобы дать
представление о грандиозности полученного числа,
напомним, что количество секунд в столетии меньше, чем 1010.
186
Специалисты в области ИППП обратили внимание на
эту проблему; однако предложенные ими способы ее решения
нельзя считать эффективными. Например, была разработана
так называемая стратегия опорного множества (set of
support), сущность которой сводится к следующему. Мы
начинаем с одного предложения, которое мы хотим доказать,
и строим его отрицание. Теперь мы пытаемся опровергнуть
это отрицание. Мы можем ограничиться сравнением
отрицания исходного предложения со всеми имеющимися
предложениями и с результатами предшествующих резолюций.
Иначе говоря, если мы пытаемся показать, что
предположение об истинности НЕ (Р) ведет к противоречию, то мы
не должны резольвировать пары предложений, не имеющих
ничего общего с данным.
На количество вариантов перебора стратегия опорного
множества существенно не влияет. Вместо 1017 мы получим
около 1010 допустимых комбинаций. Это означает, что, если
даже перебирать варианты со скоростью 10000 в секунду, то
и тогда получение нужного вывода займет около 10 дней.
Ситуация, когда сравнительно небольшое количество
исходных вариантов в результате комбинаторных
преобразований приводит к огромному количеству конечных
вариантов, называется комбинаторным взрывом. Это очень
трудная проблема, которая встает не только в ИППП. С ней
сталкивается любая система, использующая выводы.
Однако сейчас большинство специалистов убеждены, что в
ИППП названная проблема стоит особенно остро. Причина
этого тесно связана с одним из важнейших преимуществ
ИППП. В ИППП может быть выведено истинностное
значение каждого высказывания, записанного на его языке. Это
свойство называется полнотой, и оно, естественно, является
весьма желательным при прочих равных условиях. Тем
не менее, хотя это и не доказано, многие считают, что всякая
полная система необходимо подвержена комбинаторному
взрыву. Только неполная система способна обойти это
затруднение.
КОГДА МЫ ВЫВОДИМ УМОЗАКЛЮЧЕНИЯ?
Существуют и другие затруднения, касающиеся ИППП.
Чтобы понять их, нам придется обратить пристальное
внимание на условия, при которых у нас возникает желание,
чтобы наши системы вывода производили вывод умозаклю-
187
чений. Особенно важен для нас простой вопрос о том, когда
мы делаем некоторое умозаключение.
Пусть перед нами диалоговая система, воспринимающая
информацию на естественном языке и отвечающая на
соответствующие вопросы. Очевидно, что существуют две
временные точки, в которых можно начинать вывод
умозаключений: первая — после поступления вопроса, требующего
вывода умозаключения, вторая — после поступления в
систему достаточной информации для вывода данного
умозаключения. Две эти возможности мы назовем,
соответственно, временем обработки запроса (question time) и временем
обработки входного текста (read time).
Вывод умозаключений во время обработки запроса
имеет ряд очевидных преимуществ. Имея определенный набор
фактов, мы сталкиваемся с огромным числом
умозаключений, которые можно было бы вывести (напомним о
комбинаторном взрыве). Очевидно, что все допустимые выводы
произвести нельзя, тогда как поступление запроса гарантирует,
что мы будем производить лишь те выводы, которые нужны
для ответа пользователю. Однако и против такого решения
имеются веские возражения.
психологический вопрос
Если мы хотим построить модель, имитирующую процесс
чтения текста человеком, то естественно задаться чисто
эмпирическим вопросом о том, производят ли люди
умозаключения при чтении. При обычном психологическом
эксперименте испытуемому предлагают пересказать отрывок текста
с тем, чтобы он "вспомнил" те факты, которые в самом тексте
не содержались, но выводимы из него. Подобный
эксперимент наталкивает на мысль о том, что умозаключения
производятся во время чтения, однако психологи отмечают,
что они могут производиться и во время пересказа. Правда,
существуют и другие эксперименты, которые, как кажется,
отметают вторую возможность.
всегда ли возможно отложить вывод умозаключений?
Даже если бы нас не интересовала психологическая
модель, все равно мы должны были бы признать, что вывод
умозаключений нельзя полностью откладывать до времени
обработки запроса. Без вывода умозаключений часто не-
188
возможно разрешить лексическую и структурную
неоднозначность, а также установить референты местоимений.
В начале изложения мы привели ряд подтверждений этого,
сейчас рассмотрим еще один пример.
(16) Today was Jack's birthday. Janet and Penny went to
the store. They had to get presents. "I will get a
top", said Janet. "Don't do that", said Penny.
"Jack has a top. He will make you take it back".
'Сегодня день рождения Джека. Дженет и Пенни
пошли в магазин. Им были нужны подарки. "Я
куплю волчок",— сказала Дженет. "Не делай
этого,— сказала Пенни,— у Джека есть волчок.
Он заставит тебя взять его обратно".'
Трудность здесь состоит в том, что местоимение it 'его'
в последней фразе относится не к последнему упомянутому
предмету (волчок Джека), а к предпоследнему (волчок,
который собиралась купить Дженет). Чтобы правильно
установить кореферентные связи, необходимо использовать
сведения об обмене вещей, купленных в магазине.
направленные умозаключения
Подобные соображения показывают, что некоторые
умозаключения должны быть сделаны во время обработки
входного текста. Встает вопрос о том, какова пропорция таких
умозаключений и каков их характер. В этом отношении
полезно провести разграничение между "направленными"
умозаключениями (problem occasioned inference) и
"ненаправленными" умозаключениями (non-problem occasioned
inference) * (дальнейшее уточнение этого вопроса см. во
второй статье Уилкса). Направленное умозаключение —
такое, которое требуется для получения внутреннего
представления текста. Мы называем его направленным,
поскольку его необходимо делать всякий раз, когда мы
сталкиваемся с каким-либо затруднением при анализе текста:
когда нам встречается неоднозначное слово или когда
возникают разные возможности установления кореферентных
связей. Типичным примером ненаправленного
умозаключения может служить умозаключение, которое следует
сделать для понимания текста Janet shook her piggy-bank.
* Ср. термины программирования "вывод, управляемый целями"
(question driven inference) и "вывод, управляемый данными" (data driven
inference).— Прим. перев.
189
There was no sound 'Дженет потрясла копилку. He
раздалось ни звука'. Умозаключение о том, что в копилке ничего
не было, является ненаправленным: в тексте нет
неоднозначности, которую бы разрешало это умозаключение.
Сторонники подхода, согласно которому во время
обработки входного текста следует делать все умозаключения,
исходят из того, что некоторые умозаключения должны
быть сделаны до того, как процесс "понимания" текста
человеком или машиной можно считать "завершенным".
Основное предположение при подходе, использующем
направленные умозаключения, состоит в том, что, ограничив
умозаключения, выводимые во время обработки входного
текста, лишь теми, которые безусловно необходимы, можно
добиться значительного снижения числа умозаключений. На
самом деле никто в точности не знает, действительно ли
число необходимых направленных умозаключений будет
небольшим, однако предполагается, что это так; в противном
случае рассматриваемый вопрос теряет всякое практическое
значение.
Мы считаем, что вывод ненаправленных умозаключений
совершенно необходим для получения самого внутреннего
представления текста (о другой точке зрения см. в части II
статьи Уилкса). Конечно, сторонники направленных
умозаключений возразят, что все необходимые умозаключения
будут сделаны и при их подходе, поэтому, говоря более
точно, мы отстаиваем позицию, согласно которой число
необходимых умозаключений значительно больше, чем это
обычно предполагается.
Рассмотрим, в частности, проблему установления
антецедентов местоимений. Чтобы получить некоторое
представление о возникающих здесь трудностях, читатель может
проделать небольшой эксперимент. Откройте наугад любую
книгу, которую вы не читали, и просмотрите страницу с
целью установления антецедентов местоимений. Если ваши
результаты совпадут с моими, вы убедитесь, что в
большинстве случаев для установления кореферентных связей
нужно прочесть несколько строк, предшествующих
употреблению местоимения. Однако в некоторых случаях этого
недостаточно, и подобная ситуация весьма интересна,
поскольку она ставит читателя в положение, близкое к положению
ЭВМ, которая призвана устанавливать кореферентные
связи без знаний о предшествующем тексте. (Конечно,
читатель, который выводит лишь направленные умозаключения,
190
будет иметь некоторое представление о предшествующем
тексте, поэтому аналогию нельзя считать полной, но к этому
вопросу мы вернемся ниже.) Рассмотрим пример ситуации
указанного рода.
At four o'clock, after dishwashing and dozing, we
started back toward Henley. (D. Francis, Blood
Sport)
4B четыре часа, вымыв посуду и подремав, мы
отправились обратно в Хенли.' (Д. Френсис.
Кровавый спорт).
Из этой фразы не ясно, каков антецедент местоимения
we 'мы'. Непосредственное окружение фразы вопроса не
проясняет. Перед рассматриваемой фразой читаем:
I smiled and answered when I was spoken to and
concentrated carefully on the taste and texture of
what I was eating, and all that happened was that
the fat black slug of depression flexed its muscles
and swelled another notch.
4Я улыбался и отвечал, когда ко мне обращались,
и полностью сосредоточился на еде, и со мной
ничего не случилось, кроме того, что жирный черный
слизняк депрессии внедрился в меня еще глубже.'
За рассматриваемой фразой следует:
My refusal to go to America hadn't basically
disturbed Teller or Keeble an ounce.
'Мой отказ поехать в Америку ничуть не
обеспокоил ни Теллера, ни Кибла.'
Читатель может задаться вопросом, как бы он сам решил
эту задачу.
Этот пример был предложен трем людям в рамках весьма
неформального эксперимента. Испытуемых попросили
определить антецедент местоимения we и объяснить, как они
это сделали. Все трое нашли задачу трудной, и двое
предложили один и тот же способ поведения: установив, что
непосредственное окружение не помогает решению задачи,
взять предшествующий отрывок текста (примерно половину
страницы) и прочитать его вплоть до рассматриваемой
фразы. Из этого отрывка они узнали (наряду с разными
другими фактами) о том, что шестеро людей устроили пикник на
берегу реки. Тогда они предположили, что we может
относиться ко всем шестерым участникам пикника, поскольку
191
вероятна ситуация, когда участники пикников вместе
приезжают и уезжают, хотя вполне допустимы и другие
варианты. Это заставило их прочесть еще полторы
предшествующих страницы, от начала главы. Не найдя в них ничего
противоречащего их предположению, согласно которому
основная группа не разбивалась на подгруппы, они
укрепились во мнении, что we относится ко всем шестерым, хотя
и не были уверены в этом полностью. (Третий испытуемый
прочитал пять страниц, предшествующих рассматриваемой
фразе, и собрал достаточно подтверждений того же самого
вывода.)
Из сказанного следует, что программа, не делающая
попыток "следить" за ходом повествования, будет испытывать
серьезные трудности при установлении кореферентных
связей. А как бы вела себя программа, способная выводить
лишь направленные умозаключения? Трудно сказать
наверняка, что бы в точности отметила такая программа, но
предположим, что она выявила бы те особенности, о которых
шла речь выше. В то же время подчеркнем, что
окончательное решение двоих испытуемых основано на том, что они
не нашли сведений, противоречащих их гипотезе. Для того
же, чтобы быть уверенным в этом решении, понадобилось
внимательное чтение нескольких страниц, что недоступно
программе с направленными умозаключениями.
ответы на вопросы и направленные умозаключения
И, наконец, системе, неспособной делать
ненаправленные умозаключения, по-видимому, будет исключительно
трудно отвечать на вопросы по достаточно сложным
текстам. Рассмотрим такой текст:
Janet wanted to trade her colored pencils for Jack's
paints. Jack was painting a picture of an airoplane.
Janet said to him, "Those paints make your airoplane
look bad."
'Дженет хотела обменять свои цветные карандаши
на краски Джека. Джек рисовал самолет. Дженет
сказала ему: "Из-за этих красок твой самолет
получается некрасивым".'
Отметим, что система с направленными
умозаключениями во время обработки входного текста не усомнится в том,
что слова Дженет — чистейшая правда. Но предположим,
192
что мы спросим систему о том, верит ли сама Дженет своим
словам. Каким образом сможет система ответить на этот
вопрос отрицательно? Пусть мы задаем правило, согласно
которому предполагается, что человек верит в то, что
говорит, если только у нас нет оснований для противоположного
мнения. Но как показать, что у Дженет были причины не
верить в то, что она сказала? Число причин, по которым
человек может лгать, столь велико, что не следует и
пытаться искать каждую из них в приведенном тексте. Гораздо
более предпочтительным представляется противоположный
путь, при котором мы начинаем с самого текста и выводим
из него умозаключение о том, что Дженет имеет основания
для лжи. Но если в данном случае информацию о
возможности лжи можно вывести из части текста, непосредственно
предшествующей словам Дженет, то в другом, реальном
случае подобная информация может находиться достаточно
далеко от тех утверждений, которые следует признать
ложными,— и снова встает вопрос о том, каким образом
может система, не имеющая ненаправленных
умозаключений, выработать информацию такого рода.
следствия
Если наша программа будет выводить умозаключения
в процессе обработки входного текста, то какими чертами
должен обладать аппарат вывода умозаключений?
Во-первых, этот аппарат не может ограничиваться
умозаключениями, управляемыми запросами (question
driven inference). А ИППП, как было показано выше, является
именно системой, управляемой запросами. Мы видели, что
многие умозаключения необходимы независимо от запросов
пользователей, и даже если мы расширим понятие запроса,
включив в него направленные умозаключения, то все-таки
за его пределами останутся ненаправленные
умозаключения, которые с большой вероятностью могут понадобиться
при обработке текста. С другой стороны, во время
обработки текста нельзя делать всех возможных умозаключений,
поскольку их количество слишком велико. (Теоретически
ИППП позволяет делать бесконечное число выводов из
любого исходного набора фактов.) В связи с этим наша
система должна уметь отличать "важные" умозаключения,
которые следует выводить незамедлительно, от "неважных",
которые следует отложить до той поры, когда (и если) в них
7 №534
193
возникнет необходимость. Например, в тексте (16) кажется
разумным отложить вывод умозаключений о том, что у
Дженет есть легкие и сердце.
Следует отметить, что названные затруднения не
являются непреодолимыми для ИППП. Возможно, следует
заготовить список вопросов общего профиля, типа "Почему это
было сказано?" или "Почему это случилось?", с тем, чтобы
система, использующая ИППП, останавливалась после
каждой введенной фразы и отвечала на эти вопросы, производя
тем самым ненаправленные умозаключения. Однако
подобный искусственный обход естественных свойств системы
кажется подозрительным. Кроме того, систему,
останавливающуюся для ответов на подобные вопросы, нельзя считать
чистым случаем системы, использующей ИППП.
Во-вторых, любая используемая система должна
считаться с возможностью возникновения противоречий.
Естественно, что система, выводящая умозаключения по мере
поступления текста, должна время от времени совершать
ошибки. Например, наряду с текстом (16), для которого мы
заключили, что Дженет и Пенни пошли в магазин, чтобы
купить подарки, может встретиться и такой текст:
(17) Today was Jack's birthday. Janet and Penny went
to the store. They had to get presents. They had
decided to make the presents and needed glue from the
store.
'Наступил день рождения Джека. Дженет и Пенни
пошли в магазин. Им нужны были подарки. Они
решили сделать подарки сами, и в магазине им
потребовался клей. '
После чтения первых трех фраз разумно предположить, что
дети пошли в магазин для покупки подарков, однако это
всего лишь предположение, а не абсолютное утверждение.
В (17) подобное умозаключение вступит в противоречие с
новой информацией, извлекаемой из последней фразы, и
тогда это умозаключение следует отбросить. Таким образом,
наша система должна разрешать кажущиеся противоречия.
Сделать это с помощью канонического ИППП невозможно,
что является еще одним его слабым местом. В ИППП
широко применяются доказательства от противного. При
объяснении принципа резолюции мы подчеркивали, что
доказательство любого предложения В в дизъюнкции А ИЛИ В
состоит в доказательстве того, что как А, так и НЕ (А)
являются предложениями, в связи с чем их можно резольви-
194
ровать, получив нулевой дизъюнкт и доказав тем самым В.
Конечно, и здесь можно найти разные обходные пути, но
это еще одно подтверждение того, что естественные свойства
ИППП вступают в противоречие с требованиями,
вытекающими из условий поставленной нами задачи.
ЯЗЫК ПРОГРАММИРОВАНИЯ PLANNER
Чем же можно заменить ИППП? Одна из возможностей
состоит в использовании для вывода умозаключений
естественных свойств LISP или другого языка программирования.
Именно так и строились некоторые ранние диалоговые
системы, например система Рафаэла SIR — Semantic
Information Retrieval (Raphael, 1968).
система sir
Чтобы объяснить то, что сделал Рафаэл, надо сначала
бегло охарактеризовать списки свойств, используемые в
языке LISP. В LISP каждому базисному символу (или
"атому") ставится в соответствие так называемый список свойств
(property list). Так, утверждение о том, что нос (nose) —
часть (subpart) человека (person), на языке LISP
записывается следующим образом!
property list
PERSON ► (SUBPART (NOSE))
NOSE >• (SUPERPART (PERSON))
Как видно из примера, список свойств — это просто набор
пар, где первый член — имя свойства, а второй — имя
значения свойства. Если мы хотим добавить утверждения о том,
что сердце (heart) — часть человека, а девушки (girls) —
подкласс (subclass) людей, то мы должны записать
следующее:
HEART —► (SUPERPART (PERSON))
GIRL ■ ► (SUPERSET (PERSON))
И здесь мы должны были бы изменить список свойств для
PERSON:
PERSON *. (SUBSET (GIRL) SUBPART
(HEART NOSE»
7*
195
Именно этой чертой языка LISP и пользовался Рафаэл.
Он написал программы перевода некоторых типов
предложений в структуры языка LISP и программы поиска
нужных структур при ответе на вопрос. Например, если мы
спрашиваем Does a girl have a heart? 'Есть ли у девушки
сердце?', то программа сначала ищет соответствующее
значение свойства SUBPART по символу GIRL; не найдя
его, она отмечает, что существует отношение GIRL -►
(SUPERSET(PERSON)), и переходит к поиску по символу
PERSON. Этот поиск, естественно, будет успешным, и
программа даст на наш вопрос утвердительный ответ.
Но вывод умозаключений при использовании LISP
наталкивается на определенные трудности. Как отмечает
Рафаэл в конце названной статьи, добавление новой
информации и новых операций над ней часто сопровождается
необходимостью переписывания части старых программ
поиска в списках, в результате чего SIR становится
неуправляемым. Далее Рафаэл утверждает, что указанные
трудности можно обойти, используя ИППП. Это, конечно, верно,
но, как мы видели, ИППП создает много собственных
трудностей.
Другой выход состоит в том, чтобы сделать язык
программирования более пригодным для вывода умозаключений.
Именно эту задачу ставил перед собой Хьюитт (Hewitt) при
разработке языка PLANNER. Сейчас PLANNER очень
напоминает единорога: мы многое о нем знаем, но его
никогда не существовало. Другими словами, язык
программирования, называемый PLANNER, еще нигде никогда
не применялся. Тем не менее идеи, положенные в основу
языка PLANNER, оказались весьма продуктивными, и
было создано и опробовано несколько вариантов и
фрагментов этого языка. Одним из наиболее известных из них
является MICRO-PLANNER (Sussman et al., 1971).
Дальнейшее изложение посвящено языку,
приближающемуся к MICRO-PLANNER. (Это описание, возможно, будет
непонятно для тех, кто совсем не знаком с языком LISP *.)
использование языка planner
Чтобы объяснить сущность языка PLANNER,
представим себе ситуацию, когда человек посредством дисплея
* С языком ЛИСП читатель может ознакомиться, например, по
книге: УинстонП. Искусственный интеллект. М., изд-во "Мир",
1980.— Прим. ред.
196
общается с ЭВМ на языке MICRO-PLANNER. Отметим,
что для простоты изложения мы изменили многие
особенности синтаксиса языка MICRO-PLANNER, поэтому на
самом деле наше описание лишь условно соответствует
этому языку. Человек вводит на дисплей:
(ASSERT (AT JOHN KITCHEN))
Это означает, что в базу данных поступает "утверждение"
(assertion) AT JOHN KITCHEN 'В ДЖОН КУХНЯ'.
("Базой данных" называется часть памяти, где можно
хранить факты и производить их поиск.) Отметим, что из
всех введенных символов язык MICRO-PLANNER "знает"
только функцию ASSERT. Все же остальные символы,
например AT, для программы бессмысленны. Если бы
введенное утверждение имело вид (AT JOHN SINCERITY)
'В ДЖОН ИСКРЕННОСТЬ', то для программы ничего
бы не изменилось. По тем же причинам не обязательно
ставить предикат на первое место. С таким же успехом
можно было бы ввести и (JOHN AT KITCHEN). Мы ставим
предикат на первое место для единообразия с ИППП.
(GOAL (AT JOHN?))
* (AT JOHN KITCHEN)
Для того чтобы найти факт в базе данных, мы используем
функцию GOAL 'цель'. Знак "?" означает, что мы не знаем,
какое значение подставить на это место, и принимаем
любое. Таким образом, мы имеем возможность формировать
полное утверждение по его части. Знаком "*" отмечаются
ответы ЭВМ. Укажем, что способность программы
узнать в (AT JOHN KITCHEN) образец для (AT JOHN?)
объясняется тем, что в ней есть зачатки умения "подбирать
образцы". Мы могли бы спросить:
(GOAL (? JOHN KITCHEN))
и получили бы тот же ответ:
* (AT JOHN KITCHEN)
Другими словами, мы можем задавать вопросы о характере
связи между символами JOHN и KITCHEN.
Если мы введем:
(GOAL (AT JOHN HOUSE)),
то получим ответ;
• < )
197
Ответ ( ) означает, что программа оказалась не в
состоянии найти подходящее утверждение. Естественно, у
программы нет знаний о соотношении между kitchen 'кухня'
и house 'дом', пока мы эти знания не ввели. Для того, чтобы
это сделать, нам нужны так называемые "теоремы",
которые соответствуют "программам" в других языках
программирования.
(CONSE LOC-FINDER
:LOC-FINDER — название теоремы. CONSE на
: языке системы
:MICRO-PLANNER — это сокращение для
consequent theorem 'консеквентная теорема9. К этому
.•термину мы вернемся позже.
(OBJ LOC-A LOC-B)
:Это просто список переменных
местонахождения.
(AT ?OBJ PLOC-A)
:Это "образец" теоремы, который сообщает
программе, что соответствующая теорема может оказаться
.•полезной при определении местонахождения
объектов.
:3нак "?" в ?OBJ показывает, что это переменная.
(GOAL (AT ?OBJ PLOC-B)
(GOAL (PART-OF ?LOC-B PLOC-A))
.-Эти две строки означают следующее: чтобы
доказать местонахождение объекта в LOC-A, надо
доказать, что он находится в LOC-B, которое
.•является частью LOC-A.
Строки, помеченные знаком ":", содержат неформальные
пояснения для читателя и с программой не связаны.
Продолжим работу с ЭВМ.
(ASSERT (PART-OF KITCHEN HOUSE))
(GOAL (AT JOHN HOUSE) THEOREMS)
*(AT JOHN HOUSE)
Сначала мы вводим нужное нам утверждение о том, что
кухня — часть дома. Затем мы снова набираем GOAL (AT
198
JOHN HOUSE), но на этот раз добавляй символ
THEOREMS, который означает, что если в базе данных нет
соответствующего утверждения, то следует использовать
теоремы. Программа использует теорему LOC-FINDER,
поскольку ее образец соответствует образцу, вводимому функцией
GOAL. Сравнивая образец, вводимый функцией GOAL,
с образцом теоремы, программа отождествляет JOHN с
?OBJ и HOUSE с PLOC-A. Способность выбора теорем по
их образцам называется "вызовом процедур по образцу''
(pattern directed invocation). Затем программа выполняет
две функции GOAL внутри теоремы LOC-FINDER, в
результате чего, соответственно, получает (AT JOHN ?LOC
-В) (PLOC-B отождествляется с KITCHEN) и (PART-OF
KITCHEN HOUSE) (и в этом случае отождествление
произведено успешно).
Продолжаем работу.
(ASSERT (AT JOHN USA))
(GOAL (AT JOHN HOUSE) THEOREMS)
* (AT JOHN HOUSE)
Неискушенному читателю может показаться естественным,
что после ввода утверждения о том, что Джон находится в
США, программа по-прежнему способна ответить, что Джон
находится в доме, однако для получения такого ответа ЭВМ
производит значительную внутреннюю работу. Рассмотрим
подробно то, что происходит после поступления функции
GOAL.
— Определить, что ни одно из имеющихся
утверждений не подходит для (AT JOHN HOUSE).
— Просмотреть теоремы. Определить, что теорема
LOC-FINDER имеет образец, подходящий к
утверждению (AT JOHN HOUSE), вводимому
функцией GOAL.
— Начать применение теоремы LOC-FINDER.
Прежде всего отождествить JOHN с ?OBJ и HOUSE с
PLOC-A.
— Выполнить GOAL (GOAL (AT? OBJ PLOC-B)).
POBJ отождествлен с JOHN, в связи с чем имеется
не одно, a два утверждения, совпадающих с
образцом: (AT JOHN USA) и (AT JOHN KITCHEN).
По причинам, которые нас не интересуют,
программа выберет первое утверждение, отождествив
199
?LOC-B с USA. Однако она запомнит и второй
вариант.
Выполнить GOAL (GOAL (PART-OF PLOC-B
?LOC-A)), в результате чего получится (PART-OF
USA HOUSE). Естественно, последнее
утверждение не проходит, поэтому GOAL сообщит об отказе.
Обработка второго варианта может быть представлена
схематически следующей диаграммой:
Пока мы проследили операции вплоть до пункта "отказ".
Далее начинают происходить действительно интересные
вещи. Когда функция GOAL заканчивается отказом,
MICRO-PLANNER начинает осуществлять так
называемый "возврат". В сущности задача возврата состоит в
поисках легкого пути исправления. Для этого
MICRO-PLANNER возвращается к предшествующим шагам и пытается
выяснить, возможен ли другой выбор переменных. В
данном случае такой выбор имеется. Функция (GOAL (AT ?OBJ
PLOC-B)) использовала утверждение (AT JOHN USA), a
не утверждение (AT JOHN KITCHEN). Поэтому MICRO-
PLANNER возвращается к этому шагу и выбирает вторую
альтернативу.
Произвести возврат к "пункту выбора".
Определить, что в (GOAL (AT ?OBJ PLOC-B) может быть
подставлено также (AT JOHN KITCHEN). Начать
процедуру с этого шага при ?LOC-B=KITCHEN.
Выполнить (GOAL (PART-OF KITCHEN
HOUSE)). Процедура осуществляется успешно,
следовательно, теорема доказана.
200
Наше описание соответствует левой части приведенной
выше диаграммы. Отметим, что если бы утверждение (PART-
OF KITCHEN HOUSE) было взято из базы данных, то и эта
попытка закончилась бы неудачей, и мы опять не смогли
бы доказать теорему.
(ASSERT (AT JOHN STORE))
(GOAL (AT JOHN KITCHEN))
* (AT JOHN KITCHEN)
Это еще один пример, показывающий, что программе
известно лишь то, что сообщено ей в явном виде. Обычно
оказывается желательным уничтожение утверждения о том, что
Джон в кухне, после поступления утверждения о том, что
он в магазине (store), или по крайней мере введение пометы
о том, что в настоящий момент первое утверждение неверно.
MICRO-PLANNER обладает средствами для выполнения
каждой из этих двух операций. Мы покажем, как
производится первая из них, поскольку ее несколько легче
проиллюстрировать.
(ANTE LOC-CHANGE
:ANTE показывает, что это "антецедентная" теорема.
: Более подробно об этом см. ниже.
(OBJ NEWLOC OLDLOC)
(AT ?OBJ ?NEWLOC)
:Это образец. Он сообщает системе
MICRO-PLANNER, что соответствующую теорему следует
вызывать, когда вводится утверждение, отвечающее
: образцу.
(GOAL (AT ?OBJ ?OLDLOC))
(THNOT (EQUAL ?OLDLOC PNEWLOC))
(ERASE (AT ?OBJ ?OLDLOC)) )
:Три последние строки означают, что в случае,
.•когда ?OBJ находится в месте, не совпадающем
:с PNEWLOC, старое утверждение зачеркивается.
В определенном отношении теорема LOC-CHANGE
отличается от всех тех, которые были рассмотрены выше.
Отличие состоит в том, что она применяется не для
доказательства некоторого утверждения, а для введения новой
информации в базу данных. Именно поэтому она называется
антецедентной теоремой (и помечается знаком ANTE). Название
связано с традиционными названиями частей импликации
201
в ИППП, а именно — посылкой (antecedent) и следствием
(consequent).
ЧЕЛОВЕК (X) ИМПЛИЦИРУЕТ СМЕРТНЫЙ (X)
посылка следствие
(антецедент) (консеквент)
Антецедентная теорема — такая, в которой нам дана
посылка и мы выводим соответствующее следствие, тогда как
в консеквентной теореме мы должны доказать следствие,
для чего мы пытаемся найти соответствующую посылку.
Таким образом, LOC-FINDER — это консеквентная
теорема, поскольку она используется для нахождения (AT ?OBJ
?LOC-A) и доказывается с помощью перебора утверждений
в базе данных. Можно сказать, что консеквентные теоремы
"управляются целями" (question driven). С другой стороны,
LOC-CHANGE — это антецедентная теорема, поскольку она
используется при введении нового местонахождения
объекта. Она "управляется данными" (data driven). Для
использования этой теоремы мы сначала уничтожаем (erase) (AT
JOHN STORE), а потом снова вводим это утверждение:
(ERASE (AT JOHN STORE))
(ASSERT (AT JOHN STORE) THEOREMS)
Как и в случае с GOAL, теоремы используются только
тогда, когда их вызывают.
(GOAL (AT JOHN HOUSE) THEOREMS)
* (AT JOHN HOUSE)
Произошла какая-то ошибка. Мы по-прежнему получаем
утверждение о том, что Джон находится в доме. Для того
чтобы выяснить, в чем состоит наша ошибка, мы вызываем
все имеющиеся утверждения о местонахождении Джона
(FIND ALL ?Х (X) (GOAL (AT JOHN ?X)))
* (STORE KITCHEN)
Первая строка записи означает требование найти все
значения переменной X в утверждениях вида (AT JOHN ?Х).
Просматривая наши утверждения, мы замечаем, что (AT
JOHN USA) в базе данных сейчас отсутствует. Еще раз
просмотрев LOC-CHANGE, мы догадываемся, что,
по-видимому, случилось. Вероятно, теорема нашла утверждение (AT
203
JOHN USA), уничтожила его и сочла свою работу
законченной. Чтобы исправить ошибку, мы должны переписать
LOC-CHANGE следующим образом.
(ANTE LOC-CHANGE
(OBJ NEWLOC OLDLOC)
(AT ?OBJ PNEWLOC)
A (THCOND ((THAND (GOAL (AT ?OBJ P+-OLD-
LOC))
(THNOT (EQAL POLDLOC
PNEWLOC))
(THNOT (GOAL (PART-OF POLD-
LOC PNEWLOC))))
(ERASE (AT POBJ POLDLOC))
(THGO A))
((THRETURN))))
THCOND, THNOT, THGO и THRETURN — это, грубо
говоря, аналоги функций LISP: COND, NOT, GO и
RETURN. (В реальном языке MICRO-PLANNER все названия
функций начинаются с ТН, однако мы отбросили эти буквы,
когда названия функций языков MICRO-PLANNER и LISP
не совпадали.) Функции MICRO-PLANNER отличаются
от функций LISP тем, что для первых возможен возврат.
Переменная ? *- OLDLOC сигнализирует, что следует
пренебречь старым значением OLDLOC и взять ее новое
значение. Для того чтобы проверить себя, читатель может
попытаться выяснить, что произойдет в следующем случае:
(ERASE (AT JOHN STORE))
(ASSERT (AT JOHN USA))
: Заметьте, что теорем мы не вызываем, поэтому
:не будет вызвана и теорема LOC-CHANGE.
(ASSERT (PART-OF STORE USA))
(ASSERT (AT JOHN STORE) THEOREMS)
Более сложным является вопрос о том, как должна
работать функция THCOND, чтобы избежать отказа в случае,
когда встречается требование уничтожить старое
местонахождение объекта.
203
PLANNER VS. LISP
В каких же отношениях PLANNER превосходит LISP
при выводе умозаключений?
Управление базой данных. Система SIR является
типичной с точки зрения построения базы данных на LISP'e,
однако функции ASSERT, GOAL и ERASE позволяют
значительно облегчить управление базой данных.
Средства для работы с образцами. MICRO-PLANNER
располагает простейшими средствами для работы с
образцами; так, мы можем вызывать образец из базы данных по
его части. В то же время, мы можем связывать переменные.
PLANNER, если этот язык когда-нибудь будет разработан,
должен обладать значительно более мощными средствами
для работы с образцами.
Вызов процедур по образцу. Теоремы могут быть
вызваны по их образцам. Это позволяет записывать функцию,
вызывающую другую функцию, даже когда неизвестно
название второй функции, а известно только ее назначение
(насколько мы можем его выразить в образце теоремы).
Автоматический режим возвратов. Это одна из спорных
черт языка PLANNER, однако использование
автоматического режима возвратов в разумных пределах
представляется полезным. Так, SHRDLU (программа, которая подробно
рассматривается в части I статьи Уилкса) использует
автоматический режим возвратов при решении таких вопросов,
как, например, нахождение "большого синего кубика".
Общая идея состоит в выполнении трех целевых условий:
первое требует, чтобы предмет был кубиком, второе —
чтобы его цвет был синим, третье — чтобы он имел
соответствующий размер. В этом случае разумно непосредственно
использовать режим возвратов, поскольку нет никаких
способов, позволяющих "догадаться", который из нескольких
предметов, например В1, В2 и ВЗ, обладает всеми
требуемыми свойствами. Критика режима возвратов сводится к тому,
что он благоприятствует созданию программ, в которых
слишком большая роль отводится слепому поиску. А это,
в свою очередь, приводит к опасности комбинаторного
взрыва. Подобная критика совершенно справедлива.
204
Действительно, можно считать ошибкой разработчиков
языка MICRO-PLANNER то, что при использовании этого языка
практически невозможно обойти режим возвратов. Однако
существуют случаи, когда поиск должен быть слепым, и
тогда автоматический режим возвратов оказывается
удобным.
PLANNER VS. ИППП
Язык PLANNER свободен от многих сложностей,
неизбежно встающих при использовании ИППП. В особенности
это касается следующих проблем.
Комбинаторный взрыв. И на языке PLANNER можно
написать программу, в которой система выводов приведет
к комбинаторному взрыву. Однако этот язык располагает
средствами, позволяющими его избежать. Основная идея
преодоления возможности комбинаторных взрывов является
ведущей для рассматриваемого языка, хотя в приведенных
выше примерах на MICRO-PLANNER она и не была
достаточно четко проиллюстрирована. Как мы видели, поиск в
базе данных можно осуществить с помощью функции GOAL,
например (GOAL (AT CAT МАТ)), а если мы хотим
использовать теоремы, то следует записать (GOAL (AT CAT MAT)
THEOREMS). Уже эти ограничения позволяют управлять
количеством операций, которые будут произведены при
поиске; но для этого существуют и другие возможности,
например: "использовать сначала ниженазванные теоремы...",
"использовать только теорему, имеющую следующее имя...",
"использовать сначала любую теорему со следующим
свойством...", "использовать только теоремы, обладающие
следующим свойством...". Это дает возможность включать
в программу информацию, которая позволит системе
производить нужные выводы без опасности комбинаторных
взрывов.
Проблема противоречий. Этой проблемы для языка
PLANNER не существует. Поскольку каждый
пользователь задает свои собственные теоремы, то он должен заранее
задать и теорему, предотвращающую возможность
возникновения противоречий в работе программы. Более того,
язык PLANNER защищен от одного "частичного
противоречия", которое то и дело встречается на практике. Нам хоте-
205
лось бы иметь утверждение о том, что у всех людей две
ноги, и при этом не заботиться о редких случаях, когда это
утверждение неверно. С другой стороны, если у Билла одна
нога, то нам хотелось бы располагать средствами для
фиксации этого факта. PLANNER позволяет сделать это с
помощью записи факта "Билл имеет одну ногу" в форме
утверждения, а факта "Все люди имеют две ноги" — в форме
теоремы. Поскольку при выполнении функции GOAL база
данных просматривается первой, утверждение о Билле
будет найдено до того, как программа попытается применить
к нему общую теорему.
Вывод, управляемый данными, vs. вывод, управляемый
целями (data vs. question driven inference). В ИППП трудно
осуществлять вывод, управляемый данными, но для
PLANNER такая проблема не встает. Именно такой вывод
производят антецедентные теоремы.
ответ на пять вопросов
И наконец, посмотрим, как отвечает PLANNER на те
пять вопросов, которые были сформулированы в начале
настоящей работы.
1. СЕМАНТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ. В
сущности, нет ответа. PLANNER не
накладывает никаких ограничений на форму утверждений.
Конечно, некоторые сведения следует задавать в
форме теорем, и к теоремам предъявляется некоторое
требование, а именно о том, что они должны быть
записаны на языке PLANNER, но это вряд ли
можно считать ограничением.
2. ПРИМЕНЕНИЕ УМОЗАКЛЮЧЕНИЙ. Опять очень
мало. Как мы видели, одним из достоинств
PLANNER является то, что этот язык не накладывает в
этом отношении тех ограничений, что ИППП.
3. ОРГАНИЗАЦИЯ. В этом отношении PLANNER
дает ответ, хотя и не вполне определенный.
PLANNER предлагает несколько рекомендаций по
организации информации. Первая — вызов
процедур по образцу. Вторая — наличие средств
для выбора нужной теоремы при решении
конкретной задачи или при поступлении новой информации.
206
Однако следует помнить, что PLANNER является
языком программирования, поэтому его можно
использовать и для работы с другой организацией
памяти. Тем не менее было бы справедливо подвергнуть
PLANNER критике в том случае, если бы
задаваемая им организация информации не соответствовала
наилучшим способом решению рассматриваемых
нами задач. Как я покажу во второй своей статье,
есть основания полагать, что именно так и обстоит
дело с языком PLANNER.
4. МЕХАНИЗМ ВЫВОДА УМОЗАКЛЮЧЕНИЙ. Как
и ИППП, PLANNER является прежде всего теорией
механизма вывода умозаключений. Если имеется
теорема на языке PLANNER, то об ее использовании
и работе в качестве программы можно не
беспокоиться.
5. СОДЕРЖАНИЕ. Снова нет ответа.
ЛИТЕРАТУРА
Green, С. С. Application of Theorem Proving to Problem
Solving.-— In: Walker and Norton (eds.). Proceedings of the
International Joint Conference on Artificial Intelligence, 1969, pp. 219—240.
Raphael, B. SIR: A Computer Program for Semantic Information
Retrieval.—In: "Semantic Information Processing" (ed. by Minsky).
Cambridge, Mass., MIT Press, 1968, pp. 33—145.
Sussman G., Winograd, T. and Charniak, E. Micro-
Planner Reference Manual.— In: "Memoranda from the Artificial
Intelligence Laboratory", 203A. Cambridge, Mass., MIT, 1971.
Й. Уилкс
АНАЛИЗ ПРЕДЛОЖЕНИЙ
АНГЛИЙСКОГО ЯЗЫКА
(ЧАСТЬ I)*
Ряд современных лингвистических работ предлагает
разные формальные структуры для представления
отдельных предложений или совокупностей предложений
естественного языка: трансформационные выводы, исчисление
предикатов, деревья порождающей семантики и т. п.
[ср. статьи Чарняка и Скрэгга в настоящем сборнике].
Если мы располагаем структурой для представления
фрагмента текста (будь то синтаксическая, семантическая
или какая-либо иная структура), то можно различать
собственно структуру и ее соотношение с фрагментами текста.
Среди таких соотношений можно разграничивать анализ
(parsing) и приписывание (assignment). Под анализом **
мы понимаем вполне определенный комплекс прикладных
процедур перехода от фрагмента текста к его структуре, а
под приписыванием — выработку списка соответствий
между фрагментами текста и формальными структурами.
Логики часто делают утверждения такого рода: структура
предложения John loves his wife's sister, 'Джон любит сестру
своей жены', имеет следующий вид:.
EXISTS (X) EXISTS (Y) EXISTS (Z) (X = JOHN AND
Y - WIFE (X) AND Z = SISTER (Y) AND LOVES (X, Z))
'СУЩЕСТВУЕТ (X) СУЩЕСТВУЕТ (Y) СУЩЕСТВУЕТ
(Z) (X = ДЖОН И Y = ЖЕНА (X) И Z = СЕСТРА (Y)
И ЛЮБИТ (X, Z))',
* Yorick Wilks. Parsing English, I.—In: Charniak, E. and
Wilks, Y. (eds). Computational Semantics. Amsterdam etc., 1978,
p. 89—100.
© North-Holland Publishing Company (1976).
** Русским терминам анализировать, анализ в вычислительной
лингвистике США соответствуют обычно слова parse, parsing.— Прим,
ред.
208
но они обычно не описывают процесса перехода от исходного
предложения к его структуре, считая эту процедуру либо
очевидной, либо выходящей за рамки их компетенции.
Именно выработку списка соответствий между
предложениями естественного языка и формальными структурами я и
называю приписыванием.
Теперь остановимся на вопросе о том, каковы
отличительные черты анализа. Рассмотрим структуру, задаваемую
одной из простейших грамматик — контекстно свободной
грамматикой непосредственных составляющих *. Такая
грамматика может включать, например, следующие
правила:
S —> NP VP
NP —> Determiner Noun
VP —> Verb NP
Determiner —> The, the
Noun —> dog, cat
Verb —> likes
Предложение: The dog likes the cat
'Собака любит кошку'.
Считается, что предложение The dog likes the cat
порождено перечисленными выше правилами подстановки данной
грамматики. Грамматика мыслится как устройство, неявным
образом определяющее следующую процедуру: в качестве
исходного берется символ S (левая часть первого правила),
затем он заменяется правой частью этого правила, что дает
новые символы, в свою очередь заменяемые по другим
правилам (при этом одно и то же правило может быть
применено более одного раза — с соблюдением условия, что
при применении каждого правила заменяется только один
символ). Порождение предложения обычно представляется
в виде дерева непосредственных составляющих,
изображенного ниже (называемого также НС-структурой
предложения), в котором каждое ветвление из произвольного узла
соответствует применению одного из указанных правил
подстановки (в соответствии с только что описанной проце-
* С грамматиками структуры непосредственных составляющих
читатель может познакомиться, например, по книге: Лайонз, Дж.
Введение в теоретическую лингвистику. М., 1978, с. 223 и сл. Укажем
принятые в таких грамматиках значения символов: S — символ
предложения, NP — именная группа, VP — глагольная группа, Noun —
существительное, Verb — глагол, Determiner — детерминатив.— Прим. ред.
209
дурой). В конечном счете получаются символы,
совпадающие с реальными английскими словами, и процесс
останавливается в тот момент, когда каждый конечный символ
является английским словом.
NP
Determiner Noun Verb ^ NP
\
Determiner Noun
I I
The dog likes the cat
Можно считать, что это дерево отражает определенные
синтаксические отношения между словами предложения. Так,
в данной структуре артикль "The" присоединяется к слову
"dog" в результате применения правила "NP —> Determiner
Noun", и отношение артикля "The" к "dog" есть зависимость
детерминатива от существительного, которое он определяет.
Однако описанный выше процесс порождения можно будет
квалифицировать как процесс анализа только в том случае,
если, в силу стечения обстоятельств, порожденное нами
предложение совпадет с тем предложением, которое мы
хотим подвергнуть анализу.
Те исследователи, которые выступают за использование
грамматик непосредственных составляющих в качестве
инструмента анализа, хотели бы иметь на входе анализа
предложение, а на выходе — древесную структуру указанного
выше типа. Посмотрим, каким образом это можно было бы
осуществить.
Для целей анализа по непосредственным составляющим
мы относим каждое слово анализируемого предложения к
одной или нескольким грамматическим категориям; в
рассмотренном выше предложении, как видно из правил, слово
"dog" отнесено к одной категории — Noun.
Существует два способа осуществления анализа: сверху
вниз и снизу вверх. Анализ снизу вверх — это более
прямой способ; он иллюстрируется ниже. Слова в предложении
рассматриваются слева направо, и, начиная с самого левого
слова предложения, мы пытаемся заменить каждое слово
его категорией, а затем заменять последовательно пары
категориальных символов посредством обращенных правил поф-
319
становки данной грамматики — до тех пор, пока мы не
дойдем до символа предложения S. Совокупность строк
полученного таким образом вывода (фактически
перевернутого дерева, изображенного выше) может рассматриваться как
синтаксический анализ предложения:
The dog likes the cat
Determiner dog likes the cat
Determiner Noun likes the cat
NP likes the cat
NP Verb the cat
NP Verb Determiner cat
NP Verb Determiner Noun
NP Verb NP
NP VP
S
Анализ сверху вниз начинает работу не со слов и их
категорий, а просто с символа S, который преобразуется по
описанным выше правилам. Осуществляя поиск (looking
for) категорий в левой части правил, процедура порождает
последовательные цепочки категорий, пока не доходит до
категории, непосредственно соответствующей самому
левому слову предложения — артиклю "The". Далее процедура
продолжается так, как показано на нижеследующей схеме,
до тех пор, пока она не доходит до самого правого слова
предложения; в этом случае строки данной схемы также
составляют анализ предложения.
Looking for:
Looking for:
Looking for:
Noun VP
Looking for:
Looking for:
Looking for:
Looking for:
Looking for:
Noun
Looking for:
Looking for:
S
NP|VP
Determiner|
Noun|VP
VP
Verb|NP
NP
Determiner|
Noun
the dog likes the cat
the dog likes the cat
the dog likes the cat
the|dog likes the cat
the dog|likes the cat
the dogjlikes the cat
the cat
the cat
the dog likes
the dog likes
the dog likes the|cat
the dog likes the cat|
Два указанные выше вывода (снизу вверх и сверху вниз)
формально эквивалентны. Знак | (вертикальная черта) в
изображенной выше схеме отмечает границу между проана-
211
лизированной и непроанализированной частями
предложения на соответствующем шаге анализа.
Здесь следует сделать ряд замечаний. Анализ вовсе не
обязан идти в направлении слева направо: он вполне может
идти и в противоположном направлении. Структура
предложения редко бывает столь тривиальной, как
рассмотренная выше, и обычно слову в словаре приписано несколько
допустимых категорий; тогда одна из задач процесса
анализа состоит в установлении того, какая из этих ролей слова
реализуется в конкретном предложении. Так, слово "run"
имеет категорию "Verb" в предложении I run for a bus.
'Я бегу на автобус' и категорию "Noun" в предложении I
built a new chicken run. 'Я построил новую клетку для
цыплят.' (run в данном значении — 'загон, клетка').
Таким образом, если бы мы обратились к любой из
описанных выше процедур для анализа предложения I run for а
bus, мы получили бы в результате правильную структуру:
s
/\
NP VP
N VP рр
|| / \
V Р NP
I I / \
I I I I
I run for the bus
и не получили бы структуры, в которой слову run
приписана категория "N" (Noun), поскольку не существует такой
правильной последовательности применений правил
грамматики, которая порождала бы дерево данного предложения
с узлом N, подчиняющим слово run. Иначе говоря,
существует правило:
VP -+ V (и далее V —> run),
но нет правила:
VP -*• N (и далее N -> run).
Тем самым, одно из значений слова run исключается в
процессе анализа данного предложения.
Здесь уместно ввести следующие важные специальные
термины: анализ "в ширину" (breadth-first) и анализ "в глу-
212
бину" (depth-first). Анализ "в ширину"— это параллельная
обработка всех возможных альтернативных структур в одно
и то же время, причем никакой из них не отдается
предпочтения. Все эти структуры обрабатываются одновременно до
тех пор, пока одна из них (или несколько) не преобразуется
в символ S (если анализ идет в направлении снизу вверх).
При анализе "в глубину" альтернативные структуры
обрабатываются последовательно, и если некоторая цепочка
символов не допускает дальнейшего свертывания
(поскольку в данной грамматике к данной цепочке неприменимо
никакое правило подстановки, даже если анализ еще не
завершен), тогда система должна вернуться назад к одной из
альтернативных структур, еще не подвергшихся обработке.
Так, например, если бы слову run была приписана
категория N в приведенном выше предложении, то, при анализе
снизу вверх, сочетание I run было бы заменено цепочкой
NN, но в той грамматике, которой мы располагаем, нет
правила преобразования цепочки NN во что-либо другое.
Именно обнаружение этого факта обусловливает возврат и
приписывание слову run категории V (вместо N).
В случае трансформационных структур особенно
наглядно видно, что исходное предложение часто
анализируется таким образом, что в результате порождается структура,
сильно отличающаяся от исходного вида предложения.
Обратимся к классическому примеру: пассивное предложение
типа I was given the money last week. букв. 'Я был дан
деньги на прошлой неделе.' может получить синтаксическую
структуру, которая имеет приблизительно следующий вид
(отражающий порядок следования ее основных
составляющих): Someone gave me the money last week. 'Кто-то дал мне
деньги на прошлой неделе.' Это позволяет утверждать, что
анализ может порождать структуру, совершенно не
похожую по своей внешней форме на входное предложение.
Программы грамматического анализа трансформационного типа
получили широкое распространение в 60-х годах, но здесь
они подробно не рассматриваются; мы ограничились лишь
введением основных понятий. Это связано с одной из
предпосылок настоящей работы, согласно которой
грамматический (или синтаксический) анализ описанного типа не
является фундаментальным, и он не обязателен даже как
предварительный этап при построении семантической структуры
предложения. Мы вернемся к рассмотрению этого вопроса
ниже, в связи с другими проблемами.
213
Таким образом, анализ представлен здесь в весьма
общем виде, и мы не обсуждаем вопроса о том, являются ли
те или иные структуры интересными, то есть заслуживают
ли они того, чтобы быть приписанными фразам
естественного языка. Более того, структуры определенных типов,
например логические структуры, имеют самостоятельный
статус независимо от того, получены ли они в результате
анализа каких-либо предложений естественного языка.
Здесь уместно ввести еще одно противопоставление, важное
для последующего изложения. Это противопоставление
касается систем ИИ, оперирующих с естественным языком;
оно выделяет среди них структурно мотивированные и
содержательно мотивированные системы. В нашем
изложении мы не будем относить те или иные системы к одному из
двух типов, поскольку между этими типами существует
множество неопределенных промежуточных случаев, но
читателю все же следует помнить об указанном
противопоставлении при рассмотрении систем ИИ.
Структурно мотивированными мы будем называть такие
системы, которые, независимо от их потенций по обработке
естественного языка, направлены на решение
преимущественно нелингвистических задач и сосредоточены на
соотношении между применяемой в данной системе
репрезентацией структур и структурами другого рода (в том числе
языковыми). Иначе говоря, структурно мотивированные
системы — это такие системы, которые ориентированы на
решение достаточно узких нелингвистических задач и которые
извлекают из входных текстов на естественном языке лишь
ограниченную информацию, релевантную для данной
задачи.
К системам такого типа принадлежит система Боброва
STUDENT, предназначенная для решения элементарных
алгебраических задач (см. Bobrow, 1968; сама система
была разработана в 1964 г.). Действительно, STUDENT
обрабатывает входные тексты на ограниченном
естественном языке, но в этих текстах система реагирует только на
наименование некоторых алгебраических отношений, таких,
как the sum of 'сумма', и т. д. Данная система обладает и
другим свойством структурно мотивированных систем,
состоящим в том, что получаемые в результате анализа
структуры отражают скорее соотношение объектов внутри
предметной области, чем то содержание, которое может выражать
текст на естественном языке. Так, STUDENT использует
214
в качестве "семантического представления" линейные
уравнения, поскольку они наиболее удобны при решении
алгебраических задач. Аналогичным образом можно утверждать,
что использование во многих ранних системах
представлений на языке исчисления предикатов объясняется прежде
всего пригодностью этого языка для решения простых
логических задач, на которые были ориентированы
соответствующие системы, а не его способностью передавать
содержание языковых высказываний.
В строгом смысле проблема понимания естественного
языка сводится к представлению содержания. Именно эта
проблема является центральной в работах по автоматизации
анализа текстов на естественном языке со времени начала
этих работ (50-е годы), и ядро этой проблемы составляет
вопрос о системной неоднозначности. Короткий
критический экскурс в историю, возможно, прояснит существо
дела. В "эру машинного перевода" 50-х и начала 60-х годов
предпринимались смелые попытки осуществить
труднейшую задачу — автоматизировать извлечение содержания
высказываний на естественном языке. Эти попытки
закончились неудачей по трем основным причинам:
неоднозначность слов (омонимия и полисемия), структурная
неоднозначность предложений (мы рассмотрим только
неоднозначность глубинных падежей на примере неоднозначности
предлогов) и референционная неоднозначность
(неоднозначность местоимений). Средства разрешения
неоднозначности указанных типов не удалось разработать и
реализовать даже для текстов, лишенных метафоричности.
Возникновение генеративной лингвистики отчасти обусловлено
именно неудачей этих попыток: она предложила сложные
структуры для лингвистического анализа, однако утратила
ориентацию на решение какой-либо определенной задачи;
одним из недавних свидетельств этой утраты направляющей
нити исследования явился окончательный отход от
ориентации на анализ и переход к учению о том, что истинной
структурой языка является его логическая структура.
Итак, мы подошли к области ИИ, характеризующейся
возвращением к ориентации на решение определенных
задач и разработку определенных процедур, а также
медленным, но верным отступлением от структурно
мотивированного подхода. Самые ранние работы в рамках ИИ
характеризовались высокой структурной мотивированностью:
многие ведущие исследователи в ИИ считали очевидной аксио-
215
мой, что базисной формой представления текстов на
естественном языке является исчисление предикатов. Их
интересовало в основном доказательство теорем посредством
вывода одной формулы исчисления предикатов из другой; при
таком подходе "проблема естественного языка" даже не
вставала, поскольку три упомянутых выше случая языковой
неоднозначности ими просто игнорировались.
По-видимому, они действительно считали естественный язык проекцией
некоторой исходной логической схемы. Постепенно
реальное положение дел стало давать о себе знать. Недавно
Терри Виноград (Winograd, 1973) в обзоре систем ИИ,
работающих с естественным языком, провел разграничение
между системами "первого" и "второго" поколения, а свою
собственную систему (см. о ней ниже) скромно отнес к
концу первого поколения. Мы не будем рассматривать это
разграничение; отметим только, что системы, отнесенные
Виноградом к первому поколению, практически совпадают с
системами, которые характеризовались выше как
структурно мотивированные.
СИСТЕМА ПОНИМАНИЯ ЕСТЕСТВЕННОГО ЯЗЫКА ВИНОГРАДА
Чтобы лучше понять некоторые из затронутых выше
проблем, вероятно, удобнее всего начать с рассмотрения
системы самого Винограда. Его система работает в режиме
письменного диалога на дисплее между
человеком-оператором и самой системой, называемой SHRDLU, в реальном
масштабе времени. На дисплей система выводит и картину
своего ограниченного мира, состоящего из цветных
параллелепипедов и пирамид, ящика, в котором они могут быть
размещены, и "руки" (рычага), которая может передвигать
объекты данного мира.
Ниже предлагается образец диалога, приводимый в
книге Винограда. Ответы системы SHRDLU даются
прописными буквами:
pick up the big red block 'подними большой
красный параллелепипед'
OK 'Хорошо'.
find a block which is taller than the one you are.
holding and put it into the box
'найди параллелепипед, который выше того, который
ты держишь, и положи его в ящик'.
216
BY "IT", I ASSUME YOU MEAN THE BLOCK
WHICH IS TALLER THAN THE ONE I AM HOLDING
OK
>r<
"Мир" системы Винограда
'Под словом IT, как я полагаю, вы понимаете
параллелепипед, который выше того, который я держу' 'Хорошо'
What does the box contain?
'Что содержит ящик?'
THE BLUE PYRAMID AND THE BLUE BLOCK
'Синюю пирамиду и синий параллелепипед'
Had you touched any pyramid before you put the green
one on the little cube?
'Касался ли ты какой-либо пирамиды до того, как ты
поставил зеленую пирамиду на маленький кубик?'
YES, THE GREEN ONE
'Да, зеленой пирамиды'
When did you pick it up?
'Когда ты ее поднял?'
WHILE I WAS STACKING UP THE RED CUBE,
A LARGE RED BLOCK AND A LARGE GREEN CUBE
'Когда я ставил один на другой красный кубик,
большой красный параллелепипед и большой зеленый кубик'
217
why?
'зачем?'
TO GET RID OF IT
'чтобы убрать ее'
Эта оригинальная программа способна также (в
ограниченном объеме) воспринимать новые определения слов,
например слова steeple 'башня'; использовать свои знания о
свойствах описываемых объектов, например, то, что на
верхней поверхности параллелепипеда может находиться
некий объект и его можно оттуда снять, а на пирамиде —
не может; а также запоминать свои действия, как было
видно в приведенном выше примере диалога.
Программа синтаксического анализа была написана на
языке PROGRAMMAR — языке процедур, близком к
языку PLANNER. Это означает, что знакомое нам НС-правило
типа
S *NP + VP
(интерпретируемое следующим образом: предложение
состоит из именной группы и следующей за ней глагольной
группы) будет выражено так:
(PDEFINE SENTENCE
(((PARSE NP) NIL FAIL)
((PARSE VP) FAIL FAIL RETURN)))
Мы не будем останавливаться на деталях данной
системы записи; отметим только одно важное свойство
грамматики Винограда, состоящее в том, что она представляет собой
не условный список правил, а набор небольших
подпрограмм (типа указанной выше), которые действительно
задают процедуры для выработки нужной грамматической
структуры.
В лингвистических процедурах синтаксического уровня
рассматриваемой системы используется "системная
грамматика" М. А. К. Холлидея (Halliday, 1970), с помощью
которой входной фразе ставится в соответствие структура,
задающая иерархию вхождений в эту фразу составляющих
простых предложений (clauses). Входные фразы
составляются на материале словаря, насчитывающего
приблизительно 175 слов.
Если обратиться к введенным выше понятиям, то
синтаксический анализ Винограда можно охарактеризовать
как направленный сверху вниз, ориентированный "в глуби-
218
ну", без автоматических возвратов. Любой стандартной
прогр амме, соответствующей гр амматической категории,
отвечает функциональное определение на языке PROGRAM-
MAR, которое может быть сформулировано либо так, как
это сделано выше для SENTENCE, либо в виде блок-схемы,
как это показано ниже для категории VP:
ОПРЕДЕЛЕНИЕ программы VP
Приведем комментарий Винограда к началу работы
процедуры анализа сверху вниз для предложения Pick up a red
block. 'Подними красный параллелепипед.' (в квадратные
скобки заключены мои пояснения):
«Программа CLAUSE берет первое слово предложения,
чтобы определить, с какой единицы начинается предложе-
219
ние. Если это наречие, то программа предполагает, что
предложение начинается с однословного модификатора
[например: Slowly, Jack lifted the book. 'Медленно Джек
поднял книгу.']; если это предлог, она ищет начальную
предложную группу PREPG [например: On the top of the
hill stood a tree. 'На вершине холма росло дерево.']. Если
это подчинительный союз (BINDER), программа вызывает
программу для поиска придаточного предложения (BOUND
CLAUSE) [например: Before you got there, we left. 'До того,
как вы пришли туда, мы ушли.']. В английском языке
(невероятно, во всех языках) первое слово конструкции
хорошо прогнозирует ее тип. В данном случае первое
слово предложения pick — это глагол, оно указывает, что
здесь возможно повелительное предложение (IMPERATIVE
CLAUSE). Программа вызывает программу обработки
глагольных групп (VG) и подает на ее вход исходный набор
признаков: VG IMPER. Программа обработки VG ищет
группу с данными признаками. Такая группа может
начинаться либо с формы вспомогательного глагола do [Do not
call me! 'He зови меня!'], либо со смыслового глагола [Call
me! 'Позови меня!']. Если предложение начинается не с
формы глагола do, программа проверяет, не является ли
следующее (а в нашем примере — первое слово) формой
инфинитива. Если это так, то слово вводится в
синтаксическое дерево и получает дополнительный признак MVB (main
verb — смысловой глагол). Полученная к этому моменту
структура может быть схематически изображена так:
(CLAUSE MAJOR)
(VG IMPER)
(VB MVB INF TRANS VPRT) pick
Символы TRANS и VPRT были получены из словарного
определения глагола pick по функции PARSE».
После завершения синтаксического анализа ряд
программ, называемых "семантическими специалистами",
приписывает полученным синтаксическим структурам
семантические структуры. Так, для словосочетания a red cube
'красный кубик' семантический специалист по именным
группам (NP) строит следующую структуру:
(GOAL (IS ?Х BLOCK))
(GOAL (COLOR ?X RED))
220
(EQDIM ?X) описание на языке PLANNER
(BLOCK MANIP PHYSOB THING) признаки
'(ПАРАЛЛЕЛЕПИПЕД ПОДВИЖНЫЙ ФИЗ. ОБЪЕКТ
ВЕЩЬ)'.
Первые три строки — это основа программы на языке
MICRO-PLANNER; эта часть программы после
надлежащей проверки будет искать объект X, который является
параллелепипедом (BLOCK) с равными гранями (EQDIM)
и имеет красный цвет (RED) (само прилагательное red
'красный' определено в системе таким образом, что оно
может соединяться только с существительными, которым
приписан признак PHYSOB 'физ. объект'). Последние
две строки представляют набор семантических признаков,
получаемых из приведенного ниже "дерева признаков" при
движении по строке справа налево * (см. с. 222).
Дедуктивный компонент системы до того, как
осуществить определенное действие (например, поднятие объекта),
проверяет семантическую структуру некоторых
словосочетаний (в частности, именной группы the red cube 'красный
кубик') с целью выяснения возможности существования
объекта, описываемого этим словосочетанием. Если такого
объекта не существует (например, не существует объекта,
соответствующего словосочетанию equidimensional pyramid
'пирамида с равными гранями'), система может вернуться
назад и попытаться проанализировать предложение иначе.
Смысл глаголов в SHRDLU задается более сложным
образом. Семантический компонент обращается к определению
(или толкованию) глагола (например, глагола pick up), как
и в случае семантического анализа прилагательных (red) ;и
существительных (cube), и строит с помощью этого
определения соответствующую подпрограмму на языке MICRO-
PLANNER, аналогично тому, как это делается для именных
групп.
Однако здесь встречаются два затруднения. Во-первых,
pick up, в отличие от red, определяется посредством других
понятий системы, а именно — GRASP 'брать' и RAISE-
HAND 'поднимать руку', являющихся двумя основными
* С проблематикой "деревьев семантических признаков" читатель
может познакомиться по работам Дж. Катца, У. Вейнрейха, Д. Болин-
джера в сборнике: "Новое в зарубежной лингвистике", вып. X
(Лингвистическая семантика). М., 1981.— Прим. ред,
221
Дерево признаков
действиями в системе (из трех возможных). Во-вторых,
существуют два типа определений глаголов — семантические
и логико-функциональные (inferential). Виноград не дает
семантического определения для pick up, но для близкого
222
по смыслу глагола — grasp — такое определение имеется.
Определение глагола grasp
(CMEANS ((((ANIMATE)) ((MANIP)))
(EVAL (COND ((PROGRESSIVE)
(QUOTE (GRASPING 2 *TIME)))
(T (QUOTE (GRASP 2 *TIME)))))
NIL))
Основная информация этого определения сводится к
тому, что действие grasp осуществляется неким одушевленным
существом (ANIMATE) над каким-либо подвижным
объектом (MANIP) — ср. первую строку. В
логико-функциональных определениях действий такого рода их реальное
содержание передается более четко. Ниже приводится
логико-функциональное определение действия pick up;
(CONSE ТС — PICKUP
(X)
(PICKUP ?X)
(GOAL (GRASP ?X) THEOREMS)
(GOAL (RAISEHAND) THEOREMS))
Приведенное определение позволяет программе реально
выполнить команду "pick up", если это в данном случае
вообще возможно в моделируемом мире (так, нельзя было
бы поднять красный параллелепипед, если бы на нем был
уже расположен другой параллелепипед). PICKUP
определяется в терминах других, более простых поддействий,
таких, как GRASP и RAISEHAND, каждое из которых
должно быть выполнено для того, чтобы некоторая вещь
могла быть действительно поднята. Сами эти поддействия
также имеют логико-функциональные определения:
например, логико-функциональное определение для GRASP
несколько отлично от его семантического определения
(CMEANS), приведенного выше, хотя в некотором
отношении можно считать, что логико-функциональные
определения, как и программы, реально выполняющие
соответствующие команды, тоже задают смысл глаголов.
Одной из причин огромной популярности системы
Винограда является то, что до этого работы в области ИИ не
представляли лингвистического интереса, а в построениях
лингвистов не рассматривались вопросы представления зна-
223
ний и вывода умозаключений. Поэтому даже ограниченное
объединение двух указанных методов позволило достичь
значительных результатов. До работ Винограда лишь
несколько программ в области ИИ могли обрабатывать
достаточно сложные английские предложения и
приписывать им синтаксические структуры. В ранних
"классических" системах ИИ, направленных на "понимание
естественного языка", таких, как система Боброва STUDENT
(1968 г.), которая решала простые алгебраические задачи,
входные предложения резко ограничивались в длине и
имели стереотипный вид, например: What is the sum of...?
'Какова сумма...?'.
Что же касается лингвистики, то в ней до недавнего
времени очень мало внимания уделялось тому, как мы
устанавливаем кореферентные связи в таких простых фразах, как
The soldiers fired at the women and I saw several fall.
'Солдаты открыли огонь по женщинам, и я видел, как некоторые
упали.' В этом примере антецедент several (women, но не
soldiers) устанавливается с полной определенностью, но
для этого необходим ряд умозаключений, относящихся к
положению дел в реальном мире. Читатель может спросить
себя, каким образом он сам установил референт several
в этой фразе.
ОБСУЖДЕНИЕ СИСТЕМЫ SHRDLU
До сих пор мы почти не высказывали критических
замечаний в адрес системы Винограда. Что же в этой системе
может подвергнуться критике? Во-первых, в
лингвистическом отношении она крайне консервативна, и принятое в ней
подразделение аппарата на три части — синтаксис,
семантику и дедукцию — скорее всего, вообще не является
необходимым. Системы, в которых данное разграничение не
проводится, будут рассмотрены ниже (о системе Шенка см.
статьи Г. Скрэгга и Ю. Чарняка в наст. сб.). Во-вторых,
вызывает возражение тот факт, что семантика Винограда
"привязана" к простому миру геометрических фигур, в
связи с чем невозможно ее распространение на произвольную,
более общую ситуацию реального мира. Допустим, что
слову block, помимо значения 'параллелепипед',
приписаны еще два значения: 'обструкция' и 'нервное торможение'.
Сомнительно, что признаки и правила Винограда смогут
выразить смысл этих новых значений, а также то, что простые
224
структуры, используемые в его системе, способны
правильно разрешить неоднозначность (а этот вопрос еще более
важен, чем первый) для любого контекста, в котором
употреблено слово. Далее, для разрешения глубинно-падежной
неоднозначности, например неоднозначности предлога in
во фразах Не ran the mile in five minutes. 'Он пробежал
милю за пять минут.' и Не ran the mile in a paper bag. 'Он
пробежал милю в бумажном мешке.' требуются гораздо более
сложные структуры, чем те, которые предлагает Виноград.
То же самое верно и относительно комбинации глубинно-
падежной и лексической неоднозначности; ср. Не put the
key in the lock (door lock). 'Он вставил ключ в замок.' и Не
threw the key in the lock (river lock). 'Он бросил ключ в
шлюз.'
В мире геометрических фигур действуют жесткие
дедуктивные схемы умозаключений, и он логически замкнут.
Если ввести в него законы тяготения, то любой предмет,
имеющий опору, будучи тем или иным образом сдвинут с
этой опоры, неминуемо упадет. Однако мир здравого
смысла, стоящий за обычным текстом на естественном языке,
устроен совсем не так: если снова обратиться к примеру о
солдатах, стрелявших в женщин (см. стр. 224), то можно
сказать, что референционная неоднозначность several
разрешается здесь на основе некоторого обобщения типа
"Объекты, поражаемые посредством выстрелов, имеют
тенденцию падать". Здесь нет никакого жесткого, логически
обусловленного долженствования, хотя установление
кореферентной связи представляется совершенно очевидным.
На самом деле, в некотором смысле можно утверждать,
что семантика системы Винограда ориентирована не на
естественный язык, а на специальный вопрос о том, как
должны быть организованы "цель и подцель" в системе решения
задач, способной манипулировать простыми физическими
объектами. Если вернуться к приведенному выше
определению pick up (стр. 223), то нетрудно заметить, что оно на
самом деле задает процедуру поднятия объекта в системе
SHRDLU. Ничто в этом определении не поможет читателю
понять, например, самую обычную правильную фразу I
picked up my bags from the platform and ran for the train.
'Я схватил свой багаж с платформы и побежал за поездом.',
не говоря уже о любой фразе, в которой речь идет о
физическом действии, недоступном для адресата. Это можно
объяснить следующим образом: определение на языке PLAN-
8 № 691
225
NER описывает отнюдь не смысл выражения pick up, оно
задает случай употребления этого выражения примерно
так же, как задает другой случай его употребления фраза:
John picked up the volunteer from the audience by leaning
over the edge of the stage and drawing her by means of a
rope clenched in his teeth. 'Джон вытащил
женщину-добровольца из публики, наклонившись над краем сцены и
вытянув ее с помощью веревки, зажатой у него в зубах'.
В данной статье не обсуждается (если не считать
настоящего упоминания) превосходная, широко известная работа
У. Вудса (Woods, 1972). Его система, базирующаяся на
грамматике, которую он называет "грамматикой
расширенных сетей перехода" (augmented state transition network
grammar), является, несомненно, одной из самых мощных в
плане реального использования, поскольку она менее
чувствительна к конкретным особенностям входных вопросов,
чем сравнимые с ней системы. Причина того, что мы не
рассматриваем систему Вудса подробно, состоит в том, что и
Вудс, и Виноград в своих публикациях признали, что их
системы в сущности эквивалентны (Winograd, 1971;
Woods, 1973). А если это так, то нет необходимости
рассматривать обе системы и можно ограничиться системой
Винограда, которая более известна (по крайней мере, среди
специалистов по ИИ).
Доводы в пользу эквивалентности этих двух систем, по
всей видимости, справедливы: обе они являются
дедуктивными системами, базирующимися на определенного вида
грамматиках, и обе они работают в диалоговом режиме
в рамках строго ограниченной предметной области.
Принципы применения грамматики, записанной на языке
PROGRAMMAR, о которых в разных местах упоминает
ВиноГрад, по его собственному мнению, формально эквивалентны
соответствующим инструментам грамматики расширенных
сетей переходов и, в особенности, порядку выбора узлов в
сети Вудса.
Без обращения к высоким материям, с точки зрения
простого здравого смысла утверждение об эквивалентности
систем Вудса и Винограда не кажется бесспорным.
Рассмотрим следующие три утверждения:
(1) Система Вудса является в некотором смысле
машинной реализацией трансформационной
грамматики.
226
(2) Работа Винограда показала несостоятельность
трансформационной грамматики для анализа
естественного языка (этот взгляд неоднократно
высказывался в рецензиях на его работу).
(3) Системы Вудса и Винограда формально
эквивалентны (это мнение высказали оба исследователя).
Между этими тремя широко распространенными
положениями существует противоречие. Вероятно, все упирается
в определение того, в каком именно отношении система
Вудса эквивалентна трансформационной грамматике. Мы
не собираемся отвечать на этот вопрос, однако его следует
хотя бы поставить, прежде чем перейти к рассмотрению
тем, составляющих предмет второй моей статьи,
следующей ниже.
ЛИТЕРАТУРА
Halliday, M. А. К. Functional Diversity în Language.—
«Foundations of Language», No. 6, 1970, pp. 322—361.
Winograd, T. Procedures as a Representation for Data in a
Computer Program for Understanding Natural Language (Докторская
диссертация). Cambridge, Mass., MIT, 1971.
Winograd, T. A Survey on Natural Language.— In: «Advanced
papers for the Third International Joint Conference in Artificial
Intelligence», USA, Stanford, 1973 (SRI, Menlo Park, 1973).
Woods, W. А., Kaplan, R. M. and Nash - Webber, B.
The Lunar Sciences Natural Language Information System. Final Report.
(BBN Report 2378—Bolt, Boranek and Newman), Cambridge, Mass., 1972.
8»
Г. Скрэгг
СЕМАНТИЧЕСКИЕ СЕТИ
КАК МОДЕЛИ ПАМЯТИ*
ВВЕДЕНИЕ
В статьях Чарняка и Уилкса показано, что в процессе
понимания языка возникает потребность в знаниях о мире.
Значит, должен применяться какой-то способ представления
этих знаний. Проблемы разработки структур для
представления знаний мы называем проблемами памяти. Однако,
обсуждая вопрос о том, как информацию записывать,
необходимо рассмотреть и вопрос о том, как ее искать:
нельзя отрывать структуру от функции. Мы называем эти два
аспекта соответственно пассивным и активным аспектами
памяти, и в ходе нашего обсуждения они будут
переплетаться.
Понятие "памяти" используется представителями
смежных дисциплин нередко в ином смысле, чем в настоящей
работе. Что мы имеем в виду, когда говорим о памяти,
станет понятно, если мы сначала исключим некоторые ее
трактовки, далекие от нашей задачи. Разумеется, мы не
говорим здесь об обычном для вычислительной техники
определении памяти как места, где хранится
информация в вычислительной машине. Мы не говорим также об
определении, характерном для "человека с улицы", для
которого память эквивалентна способности помнить. В ином
плане, с точки зрения психологии, мы не будем обсуждать
различные гипотетически постулируемые виды "памяти", а
будем употреблять термин "память" в ограниченном смысле,
применительно к представлениям, хранящимся в
долговременной памяти, включая в данное понятие и процессы
(нижнего уровня), которые обеспечивают доступ к
информации, записанной в этих представлениях. Наконец, укажем,
что нет необходимости начинать с обсуждения того, как ин-
* Greg Scragg. Semantic Nets as Memory Models. — In:
E. Charniak and Y. Wilks (eds.). Computational Semantics.
Amsterdam etc., 1978, p. 101—128.
© North-Holland Publishing Company (1976).
228
формация реально попадает в память для последующего
хранения, поэтому вопросы обучения тоже останутся за
пределами нашего рассмотрения.
В данной статье речь идет преимущественно о
представлении "памяти", а не "языка". Тем не менее автор полагает,
что между таким представлением и представлением языка
(на самом глубинном уровне) разница невелика (если она
есть вообще). Конечно, существует ряд явлений,
информация о которых должна храниться в памяти, но которые
трудно (если вообще возможно) выразить на естественном
языке, например, такие, как запах розы или умение ездить
на велосипеде. Но, по предположению, все явления,
поддающиеся описанию с помощью языка, должны быть
представимы в памяти. Поэтому мы без колебаний включаем в
эту статью результаты некоторых разработок, нацеленных
на представление языка, но в равной степени применимых
и к представлению памяти.
Первый вопрос, который мы рассмотрим, это вопрос о
том, что такое "структура нижнего уровня". Другими
словами, как вообще мы можем представлять информацию?
Как мы можем представить какой-либо простой факт? В
первой статье Чарняка было показано, в общих чертах, как
для представления знаний может использоваться
исчисление предикатов. Оно дает как способ представления
(формулы исчисления предикатов первого порядка — формулы
ИППП), так и метод выведения новых фактов из старых
(доказательство теорем). Кроме того, оно обладает тем
преимуществом, что это способ записи, с которым уже, видимо,
знакомо большинство специалистов по вычислительной
технике и смежным дисциплинам и для которого уже
разработана обширная метатеория. Однако существует и другой
формат представления, который оказался в последние годы
даже более популярным среди исследователей в области
искусственного интеллекта. Это — "семантическая сеть".
В дальнейшем мы будем использовать семантическую сеть
в качестве главной модели памяти, обращаясь к другим
формам представления лишь в тех случаях, когда нужно
будет изложить положения, не применимые к
семантическим сетям.
СЕМАНТИЧЕСКИЕ СЕТИ
Разработка понятия семантической сети обычно
приписывается Куиллиану (Quillian, 1968) (хотя структура,
229
использованная в системе SIR Рафаэла (1964), как
показано в первой части статьи Ю. Чарняка, имеет во
многом такой же вид, и мы будем говорить о ней как о
семантической сети). В своей наипростейшей форме
семантическая сеть есть совокупность точек, называемых узлами;
каждая из них может мыслиться как представление
некоторого понятия (точное определение понятия здесь для нас
несущественно; достаточно представлять его себе как
некоторую сущность, о которой хранится информация). Каждый
узел может иметь имя, например: boy 'мальчик' или gift
'подарок'. Узлы без имен в общем случае соотносятся с
понятиями, которые не представимы с помощью простого
имени в английском языке, например: the cute little girl with
the long blond curls who lives around the corner 'миловидная
маленькая девочка с длинными белокурыми вьющимися
волосами, которая живет за углом'. Точка может
связываться посредством направленной дуги (или, если угодно,
стрелки), которая называется отношением, с любой другой
точкой сети. Это отношение получает некоторое обозначение
(помету). Графически это может выглядеть так:
R
Схема читается следующим образом: R связывает А с В.
Принятая интерпретация этой структуры сводится
к тому, что отношение R имеет место между А и В, или А
находится в отношении R к В. Заметим, что В не обязательно
находится в отношении R к А. Именно поэтому дуга должна
быть направленной и представляться в виде стрелки.
Например, если А — это Anna, В — это Bill, a R — это LIKES
'любит', мы имеем-
likes
ANNA S* "Ч BILL
Вполне возможно, что Анна ни в малейшей степени не
интересует Билла, поэтому мы не можем заключить
следующее:
Любой узел может быть связан с произвольным числом
230
других узлов, каждый из них — с любым числом других
узлов и т. д. Если добавлять все большее и большее число
узлов и дуг, графическое представление становится
похожим на сеть из линий, поэтому оно получило название
семантической сети (семантической, поскольку исторически
такие сети были использованы прежде всего для
представления значений выражений на естественном языке).
Сеть может строиться для представления очень сложных
взаимоотношений, например, в:
CHARLES
BOY
Charles представляет некоторого конкретного
члена множества всех мальчиков (ISA означает is а
'есть некоторый', boy — 'мальчик').
Charles hit the blond haired girl.
'Чарльз ударил девочку с белокурыми волосами.*
может быть представлено как:
BOY
'мальчик'
CHARLES
'Чарльз'
GIRL
'девочка'
HAIR
'волосы'
BLOND
'белокурый'
где НАР означает has-as-part 'имеет в качестве части'.
Заметим, что здесь имеются непоименованные узлы,
представляющие конкретную девочку и ее волосы. (Таким
непоименованным узлам иногда приписываются произвольные
символы типа Cl, С2 и т. д. для внутренних ссылок.) Если
добавить дополнительную информацию о том, что девочка
231
была высокая, узел, репрезентирующий девочку, будет
расширен:
Минимальной единицей информации в семантической
сети является тройка ARB. Но базисная единица —
это узел, или понятие. Понятие обладает информационным
содержанием лишь в силу того, что оно связано с другими
узлами. Можно считать, что информация существует в
отношениях. Понятие, не участвующее ни в каких
отношениях, лишено содержания, и мы считаем, что доступ к нему
закрыт. Это понятие, о котором ничего не известно
(действительно, это весьма странное понятие).
Слово "понятие" (concept) обычно используется для
обозначения как общих, так и конкретных понятий. Конкретное
понятие, подобное этому листу бумаги или конкретному
мальчику, который ударил белокурую девочку, в нашем
последнем примере, мы будем называть "элементом"
("token"). Неконкретные понятия будут называться "типами"
("types"). Часто неконкретные понятия являются типами-
классами, например GIRL и HAIR. В других случаях они
могли бы, вероятно, тоже интерпретироваться как классы
(TALL = класс высоких вещей?), но мы находим такие
интерпретации натянутыми и не будем настаивать на том,
что все "типы" являются классами. (Читатель, знакомый
со статьей Куиллиана, может заметить, что принятое нами
употребление терминов "тип" и "элемент" несколько
отличается от того, которое мы находим у Куиллиана.) Мы
видели в нашей последней схеме, как элемент (the blond girl)
был связан с соответствующим типом (girl) посредством
отношения ISA (для выражения этого отношения
используются также обозначения IS-A и ELEMENT). В этих случаях
мы можем сказать, что узел-элемент (blond girl) "является
элементом" соответствующего узла-типа (girl). Типы (girl),
которые являются подтипами других типов (human 'чело-
232
веческий'), могут связываться со своим более крупным
типом посредством отношения SUPERSET 'надмножество'
(S. S. или другие эквивалентные обозначения).
Важно подчеркнуть разграничение между
типом и элементом. Системы, в которых оно игнорируется,
обычно сталкиваются с трудностями, связанными с тем, что
в них невозможно провести различие между сущностью
(элементом) и множеством (типом), которое не имеет членов.
Чтобы пояснить это, предположим, что у нас имеется
(неправильная) структура (1) следующего вида:
(1) ANIMAL
'животное'
Это подструктура некоторой базы данных. Если бы системе,
использующей эту базу данных, был задан вопрос:
How many animals do you know about?
'О скольких животных Вы знаете?'
она могла бы ответить 'о трех', подсчитав непосредственные
подмножества узла ANIMAL. Или она могла бы ответить
'о пяти', пройдя по всем цепочкам с отношениями ISA до
их концов (CLEO, FIDO, ROVER, REX и PIG). Но
распознать, что в действительности имеется четыре конкретных
животных (их клички Cleo, Fido, Rover, Rex), невозможно,
если только не пометить каким-нибудь способом типы и
элементы, например используя два различных отношения —
ISA и SUPERSET. Альтернативный путь может состоять
в том, чтобы пометить каждый узел особым обозначением,
указывающим, является ли он классом или элементом.
Обсуждая последние примеры, мы впервые конкретно
коснулись активного аспекта памяти. В этом примере, для
того чтобы обосновать форму, которую должна иметь сеть
(необходимость разграничения "тип — элемент"), мы долж-
233
ны были обратиться к проблеме поиска информации
(выяснения того, о скольких животных имеются сведения в
системе). Действительно, популярность сетей вначале была во
многом обязана их способности существенно облегчать
определенные виды поиска и вывода. В частности, они могут
Великолепно справляться с выводами типа "Сократ — чело-
s.s. s.S.
CANARY » BIRD » ANIMAL
\. \ \
COLOR НАР НАР
\ \ \
yellow wing skin
век, все люди смертны". Здесь мы рассмотрим пример
"канарейка — птица, все птицы имеют крылья".
Если эту схему рассматривать как часть сети, то цвет
канарейки можно найти простым прохождением стрелки COLOR
от CANARY 'канарейка' к YELLOW 'желтый'. Чтобы
определить, имеет ли канарейка крылья (заметим, что НАР не
связывает здесь CANARY и WING 'крыло'), необходимо
только заметить, что BIRD НАР WING и CANARY
S. S. BIRD, следовательно, канарейки должны тоже иметь
крылья. Аналогично, повторив еще раз силлогическое
рассуждение, можно установить, что канарейки имеют кожу
(skin). Таким образом, для некоторых ситуаций
семантические сети обеспечивают естественный метод вывода.
Можно назвать еще два свойства семантических сетей,
которые способствовали росту их популярности. Во-первых,
семантические сети подсказывают некоторые способы
сокращения объема информации, подлежащей хранению.
Нет необходимости специально отмечать, что канарейки
имеют крылья, и вороны имеют крылья, и малиновки имеют
крылья, и утки имеют крылья. Нужно только, чтобы
каждое такое свойство было связано с самым общим типовым
узлом, который обладает этим типичным свойством (в нашем
случае этот узел — BIRD 'птица'). Привлекательность
такого представления заключается еще в том, что оно
эксплицитно показывает, каковы общие черты большинства
птиц. Вторым фактом, который послужил толчком для
распространения идеи семантической сети, был ряд
результатов психологических экспериментов, из которых следовало,
что хранение информации в мозгу человека осуществляет-
234
ся, вероятно, тоже в виде сетей (Collins and
Quillian, 1968); правда, позднее были получены и иные выводы
(Bischof, 1978). Было замечено, что время ответной
реакции человека устойчиво возрастает по мере того, как
вопросы затрагивают свойства все более и более общего
характера (например, канарейки желтые, имеют крылья,
имеют кожу и т. д.). Именно это и предсказывают
семантические сети, так как более общие свойства находятся дальше
от конкретных элементов и, чтобы найти их, нужно
просмотреть больше узлов.
обобщения сетей
Первоначально казалось, что семантические сети дают
нечто ценное для всех и являются настоящей панацеей для
психологов и специалистов по вычислительной технике.
Однако более поздние психологические результаты
показали, что сами по себе сети не являются хорошими
психологическими моделями, а специалисты по вычислительной
технике скоро столкнулись с формальными трудностями,
вытекающими из того, что по мере рассмотрения более
сложных данных сети, применявшиеся в ранних системах, скоро
оказались в ряде отношений недостаточными: чтобы они и
дальше могли быть жизнеспособными моделями,
требовались ограничения или дополнения в базисной структуре.
Некоторые из этих формальных проблем решаются в
модели памяти, развиваемой Норманом, Линсеем и
Румельхартом (см. Norman & Rumelhart, 1975) и
составляющей ядро предполагаемой комплексной
психологической модели. Память в их понимании предусматривает
некоторые усовершенствования и расширения по сравнению
с исходным понятием семантической сети.
Одна из проблем, связанных с описанным выше
представлением сети, возникает при моделировании фактов типа
John hit Mary 'Джон ударил Мэри', которые мы
представляем следующим образом:
HIT
JOHN s Ч MARY
Возникающая здесь трудность заключается в том, что у
нас нет возможности добавить дополнительную информацию
об этом событии, информацию о том, когда он ударил ее,
где (как в смысле локализации удара на теле, так и в смыс-
235
ле места, где произошло действие в целом), была ли
использована палка и т. д. Эта трудность может быть устранена
посредством введения концептуальных узлов не только для
объектов, но и для событий. Тогда мы получим:
Заметим, что если раньше мы различали, кто ударил
кого, помещая одно понятие в конце стрелки, обозначающей
отношение, а другое — в начале, то теперь так сделать
нельзя, поскольку теперь John и Магу каждый имеют свою
собственную стрелку. Вместо этого мы проводим данное
разграничение посредством эксплицитного называния
одного элемента агенсом, а другого — объектом, придавая
представлению вид, напоминающий падежную структуру.
Но и это представление не разрешает всех проблем.
Рассмотрим представление для следующего предложения:
John hit Mary and Bill hit Sue.
'Джон ударил Мэри, а Билл ударил Сью.'
236
Теперь уже неясно, кто ударил кого и сколько таких
действий произошло в действительности. (Не годится здесь и
такое решение, чтобы было два узла, помеченных HIT,
поскольку, при наличии одинаковых помет, не будет
возможности различить их при поиске.) Чтобы обойти эту
трудность, мы должны разграничивать конкретные действия
типа "ударить" и понятие "ударять вообще". Тогда
получаем:
Узел HIT в центре представляет понятие 'ударять'. Два
конкретных происшествия, когда кого-то ударили,
связаны с общим понятием HIT посредством отношения ACT-OF
'действие типа'. Отношение ACT-OF между понятиями,
отражающими действие, аналогично отношению ISA между
понятиями, отражающими предметы.
Узел HIT в (2) мог бы быть расширен:
Эта информация, как показывает ее местоположение в
схеме, относится к общему понятию 'ударять'. Она означает,
что без указания отношений AGENT и OBJECT данное
понятие является неполным (или даже невообразимым).
Следовательно, каждое отдельное действие типа HIT
(связанное отношением ACT-OF) должно иметь и стрелку
AGENT, и стрелку OBJECT. Такие обязательные атрибуты
237
могут мыслиться как аналоги глубинных падежных
отношений *, за исключением того, что здесь они выступают
как требования к памяти, а не к самой языковой структуре.
Заметим, что представление в виде семантической сети
вполне определенно предполагает использование именно
падежной структуры, а не позиционной структуры, как
в представлении типа исчисления предикатов. Таким
образом, в то время как раньше предикаты типа hit выступали
как связи между узлами (или, более формально, как
отношения между узлами), теперь они сами выступают в роли
узлов. Так как первоначально в нашем представлении все
предикаты были отношениями, мы могли употреблять эти
термины во многом как синонимы. А теперь этого делать
нельзя. Поэтому мы будем и дальше употреблять термин
отношение для обозначения связей между узлами, тогда
как термин предикат будет теперь обозначать общие
понятийные узлы типа HIT. Более того, мы будем называть
структуры типа (2) "предикатными структурами", чтобы
подчеркнуть тот факт, что здесь HIT является узлом
(предикатом), а не связью.
Этот переход в статусе от связи к узлу будет иметь целый
ряд важных последствий для использования
семантических сетей, что станет ясно в процессе изложения. Сейчас
же заметим, что отношения типа AGENT будут
фигурировать в сети очень часто. Каждый отдельный случай
осуществления практически каждого действия будет иметь
отношение AGENT (или ACTANT, или какое-то другое в
том же роде — употребляемые здесь термины не означают,
что мы пользуемся какой-либо конкретной системой
глубинных падежей).
Один из результатов введения предикатных структур
состоит в том, что в семантической сети теперь может быть
представлен эквивалент любого N-арного предиката,
задаваемого посредством ИППП (см. часть 1-ю статьи Чарняка).
До этого дополнения в семантической сети имелись
эквиваленты (в виде дуги отношения) только для
двухместных предикатов. Эти новые преимущества приводят,
правда, к увеличению объема базы данных и, вероятно, к
увеличению времени поиска. Впрочем, мы должны предупре-
* О глубинных падежах см.: Филлмор, Ч. Дело о падеже.—
В сб.: "Новое в зарубежной лингвистике", вып. X. М., 1981; о н ж е.
Дело о падеже открывается вновь.— Там же.— Прим. перев.
238
дить читателя, что, несмотря на тот факт, что все
современные семантические сети используют средства, аналогичные
описанным предикатным структурам, авторы таких систем
продолжают проводить свои рассуждения так, как будто
бы этого не было, и продолжают использовать старую
нотацию в качестве сокращения для новой. Мы будем поступать
так же. Однако, когда будет проводиться дуга, в
действительности представляющая некоторый узел, мы будем
помечать ее символом узла в виде кружка в центре дуги. Так:
HIT
/
ACT-OF
AGENT / OBJECT
JOHN ^ * ■*• MARY
становится:
HIT
JOHN ' ч MABY
Иногда возникает необходимость представлять в базе
данных суждения, про которые неизвестно, истинны ли
они, или даже известно, что они ложны. Например, чтобы
представить:
Peter said that he went to the store
'Питер сказал, что он пошел в магазин'
требуется, чтобы
Не went to the store
'Он пошел в магазин'
было представлено каким-либо образом в нашей сети, даже
если известно, что оно ложно. Один из способов сделать
это — пометить каждый предикатный узел значением
истинности TRUE 'истинно', FALSE 'ложно' или UNKNOWN
'неизвестно'. Так, Peter said that he went to the store
могдо бы быть представлено э следующем виде:
239
Здесь мы знаем, что Питер сказал это, но не знаем,
действительно ли он пошел. Однако это обозначение не является
достаточным для адекватного представления всех случаев.
Рассмотрим схему:
(3)
Эта запись может пониматься двояко:
Peter said that he went to the store, but he really didn't
'Питер сказал, что он пошел в магазин, но в самом деле
он не пошел1
и:
Peter said that he didn't go to the store
'Питер сказал, что он не идет в магазин'
Один из способов записи, позволяющий преодолеть эту
трудность, был разработан Шубертом (Schubert,
1975). Он использует логический оператор NOT 'не' в
качестве предиката. Так:
Peter didn't go to the store
'Питер не пошел в магазин'
240
представляется в виде:
STORE
Он вводит дополнительное соглашение о том, что некоторый
узел в базе данных соотносится с действительным
утверждением (которое объявляется истинным) тогда и только тогда,
когда на схеме не существует входящей в него стрелки.
Так, на последней схеме отрицание утверждается (is
asserted), а утвердительное высказывание — нет. Опираясь на
это соглашение, можно по разному представить два
значения, которые "скрыты" в схеме (3):
РЕАЛИЗАЦИЯ
Следует остановиться на преобразовании
семантических сетей в машинные представления. До сих пор мы
пытались обсуждать проблематику семантических сетей, не
рассматривая проблем их реального представления в
вычислительной машине. Но существует по крайней мере один
важный вопрос, который не встает при рассмотрении
семантических сетей как графов, но который мы будем вы-
241
нуждены решать, если действительно попытаемся
реализовать систему, основанную на семантической сети. Поскольку
в цифровой вычислительной машине нельзя хранить линии и
узлы как таковые, то мы должны выбрать некоторую
альтернативную схему представления. Имеется две основных
возможности:
Перечислить для каждого узла все отношения, в
которые он вступает (вместе с именами узлов, на которые
указывают отношения), то есть:
JOHN 'Джон'
HIT BILL 'ударил Билла*
LOVES MARY 'любит Мэри*
Перечислить для каждого понятия-отношения все
пары узлов, которые связаны этим отношением.
LOVE 'Любить'
JOHN, MARY 'Джон», 'Мэри'
JOAN, FRANK 'Джоан», 'Фрэнк'
(Можно было бы, конечно, идя на значительную
избыточность, использовать оба эти способа, или, может быть,
некоторую их комбинацию.) Второй вариант, если применить
его отдельно, работать, по существу, не будет, поскольку в
результате мы получим массив, где все случаи применения
каждого данного отношения сгруппированы вместе. Это
было бы не так уж плохо, если бы наши отношения были
того типа, который описан ранее (и использован выше),
то есть типа LOVE и HIT. Для того чтобы выяснить,
любит ли Джон кого-нибудь, мы могли бы просто просмотреть
записи, хранящиеся под рубрикой отношения LOVE, где
был бы список всех пар (А, В), таких, что A LOVES В
истинно. Если JOHN появляется в левой части какой-либо
пары в этом списке, то мы считаем, что он любит кого-то
(а именно лицо, приписанное ему в данном списке). Однако
вспомним, что LOVE представляется сейчас посредством
предикатной структуры, а отношения теперь носят
характер понятий типа AGENT и OBJECT. Поскольку
большинство (или все) предикаты имеют AGENT, поиск в списке
пар для отношения AGENT был бы эквивалентен
просматриванию каждого предиката в базе данных, чтобы опре-
84¾
делить, встречается ли Джон в статусе агенса с
последующей проверкой того, является ли найденный предикат
ACT-OF LOVE. Даже после этого исчерпывающего поиска
мы не знали бы, кто был ОБЪЕКТОМ его ЛЮБВИ.
С другой стороны, если бы все индексировались по
узлам и мы хотели бы получить ответ на поставленный выше
вопрос, мы просмотрели бы записи под рубрикой,
соответствующей узлу JOHN, и увидели бы, является ли он
агенсом какого-либо предиката:
JOHN LOVE 7
AGENT LOVE 7 ACT-OF LOVE
HAS-AGENT JOHN
HAS-OBJECT JILL
JILL
OBJECT LOVE 7
Если такой предикат есть и если это ACT-OF LOVE,
то мы заключаем, что Джон любит кого-то. Заметим, что
LOVE 7 (отдельный случай реализации LOVE) тоже
является узлом, поэтому в базе данных должен быть указатель
отношений, в которые он вступает. Чтобы выяснить, кого
именно Джон любит, надо просто просмотреть отношение
HAS-OBJECT в списке для LOVE 7. Итак, важно,
чтобы данные хранились (по крайней мере) в узловом
формате.
Заметим, что в приведенном примере индексирования у
нас фактически хранилась избыточная информация. Чтобы
выразить тот факт, что Джон любит Джилл, мы
использовали пять записей, хотя теоретически могли бы обойтись
и тремя, скажем, теми, которые перечислены под LOVE 7.
Однако на практике этот путь малопригоден, поскольку
при такой схеме каждый раз, когда мы хотели бы узнать,
любит ли кого-либо Джон, система должна была бы
просматривать каждый узел и определять, обладает ли он
свойствами, приписанными выше узлу LOVE 7. Очевидно, в
такой ситуации экономия на сокращении избыточных
записей в указателях отношений только ради того, чтобы быть
втянутыми в подобный поиск, была бы ложной экономией.
Но в других случаях ситуация не столь ясна. Рассмотрим
отношение SUBSET 'Подмножество'. При полном
индексировании хранилась бы не только информация при А о том,
243
что оно есть SUBSET относительно В, но также и при В —
информация о том, что В есть SUPERSET относительно
А. И снова мы имеем дело с избыточной информацией, но,
как мы уже видели, поиск конкретного факта значительно
ускоряется, если обратное отношение хранится в
эксплицитном виде. Если же мы только укажем при А, что А
SUBSET В, то будет очень трудно найти все подмножества
узла, и наоборот. С другой стороны, представляется
маловероятным, что человек всегда хранит в памяти как SUBSET,
так и SUPERSET. Заметим, что на вопрос:
Dachshunds are ?
'Таксы являются ?'
легко ответить "dogs" 'собаками', поэтому можно считать,
что при DACHSHUND в памяти хранится соотношение
(DACHSHUND SUBSET DOG) или какой-то его
эквивалент. Но:
Name ten kinds of dogs
'Назовите десять пород собак'
— гораздо более трудный случай. (Вы, может быть, и
знаете десять пород, но если только Вы не являетесь знатоком
собак, задание потребует от Вас определенного времени.)
Это может служить свидетельством в пользу того, что при
понятии DOG в памяти не хранится список всех его
подмножеств. Но в целом вопрос о том, в каких же именно
случаях должны храниться и прямые отношения, и обратные,
остается нерешенным.
беглое сравнение сетей и исчислений
Очевидное преимущество представления в форме
исчисления предикатов заключается в том, что мы получаем
в свое распоряжение всю мощь ИППП и можем осуществлять
логический вывод на основе базы данных без
дополнительных усилий. ИППП дает средства для представления
кванторов и других понятий, выразить которые в
семантических сетях совсем не просто. Попытайтесь представить в
форме сети хотя бы такое выражение:
СУЩЕСТВУЕТ (Х)(Р(Х) И Q (X) ИМПЛИЦИРУЕТ R
(X)) Один из недостатков ИППП как способа представления
данных состоит в отсутствии хорошей организации фактов
244
(см. часть I статьи Чарняка). Любой, кто пытался
проводить доказательства в ИППП, знает, что не всегда легко
выбрать формулы и правила вывода для вычисления
некоторого конкретного факта. Методики, используемые в
настоящее время в программах по доказательству теорем,
являются даже менее эффективными, чем действия людей
(в том, что касается выбора наиболее подходящего
материала). В принципе, конечно, не существует причин,
которые препятствовали бы привнесению в ИППП многих
структурных свойств семантической сети (многие из них
действительно использовались в ИППП), но тем не менее,
мы должны признать, что ИППП не оказалось такой же
удобной основой для развития методов организации
фактов, как семантические сети.
Хотя мы описывали семантические сети так, как будто
это существенно отличный от ИППП метод представления
памяти (и в самом деле, мы полагаем, что они
действительно различны по цели), тем не менее можно показать, что
они, в принципе, эквивалентны по выразительной силе,
хотя из этого не следует эквивалентность по удобству
пользования.
Чтобы убедиться в этом на интуитивном уровне,
достаточно обратить внимание на сходство между списком
двухаргументных предикатов ИППП и машинным
представлением семантической сети, описанным в предыдущем разделе
(то есть списком троек типа понятие — отношение —
понятие). Однако не так легко показать, что они эквивалентны
в точном смысле. Главные трудности концентрируются при
этом вокруг проблемы квантификации. Каким образом
выражаются в семантической сети кванторные свойства
отношений? Многие сторонники семантических сетей,
описывая смысл вводимых отношений в терминах квантификации,
делают это весьма неопределенно, а иногда даже и
непоследовательно. Например, если представление
НАР
HUMAN / A HEART
является подструктурой базы данных, то обычная его
интерпретация состоит в том, что ece люди (HUMAN) имеют
сердце (HEART). Но если в базе данных имеется
представление
245
to нам говорят, что это означает, что мужчины иногда
играют в футбол. (Или, более точно, мы считаем, что в то время
как каждый человек имеет сердце, если специально не
утверждается обратное, то в футбол играют лишь некоторые
мужчины.) При ближайшем рассмотрении оказывается
невозможным приписать отношениям некую простую
интерпретацию, которая покрывала бы все возможные кван-
тификации этого отношения. Чтобы убедиться в этсм,
заметим, что у двухместного пргедиката в исчислении
предикатов может быть шесть разных квантификаций:
(4) а) ДЛЯ ЛЮБОГО
б) ДЛЯ ЛЮБОГО
в) ДЛЯ ЛЮБОГО
г) СУЩЕСТВУЕТ
д) СУЩЕСТВУЕТ
е) СУЩЕСТВУЕТ
(Х)(ДЛЯ ЛЮБОГО (Y) (RX, Y))
(X) (СУЩЕСТВУЕТ (Y) (RX, Y))
(Y) (СУЩЕСТВУЕТ (X) (RX, Y))
(Х)(ДЛЯ ЛЮБОГО (Y) (RX, Y))
(Y) (ДЛЯ ЛЮБОГО (X) (RX, Y))
(X) (СУЩЕСТВУЕТ (Y) (RX, Y))
Однако в семантической сети можно отразить только
четыре разных квантификаций, получаемых посредством
присоединения кванторов к каждому концу дуги отношения:
XX X Y
There ïs a man who loves all women
'Существует мужчина, который любит всех женщин'
246
(EXISTS) _---£--__ (EXISTS!
(существует) ^ *,fc^x^ (существует)
Some men have watches
'У некоторых мужчин есть часы '
Если семантическая сеть должна иметь в плане квантифи-
кации ту же выразительную силу, что и ИППП, тогда
должны быть найдены некоторые дополнительные (более
сложные) структурные правила.
Шуберт (Schubert, 1975) указал один способ
перевода большинства структур, имеющихся в ИППП, в
семантическую сеть. Для этого высказывание,
представленное в форме исчисления предикатов, он прежде всего
переписывает в форме Сколема (см. первую статью Чарняка),—
в форме, которая не имеет кванторов существования, а все
кванторы общности находятся за пределами основной части
выражения. В его графе узлы, которым приписан квантор
общности, специально помечены (он использовал
пунктирный кружок). Любой узел, обозначающий некоторую
функцию Сколема и зависящий от узла, соотносящегося с
квантором общности, соединяется (посредством пунктирной дуги)
с этим узлом-хозяином, например:
(5) Every man loves a woman.
'Каждый мужчина любит женщину.*
имеет две интерпретации, представляемые в ИППП как:
FOR-ALL (X) (EXISTS (Y) (MAN (X) IMPLIES (WOMAN
(Y) AND LOVE (X, Y))))
'ДЛЯ ЛЮБОГО (X) (СУЩЕСТВУЕТ (Y) (МУЖЧИНА
(X) ИМПЛИЦИРУЕТ (ЖЕНЩИНА (Y) И ЛЮБИТ
(X, Y))))' и
EXISTS (Y) (FOR-ALL (X) (WOMAN (Y) AND (MAN
(X) IMPLIES LOVE (X, Y))))
'СУЩЕСТВУЕТ (Y) (ДЛЯ ЛЮБОГО (X) (ЖЕНЩИНА
(Y) И МУЖЧИНА (X) ИМПЛИЦИРУЕТ ЛЮБИТ (X,
Y))))'
В результате сколемизации мы получаем:
FOR-ALL(X) (MAN X IMPLIES
WOMAN(MANS-WOMAN(X)) AND LOVE (X, MANS-WOMAN (X)))
«ДЛЯ ЛЮБОГО (X) (МУЖЧИНА (X) ИМПЛИЦИРУЕТ
247
ЖЕНЩИНА (ЖЕНЩИНА-МУЖЧИНЫ (X)) И ЛЮБИТ
(X, ЖЕНЩИНА-МУЖЧИНЫ (X)))'
FOR-ALL(X) (WOMAN(A) AND (MAN(X)IMPLIES
LOVE(X,A)))
'ДЛЯ ЛЮБОГО (X) (ЖЕНЩИНА (А) И (МУЖЧИНА
(X) ИМПЛИЦИРУЕТ ЛЮБИТ (X, А)))'
(А является константой).
В семантической сети два этих утверждения могут быть
представлены следующим образом:
(б) Every man has a woman to love.
'Каждый мужчина имеет женщину, которую он
любит.'
248
(7) There Is a woman and every man loves her.
'Имеется женщина, и каждый мужчина любит ее.*
Узлы, помеченные пунктирными кружками, соотносятся
с кванторами общности. Пунктирная дуга обозначает
зависимость (в смысле функций Сколема) узла,
обозначающего женщину, которую любят, от узла, обозначающего
мужчину, который испытывает эту любовь. Заметим, что в (6)
единственным утверждаемым отношением является
импликация, а в (7) утверждается также существование женщины.
Некоторое дополнительное размышление убеждает нас
в том, что с помощью этой методики в семантической сети
могут быть скопированы все детали репрезентационных
возможностей ИППП. (Аналогично, любая связь в
семантической сети может мыслиться как двухместный предикат
ИППП. Итак, можно считать, что семантические сети и
исчисление предикатов обладают эквивалентной
репрезентационной силой.)
Все это довольно красиво на уровне теории. Но на
практике построения Шуберта являются слишком
громоздкими Так, в контексте приведенных примеров, если бы было
также известно, что Макс является мужчиной, и мы хотели
бы определить, любит ли он женщину, то кратчайший путь
от Макса к женщине, который мы должны были бы пройти,
состоял бы из восьми звеньев, как это можно увидеть из
следующей упрощенной схемы:
Заметим, что Шуберт счел необходимым представлять
отношение принадлежности к классу типа (ISA MAN) как
предикатную структуру. Другими словами, если ранее Fred
is a man 'Фред — мужчина' выглядело как:
249
то сейчас оно будет выглядеть как:
OBJECT "^^ ISA
FRED
MAN
Вообще любая программа для выведения простых фактов
типа отношений ISA будет более сложной, чем нам хотелось
бы этого. Читатель может проверить, что такая процедура
потребует в исходных сетях два шага, а в расширенных сетях
(с предикатной структурой) — четыре шага..
До сих пор мы интересовались тем, как можно
модифицировать сеть для того, чтобы включить в нее свойства
исчисления предикатов, но исследования проводились также
и в обратном направлении — с целью приблизить
представление ИППП к семантическим сетям (Sandewall, 1970).
Сэндуолл отмечает, что если использовать традиционную
нотацию предикатов в ИППП, то возникают некоторые
трудности. Так, допустим, мы представили факт, что Джон
любит Мэри, следующим образом:
LOVES (JOHN, MARY)
В рамках ИППП не существует способа для представления
выражения
Bill believes that John loves Mary
'Билл полагает, что Джон любит Мэри', потому что
запись
BELIEVE (BILL, LOVES (JOHN, MARY))
не является допустимой в ИППП. (В первой статье
Чарняка говорилось, что предикаты не могут выступать в
качестве аргументов других предикатов.) Сэндуолл
предлагает два способа преодоления этой трудности в пределах
ИППП, один из них приводит к следующему представлению
последнего примера:
VERB (El, BELIEVE)
SUBJECT (El, BILL)
OBJECT (El, E2)
VERB (E2, LOVES)
SUBJECT (E2, JOHN)
OBJECT (E2, MARY)
250
Если эта запись кажется читателю знакомой, то в этом нет
ничего удивительного: по существу, такое же решение было
предложено выше в настоящей статье для преодоления
аналогичных трудностей, связанных с сетями; глаголы были
преобразованы в предикатные структуры и были введены
глубинные падежи.
Иногда объединение сетей и ИППП представляет собой
попытку ликвидировать разрыв между взглядами
сторонников ИППП, которые хотят иметь строгий формализм,
всегда обеспечивающий доказуемость получаемых выводов,
и взглядами тех, кто чувствует, что этот строгий формализм
накладывает слишком жесткие ограничения на факты,
которые могут быть с его помощью представлены, и на
выводы, которые могут быть сделаны на основании этих
фактов. Две попытки представить кванторные значения в
семантических сетях так, чтобы обеспечивалась возможность
менее формальных и в то же время приемлемых с
интуитивной точки зрения выводов и/или представлений, были
предприняты Пальме и Скрэггом. Ни тот, ни другой на самом
деле не гарантируют, что в сети могут быть представлены
все возможные комбинации кванторов, но тем не менее
предлагают определенные правила квантификации. Скрэгг
попытался просто игнорировать формальные ограничения
ИППП и связал проблемы кванторных значений с
проблемами представления более неопределенных кванторов,
которыми мы постоянно пользуемся в речи; таковы, например,
many 'много', more 'больше', some 'некоторый' и т. д.
Пальме, с другой стороны, ввел новый квантор — СВОЙ (ITS).
Скрэгг (Scragg, 1973) попытался разрешить эти
проблемы на основе умышленного сохранения некоторой
доли неопределенности в осмыслении кванторных свойств
отношений и в то же время на основе нескольких простых
наблюдений над природой квантификации в реальной
жизни. Все отношения рассматриваются как лишенные
кванторных характеристик; считается, далее, что кванторные
уточнения могут быть получены в случае необходимости.
Такие уточнения могут осуществляться несколькими
способами.
1. Отношения между конкретными понятиями, или
элементами (tokens), никогда не получают кванторной
характеристики. Отношение между понятием-элементом и
понятием-типом не может подвергаться квантификации со
стороны элемента. Итак, нам нужно беспокоиться о кван-
251
тификации лишь тех узлов, которые обозначают понятия-
типы (тем самым мы учли случаи 4г, д, е).
2. Отношения с двойным квантором общности редко
встречаются в рамках обычного (не научного) знания.
Мы не часто делаем утверждения о фактах типа All men
love all women. 'Все мужчины любят всех женщин.'
Следовательно, если мы исключим из рассмотрения подобные
случаи, то мы не много потеряем (таким образом мы учли
и случай 4а).
3. Можно применить и принцип локальности
информации. Под этим имеется ввиду следующее: когда встречаются
два факта, являющиеся несовместимыми, мы должны отдать
предпочтение более локальному факту, то есть тому,
который находится в сети ближе к интересующему нас узлу.
Рассмотрим в качестве примера фрагмент сети:
MAN _
JOHN — о •—►leg
Можно считать, что здесь записано непротиворечивое
утверждение, согласно которому мужчины вообще (в своем
большинстве) имеют ноги, но по крайней мере один (Джон)
их не имеет. Заметим, что утверждение о том, что Джон
не имеет ног, изображено "ближе" по отношению к узлу
"Джон", чем тот факт, что мужчины вообще имеют ноги.
(Из этого следует, что поиск информации должен
проводиться сначала путем просмотра всей информации, тесно
связанной с данным узлом, и лишь после этого, если
локальная информация отсутствует, можно обращаться к
более отдаленным связям.)
4. Некоторые отношения, такие как НАР, всегда
получают кванторное сочетание ДЛЯ ЛЮБОГО, СУЩЕСТВУЕТ.
Когда подобное отношение применяется к узлу-типу, его
значение должно пониматься так, что для каждого
элемента из рассматриваемого первого класса должен
существовать единственный элемент из второго класса, связанный с
первым данным отношением (то есть должна существовать
функция, позволяющая найти второй элемент). Так, MAN
НАР HEART означает, что каждый человек имеет некото-
252
рое сердце. Внимательный читатель заметит, что это два
остающихся случая (46, в) и что это как раз та самая
ситуация, для которой Шуберту потребовались функции
Сколема. Мы считаем, что такие отношения имеют квантор
общности в хвостовой точке стрелки, а квантор существования
в головной точке стрелки. Фраза Every man loves some
woman 'Каждый мужчина любит какую-то женщину'
получает следующее простое представление:
love
MAN S* ^4^ WOMAN
Заметим, что фраза Every woman is loved by some man
'Каждая женщина любима каким-то мужчиной' была бы
представлена так:
LOVED-BY
WOMAN ^ ^ MAN
Поскольку два английских утверждения не являются
эквивалентными, мы должны предположить, что предикаты
LOVE и LOVED-BY не являются обратными по отношению
друг к другу в точном смысле, если использовать
указанное соглашение. Это раздвоение, конечно, могло бы создать
трудности. Пока еще не ясно, как показать, что конкретное
отношение связывает каждый член некоторого
ограниченного подмножества с каждым членом другого ограниченного
подмножества. (Например, Every boy in the class loves every
girl in the class. 'Каждый мальчик в данном классе любит
каждую девочку в данном классе.')
Пальме (Palme, 1973) попытался представить кван-
торные значения посредством введения третьего квантора —
СВОЙ. Последний может мыслиться как значение
соответствующего посессивного местоимения. Не удивительно, что
это местоимение используется в тех же самых ситуациях,
для которых Шуберт и Скрэгг должны были разработать
специальные средства: это ситуации типа ДЛЯ ЛЮБОГО х
СУЩЕСТВУЕТ у. Используя три квантора, он смог для
каждого прежнего неквантифицированного отношения
определить шесть отдельных отношений: помещая ДЛЯ
ЛЮБОГО или СУЩЕСТВУЕТ слева и ДЛЯ ЛЮБОГО,
СУЩЕСТВУЕТ или СВОЙ справа. Приводившийся выше пример
получает представление«
253
LOVE
MAN ' WOMAN
Несложный подсчет показывает, что система Пальме
располагает шестью возможными комбинациями для кванторных
значений, которых как раз достаточно, чтобы охватить все
случаи в примере (4).
ДВЕ СИСТЕМЫ, ОСНОВАННЫЕ НА СЕМАНТИЧЕСКИХ СЕТЯХ
До сих пор мы обсуждали проблемы представления
информации только на очень низком и общем уровне. Теперь
мы кратко рассмотрим две конкретных системы, а именно
системы Шенка и Симмонса, и укажем два различных
направления, которые они выбрали, основываясь на
семантических сетях, подчиняющихся, по существу, тем же
самым правилам, которые были нами изложены.
система шенка
Уже давно ведется спор по поводу необходимости
использования компонентных (primitive) представлений, то
есть таких, в которых все понятия могут быть разбиты на
понятия-компоненты, причем последние образуют
небольшой конечный набор. Двумя главными сторонниками
использования таких компонентов выступают Уилкс (см.
часть II статьи Уилкса) и Шенк. Теория Шенка, известная
как теория концептуальных зависимостей, является одной
из наиболее совершенных попыток создания набора правил,
точно определяющих, что может появиться в репрезентации,
подобной семантической сети. В своем нынешнем варианте,
называемом MARGIE (Schank et al., 1973), система
Шенка включает анализатор английского языка, созданный
Ризбеком (Riesbeck, 1974), подсистему семантической
памяти Ригера (Rieger, 1974) и генератор английского
языка Голдмана (Goldman, 1974). MARGIE работает
в двух режимах: в режиме перифразирования и в режиме
вывода умозаключений. (Возможности данной системы в
плане вывода умозаключений обсуждаются во второй статье
Чарняка.) Для режима перифразирования типичным при-
264
мером является следующий:
INPUT: John killed Mary by choking Mary.
ВХОД: 'Джон убил Мэри, задушив Мэри.1
OUTPUT: John strangled Mary.
John choked Mary and she died because she
'could not breathe.
Mary died because she was unable to inhale
some a i r and she was unable to inhale some
"air because John grabbed her neck.
ВЫХОД: 'Джон удавил Мэри.'
'Джон задушил Мэри, и она умерла, потому
что она не могла дышать.'
'Мэри умерла, потому что она была не в
состоянии вдохнуть воздух, и она была не в
состоянии вдохнуть воздух, так как Джон
схватил ее за горло.'
Шенк стремился дать такое представление значения, в
терминах которого можно было бы решать эти и другие
задачи, например задачу машинного перевода;
представление, которое, кроме того, было бы независимо от
конкретного языка, от синтаксиса, а также от каких бы то ни было
поверхностных структур. (Это сильно сближает систему
Шенка с моделью представления памяти.)
Формальная структура графов Шенка та же, что в
грамматике зависимостей (Hays, 1964), а элементы (узлы)
в графе могут принадлежать к четырем типам, или
концептуальным категориям. Они обозначаются аббревиатурами
РР, ACT, РА и АА и примерно соотносятся —
соответственно — с существительным, глаголом, прилагательным
и наречием. Правда, это значительное упрощение,
сделанное только для того, чтобы дать краткое и независимое
описание. На самом же деле многие английские
существительные в теории концептуальных зависимостей представляются
как действия (ACTs), например hunt 'охота'. Эти единицы
объединяются и образуют базисную структуру,
"концептуализацию", которая очень близка к предикатным
структурам. Концептуализация для The man took a book
'Человек взял книгу' выглядит примерно так:
(8) Man , ? . take О book
'человек' 1 ' • 'брать' «- 'книга'
255
Для тех, кто не знаком с падежной нотацией Шенка *,
поясним, что <=> означает, что Man находится в падеже
о
ACTOR, а < указывает на падеж ОБЪЕКТа. Можно
сказать, что и человек, и книга находятся в зависимости
от центрального АКТа (take 'брать'). Наконец, "Р"
означает прошедшее время. Для соединения концептуальных
категорий разработан тщательно продуманный синтаксис,
который будет описан ниже лишь частично.
Отметим сходство между (8) и (9).
(9)
take
\ act-of
time \
agent object
^ \
man book
Главное различие состоит в том, что (9) использует
предикатную структуру, тогда как в (8) ее нет, но при машинной
реализации (8) фактически используются предикатные
структуры по причинам, упоминавшимся выше в данной
статье.
Ядром нотации Шенка являются его 11 базисных, или
"элементарных" (primitive), действий. Это PROPEL
'приводить в движение', MOVE 'двигать', INGEST 'глотать',
EXPEL 'выталкивать', GRASP 'схватывать', PTRANS
'физически перемещать', MTRANS 'ментально перемещать',
ATRANS 'передавать', SPEAK 'говорить', ATTEND
'присутствовать' и MBUILD 'ментально создавать'. Существует
также недостаточный глагол DO 'делать'. Точное число
здесь не важно, так как оно может меняться. Но важно то,
что это число весьма незначительно. Шенк считает, что
этих элементарных действий вместе с небольшим (но пока
еще не установленным) числом состояний вполне
достаточно для того, чтобы представить значения всех глаголов.
* Детальное описание теории концептуальных зависимостей см,
в книге: Шенк Р, Обработка концептуальной информации, М.,
1980.— Прим. ред.
256
Лучше всего пояснить использование этой нотации путем
рассмотрения нескольких примеров (в порядке
возрастающей трудности).
Наш пример (8) (The man took a book) в
действительности будет выглядеть так:
Это соответствует примерно следующему: The man
Physically TRANSferred the book from some unknown
location to himself. 4[Этот] человек Физически ПЕРЕ-
местил [определенную] книгу из какого-то неизвестного
места к себе.'
John killed his teacher
'Джон убил своего учителя'
Очевидно сходство этого представления с
представлением в порождающей семантике (cause to be dead 'каузи-
ровать быть мертвым').
I saw John eating soup
'Я увидел, что Джон ест суп'. (См. схему на с. 258.)
Чтобы понять этот пример, обратимся сначала к его левой
половине. Здесь говорится, в сущности, что «я ментально
ПЕРЕместил (MTRANS) информацию из моих глаз (eyes)
в мой концептуальный процессор (СР) и информация,
которая переместилась, состояла в том, что Джон ест суп
(soup)». В правой половине говорится, что the way this
information transfer was accomplished was by ATTENDing
my eye from some unknown location to John and the soup.
9 № 584
257
'способ, которым было выполнено перемещение этой ий-
формации, состоял в обращении (ATTEND) моих глаз от
некоторого неизвестного места к Джону и супу'.
I saw John eating soup
I
Шенк разработал правила, которые задают правильно
построенные концептуализации. Так, например,
элементарный акт INGEST должен иметь в качестве своего
инструмента акт PTRANS. Существуют также умозаключения,
которые должны быть истинными для любого АКТа,
классифицируемого как действие INGEST, например:
проглоченная вещь меняет форму; если проглоченная вещь
съедобна, проглотивший ее становится "более сытым" и т. д.
Чтобы увидеть, как эти правила работают, давайте
посмотрим, как строятся полные концептуализации.
John ate a fig
'Джон съел фигу'
Основная дефиниция для eat 'есть' следующая:
о
X С ) INGEST < Y
Мы можем рассматривать эту запись как активное
образование с пробелами, которые программа пытается заполнить
на основе анализа контекста, в составе которого была
активизирована эта дефиниция. Так, заполняя переменные в
контексте нашего предложения, мы получаем:
о
John <' > ingest < fia
258
Но это не все. Одно из правил, определяющих
правильные концептуализации, гласит: все АКТы имеют
инструменты; но на приведенной выше схеме они отсутствуют.
Более того, INGEST определяет, что его инструментом
всегда является PTRANS Y to the mouth of X 'физическое
перемещение Y-a ко рту Х-а' (или, что менее вероятно,
движение рта к этому объекту). Это дает:
John
0 *
John ( ■■■■■■) INGEST < fig <
PTRANS
Ь
POSS-BY
mouth < f John
Из этого, если мы захотим, можно выводить дальнейшие
умозаключения типа упомянутых выше. Что важно
отметить, так это то, как далеко удалена эта полная
концептуализация от исходного предложения.
система симмонса
В отличие от Шенка, Симмонс не считает, что все
описания должны представляться на уровне компонентов
(primitives). Но он накладывает вполне определенную
структуру на свои сети, в которой многое связано с его
конкретной падежной системой. Типичным примером является
предложение:
John broke the window with a hammer.
'Джон разбил окно молотком.'
Симмонс представляет это предложение как сеть с
узлами С 1, С 2, С 3, С 4, соотносимыми с подходящими
смыслами слов "John", "break" 'разбивать', "window" 'окно',
"hammer" 'молоток' соответственно. Отношения между
узлами помечаются посредством одного из "глубинных
9*
259
падежных отношений1'. CAUSAL-ACT ANT (CA1, CA2)
'каузальный актант', THEME 'тема', LOCUS 'место',
SOURCE 'источник' и GOAL 'цель'. Так, в (10) John
является первым каузальным актантом (СА1) действия
разбивания, молоток рассматривается как второй каузальный
актант (СА2) этого действия, а окно выступает как тема
разбивания. Таким образом, ядро анализа можно
представить с помощью следующей схемы:
(1°) JohnC2
^CAt
>СА2
Break Ct » Hammer
C4
THEME
Window C3
или (для внутримашинного представления) — с помощью
набора троек отношений:
(Cl СА1 С2) (Cl СА2 С4) (Cl THEME СЗ)
Однако это еще не полное представление, и наше
использование в схеме словесных помет вводит в заблуждение,
поскольку узлы по замыслу должны быть чем-то вроде того,
что мы раньше называли понятиями-элементами (tokens).
(Симмонс говорит, что узел представляет "контекстуальное
значение слова") Эти элементы связаны со смыслами
конкретных слов посредством отношения ТОК ('быть
представителем'), которое в грубом приближении эквивалентно
отношению ISA, то есть, например, упоминание слова the
bank (в значении учреждения) будет представлено в сети
посредством, скажем, С55, которое будет связано
отношением ТОК со смыслом слова "bank", соотносящимся с
местом, где обычно хранят деньги. Конечно, оно не будет прямо
связано со словом bank в целом, которое в действительности
является неоднозначным. В реализации этой модели
смыслы слов будут представлены как отдельные лексические
единицы (entries), которым будут присвоены условные
имена типа L97. Для конкретного смысла "apple" 'яблоко'
Симмонс предлагает следующий ассоциируемый с ним набор
синтаксических и семантических признаков:
s
260
(ll)NBR (number) 'число' —S (singular) 'единственное*
SHAPE 'форма' —spherical 'сферическая'
COLOR 'цвет' — red 'красный*
PRINTIMAGE 'печат- —apple 'яблоко'
ный вид'
THEME 'тема' —eat 'есть'
SYNTACTIC-CATEGORY—noun'существительное'и т.д.
'синтаксическая категория'.
Возвращаясь к нашему примеру John broke the window,
можно дать следующую полную репрезентацию,
включающую отношения ТОК:
(Cl ТОК breaK) (Cl СА1 С2) (Cl THEME C3) (Cl CA2 C4)
(C2 ТОК John) (C2 DET Def) (C2 NBR S)
(C3 ТОК window) (C3 DET Def) (C3 NBR S)
(C4 ТОК hammer) (C4 DET Indef) (C4 NBR S) (C4 PREP
with)
(Здесь DET — 'детерминация', Def — 'определенная',
Indef—'неопределенная', PREP—'предлог').
261
Сеть в (12) также является представлением и для
следующих предложений, которые могут мыслиться в
качестве поверхностных вариантов единой "глубинной"
(underlying) структуры:
John broke the window with a hammer.
'Джон разбил окно молотком.'
John broke the window. 'Джон разбил окно.'
The hammer broke the window. 'Молоток разбил окно.'
The window broke. 'Окно разбилось'.
Ясно, что метод Симмонса, приписывающий некоторый
узел определенному смыслу слова, в любом случае не
является системой, основанной на компонентном подходе,
как у Шенка. Зато Симмонс использует систему правил
перифразирования, которая, по замыслу, позволяет
переходить от одной сети к другой, причем эти переходы, как
он считает, эквивалентны введению в систему компонентов.
Так, в Simmons, 1973 рассматриваются предложения:
John bought the boat from Mary.
'Джон купил лодку у Мери.'
Mary sold the boat to John.
'Мери продала лодку Джону.',
которые обычно считаются близкими перифразами друг
друга. Однако его система будет представлять их
различно.
Cl ТОК buy, SOURCE (Mary), GOAL (John), THEME
(boat)
Cl ТОК sell, SOURCE (Mary), GOAL (John), THEME
(boat)
Используя нотацию Симмонса, мы можем, однако, получить
и единую репрезентацию для обоих предложений, введя
элементарное действие transfer 'перемещать':
Cl ТОК and, Args С2 , СЗ
С2 ТОК transfer, SOURCE (John), GOAL (Mary),
THEME (money)
СЗ ТОК transfer, SOURCE (Mary), GOAL (John), THEME
(boat)
Симмонс останавливается на первом варианте
представления и на правилах перифразирования для получения одной
формы из другой.
Должно быть ясно, что представление Симмонса гораздо
ближе к естественному языку, чем представление Шенка,
и не только потому, что он избегает введения компонентов,
262
но еще и потому, что в его системе элементы (tokens) —это
представители лексических значений. Иногда
это приводит к непредвиденным проблемам. Вернемся к
(11). Существуют признаки, приписанные apple, которые
описывают яблоко, признаки, которые описывают
машинные характеристики, например PRINT-IMAGE, и,
наконец, признаки, описывающие роль, которую играет это
слово в синтаксисе. Симмонс, конечно, не единственный,
кто ставит в один ряд такие несопоставимые единицы.
Тем не менее мы полагаем, что подобный подход может
привести только к затруднениям. Если мы запрашиваем
информацию о яблоке, мы, конечно, не захотим, чтобы нам
говорили о его печатном виде.
ОРГАНИЗАЦИЯ
Расширения, обсуждавшиеся до сих пор, касались очень
конкретного уровня дробления информации. Что же можно
сказать о всеобъемлющей организации памяти и о
представлении более сложных идей, таких, как описания
физических объектов или серии событий?
Различные взгляды, выражаемые разными
исследователями о высших уровнях организации памяти, по-видимому,
отражают те или иные пристрастия их сторонников в
области психологической теории или теории использования
вычислительной техники. Иначе говоря, на организацию
памяти влияют как соображения, связанные с механизмами
вывода умозаключений, так и желание точно
моделировать интеллектуальное поведение человека. Начнем с
простого примера, попытаемся установить, каково могло бы
быть представление для понятия large block 'большой
блок'. Можно было бы ожидать, что такая простая вещь
не должна быть предметом спора. Однако для этого понятия
возможны два представления:
263
Главное различие состоит в том, что (13б) предполагает
существование понятия "large block" как класса вещей,
тогда как (13а) этого не предполагает. Число возможных
представлений увеличится, если мы добавим новые
прилагательные. В теории "не-классных" понятий a large red
block 'большой красный блок' представляется очевидным
способом:
Однако при использовании "классных" понятий
допускаются три других возможности (см. рис. 14а, б, в).
Ни одна из этих структур не является безупречной.(14а) не
соотносит понятие "large red block" с понятием "large block".
Автор же полагает, что эти понятия должны быть связаны
эксплицитно. (14б) отражает тот факт, что данный блок
фактически является красным блоком, но не может отразить
симметричный факт, состоящий в том, что это точно так же
и большой блок. Когда будут использоваться более чем
два определяющих свойства, то при построении схем типа
(14в) проектировщик системы будет сталкиваться с ком-
264
бинаторным взрывом, либо ему придется иметь дело с
очень сложной проблемой выбора: он должен будет
определить, какие из нескольких возможных отношений
теоретико-множественного включения должны быть
эксплицированы.
(14) в)
Сходная проблема, касающаяся как "классных", так
и "не-классных" представлений, возникает в случае, когда
подмножество определяется посредством двух свойств,
которые не являются независимыми друг от друга.
Например, блок, который является фактически многоцветным,
может быть представлен следующим образом:
(15)
Но из соглашений, которые использовались до сих пор,
следует, что данный блок является сплошь красным
и сплошь синим. Один из способов выбраться из
этого противоречия — представить blue and red block
'синий и красный блок' следующим образом:
265
AND
RED
Другая альтернатива: используя для представления blue
and red block схему (15), ввести правило о том, что
определенные связанные свойства (например, идентичные) не
могут применяться к узлу порознь.
Вопрос о выборе представления затемняется еще более
в случае семантической записи идиом или тонких
вариантов общих понятий. Выражение very red nose 'очень
красный нос' должно иметь представление, которое
показывает, что хотя фактически речь идет о красном носе, но
его краснота в данном случае есть нечто особое. Black men
'чернокожие люди' обозначает не множество людей,
имеющих кожу черного цвета, а людей, которые обладают
определенным набором характеристик, и в их число не
обязательно входит чернота. (Вероятно, на самом деле этот
вопрос относится к проблематике автоматического анализа.)
События также объединяются в группы для
образования более сложных событий. Какой более высокий уровень
организации был предложен для сложных событий? Для
того чтобы говорить о такой организации, давайте
предположим, что у нас есть некоторое представление для
действий и простых конструктов, скажем, типа шенковского.
Это значит, что мы определили, какие отношения мы будем
допускать и в каких комбинациях, а также имена наших
элементарных действий. Далее, предположим, что мы
условились о переводах "наивных понятий" (everyday
concepts) на язык этого представления, то есть мы имеем
некоторую структуру для sweet 'сладкий', для buy 'покупать'
и т. д. В связи с этим нам сейчас нужна теория более
сложных действий. Например, как соединить описания
различных подэтапов процесса приготовления торта в единое
описание всеобъемлющего действия приготовления торта.
266
Норман определяет сложное действие в семантической
сети путем описания его как упорядоченного списка
подэтапов, необходимых для выполнения этого действия.
Довольно интересно то, что он может описывать подобным
путем также действия, которые оперируют базой данных.
Например, определением для establish 'устанавливать';
'создавать'; 'учреждать' (у него это процедура, которая
должна гарантировать, что тройка "arb" находится в базе
данных) является следующая сеть:
Интерпретацией этой сети является программа для
определяемого в ней понятия ESTABLISH. Программа
принимает три параметра а, г и b. Определение отношения
(команды) is when состоит в том, что программа сначала
использует блок CONNECT?, чтобы проверить, связывает
ли уже отношение г понятия а и b в базе данных. Если нет
(if по), то а связывается (благодаря действию блока make-
CONNECTed) с b посредством г. Обратите внимание, что
произошло. В приведенном выше представлении с помощью
семантической сети была определена процедура, которая
оперирует данной семантической сетью. В рамках сети
оказывается возможным не только описывать события, но и
определять все способы использования данных (то есть ме-
267
ханизмы вывода умозаключений). С одной стороны,
описание ESTABLISH является частью данных, потому что оно
представлено в семантической сети, с другой стороны,
оно одновременно является процедурой.
Итак, мы косвенным образом подошли к спору о
представлении данных. Есть исследователи, которые
утверждают, что всякое знание хранится в форме процедур, и
другие ученые, которые заявляют, что оно хранится как
собрание фактов. В системе Нормана это разграничение
умышленно затемняется (автор считает, что так и следует
поступать). Различные исследователи придерживаются той или
иной крайней точки зрения и приводят много примеров в
поддержку своего мнения. Одним из серии таких
прототипических примеров является вопрос об определении дуги. С
одной стороны, сторонники процедурного подхода говорят
о том, что способ представления знания о дуге должен
заключаться в создании программы, скажем, для ее
распознавания. Сторонники фактографического подхода полагают,
что нужно просто иметь описание обобщенной дуги. Если
посмотреть с этой точки зрения на расхождения между
Симмонсом и Шенком, то обнаружится, что эти
расхождения являются фактически вариантом указанного спора.
Шенк хочет иметь универсальное (для любых целей)
представление, тогда как Симмонс хочет иметь процедуры для
перехода от одного представления к другому.
Из хорошо известных программ программа Винограда
является, пожалуй, наиболее зависимой от процедурного
знания (см.ч. первую статьи Уилкса). Первоначальное
применение семантических сетей отличалось сильной
ориентацией на данные, а не на процедуры. Автор настоящей статьи
придерживается мнения, что информация должна храниться
в той форме, которая является наиболее удобной. Данные,
которые хранятся в виде процедур, чаще всего несут на себе
слишком сильный отпечаток специфических целей и задач
по использованию информации. Лучше хранить
информацию о том, что стол красный, чем хранить информацию о
том, как определить, что стол красный. А что если нам
понадобится узнать, является ли стол зеленым? А как быть
с альтернативными методами узнавания (для слепого
человека, например)? Высказанное общее наблюдение имеет,
конечно, отклонения. Таким отклонением является,
например, ситуация типа той, что наблюдается у Нормана,
где обе формы сосуществуют в качестве различных спосо-
268
бов рассмотрения одной и той же репрезентации. Другое
исключение касается информации о действиях.
В системе LUIGI (Scragg, 1974) для хранения
информации о действиях используются неопределенные (в
смысле ориентации на данные или на процедуры)
представления. Система была построена в рамках системы Нормана
MEMOD. Система LUIGI знала, как выполнять
(фактически имитировать) различные человеческие действия типа
поджаривания хлеба, приготовления спагетти или уборки
кухни. Информация о том, как выполнять эти действия,
хранилась в форме процедур. Однако эти процедуры могли
использоваться и в качестве данных другими частями
системы для ответов на вопросы типа "How do you make a ham
and cheese sandwich?" 'Как Вы делаете бутерброд с
ветчиной и сыром?', "How many utensils do you use if you make
a mushroom omelette?" 'Сколько предметов кухонной утвари
Вы используете, если Вы готовите грибной омлет?', "Why
did Don use a knife?" 'Почему Дон пользовался ножом?'
или даже на вопрос "Did anyone do anything which would
have moved the bread?" 'Сделал ли кто-то нечто, чтобы хлеб
передвинулся?', который был самостоятельно порожден
программой LUI Gl после того, как ей не удалось ответить
на вопрос "Where is the bread?" Тде хлеб?' с помощью более
простых средств. Поскольку все моделирующие процедуры
вполне доступны для стандартных подпрограмм,
осуществляющих ответы на вопросы, то эти процедуры могут
детально обследоваться, могут предсказываться их
побочные результаты и даже могут вычисляться необходимые
для них предварительные условия, если они эксплицитно
не упоминаются.
Например, чтобы ответить на вопрос:
How do you make a ham and cheese sandwich?
'Как Вы делаете бутерброд с ветчиной и сыром?'
система должна исследовать свою собственную программу,
которую она использовала бы, если бы ей было приказано
сделать бутерброд. На каждом шаге программы она должна
определять, является ли он тем шагом, который должен
быть упомянут. Затем она порождает описание данного
шага, имея в виду, что исполнителем будет она сама (то
есть система) и что бутерброд будет сделан с ветчиной и
сыром. Ее конечным выходом является;
269
IF I WERE TO MAKE A SANDWICH
THEN I WOULD DO THE FOLLOWING THINQS:
I PLACE SLICE OF BREAD ON THE COUNTER
I SPREAD MUSTARD ON THE BREAD
I PLACE HAM ON THE BREAD
I PLACE CHEESE ON THE BREAD
I PLACE LETTUCE ON THE BREAD
I PLACE SECOND PIECE OF BREAD ON THE BREAD
'если бы я должна была сделать бутерброд,
то я сделала бы следующие вещи:
я кладу ломтик хлеба на стойку,
я намазываю горчицу на хлеб,
я кладу ветчину на хлеб,
я кладу сыр на хлеб,
я кладу салат на хлеб,
я кладу на хлеб второй кусочек хлеба'
Главным моментом здесь является то, что для описания
сложных действий, пригодных для удовлетворения
многочисленных целей, может использоваться единое
представление, которое ориентировано как на данные, так и на
процедуры. Недавно (Scragg, 1975) такого рода
представление было развито в сеть, которая включает
альтернативные методы и независимый порядок шагов, а также
информацию о причинах и результатах и информацию о
привязке к остальной части базы данных. Расширенная сеть
должна быть соединена с такой интерпретирующей
программой, которая не нуждается в фиксированном порядке
для шагов, но может выбирать его или наугад или на основе
некоторой мотивации. Отсутствие фиксированного
алгоритма, возможно, сделает систему решения
интеллектуальных задач более похожей на человека, чем
первоначальный вариант системы LUIGI. Но здесь мы уже переходим к
структурам данных весьма высокого уровня (см. об этом
вторую часть статьи Чарняка).
ЛИТЕРАТУРА
Bischof, W. F. Psychology of Language and Memory.— In:
"Computational Semantics". Amsterdam etc., 1976, p. 185—204.
270
Goldman, N. M. Computer Generation oî Natural Language trom
a Deep Conceptual Base.— In: "Memoranda from the Istituto per gli Studi
Semantici e Cognitive, 2, Switzerland, Castagnola, 1974.
Hays, D. Dependency Theory: A Formalism and Some
Observation.--"Language", No 40, 1964, p. 511—525.
Norman, D. A., Rumelhart, D. E. and The LNR
Research Group. Explorations in Cognition. San Francisco: Freeman,
1975.
Palme, J. The SQAP data base for natural language information.
(Report No. C8376—M3(E5)). (Research Institute of National Defense),
Stockholm, 1973.
Quillian, M. R. Semantic Memory,— In: Minsky (ed.)
Semantic Information Processing4'. Cambridge, Mass., MIT Press, 1968,
p. 227—270.
Rieger, C. Conceptual Memory. (Неопубликованная
докторская диссертация). Stanford University, 1974.
Riesbeck, CK. Computational Understanding: Analysis
Sentences and Context.—- In: "Memoranda from the Istituto per gli Studi
Semantici e Cognitivi", 4. Switzerland, Castagnola, 1974.
Sandewall, E. Formal Methods in the Design of
Question-Answering Systems. Report 28. (Department of Computer Sciences. Uppsala
University), 1970.
Schank, R., G old man, N., Rieger, C. and Riesbeck, R.
MARGIE: Memory, Analysis, Response, Generation and Inference on
English.— In: "Advanced papers for the Third International Joint
Conference in Artificial Intelligence", USA, Stanford, 1973 (SRI, Menlo Park,
1973).
Schubert, L. K. Extending the Expressive Power of Semantic
Networks.— In: "Advanced papers for the Fourth International Joint
Conference in Artificial Intelligence", USSR, Tbilisi, 1975 (MIT,
Cambridge, Mass., 1975).
Scragg, G. W. LUIGI: An English Question Answering Program.
(Center for Human Information Processing. San Diego, California,
1973.
Scragg, G. W. Answering Questions About Processes. (University
of California Thesis), 1974, а также частично в: Norman,
Rumelh art et al. Explorations in Cognition. San Francisco, Freeman, 1975,
p. 349—375.
Scragg, G. W. A Structure for Actions.— In: "Memoranda from
the Istituto per gli Studi Semantici e Cognitivi", Switzerland, Castagnola,
1975.
Simmons, R. F. Semantic Networks: Their Computation and
Use for Understanding English Sentences.— In: "Computer Models of
Thought and Language", ed.by Schank and Colby. San Francisco,
Freeman, 1973.
371
Ю. Чарняк
УМОЗАКЛЮЧЕНИЯ И ЗНАНИЯ
(ЧАСТЬ II)*
СИСТЕМА, БАЗИРУЮЩАЯСЯ НА "ДЕМОНАХ"
В конце нашей первой статьи мы рассмотрели язык
программирования PLANNER. Мы отметили, что в этом языке
имеются определенные средства для вывода умозаключений
и представления знаний. Но насколько удачны эти
средства? Один из недостатков языка PLANNER был уже
отмечен выше. Поскольку PLANNER — это и язык
программирования, и теория использования знаний, его можно
реализовать самыми разнообразными способами, при этом
весьма трудно усмотреть конкретные ограничения,
диктуемые данным языком. Подобная гибкость является
достоинством для языка программирования, но делает слабой
соответствующую теорию. Итак, первый недостаток языка
PLANNER как теории представления знаний и вывода
умозаключений состоит в том, что это теория с большой
степенью неопределенности.
Естественно, что названный недостаток затрудняет
определение других недостатков. Для того чтобы выявить
их, нам придется отвлечься от самого языка PLANNER
и рассмотреть способы его использования. В частности, мы
остановимся на работе Чарняка, посвященной анализу
детских рассказов (Charniak, 1972).
Это поможет нам показать, что некоторые недостатки
названной модели, в сущности, являются недостатками
языка PLANNER как такового.
Задача модели (или системы) Чарняка совпадает с одной
из задач, о которой говорилось в нашей первой статье:
она состоит в генерации разумных ответов на вопросы по
достаточно простым исходным текстам (детским рассказам).
* Eugene Charniak. Inference and Knowledge. Part 2.—In:
E. Charniak and Y. Wilks (eds.). Computational Semantics.
Amsterdam etc., 1978, p. 129—154.
© North-Holland Publishing Company (1976),
272
Пример такого текста:
Janet needed some money. She got her piggy bank
(PB), and started to shake it. Finally some money
came out.
'Дженет были нужны деньги. Она достала свою
копилку и начала трясти ее. Наконец деньги
высыпались.'
Типичными вопросами будут следующие:
Why did Janet get the PB?
'Почему Дженет достала копилку?'
Did Janet get the money?
'Достала ли Дженет деньги?'
Why was the PB shaken?
'Почему трясли копилку?'
Читателю следует отметить, что для нахождения ответов на
подобные вопросы нужны знания о мире действительности.
Данная модель направлена исключительно на решение
задачи использования необходимых знаний о
действительности при выводе умозаключений, тогда как проблемы,
касающиеся естественного языка как такового, специально
не рассматриваются. В особенности это касается
синтаксиса; правда, в модели отчасти отражаются проблемы,
которые лежат на стыке между синтаксисом и теорией
умозаключений (например, установление кореферентных
связей для именных групп), но здесь мы эти проблемы
затрагивать не будем.
Мы исходим из того, что рассказ, подающийся на вход
модели, сразу же преобразуется в семантическое
представление, удобное для вывода умозаключений. Семантическим
представлением фразы будем называть набор утверждений,
записанных на языке MICRO-PLANNER. Модель будет
пытаться "заполнить пробелы" рассказа, анализируя его
пофразно. Так, она будет пытаться устанавливать связи
между событиями рассказа (обычно это причинные связи)
и вставлять пропущенные факты там, где это покажется
важным.
"ДЕМОНЫ" и базовые стандартные подпрограммы
Рассмотрим следующий факт:
(1) If "it is (or will be) raining" and if "person P is
outside" then "P will get wet".
273
'Если "идет (пойдет) дождь" и если "лицо Р
находится на улице", то "Р промокнет".'
У всех нас есть интуитивное убеждение, что (1) — это
факт о "дожде", а не, скажем, об "улице". На улице
случаются разные вещи, и то, что некто промокнет,— лишь
одна из них. С другой стороны, во время дождя происходит
лишь ограниченный набор событий.
Мы вводим это убеждение в нашу систему, приписывая
правило (1) единице rain 'дождь' с тем, чтобы при
появлении в рассказе понятия "rain", встал вопрос о возможности
использования правила (1). Будем говорить, что rain —
это понятие -тема (или центральное понятие; topic concept)
для правила (1). Когда в рассказе встречается некоторое
понятие-тема, факты, приписанные этому понятию, могут
быть использованы при выводе умозаключений. (Будем
также говорить, что эти факты подаются на вход аппарата
умозаключений в качестве исходных утверждений.) Итак, если
понятие-тема, например "цирк", не встретилось, то
программа не сможет обратиться к тем фактам, которые
приписаны именно этому понятию.
Отметим, однако, что мы не требуем непосредственного
упоминания в тексте слова rain, прежде чем мы сможем
использовать (1). Необходимо только, чтобы в базу данных
было введено утверждение о "дожде". Сформировать же
утверждение о том, что идет дождь, программа может под
воздействием фактов, содержащихся в других частях
рассказа, например:
One afternoon Jack was outside playing with Bill.
Bill looked up and noticed that the sky was getting
dark. "I think we should stop" said Bill. "We will
get wet if we keep playing".
'Однажды днем Джек играл на улице с Биллом.
Билл посмотрел вверх и заметил, что небо темнеет.
"Я думаю,нам надо остановиться,— сказал Билл.—
Если мы будем продолжать играть, мы промокнем".'
В этом примере предполагается, что если небо днем
потемнело, то это означает приближение дождя. Если данное
соотношение занесено в базу данных, то этого будет
достаточно для того, чтобы вызвать факты, приписанные
понятию "дождь".
Отметим также, что понятие-тема не обязательно должно
274
иметь однословную манифестацию в качестве "ключевого
слова". Существуют факты, к которым система может
обратиться только через сложный набор связей в базе данных.
Факт может быть сколь угодно сложным, он может также
активизировать другие факты в зависимости от наличия
или отсутствия определенных отношений в рассказе.
Проспективный и ретроспективный поиск. Не исключен
случай обращения системы к некоторому факту тогда,
когда мы еще не располагаем всей информацией,
необходимой для его использования. Важно иметь в виду, что
мы делаем умозаключения в процессе движения по тексту.
Поэтому, если требуемая информация поступает лишь после
того, как было вызвано соответствующее правило, мы
должны осуществлять вывод умозаключений в том месте, где
накоплена информация. Так, могут встретиться обе
последовательности:
(2) Jack was outside. It was raining.
'Джек был на улице. Шел дождь.'
(3) It was raining. Jack was outside.
'Шел дождь. Джек был на улице.'
Пример (2) не содержит трудностей. В тот момент, когда мы
вводим понятие дождя, в нашем распоряжении имеется
достаточная информация для использования правила (1)
и вывода умозаключения о том, что Джек должен
промокнуть. В примере же (3) мы узнаем о том, что Джек был на
улице уже после упоминания о дожде. Если мы хотим
применить правило (1), мы должны уметь просматривать
дальнейший текст в поисках нужного нам факта. Для этого мы
будем представлять факты в форме антецедентных теорем
языка PLANNER, таким образом, чтобы факт состоял из
двух частей — образца и "тела" (последнее может быть
любой программой на языке PLANNER). "Тело" теоремы
применяется только тогда, когда в базу данных вводится
утверждение, отвечающее образцу этой теоремы. Для (1)
образцом будет "некто, находящийся на улице". Поэтому,
когда при анализе текста (3) мы обращаемся к (1), в базе
данных еще нет утверждения, которое отвечало бы образцу.
Однако нужное нам утверждение содержится в следующей
фразе, и потому программа, выводящая соответствующий
факт, срабатывает. Мы будем называть поиск некоторого
факта проспективным, когда понятие-тема встречается в
тексте раньше, чем утверждение, отвечающее образцу. Те
275
же случаи, когда утверждение, отвечающее образцу,
предшествует понятию-теме, будем называть ретроспективным
поиском (как в тексте (2)). (Это незначительное расширение
антецедентных теорем в MICRO-PLANNER, которые могут
пользоваться только проспективным поиском.)
Покажем на ряде примеров, насколько важную роль
играет проспективный поиск.
(4) Janet was thinking of getting Jack a ball for his
birthday. When she told Penny, Penny said, "Don't
do that. Jack has a ball",
'Дженет собралась подарить Джеку на день
рождения мяч. Когда она сказала об этом Пенни, Пенни
ответила: "Не делай этого. У Джека есть мяч",'
Здесь фраза Jack has a ball 'У Джека есть мяч'
интерпретируется в том смысле, что Джеку не нужен второй мяч.
Общеизвестен факт, что во многих случаях человек,
имеющий X, не хочет получить еще один X. Этот факт, возможно,
следует отнести к информации о том, "чем
руководствоваться при выборе подарков". В нашем случае
соответствующая ситуация была упомянута в предыдущей фразе,
где было сказано, что Дженет собиралась сделать Джеку
подарок.
(5) Bill offered to trade his pocket knife for Jack's dog
Tip. Jack said "I will ask Janet. Tip is her dog too".
'Билл предложил обменять свой перочинный нож на
собаку Джека по кличке Тип. Джек сказал: "Я
посоветуюсь с Дженет. Тип — это и ее собака".'
Последняя фраза интерпретируется как причина, в связи
с которой Джек должен посоветоваться с Дженет, и
является информацией об отношениях между обменом и
собственностью.
(6) Janet wanted to get some money. She found her pig-
gybank and started to shake it. She didn't hear
anything.
'Дженет нужны были деньги. Она нашла свою
копилку и начала трясти ее. Она ничего не услышала.'
Последняя фраза означает, что копилка была пуста, что
следует из знаний о копилках.
В каждом из приведенных примеров информация,
используемая для получения нужной интерпретации, со-
276
держится в одной из предшествующих фраз. Так, в
примере (4) фраза Jack has a ball 'У Джека есть мяч' сама по
себе не означает, что "не надо давать ему второй мяч".
Если бы это было так, нам бы понадобилась специальная
проверка для отсечения этого умозаключения в ситуациях
типа:
Bill and Dick wanted to play baseball. When Jack
came by Bill said. "There is Jack. He has a ball".
4Билл и Дик хотели поиграть в бейсбол. Когда
мимо проходил Джек, Билл сказал: "Вон Джек.
У него есть мяч".'
Tom asked his father if he would buy him a ball.
"Jack has a ball" said Tom.
'Том спросил отца, купит ли он ему мяч. "У Джека
есть мяч",— сказал Том.'
Bill's ball of string was stuck in the tree. He asked
Jane how he could get it out. Jane said, "You should
hit it with something. Here comes Jack. He has a
ball4'.
'Веревочный клубок Джека застрял на дереве.
Он спросил Джейн, как его достать. Джейн
сказала: "Его надо чем-нибудь вышибить. Вон идет
Джек. У него есть мяч",'
Факты были представлены нами в форме антецедентных
теорем из-за очевидной необходимости проспективного
поиска. Далее, однако, мы будем называть эти факты не
антецедентными теоремами, а "демонами", поскольку это
более короткое и выразительное название.
Спецификация и «выключение» демонов. Следует
подчеркнуть, что модель получает информацию, содержащуюся
в демонах, не в результате самостоятельного "познания".
Эта информация вводится создателем модели. С другой
стороны, демоны не специфичны для того или иного текста,
поскольку в них нет таких единиц, как red ball 'красный
мяч' или Jack 'Джек'. Они содержат обобщенные сведения
типа a person X 'лицо X', которому в одном месте будет
соответствовать имя Джек, а в другом — Билл. Мы
предполагаем наличие механизма связывания некоторых
переменных ("спецификации" демона) в момент, когда данный
демон вводится в действие.
277
Далее, мы хотим, чтобы демоны действовали только
тогда, когда они релевантны для рассказа. Рассказ может
начаться с разговора о подарке Джеку, а потом перейти к
играм, в которые играют дети у него в гостях. Нам нужны
способы "выключения" демонов, которые уже не нужны на
данном этапе рассказа. (Нерелевантный, но действующий
демон не только отнимает время и место, но и может
вызвать неправильную интерпретацию фраз.) В первом
приближении будем считать, что демон объявляется
нерелевантным по окончании обработки определенного
количества фраз в тексте.
Базовые стандартные подпрограммы. До сих пор мы
говорили, что обращение к демонам производится тогда,
когда в тексте встречается соответствующее понятие. Но
из этого следует, что существуют некоторые указатели,
приписанные понятию, которые показывают, к каким
именно демонам следует обратиться.
Если мы обратимся к конкретному примеру, скажем,
примеру (5), мы заметим, что именно предложение Билла
произвести обмен явилось основанием для дальнейшего
хода событий. Мы исходим из того, что информация,
отвечающая за обращение к демонам, записана в форме
подпрограмм. Эти стандартные подпрограммы мы будем
называть "базовыми стандартными подпрограммами'1.
Отношения между базовыми подпрограммами и
демонами можно представить следующим образом:
Базовая стандартная
подпрограмма
[центрального понятия
вызывает
ПРОГРАММА: 1
мм a nciv/inuA 1
(образец) |
Эти базовые подпрограммы отвечают не только за
обращение к демонам. Пусть нам сообщается, что у Джека есть
мяч, а у Билла — волчок. Затем Джек обменивает свой
мяч на волчок Билла. Теперь мы можем задать вопрос:
"Кому сейчас принадлежит волчок?" Поскольку вопросы
владения существенны для наших рассказов, мы хотим быть
в курсе соответствующей информации. В нашем конкрет-
278
ном случае о перемене владельцев предметов нам должно
сигнализировать высказывание с упоминанием понятия
trade 'обмен'.
Итак, каждый раз, когда будет происходить обмен, нам
нужно будет иметь сведения о перемене владельцев;
поэтому при каждом появлении понятия trade мы должны
запускать в действие соответствующую базовую
подпрограмму. Конечно, программа должна быть не столь
прямолинейной, чтобы считать фиксацией обмена такие фразы, как
I will trade... 'Я обменяю...' или Will you trade...? 'Не
обменяешь ли ты...?'
Хорошим тестом для проверки того, следует ли относить
какой-либо факт к базовой подпрограмме или к демону,
может служить то, в скольких фразах выразима
соответствующая информация. (Естественно, мы отвлекаемся от
того, что фразы можно объединять в одну сочинительными
союзами. Речь идет только об интуитивной проверке того,
какое утверждение нам необходимо — сложное или
достаточно простое.) Так, мы видели, что фраза Jack has a ball
4 У Джека есть мяч' сама по себе недостаточна для
умозаключения о том, что Джеку не нужен второй мяч. Поэтому
соответствующее отношение следует отнести к демону, а не к
базовой подпрограмме.
упорядочение фактов во ВРЕМЕНИ и поиск фактов
Состояние в текущий момент и упорядочение фактов во
времени. Мы рассмотрели две части нашей модели —
демоны и базовые подпрограммы. В настоящем разделе будут
описаны две ее оставшиеся части. Вернемся к ситуации,
когда у Джека был мяч, у Билла — волчок, и они обменялись.
Если мы теперь говорим, что у Билла есть мяч, то это
имплицирует отсутствие мяча у Джека. То есть мы должны
некоторым способом убрать из баз ы данных утверждение о
том, что Джек владеет мячом. Однако мы не хотим
полностью забывать об этом факте, так как он нужен нам для
ответов на вопросы о том, кто владел мячом до Билла. Вместо
этого мы хотим пометить соответствующее утверждение как
имевшее место в прошлом. Мы исходим из того, что
существует специальный аппарат, достаточно независимый от
других частей модели, который отвечает за постоянное
обновление информации. Назовем этот аппарат
"упорядочением фактов во времени'1 (book-keeping).
279
Поиск фактов. Чтобы заключить, что один факт сменяет
другой, тоже требуются специальные знания. Пусть мы
имеем:
(7) Jack was in the house. Sometime later he was at the
store.
'Джек был в доме. Некоторое время спустя он был
в магазине.'
Мы хотим, чтобы на вопрос Is Jack in the house? 'Находится
ли Джек в доме?' система отвечала No, he is at the store.
'Нет, он в магазине.' Но как аппарат упорядочения фактов
во времени получит этот ответ? В нем имеется простое
правило, согласно которому ((состояние) А В) сменяет
((состояние) А С), где В=^С. Например, (AT JACK FARM)
'(НА ДЖЕК ФЕРМА)' может сменить (AT JACK NEW-
YORK) '(В Джек Нью-Йорк)'. Но в примере (7) мы не
можем просто искать утверждение AT JACK (someplace
which is not the store) 'В ДЖЕК (некоторое место, не
являющееся магазином >\ поскольку Джек находится именно
в доме. Еще более сложным примером является следующий:
Jack was in the house. Sometime later he was in
the kitchen.
'Джек был в доме. Некоторое время спустя он
был на кухне.'
Для решения этой проблемы нам понадобится теорема (8):
(8) Для того, чтобы установить, что некто (PERSON)
не находится в месте (LOC),
надо выяснить, где находится PERSON, и назвать
это место X.
Если X=LOC, теорема ложна, выдать ответ "нет".
Если X является частью LOC, выдать ответ "нет".
Если LOC является частью X, попытаться найти
другое значение X.
Если другое значение X не найдено, выдать ответ
"да".
Для примера (7) аппарат упорядочения фактов во времени
попытается доказать, что Джек не находится в магазине,
с помощью использования (8) и утверждения, что Джек
находился в доме. Затем первая из двух фраз будет отмечена
как относящаяся к более раннему времени. Теоремы типа
(8) мы будем называть аппаратом "поиска фактов". Они
будут представлены в форме консеквентных теорем языка
280
MICRO-PLANNER. (В частности, это касается (8), которая
упоминалась в нашей первой статье, правда, в форме
антецедентной теоремы.)
Основная идея при введении аппарата поиска фактов
состоит в том, что этот аппарат используется для
нахождения фактов, которые не слишком важны, в связи с чем их
не хотелось бы вводить в базу данных. Например, в случае
(7) нежелательно вводить факт "Джек не находится в доме"
наряду с фактом "Джек находится в магазине". Аппарат
поиска фактов отвечает и за умозаключения типа "(лицо)
знает (факт)", выводимые через посредство вопросов типа
"находилось ли (лицо) в том месте, где произошел (факт),
или присутствовало при его упоминании?" Подобная
информация может легко быть выведена, и в то же время она не
слишком важна, поэтому ее не следует непосредственно
записывать в базу данных.
Таким образом, наша модель имеет следующий вид:
Входное
утверждение
Применение
демонов
с помощью
сравнения
С образцом
Применение
базовых
стандартных
подпрограмм
Применение
аппарата
упорядочения
фактов
во времени
Новые утверждения
Аппарат
поиска фактов
пять вопросов
Чтобы суммировать вышесказанное, вернемся к нашим
пяти вопросам и посмотрим, какие ответы на них дает
рассмотренная модель. Однако при ответе на вопросы
следует быть особенно внимательным, поскольку, как мы
увидим, эта модель (так же как и те, которые будут
рассмотрены ниже) некоторым образом отвечает на все эти
вопросы. Это объясняется тем, что модель воплощена в
машинные программы, а в таком случае опустить тот или
иной вопрос просто невозможно. Все же в нашем изложении
говорилось очень немногое, например о семантическом
представлении, и данная модель в действительности вообще не
включала в себя разработку вопросов, связанных с
семантическим представлением.
281
Выходом из названного противоречия является строгое
разграничение между машинной программой и той теорией,
которая воплощена в машинной программе. В литературе
много говорилось об отношениях между программами и
теориями. К этому мы хотим добавить одно разграничение.
Это разграничение весьма просто. Если лицо Р пишет
программу ИИ, которая выполняет задачу Т, то теорией,
которой руководствуется Р при моделировании Т, являются те
части программы, которые Т считает важными. Из данного
определения следует, что в основе одной программы могут
лежать две разные теории. Это похоже на ситуацию, когда
два человека писали бы одну программу, но
придерживались разных мнений относительно того, какие части
программы важны.
Итак, принимая во внимание названное разраничение,
попытаемся ответить с позиций рассмотренной теории на
наши вопросы.
СЕМАНТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ. О нем наша
теория говорит весьма немногое. В сущности, единственное
позитивное утверждение состоит в том, что не следует
ограничиваться лишь небольшим набором семантических
элементов. Например, в модели используются такие
специфические, неэлементарные понятия, как "дождь", "копилка",
"подарок". Может показаться, что это противоречит
подходу Шенка и Уилкса, которые используют семантические
элементы (см. вторую статью Уилкса). Однако требование
разложения единиц на семантические элементы,
выдвигаемое этими исследователями, не исключает использования
инструментов более высокого уровня. Фактически эти
авторы не отрицают, что применение инструментов более
высокого уровня может оказаться полезным.
ПРИМЕНЕНИЕ УМОЗАКЛЮЧЕНИЙ. Модель
осуществляет только ненаправленный вывод во время
обработки входного текста. Мотивировка такого подхода была
дана выше, при описании аппарата умозаключений. Такой
подход является единственно возможным в модели,
использующей демоны.
ОРГАНИЗАЦИЯ. Теория, представленная выше,— это
прежде всего теория организации. Она утверждает, что
при наличии некоторого утверждения факты, необходимые
для построения умозаключений, связанных с этим
утверждением, выводятся в следующей последовательности:
сначала с использованием базовых стандартных подпро-
282
грамм, а затем — с использованием демонов,
активизированных базовыми подпрограммами. Иначе говоря, в нашей
системе важный' для языка PLANNER принцип вызова
процедур по образцу диктует способ расположения фактов.
МЕХАНИЗМ ВЫВОДА УМОЗАКЛЮЧЕНИЙ.
Согласно рассматриваемой теории, механизмом вывода
служат демоны, записанные на языке MICRO-PLANNER (или
их эквивалент на другом языке программирования). В
дальнейшем мы укажем на недостатки такого подхода, равно
как и на недостатки принятого способа организации.
СОДЕРЖАНИЕ. Модель в своем настоящем виде не
содержит требований о том, что в точности мы должны
знать о тех понятиях, которыми манипулируем, таких, как,
например, "копилка". В принципе можно использовать
модель для формулирования подобных требований, но пока
никаких шагов в этом направлении не делалось.
недостатки модели
Существует много пунктов, по которым описанную
модель нельзя считать удовлетворительной. Но мы
рассмотрим только один из них, поскольку он связан с более
общей проблемой использования языков программирования
высокого уровня как средства для представления теорий
знания и теорий вывода умозаключений.
Рассмотрим такой факт:
(9) Umbrellas are used to keep rain off one's head.
'Зонты используются для того, чтобы уберечь от
дождя голову человека.'
Для введения этого факта в модель мы должны представить
его следующим образом:
(10) Базовая стандартная подпрограмма, которая
активизирует демон: "Возможность дождя".
Образец: Человек достает зонт.
Программа: Если человек может попасть
под дождь, он достает зонт,
чтобы не промокнуть.
Такая процедура будет хорошо работать для примеров типа:
It looked like rain. Jack got his umbrella.
'Казалось, что должен начаться дождь. Джек
достал свой зонт.*
283
Используя механизмы модели, о которых мы не упоминали,
можно справиться и с такими примерами, как
As Jack was leaving the house he heard on the radio
that it might rain. He went to the closet.
4 Когда Джек выходил из дома, он услышал по
радио, что может пойти дождь. Он пошел в
кладовКУ.'
На вопрос о том, зачем Джек пошел в кладовку, система
ответит, что, возможно, он это сделал, чтобы достать зонт.
(Другой возможный ответ состоит в том, что он хотел взять
плащ, но для нас это не существенно, поскольку плащ
также связан с дождем.) Для этого требуется
дополнительный механизм, обладающий способностью объединять
ожидание "доставания зонта" с нашими знаниями о том, где
обычно зонты хранятся, для вывода о том, что Джек
собирается достать свой зонт, хотя слово umbrella 'зонт'
в тексте и не упоминалось.
Трудность заключается в том, что при таком подходе
нельзя правильно понять примеры типа:
(11) Jack began to worry when he realized that everyone
on the street was carrying an umbrella.
'Джек начал волноваться, когда заметил, что
у всех прохожих есть зонты.'
Вопрос: What was Jack worrying about?
'Почему волновался Джек?'
Ответ: That it might rain, and he was without an
umbrella.
'Мог пойти дождь, ay него не было зонта.'
Интуитивно совершенно очевидно, что здесь следует
использовать факт типа (9), однако его формулировка (10),
в том расплывчатом виде, как она записана, ничего не
даст для понимания примера (11). Трудность состоит в
том, что, поскольку (11) не содержит упоминания о дожде,
демон, сформулированный в (10), не будет активизирован.
Другими словами, наличие в (10) указателя, направленного
от понятия "дождь" к понятию "зонт", не означает, что
существует и указатель, направленный в обратном
направлении — от понятия "зонт" к понятию "дождь", в связи с
чем из (11) нельзя перейти к утверждению о возможности
дождя. На самом деле найти решение для подобной
284
проблемы не сложно, например так:
(12)
В (12) утверждается следующее. Имеется заголовок,
относящийся к понятию "зонт", который характеризует
способы использования зонта с помощью указания на набор
фактов такого использования. Использование зонта имеет
указатель, направленный к понятию "зонт", поскольку для
использования зонта необходимо иметь сам зонт.
Отмечается также, что цель использования зонта — защита от
дождя, а защита от дождя в свою очередь может
осуществляться с помощью использования зонта. Подобные
сведения, за исключением фактов, перечисленных под рубрикой
"использование зонта", вовсе не напоминают программы,
или демоны. Скорее, это сложный набор указателей, или,
другими словами, "структура данных". Более того, как
показано в работе (Charniak, 1975а), даже
"использование дождя" нельзя рассматривать как программу, это
скорее фрагмент данных.
Нельзя не признать, что наша аргументация носит
спекулятивный характер. Прежде всего, мы утверждаем, что
надлежащее представление факта (9) имеет форму
фрагмента данных, а не программы, и это указывает на
определенный недостаток системы PLANNER и процедурного
подхода (см. статью Скрэгга в наст, сб.) вообще. Обе части
нашего утверждения открыты для критики. Прежде всего
можно представить себе такое видоизменение демона (10),
которое позволило бы использовать его и при
упоминании единицы umbrella 'зонт'. Это видоизменение не
является простым, поскольку программа должна принимать
во внимание ряд условий, при которых следует
активизировать этот демон, но в принципе оно возможно. В ответ
на возражение такого рода мы можем повторить то, что
мы говорили относительно исчисления предикатов первого
285
порядка: если использование аппарата вступает в
противоречие с внутренними свойствами самого аппарата, то это
с большой вероятностью прогнозирует ошибочность такого
подхода. (Справедливо и то, что четкой границы между
программой и данными не существует. Одним из факторов,
позволяющих судить о том, является ли некоторая
структура программой или данными, служит степень
детерминированности способов использования этой структуры.
Если программу можно использовать более чем одним
способом, то это ставит под сомнение сам ее статус программы.
Попытавшись же модифицировать некоторую программу
таким образом, чтобы она включала структуры типа (11),
можно незаметно для себя превратить эту программу в набор
данных.)
Отметим также, что, отказываясь от использования
демонов для представления единичных фактов типа (9), мы
тем самым отходим от принципа вызова процедур по
образцу, с помощью которого мы получали доступ к важным для
нас фактам. Иначе говоря, поскольку мы больше не
представляем (9) в форме демона, исчезает разграничение
образца и программы, которое придавало смысл концепции
вызова процедур по образцу.
Но когда мы говорим, что (9) следует представлять
в формате данных типа (12), а не в формате демона типа (10),
мы вовсе не утверждаем, что знания вообще не следует
представлять на языке PLANNER. Как было отмечено
выше, PLANNER — это язык программирования, в связи
с чем он обладает значительной гибкостью. Так, один из
путей обхода рассматриваемой трудности состоит в том,
чтобы не выделять утверждения (9) в качестве отдельного
демона, а включить его в программу, содержащую всю
информацию из (12), но записанную на языке PLANNER.
Тогда возражения сведутся к неоднократно повторяемой
нами формуле: вызывает подозрения необходимость
преодолевать свойства, внутренне присущие некоторому
формализму.
ПРОГРАММЫ ФОРМИРОВАНИЯ СУЖДЕНИЙ,
РАБОТАЮЩИЕ С ЕСТЕСТВЕННЫМ ЯЗЫКОМ
Описывая такую область, где известно очень немногое
и работы часто строятся по принципу "попытаемся и
посмотрим, что получится" (а область, о которой идет речь,
286
именно такова), испытываешь естественное желание без
каких-либо обобщений перечислить то, что в этой области
сделано. До сих пор мы избегали подобной манеры
изложения, но сейчас мы позволим себе некоторую вольность
и просто перескажем две работы, которые представляются
особенно интересными. Мы не будем забывать о пяти
вопросах, интересующих нас все время, в остальных же
моментах описание этих работ не будет единообразным.
система макдермотта
Существует тонкое, но весьма интересное различие
между программой МакДермотта TOPLE (1974) и другими
программами, описываемыми в наших статьях. Обычно
системы (например, система понимания детских рассказов)
делают основной упор на аппарат умозаключений,
необходимый для ответа на вопросы по тексту. Основная задача
TOPLE состоит не в выводе умозаключений и не в ответе
на вопросы, а в формировании "системы убеждений"
(believing). Основной вопрос, интересующий МакДермотта,
состоит в следующем: "Каким образом мы приходим к
определенному убеждению (начинаем верить во что-то)?"
Интуитивно представляется, что здесь играет роль
авторитетность источника и степень соответствия новой информации
уже имеющимся убеждениям. МакДермотт исходит из этой
общепринятой концепции и пытается ее расширить. Нас
работа МакДермотта интересует потому, что
рассматриваемый им процесс требует применения умозаключений.
Дальнейшее изложение почти целиком основывается
на описании излюбленного примера МакДермотта. Система
TOPLE способна обрабатывать предложения, относящиеся
к узкой предметной области — "микромиру", в котором
имеются экспериментатор и обезьяна, находящиеся в одной
комнате (ср. микромир системы Т. Винограда SHRDLU).
В системе SHRDLU ситуации относятся к "миру кубиков",
а в системе TOPLE рассматривается проблема "обезьяна
и бананы", описанная МакКарти. Работа МакКарти
состояла в построении аксиоматики знаний, которые
необходимы обезьяне, пытающейся достать подвешенные на
потолке и непосредственно недоступные ей бананы. При
этом имеется ящик, который можно передвигать, что
позволяет обезьяне доставать бананы. МакДермотт не рас-
287
сматривал детали этой ситуации, а просто использовал ее
как достаточно известный пример.
TOPLE воспринимает предложения в настоящем
времени, касающиеся того, что происходит в комнате
обезьяны и пытается "поверить" тому, что ей говорят, проверяя
соответствие новых фактов тем, которые ей уже известны.
В отличие от строго детерминированного "мира кубиков"
(см. часть I статьи Уилкса), TOPLE допускает в своем
мире некоторую неопределенность; это касается, например,
местоположения предметов в комнате или причин, по
которым обезьяна выполнила какое-либо действие. Однако
все станет гораздо понятнее, если мы просто приведем
некоторые примеры работы системы.
Как и Чарняк, МакДермотт не занимался специально
анализом естественного языка, его интересовали только
вопросы кореференции и неоднозначности, поэтому он тоже
принял решение вводить в систему не предложения
английского языка, а их семантические представления. В этих
последних допустимы случаи неоднозначности, которые
система должна разрешать самостоятельно. Мы будем
приводить английские фразы, соответствующие этим
семантическим представлениям.
The banana is under the table, by the ball.
'Банан находится под столом, рядом с мячом.'
Эта фраза обрабатывается как содержащая два
утверждения. Первое утверждение нас не интересует, а второе
представляет определенный интерес, поскольку, как отмечает
МакДермотт, оно может описывать по меньшей мере две
ситуации:
(13) Мяч тоже находится под столом.
288
(14) Мяч столь велик, что не помещается под столом;
он находится около стола.
Очевидно, что ситуация (14) достаточно странная, так как
мячи редко бывают такими большими; однако, если
заменить мяч, скажем, на торшер, то соответствующая ситуация
(15) Торшер находится около стола.
будет вполне нормальной. TOPLE выберет ситуацию (13),
поскольку имеет некоторое представление о вероятных
размерах предметов в комнате.
Более интересным примером поведения программы будет
ее реакция на фразу:
The monkey goes over to the table.
'Обезьяна подходит к столу.'
10 №534
289
TOPLE хочет "поверить" этому утверждению. Программа
для GO 'ИДТИ' сообщает, что выполнение действия GO
означает желание и возможность со стороны обезьяны
выполнить это действие. Второе условие не вызывает
трудностей, однако программа не знает, почему Спиро (так зовут
обезьяну) хочет идти к столу. Подходящей причиной мог
бы быть интерес обезьяны к чему-либо, находящемуся в
данном месте — к столу, мячу или банану. У TOPLE нет
оснований для того, чтобы предположить у Спиро интерес
к столу, но Спиро может захотеть играть в мяч или съесть
банан. Неопределенность в этом вопросе заставляет TOPLE
генерировать два альтернативных варианта желаний и
намерений Спиро. (Предлагаемое ниже представление
отличается от представления МакДермотта тем, что последнее
сложнее. Однако, поскольку мы не собираемся
рассматривать и обсуждать это представление, в примере оно
существенно упрощено.)
В ситуации 0:
(WANT SPIRO (HOLD SPIRO BAN 1))
'(ХОТЕТЬ СПИРО (ДЕРЖАТЬ СПИРО БАНАН 1))'
(WANT SPIRO (EAT SPIRO BAN 1))
'(ХОТЕТЬ СПИРО (СЪЕСТЬ СПИРО БАНАН 1))'
(HUNGRY SPIRO)
'(ГОЛОДЕН СПИРО)'
(GO SPIRO TAB 1)
'(ИДТИ СПИРО СТОЛ 1)*
В ситуации 1:
(AT SPIRO ТАВ1)
'(У СПИРО СТОЛ 1)'
(PICK-UP SPIRO BAN 1)
'(ПОДНИМАТЬ СПИРО БАНАН 1)*
В ситуации 2:
(HOLD SPIRO BAN 1)
'(ДЕРЖАТЬ СПИРО БАНАН 1)'
290
В ситуации 3:
(EAT SPIRO BAN 1)
ЧЕСТЬ СПИРО БАНАН 1)'
В ситуации 4:
BAN 1 ceases to exist
'БАНАН 1 перестает существовать*
Или:
В ситуации О':
(WANT SPIRO (HOLD SPIRO BALL 1))
'(ХОТЕТЬ СПИРО (ДЕРЖАТЬ СПИРО МЯЧ 1))'
(WANT SPIRO (PLAY SPIRO BALL 1))
'(ХОТЕТЬ СПИРО (ИГРАТЬ СПИРО МЯЧ 1))'
(GO SPIRO TAB 1)
•(ИДТИ СПИРО СТОЛ 1)'
В ситуации 5:
(AT SPIRO TAB 1)
'(У СПИРО СТОЛ 1)*
В ситуации 6:
(PLAY SPIRO BALL 1)
'(ИГРАТЬ СПИРО МЯЧ 1)*
(PICK-UP SPIRO BALL 1)
'(ПОДНИМАТЬ СПИРО МЯЧ 1)'
В ситуации 7:
(HOLD SPIRO BALL 1)
'(ДЕРЖАТЬ СПИРО МЯЧ 1)'
«В приведенном примере каждая ситуация описывает
отдельное состояние мира, каждое последующее состояние
является результатом действий в предшествующем
состоянии. Две последовательности ситуаций взаимно исключают
друг друга: ситуации 1 и 5 обе являются продолжениями
состояния 0. (Отметим, что состояние 0 имеет два варианта,
каждый из вариантов запоминается.)
Последовательности генерируются путем моделирования поведения Спиро с
помощью целей, соответствующих его желаниям. ((HUNGRY
SPIRO) в ситуации 0 и (WANT SPIRO (PLAY SPIRO
10* 291
BALL 1)) в ситуации 0' являются главными
допущениями, которые введены для объяснения поведения обезьяны».
В этом месте программа создает два "возможных мира":
в одном из них Спиро голоден, в другом — Спиро хочет
поиграть. Далее каждый "мир" снабжается действиями,
ожидаемыми при принятии соответствующего допущения
о желаниях Спиро. Теперь системе нужно некоторое
подтверждение одного или другого допущения. Следующая
введенная фраза Spiro picks up the banana 'Спиро
поднимает банан' и дает системе нужное подтверждение. А именно,
эта фраза согласуется с предсказываемым действием в
ситуации 1, что оправдывает всю серию ситуаций 0—4.
В действительности были упомянуты только действия до
ситуации 2; сведения о том, что Спиро съест банан,
являются предсказанием системы TOPLE. Вторая
последовательность ситуации (0\ 5—7) будет просто отброшена как
нереализованная.
Как и следовало ожидать, система понимания
естественного языка TOPLE придерживается многих убеждений,
которые нельзя считать выведенными из входных текстов, но
о которых система "догадалась" самостоятельно; поэтому
она должна давать себе отчет в том, по каким причинам
она поверила в то, что вошло в ее "систему убеждений".
TOPLE отличается от других рассматриваемых нами систем
в том отношении, что если новая информация вступает в
противоречие с ее догадками, то она способна предложить
новые гипотезы, которые объясняют как старую, так и
новую информацию.
Эту способность обеспечивает механизм TOPLE, который
называется "кругом убеждений". Возьмем несколько
модифицированный вариант одного из искусственных примеров
МакДермотта (не имеющих ничего общего с миром
обезьяны и бананов). Пусть мы знаем, что Фред — птица, но он
не летает. Чтобы поверить обоим этим утверждениям, мы
должны построить гипотезу, объясняющую противоречие.
Например, мы можем предположить, что Фред — пингвин.
Для подкрепления этой гипотезы мы можем попытаться
определить, где живет Фред, надеясь обнаружить, что он
живет в Антарктике. Пусть, однако, нам удалось выяснить
только то, что он живет в Южном полушарии. Это
подкрепляет гипотезу, что Фред живет в Антарктике, но ни в коей
мере не доказывает ее. Используя "круги убеждений",
мы можем описать состояние наших знаний в текущий мо-
292
не доказан, мы пытаемся подтвердить его тем, что Фред
живет в Антарктике, что изображено на схеме с помощью круга
из двойных стрелок. Но и последнее утверждение ничем не
доказано, поэтому мы используем утверждение о том, что
Фред живет в Южном полушарии. Круг, образованный
пунктирными стрелками, подкрепляет предположение о
том, что Фред живет в Антарктике. Каждому кругу
приписана (хотя и не показана на схеме) программа, которая
помогает, когда для этого появляются основания, подвергать
сомнению любой из элементов данного круга. Так, если мы
узнаем, что Фред живет в Сиднее, то мы должны
подвергнуть сомнению нашу гипотезу, что он живет в Антарктике.
Чтобы найти выход, можно предположить, что либо Фред
является страусом, либо он живет в зоопарке, и
попытаться подкрепить эти гипотезы.
Что здесь особенно интересно, так это открывающаяся
возможность измерения степени правдоподобия того или
иного факта, которое можно осуществить путем подсчета
количества неоправдавшихся предположений,
понадобившихся программе для перевода некоторого факта из класса
неправдоподобных в число правдоподобных. А это в свою
очередь интересно потому, что, используя наши знания о
мире, например, для установления антецедента
местоимения, мы обычно руководствуемся не тем, что один из
возможные способов приведет к неправдоподобной ситуации, а
тем, что один способ дает несколько более правдоподобную
ситуацию, чем другой (об установлении кореферентных
связей см. часть II статьи Уилкса).
мент следующим образом. Посмотрим сначала только на
одинарные непрерывные стрелки. Они образуют круг,
соответствующий нашей исходной ситуации. Стрелки
направлены от имеющихся утверждений, затрудняющих
интерпретацию, к гипотетическому, которое разрешает
противоречие. Но поскольку тот факт, что Фред — пингвин, нами
Возвращаясь к нашим пяти вопросам, мы можем сказать,
что программа МакДермотта заслуживает внимания в
нескольких аспектах. В отношении того, зачем и когда
обращаться к умозаключениям (применение умозаключений),
программа МакДермотта отличается от других программ,
как мы уже говорили, тем, что умозаключения в ней
делаются для подкрепления тех или иных взглядов, а не для
заполнения пропусков в рассказе. А это, как было
отмечено, открывает интересные возможности для установления
кореферентных связей. В то же время сфера установления
правдоподобия убеждений сама по себе настолько не
разработана, что в этом отношении рассматриваемую программу
практически не с чем сравнивать. Интересное решение
предлагается в системе TOPLE для вопроса организации
знаний.
Когда в систему вводится новое утверждение, то
известные факты, с которыми оно должно комбинироваться с
целью получения новых умозаключений, могут храниться
в одном из двух мест. Наиболее очевидным местом является
серия стандартных подпрограмм, помеченных ключевыми
предикатами и примерно соответствующих базовым
стандартным подпрограммам Чарняка. (Это очень
приблизительное сравнение, поскольку МакДермотт использует
названные подпрограммы еще и для поиска фактов.)
Например, мы видели работу программы с ключевым
предикатом GO, которая привела к построению двух возможных
миров, соответствующих двум предположениям о том,
зачем Спиро пошел к столу. Другим местом, где входное
утверждение должно искать факты, является множественная
"структура мира". Как мы помним, в зависимости от того,
за бананом или за мячом пошел Спиро, TOPLE
предсказывает два возможных продолжения рассказа. Каждое из
продолжений опирается на собственный "возможный мир",
то есть на отдельную базу данных, но обе эти базы связаны
с "реальным миром" в том смысле, что факты, известные в
реальном мире, вводятся в каждый из возможных миров.
Таким образом, в этот момент актуализированы сразу три
базы данных, которые организованы следующим образом
(см. схему на с. 295).
Как уже говорилось, поступление следующей фразы
(Spiro picked up the banana) подтверждает одно из
высказываний того возможного мира, который расположен в
левой части нашей схемы, и поэтому именно эта картина мира
294
признается истинным продолжением реального мира", а
альтернативная картина мира отбрасывается. При этом
производится ряд умозаключений. Так, выводится, что
Спиро пошел к столу, чтобы поднять банан и съесть его.
Картина "реального мира",
включающая информацию
о расположении стола,
банана и мяча
Картина мира, основанная Картина мира, основанная
на предположении, что на предположении, что
Спиро хочет съесть банан Спиро хочет П0Играть в МЯЧ
(ситуации 0-4) (ситуации 0'; 5-7)
Эта множественная структура мира выполняет в системе
МакДермотта примерно ту же роль, что демоны в системе
Чарняка, а именно — позволяет системе TOPLE
предсказывать то, что может случиться, и узнавать подтверждения
предсказаний, когда они встречаются. Однако с формальной
точки зрения два названных механизма отнюдь не являются
эквивалентными. Прежде всего, множественные миры не
подсказывают ясного решения в том случае, когда
ситуация допускает несколько альтернативных вариантов и при
этом выбор варианта не влияет на дальнейший ход действия.
Например, если человек сдает купленную вещь обратно в
магазин, он может получить деньги, или специальный чек,
или однотипную вещь, или другую вещь, но той же
стоимости. Нетрудно представить себе единый демон,
включающий все эти варианты. TOPLE же в этом случае,
по-видимому, должна построить четыре разных мира. Кажется
разумным видоизменить множественную структуру мира TOPLE
таким образом, чтобы в ней допускались переменные и один
и тот же мир мог бы допускать вариативность. Конечно,
введение переменных нарушает первоначальный замысел
МакДермотта, в связи с чем потребуются и дальнейшие
переделки, необходимые для введения некоторого аналога
демонов. Это возвращает нас к старому вопросу о том, в какой
момент следует прекращать расширение одного формализма
и заменять его другим формализмом.
В то же время множественная структура мира удобнее,
чем демоны, при моделировании серии последовательных
действий. И наконец, системы МакДермотта и Чарняка
295
сходны в том отношении, что обе они не могут производить
нужные обобщения в случаях, подобных описанной выше
ситуации с использованием зонта.
система ригера
Работу Ригера можно было бы считать интересной уже
потому, что это первая попытка применения теории
концептуальных зависимостей Шенка к проблемам
умозаключений и знания. Однако, как представляется, по существу
работа Ригера очень мало связана с теорией
концептуальных зависимостей, что видно хотя бы из того, что в своих
более поздних публикациях Ригер почти не упоминает эту
теорию. С другой стороны, эта работа весьма значительна
сама по себе, поэтому ее, по-видимому, можно
рассматривать и независимо от теории концептуальных зависимостей.
Программа Ригера, которой он не дал названия, имеет
своей основной задачей вывод умозаключений на основе
входных текстов. Как и в системах Чарняка и МакДермотта,
в системе Ригера на вход подаются не фразы естественного
языка, а их формальные представления (на языке
концептуальных зависимостей).
Ригер пытается охватить такой широкий круг
проблем, что на одном коротком примере очень трудно показать
все существенные черты его программы. Все же типичным
для работы Ригера примером можно считать фразу такого
типа:
John hit Mary 'Джон ударил Мери.'
Из этой входной фразы программа выведет умозаключения
типа следующих:
(16) John probably used his hand.
|/Джон, возможно, использовал свою руку.'
(17) Mary was probably hurt.
'Мери, возможно, была ранена.'
(18) John probably wanted to hurt Mary.
'Джон, возможно, хотел ранить Мери.'
(19) John might have been angry with Mary.
'Возможно, до этого Джон рассердился на Мери.'
(20) John and Mary are near each other.
'Джон и Мери находятся близко друг к другу.'
Mary now wants to feel better.
'Сейчас Мери хочет поправиться.'
296
John probably wants Mary to feel better.
'Джон, возможно, хочет, чтобы Мери поправилась.'
Этот пример типичен в следующих отношениях, (а)
Умозаключения строятся на основе одной фразы. Ригер
рассматривает также несколько примеров текстов длиной в
3—4 фразы, подавляющее же большинство его примеров
состоит из 1—2 фраз, (b) Во фразах говорится о простых
действиях, вроде действия "ударить", в них не
рассматриваются более сложные события, такие, как "день
рождения" или "покупка вещей в магазине", (с) Программа
производит много сложных умозаключений, часть которых
представляется несколько сомнительной — ср. последнее
умозаключение в приведенном выше примере. Программа
построила это умозаключение, поскольку она полагает,
во-первых, что желание Мери поправиться является
результатом того, что Джон ее ударил, и, во-вторых, что Джон
хочет, чтобы произошли все следствия, вытекающие из
его действия. Возможно, это конкретное умозаключение
Ригер сочтет ошибочным, однако его общая позиция
состоит в том, что программы, которые выводят "лишние"
умозаключения, предпочтительнее программ, которые
могут вывести слишком мало умозаключений.
Попытка прямого описания набора программ, входящих
в систему (а задача системы состоит не только в простом
построении умозаключений, но и в автоматическом
понимании рассказов, в ведении диалога, в разрешении
лексической многозначности и проблем референции, в ответах
йа вопросы, относящиеся не столько к содержанию
рассказов, сколько к модели мира, введенной в систему),
неизбежно привела бы к введению большого количества
деталей и мало дала бы по существу. Вместо этого мы
охарактеризуем систему в рамках ответов на наши пять
вопросов. Мы отвлекаемся от многих черт системы и
рассматриваем лишь те ее аспекты, которые представляются
наиболее интересными с теоретической точки зрения. Наше
описание является скорее теорией Чарняка на базе
программы Ригера (если понимать различие между теорией
и программой так, как было предложено выше), чем
теорией самого Ригера.
СЕМАНТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ. Как уже
говорилось, Ригер использует теорию концептуальных за-
297
висимостей, которая, несомненно, относится к теориям
семантических представлений.
ПРИМЕНЕНИЕ УМОЗАКЛЮЧЕНИЙ. Большая часть
интересных, хотя порой и спорных, решений в системе
Ригера относится к этому разделу. Например, в важном
вопросе о том, какое количество умозаключений должно
делаться по ходу прочтения текста, Ригер придерживается
крайней точки зрения, считая, что их количество должно
быть огромным. Конечно, никто в сущности не
представляет, каким может оказаться нужное количество
умозаключений, и потому сказать, что их количество должно быть
огромным,— все равно, что не сказать почти ничего.
Однако, принимая во внимание приводимые Ригером примеры
умозаключений, которые, по его мнению, необходимы, а
также его общую позицию относительно статуса
умозаключений, можно считать, что предполагаемое в его
работах количество умозаключений на несколько порядков
выше того, с которым могли бы согласиться МакДермотт
или Чарняк. Например, Ригер считает, что умозаключения
рефлекторны, и человек, услышав фразу, производит их
почти бессознательно. Цель таких "неуправляемых"
умозаключений состоит в установлении соотношений между
только что услышанным и известным ранее. Согласно
Ригеру, входные фразы как бы задают точки в "пространстве
умозаключений", а цель неуправляемых умозаключений —
произвести расширение сфер вокруг этих точек в
пространстве умозаключений таким образом, чтобы эти сферы
пересеклись с другими, существовавшими ранее. Для
сравнения отметим, что модели Чарняка и МакДермотта
производят умозаключения только для заполнения
специфических лакун, поскольку оба эти автора исходят из
предположения, согласно которому неуправляемый вывод
умозаключений выльется в огромное число операций и
пересечение сфер не будет достигнуто за разумное время.
Другим способом иллюстрации различия между двумя
рассматриваемыми точками зрения может служить пример
того, какие умозаключения Ригер считает разумным
производить во время обработки входного текста.
Входная фраза: John told Mary that Bill wants a book.
'Джон сказал Мери, что Билл хочет
книгу.'
298
Умозаключения: Bill wants to possess a book.
'Билл хочет получить книгу.'
John believes that Bill wants a book.
'Джон считает, что Билл хочет книгу.'
Mary now knows that Bill wants a book.
'Сейчас Мери знает, что Билл хочет книгу.'
Bill probably wants to read a book.
'Вероятно, Билл хочет прочесть книгу.'
Bill might want to know the concepts
contained in the book.
'Возможно, Билл хочет знать содержание
книги.'
Bill might get himself a book.
'Возможно, Билл получил книгу.'
John might give Bill a book.
'Возможно, Джон дает Биллу книгу.'
Mary might give Bill a book.
'Возможно, Мери дает Биллу книгу.'
John may want Mary to give Bill a book.
'Возможно, Джон хочет, чтобы Мери дала
Биллу книгу.'
John and Mary may have been together
recently.
'Возможно, Джон и Мери недавно были
вместе.'
Из всех этих умозаключений другие исследователи
признали бы разумным вывод только первого умозаключения.
(Иначе говоря, существуют условия, в которых может быть
выведено каждое из них. Например, если нам известно,
что у Мери есть несколько экземпляров книги, о которой
идет речь, то можно считать желательным предпоследнее
умозаключение. Но это скорее исключение, чем общее
правило.) Другие темы, рассматриваемые Ригером и
относящиеся к применению умозаключений,— это
соотношение между референцией и умозаключениями (см. часть II
статьи Уилкса) и классификация умозаключений.
Умозаключения классифицируются с точки зрения типа знаний,
которые хочет получить тот, кто их производит. (Если
читателю непонятно, почему эта тема отнесена к разделу
"применение умозаключений", то он получит необходимые
разъяснения позже.)
299
Не представляется возможным рассматривать все типы
умозаключений, предлагаемые Ригером (ему самому на
это потребовалось около 150 страниц). Поэтому мы
ограничимся простым перечислением тех типов умозаключений,
которые достаточно очевидны. (За исключением первого
типа умозаключений, все остальное — цитаты из Ригера.)
1. Конкретизирующие умозаключения. На
языке концептуальных зависимостей представление
действий включает пробелы, которые заполняются текущей
информацией (или конкретизируются). Например, именно
умозаключение такого типа отвечает за то, что из фразы
John hit Mary выводится информация о том, что Джон
использовал свою руку (16).
2. Умозаключения, устанавливающие причину:
каковы вероятные причины действия или
состояния (см. пример 19).
3. Умозаключения, устанавливающие результа-
т ы : каковы вероятные результаты действия или
состояния (пример 17).
4. Умозаключения, устанавливающие мотивы:
почему деятель хотел (хотел бы) совершить действие
(пример 18).
5. Умозаключения, устанавливающие возможности:
каким должно быть состояние "мира" для того, чтобы
произошло данное действие (пример 20).
6. Умозаключения, устанавливающие функции!
почему люди хотят владеть предметами.
7. Умозаключения, прогнозирующие
возможности: если человек хочет, чтобы имело место
некоторое состояние мира, то является ли это состояние
результатом какого-либо прогнозируемого действия.
8. Умозаключения, устанавливающие отсутствие
возможностей: если человек не может совершить желаемое
действие, можно ли объяснить это отсутствием некоторого
предшествующего состояния мира.
9. Умозаключения, устанавливающие контрмеры:
если некоторое действие вызывает (вызовет) нежелательный
результат, что может сделать человек для полного или
частичного предотвращения действия.
10. Умозаключения, прогнозирующие
действия : если известны потребности и желания человека,
какие действия он может произвести для достижения своих
потребностей.
300
11. Умозаключения, прогнозирующие расширение
знаний: если известно, что человек располагает
определенными знаниями, то какими еще знаниями он может
располагать.
12. Нормативные умозаключения: если известно,
что считается нормальным, установить, насколько
достоверна некоторая информация при отсутствии точной
информации.
13. Умозаключения, устанавливающие
продолжительность состояний: предсказать примерную
продолжительность состояния или действия.
14. Умозаключения, устанавливающие свойства:
если известны некоторые свойства сущности и ситуации,
в которых эта сущность имеет место, какие дополнительные
свойства данной сущности можно предсказать.
15. Ситуационные умозаключения: какую
дополнительную информацию о некоторой известной ситуации
можно представить себе (или вывести).
16. Умозаключения, устанавливающие намерения
говорящего: для чего говорящий это сказал; что
можно вывести, зная то, как он это сказал.
Так, типичным примером умозаключения типа 7 (то
есть умозаключения, прогнозирующего возможности) будет
следующий:
Andy blew on the hot meat.
'Энди подул на горячее мясо.'
Мы предполагаем, что Энди намеревается съесть мясо на
том основании, что дуют на мясо для того, чтобы оно
остыло, а определенная температура пищи — это обычная
предпосылка (или, по терминологии Ригера, "условие,
создающее возможность") приема пищи. Итак, из желания
Энди добиться требуемого состояния мы делаем вывод о
том действии, которое он хочет произвести.
Но для чего нам нужна такая классификация? Ее
назначение — помочь ограничить число умозаключений,
выводимых системой. Дело в том, что Ригер и другие авторы,
работы которых рассматриваются в этой статье, считают,
что большую часть выводов программа должна производить
во время обработки входного текста, а не во время
обработки запроса. В то же время, поскольку в принципе из
фразы текста можно вывести бесконечное количество
умозаключений, мы должны, по меньшей мере, выделить два класса
301
умозаключений: те, которые система будет выводить
немедленно, и те, которые будут выводиться только при
поступлении соответствующего запроса. (Именно здесь и встает
вопрос о применении умозаключений.) Но вопрос о том,
какие умозаключения следует выводить немедленно,
решается в соответствии с реальными задачами системы (как
она должна преобразовать входной текст). Поэтому мало
просто разделить умозаключения на две группы, скорее
мы должны произвести более тонкую классификацию,
в результате которой система сумеет определять границы,
в которых следует выводить умозаключения при обработке
входных текстов, изменяя эти границы в случае
необходимости. Для этого и нужна классификация
умозаключений.
Именно таким способом и использует Ригер свою
классификацию, но, учитывая, что, согласно его мнению,
исследователь не должен сильно ограничивать число
выводимых системой умозаключений (вспомним расширение
сфер умозаключений), его соображения об использовании
типов умозаключений не кажутся слишком убедительными
и, следовательно, его классификацию нельзя считать
особенно полезной. Более того, сам он, по крайней мере до
сих пор, использовал лишь четыре из предложенных им
шестнадцати типов умозаключений. То, что он посвящает
столько времени классификации и при этом не дает
убедительных примеров ее использования, нельзя не признать
серьезным недостатком его работы.
ОРГАНИЗАЦИЯ. Предложения Ригера в этой области
можно объяснить в тех терминах, которыми мы
пользовались при описании работы Чарняка. Нужная для вывода
умозаключений информация сгруппирована в пучки
(которые Ригер называет молекулами умозаключений),
соответствующие базовым подпрограммам Чарняка. Единицам
поиска фактов соответствуют у Ригера "нормальные
молекулы" (с той разницей, что в системе Ригера эти единицы
используются гораздо реже, чем у Чарняка, поскольку
Ригер стремится вывести большинство умозаключений во
время обработки входного текста). У Ригера нет
образований, соответствующих демонам Чарняка,— более того,
он критикует идею демонов, считая, что лучше немедленно
производить все умозаключения, чем ждать указаний на
необходимость введения демонов. Иногда это представ-
302
ляется правдоподобным; например, из того, что Джек
голоден, следует, что он, возможно, поест. Если же
использовать стратегию демонов, то следует включить демон,
который попытается найти подтверждения того, что Джек
ест. В этом случае допустимы обе стратегии, однако в
других случаях отсутствие в системе Ригера демонов (или
их эквивалентов) вызывает серьезные трудности.
Например, если Дженет трясет копилку, демоны предусматривают
возможности как наличия, так и отсутствия в ней денег.
А каким образом введет оба такие утверждения система
Ригера? Отметим, что МакДермотт решает эту задачу,
используя альтернативные возможные миры, которые
функционально в данном случае аналогичны демонам, Ригер же
не имеет никаких средств для отражения альтернативных
миров.
МЕХАНИЗМ УМОЗАКЛЮЧЕНИЙ. Молекулы
умозаключений, которые, как указывалось, выполняют
большую часть вывода умозаключений, являются на самом деле
программами на LISP'e. Некоторые факты, такие, как
основное назначение предмета (например, основное
назначение телефона — передача информации), представлены в
форме данных. Тем не менее большая часть фактов
представлена в форме программ, и Ригер является сторонником
процессуального представления.
СОДЕРЖАНИЕ. По существу, ответа нет.
СИСТЕМЫ, ИСПОЛЬЗУЮЩИЕ ФРЕЙМЫ
Большая часть современных работ по теме,
рассматриваемой в этой главе, использует терминологию и идеи,
которые восходят к работе Минского о фреймах (Minsky,
1975). Это — сложная работа, но ее ведущая мысль весьма
проста: единицы знаний, используемые программой
понимания текста, должны быть гораздо крупнее, чем те
единицы, которые использовались в описанных выше системах.
Мы будем рассматривать теорию фреймов Минского как
относящуюся к организации, а не к четырем остальным
интересующим нас вопросам. Тем не менее следует
отметить, что работа Минского затрагивает много других
проблем, о которых мы даже не будем упоминать.
303
ОПРЕДЕЛЕНИЕ ФРЕЙМОВ ПО МИНСКОМУ
Отправным пунктом работы Минского является вовсе
не естественный язык, а задача объяснения способности
видеть. Проблема, с которой имеет дело Минский (как и
всякий, кто работает с цифровой ЭВМ последовательного
действия (то есть с машиной, осуществляющей в
определенный момент только одну операцию)), состоит в том, чтобы
смоделировать способность человека, входящего в комнату
или куда-либо еще, охватить все единым взглядом. Если
люди действительно видят именно таким образом, это
может служить аргументом в пользу того, что их
восприятие не "последовательно", а скорее "параллельно", то есть
они воспринимают одновременно много разных частей
одной сцены. Минский предположил, что способность
видеть все единым взглядом иллюзорна, а на самом деле
видение — протяженный во времени процесс. Но ему
надлежало объяснить, каким образом оно осуществляется
так гладко и быстро. Согласно Минскому, перед тем, как
войти, например, в комнату, мы обычно имеем
представление о том, что мы увидим. Если комната нам знакома,
наше предварительное знание включает разного рода
детали, например расположение мебели, покрытие пола и
т. п. Если предположить, что все эти части соединены
воедино в нашем представлении, то, входя в комнату, мы
должны только проверить, произошли ли в комнате
изменения по сравнению с нашим исходным представлением.
Этот фрагмент знаний Минский называет фреймом. Но
даже если мы входим в незнакомую комнату, мы все же
имеем много информации о том, что ожидать. По меньшей
мере тип двери скажет нам, что она ведет в комнату, а не
в зал и не на улицу. Более того, обычно у нас имеется
представление о типе комнаты — будь то жилая комната,
комната в учреждении или класс, и в каждом из этих
случаев соответствующий фрейм скажет нам, что именно
нам следует ожидать, поэтому осмотр комнаты требует
только сравнения данной конкретной комнаты с обычной
комнатой этого типа. Таким образом, фрейм — это
структура данных, представляющих стереотипную визуальную
ситуацию. При переходе к естественному языку нам
следует только отбросить слово "визуальный".
При таком подходе к нашим знаниям о комнате нам
необходимы определенные средства для представления этих
знаний. Если речь идет об известной нам комнате, нам
304
нужно задать имеющиеся в ней предметы. Каждый предмет
будем представлять единицей, называемой "терминалом"
фрейма. Терминал описывает предмет, задавая его
специфические черты. В случае стереотипной комнаты, например
типичной комнаты в учреждении, терминалы будут
описывать скорее не конкретные, а прототипические предметы,
например "стандартный канцелярский стол". Терминалы
задают типичные свойства предметов. Минский считает,
что в действительности люди сводят конкретные предметы
к их прототипам, в результате чего у них и формируются
их собственные представления о стандартных предметах
(как бы вводятся переменные с незаполненными
значениями). Однако на самом деле теория Минского
практически не зависит от того, описывает ли терминал
неопределенный, "смазанный" образ канцелярского стола,
который мы просто опознали, войдя в комнату, или
определенный стандартный образ, который необходимо дополнить
специфическими деталями конкретного стола.
Кроме терминалов, нам нужна информация об
отношениях между объектами и о способах использования фрейма.
Более того, нужны указатели, соединяющие данный фрейм
с другими, описывающими ту же самую сущность
(например, комнату), но с иных точек зрения. Так, входя в
комнату, мы не видим стены, находящейся за нашей спиной,
и потому, как считает Минский, описание этой стены в
фрейме нашего "видения" должно отсутствовать. В то же
время должны быть родственные фреймы, включающие
описание этой стены. Для того чтобы избежать
дублирования информации в родственных фреймах, принято
соглашение о том, что фреймы могут иметь общие терминалы.
Так, если у нас представлены четыре фрейма (каждый из
них описывает вид комнаты, ориентированный на одну
из стен), то во всех четырех будут даны описания
предметов, находящихся в центре комнаты, а каждая стена
будет фигурировать в трех фреймах. Разрешая
использование фреймами общих терминалов, мы освобождаемся
от необходимости вновь описывать уже описанные предметы
(см. схему на с. 306).
Мы начали рассмотрение фреймов с их применения к
описанию зрительных образов, поскольку это наиболее
наглядный пример. Если обратимся к проблемам,
касающимся естественного языка, то фреймы становятся более
сложными. Прежде всего в этом случае Минский предла-
305
гает уже не единый тип фрейма, а четыре их типа,
приблизительно соответствующих синтаксическому
представлению, семантическому представлению, представлению
стереотипных событий и представлению свойств
коммуникативной ситуации. Первые два типа представлений достаточно
понятны. Последний, четвертый тип, относится к способам
подачи информации в рассказах, диалогах или научных
трудах. Например, в рассказах обычно наличествует одно
или несколько действующих лиц, сюжет, некоторая
ведущая мысль. Во фрейме рассказа должны быть,
следовательно, отражены принятые способы его построения.
Существует много опытов подобного описания (с этой
точки зрения можно взглянуть и на литературоведение),
однако до сей поры еще не было предложено ничего, что
могло бы внести достаточную для наших целей ясность
в рассматриваемый вопрос.
Наиболее интересными из перечисленных типов фреймов
представляются фреймы третьего типа, описывающие
стереотипные события, или, как называет их Минский, "фреймы
сценариев". Минский не говорит ничего конкретного о
таких фреймах, однако один из его примеров дает
представление о его замысле. Это набросок фрейма,
описывающего празднование дня рождения. Такой фрейм можно
использовать для автоматического понимания простых
рассказов типа тех, которые были рассмотрены выше.
В частности, информация о том, что на день рождения
принято дарить подарки, необходима для понимания таких
рассказов, как, например, следующий:
Jane was invited to Jack's birthday party. She wondered
if he would like a kite,
306
'Джейн пригласили на день рождения Джека. Она
думала, понравится ли Джеку змей.'
Предложенный Минским набросок фрейма имеет вид:
ОДЕЖДА Лучше праздничная
ПОДАРОК Должен понравиться хозяину
Должен быть куплен и красиво
упакован
ИГРЫ Прятки; жмурки
УКРАШЕНИЯ .... Воздушные шары, ленты,
цветная бумага
ПРАЗДНИЧНАЯ ЕДА Торт, мороженое, газированная
вода, бутерброды с сосисками
ТОРТ Свечи, задувание, пожелания,
пение, песни о дне рождения
МОРОЖЕНОЕ .... Стандартное ассорти (из трех
цветов)
Это описание удовлетворяет предложенному выше
общему виду фрейма: единицы левого столбца соответствуют
терминалам, а единицы правого столбца задают значения
переменных для каждого терминала. Однако сам Минский
в той же работе утверждает, что задание терминалов и
вопросы, при этом встающие, вызывают очень много
трудностей. Затем он предлагает иную по сравнению с
приведенной выше форму того же фрейма:
Y должен купить Р для Х'а... Выбрать Р!
Х'у должен нравиться Р Понравится ли Х'у Р?
Купить Р с Где купить Р? "|
Достать деньги для покупки Р ... Где достать
деньги?
Подвоп-
j. росы для
фрейма
v тт "подарок1'
Y должен одеться Что должен г
надеть Y?
Сравнивая два предложенных варианта, отметим, что
первый напоминает статическое описание того, что
происходит на праздновании дня рождения, а второй выглядит
скорее как набор инструкций, которые должен выполнить
тот, кто впервые собирается на день рождения. Отметим,
например, что во втором варианте не упоминаются
украшения. Можно вообразить другую серию инструкций, для
307
именинника (в качестве отдельного фрейма: как следует
принимать гостей), и в этом фрейме будет упомянуто
о выборе украшений.
дальнейшие разработки фреймов
Сам Минский нигде не говорит о различии между двумя
вариантами фреймов, однако многие его последователи
отдают предпочтение второму варианту перед первым.
Так, в двух недавних работах (Schank — Abelson,
1975 и Charniak, 1975b) описываются формальные
объекты, весьма напоминающие сценарные фреймы
Минского. В обеих работах фреймы представлены в форме
инструкций относительно способа выполнения некоторого
действия. В работе Шенка и Абельсона эти формальные
объекты называются сценариями (scripts), как и в
предшествующих работах Абельсона, о которых мы не имеем
возможности здесь говорить. Предложенный ими сценарий
касается поведения посетителя ресторана. Чарняк, вслед
за Минским, называет соответствующие представления
информации сценарными фреймами. Рассматриваемая
Чарняком предметная область — посещение магазина
(универсама). Представляется, однако, что различие между
предложениями Шенка — Абельсона, с одной стороны,
и Чарняка, с другой стороны, чисто терминологическое,
а содержательно между этими двумя представлениями
ощутимого различия нет.
Как и у Минского, сценарный фрейм (далее — просто
фрейм) — это структура данных относительно некоторой
темы, такой, как покупка товаров в магазине, принятие
душа или использование копилки. Каждый фрейм состоит
прежде всего из набора утверждений о теме фрейма,
называемых "утверждениями фрейма" (далее УФ). УФ примерно
соответствуют терминалам Минского, особенно если
рассматривать терминалы как вопросы к теме фрейма.
(Вопросы можно считать способом выражения утверждений,
и в Minsky, 1975 нет никаких указаний на противное.)
УФ записаны на подходящем для программной реализации
семантическом языке, но в наших примерах мы пользуемся
обычным английским языком.
Основным средством понимания фразы рассказа
является ее соотнесение с одним или более УФ. Например,
отдельным УФ во фрейме "посещение магазина" будет такоез
308
(21) SHOPPER obtain use of BASKET.
'ПОКУПАТЕЛЬ берет КОРЗИНУ.'
(SHOPPER, BASKET и в принципе любая часть УФ,
написанная заглавными буквами, являются переменными.
Эти переменные имеют ограничения; так, ПОКУПАТЕЛЬ —
это, вероятно, человек, и по меньшей мере — одушевленное
существо, а КОРЗИНА относится к классу корзин, а не,
скажем, карманов.) Это УФ будет соотнесено со второй
фразой следующего текста:
(22) Jack was going to get some things at the
supermarket. The basket he took was the last one left.
'Джек собирался кое-что купить в магазине.
Корзина, которую он взял, была последней.'
Здесь мы предполагаем, что часть второй фразы будет
представлена следующим образом:
(23) Jack 1 obtain use of basket 1.
'Джек 1 берет корзину 1.'
(Напомним, что и (21) и (23) на самом деле записаны на
общем семантическом языке.) Сведения о том, что (23)
появилось при сопоставлении (22) с (21), задаются в форме
специального указателя от соответствующей фразы текста
к УФ.
Фрейм посещения магазина имеет ряд других УФ,
связанных с (21), например, таких:
(24) (21) usually occurs before (25).
'(21) обычно происходит раньше, чем (25).'
(25) SHOPPER obtains PURCHASE-ITEMS.
'ПОКУПАТЕЛЬ берет ТОВАРЫ.'
Каждая модификация (например (24)) определенного УФ
считается верной для всех утверждений рассказа (УР),
соотнесенных с УФ (например (23)), если нет очевидных
указаний на противоположное. Поэтому с помощью (24)
мы можем заключить, что ко времени события (22) Джек
еще не закончил покупку товаров. Другие модификации
(21) укажут, что, вероятно, Джек был в магазине, когда
он брал корзину, и что он взял ее для использования
в магазине.
Переменная SHOPPER в (21) появляется также в (25),
и, вообще говоря, одна переменная может использоваться
во многих УФ. Поэтому сферой действия переменных
309
должен быть по меньшей мере тот фрейм, в котором они
появляются. Если УР соотносится с УФ, переменная УФ
становится связанной. Естественно, что за этими случаями
связанности (конкретизации) надо следить. Например,
отсутствие подобного наблюдения приведет к тому, что
система не заметит странности такого рассказа:
Jack went to the supermarket. He got a cart and started
up and down the aisles. Bill took the goods to the
checkout counter and left.
'Джек пошел в магазин. Он взял тележку и стал
катать ее взад и вперед по проходу. Билл отнес товары
к кассиру у выхода и ушел.'
Вероятно, не следует в процессе наблюдения за такого рода
случаями связанности действительно менять фрейм. Вместо
этого можно оставлять фрейм нетронутым, а связанные
переменные хранить в особой структуре, называемой
образом фрейма (сокращенно ОФ). У фреймов, описывающих
определенные действия, например покупку товаров, будут
образованы отдельные ОФ для каждой реализации этого
действия. Так, если два человека одновременно находятся
в одном магазине или один человек посещает два магазина,
то в обоих случаях такой ситуации будут соответствовать
два ОФ, что позволит различать соответствующие случаи
посещения магазинов.
Большая часть информации будет храниться в виде
связанных переменных (покупатель, товар, магазин,
тележка и т. п.). Однако информация о связанных
переменных не исчерпывает всей той информации, которой мы
хотели бы располагать в ОФ; например, нам, возможно,
понадобится указатель от ОФ к некоторым, если не ко
всем УР, которым сопоставлены УФ. Более интересен тот
факт, что в ОФ фреймов, описывающих действия,
указывается, на какой стадии развития ситуации находится
действие для каждой фразы рассказа. Так, например, мы
сочтем странным следующий рассказ:
Jack drove to the supermarket. He got what he
needed, and took it to his car. He then got a shopping cart.
'Джек приехал на машине в магазин. Он купил то,
что ему было нужно, и отнес покупки в машину.
Затем он взял тележку для покупок.'
Как мы уже сказали, УФ модифицируются с помощью
утверждений, выстраивающих события во времени, по-
310
этому для того чтобы заметить странность рассказа,
необходимо иметь в ОФ один или несколько указателей
к УФ, с помощью которых определяется, какое из событий
в уже проанализированной части рассказа является самым
поздним по времени.
Чтобы читатель получил более наглядное
представление о том, какой вид будет иметь подобный фрейм, мы
приведем один пример, однако при его рассмотрении
следует иметь в виду следующее: во-первых, это лишь
небольшой фрагмент общего фрейма, описывающего покупку
товаров в магазине, и, во-вторых, в этом фрагменте,
возможно, содержится много неточностей.
(26) Goal: SHOPPER owns PURCHASE-ITEMS
'Цель: ПОКУПАТЕЛЬ владеет ТОВАРАМИ'
SHOPPER decide if to use basket, if so set
up cart-carry Fl
'ПОКУПАТЕЛЬ решает, нужна ли ему
корзина, если да, вызвать фрейм Fl "тележка"'
a) SHOPPER obtain BASKET *cart-carry
'ПОКУПАТЕЛЬ берет КОРЗИНУ »"тележка«4'
SHOPPER obtain PURCHASE-ITEMS
'ПОКУПАТЕЛЬ берет ТОВАРЫ'
method-suggested
'предлагаемый способ'
Do for all ITEM 6 PURCHASE-ITEMS
'Выполнить для каждой ВЕЩИ-ТОВАРА'
SHOPPER choose ITEM 6 PURCHASE-ITEMS-
COLLECTED
'ПОКУПАТЕЛЬ выбирает ВЕЩЬ^ТОВАР-
-ОТБИРАЕМЫЙ'
SHOPPER at ITEM
'ПОКУПАТЕЛЬ у ВЕЩИ'
side-condition COLLECTED at ITEM also
' побочное условие, накладываемое также
на ВЕЩЬ: ОТБИРАЕМАЯ '
method-suggested
'предлагаемый способ'
b) '—>cart-carry (SHOPPER, BASKET,
COLLECTED, ITEM)
4
311
'тележка (ПОКУПАТЕЛЬ, КОРЗИНА,
ОТБИРАЕМЫЙ, ВЕЩЬ)'
SHOPPER hold ITEM
'ПОКУПАТЕЛЬ держит ВЕЩЬ'
с) ITEM in BASKET *cart-carry
'ВЕЩЬ в КОРЗИНЕ *"тележка"'
COLLECTED «- COLLECTED + ITEM
'ОТБИРАЕМОЕ <— ОТБИРАЕМОЕ +
ВЕЩЬ'
End
' Конец'
SHOPPER at CHECK-OUT-COUNTER
'ПОКУПАТЕЛЬ у КАССИРА'
SHOPPER pay for PURCHASE-ITEMS
'ПОКУПАТЕЛЬ платит за ТОВАРЫ'
SHOPPER leave SUPERMARKET
'ПОКУПАТЕЛЬ покидает МАГАЗИН'
Мы не будем объяснять названия, которые в общих чертах
понятны сами по себе, однако в двух местах мы хотим
внести уточнения. Первое касается того, что фрейм
вызывает "подфрейм" ("cart-carry", строка (b)), который
объясняет, как следует использовать в магазине тележку. Более
того, строки (а) и (с) снабжены особыми пометами,
показывающими, что они также являются утверждениями фрейма
"тележка", в связи с чем они (i) применяются только тогда,
когда фрейм "тележка" активизируется и (ii) значительная
часть их содержания определяется их местом в структуре
этого фрейма (например, именно во фрейме "тележка"
объяснено, почему товары следует складывать в тележку).
ФРЕЙМЫ VS. ДЕМОНЫ
Чтобы продемонстрировать некоторые достоинства
фреймов, сравним их с демонами, которые были описаны выше.
Одно преимущество фреймов перед демонами можно было
заметить ранее. Речь идет о проблеме обращения с
фактами типа фактов о зонте, которые потребовали построения
особой схемы (12). Читатель может вернуться к этой схеме
и убедиться самостоятельно, что она естественно
покрывается моделью, основанной на фреймах (ср. особенно
"использование зонта").
312
Однако фреймы обладают и другими преимуществами
перед демонами. Чтобы их раскрыть, укажем на аналогию
между демоном и УФ. Аналогия сводится к тому, что УФ
выполняют именно ту функцию, которую призваны были
выполнять демоны: они оценивают существенность фразы
в данном контексте. Так, для приведенной ниже
последовательности фраз оценка существенности каждой из них
может быть определена на основании того, что они отвечают
некоторым УФ, но не на основании того, что они отвечают
некоторым демонам.
Jack got a cart.
'Джек взял тележку.'
Jack picked up a carton of milk.
'Джек взял пакет молока.'
Jack walked further down the aisle.
'Джек пошел дальше по проходу.'
Jack walked to the front of the store. He put the
groceries on the counter.
'Джек пошел к выходу. Он положил бакалейные
товары на прилавок.'
В этом сравнении интересно то, что демон содержит
минимум 3—4 утверждения, тогда как УФ всегда состоят из
одного утверждения. УФ обладают высокой компактностью,
по крайней мере сравнительно с демонами. Причину этого
заметить нетрудно. Демоны, будучи независимыми друг
от друга фактами, должны сами связывать свои
переменные, и большая часть демона имеет целью проверку
правильности связывания переменных (например, единица
демона BASKET 'корзина' должна быть сопоставлена
с единицей, обозначающей корзину, а не пакет молока).
Та же проверка осуществляется и для фрейма, но,
поскольку переменные обычно проходят через весь фрейм,
а не принадлежат отдельным УФ, эта проверка
осуществляется более экономными средствами. Более того,
структура фрейма в неявном виде содержит все умозаключения
из каждого УФ, тогда как для демона эти умозаключения
должны быть сформулированы эксплицитно. Таким
образом, вторым преимуществом фрейма является экономия
памяти, позволяющая вводить больше фактов.
Сравнение УФ и демонов выявляет и третий аспект,
в котором, как представляется, УФ превосходят демоны.
Многие критикуют модель, использующую демоны, за то,
313
что каждое упоминание в тексте некоторой темы
активизирует все связанные с ней демоны, хотя в действительности
каждый раз используется лишь небольшая их часть. Такой
подход может вызвать возражения по одной из двух
причин. Одна состоит в том, что наличие множества
потенциально допустимых демонов затрудняет выбор тех, которые
действительно следует применять в данном случае. Но эта
трудность возникает и при использовании фреймов,
поскольку число демонов и УФ сравнимы.
Вторая причина недовольства большим количеством
активизируемых демонов касается времени, затрачиваемого
на их применение. Если предположить, что вызов демона
практически не занимает времени, то никакой проблемы
не будет. Однако на самом деле эта процедура все же
занимает время, и поэтому трудно оправдать вызов демона,
который впоследствии не используется. Фреймовый
подход предлагает возможный способ решения этой проблемы,
поскольку вместо того чтобы вызывать все демоны,
связанные с темой, нужно только построить по фрейму один его
образ. Это позволит сэкономить время, но создаст и
определенные неудобства. В особенности это касается вопроса
поиска: поиск демона производится по индексу и является
простым, тогда как просмотр фрейма с целью нахождения
нужного утверждения — процесс более длительный, если
не предложено никакой упрощающей этот поиск
процедуры. Итак, при фреймовом подходе по сравнению с
демонами требуется большее время на поиск внутри фрейма,
но не требуется вызова неиспользуемых фреймов, как это
происходит с демонами, что заставляет отдать предпочтение
фреймовому подходу.
В заключение отметим, что во фреймах, которые
приводились выше, не встает вопроса о временных
отношениях между УФ. О демонах этого сказать нельзя. (Мы
вскользь упоминули об этом, отметив, что "допустимые
миры" МакДермотта лучше отражают временные
отношения, чем демоны.) Мы видели, что во фреймах могут
использоваться указатели, позволяющие программе
выделять события, которые находятся вне временной
последовательности. Что может служить эквивалентом этих
указателей в модели, использующей демоны? Прежде всего,
где будут храниться такие указатели? Соотносить каждый
демон с временным указателем — путь самый
неэлегантный, но не ясно, какой другой путь можно еще предло-
314
жить. Кроме того, где будет храниться сама информация
о временных отношениях? Отметим, что эта информация
имеет гораздо более сложный вид, чем простая цепочка
или даже решетка, отражающая временную
соотнесенность. Некоторые временные отношения обязательны (то
есть другой порядок действий невозможен), другие —
предпочтительны (то есть другой порядок действий
нежелателен), а третьи — регулярны (то есть другой порядок
действий не принят) (См. Charniak, 1975а). В модели,
использующей фреймы, информация о времени может
храниться наряду с другой информацией в самом фрейме.
Но как хранить эту информацию в модели, использующей
демоны, совершенно неясно. Мы не говорим, что это
вообще невозможно, однако хранение информации о времени
как бы нарушает естественные свойства такой модели.
ЗАКЛЮЧЕНИЕ
По-видимому, фреймы превосходят демоны, но мы
отнюдь не хотим вводить читателя в заблуждение и
утверждать, что фреймы позволяют ответить на все вопросы,
поставленные в нашей первой статье. Остановлюсь на
некоторых трудностях, связанных с фреймовым подходом
(выше мы о них даже не упоминали).
Одна трудность касается выработки формальных
условий активизации фрейма (то есть условий, при которых
начинается построение образа фрейма). Самым простым
условием было бы наличие в тексте соответствующего
ключевого слова (например, supermarket 'универсам').
Однако очевидно, что это условие неудовлетворительно.
Во-первых, часто упоминание слова в тексте не требует
вызова фрейма, например, если мы описываем район и
перечисляем все его магазины, включая универсам, то
соответствующий фрейм не должен активизироваться.
С другой стороны, активизация фрейма может
понадобиться, даже если ключевое слово и не названо. Например:
As Jack walked down the aisle he picked up a can of
tunafish and put it in his basket.
'Когда Джек шел по проходу, он взял банку тунца
и положил ее в корзину.'
Вопрос о том, как быть в такой ситуации, остается
открытым.
Еще одна трудность, и значительно более существенная,
315
состоит в том, что фреймы описывают только стереотипные
ситуации. Такие ситуации стоят за любым текстом, однако
каждый текст, чтобы не быть скучным, должен включать
нечто, находящееся за пределами этого стереотипа. Мы
не говорили о том, как использовать фреймы при
понимании необычных поворотов, которыми полны как любые
рассказы, так и сама жизнь.
Список подобных трудностей можно продолжать еще
долго, но обратимся в заключение к проблеме, которая
влияет на все системы, описанные в этой статье,— проблеме
содержания. Возможно, читатель заметил, что каждый раз,
когда мы пытаемся ответить на пять вопросов, последний
вопрос остается без ответа. Ни один из авторов систем не
предложил формальную процедуру выделения информации,
нужной для понимания даже простейших рассказов. Это
объясняется многими причинами, но основные из них
две. Во-первых, проблема содержания исключительно
сложна. Чарняк в работе (Charniak, 1974) попытался
проанализировать информацию, необходимую для
понимания последней фразы рассказа (16) в нашей первой статье
(Не will make you take it back Юн заставит тебя взять
его [мяч] обратно'). Его весьма неполный анализ занял
около 100 страниц. Во-вторых, нельзя преуспеть в
разрешении этой проблемы, если не располагать (хотя бы в
общем виде) формальным языком для представления
содержания, в противном случае можно написать лишь еще
один текст на естественном языке, что мало приблизит нас
к цели. Следовательно, мы сможем пытаться
формализовать некоторый обозримый фрагмент знаний о мире,
необходимый для понимания естественного языка, не ранее,
чем мы обретем некоторую уверенность в пригодности
используемого нами языка представления знаний.
Тем не менее дело не так безнадежно, как может
показаться из предшествующего абзаца. Наши знания в
рассматриваемой области увеличиваются, хотя цель все
еще далека. Сравним фреймовый подход хотя бы с системой
Рафаэла SIR (см. часть I этой статьи). Система Рафаэла
была очень ограниченной, что в то время было неизбежно.
Система SIR работала с примерами такого типа: A man has
two hands. A hand has five fingers. How many fingers does
a man have? 'У человека две руки. На руке пять пальцев.
Сколько пальцев у человека?' Неясно, как можно было
бы расширить SIR, чтобы она понимала назначение кор-
316
зины в магазине. Новые системы понимают естественный
язык в объеме, который для ранних систем был нереальным,
а это уже достижение.
ЛИТЕРАТУРА
Charniak, Е. Toward a Model of Children's Story
Comprehension.— In: "Memoranda from the Artificial Intelligence Laboratory",
Massachusetts Institute of Technology. TR 266, 1972.
Charniak, E. He will make you take it back: A study in the
Pragmatics of Language.— In: "Memoranda from the Istituto per gli
Studi Semantici e Cognitivi", 3. Switzerland, Castagnola, 1974.
Charniak, E. (1975 a). A Partial Taxonomy of Knowledge
about Actions.— In: "Advanced papers for the Fourth International Joint
Conference in Artificial Intelligence", USSR, Tbilisi, 1975 (MIT,
Cambridge, Mass., 1975).
Charniak, E. (1975b). Organization and Inference in a Frame-like
System of Common Sense Knowledge.— In: "Position papers for the
Workshop on Theoretical Issues in Natural Language Processing, Massachusetts
Institute of Technology", 1975 (BBN, Cambridge, Mass., 1975).
Minsky, M. A Framework for Representing Knowledge.-— In:
"The Psychology of Computer Vision" (Winston) (ed.). New York, McGraw-
Hill, 1975, p. 211—277.
Schank, R. and Abelson, R. Scripts, Plans and Knowledge.—
In: "Advanced papers for the Fourth International Joint Conference in
Artificial Intelligence", USSR, Tbilisi, 1975 (MIT, Cambridge, Mass.,
1975).
Й. Уилкс
АНАЛИЗ ПРЕДЛОЖЕНИЙ
АНГЛИЙСКОГО ЯЗЫКА
(ЧАСТЬ II)*
В этой статье мы продолжим рассмотрение систем,
ориентированных на представление структур предложений
естественного языка и анализ предложений с целью
обнаружения этих структур. В конце статьи мы сопоставим
системы, рассмотренные в этой и других работах, по ряду
оснований.
Следует иметь в виду, что мы используем термин
"анализ" (parsing) не только в стандартном смысле, принятом
в математической и вычислительной лингвистике (где
анализ понимается как процесс, абсолютно нейтральный к
содержанию, к практической ценности или степени
нетривиальности структур, приписываемых предложениям
естественного языка). Так, в первой нашей статье мы
иллюстрировали общее понятие анализа на примере грамматики
непосредственных составляющих, но читатель уже понял
наш вывод о том, что для получения результатов,
представляющих хоть какой-нибудь интерес, требуются
гораздо более богатые структуры представления смысла и
знаний, чем те, которые порождаются НС-грамматиками.
Таким образом, термин "анализ" в последующем изложении
обозначает процесс, который отнюдь не является
нейтральным к тому, что Ю. Чарняк в своей первой статье
назвал содержанием представлений. Адекватным
результатом анализа, как мы полагаем, могут считаться такие
представления, которые проливают свет на явление,
названное в нашей первой статье системной неоднозначно-
* Yorick Wilks. Parsing English IL—In: E. Charniak and
Y, Wilks (eds.). Computational Semantics. Amsterdam etc., 1978,
p. 155—184.
© North-Holland Publishing Company (1976).
318
стью языка, включающей лексическую, структурную
(глубинно-падежную) и местоименно-референционную
неоднозначность.
СИСТЕМЫ ВТОРОГО ПОКОЛЕНИЯ
Для того чтобы понять, почему Т. Виноград
противопоставил свою систему тем, которые он назвал системами
второго поколения, мы должны иметь в виду, что чаще всего
поколение системы обусловливается не временем ее
создания или наследованием тех или иных идей, а ее
внутренними свойствами. В своем обзоре Виноград относит ко
второму поколению, наряду с другими, системы Симмонса,
Шенка и Уилкса, хотя их основные принципы и
терминология были изложены в публикациях 1966, 1967 и 1968 гг.
соответственно. Как эти, так и другие системы второго
поколения строятся на следующем предположении:
системы понимания естественного языка должны быть
способны оперировать очень сложными лингвистическими
объектами — семантическими структурами, а все
упрощенческие подходы к проблеме понимания языка машиной
обречены на провал.
Как говорилось в нашей первой статье, системами
второго поколения можно считать (в порядке грубого
приближения) такие системы, которые построены на основе
принципов, аналогичных "фреймовому" подходу Минского
(этот подход описан во второй части статьи Чарняка).
Основной чертой структуры фреймового типа является
то, что она призвана предсказывать как определенные
характерные черты еще не введенных текстов, так и
некоторые сведения об устройстве мира той предметной
области, которая стоит за этими текстами. Наличие подобных
структур, а также связанных с ними правил вывода
умозаключений свидетельствует о новой черте систем
понимания, не свойственной системам первого поколения,
которая состоит в возможности задавать "частичную
информацию" (термин МакКарти) с помощью правил,
отражающих индуктивные обобщения — полезные, хотя
и не всегда верные, например: "люди пытаются добиться
того, чего они хотят". Как мы показали на примере фразы
о женщинах и солдатах (см. нашу первую статью), такая
нечеткая индуктивная информация, требующая
контекстуальных подтверждений, нужна для понимания даже очень
простых текстов. Если взять в качестве примера задачу
319
восприятия визуальной информации, то можно сказать,
что фреймовый подход моделирует интеллектуальную
деятельность человека, способного не только смотреть,
но и видеть.
Отметим, что данное нами определение систем
фреймового типа носит гораздо более общий характер, чем
описание Чарняка (см. его вторую статью), и предназначено
лишь для пояснения сущности трех систем, о которых
сейчас пойдет речь — систем Колби, Ризбека — Шенка и
Уилкса. После их рассмотрения мы сможем свести вместе
более общее и более частное определения понятия фрейма.
СИСТЕМА КОЛБИ
На протяжении ряда лет Колби (Colby étal., 1971),
(Еnеa and Colby, 1973), (Colby and Parkinson,
1974) разрабатывал диалоговую систему, моделирующую
речевую деятельность параноика (этот автоматический
собеседник, как и сама система, носит имя PARRy).
Свидетельством успеха системы служит тот факт, что ее
программы широко используются специалистами по ИИ, не
связанными непосредственно с разработкой данной системы.
Приведем образец диалога (ответы PARRy даны
прописными буквами):
Have you been hospitalised before?
'Вы раньше лечились в больнице?'
THIS IS THE FIRST TIME.
'Это первый раз.'
How long have you been there?
'Сколько времени вы здесь находитесь?'
ABOUT TWO WEEKS.
'Около двух недель.'
Any headaches?
'Головные боли есть?'
MY HEALTH IS FINE.
'Мое здоровье в прекрасном состоянии.'
Are you having any difficulty with your memory?
'Испытываете ли вы трудности с памятью?'
NO.
'Нет.'
320
Then perhaps you can tell me who is the President of
the United States?
'He скажете ли вы тогда, кто президент Соединенных
Штатов?'
NIXON IS PRESIDENT.
'Никсон — президент.'
What day is it today?
'Какой сегодня день недели?'
TODAY IS THURSDAY.
'Сегодня четверг.'
What season is it?
'Какое сейчас время года?'
LET'S GET ON WITH THE INTERVIEW.
'Давайте продолжим беседу.'
Цель Колби состояла в разработке такой системы,
которая не является "слабой" в том смысле, в каком это
можно сказать о большинстве других систем ИИ, то есть
она не отступает, когда входная фраза не совсем такова,
как можно было ожидать, и пытается продолжить диалог
при любых обстоятельствах (как это обычно делают
собеседники-люди).
Указанное свойство достигается благодаря отказу от
обычного синтаксического анализа, а также от попыток
рассматривать все слова входных предложений. Это дает
ощутимую помощь, в чем можно убедиться, если попытаться
пословно проанализировать такую форму вежливости, как
Would you be so kind as to... 'He будете ли вы столь
любезны...' Англичане, приезжающие в США, быстро
отвыкают от подобных выражений, вызывающих
замешательство их собеседников в магазинах.
Входной текст делится на сегменты с помощью
эвристической процедуры, которая проводит границу сегмента
тогда, когда встречается одно из ключевых слов. Затем
каждому сегменту сопоставляется его образец (pattern).
Сейчас в памяти машины хранится 1700 образцов (Colby
and Parkinson, в печати), которые сопоставляются
не с синтаксическими или семантическими представлениями
(за исключением случаев противоречий и ошибок), а
непосредственно с цепочками слов входного текста (с помощью
операций замен и сокращений). Так, например, во
входном предложении What is your main problem? 'Что вас
11 № 534
321
больше всего беспокоит?' глагол Is заменяется своим
инфинитивом BE, a your 'ваш' заменяется YOU 'вы', в
результате чего получается:
WHAT BE YOU MAIN PROBLEM
Затем применяется операция сокращения, последовательно
зачеркивающая каждое слово полученной цепочки, а
четыре оставшихся слова сравниваются с образцами:
BE YOU MAIN PROBLEM
WHAT YOU MAIN PROBLEM
WHAT BE MAIN PROBLEM
WHAT BE YOU PROBLEM
WHAT BE YOU MAIN
Только для предпоследней из перечисленных цепочек в
памяти хранится образец, который, естественно, и
отбирается в качестве результата анализа. Этот процесс можно
назвать процедурой минимального анализа.
В том же формате, что и образцы, записаны правила,
задающие реакцию "пациента" на обнаруженные им во
входных вопросах или замечаниях агрессивность или
преувеличенное дружелюбие. Подобранные образцы затем
используются (непосредственно или через посредство
упомянутых правил вывода) при порождении образцов
ответов.
Эвристики описываемой системы отличаются большой
изобретательностью, о чем свидетельствует ее
популярность. В последнее время система подверглась
существенной модификации: сейчас она называется PARRY2,
и ее работа базируется скорее не на первоначальной
концепции ключевых слов, а на процедуре сравнения с
образцами. Она включает "частичные" (или прагматические)
правила, моделирующие ожидания и намерения, и уже это
позволяет отнести ее к системам второго поколения,
осуществляющим весьма творческую интерпретацию входных
фраз. Разрабатывается также генератор, который сможет
выдавать не только заранее заданные ответы.
Колби и его коллеги затратили большие усилия на
то, чтобы выяснить, могут ли психиатры отличить ответы
PARRY от ответов человека-параноика (Colby and
Hilf, 1973). Это, возможно, первая реальная попытка
проведения теста Тьюринга (Turing, 1951), заключаю-
322
щегося в сравнении реакции человека и машины. Имеются
определенные затруднения в статистической интерпретации
результатов, но все же несомненно, что группа психиатров,
подвергшихся опросу, не могла различить ответы пациента
и машины. Несмотря на это, многие все же считают, что
принципиально PARRY нельзя относить к имитирующим
системам, поскольку, как они говорят, она "ничего не
понимает". Можно возразить, что такие критики
имплицитно предъявляют слишком высокие требования к понятию
"понимание". Ведь тогда можно пойти дальше и счесть, что
многие люди тоже не понимают содержания предложений
столь же глубоко и точно, как это доступно философу-
аналитику (что, возможно, и к лучшему). Однако
несомненно, что многие люди во многих ситуациях понимают
(или создают впечатление, что понимают) именно так, как
PARRY.
Когда мы говорили, что PARRY относится к "сильным"
системам в том смысле, что она готова работать с
необычными или неожиданными входными фразами, мы не
хотели сказать, что она даст осмысленный ответ на
бессмысленную входную "цепочку" (например, на строчку,
состоящую из звездочек), однако подобный способ
проверки работы системы понимания языка нельзя считать
приемлемым. Ясно, однако, что простое внутреннее
представление, используемое программой, позволяет расширить
PARRY таким образом, что эта система легче, чем
однотипные ей системы, реагирует на неожиданности во входных
предложениях.
Действительным недостатком PARRY можно считать
то, что она оказывается "слабой" в более общем смысле, а
именно осуществляет большую часть своего "понимания"
за счет конкретного ситуационного контекста,
определяемого задачей поведения параноика. Пользователи
программы склонны терпимо относиться к ее отказам от общения и
резким сменам тем разговора на том основании, что такое
поведение типично для параноика, хотя, если судить с точки
зрения именно способности понимания естественного языка,
подобные ответы системы вызваны просто тем, что она
оказалась не в состоянии понять смысл входного предложения
(то есть подобрать подходящие образцы).
и*
323
СИСТЕМА УИЛКСА
Система Уилкса строит семантические представления
для небольших текстов на естественном языке: базисное
представление строится непосредственно по тексту и может
затем преобразовываться с помощью разного рода правил
вывода умозаключений и достигать такого уровня глубины
представления, который необходим для решения задач,
наглядно демонстрирующих способность системы
"понимать" текст. Введена единая форма представления, то есть
предложены такие структуры, в которых объединяется
информация, обычно подразделяемая на синтаксическую,
семантическую, фактическую и дедуктивную. Основной
единицей этого семантического представления является
шаблон (template), интуитивным соответствием которого
можно считать базисную форму сообщения, имеющую форму
тройки "агенс — действие — объект". Шаблоны строятся
из более мелких блоков, называемых формулами, которые
соответствуют толкованиям отдельных лексем. Для того,
чтобы построить полное семантическое представление
текста (называемое семантическим блоком), шаблоны
объединяются с помощью двух видов структур более высокого
уровня — надшаблонов (paraplates) и правил вывода
умозаключений. Сами шаблоны строятся в процессе обработки
входного текста, тогда как формулы, надшаблоны и правила
вывода умозаключений хранятся в системе в готовом виде.
Каждая из готовых структур трех названных типов
построена на базе инвентаря из 80 атомарных семантических
элементов, а также функций и предикатов, задаваемых на
этом множестве элементов.
Система работает в режиме непосредственного доступа,
пакеты программ написаны на языках LISP (см. сноску на
с. 196), MLISP и MLISP2 (два последних языка являются
расширениями LISP'a за счет введения структуры команд и
средств сравнения с образцами). На вход подаются тексты
на английском языке, которые пользователь составляет на
материале словаря, включающего около 600 значений слов.
Система переводит эти достаточно разнообразные входные
тексты на французский язык. Такой режим работы системы
удобен для проверки понимания английского языка,
поскольку французский перевод обычного прозаического
текста очевидным образом является либо правильным, либо
неправильным и в то же время ситуация машинного пере-
324
вода позволяет опробовать возможности системы в решении
трудных лингвистических задач (лексическая,
глубинно-падежная и местоименно-референционная неоднозначность).
Для этого можно, например, специально подбирать
лексику входных предложений со сложными кореферентными
связями (так, чтобы при переводе род французского
местоимения диагностировал его референционную соотнесенность).
Именно в этом смысле французский перевод показывает,
правильно ли программа произвела вывод умозаключений
при "понимании" переводимого текста. Программа является
достаточно сильной, она может обрабатывать даже тексты,
содержащие некоторые грамматические ошибки. Это
объясняется тем, что в программе отсутствует синтаксический
анализ в его обычном понимании, она осуществляет
непосредственный переход к семантическим представлениям.
Типичным примером входного текста может служить
такой: John lives out of town and drinks his wine out of a
bottle. He then throws the bottles out of the window. 'Джон
живет за городом и пьет вино из бутылки. Затем он
выбрасывает бутылки из окна'. Программа дает французский
перевод, в котором три употребления предложной
конструкции out of переведены по-разному, поскольку они имеют
три разных смысла и во французском языке эти смыслы
выражаются разными языковыми средствами. Другим
примером является фраза Give the monkeys bananas although
they are not ripe because they are very hungry. 'Дай бананы
обезьянам, хотя они и незрелые, потому что они голодны.',
в которой два вхождения местоимения they (относящиеся,
соответственно, к бананам и обезьянам) будут переведены
местоимениями разных родов по принципу
предпочтительности, о котором будет сказано ниже. Оба эти примера
обрабатываются "базовым компонентом" системы (см. Wilks,
1973). Однако во многих случаях местоименная
неоднозначность неразрешима с помощью прямых "соображений
предпочтительности", использованных в последнем
примере, где, грубо говоря, свойство "зрелости" считалось более
предпочтительным при имени с признаком "растение", а
свойство голода — при имени с признаком "живое
существо". А уже в таких примерах, как John drank the wine on
the table and it was good. 'Джон выпил вино со стола, и оно
было хорошим.', местоимение it, которое можно соотнести с
двумя существительными — wine 'вино' и table 'стол', не
может быть обработано за счет учета предпочтительности,
325
поскольку оба существительных могут быть связаны с
прилагательным good 'хороший'. В таких случаях, когда
базовый компонент не в состоянии разрешить неоднозначность,
программа строит более глубокие представления текста,
пытаясь вывести цепь умозаключений, одно из звеньев
которой выявит предпочтительный вариант.
Система не содержит в явном виде никакой
синтаксической информации; все, что ей известно о смысле
произвольного английского слова,— это его формула. Она имеет вид
древесной структуры семантических элементов и
интерпретируется с помощью отношений зависимости. Главным
элементом формулы (head) считается самый правый элемент,
именно он и задает фундаментальную категорию, к которой
принадлежит вся формула. Так, главными элементами
формул, приписываемых действиям, могут быть только
следующие семантические элементы: PICK 'поднимать', CAUSE
'каузировать', CHANGE изменять, изменяться', FEEL
'чувствовать', HAVE 'иметь', PLEASE 'доставлять
удовольствие', PAIR 'соединять подвое', SENSE 'чувствовать', USE
'использовать', WANT 'хотеть', TELL 'говорить', BE
'быть', DO 'делать', FORCE 'заставлять', MOVE 'двигать,
двигаться', WRAP 'заворачивать', THINK 'думать', FLOW
'лить, литься', МАКЕ 'изготовлять', DROP 'бросать,
падать', STRIK 'ударять', FUNC 'функционировать', H APN
'случаться'.
Например, формула
((*HUM SUBJ) (*АШ OBJ) (THING INST) STRIK)
орисывает смысл действия 'бить' (beat) следующим образом:
«Действие, преимущественно состоящее из ударов (STRIK)
ц обычно выполняемое при помощи инструмента (INST),
являющегося вещью (THING), объект (OBJ) которого —
чаще всего живое существо (ANI), а субъект (SUBJ) —
человек (HUM)»*. Звездочки перед элементами означают,
* О глубинно-падежных отношениях см. статьи Ч. Филлмора в
сб. "Новое в зарубежной лингвистике", вып. X. М„ 1981.— Прим. ред.
326
что речь идет о классе элементов, например, класс *HUM
'человеч.' включает два элемента: MAN Человек' и FOLK
'группа людей'. Предлагаемая древесная структура
довольно бедна (что объясняется требованием простоты ее
преобразования в выражение на языке LISP); та же
семантическая единица может быть представлена в форме,
которая предложена Симмонсом для записи филлморовских
глубинно-падежных отношений, а именно
SUBJ OBJ
*ним .. >STRIKE— *ANl
(or Agent)
1 INST
THING
Эта схема наглядно показывает, что фрагмент
глубиннопадежной структуры, изображенный в верхней части
схемы, самым тесным образом связан с базисным
действием, или главным элементом формулы (который
занимает самое правое место при скобочной записи и
подчеркнут в формуле — см. стр. 326). Однако подобное
преобразование скобочной записи в стрелочную, как это
часто случается с графическими изображениями,
наталкивается на некоторые ограничения. Например, стрелочная
запись оказывается малоэффективной при описании смысла
имен, поскольку главные элементы соответствующих
формул (например, THING 'вещь' в формуле для needle 'игла'
или STUFF 'вещество, материал' в формуле для water
'вода') не имеют непосредственно зависящих от них по
глубинно-падежным отношениям элементов, аналогичных
отношениям в семантическом дереве для действия, например
beat.
Глубинно-падежные части формул могут иметь в своем
составе другие глубинно-падежные подчасти или даже
элементы, обозначающие действия; такое развертывание может
включать столько ступеней, сколько покажется
целесообразным иметь в толковании разработчику словаря.
Например, формула слова sew 4шить' будет содержать
инструментальную часть, которая описывает предпочтительные
инструмент этого действия как линейную вещь (LINE
THING), имеющую (WITH) отверстие (THRU PART) —
естественно, речь идет об игле. Соответствующее поддерево
327
(всего дерева для sew) имеет вид:
где дополнительная падежная характеристика вставлена
внутрь характеристики инструмента. Такая форма
представления позволяет существенно использовать
упорядоченность элементов, которая выпадает в стрелочном
представлении, что дает гораздо большую гибкость при описании
смысла имен, чем метод Катца — Фодора *, не
предусматривающий ни глубинно-падежных элементов, ни
элементов для представления действий (система Шенка
является вариантом этого метода — см. Weber, 1972).
Структуры-шаблоны, задающие семантические
представления реальных предложений и их частей, имеют форму
сети, составленной из формул типа приведенных выше.
Шаблон всегда состоит из трех основных узлов: для агенса,
действия и объекта, он может содержать также другие
узлы, подчиненные трем названным. Например, в шаблоне
предложения John beat the carpet 'Джон выбивал ковер'
приведенное выше дерево для beat будет поставлено на
место узла, символизирующего действие, другое дерево —
для John — на место агенса и т. д. Сложность
семантических представлений в системе определяется тем, как
формулы, рассматриваемые в качестве активных сущностей,
управляют заполнением других узлов данного шаблона.
Итак, полный шаблон — это достаточно сложная
структура. Приведем в качестве примера шаблон предложения
John shut the door. 'Джон закрыл дверь.':
* См. статьи Дж. Катца, У. Вейнрейха и Д. Болинджера в сб.:
"Новое в зарубежной лингвистике", вып. X. М., 1981.— Прим. ред.
328
(1)
(THE {(PLANT STUFF) SOUR) ««THRU PART) OBJE) (NOTUSE'ANI)) GOAL) ((MAN USE) (OBJE THING»)
ЦОЛК ( (ДЕРЕВЛЛАТЕР 1ИСТОЧН )((«ЧЕРЕЗ ЧАСТЬ)ОБЪЕКТ)(НЕ ИСП/ОДУШ ))ЦЕЛЬ)((ЧЕЛОВ.ИСП.)(ОБЪЕКТ ВЕЩЬ)))
Определенный артикль the не получает особого
семантического представления, а просто присоединяется, как это
видно в шаблоне, к соответствующей формуле (как и
элемент PAST 'прош. время' следует присоединить к формуле
для shut). Хотя все шаблоны имеют единую базисную форму
"агенс — действие — объект", любому из этих узлов может
быть подчинена зависящая от него формула. Например,
если бы рассматриваемое предложение имело вид: John
shut the green door. 'Джон закрыл зеленую дверь.',
объектному узлу door была бы подчинена формула слова green.
Каким образом в действительности производится
переход от текста к шаблонам? Этот процесс начинается с
сегментации (fragmentation) текста: программа разбивает
фразы текста на сегменты, пользуясь ключевыми словами,
такими, как предлоги, подчинительные союзы и т. п. Это
329
'объект, имеющий материалом (источником)
древесину и используемый человеком для того,
чтобы одушевленные вещи не могли использовать
отверстие'
делается только на основе списка ключевых слов и
сведений о диапазоне действия семантических формул
неключевых слов. Например, разбиение на сегменты фразы The
sort of man I that dogs need I is kind. 'Человек, I который
нужен собакам, / должен быть добрым.' осуществляется в
двух местах, отмеченных здесь вертикальными чертами.
Даже это предложение требует использования семантики
формул для определения того, что в данном случае that
является относительным союзным словом, а не
указательным местоимением, как во фразах типа The dog likes that
man. 'Собака любит того человека'.
Обычно каждому сегменту фразы, полученному
указанным способом, сопоставляется один или более шаблонов,
однако в некоторых случаях сегменты немедленно
склеиваются в единый шаблон, как, например, это произойдет для
предложения The sort of man is kind из приведенной выше
фразы.
Затем осуществляется процедура наложения (matching)
шаблонов на сегменты. Сначала программа просматривает
в сегменте слева направо все комбинации формул (ибо,
вообще говоря, для каждого слова будет определено более
одной формулы: каждая соответствует какому-то из
значений слова), при этом обращается внимание лишь на
главные элементы формул. Ищутся формулы для агенса
действия и объекта, сначала именно в названном порядке; при
этом, например, формула прилагательного (ее главный
элемент — KIND 'тип') никогда не может занять место
агенса. Соответствующая процедура называется наложением
каркасов шаблонов (bare template matching) и в
действительности выглядит сложнее, чем было здесь показано,
поскольку тройка "агенс — действие — объект" часто
располагается в сегменте в другом порядке. В связи с этим вводится
шкала предпочтительности для выбора порядка главных
элементов формул. Кроме того, многие сегменты не
содержат всей тройки главных элементов, например, у
предложения John left. 'Джон ушел.' не может быть объекта, и
в таких случаях для сохранения единообразия шаблонов в
них вводятся пустые узлы. И наконец, английские предлоги
всегда трактуются как узлы действий, и потому им всегда
приписываются пустые агентивные узлы (этот вопрос будет
рассмотрен подробнее ниже).
Сама процедура наложения шаблонов тоже не так проста,
как это было представлено выше, и она не сводится к пря-
330
мому построению шаблонов из целых формул. Хотя полный
шаблон, например для John shut the door, как он приведен
выше, действительно строится таким образом, но до этого
система уже сопоставила входному предложению каркас
шаблона, состоящий из главных элементов MAN CAUSE
THING 'человек каузирует вещь', который в системе
считается допустимым, в отличие, например, от недопустимого
каркаса вида KIND CAUSE THING 'тип каузирует вещь'.
Таким образом, каркасы шаблонов (или типы шаблонов),
состоящие из трех упорядоченных семантических
элементов, заранее заданы системе и накладываются на
сегменты текста.
Затем следует более интересная процедура наложения,
которую мы назовем расширением по предпочтительности
(preferential expansion). Шаблоны строились до сих пор с
помощью приписывания формул узлам только на основе
требований к главным элементам формул. Для предложения
John shut the door мы получим один правильный шаблон
типа приведенного выше, но для предложения John shut
the case. 'Джон закрыл ящик/судебное дело.' возможны
два правильных шаблона с такими каркасами: MAN CAUSE
THING и MAN CAUSE GRAIN 'человек каузирует
систему', поскольку элемент GRAIN 'система' является главным
в формуле для второго значения слова case.
Расширение состоит в поочередном обследовании всех
шаблонов, принципиально допустимых для данного
сегмента, с целью выяснить, какие требования формул к
предпочтительному заполнению валентностей выполняются
при выборе данного варианта шаблона.
Как говорилось ранее, некоторые семантические
элементы, входящие в состав формул, не носят обязательного
характера и выражают желательность,
предпочтительность подобного заполнения. Так, в шаблоне (1) формула
для shut содержит указание на предпочтительность того,
чтобы агенсом был человек, а объектом — вещь. Оба условия
предпочтительности выполняются, если главным элементом
формулы для case является THING (то есть, если выбрать
для case первое, вещественное значение), тогда как формула
с главным элементом GRAIN (для второго значения case)
не удовлетворяет условию предпочтительности,
наложенному на объект. Таким образом, рассматриваются не только
формулы для действия, но и все остальные формулы,
входящие в состав шаблонов.
331
Такой поиск типов агенсов, объектов и т. п. носит лишь
предпочтительный характер. Иначе говоря, может быть
принята и формула, не удовлетворяющая условиям
предпочтительности, но только в том случае, если нельзя найти
лучшего варианта. В результате сегменту сопоставляется
тот шаблон, в котором выполнено наибольшее число
условий предпочтительности. Общий принцип здесь сводится к
тому, что наилучшей интерпретацией является та, которая
с точки зрения передачи информации содержит
наименьшее количество "новшеств" по сравнению со стандартом.
Эта простая процедура подсчета предпочтительностей
попутно выполняет значительную часть работы, обычно
возлагаемую на аппарат синтаксического анализа, поскольку
одновременно с разрешением лексической неоднозначности
(способом, описанным выше) она следит за тем, чтобы
семантические представления прилагательных заняли в
шаблонах надлежащие позиции (ср. the green door) и т. п.
Тем самым формулы — это не просто статичные объекты,
задающие смысл слов. В процедурах типа описанной выше
они играют активную роль, предъявляя свои требования к
строящимся шаблонам. Если попытаться определить
использование принципа предпочтительности в терминах анализа
снизу вверх vs. сверху вниз, то окажется, что его нельзя
считать чистым случаем ни первого, ни второго,
поскольку предпочтительная структура выбирается при анализе
снизу вверх, а потом применяется при анализе сверху вниз.
332
До сих пор мы рассмотрели следующие шаги работы
программы анализа: сегментация текста и процедура
наложения шаблонов, состоящая из двух этапов. Ниже мы
рассмотрим процедуру вывода умозаключений, также
состоящую из двух этапов. Результатом ее применения является
семантическое представление текста (=семантический блок).
В целом переход от текста к его семантическому
представлению символизирует данная нами на с. 332 схема.
Обратимся теперь к процедурам вывода умозаключений,
которые объединяют шаблоны так, что в результате текст
оказывается представленным в форме семантического блока;
под семантическим блоком мы понимаем упорядоченную
последовательность шаблонов, связанных стрелками
определенных типов (речь о них пойдет ниже). Построение
такого блока означает, с точки зрения системы, разрешение
всех случаев лексической и референционной
неоднозначности; после этого программа в ее современном виде начинает
переход от семантического блока к французскому тексту.
Эта часть работы системы описана в (Herskovits,
1973). Таким образом, сейчас система, построив (как
показано на схеме) семантическое представление, осуществляет
синтез французского текста. Однако с равным успехом она
могла бы отвечать на вопросы или выполнять другую
аналогичную задачу.
В дальнейшем изложении в целях сокращения мы не
будем приводить шаблоны в их полной, достаточно громоздкой
форме (ср. (1)), а будем обозначать их наборами не менее
чем трех символов (английских слов и пустых узлов) в
квадратных скобках. Подчеркнем, что слова в квадратных
скобках следует понимать как сложные семантические
объекты, а не как собственно слова английского языка.
Следующий тип структуры — надшаблон. Он служит для
объединения двух шаблонов, причем чаще всего один из
шаблонов представляет "главное" предложение
[подлежащее, сказуемое и прямое дополнение], а второй —
предложную группу. Так, если мы хотим получить надшаблон
для предложения
John left his clothes at the cleaners.
'Джон оставил свою одежду в химчистке.',
которому раньше система приписала два шаблона (один —
"главному" предложению, второй — предложной группе),
то надо соединить их глубинно-падежной связью
локативного характера (SLOCA — spatial-location case tie) сле-
333
дующим образом:
[John left his + clothes]
SLOCA J
>►[ ( D =пустой узел агента) at the + cleaners]
Каково же устройство надшаблона? Каждый надшаблон
выражает одно из глубинно-падежных отношений (отметим,
что здесь используется тот же набор глубинных падежей, что
и внутри формул), а для каждого глубинного падежа
имеется по нескольку надшаблонов. Некоторые глубинные
падежи условно обозначаются названиями английских
предлогов, хотя на самом деле каждый предлог способен
передавать не одно, а несколько глубинно-падежных значений.
Так, рассмотрим значения предлога by в группе
предложений, которые начинаются одинаково: Не left Comano
by... 'Он ушел/уехал из Комано...' . В приведенных
ниже примерах в правой колонке даны названия падежей,
соответствующие типам надшаблонов, которые соединяют
"главное" предложение с предложной группой
(2) Не
left
Comano
(3)
(4)
(5)
(6)
(7)
(8)
by courtesy of the police
'благодаря любезности
полиции'
by the autostrada
'по автостраде'
by car
'на машине'
by stealth
'украдкой'
by Monday night
'к вечеру понедельника'
by following the arrows
'в направлении указателей'
by stealing a boat
'украв лодку'
SOUR
'источник'
DIRE
'направление'
INST
'инструмент'
WAY
'образ
действия'
TLOCA (time
location case)
'время'
DIRE
'направление'
INST
'инструмент'
334
В общем виде надшаблон — это шестерка главных
элементов двух каркасов шаблонов (причем некоторые
элементы могут быть пустыми узлами) в соответствии с ролями
"агенс первого шаблона", "действие первого шаблона",
"объект первого шаблона" и аналогично для второго
шаблона (особенно редко заполняются места агенса и
объекта). В отличие от шаблонов, в надшаблонах условия
заполнения узлов носят обязательный характер: при наложении
некоторого надшаблона на пару шаблонов все их узлы
должны удовлетворять заданным в надшаблоне условиям. Ниже
представлены четыре надшаблона, дающие положительный
результат при их наложении на пары шаблонов,
соответствующие предложениям с теми же номерами, что
приведены выше. Левая часть у всех надшаблонов одна и та же и
написана один раз:
(3') (*ANI) (MOVE) (WHERE POINT)
(4')
(7')
(8')
(DIRE)
(INST)
(DIRE)
— DD (WHERE LINE)
-►DD (*REAL)
"*• D (*DO) (WHERE SIGN)
(INST)
"*" □ (*DO) (*REAL)
Семантический класс *DO охватывает главные элементы,
связанные с разного рода действиями. Скобки
символизируют условия такого вида: "выражение в скобках считается
успешно сопоставленным соответствующей формуле
некоторого шаблона, если это выражение является ее
составной частью". Например, (3') соответствует (3), поскольку:
формула he
"— left
"— Comano
"— autostrada
попадает в класс
(имеет в качестве
части)
"ANI
MOVE
(WHERE
POINT)
(WHERE
LINE)
Аналогичное соответствие устанавливается и между
другими предложениями и надшаблонами. В результате этого
между двумя шаблонами, описывающими "главное"
предложение и предложную группу (3), устанавливается глу-
335
бинно-падежная связь DIRE 'направление'. В более
сложных случаях сегменту предложения могут быть
сопоставлены два или более шаблона, и тогда выбирается тот
шаблон, который согласуется с "более предпочтительным над-
шаблоном". Как мы увидим, надшаблоны, заданные для
каждого предлога, упорядочены, и "более
предпочтительным" считается тот надшаблон, который оказался
применимым раньше.
Мы привели несколько надшаблонов, которые
приписаны предлогу by и вызываются каждый раз, когда шаблон,
соответствующий сегменту с by, надо связать с другими
шаблонами. Надшаблоны для каждого предлога организованы
в список по типу действия, упоминаемого в левой части над-
шаблона; внутри гнезда надшаблоны определенным
образом упорядочены, хотя это упорядочение надшаблонов, как
мы увидим, произвести не слишком просто.
Например, сочетание глагола (у которого главным
элементом его формулы является MOVE) с предлогом by в
большинстве случаев диагностирует инструментальный
падеж (INST), если нет указаний на другую падежную связь.
Поэтому более частный надшаблон (3') должен быть
применен раньше, чем надшаблон (4'), для того чтобы обеспечить
обработку случаев типа (3), поскольку при
противоположной последовательности правил — (4'), (3') — надшаблоном
для (3) оказалось бы (4'), чего допускать "не следует".
Представим, что мы внесли бы весьма специфическое
уточнение в последний, шестой узел надшаблона (4'),
заменив весьма общий семантический элемент (*REAL),
приписываемый широкому классу реальных объектов и
сущностей, на гораздо более частный элемент, имеющий
смысл 'средство для транспортировки людей'. Тогда
надшаблон (4') можно было бы поставить раньше, чем (3'),
и он работал бы нормально (давал бы правильный анализ
предложения 4). Но фраза Не left Comano by cattle truck.
'Он уехал из Комано на платформе для перевозки скота.'
не смогла бы быть проанализирована с помощью (4')
(поскольку платформа для перевозки скота обычно не
используется для перевозки людей); неприменимым оказался бы
далее и надшаблон (3'), который теперь находится ниже,
чем (4'). В результате вообще не нашлось бы надшаблона,
соответствующего структуре этой фразы, и значение
инструментального падежа, соединяющего два шаблона, не
было бы установлено.
336
Подобные рассуждения убеждают нас в необходимости
определять порядок применения надшаблонов с учетом
предпочтительности. Но такой порядок не может быть
простым (линейным), поскольку в ряде случаев надшаблоны как
бы имеют один порядок, например (3') и (7'). Чтобы учесть
такую возможность, мы вводим между надшаблонами
отношение частичного порядка (оно не имеет ничего общего
с частичной информацией, о которой говорилось выше).
Надшаблон имеет общий вид (шаблон) —> (шаблон), в
связи с чем представляется разумным считать надшаблоны
структурами вывода умозаключений в широком смысле.
Эта мысль не покажется странной читателю, который
ознакомился с системой Шенка (см. статью Скрэгга), в
которой умозаключением называется расширение
концептуализации за счет глубинно-падежной информации.
Как было сказано в начале описания системы Уилкса,
в случаях референционной неоднозначности система
связывает между собой шаблоны, используя принцип
предпочтительности (ср. пример о бананах и обезьянах). Связь
такого рода соединяет "местоименный" узел одного шаблона
с именным узлом антецедента данного местоимения в
другом шаблоне.
Здесь уместно сделать общее замечание относительно
того, каким образом устанавливаются кореферентные связи
для местоимений в разных системах, рассматриваемых в
этой книге, например в системе Винограда (см. ч. первую
статьи Уилкса), Ригера (см. ч. вторую статьи Чарняка, в
которой эта проблема в значительной степени решается с
помощью анализатора Ризбека — см. ниже), Чарняка (см.
часть II статьи Чарняка, где описывается система,
устанавливающая кореферентные связи в рамках процесса
анализа детских рассказов) и Уилкса (о ней речь идет сейчас).
Ни в одной из названных систем нет единой процедуры
соотнесения местоимений с теми существительными или
именными группами, которые они замещают, поскольку
проблема референции носит разноплановый характер и не может
быть решена одним универсальным способом.
Так, существует распространенное заблуждение,
согласно которому местоимение относится к некоторой
лексической единице, ранее упомянутой в тексте (или, в
редких случаях, упомянутой позже, чем местоимение),— такой
взгляд лег в основу почти всех систем ИИ. Однако в общем
случае это не верно, что видно из таких примеров, как It is
337
hot In here. 'Здесь жарко.' или In Italy he drank mineral
water in his wine and it tasted good. 'В Италии он пил
минеральную воду с вином, и это было вкусно.', причем в
последнем примере it относится к тому, что непосредственно в
предложении не названо. Конечно, сочетаемостные
ограничения с учетом принципа предпочтительности или какие-
либо другие средства часто бывают достаточными для
установления кореферентных связей местоимений, как в
примере о бананах и обезьянах, однако в других случаях
эти средства помочь не могут (и мы скоро это покажем).
Существует известное правило, которое все когда-то учили
в школе, что местоимение относится к последнему из
упомянутых "подходящих" объектов, и иногда, не имея других
рецептов, мы можем с его помощью объяснить
употребление местоимений во фразах типа John took the wheel off
his bike and then the saddle and left it in the garage. 'Джон
отвинтил от своего велосипеда колесо, потом седло и
оставил его в гараже.', где it можно считать заместителем
последнего из названных до него существительных — saddle.
Но когда мы встречаем такой пример: The log floated past
the tree and then the fish swam under it. 'Бревно проплыло
мимо дерева, а затем под ним проплыла рыба.', то наверняка
можно сказать, что it относится к существительному log
'бревно', а не к последнему из упомянутых tree 'дерево'.
Видимо, естественно считать, что в этом примере
антецедент местоимения it устанавливается благодаря нашим
знаниям о том, что значит 'проплыть' (float u swim), и о том,
что деревья обычно не плавают на воде.
Другими словами, существует целый ряд различных
способов установления кореферентных связей в различных
обстоятельствах. Однако если какой-то из этих способов
объявляется общим правилом, то для него нетрудно найти
исключения. Опасна и другая крайность, когда мы вообще
отказываемся от поиска общих правил, объясняя свой
отказ тем, что они не универсальны. Это тоже было бы
ошибкой, поскольку нормы не теряют своей ценности из-за
того, что они нарушаются.
В системах ИИ наблюдаются два основных подхода к
проблеме установления кореферентных связей. При первом
подходе упор делается на очень общие процедуры,
выполняемые системой, и предполагается, что если эти процедуры
осуществляются правильно, то удается точно установить и
большинство кореферентных связей. Названный подход
338
принимает во внимание скорее наиболее распространенные
случаи, чем исключения. При этом различные типы
кореферентных связей выделяются и описываются в терминах
операций, выполняемых системой в целом. Этот подход
развивается в системах Уилкса и Шенка.
При втором подходе для разных конкретных условий
разрабатываются специальные процедуры, и именно
применительно к этим условиям решается проблема
установления кореферентных связей. Это "специалисты" Винограда
(см. часть I статьи Уилкса), "демоны" Чарняка (см. часть II
статьи Чарняка) и т. п. В таких системах общие проблемы
представления текста отступают на второй план, а основное
внимание уделяется разбору не типичных, а особо трудных
случаев, нарушающих нормы.
На практике во всех работающих системах оба
названных подхода объединяются, и все предложенные способы
решения рассматриваемой исключительно сложной
проблемы — это пока еще не более чем весьма грубые и
поверхностные приближения.
После этого отступления, посвященного общим
вопросам референции, вернемся к системе Уилкса. Многие
языковые примеры не поддаются обработке с помощью простого
применения принципа предпочтительности в базовом
компоненте; особенно это касается случаев лексической и
референционной неоднозначности. Если такие случаи
не обработаны, то нельзя построить искомый единственный
семантический блок шаблонов, поэтому такие фразы
поступают из базового компонента в "расширенный компонент
вывода умозаключений". В этом компоненте
осуществляется вывод из обычных шаблонов новых структур типа
шаблонов (они называются экстракциями); полученные
экстракции вместе с шаблонами подвергаются обработке
по правилам "здравого смысла".
Проиллюстрируем эту последнюю стадию анализа на
примере фразы (9):
(9) John bought a car in the market and liked it
immediately. 'Джон купил автомобиль на рынке и сразу его
полюбил.'
Заключительный семантический блок для (9) будет иметь
(схематически) такой вид, как показано на стр. 340.
"Саг" и "John" в схеме обведены овалами, поскольку
это результирующие значения формул, стоящих в
соответствующих узлах. Узел "John" получен простым применением
339
правил предпочтительности в базовом компоненте, поэтому
мы сосредоточим внимание на узле "саг", который заменил
местоимение it. Представление (10) является результатом
применения трех независимых процедур над тремя
исходными шаблонами (#1, #2, #3), представляющими входной
текст. Первая процедура вводит глубинно-падежную связь
SLOCA 'МЕСТО' способом, о котором говорилось выше.
Вторая процедура ведает экстракциями. Представления в
двойных квадратных скобках (1.1, 1.2 и 1.3) являются
экстракциями, которые добавлены к представлению до
применения правил вывода умозаключений. Все три
выведены из #1, как это показывают пунктирные стрелки.
Основным типом экстракции является такой, который
получается в результате развертывания (unpacking)
каждого падежного типа (кроме агенса и объекта),
наличествующего в формулах исходного шаблона (#1); о
развертывании будет сказано ниже.
В формуле глагола bought, приводимой ниже, имеется
целевая (GOAL) часть, в которой содержится информация
о том, что цель покупки состоит в использовании
купленного, поэтому 1.2 является результатом развертывания
целевой части #1. Аналогично 1.3 является результатом
развертывания части, символизирующей образ действия
(WAY), а 1.1, как интуитивно кажется, является
каузальным следствием из #1, поскольку действие 'покупка'
принадлежит к более общему классу получения (GET), что
видно из формулы для buy:
Формула означает, что покупка — это получение чело-
340
CHUM SUBJ) CREAL OBJE) (USE GOAL) («(GET SIGN) OBJE) («HUM GIVE)) WAY) GET\
СЧЕЛ. СУБ) (»РЕАЛ. ОБЪЕКТ) (ИСП. ЦЕЛЬ) ((((ПОЛУЧ ЗНАК) ОБЪЕКТ) («ЧЕЛ. ДАВАТЬ)) СПОСОБ) ПС;ЛУЧ1
веком реального объекта для использования этого объекта,
и способ получения состоит в том, что человеку даются
деньги (GET SIGN). Таким образом, три стрелки
экстракций на предыдущей схеме могут быть помечены символами
трех глубинных падежей: CAUSE 'причина', GOAL 'цель'
и WAY 'образ действия' соответственно.
Итак, экстракции — это новые формальные структуры
типа шаблонов, добавляемые к представлению текста для
"углубления" этого представления. В них дается
информация, которая не содержалась в исходном тексте в явном
виде. Вообще говоря, эта информация может быть и неверной.
Например, Джон мог купить машину (#1), но не владеть
ею (#1.1), поскольку он ее немедленно перепродал.
Экстракции строятся путем развертывания падежных частей в
формулах в виде структур по типу шаблонов, как если
бы все условия падежной предпочтительности в формуле
действительно были выполнены. Поскольку формула входит в
состав некоторого шаблона, то обычно по остальным частям
шаблона можно судить, как именно должно было бы быть
выполнено условие предпочтительности. Например,
согласно формуле для bought, цель покупки — использование
покупаемого объекта, а информацию о том, что это за объект,
надо искать в объектном узле шаблона (#1). Таким
образом, экстракции всегда носят локальный характер, потому
что они выводятся из информации, содержащейся только в
данном шаблоне.
Третьей процедурой является вывод умозаключений по
правилам "здравого смысла", на схеме (10) ей соответствует
стрелка (с прямыми углами), ведущая от шаблона #1 к
шаблону #3. На основании этой стрелки в #3 на место it
подставлена формула для саг. Правила вывода имеют вид
"(шаблон) —> (шаблон)" и всегда включают ограничения
на значения переменных. Правило, с помощью которого
произведен вывод # 1 ~* #3, выглядит следующим образом:
341
[animate 1 cause + self + have realobject 2] —> f 1 *judges
2),
где переменная 1 должна относиться к семантическому
классу *ANI '*жив.\ запись * judges означает требование
принадлежности к соответствующему семантическому
классу (которому удовлетворяет и like 'любить'), а квадратные
скобки показывают, что мы имеем дело с сокращенным
вариантом данного правила, которое на самом деле имеет вид:
((*ANI 1) ((SELF HAVE) CAUSE) (*REAL 2)) -* (1
*JUDG 2)
'((*ЖИВ 1) ((CAM ИМЕТЬ) КАУЗИРОВАТЬ)
(*РЕАЛЬН. 2)) -> (1*СУДИТЬ 2)'
Левая часть правила соответствует шаблону #1, а правая—
шаблону #3. Отсюда объектный узел it в #3 считается
равным переменной *REAL 2 в левой части правила, то
есть равным саг.
Следует отметить, что эти правила вывода являются
частичными: в общем случае они не принадлежат к
обязательным следствиям. В случае успешного наложения
шаблонов и заполнения "смысловых лакун" мы считаем, что
получаем правильную семантическую интерпретацию текста.
Более того, рассматривая цепочку выводов из шаблона (или
экстракции) с обрабатываемым местоимением, мы считаем
более предпочтительной (правильной) самую короткую
цепочку из всех возможных (в нашем примере — цепочка,
ведущая от it к market 'рынок', отбрасывается как более
длинная). Аналогичные соображения относительно
заполнения лакун текста с выбором результата, полученного по
самой короткой цепочке вывода, высказаны недавно
Кларком (Clark, 1975), который, впрочем, опирался на
психологические данные.
Можно усмотреть сходство между нашими
предложениями и "стратегией демонов" Чарняка, описанной в ч. II
статьи Чарняка, хотя это сходство и не касается
предпочтительности кратчайшей цепочки вывода. В этой части Чар-
няк рассматривает в основном вопросы машинного вывода,
однако на самом деле одна из исходных задач Чарняка
состояла именно в решении проблемы референции в рамках
системы анализа детских рассказов (см. Charniak,
1972). Оба сравниваемых подхода направлены на
"заполнение смысловых лакун" в отличие, например, от системы
342
Ригера (Rieger, 1974), где вывод умозаключений
производится в отличие от упомянутых систем,
безотносительно к поиску подтверждения этих умозаключений на каждой
стадии анализа. Другая общая черта систем Уилкса и
Чарняка состоит в том, что правила вывода в них имеют вид:
А ИМПЛИЦИРУЕТ В
А ИМПЛИЦИРУЕТ НЕ В,
то есть правила вывода осуществляют поиск либо
некоторого утверждения, либо его отрицания. В нашем примере
(3) использовалась бы та же самая процедура наложения,
если бы в исходном тексте сообщалось, что Джон не любит
свой автомобиль. Этот подход ориентирован на обеспечение
скорее релевантности и связности представления текста, чем
формально-логической корректности, поскольку
приведенный выше общий вид правил делает систему логически
тривиальной. Однако с точки зрения автоматического
понимания естественного языка это не существенно.
Основной недостаток системы Уилкса состоит в том, что
коды, состоящие исключительно из семантических
элементов, обладают как неоднозначностью, так и избыточностью.
Например, в терминах семантических элементов нельзя
выразить различие между такими словами, как hammer
'молоток' и mallet 'колотушка'. Это, конечно, не столь
важно, если эти коды способны отражать существенные
семантические различия. В то же время принятое
семантическое представление содержит многочисленные
повторения; например, представление предложения The shepherd
tended his flock. 'Пастух пас свое стадо.' будет состоять из
формул, в значительной степени пересекающихся друг с
другом, то есть каждый узел будет как бы снова
рассказывать все ту же историю. Не ясно, сохранит ли система
стабильность при значительном увеличении словаря,
скажем, до нескольких тысяч слов.
Вызывает сомнения и то, не станет ли неуправляемым
аппарат вывода умозаключений при существенном
увеличении количества правил "здравого смысла", не станут ли
цепочки нахождения антецедентов местоимений чересчур
длинными. Не совсем удовлетворительным кажется и
решение всегда выбирать самую короткую цепочку, например
предпочитать цепочку из трех шагов цепочке из четырех
шагов (хотя предпочитать цепочку из одного шага цепочке
из четырех шагов кажется вполне естественным). Эти труд-
343
ности показывают, что принцип предпочтительности в
системе должен опираться на систему весов, однако сейчас
подобная система отсутствует.
МАШИННАЯ РЕАЛИЗАЦИЯ РИЗБЕКОM ТЕОРИИ ШЕНКА
Теория концептуальных зависимостей Шенка*
рассмотрена в статье Скрэгга. Она была применена в системе
MARGIE (Schank et al., 1973), анализатор которой
разработан Ризбеком (Riesbeck, 1974), аппарат вывода —
Ригером (Rieger, 1974, см. также вторую статью
Чарняка), а синтезатор — Голдманом (Goldman, 1974).
Нас интересует только первая часть системы — анализатор.
Разработка анализа английских фраз на базе теории
концептуальных зависимостей — задача далеко не простая;
как помнит читатель из первой статьи Уилкса, Шенк
предложил некоторые процедуры вывода, касающиеся
концептуализации (ср. глубинно-падежный вывод), однако совсем
не рассматривал вопросов анализа естественного языка,
то есть способов перехода от текста к его структуре в
терминах концептуальных зависимостей и не пытался даже
предоставить исходную информацию для последующей
разработки подобных алгоритмов. Это означает не то, что Шенк
отказался от решения таких проблем, как языковая
неоднозначность, но только то, что применение правильного
семантического представления, по его мнению, само по себе
решит эти проблемы. Как мы видели выше, при
рассмотрении системы Уилкса, для того чтобы проанализировать,
к примеру, предложные группы, требуется значительный
объем семантической информации и большое число
различных критериев; разработкой всего этого и занялся Ризбек.
Первым шагом перевода системы Шенка в форму,
пригодную для машинного использования, была выработка
линейной семантической записи, поскольку плоскостные
структуры Шенка содержат многие сведения лишь в
имплицитном виде.
Анализ, предложенный Ризбеком, направлен в глубину
(см. определение выше). Вскоре после своего начала он
становится анализом сверху вниз. Мы говорим "вскоре",
поскольку начинает анализ процедура "вызова" концеп-
* В русской переводной литературе наряду с термином "теория
концептуальных зависимостей" используется термин "теория
семантических зависимостей".— Прим. ред.
344
туальных структур на основе появления в тексте тех или
иных слов, которые просматриваются слева направо. Эти
структуры Ризбек называет ожиданиями; они
предугадывают, что было сказано раньше или что будет сказано в
тексте дальше. Ожидания имеют форму запросов по тексту на
основе появления в нем определенных слов.
Весьма существенным аргументом в пользу такого
подхода является то, что наиболее подходящие
концептуальные структуры весьма далеки по своему виду от
поверхностной структуры текста, и что эти наиболее подходящие
структуры лучше всего применять как можно раньше, а не
после завершения процесса последовательного "углубления"
репрезентации, как, например, в системе Уилкса.
Прекрасным примером в этом отношении является предложение
John gave Mary a beating букв. 'Джон дал Мери битье',
которое имеет очень мало общего с подлинным действием
'давать'; этот пример будет подробно рассмотрен ниже.
В системе Ризбека правильная структура названного
предложения фактически связана с толкованием для beating,
поэтому, когда процедура анализа доходит до данного
слова, эта правильная концептуализация (базирующаяся на
"примитивном" действии PROPEL, которое выражает
движение руки Джона) как бы "берет верх" и вытесняет
предварительные структуры, построенные в ходе анализа
четырех предшествующих слов предложения.
Ниже приводится разработанная Ризбеком таблица
запросов, ассоциируемых со словами данного предложения в
процессе его анализа слева направо (и записанных в
таблице сверху вниз).
NP — сокращение для известного грамматического
понятия "именная группа" (noun-phrase). Таблица легка для
понимания, следует только иметь в виду, что
пронумерованные вопросы в третьем столбце остаются активными
(и, соответственно, "спускаются" по столбцу ниже), пока
на них не будет получен положительный ответ. Запросы,
состоящие из пометы "истинно" (номер 5 и 6),— это просто
пустые запросы (имеющие аналогию в языке LISP) *,
которые автоматически получают положительный ответ в том
случае, если над ними ничего не остается.
В общих чертах анализ предложения проходит следую-
щим образом. Утвердительный ответ на запрос 2 приводит
* См. Уинстон, П. Искусственный интеллект. М., 1980; Ра-
фаэл Б. Думающий компьютер. М., 1979.—Прим. ред.
345
Шаг
0
1
2
3
4
5
6
7
и
Анализируемое
слово
нет
John
gave
Mary
а
beating
period
none
Текущие запросы
1 — ЭТО NP?
1 — ЭТО NP?
2 — текущая NP —
человек?
3 — текущая NP —
предмет?
4 —текущая NP —
! действие?
5 — истинно
2 — текущая NP —
человек?
3 — текущая NP —
предмет?
4 — текущая NP —
действие?
3 — текущая NP —
предмет?
4 — текущая NP —
действие?
6 — истинно
7 — текущее слово —
это конец NP?
7 — текущее слово —
это конец NP?
3 — текущая NP —
предмет?
4 — текущая NP —
действие?
Вызв
запрос
нет
1
5
2
6
Нет
7
4
Предпринимаемое
действие
нет
Считать "John"
субъектом при глаголе,
который последует.
Если появится "to",
то далее следует 1
реципиент
действия "giving".
Считать Магу
реципиентом действия
"giving".
Сохранить настоящий
список запросов и
заменить его на:
7 — текущее
слово — это конец NP?
Нет 1
Построить NP "a
beating" и снова дать
список запросов.
Считать действие,
выраженное
данной NP, главным
действием
предложения, субъект
(John) — деятелем,
а реципиент
(Магу), — объектом.
346
к тому, что анализатор как бы считает, что он имеет дело с
предложением типа John gave Mary a dollar. 'Джон дал
Мери доллар.', и потому на шаге 2 он ожидает появления
предлога to. Так продолжается до шага 7, когда
выясняется, что "дается" не предмет (запрос 3), как было бы в
случае типа John gave Mary a dollar, а действие (запрос 4).
То, что существительное beating относится к классу
действий, приводит к полной перестройке семантического
представления, в основу которого теперь кладется
элементарное действие PROPEL (для beat), а не PTRANS (для
give).
Та же процедура применяется к более сложным
предложениям, например к таким, которые содержат
предложенью группы. Анализ предложения, содержащего
предложную группу, рассмотрим на примере John prevented Mary
from leaving by locking her. 'Джон помешал Мери уйти,
заперев ее'.
Анализ включает три стадии:
(i) Prevent генерирует запросы (ожидания),
касающиеся предлогов FROM или BY1. Эти объекты
назовем "предложными формами11. Под BY1 имеется
в виду одно из значений предлога by. Если
использовать глубинно-падежные наименования, то
смысл BY1 можно задать как "способ действия",
в противоположность другим значениям
предлога by.
(ii) Сам предлог FROM ассоциируется с очень
сложными запросами; приведем пример для FROM0:
(Т (IMBED <= ((MOD QUOTE ((CANNOT)))
(TIME CHOICE <= TIME)
(SUBJ CHOICE OBJE))
((OR (EQ WORD (QUOTE BY))
(BREAK POINT))
(RESET ALL) NIL))
NIL
Очевидно, что это сложный запрос, и у нас нет особой
необходимости вдаваться в детали приведенной записи для
того, чтобы объяснить его роль, которая сводится к тому, чтр
здесь осуществляется связь двух концептуализации: одной
347
для prevent, а второй для leave. Роль этого запроса
аналогична роли надшаблонов Уилкса, о которой говорилось
выше. Мы выписали этот запрос для того, чтобы было ясно
видно, что он нацелен на поиск среди последующих слов
предлога by (см. четвертую строку запроса).
(iii) Запросы для BY 1 имеют еще более сложную форму,
но их суть, согласно Ризбеку, сводится к поиску
типа элементарного действия, которое
соответствовало бы семантическому представлению
встретившейся предложной группы, что в конце концов
и достигается в рассматриваемом нами примере.
Здесь сразу возникает вопрос о том, что такое
предложная форма типа FROM0? Соответствует ли она
глубинному падежу? Во-первых, Ризбек утверждает, что она
"специфична для слова prevent", из чего следует, что она
не может быть глубинным падежом в каком-либо общем
смысле и что она связана с некоторой классификацией
поверхностных предлогов. Во-вторых, не вполне ясно, что
же произойдет, если ожидание окажется невыполненным,
поскольку в приводимых Ризбеком примерах они всегда
выполняются. Поэтому остается непонятным, когда
вводятся в игру другие значения from (FROMN), если FROM0
оказывается неприменимым.
Последнее соображение является частью более общего
вопроса о том, предлагает ли Ризбек какие-либо средства,
соответствующие порядку предпочтительности
надшаблонов в системе Уилкса. По мнению Уилкса (хотя оно, быть
может, и недостаточно аргументировано), правила анализа
глубинно-падежных отношений должны быть упорядочены,
а Ризбек специально отмечает, что его запросы не
упорядочены. В то же время процедуры, описываемые Ризбеком,
можно воспринимать и как упорядоченные; так, prevent
вызывает не любое FROMN, a FROM0 и затем,
по-видимому, FROM 1 и т. д., что можно считать прямой аналогией
порядка применения надшаблонов. Однако это может
показаться несовместимым с утверждением Ризбека о
неупорядоченности запросов. Возможно, Ризбек
бессознательно исходит из неверного предположения, согласно
которому люди говорят именно то, что от них ожидают, а
тогда принцип предпочтительности при упорядочении
структур становится ненужным (это можно назвать
феноменологическим заблуждением). Но все дело, увы, в том, что в
348
действительности люди часто говорят совсем иначе, и
приходится проявлять внимание к тому, что они говорят.
Кроме того, пример обработки предложных групп
показывает, что система Ризбека весьма поверхностна в прямом
смысле этого слова: анализ ведется в терминах таких
категорий, как "глаголы" и зависящие от них "предлоги" (если
считать предлогом FROM(J)), хотя теоретически более
правильным было бы говорить о базисных действиях и
зависящих от них глубинных падежах. При таком поверхностном
подходе, естественно, трудно перейти к существенным
семантическим обобщениям. Это особенно странно для
системы анализа, которая базируется на теории Шенка,
так как Шенк считает использование разного рода
поверхностных представлений неприемлемым. Поэтому в
названном отношении анализатор Ризбека, возможно, обладает
большей независимостью от теории Шенка, чем это кажется
на первый взгляд.
Другой общий вопрос, связанный с вышеизложенным,
касается стремления Ризбека избежать промежуточных
представлений любого рода — как синтаксических, так и
семантических (например, таких, как шаблоны Уилкса),
и попытаться осуществить прямой переход от слов текста к
конечной концептуализации. Это стремление может, в конце
концов, вылиться в то, что ему придется ассоциировать
со словом такие запросы, которые будут касаться не только
выбора одного из значений слова, но и разных
синтаксических позиций слова. Таблица запросов, как мы видели,
показывает, сколь тесно связаны запросы с синтаксическим
порядком слов. Само по себе это не страшно, однако
очевидно, что такой путь делает очень трудной как
формулировку семантических обобщений, которые и должны
явиться стержнем системы, так и разработку пословных запросов
для фраз значительной длины и сложности.
Часть этих трудностей проистекает из-за того, что
во-первых, в качестве механизма анализа используются
неуправляемые ожидания и, во-вторых, анализ Ризбека направлен
в глубину и в то же время не предусматривает возвратов.
Можно предположить, что анализ в глубину — как
синтаксический, так и семантический,— обязательно должен
допускать отказы и возвраты, то есть надо иметь возможность
остановиться, когда полученная на данном шаге
структура оказалась неприменимой, и, вернувшись к тому месту,
где был сделан какой-то выбор, попытаться реализовать
349
альтернативный вариант. Однако именно процедура отказа
и возврата является слабым местом почти всех
современных систем ИИ — Винограда, Уилкса, Ризбека и др. В
сущности, переход к анализу сверху вниз с использованием
фреймовых структур объясняется, в частности, желанием
избавиться от необходимости использования возвратов.
Трудности возникают при попытке совместить этот подход с
анализом исключительно в глубину, как делает Ризбек.
Другими словами, для моделирования внимательного
адресата необходимо разрешить одновременное
использование более чем одного ожидания. В противном случае мы
моделируем адресата, который не слушает того, что ему
говорят, и понимает лишь то, что он ожидал услышать.
А такие люди не способны ни к коммуникации, ни к
пониманию.
Преувеличенное внимание к ожиданию вызывает эффект,
охарактеризованный выше как феноменологическое
заблуждение: люди, понимая естественный язык, никогда не
задумываются об альтернативных вариантах, например,
их не волнует, что вне данного контекста многие слова
могут иметь другие смыслы и т. п.; поэтому семантический
анализатор тоже не должен рассматривать такие
альтернативы и, располагая правильными понятийными
(семантическими преференциальными) структурами фреймового
типа, может непосредственно переходить на глубинном уровне
к правильной интерпретации текста, не заботясь об
остальных вариантах.
Первая часть этого утверждения верна, но вторая —
абсолютно ошибочна, и, возможно, стоит подробно
объяснить, почему.
Ошибка заключена в предположении, что правильное
семантическое представление полностью удовлетворяет
исходному тексту, а неправильное — полностью не
удовлетворяет ему. (Следовательно, первый из путей, по
которому удастся пройти, и будет правильным.) Однако
реальное положение дел при семантическом описании всегда
таково, что одно представление может удовлетворять тексту в
большей степени, чем другие, но для того чтобы выявить
это представление, надо сравнить его с другими.
Рассмотрим одно предложение, которое детально
обсуждает Ризбек:
John gave Mary the book.
'Джон дал Мери книгу.*
350
При анализе этого предложения действие give генерирует
запросы, один из которых состоит в следующем: «если
непосредственно за глаголом следует существительное с
признаком 'человек', считать его реципиентом действия, в
остальных случаях считать его объектом действия». В этом
требовании нет никаких указаний на возможность возврата к
альтернативному варианту (в случае неожиданной осечки),
и это считается нормальным в рассматриваемой концепции.
Но при таком подходе окажутся неправильно
проанализированными предложения типа:
John gave Mary to the Imam of Oudh.
'Джон отдал Мери имаму Оуда.'
John gave his city his stamp collection.
'Джон подарил своему городу коллекцию марок.'
Эти предложения вполне нормальны и естественны; они
показывают, что простые, ничем не связанные ожидания
недостаточны, если только: (i) нет уверенности, что критерий
выбора правилен, или (и) отсутствует анализ в ширину,
учитывающий альтернативные варианты, или (iii) не
разрешен комплексный возврат.
АНАЛИЗ И "БОЛЬШИЕ ФРАГМЕНТЫ ЗНАНИЙ"
В своей второй статье в настоящем сборнике Чарняк
привел фрейм "покупка в магазине" в качестве примера
представления "большого фрагмента знаний о мире", по
крайней мере большего, чем те, которые имеются в
системах, рассмотренных в настоящей статье, хотя все эти
системы базируются на фреймовом подходе. Таким образом,
мы имеем два типа фреймов: "малые" и "большие
(крупномасштабные)". Шаблоны Уилкса и концептуализации
Шенка относятся к малым фреймам, тогда как упомянутые
структуры Чарняка можно отнести к большим фреймам.
Недавно и Шенк перешел к большим фреймам, которые
он, вслед за Абельсоном (Abelson, 1973), называет
сценариями (scripts). Сначала мы кратко опишем эти
структуры, а потом рассмотрим вопрос о возможных
способах их использования в процедуре анализа.
Переход Шенка от малых фреймов к большим начался
с того, что он, совместно с Ригером, исследовал новый
класс причинных умозаключений, которые углубляют имев-
351
шиеся ранее концептуализации. Например, анализ фразы
John's cold improved because 1 gave him an apple. 'Джону
стало не так холодно, потому что я дал ему яблоко.'
(Schank, 1973а) содержит по меньшей мере четыре более
глубоких уровня структур с причинными отношениями,
включая такой, на котором имеется утверждецие, что
Джону пришло в голову (MBUILD), что он хочет съесть
яблоко. Отсюда видно, что экспликация смысла
осуществляется здесь не только на уровне элементарных
семантических единиц, но затрагивает и мыслительную деятельность.
Этот пример выявляет различие между подходами Ригера
и Шенка. Ригер полагает (Rieger, 1974), что правила
вывода умозаключений должны строить отдельные новые
подграфы (см. часть II статьи Чарняка), цепочка которых
ведет к решению некоторой задачи, например к
установлению референтных связей местоимений. Шенк же не
считает нужным применять выводы для решения
лингвистических задач (Schank, 1973а), они используются
просто для построения новых, более сложных
концептуальных графов. Впоследствии Шенк отказался от этой
тенденции к постоянному усложнению схем (для отдельных
предложений) и обратился к представлению текста.
Согласно Шенку, представления частей текста должны быть
связаны между собой причинными связями, при этом для
сохранения наглядности представления текста в целом
концептуальные схемы отдельных фраз текста и их частей
должны быть сокращены, например до троек типа PEOPLE
PTRANS PEOPLE. При таком подходе некоторые
поверхностные черты текста должны сохраниться и в его
представлении, поскольку в противном случае придется принять
неверную позицию, согласно которой порядок фраз текста
абсолютно незначим и произволен. Этот отход от
первоначальной позиции следует приветствовать, поскольку
ранее в русле каузальных умозаключений, вывод ecex
следствий и результатов из каждой концептуализации должен
был производиться внутри самой этой концептуализации.
В предельном случае каждая фраза текста оказалась
бы представленной структурой, включающей чуть ли не
весь текст, частью которого она является. А тогда
представление текста никогда бы не было получено.
В последнее время Шенк разработал сценарий,
описывающий посещение ресторана (Schank, 1975а). Это уже
не цепочка причинных отношений, строящихся в процессе
352
анализа текста, а структура, которая, подобно фреймам
Чарняка (см. часть II статьи Чарняка), задается в системе
заранее, до введения текстов. Сценарий начинается
следующим образом:
Scene 1 entering
'Сцена 1 вход'
PTRANS —go into restaurant
'войти в ресторан'
MBUILD —find table
'найти глазами стол'
PTRANS — go to table
'подойти к столу'
MOVE —sit down
'сесть'
Scene 2 ordering
'Сцена 2 заказ'
ATRANS — receive menu
'получить меню'
ATTEND —look at it
'просмотреть его'
MBUILD —- decide on order
— 'решить, что заказывать'
MTRANS —tell order to waitrees
'сообщить заказ официантке'
Далее, сцена 3 описывает процесс еды, а сцена 4 — выход
из ресторана. Шенк также разработал программу, которая
анализирует рассказы о посещении ресторана длиной в абзац
и синтезирует несколько большие подлине рассказы,
включающие "пропущенную" в исходных текстах информацию,
взятую из сценария, приведенного выше. Например, если на
вход поступает рассказ John went to the restaurant, got angry
and left. 'Джон пришел в ресторан, рассердился и ушел.', то
программа может развернуть его в более длинный текст,
например, такой John went to the restaurant. He found a
table and sat down. He got the menu and ordered the food.
When it came he didn't like it, so he got angry with the
waitress and left. 'Джон пошел в ресторан. Он нашел стол и сел.
Он взял меню и заказал еду. Когда ее принесли, она ему не
понравилась, поэтому он рассердился на официантку и
ушел.
1 2 № 534
353
Как часто бывает в нашей области знаний, остается
неясным, какие задачи призвана решать эта программа и как
следует оценивать полученный выходной текст. Вопрос
может проясниться после рассмотрения следующего
неадаптированного газетного текста.
Mr. Justice Forbes, at Winchester Crown Court yesterday,
criticized authorities who charge people with attempted
murder without "a scrap of evidence".
Philip Slater, aged 25, was charged with carrying an
offensive weapon, attempted murder, and wounding with intent.
After he had pleaded guilty to wounding with intent Mr.
Justice Forbes said: "Why was this charge of attempted
murder put? There was never the slightest chance that any jury
would convict this man on this charge".
4M-p Джастис Форбес в суде Винчестер Краун вчера
критиковал власти, которые обвиняют людей в попытке
убийства без "каких-либо доказательств".
Филип Слейтер, 25 лет, был обвинен в ношении оружия
с целью нападения, попытке убийства и намеренном
нанесении ранения.
После того как он признал себя виновным в намеренном
нанесении ранения, м-р Джастис Форбес сказал: "Почему
было выдвинуто обвинение в попытке убийства?
Невозможно, чтобы какой бы то ни было суд присяжных подтвердил бы
это обвинение".'
Теперь читатель может спросить себя, носил ли
обвиняемый огнестрельное оружие. Если ответ утвердителен, встает
вопрос, на основании чего у читателя сложилось такое
мнение, если в тексте об этом прямо не сказано. Шенк бы
ответил на это, что мы пополняем рассказ, располагая
некоторым "сценарием".
Те же соображения лежат и в основе фреймов Чарняка
(см. вторую статью Чарняка); обе эти системы,
использующие "большие" фреймы, будут рассмотрены ниже.
Сейчас мы перейдем к сопоставлению по десяти
основаниям, касающимся процедуры анализа тех систем, которые
были описаны в статьях Чарняка, Скрэгга и Уилкса.
УРОВЕНЬ ПРЕДСТАВЛЕНИЯ
Важный спорный момент в современных исследованиях
по ИИ касается того, каким должен быть наилучший
уровень представления текста на естественном языке. Первое
354
направление, к которому принадлежит Колби и, с
некоторыми оговорками, Чарняк, считает, что естественный язык
в сущности самодостаточен; второе направление,
представителями которого являются Шенк и Уилкс,
придерживается мнения, согласно которому умозаключения,
касающиеся текстов на естественном языке, можно делать лишь
на некотором редуцированном уровне представления,
использующем элементарные единицы. Чарняк считает, что
его структуры преобразований не зависят от того, на каком
уровне они осуществляются, или, вернее, что их можно
осуществлять на разных уровнях, диктуемых предметной
областью. Однако не вызывает сомнений то, что
представление в предикатной форме, предлагаемое Чарняком,
находится во взаимно-однозначном соответствии со словами
английского языка.
Самой мощной системой в рамках первого направления
является, несомненно, система Колби, который пытается
осуществить непосредственный исключительно громоздкий
переход от уровня английских слов к внутренним
структурам. Однако подчеркнем, что два названных подхода
различаются скорее количественно, чем качественно, поскольку
никто не будет утверждать, что абсолютно любое
выражение, распознаваемое "разумным" анализатором, должно
непременно соотноситься с некоторым "глубинным"
представлением. Так, было бы серьезной теоретической ошибкой
разрабатывать такую систему, которая, получив на вход
Good morning 'Доброе утро', прежде чем выбрать
правильный ответ Good morning, производила бы перевод этого
выражения в некоторое глубинное семантическое
представление.
Однако эти споры всегда касались лишь степени
использования семантического разложения. Так, Шенк,
решительно высказываясь за необходимость использования
семантических элементов, на деле разработал систему
семантических представлений только для глаголов, хотя работа по
созданию семантических представлений для имен в рамках
теории Шенка и ведется без его непосредственного участия
(см. Weber, 1972). Уилкс же, разработав семантические
представления для всех частей речи, вместе с тем сохраняет,
в отличие от Шенка, в своей системе доступ к
поверхностным единицам и сейчас занимается включением новых,
менее элементарных, более поверхностных единиц в свои
семантические формулы (Wilks, 1975).
12*
355
Однако самый серьезный аргумент против
использования поверхностных уровней представления текста
состоит не в. том, что при таком подходе неизбежна громоздкая
процедура перехода от текста к внутренним структурам,
а в том, что теоретическая четкость возможна только в
случае применения семантических элементов. Этот аргумент
тесно связан со сложным вопросом о статусе семантических
элементов, который сейчас широко обсуждается и которого
мы можем коснуться лишь вскользь. К сожалению,
обоснование необходимости упомянутых элементов часто ведется
с неправильных позиций, что только вредит делу.
Например, некоторые сторонники семантических элементов
объявляют их объективно существующими, из чего заключают,
что эмпирическими методами можно выявить их
правильный и единственный набор. При такой точке зрения
теряется языковая сущность структур семантических элементов *,
поскольку основное свойство языка состоит в том, что
можно, меняя одни слова на другие, передать один и тот же
смысл, Если бы существовал правильный единый список
элементарных единиц (хранящихся в мозгу), то указанное
свойство не было бы присуще языку. В действительности
многочисленные психологические исследования . показы^
вают, что при пересказе и повторении люди не способны
воссоздать ни точные слова, ни синтаксические
конструкции. Из многочисленных работ на эту тему назовем две:
Wettler, 1973, и Johnson - Laird, 1974.
Хотя эти психологические данные и не доказывают
существования семантических элементов, но, несомненно,
свидетельствуют в пользу вероятности этого. Другим
подтверждением их существования могут служить результаты
кодирования третьего издания словаря Вебстера,
проведенного Корпорацией разработки систем (Systems Development
Corporation). Оказалось, что список самых частых слов в
толкованиях этого огромного словаря (не считая артиклей а
и the) почти полностью совпадает с набором семантических
элементов, используемых авторами названных выше
семантических систем, при том, что этот набор создавался
априорно.
* Здесь, как и в других своих работах, Й. Уилкс не проводит
четкого различия между языком-объектом и метаязыком для описания
смыслов.— Прим. перев,
356
Вопрос об уровне семантических представлений следует
четко отделить от связанного с ним вопроса о центральных
знаниях, необходимых для автоматического понимания
текста.
ЦЕНТРАЛЬНЫЕ ЗНАНИЯ
Этот вопрос касается не того, как представлять знания,
а того, насколько неспецифическими должны быть эти
знания; здесь опять можно провести границу между подходом
Чарняка, с одной стороны, и Шенка и Уилкса — с другой.
Судя по примерам Чарняка, таким, как посещение дня
рождения, он считает, что фундаментальная форма
информации весьма существенно зависит от самой конкретной
ситуации, в то время как Шенк (до своего перехода к
сценариям) и Уилкс ввели в свои системы в качестве
центральных частичные утверждения о человеческих желаниях,
ожиданиях и т. п., причем эта информация во многом носит
настолько общий характер, что она становится почти
бессодержательной, и — может добавить наш критик —
именно поэтому роль такой информации в системах понимания
естественного языка столь долго игнорировалась.
Если человек бегло говорит, например, по-немецки, он
все же может не понять разговора, ведущегося на
немецком языке, о подарках на день рождения, если он не
располагает подробной фактической информацией о том, как
принято в Германии приветствовать виновника торжества
(а здесь могут быть весьма существенные отличия от
обычаев, принятых в Америке). И, наоборот, человек может
понять специальную статью о предмете, в котором он
хорошо разбирается, даже если он очень плохо знает язык,
на котором написана статья.
В конце концов, это различие может тоже оказаться
лишь количественным, а не качественным и свестись только
к тому, как удобнее описывать ту или иную предметную
область, хотя не исключено, что за этими частными
описаниями останутся незамеченными важные общие
закономерности. Нельзя считать бессмысленным вопрос о том, в
какой степени исследования естественного языка, ведущиеся
в рамках ИИ, действительно относятся к естественному
языку. Но даже если эти исследования и не являются
собственно лингвистическими, они все же имеют определенную
ценность. Ньюэлл (Moore, Newell, 1973) относит их к
357
теоретической психологии, и, если согласиться с этим, связь
их с лингвистикой окажется еще более слабой. Мы вскользь
коснулись этого вопроса, когда при описании системы
Винограда размышляли о том, можно ли считать
толкование слова pick up 'поднять' относящимся к употреблению
названного глагола в естественном языке, или это описание
действий, предпринимаемых системой в случаях, когда
она должна поднять нечто.
Попробуем еще более обобщить рассматриваемую
проблему и с этой целью сформулировать кажущийся
абсурдным вопрос о том, почему работы Чарняка нельзя отнести
к теме "Социоэкономическое поведение американских детей
в состоянии стресса". По отношению к работе Чарняка такой
вопрос носит шутливый характер и сформулирован он
просто в целях наглядности объяснения. Однако сейчас в ИИ
возникает множество систем, в которых язык оказывается
не предметом исследования, а отправным пунктом для
манипулирования информацией в той или иной предметной
области, например в рамках системы предсказания вида
химического спектра или игры в веревку (snakes and ladders),
и т. д., и для этих систем подобный вопрос становится вполне
серьезным. Настало время понять, ожидаем ли мы решения
проблемы понимания естественного языка от систем, для
которых лингвистический компонент является
центральным, или от систем, для которых язык служит лишь
отправным пунктом. Несомненно, справедливо, что любая
информация может помочь пониманию текста, с этой
информацией связанного. Вопрос состоит в том, следует ли отсюда,
что, изучая спецификацию, организацию и
формулирование такого знания, мы исследуем естественный язык,
поскольку тогда к сфере лингвистики нам придется отнести
все человеческие знания — от физики до истории и
медицины, хотя, конечно, такой подход вызвал бы поддержку
у некоторых направлений современной философии.
Мы не собираемся заниматься существенным для
философии разграничением языкового и внеязыкового, мы
просто с практических позиций пытаемся провести границу
между специфическими знаниями и центральными
знаниями, причем при отсутствии последних нельзя считать, что
система понимает естественный язык. Так, человек может
ничего не знать о том, как отмечаются дни рождения в
США, но его нельзя обвинить в незнании английского
языка, если он не понял какой-то конкретный рассказ на
358
эту тему. В то же время, если какой-то человек не
располагает общей информацией о частичных умозаключениях,
связанных, например, с ситуациями, когда люди могут быть
ранены и падают или когда люди стремятся получить то,
чего им недостает, то окружающие могут отнести
непонимание данным человеком совсем простых фраз за счет его
незнания английского языка. Здесь встает интересный и
сложный вопрос о том, что было бы, если бы сторонники
двух противоположных подходов попытались создать
единую, более широкую систему с общим аппаратом
умозаключений; другими словами, является ли естественный
язык таким целым, описание которого можно построить по
частям?
В то же время следует иметь в виду, что подчас решение
чисто лингвистических проблем опирается на такие знания
о мире, которые даже еще более специфичны, чем знания,
используемые в современных системах ИИ, как видно
из следующей пары предложений:
The deer came out of the wood.
'Олень вышел из леса.'
The grub came out of the wood.
'Личинка вывелась в древесине.',
где любой читатель успешно выделит два разных значения
слова wood 'лес/древесина' просто на основании различий
агентов. Однако никем еще не предложено общей методики
разрешения неоднозначности в подобных элементарных
случаях.
ФЕНОМЕНОЛОГИЧЕСКИЙ УРОВЕНЬ
Еще одним понятием, которое не следует смешивать с
противопоставлением центральных и специфических
знаний, является понятие "феноменологического уровня"
вывода умозаключений в системе понимания языка [уровня
детальных представлений о реальных явлениях]. Мы не
оговорились; рассмотрим процесс приема пищи в
анатомическом аспекте: он обычно включает поднесение локтевой и
лучевой костей руки к нижней челюсти или подбородку.
Однако очевидно, что внесение этой информации в систему
ИИ для вывода умозаключений было бы неправильным.
Можно сказать, что неправомерен сам феноменологический
уровень в системе ИИ, даже если все умозаключения, про-
359
изводимые на этом уровне, и правильны. Равным образом
неправомерна система ИИ, строящая умозаключения о
каких-то предметах и пользующаяся при этом
информацией об их квантовой структуре.
Анализ процесса еды, предложенный Шенком, включает
информацию о том, что он производится с помощью
движений руки по направлению ко рту, но, возможно, и эта
информация является излишней и уводит слишком далеко от
языкового смысла глагола eat (каким бы он ни был) в
сторону знаний о действиях, и в связи с этим система, всегда
сопоставляющая глаголу eat подобные сведения, может
стать неуправляемой, генерируя разные ненужные
побочные выводы.
Несомненно, информация такого рода при каких-то
обстоятельствах небесполезна; ее можно рассматривать как
способ заполнения значений (default value) переменных (в
терминологии М. Минского), а именно конкретизировать
незаполненное значение инструмента еды как "рука,
подносящая еду ко рту" в случаях, когда в тексте нет указаний
на противоположное. Тем не менее, как мы пытались
показать, имеется очевидная опасность перенесения
умозаключений на феноменологический уровень в масштабах,
выходящих за пределы здравого смысла. Убедительным
примером этого служит предлагаемый Шенком (Schank,
1973а) анализ умственной деятельности, при котором
всякому действию, например удару по мячу, предшествует
ментальное действие обдумывания того, следует ли
производить этот удар. Очевидно, что такой уровень анализа
выходит за рамки здравого смысла, и подобные ненужные
расширения скажутся отрицательно на работе системы,
задача которой состоит в моделировании здравого смысла
и понимания естественного языка.
ПРОБЛЕМА НЕЗАВИСИМОСТИ АНАЛИЗА
Еще одним важным спорным моментом является вопрос
об отделении анализа, состоящий в том, следует ли считать
собственно анализатор текста или диалога отдельной частью
системы понимания. Чарняк и Минский полагают, что эту
начальную процедуру анализа можно легко отделить от
содержательно интересных процедур вывода
умозаключений, считая представление текста, пригодное для работы
аппарата вывода, просто изначально заданным. На это
360
можно возразить, что многие умозаключения должны быть
сделаны именно в процессе анализа текста для получения его
представления. Например, нельзя приписать правильной
семантической структуры предложению Не shot her with а
colt. 'Он застрелил ее из кольта / жеребенка.', не произведя
умозаключения о том, что инструментом действия
"стрелять" является обычно ружье, а не жеребенок; то есть
нельзя перейти от этого предложения к его структуре, не
принимая во внимание системную неоднозначность, свойственную
естественному языку. Сущность отделения анализа состоит
в том, что содержание и устройство семантического
представления рассматриваются независимо от того, для чего
они будут применяться. Результат такого отделения может
оказаться очень похожим на положение в логике, где
некоторая структура просто объявляется "правильной" для
некоторого предложения.
Отметим также, что типы умозаключений, необходимые
для разрешения лексической и
местоименно-референционной неоднозначности, сильно пересекаются: очень часто обе
задачи требуют разрешения в рамках одного короткого
предложения и тесно связаны друг с другом. В системе Чарняка
искусственное отделение анализа приводит к тому, что эти
два тесно связанных языковых явления оказываются
оторванными друг от друга. Его система производит разные
умозаключения для установления антецедентов
местоимений, а лексическая неоднозначность, по его замыслу, будет
в дальнейшем разрешаться некоторым другим аппаратом,
никак не связанным с функционирующим сейчас. (На это
Чарняк, по-видимому, возразил бы, что его систему и сейчас
можно дополнить средствами разрешения лексической
неоднозначности.)
Другим способом показать различие систем,
разработчики которых принимают или отвергают тезис об
отделении анализа, может служить рассмотрение вопроса о том,
какое место в них уделяется синтаксису. Как мы видели, в
системе Винограда синтаксический анализ играет
центральную роль, в то же время оба подхода, связанные с
применением фреймов (Чарняка и Шенка — Уилкса), вовсе не
касаются вопросов синтаксического анализа хотя и по
разным причинам. Чарняк не занимается синтаксисом,
относя его к тому "преданализу", который выходит за рамки
его системы. Шенк и Уилкс считают, что фундаментальным
является семантический анализ и при достаточно мощном
361
семантическом аппарате результаты, ожидаемые от
синтаксического анализа, будут получены автоматически. Это
предположение подтверждается успешной практической работой
двух анализаторов, созданных на базе семантических
теорий Шенка и Уилкса.
Мы придерживаемся убеждения (противоположного
убеждению Скрэгга и Чарняка), согласно которому анализатор
входного текста должен быть неотъемлемой частью системы
понимания и потому его нельзя отделять от других частей
такой системы. Это касается не только систем
"представления знаний", но и систем с так называемой "семантической
памятью". Справедливость нашего подхода подтверждает
не только то, что анализ обеспечивает проверку
предлагаемых представлений (это не главное), но и то, что именно
анализ показывает, каково значение этих представлений.
Читатель, вероятно, заметил, что структуры знаний и
памяти, рассмотренные в настоящей статье, очень
напоминают несколько видоизмененные высказывания на
английском языке. Шенк и Уилкс в разных выражениях
признают, что их семантические представления — это как
бы стенографическая запись других структур, описанных в
терминах семантических элементов, однако и эти структуры
можно считать еще более причудливым вариантом
видоизменения того же английского языка. Как мы стремимся
показать в настоящей статье, только анализ, то есть процедура
перехода от текста к его структурам, придает этим
структурам определенное значение, в связи с чем они и перестают
быть простыми видоизменениями высказываний на
английском языке.
ПРИМЕНЕНИЕ СТРУКТУР В ПРОЦЕССЕ АНАЛИЗА
Этот пункт является обобщением двух предшествующих;
он касается вопроса о том, можно ли на основе вида
структур, используемых в системе, получить представление
о тех процедурах, с помощью которых эти структуры
применяются в процессе анализа входного текста.
Рассматриваемый вопрос следует отличать от вопросов машинной
реализации системы. Например, образцы в системе Колби дают
ясное представление о способе их использования при
анализе входного текста, и в то же время машинные
алгоритмы сравнения фрагментов входного текста с образцами
могут быть различными. То же самое можно сказать и о шаб-
362
лонах в системе Уилкса, хотя к тому времени, когда
входной сегмент преобразуется в форму канонического шаблона,
он сильно отличается от своего исходного вида.
Наибольшей наглядностью в плане их применения при анализе
обладают структуры, используемые в системе Винограда;
сами обозначения этих структур помогают понять те
процедуры, с помощью которых они применяются.
Противоположны в этом отношении структуры, используемые
Чарняком и Шенком, которые никак не связаны с процедурой
их использования, то есть их применение может
осуществляться не только с помощью разных машинных
алгоритмов, что не имеет значения, но и с помощью разных наборов
лингвистических правил. А ведь создание этих правил
является важной частью разработки системы, и их вид может
существенно повлиять на первоначальный замысел
исследователя.
Таким образом, отделение анализа и связь структур
с процедурой анализа — вещи различные. В системе
Шенка MARGIE анализ, созданный Ризбеком, представлен;
однако получаемые в результате анализа структуры, как
мы видели при рассмотрении работ Ризбека, наглядностью
не обладают, то есть не отражают характера их применения
к тексту.
В своих последних публикациях Виноград выдвинул
гораздо более сильное требование, чем то, которое
поддерживаем мы: по его мнению, сама структура управления
программой понимания должна представлять теоретический
интерес, поскольку только в этом случае достаточно
длинная и сложная программа анализа языка сохранит ясность
и понятность.
ПРОСПЕКТИВНЫЙ вывод
Еще один спорный вопрос касается того, следует ли
делать все возможные умозаключения в процессе понимания
текста, выдвигая разного рода ожидания (точка зрения Чар-
няка, Шенка, Ригера), или следует пользоваться
принципом минимальной затраты сил и производить глубокие
умозаключения только тогда, когда это требуется для самого
понимания, например при неоднозначности текста,
неразрешимой более простыми средствами (точка зрения Уилкса).
Используя термины программирования, вопрос можно
переформулировать так: какой вывод предпочтительнее —
управляемый целями или управляемый данными?
363
Хотя Шенк иногда и пишет, что система должна
осуществлять «все возможные» умозаключения в процессе
обработки текста, суть спора сводится не к этому, поскольку
никто не возьмется защищать какое-либо строгое
определение понятия «все возможные умозаключения».
Аргументация Чарняка сводится к следующему. Если не делать
проспективных умозаключений при пофразном анализе
рассказа — проспективные умозаключения (= вывод,
управляемый данными) противопоставляются ретроспективным
(= вывод, управляемый целями), которые делаются только
при возникновении определенного рода сложностей,— то
в общем случае система может оказаться неспособной
разрешать лексическую или референционную неоднозначность,
возникающую в дальнейшем изложении, так как она не
сможет определить то место в предшествующем тексте, где
надо было сделать то или иное умозаключение. Таковы,
в самых общих чертах, возражения Чарняка против
применения в системах понимания естественного языка лишь
вывода, управляемого целями (см. вторую статью Чарняка).
Один из уязвимых пунктов этой аргументации касается
того, всегда ли действительно существует такой фрагмент
текста, который бесспорно позволяет разрешить все
языковые сложности. Неясно также, о чем, в сущности, идет речь—
о том, как люди понимают тексты, или о том, как надо
строить модель понимания текстов. Например, можно
согласиться с мнением Чарняка и все же построить систему
лишь с выводом, управляемым целями, на том основании,
что в настоящее время это единственный способ управлять
огромным количеством выводов, возможных в процессе
понимания, поскольку любая система, производящая выводы
без ориентации на конкретные сложности, которые
возникают при понимании текста, практически оказывается
неуправляемой. Например, Ригер (Rieger, 1974)
вынужден был достаточно произвольно сократить число
проспективных умозаключений, что нельзя счесть удачным
способом решения проблемы. Следует отметить, что в последних
публикациях как Шенка, так и Чарняка ориентация на
проспективные умозаключения прослеживается в меньшей
степени, чем раньше. В то же время системы, работающие с
ретроспективными умозаключениями, способны
осуществлять и проспективные умозаключения, например
экстракции в системе Уилкса можно без труда трансформировать в
проспективные умозаключения.
364
Быть может, сущность этого спора касается только
степени использования определенного типа вывода и сводится
к тому, как определить долю проспективных
умозаключений, достаточных для разрешения сложностей, встающих
при анализе последующей части текста, и отделить их от
неиспользуемых умозаключений. Не исключено, что в этом
вопросе исследователям в области ИИ могут существенно
помочь психологи.
ПОДРАЗДЕЛЕНИЕ НА МОДУЛИ
Проблема модулей связана с подразделением системы
(или программы) на отдельные (взаимодействующие)
компоненты и с природой отношений между ними. Как мы
видели, система Винограда состоит из синтаксического,
семантического и дедуктивного компонентов, которые
связаны, по выражению Винограда, "гетерархично" (в
противоположность иерархической связи), то есть разные
компоненты могут работать в разное время.
В противоположность подходу Винограда, Шенк и Уилкс
не считают необходимым подразделение на синтаксический
vs. семантический или семантический vs. дедуктивный
компоненты в системе понимания, да и в принципе
отказываются от противопоставления синтаксиса и семантики. По их
мнению, нельзя считать особым достижением создание
программ, объединяющих синтаксический и семантический
анализ, поскольку не было нужды их разделять.
Чарняк полагает, что следует проводить границу между
синтаксическим и семантическим компонентами там, где
это возможно. Это связано с его убеждением о
необходимости отделения анализа: оформлять такое отделение в виде
особого модуля, например синтаксического. Однако
отделение анализа и принцип модульности — это далеко не одно
и то же. Например, система Винограда подразделена на
модули, но анализ входного текста в ней не отделен от
аппарата вывода умозаключений.
МАСШТАБ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
Дискуссия по поводу масштаба представления знаний
связана с применением структур в процессе анализа и
с независимостью анализа; суть ее сводится к выяснению
365
практических функций крупномасштабных представлений
знаний в форме фреймов. В этой статье неоднократно
указывалось, что цель крупных структур фреймового типа
состоит в том, чтобы способствовать решению конкретных
лингвистических задач, таких, как разрешение
лексической или местоименно-референционной неоднозначности; в
противном случае эти структуры имеют мало общего с
автоматическим пониманием естественного языка. Другими
словами, представление знаний как таковое,
безотносительно к решению определенной задачи, не должно входить в
сферу интересов ИИ.
При такой постановке вопроса обратимся снова к
"большим порциям" знаний, описываемых такими структурами,
как фреймы Чарняка, которые были разработаны как
целостные образования (см. часть II статьи Чарняка), или
сценарии Шенка, которые были созданы путем соединения
элементарных действий. В сущности, подобные структуры
можно построить на основе самых разнообразных
разрозненных фактов, отражаемых на формальном уровне в виде
отдельных утверждений. Так, Уилкс мог бы "соединить"
предлагаемые им правила вывода таким образом, чтобы они
имели не форму отдельных утверждений вида "Р
ИМПЛИЦИРУЕТ Q", но обобщенную форму:
Р
ИМПЛИЦИРУЕТ Q
ИМПЛИЦИРУЕТ R
ИМПЛИЦИРУЕТ S,
где на месте каждой буквы стоит сложный объект
(например, шаблон) или одна из двух частей [посылка или
следствие] правил "здравого смысла".
Однако целесообразность применения таких структур
можно поставить под сомнение, если обратиться к текстам,
которые описывают деятельность, выходящую за рамки
повседневности.
Предположим, что мы рассматриваем предложения,
касающиеся обрядов посвящения в мужчины в далеком
племени. Комбинируя способы описания Чарняка (см. часть II
статьи Чарняка) и Шенка, мы получим такой фрейм:
Сценарий: обряд посвящения в мужчины.
Роли: мальчик, старейшина, помощники, толпа.
366
Мотив: нанесение ритуальных насечек на спину
мальчика.
(11) а) Цель: татуировать МАЛЬЧИКА
b) ПОМОЩНИКИ держат МАЛЬЧИКА (двумя
руками)
c) СТАРЕЙШИНА берет ИНСТРУМЕНТЫ
d) СТАРЕЙШИНА обращается к толпе (с призывом
должным образом себя вести)
e) (общее условие)
§ плохое поведение ТОЛПЫ -► действие
приостанавливается
f) СТАРЕЙШИНА проверяет, достаточно ли чист
МАЛЬЧИК (специальное условие)
g) МАЛЬЧИК не чист —> действие
приостанавливается
h) СТАРЕЙШИНА делает НАСЕЧКУ на спине
МАЛЬЧИКА
i) I используемый метод
I > применяется для каждой НАСЕЧКИ.
Общая идея описания вполне понятна без дальнейших
пояснений, а далекую или воображаемую культуру мы
выбрали намеренно.
Предположим теперь, что мы имеем следующий рассказ:
(12) Little Kimathi's mother accidentally touched his
arm during the puberty rite. The crowd drew back
in horror. 'Мать маленького Киматхи случайно
дотронулась до его руки во время обряда
посвящения в мужчины. Толпа отпрянула в ужасе'.
Если мы хотим понять текст (12), то действительно ли
нам нужен фрейм обряда посвящения в мужчины,
приведенный выше? Фрейм (11) "покрывает" текст (12) с помощью
строки (е), если имеется еще и список способов плохого
поведения (который можно вообразить, что и
символизирует значок "§"). Однако ясно, что мы прекрасно понимаем
(12) и без всякого фрейма.
Попросту говоря, мы выводим из (12) следующее: то, что
мать во время церемонии дотронулась до Киматхи —
плохо, и для понимания этого соответствующая констатация
в приведенном фрейме (11) нам не нужна. Марсианин,
367
знающий смысл английских слов и имеющий минимальное
представление о реакциях человека на дурные поступки,
понял бы то же самое. Этим и объясняется то, что мы
выбрали ситуацию обряда посвящения в мужчины, в котором
мы разбираемся примерно так же, как марсианин, а не
известную ситуацию покупки в магазине. Если мы понимаем
(12), то не с помощью фрейма (11), поскольку, согласно
допущению, у нас его нет.
Мы утверждаем здесь не то, что "крупномасштабные"
фреймы не нужны вовсе, но только то, что с точки зрения
конкретных проблем понимания естественного языка их
роль еще не определена.
Одним из возможных способов уточнения роли фреймов
может быть такой (и к этому уточнению близок Шенк в
работе (Schank, 1975 а)): для того чтобы понять рассказ,
нам нужны сведения о стандартном ходе событий в
базисном рассказе (фрейме) данного типа; иначе говоря, мы можем
понять конкретный рассказ только путем определения
того, насколько он отклоняется (или не отклоняется) от
стандартного рассказа данного типа. Эту гипотезу можно
назвать "гипотезой стандартного сюжета"; однако пока
неясно, как она соотносится с данными психологии.
ПРОЦЕДУРЫ, КАСАЮЩИЕСЯ МИРА ДЕЙСТВИТЕЛЬНОСТИ
В то время, к которому относится система Винограда и
возникновение языка PLANNER (см. часть I статьи Чар-
няка), велась оживленная дискуссия о правомерности
лозунга "значения суть процедуры". Она касалась того,
каковы оптимальные формы "интеллектуальных" программ, а
названный лозунг объединял сторонников фиксации
смысла в форме процедур (в духе Винограда).
Эта дискуссия отошла в прошлое, но в современных
работах, касающихся лингвистических систем ИИ, можно
усмотреть ее аналог, который связан уже не с внутренними
машинными процедурами, а с отношением процесса
понимания к реальной деятельности во внешнем мире. Как уже
заметил читатель, многие описанные в статьях данного
сборника системы — Винограда, Чарняка, Скрэгга, Ригера
(Rieger, 1975) — связаны с реальной деятельностью
(поднятие предметов, приготовление пищи и т. п.) или, говоря
более точно, с имитацией этой физической деятельности. Что
363
это — простое совпадение или отражение действительно
существующей связи между деятельностью и пониманием?
В основе многих современных работ лежит (не
выраженная явно) гипотеза, которую можно назвать "проверка
делом"; суть ее в том, что при представлении знаний надо
выбирать знания о действиях, которые мы умеем
выполнять — будь то строительство пирамид из кубиков, еда в
ресторане, покупка в магазине, приготовление пищи или,
как в системе Ригера (Rieger, 1975), сливание воды в
унитазе.
Связь с естественным языком состоит в предположении,
что нельзя понять тексты, описывающие человеческую
деятельность, не выполняя или не умея выполнять эту
деятельность. (В сущности, оно относится к утверждениям
типа того, что дети начальных классов не поймут
рассуждений о любви в пьесах Шекспира, которые они проходят,
поскольку сами они еще этого чувства не испытали.)
Конечно, в этом предположении есть рациональное
зерно, но на деле оказывается совсем не просто установить,
что же именно не понимает человек, не совершавший
самостоятельно тех или иных описываемых действий, если он
тем не менее способен отвечать на соответствующие вопросы
так, как если бы он все понимал. Так, человек может
ответить на множество вопросов о катании на лыжах и, как
будет казаться, понять газетную заметку на эту тему,
даже если сам он не стоит на лыжах.
Более сильный аргумент в защиту релевантности
фреймовых описаний реальной деятельности для понимания
естественного языка — это указание на возможность
обучения этой деятельности. Положительным моментом при
этом является то, что такой взгляд позволяет избавиться от
необходимости безусловного принятия "гипотезы
стандартного сюжета" (что, по-видимому, делает Шенк); однако тут
же возникают и возражения, поскольку деятельности
рассматриваемого рода (еда в ресторане, покупка в
магазине), скорее всего, вообще не обучаются, или, по крайней
мере, обучаются не так, как учатся пользоваться ножницами
или завязывать шнурки на ботинках.
Таковы основные моменты дискуссии между
сторонниками (Чарняк, Шенк) и противниками (Уилкс)
использования "крупномасштабных" фреймов.
369
ЗАДАЧИ СИСТЕМ
В заключение кратко остановимся на основных задачах,
которые (обычно в неявном виде) ставились при разработке
систем, описанных выше. Этих задач, по-видимому, четыре.
(i) Создание сильного аппарата вывода умозаключений.
Эта задача была основной для ранних систем,
базирующихся на языке исчисления предикатов; она согласуется с
выдвинутым Хейесом (Hayes, 1974) требованием
применять такой семантический аппарат, который позволяет
машине стать, как он говорит, "интеллектуально
респектабельной". Та же задача ставится и перед многими
системами, использующими языки типа PLANNER.
(ii) Накопление и формализация знаний о предметных
областях, стоящих за входными текстами (при этом
формализмы часто строятся на основе естественного языка).
(Ш) Машинная реализация, создание действующей
системы для решения таких задач, которые наглядно
демонстрируют "автоматическое понимание".
(iv) Моделирование языковой и/или психической
деятельности человека.
Значительно упрощая реальное положение дел, можно
сказать, что задачи системы Чарняка — (ii) и отчасти (i) и
(iv), Винограда — (iii), а также, в некоторой степени,
три остальные, Колби (в аспекте языковой, а не
психической деятельности) — (iii), Шенка и Уилкса — (ii), (iii) и
(iv).
Практика заинтересует только задача (iii), однако нет
единого мнения относительно того, при каком результате
эту задачу можно считать выполненной. Скептик скажет,
что, в конце концов, все эти системы анализируют те
предложения, которые они анализируют, или, при более
строгом изложении, все системы (как упомянутые здесь, так и
прочие) в некотором смысле определяют некий
естественный язык, а именно тот, который задается входными
предложениями, поддающимися анализу в данной системе.
Вопрос только в том, насколько эти многочисленные
ограниченные "естественные языки" близки английскому языку.
ЛИТЕРАТУРА
Abelson, R. P. The Structure of Belief Systems.— In:
"Computer Models of Thought and Language" (ed. by Schank and Colby). San
Francisco, Freeman, 1973.
379
Charniak, E. Toward a Model of Children's Story
Comprehension.— In: "Memoranda from the Artificial Intelligence Laboratory", MIT,
TR266, 1972.
Clark, H. On Bridging.— In: "Position papers for the Workshop
on Theoretical Issues in Natural Language Processing", Massachusetts
Institute of Technology, 1975 (BBN, Cambridge, Mass., 1975).
Colby, K. M. and Parkinson, R.C. Pattern-Matching Rules
for the Recognition of Natural Language Dialogue Expressions.—
"American Journal of Computational Linguistics", No 1, 1974, p. 1—70.
Colby, K. M. and Hilf, F. D. Multidimensional Analysis in
Evaluating a Simulation of Paranoid Thought.— In: "Memoranda from the
Artificial Intelligence Laboratory", Stanford University, California,
Stanford, 1973.
Colby, K. M. et al. Artificial Paranoia.—"Artificial Intelligence",
No 2, 1971, p. 1—25.
Conceptual Informational Processing (Schank R. ed.). Amsterdam, 1975.
Enea, H. and Colby, К- M. Idiolectic Language Analysis for
Understanding Doctor-Patient Dialogues.— In: "Advanced papers for the
Third International Joint Conference in Artificial Intelligence", USA,
Stanford, 1973 (SRI, Menlo Park, 1973).
Goldman, N.M. Computer Generation of Natural Language from
a Deep Conceptual Base.— In: "Memoranda from the Istituto per gli Studi
Semantici e Cognitivi", Switzerland, Castagnola, 2, 1974.
Hayes, P. J. Some Problems and Non-Problems in Representation
Theory.— In: "Proceedings of the Summer Conference of the Society for
Artificial Intelligence and Simulation on Behaviour", University of Sussex,
UK, 1974.
Herskovits, A. The Generation of French from a Semantic
Representation.— In: "Memoranda from the Artificial Intelligence Labo-
ratory",Stanford University, Stanford, California, 212, 1973.
Johnson-Laird, P. Memory for Words.— "Nature", 1974, No.
251, p. 104—105.
Rieger, С Conceptual Memory (Unpublished Ph. D. Thesis,
Stanford University), 1974.
Rieger, С The Common-Sense Algorithm.— In: "Position papers
for the Workshop on Theoretical Issues in Natural Language Processing",
MIT, 1975 (BBN, Cambridge, Mass., 1975).
Riesbeck, CK. Computational Understanding: Analysis
Sentences and Context.— In: "Memoranda from the Istituto per gli Studi
Semantici e Cognitivi", 4, Switzerland, Castagnola, 1974.
Schank, R. Causality and Reasoning.— In: "Memoranda from the
Istituto per gli Studi Semantici e Cognitivi, 1. Switzerland,
Castagnola, 1973a.
Schank, R. Using Knowledge to Understand.— In: "Position
papers for the Workshop on Theoretical Issues in Natural Language
Processing", MIT, 1975 (BBN, Cambridge, Mass., 1975a).
Schank, R., Goldman, N., Rieger, C. and Riesbeck,
R. MARGIE: Memory Analysis, Response, Generation and Inference on
English.— In: "Advanced papers for the Third International Joint
Conference in Artificial Intelligence", USA, Stanford, 1973 (SRI, Menlo Park,
1973).
Turing, A. Computing Machineiy and Intelligence,—"Mind",
1951, p. 1—17.
371
Weber, S. Semantic Categories of Nominals for Conceptual
Dependency Analysis of Natural Language.— In: "Memoranda from the
Artificial Intelligence Laboratory", 172. Stanford University, Stanford,
California, 1972.
Wilks, Y. A. An Artificial Intelligence Approach to Machine
Translation.— In: "Papers in Computer Models of Thought and Language"
(ed. by Schank and Colby), San Francisco, Freeman, 1973.
Wilks, Y. A. Seven Theses on Artificial Intelligence and
Natural Language.— In: "Memoranda from the Istituto per gli Studi Se*
mantici e Cognitive, 17. Switzerland, Castagnola, 1975.
Г. Хендрикс
ВОПРОСЫ ИНЖЕНЕРНОЙ психологии
ПРИ ОРГАНИЗАЦИИ ДИАЛОГА НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
В ПРИКЛАДНЫХ СИСТЕМАХ *
СТЭНФОРДСКИЙ ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ
ЦЕНТР ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Описываются аспекты инженерной психологии, учет которых
должен способствовать более широкому применению практических систем,
использующих естественный язык. Эти аспекты включают коррекцию
орфографических ошибок, обработку неполных (эллиптических)
входных текстов, вопросы о заложенных в системе языковых определениях
(на основе запросов на английском языке) и возможность для любого
пользователя расширить понимаемый системой язык с помощью
синонимов и перифраз. Все перечисленные черты учтены в ориентированной
на прикладные задачи системе LIFER, которая предназначена для
разработки интерфейсов на естественном языке, обеспечивающих общение
между ЭВМ и любым пользователем.
Представлены также методы, используемые в LIFER для решения
более сложных вопросов инженерной психологии, связанных с
общением человека и машины.
I. ВВЕДЕНИЕ
Настоящая статья описывает некоторые аспекты
ориентированной на прикладные задачи системы,
предназначенной для разработки интерфейсов на естественном языке,
обеспечивающих общение между ЭВМ и любым
пользователем. Так же как и в самой описываемой системе, в статье
делается упор на те аспекты инженерной психологии, с
которыми мы сталкиваемся при создании практичных и
удобных интерфейсов. Такая ориентация привела к более
тщательному изучению некоторых обычно не
рассматриваемых аспектов обработки языка, включая обработку
неполных входных текстов, способность возвращаться к анализу
текста после коррекции орфографических ошибок и воз-
* Gary G. Hendrix. Human Engineering for Applied Natural
Language Processing.— In: "Proceedings of the Fifth International
Joint Conference on Artificial Intelligence", Vol. I. Cambridge, Mass.,
1977, с 183—191.
© IJCAI - 1977.
373
можность для пользователей, не знакомых с языком
программирования, применяемым в данной системе, строить
входные запросы и сообщения на английском языке в
реальном масштабе времени, что расширяет понимаемый
системой язык и включает в него индивидуальные
особенности пользователя. Обсуждаются осуществление этих задач
в удобном пакете программ и их интеграция с другими
аспектами инженерной психологии.
а. историческая перспектива
В последнее время растет число примеров,
показывающих, что современное состояние исследований в области
автоматической обработки текстов на естественном языке,
хотя и находится пока на довольно примитивном уровне, все
же позволяет справиться с решением некоторых вполне
реальных проблем. Например, Браун и Бертон (Brown
and Burton, 1975) разработали практическую систему
обучения с помощью ЭВМ, создан ряд языковых систем для
общения с базой данных, в частности системы REL
(Тhompson and Thompson, 1975), LUNAR (Woods et al.,
1972) и PLANES (Waltz, 1975). Февральский номер
Известий SIGART за 1977 г. содержит краткий обзор 52
исследовательских работ, посвященных вопросам разработки
интерфейсов на естественном языке.
Все возрастает также потребность в создании
собственно прикладных систем. Только в одном Центре
искусственного интеллекта в Стэнфордском исследовательском
институте разработаны многочисленные программы,
увеличивающие возможности систем благодаря применению
естественного языка в рамках таких задач, как: поиск в базе
данных, автоматизация в промышленности, автоматическое
программирование, логический вывод, оценочные
рассуждения. Привлекательность всех этих систем как для
разработчиков, так и для пользователей резко возрастает, когда
они могут использовать в качестве входного языка
естественный язык.
в. система lifer
С целью добавить к различным видам программного
обеспечения возможности естественного языка в
Стэнфордском исследовательском институте разработан пакет удоб-
374
ных инструментов, в совокупности названных LIFER,
которые способствуют быстрому конструированию
интерфейсов на естественном языке.
В основе LIFER лежит идея (Hendrix, 1976,
1977) приспособить методы вычислительной лингвистики
к системам, нацеленным на практическое применение,
одновременно расширяя эти методы в плане более полного
удовлетворения потребностей человека. Быть может, эти
потребности не входят в число центральных проблем всей науки
о языке, но они, безусловно, являются главным фактором
в ее приложениях. В последующих разделах данной статьи
представлены некоторые включенные в систему LIFERг
особенности инженерной психологии, ориентированные на
пользователей интерфейсов.
Ряд нелингвистических методов был разработан либо под
влиянием системы INTERLISP (Teitelman, 1975),
либо взят оттуда непосредственно 2. INTERLISP — это
интерактивная система программирования на языке LISP,
которая сама по себе является блестящим примером
продуманного применения принципов инженерной психологии
при разработке программного обеспечения.
П. СРЕДСТВА ИНЖЕНЕРНОЙ ПСИХОЛОГИИ
ДЛЯ ПОЛЬЗОВАТЕЛЕЙ ИНТЕРФЕЙСОВ
Некоторые особенности инженерной психологии
иллюстрируются представленными ниже примерами
взаимодействия пользователя с LIFER.
Эти конкретные диалоги включают обращение системы
LIFER к базе данных, содержащей информацию о
сотрудниках университета. Могут быть построены также
аналогичные интерфейсы для общения между LIFER и другими
конкретными типами программного обеспечения.
С точки зрения обработки выражений языка наиболее
интересными программами системы LIFER являются про-
1 В руководстве по LIFER [Hendrix, 1977] описывается, как
определить целевые языки для конкретных приложений. Оно включает
также информацию об используемых в LIFER особенностях
инженерной психологии, ориентированных на разработчиков интерфейсов, а
также материалы, относящиеся к прикладной вычислительной
лингвистике.
2 LIFER непосредственно использует программу коррекции
орфографических ошибок системы INTERLISP, а также операторы USE и
REDO.
375
граммы обработки эллипсиса, коррекции орфографических
ошибок и перифразирования.
Примеры взаимодействия с LIFER
1 — What is the salary of Eric Johnson?
'Каково жалованье Эрика Джонсона?'
PARSED! 'Обработано'
(ID 327—36—8172 SALARY 19250)
2 — Position and date hired?
'Должность и дата поступления на работу?'
Попытка использования программы эллипсиса: WHAT
IS THE POSITION AND DATE HIRED OF ERIC
JOHNSON 'Каковы должность и дата поступления на
работу Эрика Джонсона?'
(ID 327—36—8172 POSITION Assoc-Prof
'адъюнкт-профессор' DATE-HIRED 8/1/70)
3 — of Robert Morgan 'Роберта Моргана'
Попытка использования программы эллипсиса: WHAT
IS THE POSITION AND DATE HIRED OF RORERT
MORGAN 'Каковы должность и дата поступления на
работу Роберта Моргана?'
(ID 437—26—1190 POSITION Assis-Prof, 'ассистент' DATE-
HIRED 6/1/73)
4 — Employee 282—93—5307 'Служащего 282—93—5307'
Попытка использования программы эллипсиса: WHAT
IS THE POSITION AND DATE HIRED OF
EMPLOYEE 282—93—5307
(ID 282—93—5307 POSITION Secretary DATE-HIRED
3/13/69)
5 — Of professors in the computer science department
'преподавателей факультета вычислительных наук'
Попытка использования программы эллипсиса: WHAT
IS THE POSITION AND DATE HIRED OF
PROFESSORS IN THE COMPUTER SCIENCE DEPT 'Каковы
должность и дата поступления на работу
преподавателей факультета вычислительных наук'
(ID 131—20—8462 POSITION Prof DATE-HIRED 8/1/55)
(ID 416-16-2749 POSITION Prof DATE-HIRED 8/1/74)
(ID 179-80—1360 POSITION Prof DATE-HIRED 1/1/63)
(ID 257—58—3058 POSITION Prof DATE-HIRED 15/7/71)
(ID 207—49-0271 POSITION Prof DATE-HIRED 8/1/69)
376
6 — What is the avarage salary and age for math
department secretaries 'Каковы среднее жалованье и
возраст секретарей факультета математики?'
AVERAGES spelling 'написание*
PARSED!
SALARY
5 items accepted
'Рассмотрено 5 чисел'
Average is 7631.4999
AGE
4 items accepted
'Рассмотрены 4 числа*
Average is 28. 1471
[Примечание: дата рождения одного из секретарей имела
значение NIA, означающее "not available" 'отсутствует']
7 — Maximum
Попытка использования программы эллипсиса: WHAT
IS THE MAXIMUM SALARY AND AGE FOR MATH
DEPARTMENT SECRETARIES
SALARY 10730
AGE 32
8 — What assistant Professors in compsci were hired after
1975? 'Кто из ассистентов на факультете выч. н. был
принят на работу после 1975?'
Попытка использования программы эллипсиса:
ELLIPSIS HAS FAILED 'Эллипсис не подходит'
THE PARSER DOES NOT EXPECT THE WORD
"COMPSCI" TO FOLLOW "WHAT ASSISTANT
PROFESSORS IN"
'Анализатор не ожидает слова compsci после what
assistant professors in'
Options for next word or meta symbol are:
'Варианты следующего слова или метасимвола'
(DEPARTMENT-NAME) '(название-факультета)'
(DEPARTMENT) ' (факультет)'
377
9 —What is a (DEPARTMENT-NAME) 'Что такое
(название-факультета > '
PARSED!
(DEPARTMENT-NAME) may be any member of the
set
{ANTHRO ANTHROPOLOGY ART BS
BUSINESS. . . CS. . . ZOO ZOOLOGY}
'(название-факультета) может быть любым членом
множества. . .'
(DEPARTMENT-NAME) may be any sequence of words
following one of the patterns:
'(название-факультета) может быть любой
последовательностью слов, соответствующей одному из
следующих образцов':
DEPARTMENT-NAME> =>
BUSINESS ADMINISTRATION 'управление'
COMPUTER SCIENCE
'вычислительные науки'
HOME ECONOMICS 'американская
экономика'
10 — Use CS for Compsci in 8 'Использовать CS вместо
compsci в 8'
PARSED!
(ID 263—42—6062POSITION Assist-Prof DATE-HIRED
8/1/76)
(ID 501—13—1171 POSITION Assist-Prof DATE-HIRED
6/15/76)
11 — What are their names and ages? ' Каковы их имена,
фамилии и возраст?'
PARSED!
(ID 263—42—6062 NAME (John W. Francis) AGE 36)
(ID 501—13—1171 NAME (Martha K. Scott) AGE 28)
12 — How many associate professors are there in the compsci
department? 'Сколько ассистентов на факультете выч.
н.?'
Попытка использования программы эллипсиса:
ELLIPSIS HAS FAILED THE PARSER DOES NOT EXPECT
THE WORD "COMPSCI" TO FOLLOW "HOW MANY
ASSOCIATE PROFESSORS ARE THERE IN THE".
'Анализатор не ожидает слова compsci после how many
associate professors are there in the.'
Options for next word or meta symbol are:
(DEPARTMENT-NAME >
13 — Define compsci like CS 'Определи compsci как CS*
PARSED!
COMPSCI
14 — Redo — 2
PARSED!
5
15 — List the compsci secretaries 'Перечислить секретарей
на факультете выч. н.'
PARSED!
(ID 490—81—2131)
(ID 512—37—3594)
(ID 572—15—4276)
16 — Print salary of Martin Devine
'Напечатать жалованье Мартина Девайна'
Попытка использования программы эллипсиса:
ELLIPSIS HAS FAILED
THE PARSER DOES NOT EXPECT THE WORD
"SALARY" TO FOLLOW "PRINT"
Options for next word or meta symbol are: THE
17 — Let "print salary of Martin Devine" be a paraphrase of
"print the salary of Martin Devine"
'Пусть print salary of Martin Devine является
перифразой для print the salary of Martin Devine'
PARSED!
LIFER. TOP. GRAMMAR => (PRESENT)
(ATTRIBUTES) (EMPLOYEE) finished 'конец'
18 — Print salary Martin Devine
PARSED!
ID 131—20—8462 SALARY 31500)
19 — Age and position
Попытка использования программы эллипсиса:
PRINT AGE AND POSITION MARTIN DEVINE
(ID 131—20—8462 AGE 57 POSITION Prof)
20 — Show date hired compsci professors making over 30 000
'Показать дату поступления на работу
преподавателей, получающих свыше 30000'
PARSED!
379
(ID 131—20—8462 POSITION Prof DATE-HIRED
8/1/55)
(ID 207—49—9271 POSITION Prof DATE-HIRED
8/1/69)
21 — Lef "DUMPALL Martin Devine" be a paraphrase of
"What is the ID, position, department and salary of
Martin Devine"
PARSED!
LIFER. TOP. GRAMMAR => DUMPALL (EMPLOYEE)
finished
22 — Dumpall employees earning over 35000
PARSED!
(ID 122—22—8769 POSITION Prof DEPT Math SALARY
35500)
(ID 178—31—1942 POSITION Prof DEPT Physics
SALARY 36000)
(ID 206—56—1620 POSITION President DEPT N/A
SALARY 37500)
23 —(CONS 'THIS' (INTERACTION USES INTERLISP
DIRECTLY)) (THIS INTERACTION USES
INTERLISP DIRECTLY)
('Этот диалог использует непосредственно
INTERLISP')
Однако удобство пользования системой LIFER зависит
не столько от мощи отдельных программных средств,
сколько от суммарного эффекта их совместной работы по
обеспечению пользователей средствами общения. Именно такое
совместное действие программных средств различных
уровней сложности следует иметь в виду при рассмотрении
приведенных примеров.
А. ввод входных сообщений
После того как INTERLISP (язык, используемый в
настоящее время системой LIFER) выдает напоминающий
символ, пользователь может печатать запросы, команды и
сообщения на английском языке 3. При этом нет необхо-
3 Естественно, что в действительности любой конкретный
интерфейс допускает лишь подмножество английского, однако эксперименты
показывают, что это подмножество может быть выделено с таким
расчетом, чтобы покрыть большую часть конкретной прикладной области.
380
димости непосредственно вызывать программу анализа
текста. Допускаются как прописные, так и строчные
буквы, использование пунктуации факультативно. Например,
в первой строчке пользователь задает вопрос What is the
salary of Eric Johnson? после того, как INTERLISP
печатает напоминание "1—".
В. ОБРАТНАЯ СВЯЗЬ
LIFER анализирует типичные входные фразы, такие,
как в диалоге 1, используя гораздо меньше секунды
времени центрального процессора на графическом дисплее DEC,
подсоединенном к машине PDP KL-104. Однако при сильной
загрузке центрального процессора может произойти
небольшая задержка при обработке входной фразы, что вызывает
беспокойство пользователя. LIFER стремится снять это
беспокойство, обеспечивая постоянную обратную связь.
Например, луч электронно-лучевой трубки или печатная
головка телетайпа непосредственно фиксирует результаты
анализа фразы по мере продвижения слева направо. Такая
обратная связь является важным свойством, присущим
человеку; это явление того же порядка, что и поддержание
связи с помощью взгляда, кивка головы и поглаживания
бороды. Другим видом обратной связи является то, что
система печатает сообщение PARSED! 'обработано', когда
она закончила анализ входного текста и готова вызвать
программное обеспечение прикладной системы (то есть
системы, для которой LIFER обеспечивает интерфейс),
чтобы ответить на вопрос, выполнить команду или
включить информацию, содержащуюся во входном сообщении,
в базу данных.
с. неполные входы
Если пользователь только что задал вопрос What is
the salary of Eric Johnson? 'Каково жалованье Эрика
Джонсона?', а затем желает узнать его служебное положение и
дату поступления на работу, гораздо удобнее и естественнее
спросить: POSITION AND DATE HIRED 'Должность и
дата поступления на работу', чем педантично печатать
WHAT IS THE POSITION AND DATE HIRED OF ERIC
4 Время обработки рассчитывается на основе словаря в 1000 слов
и грамматики, содержащей свыше 600 правил порождения,
381
JOHNSON. Учет склонности человека сокращать входной
текст — важный фактор разработки прикладных систем.
Хотя некоторые системы позволяют определить грамматику
так, что она допускает неполные предложения в качестве
"полных" входов 5, в LIFER это не является необходимым,
так как система автоматически выводит возможные
эллиптические (то есть неполные) структуры на основе
грамматик, определенных для полных конструкций. (См. выше
диалог 2).
Сначала LIFER пытается проанализировать входной
текст как полное предложение 6. Только в случае, если
такой анализ не срабатывает, система включает программу
эллиптического разбора. Для уведомления пользователя об
этой смене программ LIFER печатает сообщение TRYING
ELLIPSIS 'попытка использования программы
эллипсиса', когда запускается программа разбора эллипсиса. Если
разбор неполного предложения прошел успешно, система
снабжает пользователя дополнительной информацией,
печатая после слов TRYING ELLIPSIS полный вариант
неполного входного текста, который замещает сообщение
PARSED! (печатаемое в случае полного входного текста).
Входы 2—5 — различные неполные варианты одной и той
же структуры входного предложения, а именно входа 1.
Вход 2 вызывает замену атрибутов. Во входах 3—5
меняются лица, о которых запрашиваются сведения. Следует
отметить, что во входе 5 запрашиваются сведения о
положении и дате зачисления целой группы людей.
D. коррекция орфографических ошибок
При работе с входными текстами, составленными
человеком, важно учитывать, что они часто содержат
орфографические ошибки. Независимо от того, действительно ли
пользователь не знает правописания какого-либо слова или
он просто неправильно его напечатал, результат один и тот
же: искаженный вход. При разработке систем, нацеленных
на исследование понимания естественного языка, нет
необходимости обращать специальное внимание на коррекцию
орфографии. Но пользователей прикладных систем раздра-
5 Так сделано, например, в системе понимания речи в Стэнфордском
исследовательском институте. См. Walker, 1976.
6 Эта операция, однако, может быть пропущена, если в качестве
первого знака текста, который должен быть обработан только как
эллипсис, напечатать запятую.
382
жает, когда орфографические ошибки ведут к прерыванию
процесса обработки текста и в конечном счете к
задержкам и утомительным перепечаткам.
Способность к исправлению орфографических ошибок,
реализуемая с помощью механизма коррекции системы
INTERLISP, иллюстрируется диалогом 6. Печатается
сообщение, указывающее, что было произведено исправление
ошибки, а исправленное слово печатается непосредственно
под неправильно написанным словом.
е. сообщения об ошибке
Диалог 8 иллюстрирует реакцию LIFER, когда система
не может успешно проинтерпретировать входное
сообщение. Не сумев проанализировать предложение ни как
полное, ни как эллиптическое и не имея возможности
применить программу коррекции орфографических ошибок,
LIFER прекращает обработку и печатает сообщение об
ошибке. Это сообщение не является загадочным вздором
типа ERROR TRAP AT LOC 13730 'Ошибка-ловушка в
месте 13730', но ценной информацией, которая может
помочь неопытному пользователю понять, в чем состоит
ошибка, и содействовать ее исправлению. (Разработчики
системы могут вызвать специальные диагностические
стандартные подпрограммы, устанавливающие сложные ошибки, но
это другой вопрос.) Сообщение о текущей ошибке (одно из
нескольких) указывает, что LIFER поняла, что означает
WHAT ASSISTANT PROFESSORS IN, но не знала слова
COMPSCI. Система ожидала (DEPARTMENT-NAME) *
(название-факультета У.
ß этом месте пользователь, по-видимому, поймет, что в
лексиконе LIFER нет слова COMPSCI. Можно было бы
попробовать выразить название факультета каким-либо
другим способом, например, таким, как COMPUTER
SCIENCE. С другой стороны, пользователь может быть
поставлен в тупик, не имея понятия, что такое
(DEPARTMENTNAME). Это ведет к возникновению новой проблемы,
иллюстрируемой диалогом 9.
р. ознакомление с определениями языковых ЭЛЕМЕНТОВ
LIFER обеспечивает легкий доступ на естественном
языке к информации о заложенных в системе языковых
определениях. Опытные пользователи и разработчики интерфей-
383
са могут использовать этот механизм для освежения в
своей памяти сведений о заложенных в системе структурах и
ее возможностях. Неопытным пользователям, как это
показывает последний пример, может понадобиться доступ к
языковому определению с тем, чтобы понять сообщения об
ошибке.
Диалог 9 представляет один тип вопроса,
обеспечивающего доступ к заложенным в системе структурам. Ответ на
такой вход содержит слова и фразы, которые могут
заменять (DEPARTMENT-NAME).
g. эксплицитные замены
Если пользователь желает задать вопрос, который
является простым вариантом ранее заданного вопроса, но
контекст не позволяет использовать эллипсис (например,
существуют промежуточные предложения), то к более
раннему входному высказыванию, как это иллюстрируется
диалогом 10, может быть сделана непосредственная
отсылка. Эти отсылки и замещения сокращают количество
печатного текста, уменьшая, таким образом, как труд
пользователя, так и возможность ошибок при печати. Это—
стандартная программа в INTER LISP, не являющаяся
уникальной для LIFER.
н. местоименное тождество
Разрешение референционного тождества, особенно
тождества местоимений, связано с весьма сложными
проблемами в системах обработки языка 2. У LIFER нет
волшебного средства для решения этих проблем, однако в системе
имеются механизмы обработки некоторых наиболее простых
случаев. Один из них иллюстрируется диалогом 11.
I. определение синонимов
В диалоге 12 пользователь пытается вновь употребить
слово COMPSCI и вновь получает сообщение об ошибке.
Вполне вероятно, что он привык употреблять такое сокра-
7 См. Grosz, 1977, где приводятся интересные соображения
относительно проблем анализа дискурса и предпринимаются шаги для
их решения,
384
щение для computer science и не желает приспосабливаться
к тем синонимам, которые в настоящий момент может
обрабатывать система. Напротив, он хочет, чтобы система
приспособилась к ЕГО привычкам. В диалоге 13
пользователь просит систему определять COMPSCI как CS8.
В дальнейшем эти слова будут считаться синонимами. -
В диалоге 14 диалог 12 вновь вызывается с помощью
оператора REDO, действующего в INTERLISP. На этот
раз слово COMPSCI понято. В диалоге 15 COMPSCI
используется в новом входном сообщении.
J. определение перифраз
Механизм синонимии, представленный выше, позволяет
LIFER, обучаясь новым словам, приспосабливаться к
отдельным пользователям. Механизм перифразирования
позволяет LIFER приспособиться к новым грамматическим
конструкциям. Например, пользователь может устать
печатать синтаксически "правильные" английские вопросы и
захотеть использовать сокращенный формат. В диалоге 16
пользователь пытается употребить сжатое выражение и
получает сообщение об ошибке. В диалоге 17 используется
обычная английская конструкция, которая указывает
системе, что с этого момента разрешается сокращенная форма.
LIFER анализирует конкретную перифразу, данную ей в
качестве примера, с целью найти обобщение, пригодное для
других случаев. (Подробнее об этом будет сказано ниже.)
Правила вывода, фиксирующие результаты этого
обобщения, напечатаны для более опытного пользователя.
8 Синонимы можно также определять с помощью более общего
понятия перифразирования. Пример перифразирования, сходный с
использованием синонимов в диалоге 13, следующий:
13— Let "How many associate professors are there in the COMPSCI
department" be a paraphrase of "How many associate professors are
there in the CS department". 'Пусть how many associate professors
are there in the COMPSCI department будет перифразой для how
many associate professors are there in the CS department.*
PARSED!
MAY LIFER ASSUME THAT "COMPSCI" MAY ALWAYS BE USED
FOR "CS" 'Может LIFER принять, что COMPCSI может всегда
использоваться вместо "CS"*
(TYPE YES OR NO) 'печатать ДА или НЕГ
YES 'ДА*
(DEPARTMENT-NAME) => CS
finished 'конец'
14—...
13 №534
385
В диалоге 18 пробуется новый сокращенный формат.
Диалог 19 — это пример расширения эллиптических
выражений, основанных на формате, определенном пользова^
телем. Диалог 20 показывает, что LIFER обобщила
начальную перифразу с тем, чтобы обобщенная конструкция
покрывала другие сходные с начальной перифразой
сокращенные конструкции.
Диалоги 21 и 22 — это дальнейшая иллюстрация
способности LIFER к перифразированию. На основе диалога
21 DUMPALLX принимает значение INDICATE THE ID,
POSITION, DEPARTMENT AND SALARY OF X
'укажите идентификационный номер, должность, факультет и
жалованье Х-а'.
к. обращение к языку-хозяину
Пользователь, знакомый с языком INTERLISP, может
предпочесть смешанные диалоги с анализатором LIFER
и с системой INTERLISP. Как показано в диалоге 23, это
легко сделать, напечатав перед входным сообщением,
предназначенным для взаимодействия с INTERLISP, сим-
вол ! .
L. обеспечение удобным языком интерфейса
В конечном итоге наиболее существенным
требованием инженерной психологии, ориентированной на
пользователя, является обеспечение его языком интерфейса,
отражающим языковые структуры, необходимые для
удобного общения с программами прикладной системы. Такие
механизмы, как коррекция орфографических ошибок и
обработка эллипсисов, хотя и важны, но никогда не смогут
восполнить недостатков основных лингвистических
механизмов.
При существующем уровне исследования проблем
обработки языка было бы бесполезно пытаться представить
окончательную спецификацию английского языка,
обладающую достаточной общностью для покрытия всех
потенциальных областей применения. Подход в LIFER
базируется не на стремлении достигнуть некоторой
окончательной спецификации, а скорее на желании обеспечить
разработчиков интерфейсов основными понятиями,
инструкциями и механизмами, которые позволяют за вполне приемле-
386
мое время создать надежное практическое определение
языка специального назначения, покрывающего спектр
языковых структур, наиболее релевантных для конкретной
области 9.
Здесь невозможно рассмотреть в деталях конкретный
набор функций взаимодействия, которые предоставляет
LIFER для определения прикладного языка 10, но
некоторые ключевые моменты стоит упомянуть:
1) Разработчики интерфейса работают в рамках языка
INTERLISP — мощного и гибкого языка-"хозяина",
имеющего совершенные средства отладки. Возможно, языки
более низкого уровня обрабатываются быстрее, однако
гибкость и простота программирования — вот что берется в
расчет, когда идет речь о создании работающей системы при
разумных затратах сил и времени.
2) Расширения и изменения языковых определений
могут свободно смешиваться с вызовами анализатора.
При создании системы нет этапа составления грамматики.
Это позволяет разработчикам интерфейса действовать
быстро, по принципу "расширяй-и-проверяй" и содействует
работе механизмов, модифицирующих язык в процессе
обработки, таких, как программа перифразирования.
3) Разработчик интерфейса никак не связан с
внутренними структурами, которые LIFER строит в целях
повышения эффективности обработки. В частности, пользователь
общается с LIFER в терминах простых правил порождения,
которые внутри системы хранятся в виде сети переходов
(Woods, 1970).
4) LIFER обладает мощным механизмом
грамматического редактирования (который использует программу
редактирования системы INTERLISP).
5) LIFER обладает пакетом функций для
формулирования запросов к грамматике и для отладки программ.
6) Конструкции с эллипсисом обрабатываются
автоматически, и поэтому разработчику интерфейса нет нужды
обращать на это внимание.
7) Имеется общее руководство, описывающее, как
пользоваться системой.
9 Языки целевого назначения с помощью LIFER, возможно, легче
всего строить на основе обращения к понятию "семантической
грамматики" в понимании Брауна и Бертона (Brown and Burton, 1975).
10 Подробное обсуждение этой темы содержится в руководстве по
LIFER [Hendrix, 1977],
13*
387
III. РЕАЛИЗАЦИЯ ОТДЕЛЬНЫХ ПРОГРАММ
В этом разделе рассматривается работа программ
коррекции ошибок, разбора эллипсиса и перифразирования в
системе LIFER.
а. осуществление коррекции ошибок
LIFER использует программу анализа слева направо,
основываясь на упрощенной версии расширенных сетей
перехода Вудса (Woods, 1970). Каждый раз, когда
анализатор обнаруживает, что дальнейшее продвижение
по задействованной в настоящий момент тропинке
невозможно, он заносит отказ в список точек отказа. Каждая
запись в этом списке указывает состояние системы в
момент, когда произошел отказ (то есть положение в сети
перехода и значения различных стеков и регистров), и
позицию во входной цепочке (для данного момента). Частичные
неоднозначности и ложные тропинки естественным образом
выделяют точки отказа даже при обработке полностью
приемлемого входа.
Если входной текст полностью разобран, то точки
отказа не рассматриваются. Но если текст не удается
проанализировать, список точек отказа используется программой
коррекции ошибок, которая выбирает точки отказа,
связанные с крайней правой позицией в тексте, для которой
были зарегистрированы точки отказа. Предполагается, что
точки отказа, расположенные слева, не были вызваны
ошибками в написании, так как определенные переходы,
использующие слова в этих позициях, должны были быть
успешными для того, чтобы справа от них могли оказаться точки
отказа.
Программа коррекции ошибок производит дальнейшее
ограничение крайних правых точек отказа, рассматривая
только те случаи, когда крайняя правая точка G
подчиняется крайней правой точке F. G подчиняется F, если G
является точкой отказа в сети, вызываемой условием PUSH
на дуге, ведущей от F. Так как G и F обе являются
крайними правыми точками отказа, G представляет собой задержку
начального состояния PUSH-сети. (При любом
произведенном переходе G окажется справа от F.) Следовательно, если
точка F будет вновь включена в анализ, G будет вновь
рассматриваться как один из путей перехода от F. G, таким
образом, не имеет смысла рассматривать независимо. Все
388
подчиненные крайние правые точки отказа исключаются
из рассмотрения.
Работая с крайними правыми доминирующими точками
отказа, программа коррекции ошибок анализирует
связанные с ними тропинки с целью нахождения всех категорий
слов, которые сделали бы возможным переход. (Для
тропинок PUSH это требует исследования субграмматик.) На
базе программы коррекции ошибок INTERLISP слово
входной цепочки, связанное с крайними правыми точками
отказа, сравнивается с лексическими единицами только что
найденных категорий. Если "неправильно написанное"
слово достаточно сходно с какими-то из этих лексических
единиц, производится его замещение наиболее похожей
единицей. Точки отказа, связанные с лексическими
категориями, включающими это новое слово, вновь начинают
последовательно включаться в анализ, пока не будет
найдена точка, ведущая к успешному разбору. (Это может
привести к новой коррекции ошибок, встреченных правее.)
Если все вновь включенные в разбор точки потерпят
неудачу, "неправильное" слово заменяется другими близкими
лексическими единицами. Если такие замены также
окончатся неудачей, LIFER печатает сообщение об ошибке.
LIFER поощряет использование семантически
ориентированных синтаксических категорий, таких, как
(EMPLOYEE) '(служащий)' и (DEPARTMENT-NAME)
'(название-факультета)', а не таких стандартных категорий, как
(NOUN) '(существительное)'. Использование этих более
специализированных категорий намного облегчает
коррекцию ошибок, так как резко ограничивает число
потенциально возможных слов в любой точке разбора и.
в. реализация программы обработки эллипсиса
Механизм обработки эллиптических входных
сообщений системы LIFER пользуется тем, что спецификации
языков прикладных систем имеют тенденцию в синтаксических
категориях кодировать значительное количество семанти-
н Примером конкретной системы LIFER может служить система,
описанная в качестве примера в (Sacerdoti, 1977). Она имеет
словарь, включающий свыше 1000 слов, не считая чисел и кодированных
символов. Этот словарь разделен на 131 категорию, 113 из которых
содержит 10 или менее слов; 15 категорий содержит от 11 до 50 слов; самая
большая категория — 144 слова.
389
ческой информации. Так, сходные синтаксические
конструкции обычно близки семантически. Обработка эллипсисов в
LIFER основывается на этом понятии схожести. В процессе
разбора эллипсиса LIFER допускает любую цепочку слов,
которая синтаксически сходна с любой подцепочкой
смежных слов в последнем входном сообщении. (Если последнее
входное сообщение было неполным, используется его
расширение до полного предложения.) При поиске аналогии
LIFER обращается к синтаксическому дереву последнего
входного предложения, которое было успешно
проанализировано системой. Для любой подцепочки смежных слов в
последнем входном предложении может быть определен
"образец аналогии" с помощью программы абстрагирования,
работающей над старым синтаксическим деревом от слов
подцепочки к корню дерева. Как только синтаксическое
дерево показывает, что часть подцепочки является полным
расширением некоторой синтаксической категории, данная
часть замещается именем категории. Образец аналогии —
это конечный результат всех таких замен.
WHAT IS the salary об martin devine?
/LIFER.TOP. GRAMMAR/
Рис, /. Синтаксическое дерево.
Рассмотрим, например, как может быть найден образец
аналогии для подцепочки
OF MARTIN DEVINE
на основе представленного на рис. 1 синтаксического дерева
предыдущего входного предложения WHAT IS THE
SALARY OF MARTIN DEVINE? Так как часть подцепочки
MARTIN DEVINE является полным расширением (NAME),
подцепочка переписывается как OF (NAME). Аналогичным
образом, так как (NAME) есть расширение (EMPLOYEE),
подцепочка переписывается как OF (EMPLOYEE). Так как
390
никакая другая часть подцепочки не является полным
расширением других синтаксических категорий в дереве,
процесс прекращается, и OF (EMPLOYEE) принимается как
наиболее общий образец аналогии. Если текущий вход
будет подходить к этому образцу аналогии, LIFER примет
его как допустимый эллиптический вход. Например,
образец аналогии OF (EMPLOYEE), выделенный из последнего
входа, может быть использован для сопоставления с такими
текущими входами, как
OF ERIC JOHNSON
OF EMPLOYEE 494—81—7207 и
OF PROFESSORS IN THE MATH DEPARTMENT
Преподавателей факультета математики'
Следует заметить, что расширение (EMPLOYEE) не
обязано совпадать с расширением в старом входном сообщении,
которое породило данный образец аналогии. Например,
OF EMPLOYEE 494-81-7207 соответствует расширению
(EMPLOYEE) в EMPLOYEE (ID-NUMBER), а не
расширению (EMPLOYEE) в (NAME).
Для вычисления ответов на эллиптические входы,
соответствующие образцу OF (EMPLOYEE), LIFER ищет путь
по старому синтаксическому дереву от общей категории
цепочки OF (EMPLOYEE) к корню. Прежде всего
вызывается программа определения значения (ITEM) на основе
составляющих правила порождения
(ITEM) => THE (ATTRIBUTE),
которая использует новое значение (EMPLOYEE)
(появившееся в текущем эллиптическом входе) и старое
значение (ATTRIBUTE) из последнего предложения. Затем,
используя только что вычисленное значение (ITEM) и
старое значение (PRESENT), точно так же определяется
новое значение категории (LIFER. TOP. GRAMMAR) —
корня синтаксического дерева.
Ниже приведены некоторые другие подцепочки с
соответствующими образцами аналогии и примерами
возможных новых эллиптических входов, подходящими к этим
образцам:
подцепочка: THE SALARY
образец: THE (ATTRIBUTE)
возможное эллиптическое
выражение: THE AGE AND DATE HIRED
подцепочка: SALARY OF MARTIN DEVINE
391
образец: (ATTRIBUTE) OF (EMPLOYEE)
возможное эллиптическое
выражение: AGE OF CS SECRETARIES
подцепочка: WHAT IS THE SALARY
образец: (PRESENT) THE (ATTRIBUTE)
возможное эллиптическое
выражение: PRINT THE DATE HIRED
подцепочка: WHAT IS THE SALARY OF MARTIN
DEVINE
образец: (LIFER. TOP. GRAMMAR)
возможное эллиптическое
выражение: [любое полное предложение]
В целях эффективности стандартные подпрограммы
эллипсиса кодируются таким образом, что избегается
действительное порождение образцов аналогии 12. Тем не менее
в теоретическом плане результат эквивалентен анализу,
основывающемуся на образцах аналогии для каждой
непрерывной подцепочки последнего входа.
12 На теоретическом уровне используемый алгоритм можно описать
так. Если последний вход был проанализирован с помощью правила
порождения высшего уровня
(LIFER. ТОР. GRAMMAR)=>(Xi><X3)...(Xn),
то разбор эллипсиса начинается с попытки совместить новый вход с
подцепочкой, расположенной слева в правой части правила порождения.
Если новый вход вполне соответствует последовательности (Xi)...(Xj),
оставляя неиспользованными (Xj+1)...(Xn), то (Xj + 1)...(Xn) берутся
из старого входа. Если новый вход не подходит к левой части цепочки
(Х!)...(ХП), то процесс начинается заново, отталкиваясь от усеченного
слева образца (Х2)...(ХП). В общем случае, если новый вход совпадает
с подобразцом (Xj)...(Xj), то старые составляющие (X1>...(Xj_1> и
(Xj + 1)...(Xn) используются для расширения эллиптического входа до
нового полного предложения на высшем уровне его представления.
Этот процесс осложняется тем фактом, что любая составляющая
(X) могла сама быть расширена в последнем входе на основе правила
порождения (X>=§>(Y1)(Y2)...<Ym>.
Если новый вход при попытке его сопоставления с (Xi)...(Xn) не
использует (Xj), то (Xi) замещается набором (Y1)...(Ym) в расчете на то,
что эллиптический вход может начаться где-то посредине расширения
старого (Х\). Только после того, как путем последовательного усечения
слева (Y) будет исчерпан, (Xi + i) становится крайним левым символом
для новой серии сопоставления цепочек. Точно так же, если (Xj>...
(Xi+ln) подходит к левой части эллиптического входа, но левая часть
остатка от входа не подходит к (Xi+m + i>, то (Xi + m + 1) заменяется на
его расширение, взятое из последнего входа, и процесс сопоставления
продолжается. Иногда случается, что эллиптический вход может
кончиться в середине расширения (Xi + m + 1).
392
С. РЕАЛИЗАЦИЯ СИСТЕМЫ ПЕРИФРАЗИРОВАНИЯ
Механизм перифразирования в LIFER также
использует семантически, ориентированные синтаксические
категории и синтаксические деревья. В типичном случае
механизму перифразирования дается модель предложения,
которое система уже может понять, и перифраза. Общая
стратегия механизма перифразирования — проанализировать
предложение-модель и затем найти похожие структуры в
перифразе.
1. Основной метод
В частности, механизм перифразирования побуждает
анализатор построить синтаксическое дерево предложения-
модели. Используя это дерево, механизм перифразирования
определяет все правильные подфразы модели, то есть все
подцепочки, являющиеся полным расширением одной из
синтаксических категорий, имеющихся в дереве.
Предполагается, что любая из этих подфраз предложения-модели,
которые также имеются в перифразовой цепочке, играет ту
же роль в перифразе, что и в самой модели. Так,
семантически ориентированные синтаксические категории,
которые объясняют эти подфразы в модели, вновь используются
для объяснения соответствующих подфраз перифразы.
Более того, отношения между синтаксическими категориями,
которые имеются в синтаксическом дереве модели,
формируют основу для установления отношений между
соответствующими синтаксическими единицами, выведенными и
для перифразы.
а. Определение правила порождения
для перифразирования
Для нахождения соответствия между моделью и
перифразой, подфразы модели прежде всего классифицируются.
Более длинные фразы предпочтительнее более коротких, а
из двух фраз одной и той же длины первой берется левая
крайняя. Например, расклассифицированные фразы дерева
на рис. 1 следующие:
1. (ITEM) THE SALARY OF MARTIN DEVINE
2. (PRESENT) WHAT IS
3. (NAME) MARTIN DEVINE-- не используется
4. (EMPLOYEE) MARTIN DEVINE
5. (ATTRIBUTE) SALARY
393
Так как синтаксическое дерево указывает, что
(EMPLOYEE) => (NAME) => MARTIN DEVINE, то и (NAME),
и (EMPLOYEE) соответствуют одной и той же подфразе.
В таких случаях рассматривается только наиболее общая
синтаксическая категория ((EMPLOYEE)).
Начиная с первой (наиболее длинной) подфразы,
подфразы сопоставляются с последовательностями в
перифразовой цепочке. (Если некоторая подфраза совмещается с
двумя последовательностями слов, используется только крайнее
левое совмещение.) Более длинным подфразам отдается
предпочтение, так как их совмещения приведут к
обобщениям, включающим совмещение для более коротких
содержащихся в них фраз. Как только найдено некоторое
совмещение, совпавшая последовательность слов в перифразе
замещается синтаксической категорией, связанной с
соответствующей подфразой. Этот процесс продолжается до тех
пор, пока сопоставления не будут испробованы для всех
подфраз.
Например, предположим, что предложена следующая
перифраза для вопроса на рис. 1:
FOR MARTIN DEVINE GIVE ME THE SALARY
'Для Мартина Девайна дайте мне жалованье'
Подфразы 1 и 2, перечисленные выше, не совпадают с
подцепочками в этой перифразе. Подфраза 3 не
рассматривается, так как она подчиняется подфразе 4. Подфраза 4
совмещается с последовательностью слов в перифразе. Замена
последовательности слов именем соответствующей
категории порождает новую цепочку перифразы:
FOR (EMPLOYEE) GIVE ME THE SALARY
Подфраза 5 совмещается с последовательностью слов в этой
новой цепочке. Соответствующая замена порождает
FOR (EMPLOYEE) GIVE ME THE (ATTRIBUTE)
Так как больше подфраз нет, структура
(LIFER. TOP.GRAMMAR) =>
FOR (EMPLOYEE) GIVE ME THE (ATTRIBUTE)
создается в качестве нового правила порождения для
данной перифразы.
394
b. Определение функции ответа
для правила порождения перифразы
Новая семантическая функция, указывающая, как
отвечать на входы, подходящие к данному правилу
порождения, программируется автоматически на основе
информации, содержащейся в синтаксическом дереве предложения-
модели. В частности, синтаксическое дерево указывает,
какие правила порождения использовались в модели для
расширения различных синтаксических категорий. С
каждым из этих правил связана функция, которая вычисляет
интерпретацию соответствующих подфраз, исходя из их
составляющих. Механизм перифразирования вновь
использует выбранные функции модели для создания новой
функции для правила порождения перифразы. Как это
происходит, лучше всего показать на примере.
Вновь обращаясь к примеру на рис. 1, мы видим, что
синтаксическое дерево указывает на использование
правила порождения
(LIFER. TOP. GRAMMAR) r> (PRESENT) (ITEM)
С этим правилом связана функция Fl (не приведенная на
рисунке, но имеющая отсылку в действительном дереве),
которая вычисляет значение (value) для (LIFER. ТОР.
GRAMMAR) на основе значений для (PRESENT) и
(ITEM)13. Используя нотацию "#(Х)" для обозначения
"значение (X)", роль Fl можно выразить уравнением
# (LIFER. TOP. GRAMMAR) = Fl (^(PRESENT),
=Н= (ITEM))
Другим правилом порождения, указанным синтаксическим
деревом модели, является
(ITEM) => THE (ATTRIBUTE) OF (EMPLOYEE)
Это правило связано с функцией F2, где
# (ITEM) = F2 (^(ATTRIBUTE), ^(EMPLOYEE))
Механизм перифразирования должен определить новую
функцию FN для правила порождения перифразы
(LIFER. TOP. GPAMMAR)=>FOR (EMPLOYEE)
GIVE ME THE (ATTRIBUTE)
13 Так как (LIFER. TOP. GRAMMAR) представляет собой
синтаксическую категорию на уровне предложения, это значение является
фактически ответом на весь вход.
395
Более того, значение, вычисленное функцией FN, должно
быть такое же, как и значение, вычисленное как ответ на
предложение-модель. Так как категории (EMPLOYEE) и
(ATTRIBUTE) появляются в правиле порождения
перифразы с правой стороны, то механизм перифразирования
принимает, что FN является функцией #(EMPLOYEE)
и #(ATTRIBUTE). Так как FN должна вычислить то же
значение, что и функция Fl модели, то механизм
перифразирования принимает, что
FN (^(EMPLOYEE),
#(ATTRIBUTE))=F1(#(PRESENT), #(ITEM>)
Синтаксическое дерево указывает, что расширение для
(PRESENT) не зависит от расширений (EMPLOYEE)
и (ATTRIBUTE). Поэтому механизм перифразирования
принимает, что при вычислении функции FN значение
#(PRESENT) является константой. Другими словами,
значение (PRESENT), используемое в модели, всегда будет
использоваться как значение (PRESENT) при вычислении
функции FN в терминах функции Fl.
Напротив, (ITEM), как показывает синтаксическое
дерево, включает и (EMPLOYEE) и (ATTRIBUTE).
Следовательно, оба эти параметра в FN могут повлиять на
значение #(1ТЕМ).
Функция F2 указывает природу этого влияния. Поэтому
в равенстве, определяющем функцию FN, механизм
перифразирования заменяет значение #(1ТЕМ) выражением,
которое вычисляет его:
FN (#(EMPLOYEE), # (ATTRIBUTE)-
Fl (^(PRESENT), F2 (# (ATTRIBUTE ),
REMPLOYEE)))
Это новое равенство полностью определяет FN в терминах
констант, формальных параметров FN и уже определенных
функций, то есть FN определена в терминах константы
#(PRESENT) (взятой из входной модели), формальных
параметров #(EMPLOYEE) и #(ATTRIBUTE) и
определенных до этого функций Fl и F2.
2. Дальнейшее обобщение
Целью программы перифразирования является описание
данной перифразы в возможно более общих терминах с
тем, чтобы новые конструкции, созданные для конкретных
396
перифраз, покрывали максимальное число новых
возможных входов. В определенных случаях эти конструкции,
созданные с помощью основного метода, описанного выше,
могут быть расширены механизмом перифразирования
следующим образом. Положим, некоторая подфраза S
модели, которая совпадает с подцепочкой перифразы,
связана с синтаксической единицей (М> в синтаксическом
дереве модели. Такая единица (М) в свою очередь появится
в дереве как непосредственная составляющая более общей
единицы (G), так что
(G)=>x <М> у,
где х и у — некоторые (возможно, пустые)
последовательности языковых единиц. Так как подфраза, связанная с
(G), не совпала ни с какой частью перифразы, то либо х,
либо у, либо они оба отсутствуют в перифразе (по крайней
мере в непосредственной близости к (М>). Тем не менее,
если грамматика разрешает правило порождения
<G> =» <М>
и если значение, приписанное G, одинаково в обоих правилах
(G>=> <М>
и
<G>:=>x <М> у,
тогда (М> заменяется на (G) в перифразе, чтобы получить
конструкцию с более широким применением.
Предположим, например, что имеется следующая
входная модель:
WHAT IS THE SALARY OF EMPLOYEE MARTIN
DEVINE
и что синтаксическое дерево подобно дереву на рис. 1, за
исключением того, что (EMPLOYEE) расширяется как
EMPLOYEE MARTIN DEVINE
<TITLE> <EMPLOYEE> <NÄME>
Положим, далее, что в качестве перифразы предлагается
опять
FOR MARTIN DEVINE GIVE ME THE SALARY
397
В отличие от предыдущего примера, в котором Martin
Devine был замещен (EMPLOYEE), теперь алгоритм
замещения последней части разрешает здесь только замену (NAME ).
Результирующая перифраза следующая:
FOR (NAME) GIVE ME THE (ATTRIBUTE).
Эта структура подходит к данной перифразе, однако не
покрывает предложения
FOR PROFESSOR MARTIN DEVINE GIVE ME THE
AGE.
Однако, используя только что описанный процесс
обобщения, если система разрешает правило
(EMPLOYEE) r> (NAME)
и если значение (EMPLOYEE), определенное этим способом,
такое же, что и значение, использующее правило
(EMPLOYEE) r> (TITLE) (NAME),
то в перифразовой структуре (EMPLOYEE) будет заменять
(NAME), производя
FOR (EMPLOYEE) GIVE ME THE (ATTRIBUTE).
Эта более обобщенная конструкция годится для входных
фраз
FOR PROFESSOR MARTIN DEVINE GIVE ME THE
AGE
FOR EMPLOYEE 205-56-1620 GIVE ME THE DATE
HIRED
FOR MATH DEPARTMENT SECRETARIES GIVE
ME THE SALARY.
3. Запись в субграмматике
Рассмотрим перифразы вида "х у z", моделью для которых
является форма "xSy" и S — собственная подфраза,
связанная с синтаксической категорией (С). Механизм
перифразирования учитывает этот тип условия и спрашивает
пользователя, всегда ли у является перифразой S или только в
контексте х и z. Если пользователь указывает на
зависимость от контекста, обработка продолжается как обычно.
Если же пользователь указывает, что у является
перифразой S в любом контексте, тогда LIFER закрепляет у в ка-
398
честве перифразы S в субграмматике, связанной с (С).
В этом случае влияние данной перифразы будет
сказываться везде, где используется категория (С). (Например,
см. примечание к разделу II—1.)
IV. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
В течение прошедшего года было разработано несколько
интерфейсов, использующих LIFER; оценка их
пользователями была в высшей степени положительной. Стоит
отметить, что разработка интерфейсов для некоторых более
простых приложений заняла менее недели. Большинство этих
простых интерфейсов относилось к небольшим реляционным
базам данных. Однако интерфейсы были также разработаны
для системы распределения людей и ресурсов, для
основанной на ЭВМ экспертной системы и для программы, которая
отвечает на вопросы относительно взаимоотношений между
программами в большом массиве машинных кодов.
LIFER использовалась также при создании и более
сложных интерфейсов. Один из них, занявший несколько
человеко-месяцев (но не несколько человеко-лет),— это
компонент INLAND системы LADDER, описанной Сейсер-
доти (Sacerdoti, 1977). Эта система, включающая более
600 "правил порождения" и лексикон свыше 1000 слов (не
принимая во внимание чисел и многочисленных символов),
обеспечивает доступ на естественном языке к сравнительно
большому набору данных, распределенных среди
многочисленных удаленных ЭВМ, входящих в сеть ARPA.
В заключение можно отметить, что опыты с LIFER
показывают, что могут быть разработаны действительно
полезные интерфейсы на естественном языке и что процесс
разработки отнимает гораздо меньше усилий, чем можно
было бы ожидать. Учет требований инженерной психологии
играет ключевую роль в достижении этих результатов.
Применение подобных требований к более сложной
технологии обработки языковых данных, подобной
разработанному в Стэнфордском исследовательском институте проекту
понимания речи (Walker, 1976), обещает создание
практических систем, допускающих гораздо большую беглость
устной или письменной речи их пользователей.
Работа, представленная здесь, была выполнена в
рамках программы внутренних исследований и развития в
Стэнфордском исследовательском институте.
399
ЛИТЕРАТУРА
Brown, J. S. and Burton, R. R. Multiple Representations of
Knowledge for Tutorial Reasoning.— In: "Representation and
Understanding" (ed. by Bobrow, D. G. and Collins, A.). New York, Academic
Press, 1975, p. 311—349.
Grosz, Barbara J. The Representation and Use of Focus in
Dialogue Understanding. (Докторск. дисс, University of California, June,
1977.)
Hendrix, G. G. LIFER: A Natural Language Interface
Facility.— Technical Note 135 (Artificial Intelligence Center, Stanford
Research Institute). Menlo Park, California, 1976.
Hendrix, G. G. The LIFER Manual: A Guide to Building Practical
Natural Language Interfaces.— Technical Note 138 (Arficial Intelligence
Center, Stanford Research Institute). Menlo Park, California, 1977.
Sacerdoti, E. D. Language Access to Distributed Data with
Error Recovery.— In: "Adv. papers of 5th International Joint Conference
on Artificial Intelligence". Cambridge, Massachusetts, August 1977.
Teitelman, W. INTERLISP Reference Manual (XEROX Palo
Alto Research Center). Palo Alto, California, 1975.
Thompson, F. B. and Thompson, В. H. Practical
Natural Language Processing: The REL System Prototype.— In: "Advances
in Computers" (ed. by Rubinoff, M. and Yovits, M. C). Academic Press,
New York, 1975, p. 109—168.
Walker, D.E. (ed.) Speech Understanding Research. (Annual
Report. Project 3804. Artificial Intelligence Center, Stanford Research
Institute). California, 1976.
Waltz, D. L. Natural Language Access to a Large Data Base: An
Engineering Approach.— In: "Adv. Papers 4th Int. Joint Conf. on
Artificial Intelligence). USSR, Tbilisi, September, 1975", p. 868—872.
Woods, W. A. Transition Network Grammars for Natural Language
Analysis (CACM 13, 10 October 1970, p. 591—606).
Woods, W. А., Kaplan, R. M. and Nash - Webber, B.
The Lunar Science Natural Language System: Final Report (Report No
2378 — Bolt Beranek and Newman Inc.). Cambridge, Massachusetts, 1972.
400
Р. Шенк, M. Лебовиц, Л. Бирнбаум
ИНТЕГРАЛЬНАЯ ПОНИМАЮЩАЯ СИСТЕМА *
Йельский университет
Отделение вычислительных наук
Предлагается новый тип анализатора (parser) естественного языка.
Идея, положенная в основу этого анализатора, заключается в
преобразовании входных предложений в наиболее глубинную (для данной задачи)
форму представления их значения и следующих из них умозаключений.
Анализатор не вычленяется из понимающей системы в целом. Для
осуществления анализа он использует интегральную концепцию
умозаключений, сценариев, планов и других видов знания. Более того, он не
пытается анализировать все, что он видит. Напротив, он определяет
наиболее интересные части текста и концентрирует свое внимание именно на
них, игнорируя все остальное.
I. ОБЗОР АНАЛИЗАТОРОВ,
ОСНОВАННЫХ НА КОНЦЕПТУАЛЬНЫХ ЗАВИСИМОСТЯХ
На протяжении последних десяти лет исследователи,
работающие в рамках нашего проекта, разработали и
запрограммировали большое число анализаторов. Задача
этих анализаторов состояла в преобразовании исходных
выражений естественного языка в некоторое внутреннее
представление. (Заметим, что первая фаза процесса
понимания традиционно соотносится с выявлением
синтаксической формы входного сообщения.) Однако термин "анализ"
(parsing) с не меньшим основанием может быть применен к
первой фазе понимания в любом ее истолковании. В этой
статье мы рассмотрим некоторые из проблем, возникших
в ходе создания наших анализаторов, и представим новую
теорию анализа, моделирующую реальный процесс
понимания, как он осуществляется в ходе обычного чтения
текста; опишем программу, которая реализует эту теорию
и понимает газетные сообщения на тему о терроризме.
* Roger С. Schank, Michael Lebowitz, Lawrence
Birnbaum. An integrated understander.— "American Journal of
Computational Linguistics", 1980, Vol. 6, No 1, p. 13—30. При переводе
настоящей статьи на русский язык редакция сочла возможным сократить
ряд примеров.— Прим. ред.
© Association for Computational Linguistics (1980).
401
Все наши анализаторы были программами, которые
преобразовывали английские предложения в представления их
значений в рамках теории концептуальных зависимостей
(КЗ). В основе их построения всегда лежало
методологическое допущение о том, что используемый алгоритм
анализа должен быть как можно более адекватным в
психологическом плане. Таким образом, наши анализаторы
предназначены для моделирования того способа анализа, которым,
как мы полагаем, пользуются люди. Это методологическое
допущение повлекло за собой операционный принцип,
соблюдавшийся, за одним исключением, во всех случаях
(которые мы обсудим ниже), а именно, что алгоритм анализа
движется по тексту слева направо и осуществляет его
просмотр один раз, не допуская возврата. Эти анализаторы не
были рассчитаны на обработку предложений, похожих на
настоящие "садовые тропинки", когда в процессе понимания
людям приходится осуществлять возврат назад.
Первый анализатор, который мы разработали (Schank
and Tesler, 1969), использовал так называемые "правила
реализации" и преобразовывал английские синтаксические
структуры в КЗ. (Этот термин, взятый из Lamb, 1966,
означал, что мы соотносили один языковой уровень с
другим.) Главный недостаток этого анализатора состоял в том,
что он нарушал нашу методологическую установку на
моделирование процессов, осуществляемых человеком. Для
многих английских предложений, которые были
неоднозначными, применявшийся нами алгоритм не мог определять
предпочтительность одной интерпретации по сравнению с
другой, хотя люди явно владеют такого рода
предпочтениями.
В работе Schank et al., 1970 мы предложили
некоторое решение для устранения этого недостатка и
реализовали новые принципы при построении нового анализатора,
который мы назвали SPINOZA П. SPINOZA II должен
был для управления ходом анализа использовать само
представление КЗ. Это значит, что в процессе анализа
значение любого понятого сегмента (от начала
предложения) должно помогать при определении значения остальной
части предложения. Эта идея повлекла за собой
сопутствующую идею о том, что, поскольку анализом будет управлять
значение, мы на самом деле, видимо, почти не должны
полагаться на синтаксис как на средство осуществления нашего
анализа. (В то же самое время сходную идею разрабатывал
402
Уилкс (Wilks, 1973), и его мнение послужило
поддержкой для нашей веры в возможность осуществления этой
идеи.) Мы не считали, что сможем обойтись без
синтаксиса. Наша точка зрения состояла в том, что опора прежде
всего на семантические аспекты существенно уменьшит
зависимость наших анализаторов от синтаксиса.
В то время, когда разрабатывались анализаторы
указанного типа, другие исследователи также создавали методы
для преобразования входных предложений на естественном
языке во внутреннее представление. Большинство этих
методов основывалось на синтаксисе предложений. Один из
наиболее популярных методов состоял в использовании
Расширенной сети переходов (Augmented Transition
Network (ATN)). Анализаторы этого типа обсуждались в
работах: Thorne et al., 1967; Bobrow and Fraser, 1969;
Woods, 1969; Kaplan, 1975. Анализатор, очень
близкий к классу ATN, представлен в работе Винограда (см.
Winograd, 1972). Модели типа ATN опирались
преимущественно на синтаксис, лишь изредка обращаясь к
установлению нескольких простых семантических свойств слов.
Еще более тесно связаны с синтаксисом анализаторы,
базирующиеся на трансформационной грамматике, как,
например, в работе: Plath, 1974. Одной из последних
публикаций на эту тему является работа: Marcus, 1979,
где описывается анализатор, основанный на
предположении о возможности выделения синтаксиса как
самостоятельной части понимания языка. Важно подчеркнуть, что
все эти программы рассматривают синтаксический анализ
как процесс, полностью изолированный от остальных
сторон понимания. Этими системами управлял синтаксис,
хотя в некоторых случаях синтаксическому анализатору
разрешалось запрашивать семантическую информацию.
Некоторые системы понимания речи, в частности Hearsay-
II (CMU Computer Science Speech Group, 1976), используют
более интегральный подход, но они лишь слегка касаются
того уровня анализа, который интересует нас. В рамках
нашей концепции мы всегда подчеркивали необходимость
интеграции семантики и синтаксиса в процессе
анализа.
Анализатор SPINOZA-II был закончен лишь отчасти,
когда мы вынуждены были от него отказаться по
соображениям не академического порядка. Было предпринято
несколько попыток продолжить разработку этого анализато-
403
pa, пока Крис Ризбек не создал анализатор, который был
похож на SPINOZA-II по идее, но отличался по форме
(см. Riesbeck, 1975). Программа этого анализатора
была основана на так называемых запросах,
представлявших собой особую форму проверки выполнения заданных
условий (см. Newell, 1973). Запросы активизиррвались
каждый раз, когда могли быть выдвинуты ожидания о
некоторой синтаксической или семантической информации, и
выполнялись, если включенные в них ожидания
оказывались истинными. Таким образом, анализ направлялся
посредством ожиданий, что делало систему Ризбека,
позже названную ELI, сильно ориентированной на
анализ "сверху вниз" (см. Riesbeck and Schank,
1976).
ELI была использована в роли "приставки" к системе
SAM, нашей системе понимания, основанной на сценариях
(Schank et al., 1975; Cullingford, 1978), и была
объединена с работой Гершмана (Gershman, 1977)
по именным группам, что привело к созданию
анализатора, который мог обрабатывать очень сложные по
структуре предложения.
Одним из главных недостатков ELI является ее
"негибкость". Грейнджер (Granger, 1977) создал для ELI
дополнительный компонент — FOUL-UP, который
определяет значение неизвестных слов в контексте, и это придало
системе некоторый запас прочности. Но в повседневной
практике исследователи приходили к выводу, что проще
создавать особые анализаторы, предназначенные для
специальных целей и построенные по типу ELI, которые
являются менее громоздкими и более удобными при
пользовании. Например, программа POLITICS Карбонелля
(Carbonell, 1979) — модель субъективного понимания
политических событий — использует анализатор, сходный с ELI,
но построенный самим Карбонеллем.
Может быть, самый важный итог работы Карбонелля
состоит в том, что она выявила для всех нас основную
ошибку, характерную для наших рассуждений о
построении больших понимающих систем. Мы всегда склонялись к
принципу модульности в проектировании наших программ
как потому, что это всегда рассматривалось как хороший
стиль в программировании, так и потому, что, поскольку
наши системы являются очень большими, каждый отдельный
модуль часто составлял тему работы отдельного человека.
404
Однако эта модульность явилась причиной целого ряда
трудностей. При таком подходе система, которую мы
строим, должна, например, в идеале, использовать ELI на
первом этапе анализа (в качестве "приставки"). Но на практике
ELI оказывается очень большой и громоздкой программой.
Далее, возникает еще одна практическая проблема, а
именно: словарь для любой новой области, в которой должна
работать создаваемая система, является, скорее всего,
новым для ELL Поскольку в ELI определения слов
являются в известном смысле сами программами, всякая новая
система в любом случае потребует написания большой
части соответствующей анализирующей программы с самого
начала. Эта практическая проблема приводит, далее, к
гораздо более интересному вопросу. Подобно тому как
несколько лет назад мы осознали, что для построения более
интегрированной анализирующей системы важно
воспользоваться силой имевшихся у нас представлений КЗ, точно
так же любой новый анализатор, разрабатываемый для
новой системы, должен в принципе пользоваться
результатами, полученными на более высоких уровнях понимания,
которые являются частью новой системы. Так, система
POLITICS может проводить анализ более эффективно, если
она использует не только частично построенное
представление КЗ для того фрагмента текста, который она уже
поняла, но также и его место в идеологии, которую
использует эта программа, его общую значимость и т. д. С этой
точки зрения модульность оказывается весьма серьезным
недостатком. Почему не извлекать выгоду из всего, что
имеется в нашем распоряжении и может помочь в процессе
анализа? Тот факт, что для осуществления анализа люди
используют только синтаксис и некоторые конкретные
семантические признаки (именно эти, а не другие),
является не более вероятным, чем то, что они используют только
чистый синтаксис. Понимание является в полном смысле
этого слова интегральным процессом. Приверженность
принципу построения модульных систем помешала
прогрессу в автоматизации анализа, потому что эта задача требует
использования наших знаний в полном объеме; это,
очевидно, необходимо и для разрешения неоднозначности
предложения, и для выявления подходящих смыслов слова, и,
что не менее важно (как мы увидим ниже в этой статье),
для принятия решений о том, что в тексте следует
игнорировать.
405
Необходимо уточнить, что мы имеем в виду, когда
объявляем модульность помехой в развитии систем анализа.
Ясно, что с точки зрения программирования наши
анализаторы должны иметь модульный характер. Однако, если
на поверку оказывается, что модули тратят все свое время
на коммуникацию друг с другом, то данная конкретная
схема модульной организации должна вызывать
подозрения — в реальной действительности модули образуют
интегральное единство. Поскольку коммуникация модулей
друг с другом, как правило, весьма трудна, наблюдается
стремление избегать ее вообще. Это может привести к
проектированию таких процедур, которые по замыслу
должны взаимодействовать друг с другом, а на практике
становятся все более и более изолированными друг от друга.
Именно это и произошло со стратегией модульной
организации систем, которую мы описали выше.
2. В ТЕКСТЕ НЕ ВСЕ ЗАСЛУЖИВАЕТ ВНИМАНИЯ
Один из главных недостатков системы SAM, а также
ELI (являющейся частью SAM) состоит в неспособности
обрабатывать тексты, к восприятию которых она не
подготовлена. Новая словарная единица, новая область дискурса
или ранее не встречавшаяся синтаксическая конструкция
часто приводили систему в полное смятение. Одним из
видов результатов, выдававшихся системой SAM, было
резюме (summary) прочитанного. Нам казалось, что мы могли
получать в общем такой же результат с помощью гораздо
более надежной и значительно более быстрой программы
FRUMP (Dejong, 1977). FRUMP не анализирует каждое
слово каждого рассказа, поступающего на вход. Напротив,
она воплощает в себе некоторую теорию беглого чтения
(skimming), которая направляет ее в процессе чтения.
FRUMP выделяет то, что представляет для нее интерес,—
обычно это единицы информации, которые она хочет
включить в свое резюме, относящееся к любой конкретной
области, о которой она имеет знания. Таким образом, FRUMP
в высшей степени ориентирована на анализ типа "сверху
вниз", по этой причине она не может рассматриваться как
простая замена системы SAM. Программа SAM могла в
принципе реагировать на входные тексты, к которым она
не была подготовлена, хотя на практике такое случалось
совсем не часто! FRUMP не может реагировать на те аспек-
406
ты рассказов, к которым она не подготовлена, но это не
означает, что она вообще не в состоянии обрабатывать
такие рассказы.
Для целей настоящей статьи, однако, в системе FRUMP
особенно интересным является то, что она представляет
собой пример работающей, надежной, интегральной (то
есть не модульной) системы. Анализатор системы FRUMP,
в сущности, неотделим от блока логического вывода (infe-
rencer). Причина этого проста. FRUMP знает, что ей
необходимо найти в рассказе. Она располагает правилами,
определяющими, как находить в тексте нужные вещи;
это могут быть как правила вывода умозаключений, так и
правила анализа. Но такие правила являются в
действительности только нижним уровнем манифестации решений
более высокого уровня, принятых на основе многих
соображений, из которых лишь часть связана с процессом
анализа. FRUMP работает хорошо, потому что ее интересы
непосредственно управляют процессом поиска. Она может
игнорировать то, что ее не интересует, и сосредоточивать
свое внимание на том, что ей нужно узнать.
Давайте посмотрим, как нормальный грамотный
взрослый человек читает рассказ, например газетную заметку.
Мы и раньше серьезно задумывались над вопросом о том,
читает ли человек (при обычном нормальном процессе
чтения) детально, как SAM, или бегло, как FRUMP. И хотя
мы не имеем твердых доказательств в пользу одного или
другого из этих способов, нам представляется, что человек
больше похож на FRUMP, чем мы раньше думали. Если
это так, то отсюда следуют важные выводы о том, как в
действительности должен выглядеть анализатор. Мы не
утверждаем, что анализатор системы FRUMP является
адекватным. Очевидно, что нет, поскольку он пропускает важные
аспекты многих рассказов. С другой стороны, некоторая
комбинация типа анализа, принятого в системе FRUMP,
с типом анализа, принятым в ELI, могла бы способствовать
созданию очень мощной и надежной системы для понимания
текстов на естественном языке.
3. ВРЕМЯ ОБРАБОТКИ В ХОДЕ АНАЛИЗА
Одним из главных факторов, которые необходимо
учитывать, на наш взгляд, при рассмотрении устройства
анализатора, является скорость, с которой люди могут читать
407
текст. Если учесть вывод умозаключений, а также
обращение к фоновому знанию и другие проблемы, с которыми
человеку приходится иметь дело в ходе чтения или
слушания предложения, то следует заключить, что люди решают
задачу понимания очень быстро. Они заканчивают
понимание большей частью в тот момент, когда перестает звучать
то предложение, которое они слушают. Отсюда следует,
что время, которым они располагают для вывода
умозаключений и применения знаний, не может растягиваться до
конца предложения и продолжаться после того, как
закончится анализ. Наоборот, такие дополнительные процессы
должны осуществляться в то же самое время, когда
осуществляется анализ. Это подтверждается психологическими
данными; см., например, работу Marslen — Wilson,
1975. В указанной работе исследуются ошибки в
повторении предложений и показывается, что на протяжении всего
времени чтения предложения должна происходить
обработка информации на высших уровнях. Такое заключение,
несомненно, придает гораздо больший вес той гипотезе,
которую мы сформулировали выше. Из нее следует, что
процессы, происходящие у человека, носят в высокой
степени интегральный характер. Иначе говоря, люди должны
выводить умозаключения из ранних частей предложения
до того, как они услышат его последующие части. Если
это так, то отсюда также следует, что люди будут
использовать все, что им удастся обнаружить; тем самым проблемы
установления смысла слов и другие оказываются под
влиянием процессов высших уровней. Таким образом, с точки
зрения моделирования процессов обработки информации
человеком, проекты анализаторов, которые сначала
полностью осуществляют свою работу, а затем отсылают свои
результаты в блоки логического вывода, не имеют смысла.
Из сказанного вытекает также и еще одно следствие.
Мы должны задаться вопросом: когда происходит этот тип
обработки, не направленной непосредственно на анализ?
Существуют два возможных ответа. Либо люди используют
параллельные процессы, и все это происходит буквально в
одно и то же время, либо (если обработка является
последовательной) для указанного типа обработки должно быть
сэкономлено время за счет чего-то другого. Этим "чем-то
другим" является, вероятно, полная обработка каждого
воспринимаемого слова. Иначе говоря, с точки зрения
последовательной (serial) организации обработки, не все слова
408
равноценны. Одним словам выделяется много времени на
обработку (тем словам, которые имеют, например, большую
синтаксическую, семантическую и логическую значимость),
а другие будут едва замечены.
Вопрос о том, какое объяснение правильнее
(последовательное или параллельное), сегодня нами решен быть не
может. Однако, даже при частичном использовании
параллельной обработки, кажется правдоподобным, что общий
объем обработки, требующейся в каждый данный момент
процесса понимания, имеет некоторые минимальные
границы и что скорость ввода часто нарушает эти границы.
Таким образом, мы снова приходим к необходимости
обрабатывать одни слова за счет других.
Итак, последовательная организация обработки
предполагает такую модель анализа, при которой он
осуществляется местами неполно. Как мы указывали в другой работе
(Schank, 1975), процесс осуществления полного анализа
чрезвычайно сложен. Несколько упрощая, можно сказать,
что прочтение слова занимает п миллисекунд, а полная
обработка слова — m миллисекунд. Поскольку весьма
вероятно, что в случае обычной речи и чтения m намного больше,
чем п, и поскольку при обычной речи и чтении слова
поступают в виде непрерывного потока, то очевидно, что люди
не в состоянии полностью обрабатывать каждое слово,
которое они слышат. Более вероятной представляется
такая организация этих процессов, при которой они решают,
на что в ходе анализа обратить серьезное внимание, а к
чему отнестись небрежно. Такие решения можно объяснить
многими факторами. Один из наиболее очевидных — это
интерес. Иначе говоря, люди склонны обращать внимание
на то, что им интересно (именно этому посвящая отведенное
на обработку время). Мы обсуждали понятие интереса и
его разновидности применительно к проблеме вывода
умозаключений (Schank, 1978). Главный наш постулат
состоял в том, что вывод умозаключений управляется
интересом. Вероятно, аналогичный постулат справедлив
и по отношению к излагаемой пересмотренной концепции
процесса анализа, потому что теперь мы рассматриваем
весь процесс понимания как интегральный феномен.
Рассмотрим следующее предложение:
A small twin engine airplane carrying federal marshals
and a convicted murderer who was being transported to Lea-
409
Venworth crashed during an emergency landing at O'Hare
Airport yesterday.
'Маленький двухмоторный самолет, на борту которого
находились федеральные судебные исполнители и
осужденный убийца, который транспортировался в Ливенуорт,
потерпел вчера аварию при вынужденной посадке в
аэропорту О'Хэр.'.
Интуитивно ясно, что некоторые части этого
предложения более интересны, чем другие. Более того, согласно
высказанным выше соображениям о количестве времени
обработки, которым мы располагаем, чрезвычайно
существенно, что обработка некоторых слов должна занимать
меньше времени, чем время, требуемое для того, чтобы
прочитать или услышать их. Правда, на первый взгляд это
может показаться несколько странным. Каким образом
слово может обрабатываться за меньший промежуток
времени, чем то время, которое требуется, чтобы прочитать
или услышать его, если само прочтение или восприятие его
на слух является частью этой обработки? Тем не менее мы
находимся именно в такой парадоксальной ситуации,
если, конечно, мы придерживаемся того взгляда, что
обработка любого отдельного слова в предложении может
потребовать больше времени, чем нужно для его
прочтения или восприятия на слух; при этом обработка
предложения в целом занимает не больше времени, чем требуется
для восприятия его на слух, и к тому же разные слова
поступают с такой скоростью, что между ними нет временных
интервалов, которые могли бы использоваться для
обработки. (Дело обстоит, очевидно, именно таким образом, ибо
простое нахождение словесных границ в предложении
является очень сложной задачей, потому что речевой поток
непрерывен.)
Поскольку количество времени обработки, которым
располагает человек, ограничено скоростью потока,
поступающего на вход (в случае устной речи — непрерывного),
то некоторые из слов, вероятно, не обрабатываются совсем
(или, во всяком случае, они обрабатываются настолько
частично, что человек едва успевает их увидеть или услышать).
Ввиду того что самые важные слова часто идут в конце
синтаксической группы (phrase), все предшествующие слова
могут фактически игнорироваться до тех пор, пока их не
"соберут вместе" справа налево. Далее, обработка по прин-
410
ципу "сверху вниз" помогает человеку определить, что
следует игнорировать. Согласно этой схеме, слова хранятся
в буферном устройстве и фактически игнорируются до тех
пор, пока не будет найдено слово, которое инициирует
обработку. Когда такое слово обнаруживается, слова в
буферном устройстве собираются вместе и их анализ завершается.
Слова, которые инициируют обработку, появляются обычно
в конце синтаксических групп или ритмических групп
(breath groups).
Значит, чтобы провести обработку именной группы,
такой, например, как a small twin engine airplane
'маленький двухмоторный самолет', мы должны предположить,
что процессор фактически игнорирует все слова до слова
airplane, просто отмечая их наличие в оперативной
памяти (для возможного поиска после того, как будет
найдено ядерное существительное). Как только мы узнаем,
что airplane — субъект предложения, могут быть
выдвинуты определенные ожидания, которые позволят нам лучше
представить себе, что следует искать (и, таким образом,
что игнорировать). Например, значение слова carrying
'перевозивший' может фактически игнорироваться, потому
что, когда мы еще только начинаем понимать, что это за
слово, мы уже слышим нечто о судебных исполнителях и
об убийце и решаем уделить внимание этим единицам.
Суть дела здесь заключается в том, что в
действительности мы не воспринимаем в предложении каждое слово:
по мере того как поступает непрерывный речевой поток,
мы выбираем то, что находим интересным, возвращаясь
назад, чтобы выявить те отношения, которые связывают
воедино интересующие нас элементы, и фактически
игнорируем все остальное. Разве нам важно, что в
предложении был употреблен глагол carrying 'перевозивший', а
не глагол containing 'содержавший', или что в нем
использована конструкция, отличная от конструкции in which
they were flying 'в котором они летели'? Мы уже
осуществили предсказание, в соответствии с которым отношение
между людьми и самолетом — это отношение "нахождения
внутри", потому что именно это отношение является
наиболее обычным. Мы должны только подтвердить тот факт,
что этому предсказанию ничто не противоречит, а такое
подтверждение может быть получено на том основании, что
мы имеем дело с ситуацией полета. В свете этой теории
нас не должен удивлять тот факт, что люди, понимающие
411
текст, зачастую не могут вспомнить те реальные слова,
которые они читают. Ведь они, быть может, в
действительности и не прочитывали их совсем!
Следовательно, теория частичного анализа гласит, что
большинство слов едва замечается нами, до тех пор пока не
возникнет какая-то причина, которая заставит нас обратить
на них внимание. Главная проблема нашей теории состоит,
следовательно, в том, как мы узнаём, каким словам мы
должны уделить внимание, чтобы начать их серьезную
обработку.
Если в процессе нормального понимания речи
некоторые элементы языка пропускаются вовсе или
обрабатываются лишь в слабой степени, то может возникнуть вопрос,
почему они вообще присутствуют в речи. Почему автор не
опускает их? Ответ сводится к тому, что один и тот же
рассказ может пониматься разными читателями с разной
степенью полноты. Читатель, обращающий внимание на
каждую деталь повествования, имеет возможность выявить
нюансы, обычно пропускаемые читателем, который, как
в описываемом нами случае, удовольствуется частичным
пониманием.
На наш взгляд, имея дело с такими средствами
информации, как газеты, люди не осуществляют детальной
обработки, но все же в состоянии извлечь огромное большинство
сведений, интересующих их. Это тот самый тип обработки,
который мы и пытаемся моделировать в рамках нашей
концепции. Мы отнюдь не заявляем, что она представляет
единственный уровень обработки, которым человек может
пользоваться, но полагаем, что этот уровень является очень
важным и широко используемым уровнем понимания.
(В этом месте стоит сделать одно попутное замечание.
В течение ряда лет мы говорим о том, что ожидания
управляют различными частями процесса понимания (например,
Riesbeck, 1975; Cullingford, 1978).
Разграничение, проводимое нами здесь, сводится к
противопоставлению обработки, управляемой ожиданиями, и
обработки, управляемой интересом. Очевидно, наиболее мощные
и важные механизмы, находящиеся в распоряжении
понимающего, управляются одновременно и ожиданиями, и
интересом.)
Причины полной обработки данного слова могут
относиться к любому уровню системы. Укажем некоторые из
них:
412
Ожидания на уровне анализатора. Если анализатор
ожидает появления слова определенного типа, то
удовлетворение этого ожидания может оказаться чрезвычайно
важной силой в работе анализатора. Так, например, анализатор
может функционировать лучше всего при том условии, что
он будет ожидать появления тех или иных синтаксических
или концептуальных типов с такой степенью
определенности, что будет игнорировать все остальное (до тех пор, пока
они не будут найдены). Здесь мы опять сталкиваемся с
нарушением идеи анализа слева направо, потому что
анализатор не может заинтересоваться данным элементом, пока
он до него не дошел, не проигнорировал его, а затем увидел
единицу, приведшую к активизации ожиданий, которые
могут быть удовлетворены только посредством возвращения
назад.
Синтаксис. Главное существительное в некоторой
временной группе может заставить процессор заняться
выявлением всех соответствующих определений, в которых
возникла необходимость или которые вызвали к себе
интерес. Определенные функциональные слова могут
переключить центр внимания на те знаменательные слова, ценность
которых с точки зрения интересов читателя установлена с
большой степенью вероятности. Так, предлог to будет
замечен лишь в той мере, в какой он может привлечь внимание
к последующему существительному, если уже стало ясно,
что указание на направление движения ожидается
читающим и представляет для него определенный интерес.
Ценность с точки зрения интереса. Как анализатор
решает, что он хочет анализировать? Очевидно, мы нуждаемся
в полной интегральной системе, в которой анализатор и
память общаются в процессе анализа предложения. Без
такой интеграции не было бы убедительной основы для того,
чтобы замечать одни вещи и не замечать другие.
Информирование анализатора о том, на что следует обращать
внимание, входит в функции эпизодической памяти и компонента,
отражающего знания о мире. Указания на ценность с точки
зрения интереса хранятся в памяти как часть знаний,
ассоциированных с понятиями. Некоторые понятия являются
почти всегда интересными, другие интересны в
определенных обстоятельствах. Но самое важное состоит в том, что
определенные вещи представляют интерес в свете того, что
им предшествовало в тексте, то есть "интересность" явля-
413
ется динамическим свойством. Так, можно ожидать, что
объект убийства будет представлять больший интерес,
если убийство произошло в посольстве, а не в
каком-нибудь, вообще говоря, менее интересном месте типа бара.
(Но, конечно, могут быть построены и такие контексты, где
бары будут играть очень важную роль. Именно поэтому
необходимо иметь динамическую память, а не просто
словарь.)
Ожидания, связанные с высшим уровнем. Если мы читаем
текст о событии, которое подходит какой-то структуре
высшего уровня организации знания (типа сценария или
плана), то предсказания, вытекающие из этого сценария или
плана, могут направлять фокус интереса в процессе
обработки предложения. Так, мы можем знать, что жертва
убийства и отождествление убийцы имеют решающее значение
при чтении рассказа об убийстве, и таким образом можем
считать, что предсказания типа "сверху вниз" в ходе
анализа текста будут ставить эти единицы в центр внимания
(фокус интереса).
Чтобы увидеть, как все это используется, рассмотрим
схему предложения "X went to visit Y". Система
обращается к памяти, чтобы определить, следует ли считать X
интересным, поскольку он является главным
существительным и обладает признаком лица. Если никакой
информации не найдено, обработка должна происходить быстрее,
чем в том случае, когда информация обнаружена. Так, если
X есть John или Sam, то дальше мы идем быстро. Если бы
Х-ом был Henry Kissinger Тенри Киссинджер* или your
mother'твоя мать', то мы, вероятно, стали бы продвигаться
дальше более медленно, потому что было бы
активизировано больше ожиданий об их поведении, которые
представляют интерес.
Went является единицей, которая побуждает нас
продолжать обработку, поскольку она не имеет никакого
конкретного значения в изоляции. (То есть мы могли бы иметь went
crazy 'сошел с ума', went fishing 'пошел рыбачить', went to
Boston 'поехал в Бостон'; мы не можем ничего понять,
пока не увидим последующих слов. Теория здесь проста:
"Зачем вообще размышлять? Просто иди дальше".) Visit—
слово, которое вызывает сценарий ($VISIT), если объектом
визита является человек, равный по положению, или член
семьи. Но это же слово может вызвать и. другие сценарии,
414
отличные от сценария $VÎSIT. Если бы объектом глагола
visit являлся, например, музей или Конгресс, мы получили
бы совершенно . другие сценарии или даже не получили
бы вообще никакого сценария. (Какой сценарий может
вызвать выражение went to visit a mortuary 'пошли
навестить морг'?) Очевидно, суть дела здесь в том, что visit
также почти полностью игнорируется, поскольку оно
значит здесь очень мало. Его действительное
предназначение состоит в том, чтобы остановить наше внимание на
объекте, который следует за ним. Иначе говоря, мы
действительно начинаем обработку этого предложения на
достаточно глубоком уровне лишь после того, как узнаём, что
из себя представляет Y. Тогда, если Y отвечает
определенным критериям, мы вызываем сценарий $VISIT. Если Y —
представитель противоположного пола, то мы имеем дело
с неоднозначностью предложения с точки зрения сценариев
(и, следовательно, с точки зрения его обработки). В этом
случае применимым может оказаться либо сценарий $VISIT
либо сценарий ^ROMANCE 'любовная история', и мы
должны будем затем вычислить, какой из них нам подходит.
Заметим, что, хотя большинство приведенных
примеров, а также тех, которые будут приводиться ниже,
опирается при описании событий на сценарии, это не означает,
что предлагаемые принципы обработки текста не могут
быть применены к рассказам, которые удобнее
представлять с помощью других структур знания, например
планов и целей (Schank and Abelson, 1977;
Wilensky, 1978). На самом деле, мы считаем, что эти принципы
будут применимы, вообще говоря, ко всему, что может быть
представлено в памяти. Сценарии играют важную роль в
наших ранних разработках по созданию анализаторов,
потому что мы занимались такой областью (заметки в
газетах), которая характеризуется наличием
многочисленных стереотипных ситуаций. Однако мы надеемся
расширить рамки этой работы и научиться анализировать
рассказы, требующие иных типов представления.
4. ПРИМЕР
Ниже приведено предложение, взятое из заметки с
первой страницы газеты "Нью-Йорк Тайме":
An Arabie speaking gunman shot his way into the
Iraqi Embassy here (Paris) yesterday morning, held
415
hostages through most of the day before surrendering
to French policemen and then was shot by Iraqi security
officials as he was led away by the French officers.
'Вчера утром здесь (в Париже) вооруженный
человек, говорящий по-арабски, стреляя на ходу,
ворвался в иракское посольство, захватил заложников и
держал их большую часть дня, а затем сдался
французским полицейским, позднее он был застрелен
сотрудниками иракской службы безопасности в то время,
когда его уводили французские офицеры.'
Рассмотрим теперь это предложение слово за словом и
попытаемся определить желаемый вид обработки в рамках
интегральной схемы понимания. Программа, которую мы
опишем ниже, осуществляет именно такую обработку.
Модель будет пропускать неинтересные части и строить свое
представление, когда это необходимо, стараясь
заканчивать полную обработку каждой подчасти без отставаний.
Иными словами, мы хотим, чтобы предлагаемая нами
модель заканчивала обработку, лишь слегка запаздывая
по отношению к моменту, когда была получена входная
информация,— точно так же, как действует человек.
Отметим здесь один важный момент: хотя мы и будем
обсуждать анализ этого предложения, следуя слово за
словом слева направо, мы не должны думать, что и в
действительности человек понимает текст по принципу "не
более одного слова одновременно4'. На деле слова
поступают целыми группами, как при визуальном (чтение),
так и при слуховом (устная речь) восприятии. Поэтому
мы тоже можем производить обработку по тому же
принципу. Так, например, для любого рассматриваемого слова
мы всегда знаем следующее за ним слово. Такое допущение
может упростить решение проблемы снятия
неоднозначности.
****************
An Arabic speaking gunman...
'Вооруженный человек, говорящий по-арабски...'
*************************
AN (неопределенный артикль) — это слово, которое
сначала нужно только сохранить, чтобы не забыть. Это
значит, что система смотрит его в словаре и находит там
416
указание перейти к следующему слову, поместив AN в
какой-то отсек оперативной памяти (ОП) с тем, чтобы
вернуться к нему позднее.
ARABIC 'арабский' подается в словаре как слово,
которое может быть пропущено, если ему предшествовало
другое пропускаемое слово, поэтому наша модель
пропускает его и помещает в ОП." (То, что слово ARABIC
может быть пропущено, было определено еще при
разработке модели и записано в словаре. Сами же критерии
определения того, что может пропускаться, составляют
одну из интересных актуальных проблем при
моделировании языковой способности человека. (Обсуждение этих
вопросов можно найти в Schank and Selfridge,
1977). Обычно прилагательные (правда, не все) могут
пропускаться. Слово Russian 'русский', например, не
может быть пропущено, потому что оно может обозначать
деятеля. Не могут пропускаться и прилагательные,
отмеченные как представляющие определенный интерес,
например disgusting 'отвратительный', murderous
'кровавый', lecherous 'распутный' и т. д.)
SPEAKING 'говорящий' также может быть пропущено,
пока не встретилось потенциальных деятелей. Поиск
обозначений ДЕЯТЕЛЕЙ в ОП приводит к отрицательному
результату. Поэтому данное слово также пропускается.
GUNMAN 'вооруженный человек' снабжено признаками
ACTOR 'деятель', NOUN 'существительное' и HIGH
INTEREST ACTOR 'деятель, представляющий большой
интерес'. Тот факт, что у нас появилось слово с признаком
HIGH INTEREST, заставляет нас построить запросы
типа "сверху вниз", связанные с выяснением определенной
информации; в частности, теперь мы хотим получить
ответы на следующие вопросы:
КТО он? — Заставляет нас собрать вместе накопленные
прилагательные (например, ARABIC) и приписать их к
элементу памяти, обозначающему данного человека
(GUNMAN).
ЧТО он сделал? — Ответом на этот вопрос служит
единица, которую мы находим в памяти при элементе
GUNMAN, а именно — SHOOT 'стрелять'. Таким образом,
еще до того как в систему поступит продолжение текста,
выводится умозаключение, что упомянутый вооруженный
человек стрелял или будет в кого-либо стрелять.
И № 534
417
В КОГО он стрелял? — Вопрос заставляет
поинтересоваться синтаксическим объектом глагола, которым, по,
нашему допущению, является SHOOT.
ПОЧЕМУ он стрелял? — Заставляет нас искать
причину.
ГДЕ это случилось? — Заставляет нас искать
местонахождение.
КАКИЕ СЦЕНАРИИ могут быть вызваны? — Само
слово GUNMAN может послужить причиной вызова того
или иного сценария. Наиболее вероятен вызов сценариев
$ROBBERY 'ограбление', $TERRORISM 'терроризм' и
$KIDNAP 'похищение'. Теперь мы можем заняться
поиском подтверждений в остальной части предложения.
Вопросы, сформулированные выше (в виде запросов;
см. Riesbeck, 1975), будут теперь управлять анализом
остальной части этого предложения. Здесь важно указать
на то обстоятельство, что посредством этих запросов на
самом деле осуществляется управление не просто разбором
предложения, а процессом гораздо более сложного порядка.
Эти вопросы затрагивают информацию, которая интересна
для нас в более широком плане понимания. Мы
осуществляем фактически целостный процесс понимания этого
рассказа. Запросы в равной степени затрагивают факторы,
существенные и для собственно анализа, и для вывода
умозаключений, и для применения сценариев, и для целе-
полагания.
******************
shot his way into the Iraqi Embassy...
'стреляя на ходу, ворвался в иракское посольство..."
*** ********************^***
SHOT 'стреляя' сразу же признается тем словом,
которое удовлетворяет ожиданию, вытекающему из информации,
приписанной слову GUNMAN. Именно путем
удовлетворения подобных ожиданий строятся концептуальные
структуры, и в данном случае мы строим первую такую
структуру — представление для действия SHOOT. При этом
позиция деятеля заполняется элементом, обозначающим
упомянутого вооруженного человека, а позиция направления
стрельбы остается незаполненной. Эта незаполненная
позиция маркируется так же, как позиция, удовлетворяющая
418
ответу на вопрос типа "КТО . . .?" (см. выше), и теперь
анализатор "заинтересован" в том, чтобы найти ответ на
указанный вопрос,* связанный с концептуальной структурой
SHOOT; с этой целью система ищет следующее главное
существительное в последующей именной группе.
HIS 'его', 'свой' пропускается и хранится в ОП.
WAY 'путь' не удовлетворяет ожиданию, связанному
с заполнением пустой позиции. Слово WAY фиксируется,
с одной стороны, как пропускаемое слово, а с другой, как
указание на направление или местоположение. В этот
момент создается запрос, связанный с поиском этого
местоположения, и мы предпринимаем попытку пропускать
последующие слова до тех пор, пока не найдем обозначение
искомого места.
INTO 'в (вовнутрь)' подано в словаре как
пропускаемое слово.
THE (определенный артикль) записывается в ОП и
пропускается.
IRAQI 'иракский' записывается в ОП и пропускается.
EMBASSY 'посольство' оказывается обозначением
места и фиксируется как местоположение события SHOOT.
Более того, EMBASSY помечается как слово,
представляющее интерес, и как обозначение места, важного в
политическом отношении. Последняя информация
удовлетворяет условиям запроса, вызывающего сценарий
$TERRORISM, предсказанного нами (среди прочих) на основе
анализа слова GUNMAN. Коль скоро EMBASSY
представляет интерес, активизируются его запросы. Один из
них направлен на поиск страны, которую представляет
данное посольство. В результате из ОП извлекается слово
IRAQI, которое удовлетворяет указанному запросу.
Фиксация сценария $TERRORISM приводит к тому,
что мы перестаем интересоваться представлением
предложения как такового и сосредоточиваем свое внимание на
формулировании и удовлетворении запросов, вытекающих
из этого сценария и необходимых для представления
рассказа в целом. Итак, теперь мы пытаемся найти ответы на
следующие запросы:
Были ли взяты ЗАЛОЖНИКИ?
Какие были предъявлены требования? (Деньги?
Освобождение политических заключенных?)
Был ли причинен какой-либо ущерб?
14*
419
Какие меры были предприняты против террориста?
(Ответный огонь? Арест? Освобождение заложников?)
************
here yesterday morning...
'здесь вчера утром...'
***********
HERE 'здесь' в рамках сообщения о новостях всегда
обозначает то место, которое указано в газетной строке,
содержащей дату сообщения. Запись этой локализации
добавляется к представлению рассказа.
YESTERDAY 'вчера' оказывается обозначением
времени и поэтому записывается в позицию времени в
структуре данного события.
MORNING 'утро' тоже обрабатывается указанным
способом.
held hostages through most of the day...
'задерживал заложников большую часть дня...'
HELD 'задерживал' пропускается, потому что оно не
соответствует ни одному из запросов. Такого соответствия
нет по той причине, что информация о слове HELD,
имеющаяся в обозреваемой части словаря, сводится лишь к
тому, что это — глагол. Поскольку появление глаголов
не предсказывалось, мы пропускаем это слово. Можно,
конечно, представить себе случай, когда при этом слове
стояла бы помета о его интересности. Заметим, что HELD —
чрезвычайно многозначное слово; раньше мы, может быть,
и стали бы выводить многочисленные предсказания из
него, а потом искать подтверждения того, какое из
значений имелось в виду. При интегральной понимающей
системе у нас нет необходимости это делать. Причина
этого вскрывается при рассмотрении хода последующей
обработки данной группы.
HOSTAGES 'заложники' прямо отвечает одному из
имеющихся запросов. Вызывается соответствующая сцена
из сценария ^TERRORISM, а именно сцена ВЗЯТИЕ
ЗАЛОЖНИКОВ. В этот момент производится проверка
хранящегося в ОП глагола с целью удостовериться в
правильности принятого решения. Если бы, например, в ОП
420
хранился глагол shot 'застрелил', то этот вызов не должен
был бы срабатывать. Глагол HELD оказывается в точности
таким словом, которое вполне согласуется с вызываемой
сценой. Важный момент состоит здесь в том, что значение
глагола HELD и не должно было определяться в
изолированном виде, что представляется удачным решением,
потому что слова типа HELD в действительности не имеют
какого-либо конкретного значения. Значение этого глагола
вытекает из его связи с HOSTAGES, а слово HOSTAGES
понимается посредством сценария $TERRORISM. Таким
образом, принцип интегрального понимания плюс анализ
типа "пропускать и сохранять" в огромной степени
облегчает обработку текста.
THROUGH 'через; в течение' подается в словаре как
указание либо на время, либо на место, поэтому
формируется запрос на поиск соответствующего слова. Однако
на данный момент наша система знает, что именно ее
интересует. В частности, очень важно продолжить поиск
ответов на неудовлетворенные запросы, имея в виду
особенно то, что они связаны с понятием смерти (см. Schank,
1978). Поэтому мы фактически игнорируем остальную часть
группы как не представляющую интереса.
MOST 'большая часть' записывается в ОП и
пропускается.
OF (предлог) пропускается.
THE записывается в ОП и пропускается.
DAY 'день' опознается и игнорируется. Вместе с тем
это слово отвечает запросу низшего уровня по поводу
указания времени, и данная информация добавляется к
нашим знаниям о времени; она может быть использована
позднее, если у нас когда-нибудь возникнет интерес к
тому, что мы сейчас сочли неинтересным.
before surrendering to French policemen...
'перед тем как сдаться французским полицейским...'
BEFORE 4перед' —это слово, связанное с
упорядочением во времени; оно подготавливает нас к фиксации
нового события и уточняет его время относительно ранее
упомянутого события.
421
SURRENDERING 'сдача' — слово, которое
маркировано признаком высокой степени интереса и одновременно
охарактеризовано как составная часть нескольких
сценариев, включая $TERRORISM. В рамках этого сценария
вызывается сцена сдачи властям (в плен) и
формулируются запросы, касающиеся причин этого действия, его
контрагентов и т. д. Определенные слова считаются
указателями этих ролей. Так, because 'потому что' выделяет
причины, a to (предлог с дативным значением) выделяет
контрагентов.
ТО говорит нам, что далее следуют контрагенты (люди,
взявшие в плен).
FRENCH французский' откладывается в ОП.
POLICEMEN 'полицейские' помечено как
существительное, которое может быть ДЕЯТЕЛЕМ, поэтому
система обращается к ОП, чтобы собрать относящиеся к
нему компоненты. Это слово может обозначать также
контрагента в сцене сдачи властям, так что оно удовлетворяет
двум имеющимся запросам.
and then was shot by Iraqi security officials...
'и затем был застрелен сотрудниками иракской службы
безопасности...'
***************************
AND 'и' говорит о том, что кончилось одно событие и,
вероятно, начинается другое событие.
THEN 'затем' дает указание о времени данного
события.
WAS 'был' указывает на то, что деятель, записанный в
ОП, является концептуальным объектом .нового события.
Поэтому формируются запросы о соответствующем деятеле
и действии.
SHOT 'застрелен' оказывается словом, представляющим
интерес, и обрабатывается так же, как GUNMAN, за
исключением того, что мы не будем в этом случае искать
некоторые элементы, характерные именно для
существительного GUNMAN. В результате мы получаем:
В КОГО они стреляли? — ARAB GUNMAN 'в
вооруженного араба'.
422
КТО СТРЕЛЯЛ? — Ответа нет.
ПОЧЕМУ стреляли? — Ответа нет.
ГДЕ это случилось? — Уже известно.
КАКИЕ СЦЕНАРИИ вызываются? — Глагол SHOOT
'стрелять' может вызвать какой-либо сценарий. Обычно
здесь могут рассматриваться три варианта: $ROBBERY
'ограбление', $TERRORISM 'терроризм' и $KIDNAP
'похищение'. Но мы имеем дело с контекстом, который
задается сценарием $TERRORISM. Другие из упомянутых
сценариев не могут быть нормальным продолжением
сценария ^TERRORISM. К такому выводу мы приходим
на основе обращения к планам и целям.
КАКОВЫ были РЕЗУЛЬТАТЫ этого действия? —
Строится запрос с целью определения результатов. Если
в тексте не удается найти элементов, удовлетворяющих
этому запросу, то делается умозаключение об обычных
результатах этого действия. В данном случае это смерть
объекта.
Так как слово SHOT оказывается интересным, мы
должны объяснить его. У нас нет для этого сценариев,
поэтому мы должны выяснить, кто мог захотеть убить
данного вооруженного человека и почему. Эти запросы
добавляются к массиву активизированных ранее запросов.
BY (предлог) говорит о том, что далее идет
обозначение деятеля.
IRAQI 'иракский' пропускается и записывается в ОП.
SECURITY 'безопасность', 'служба безопасности'
пропускается и записывается в ОП.
OFFICIALS 'сотрудники' используется для завершения
обработки данной именной группы. Это слово
удовлетворяет запросу о том, КТО стрелял, и раз мы теперь
располагаем знанием деятелей, то мы можем задаться вопросом
о том, почему они хотели убить ТЕРРОРИСТА. В данный
момент мы могли бы установить связь между IRAQI
SECURITY OFFICIALS и IRAQI EMBASSY, но это не
ведет к какому-либо объяснению. Это только заставляет
нас удивляться происшедшему. Мы пытаемся объяснить
данное событие, постулируя, например, темы типа МЕСТЬ
или ЗАСТАВИТЬ ЕГО МОЛЧАТЬ, но уверенности на
этот счет нет.
as he was led away by French officers.
423
'в то время, когда его уводили французские офицеры*.
В основном наш анализ закончен, так как больше нет
запросов, требующих немедленного удовлетворения. (Мы
узнаём это после того, как просмотрели абзац и не нашли
новых запросов.) Нас, однако, продолжают интересовать
цели каждого из деятелей, поэтому запросы типа ПОЧЕМУ
остаются активизированными.
AS 'в то время, когда' является показателем
одновременности. Поскольку у нас нет особого интереса к тому,
что происходило в то же самое время (если только это не
факты, интересные сами по себе), то мы можем теперь,
пропуская слова, искать действия и деятелей, которые
представляют интерес. AS может также обозначать
причинность, но в этом случае семантические предсказания,
сформированные ранее, сами осуществят поиск нужной
причины.
НЕ 'он' пропускается.
WAS 'был' пропускается.
LED 'уводимый' интереса не представляет, опознается
и затем пропускается.
AWAY 'прочь' пропускается.
BY (предлог) пропускается.
THE пропускается.
FRENCH 'французский' пропускается.
OFFICERS 'офицеры' пропускается, потому что нет
запросов, которые бы интересовались этим словом.
Конец абзаца говорит о том, что анализ закончен.
Окончательное представление для этого предложения таково:
$TERRORISM 'терроризм'
ACTOR 'деятель' — Arab gunman
PLACE 'место' —- Paris, Iraqi Embassy
SCENES 'сцены'
$HOSTAGES 'заложники' — some 'несколько'
$CAPTURE 'взятие в плен'
ACTOR — French policemen
OBJ ЕСТ — Arab gunman
PLACE — Paris, Iraqi Embassy
UNEXPECTED RESULT 'неожиданный, результат':
424
ACTOR — Iraqi officials
ACTION — SHOOT
OBJECT — Arab gunman
RESULT 'результат'
ACTOR — Arab gunman
STATE 'состояние' — dead 'мертвый'
5. ОБРАБОТКА ТЕКСТА
ПО ПРИНЦИПУ ИНТЕГРАЛЬНОГО ЧАСТИЧНОГО АНАЛИЗА
Мы разработали программу, которая реализует теорию
анализа, проиллюстрированную выше,— интегральный
частичный анализатор (an Integrated Partial Parser) — ИЧА.
В настоящем разделе мы рассмотрим, как работает этот
анализатор. Он нацелен на обработку ограниченного
класса текстов, а именно газетных заметок на тему о
терроризме и на смежные темы. Мы не пытались охватить
все проблемы, встающие при автоматизации анализа.
Основное внимание было сосредоточено на тех вопросах,
которые связаны с сущностью такого рода анализаторов.
Одна из известных проблем, которых мы не касались,—
это обработка многозначных слов. К счастью, в рамках
обрабатываемого нами класса рассказов большинство слов,
особенно интересных, имеет ровно одно предпочитаемое
значение. С помощью ИЧА было успешно обработано
более 200 текстов, взятых непосредственно из различных
газет. Многие из них были взяты наугад. В настоящее
время ИЧА располагает словарем объемом более 2000 слов.
Анализатор написан на LISP'e и эксплуатируется на
машине системы DEC 20/50.
Ограничения данной программы связаны со словарем
и знаниями о мире. Объем словаря в 2000 слов, типичный
для экспериментальных программ в области
искусственного интеллекта, все-таки несколько маловат, даже для
текстов о терроризме. В настоящее время мы расширяем
словарь. Программа ограничена также тем кругом
текстов, для понимания которых она располагает
соответствующими знаниями о мире. Мы брали только такие
заметки, которые основаны на сценариях, но, как
упоминалось выше, мы считаем, что общие методы ИЧА будут
применимы и к другим формам знания. Возможности ИЧА
425
могут быть усилены как путем добавления новой
информации сценарного типа, аналогичной уже имеющемуся
запасу знаний, так и путем учета ряда других типов
знания о мире.
Другое ограничение ИЧА состоит в том, что он
испытывает трудности при анализе текстов с тонкой
организацией повествования,— текстов, в которых не очень
прост переход к заключению. Но именно такой тип
текстов представляет трудности и для людей, особенно при
быстром чтении. Планируемое решение этой проблемы
сводится к тому, чтобы обеспечить возможность возврата
и чтения текста в более тщательной манере, чем это обычно
делает ИЧА.
Схема анализа, реализованная в ИЧА, основана на
классификации слов в словаре с точки зрения того, что
должен делать анализатор с каждым словом по мере его
прочитывания. Следовательно, такие категории, как
существительное, глагол и т. п., имеют смысл в анализаторе
лишь в том случае, если они приводят к разным типам
обработки.
Легко говорить, как мы это делали выше, что такое-то
слово надо пропустить или сохранить или что-нибудь в этом
роде. На практике же подобные решения мы должны
принять заранее. Таким образом, ключевые проблемы
реализации такого анализатора следующие: во-первых,
установление категорий для подачи слов в словаре, которые будут
полезны в данной модели; во-вторых, разработка процедуры
для определения того, к какой категории подходит каждое
данное слово. Как мы вскоре увидим, приписывание слова
к определенной категории может зависеть от предметной
области.
Возвращаясь к примеру в предыдущем разделе, мы
можем сказать, что с прочитываемым словом можно
поступать тремя способами. Слово может быть пропущено,
оно может быть записано в ОП и затем пропущено или оно
может сразу же быть подвергнуто полной обработке.
Первая возможность заключается в том, что его можно
просто пропустить. Существует много слов, которые с точки
зрения нормального чтения не имеют существенного
понятийного содержания. Если вспомнить текст, приведенный
в предыдущем разделе, то это будут слова: most * большая
часть', way 'путь', held * держал'.
Вторая возможность, которая следует из нашего при-
426
мера, заключается в том, что слово может быть записано
в ОП и затем пропущено. Слова, к которым следует
применять эту стратегию обработки, несут определенную
функциональную нагрузку или какое-то понятийное содержание,
но при этом могут считаться банальными и неинтересными.
Тем не менее мы не можем их просто игнорировать, потому
что их значения могут оказаться важными для
конкретизации наших знаний о событиях и предметах, которые
нас интересуют. Например, они могут использоваться
для заполнения ролей в концептуальных структурах,
представляющих интересные события. Они могут также
больше не использоваться в последующем анализе. В
соответствии с данной стратегией обрабатываются многие
слова в нашем примере. Примерами могут служить слова
Arabic, Iraqi и his, а также все артикли.
С такими словами система может поступать двумя
способами. Либо их значение помогает в конкретизации чего-
либо интересного (и в этом случае такое значение будет
включено в семантическое представление текста), либо
оно не помогает в решении этой задачи. Например, значение
слова French французский' в сочетании
(1) before surrendering to French policemen
'перед тем как сдаться французским полицейским'
включается в семантическое представление, потому что
нас интересует вопрос о том, кому сдался террорист, то
есть нас интересуют полицейские. С другой стороны,
значение слова French в сочетании
(2) as he was led away by the French officers
'в to время когда его уводили французские офицеры'
не включается в семантическое представление, потому что
в сферу нашего интереса слово officers не попадает.
Существуют слова, которые, помимо понятийных
характеристик, снабжены в словаре определенной
информацией о связанных с ними процедурах; она записана
в форме ожиданий, помогающих конкретизировать
значение таких слов. Объектами подобных ожиданий часто
являются слова, которые подлежат обработке в
соответствии со стратегией "записать и пропустить". Например,
вполне вероятно, что со словом embassy Посольство'
ассоциируется ожидание, направленное на поиск названия
страны, которую данное посольство представляет, а слова
427
policemen, officers и officials связаны с ожиданиями
названия правительственного учреждения, от имени которого
они действуют. Но если некоторое слово подлежит
обработке по стратегии "записать и пропустить", то эти
ожидания не должны пускаться в действие до тех пор, пока
мы не будем уверены в том, что понятие, связанное с
основным словом, действительно уточняет наши знания о
чем-то интересном. Если оказывается, что нас данное
понятие не интересует, то нет смысла осуществлять
ненужную обработку. Сравним обработку слова policemen в
сочетании (1) с обработкой слова officers в сочетании (2).
Поскольку выясняется, что понятие полиции в первом
случае расширяет наши знания об интересующем нас событии,
то представляется правдоподобным, что будет
реализовано ожидание, связанное с указанием на государство,
от имени которого действует полиция. Во втором случае,
поскольку понятие 'офицеры' не расширяет наши знания
о чем-либо интересном, то нет смысла применять здесь
подобное правило.
Третья возможная стратегия обработки слова
заключается в том, что оно немедленно и полностью
обрабатывается, то есть система обращает внимание на его значение
и на ожидания, им порождаемые. Именно эта стратегия
применяется ко всякому слову, обладающему существенным
и интересным понятийным содержанием. Эти понятия и
ожидания управляют всем ходом анализа. Примеры из
нашего рассказа включают слова gunman, shot и hostages.
Ожидания, порождаемые этими словами, могут включать
тот же тип простых конкретизирующих ожиданий (типа
заполнения позиций), которые ассоциируются с
некоторыми словами, подлежащими обработке по стратегии
"записать и пропустить". Например, вполне возможно, что
одно из ожиданий, порождаемых словом gunman, будет
направлено на поиск национальной или политической
принадлежности данного вооруженного человека.
Эти слова могут также порождать ожидания,
оперирующие на гораздо более высоком уровне. Например, когда
мы читаем слово gunman, мы ожидаем, что он мог
осуществить действие стрельбы из какого-либо оружия. Мы также
ожидаем событий, связанных с несколькими возможными
сценариями, включая $ROBBERY 'ограбление' и
$TERRORISM. Эти ожидания действуют примерно так же, как
происходит применение сценариев (см. Cullingford,
428
1978): они служат для того, чтобы распознавать события
и тем самым определять, разумно ли усматривать их в
данном контексте. Так, коль скоро мы знаем, что
вооруженный человек скорее всего является террористом, мы
ожидаем, что он может задерживать заложников, может
стрелять и убивать каких-то людей и может выдвигать
требования. Мы знаем также, что данный эпизод может
иметь лишь очень ограниченное число возможных исходов:
террорист может быть взят в плен, он может сдаться сам,
он может быть убит, он может сбежать. Эти ожидания
высшего уровня помогают нам решить, что является
важным в рассматриваемом тексте при взгляде на него "сверху
вниз". Все это имеет решающее значение для организации
анализа. Но гибкость анализа зависит также от его
способности отвечать на вопросы относительно таких
предметов и событий, которые не предусматриваются
ожиданиями.
Ожидания, используемые в ИЧА, реализуются в форме
запросов (см. R i е s b е с к, 1975). Запрос имеет форму
правила вывода, или пары вида "проверка — действие".
Если в результате проверки некоторого действующего
запроса выясняется его справедливость, то выполняются
соответствующие наборы действий. Список запросов
упорядочен так, что, когда система приступает к рассмотрению
действующих запросов, первыми рассматриваются запросы,
активизированные позже всех, поскольку они
представляют более новые и, видимо, более адекватные ожидания.
Поскольку теоретически проверки и действия,
выполняемые запросами, могут быть совершенно произвольными,
в нашей системе мы выделили в качестве необходимого
лишь ограниченное множество запросов. У нас запросы
могут делать следующее:
строить новые концептуальные структуры — обычно
данный запрос строит только одну такую структуру;
заполнять какую-то позицию в некоторой
концептуальной структуре некоторой другой концептуальной
структурой, например: заполнять позицию ДЕЯТЕЛЬ в сцене
$SHOOT 'стрелять' концептуальной структурой,
соответствующей конкретному вооруженному человеку;
активизировать другие запросы — часто это запросы,
которые пытаются заполнить пустые позиции в структуре,
429
создаваемой под воздействием запроса-инициатора; это
могут быть также ожидания, касающиеся действий,
состояний или более сложных эпизодов, которые могут
следовать далее;
отменять запросы — в этом случае речь идет об
аннулировании какого-либо запроса (возможно, и самого
данного запроса), когда он перестает быть уместным.
Существует три типа проверок, выполняемых запросами:
проверка конкретных лексических единиц, например:
служебные слова часто являются характерным признаком
той или иной конструкции; так, в сочетании surrender
to French policemen 'сдаться французским полицейским'
запросы, связанные со словом surrender (или со сценарием
$SURRENDER), могут быть направлены на поиск слова
to (предлог), которое служит признаком следующего за
ним обозначения властей, которым некто сдался;
проверка наличия лексических единиц,
удовлетворяющих некоторому условию; например, это могут быть слова,
активизирующие какой-то конкретный сценарий;
поиск объектов или событий определенного структурно-
семантического типа. Это может быть такая простая
процедура, как проверка структур на совпадение с образцом;
либо речь может идти о проверке семантических признаков
вроде "человек" или "власти".
Тот факт, что запросы могут искать конкретные
лексические единицы, играет очень важную роль в сокращении
времени обработки. Этот резерв обеспечивается как
запросами, которые ищут служебные слова (типа
предлогов), так и запросами, которые ищут более существенные
факты. Часто слово может вызвать ожидания,
направленные на поиск конкретных слов, указывающих, какой
сценарий применим в данной ситуации. Например,
упоминание вооруженного человека порождает ожидания, которые
ищут подтверждения для сценариев, связанных с
терроризмом, похищением или ограблением. Запрос, целью которого
является поиск подтверждений для сценария налета,
может включать проверки на конкретные слова (или
сочетания) типа diverted 'отвлекли внимание', hijack 'налет
на транспорт (с целью ограбления)', took over 'увезли',
которые сигнализируют о наличии сцены налета. Запросы
используют также проверки на концептуальном уровнс.
430
Запрос, активизируемый словом gunman и проверяющий
уместность сценария терроризма, обращает внимание на
место происшествия. Если это место, где размещается
какая-то политическая организация (посольство,
штаб-квартира какой-либо партии и т. п.), то мы имеем дело с явным
подтверждением пригодности сценария терроризма.
Образец запроса приводится ниже (см. стр. 431 и сл.).
Внутри широких категорий слов, подлежащих
немедленной обработке, и слов, которые записываются в ОП и
пропускаются, существуют подкатегории, помогающие
решать вопрос о конкретном способе обработки данного
слова. Необходимо высказать еще два условия, влияющие
на классификацию слов. Первое связано с тем, как данное
слово видоизменяет создаваемую семантическую
репрезентацию; второе — это тип ожиданий, вызываемых данным
словом. Классификация слов учитывает оба этих условия.
Ниже описывается каждый класс слов и указывается, как
их обрабатывает ИЧА. Для каждого класса приводится
образец словарной статьи.
Образец запроса
~FIND— ~На основании обнаружения подходя-
$HIJACK щих слов или понятий вызывает сце-
'найти — нарий налета на транспорт (с целью
сценарий ограбления), строит представление со-
—налёта' бытия налета и порождает несколько
новых запросов, ожидая сцены и лру-
гие действия. (Данная команда
вызывается словом GUNMAN.)
(DEF—REQ FIND—$HIJACK
'(дефиниция запроса найти—сценарий—налета*
TEST (HIJACK—INSTANTIATOR ~Тест ищет слова,
*NEW—ITEM*) которые указы-
'проверка (слово—вызывающее— вают на сцена-
налет* новая—единица*)' рий налета
ACTION (REQ—EVENT 8 ~Действие строит собы-
(SCRIPT $HIJACK тие по сценарию на-
'действие лета при уровне инте-
(запрос—события 8 реса 8, заполняемые
(сценарий налета' позиции здесь
указаны. Позиция деятеля
431
ACTOR
'деятель* 'пусто'
DEMANDS NIL
'требования' 'пусто'
FROM NIL
'от' 'пусто'
DESTINATION NIL
'цель' 'пусто'
ТО NIL
'к' 'пусто'
PASSANGERS NIL
'пассажиры' 'пусто'
VEHICLE NIL)
'транспорт' 'пусто')
((ACTOR. (TOP-OF *ACTOR—
STACK*)))
'((деятель, (последний в
Накопителе—деятелей*)))'
(REDUNDANT—HIJACK—
WORDS
'(избыточные—слова—налета'
FIND—HIJACK—
DESTINATION
'найти—цель—налета'
FIND—HIJACK—VEHICLE
'найти—транспорт—налета')
FIND—HIJACK—
PASSANGERS
'найти—пассажиров—налета'
FIND—HIJACK—EVENTS
'найти—события—налета'
SURRENDER—SCENE
'сцена—сдачи'
RECOGNIZE—DEMANDS
'распознать—требования'
RECOGNIZE—COUNTER-
MEASURES)
'распознать—меры—противо
действия')
заполняется
последним деятелем,
поступившим в
НАКОПИТЕЛЬ ДЕЯТЕЛЕЙ.
NIL
Активизируются
эти новые
запросы
A - СЛОВА, ПОДЛЕЖАЩИЕ НЕМЕДЛЕННОЙ ОБРАБОТКЕ
В рамках теории интегрального анализа слова
классифицируются прежде всего в соответствии с типом
концептуальных структур, которые они строят. Иначе говоря,
наиболее важная роль, которую играет слово с точки
зрения предлагаемой концепции анализа, это не его
синтаксическая роль ("существительное", "глагол" и т. п.)
и даже не его понятийная роль ("деятель", "действие"
и т. п.). С нашей точки зрения, наиболее существенная
характеристика слова — это то, как оно влияет на
обработку текста в рамках интегрального процесса понимания.
В семантическом представлении, приведенном выше
для предложения о вооруженном человеке, говорящем
по-арабски, представлены два разных вида единиц. С одной
стороны, имеют место определенные события: сценарий
терроризма, сцена пленения, убийство вооруженного
человека и т. д., с другой стороны — индивидуальные
понятия, играющие ту или иную роль: "вооруженный
человек", заполняющий позицию ДЕЯТЕЛЯ в сценарии
терроризма, или "иракское посольство", заполняющее
позицию МЕСТА в этом сценарии, и т. д. Слова,
заполняющие позиции, мы будем называть элементами (tokens).
Имея в виду это разграничение между элементами и
событиями, рассмотрим классификацию слов.
AI— слова, ответственные за представление событий
(Образец словарной статьи AI см. на с. 436—437).
Один класс образуют слова, которые инициируют
построение структур событий. Мы называем их словами,
ответственными за представление событий (event builders),
сокращенно — ПС-слова. Этот класс слов включает много
глаголов и ряд существительных типа "убийство", "мятеж",
"налетчик". Всем ПС-словам приписывается указание на
уровень интереса. Это помогает определять, является ли
событие достаточно значимым для того, чтобы быть
включенным в окончательное представление текста, то есть
достаточно ли оно интересно для того, чтобы считать его
центральным событием в данном представлении, и
достаточно ли оно важно для того, чтобы мы тратили
драгоценное время обработки на попытки заполнить его пустые
позиции. Всем ПС-словам приписывается также набор
ожиданий, помогающих управлять ходом анализа. Эти
ожидания разнообразны — от запросов, имеющих своей
15 № 634
433
целью заполнить конкретные позиции последующими
словами текста, до общих ожиданий относительно событий,
которые, по всей вероятности, должны произойти (в
соответствии с набором сцен некоторого сценария).
ПС-слова подразделяются далее согласно типу события,
построение которого они инициируют. Многие
широкоупотребительные слова типа "дал", "пошел", "съел" строят
простые события (не представляющие большого интереса
с точки зрения своих внутренних свойств). Это события,
которые мы всегда могли представлять довольно легко в
рамках теории концептуальных зависимостей (Schank,
1972; 1975). В ходе нашей последующей работы над
структурами знаний более высокого уровня мы пришли к
выводу, что наиболее существенными являются те виды
семантических представлений, которые связаны со
сценариями, планами и целями (см. Schank and Abelson,
1977). Из сказанного следует, что те ПС-слова, которые
строят простые структуры на основе концептуальных
зависимостей, требуют меньше всего внимания при
обработке, потому что они наименее интересны. Они образуют
отдельный подкласс ПС-слов. На них в процессе анализа
почти никогда не расходуется много времени. Им приписаны
довольно простые ожидания, нацеленные обычно на
заполнение таких позиций, как ДЕЯТЕЛЬ, ОБЪЕКТ, К
(направление), ОТ (направление), ИНСТРУМЕНТ. Чтобы
начать искать информацию для удовлетворения этих
ожиданий, эти ожидания в конечном счете должны быть
связаны с более интересным событием или должен
существовать интересный деятель, который, предположительно,
будет участвовать в данном действии.
Другие разновидности ПС-слов — это слова,
ответственные за построение сценариев, и слова, ответственные
за построение сцен. Слова обоих этих типов могут иметь
гораздо более сложные запросы, часто предсказывающие
возможные события. Единственное реальное различие
между этими двумя разновидностями (с одной стороны, это
слова типа "налет", "похищение", а с другой — слова
типа "сдаваться", "осужденный") состоит в том, что на
основе слов второй разновидности мы делаем умозаключение
о вероятном сценарии, так как сцены не могут иметь места
в изоляции, а на основе слов первой разновидности мы
строим ожидания, касающиеся вероятных сцен данного
сценария.
434
Другие структуры знаний, используемые при
понимании текстов, такие, как планы, цели и темы, также
ассоциированы с определенными ПС-словами (то есть со
словами, которые строят эти структуры непосредственно),
но для большого класса газетных сообщений оказывается
достаточным учитывать те виды ПС-слов, которые
упоминались выше. (Строго говоря, структуры знаний более
высокого уровня обычно не фиксируются посредством
какого-то конкретного слова непосредственно. Наличие
таких структур чаще всего должно устанавливаться
посредством умозаключений.)
Когда система прочитывает некоторое ПС-слово, на
основе шаблона, хранящегося в словаре, строится пустая
структура события. Затем ИЧА проверяет, есть ли
запросы, ожидающие этого события. Часто событие довольно
легко получает соответствующую интерпретацию благодаря
ожиданиям, созданным на основе контекста рассказа. Если
подходящих ожиданий нет, то учитывается уровень
интереса данного события, указанный в словаре. Если
данное событие не представляет большого интереса, то
анализатор переходит к следующему слову. Если же событие
представляет значительный интерес, то вызываются
ожидания, записанные в словарной статье данного слова,
снабженные ссылкой на структуру нового события.
ИЧА следит за главным событием рассказа. Он
проверяет, не возникло ли какого-то нового события,
представляющего больший интерес, чем старое главное событие.
Если появившееся интересное событие представляет
меньший интерес, чем текущее главное событие, и если оно не
отвечает никакому ожиданию, то оно хранится в качестве
необъясненного события, что указывает на необходимость
для ИЧА искать какое-то объяснение.
А2 — СЛОВА, ОТВЕТСТВЕННЫЕ ЗА СОЗДАНИЕ ЭЛЕМЕНТОВ
(Образец словарной статьи À2 см. на с. 439.)
Многие слова, включая большинство существительных
(типа "вооруженный человек" или "посольство"), участвуют
в процессе понимания, заполняя пустые позиции в
структурах событий. Мы называем этот класс словами,
ответственными за создание элементов (token markers),
сокращенно — СЭ-слова. Эти слова приводят к построению элемента.
Если данное слово представляет интерес или в оперативной
памяти хранится какое-либо интересное определение (и
15*
435
только в этих случаях), то из оперативной памяти
извлекаются слова, которые модифицируют данный элемент.
Создаваемые элементы часто являются объектами, которые
ищутся анализатором на основе ожиданий,
сформированных во время обработки предыдущих слов предложения.
Класс СЭ-слов может разбиваться на подклассы двумя
способами. Прежде всего, имеется несколько различных
типов элементов по их характеру: элементы, обозначающие
деятеля, место, организацию, средства передвижения,
время и другие. Тип создаваемого элемента является одним
из факторов определения того, удовлетворяет ли данный
новый элемент некоторому ожиданию, сформированному
ранее.
Образец словарной статьи (AI)
(WORD—DEF OCCUPIED
('описываемое слово "занял"*
INTEREST 5 'интерес'
TYPE ЕВ
'тип'
SUBCLASS SEB 'подкласс'
TEMPLATE(SCRIPT
^DEMONSTRATE
'ПС-слово'
'ПС-слово,
задающее
сцену'
'шаблон' ('сценарий*
'демонстрировать'
ACTOR
'деятель*
OBJECT
'объект'
DEMANDS
'требования'
METHOD
'метод'
NIL
'пусто'
NIL
'пусто'
NIL
'пусто'
(SCENE
('сцена'
ACTOR
'деятель'
$OCCUPY
'занимать'
NIL
'пусто'
~Слово
OCCUPIED
инициирует построение
структуры,
задающей
сценарий
демонстрации,
включающий сцену
захвата здания.
г
LOCATION NIL))
'место' 'пусто'))
436
FILL (((ACTOR) (TOP—OF *AC-~ Заполняются
TOR—STACK*)) позиции
'заполнить' ((('деятель' ('последний в на- деятелей
копителе
деятелей*))
((METHOD ACTOR)
(('деятель метода*)
(TOP—OF
•ACTOR—STACK*)))
('последний в*
накопителе
деятелей*»)))
REQS (FIND—DEMON—OBJECT ~Ожидание,
'запросы* 'найти—объект демона*
FIND—OCCUPY—LOC
'найти—захваченное—
место'
RECOGNIZE—
DEMANDS]
'распознать—требования*]
связанное с
поиском того, против
кого
направлена
демонстрация.
'Ожидание,
связанное с
поиском места
демонстрации.
^Ожидание,
связанное с
поиском требований.
Другое подразделение СЭ-слов касается того
воздействия, которое оказывает СЭ-слово на последующую
обработку. Это деление основано на том, насколько
интересным является данное СЭ-слово. Интересные СЭ-слова
порождают ожидания относительно того, что мы можем
ожидать в последующей части предложения. Так, слово
gunman порождает ожидания, касающиеся стрельбы,
похищения или ограбления. Интересные СЭ-слова,
выполняющие роль деятеля в каком-либо событии, порождают,
естественно, ожидания, связанные с вероятным появлением
дополнительной информации об этих людях. Например,
gunman активизирует запросы, которые ищут подходящие
сценарии.
СЭ-слова, не являющиеся интересными и поэтому не
порождающие никаких ожиданий, могут быть отнесены
к одному из двух подклассов — обычных (normal) СЭ-слов
437
и пустых СЭ-слов. Обычные СЭ-слова могут быть легко
соотнесены с объектами, уже находящимися в памяти,
даже если они не представляют интереса. Примеры обычных
СЭ-слов: "аэропорт", "Вермонт", "служащие". Элементы,
создаваемые обычными СЭ-словами, могут использоваться
для заполнения позиций в представлении текста. Пустые
СЭ-слова, с другой стороны,— это слова, сведения о
которых являются настолько нечеткими, что фактически
бессмысленно включать их в окончательное представление
предложения. К этому классу относятся слова типа "люди",
"место", "кто-нибудь". Эти слова создают элементы,
могущие аннулировать ожидания, но в окончательное
представление они не включаются. Если к данному элементу не
адресовано никакое ожидание и он не представляет
интереса сам по себе, то по нашей схеме анализа он
игнорируется, так как вряд ли есть смысл запоминать его.
в - слова, которые записываются и пропускаются
Многие слова нет нужды обрабатывать, когда мы
прочитываем их в первый раз. Они просто записываются в
оперативной памяти, а их обработка, если она оказывается
необходимой, завершается позднее. Следует признать два
важных положения, касающихся такого рода слов. Во-
первых, тот факт, что мы записываем слово, еще не
означает, что мы будем обязаны осуществлять его дальнейшую
обработку. Большинство записываемых и пропускаемых
слов не представляет большого интереса, и если какое-то
последующее интересное слово не потребует их
рассмотрения, пропущенные слова могут быть оставлены без
дальнейшей обработки. Предполагается, что процесс
запоминания (записи) слова очень легок, так что
записываемые и пропускаемые слова часто требуют очень
маленьких затрат времени на их обработку. Другое важное
положение, касающееся такого рода слов, состоит в том, что
при определении того, какие слова подлежат записи и
пропуску,, а какие полностью пропускаются, существенную
роль играют предметная область и контекст. Так,
например, слово типа tall 'высокий' полностью пропускается во
многих предметных областях (например, в сообщениях,
помещаемых в различных рубриках газеты), но при чтении
сообщения из спортивной жизни оно может быть расценено
как слово, подлежащее записи и пропуску, так как высокий
438
Образец словарной статьи (А2)
(WORD—DEF GUNMAN
'описываемое слово* 'вооруженный человек'
INTEREST 5 ~Слово GUNMAN
'интерес' 5 является интерес-
TYPE ТМ ным СЭ-словом.
'тип' СЭ-слово
SUBCLASS ACTOR
'подкласс* деятель
MEMORY Т
'память' Т
REQS (CONFIRM—SHOOT ~Ожидание стрельбы
'зап росы' ('подтвердить—стрелять'
FIND—WHY—SHOOT ~Ожидание причин,
'найти—почему—стре- заставивших дан-
лять* ного человека
стрелять в кого-то.
(FIND—$TERRORISM~ Набор ожиданий,
('найти—сценарий— которые задают
терроризм* сценарии, вероят-
FIND—$ROBBERY ные для данной
'найти—сценарий— ситуации. Если бу-
ограбления' дут удовлетворены
FIND—$KIDNAP условия одного из
'найти—сценарий—по- них, то остальные
хищения' будут аннулирова-
FIND—$HIJACK] ны.
'найти—сценарий—налета']
рост человека в некоторых ситуациях может выдвигаться
на передний план.
Класс записываемых и пропускаемых слов может быть
подразделен на несколько подклассов, в зависимости от
того, что мы делаем со словом, если мы принимаем решение
производить его дальнейшую обработку. (Напомним, что
вполне вероятно, никакой обработки может не последовать
вообще.)
439
BI — слова, служащие для уточнения
представлений элементов
Первый класс записываемых и пропускаемых слов
нацелен на пополнение представлений элементов, построенных
в результате обработки СЭ-слов. Слова этого класса служат
для усовершенствования (уточнения) представлений
элементов (token refiners) и сокращенно обозначаются как
УЭ-слова, Большинство слов, которые обычно выступают
в составе именных групп, в том числе многие
прилагательные, являются УЭ-словами в тех областях, где их
нельзя пропускать полностью. Так, в рассмотренном
выше примере Arabic является УЭ-словом, которое
уточняет представление элемента в роли деятеля, построенного
для слова gunman; это уточнение состоит в указании
"nationality: Arabic" 'национальность: араб'. Обработка всех
УЭ-слов начинается одинаково. Каждое УЭ-слово
подлежит временному хранению в памяти до тех пор, пока не
будет найдено то СЭ-слово, которое оно модифицирует;
в этот момент оно может быть извлечено из памяти и
подвергнуто дальнейшей обработке; способ обработки зависит
от типа УЭ-слова. (Если СЭ-слово оказывается
неинтересным, дальнейшая обработка не производится.)
Класс УЭ-слов может быть разбит на подклассы тремя
способами в зависимости от того, как изменяются
представления элементов, модифицируемых ими. Большой
класс УЭ-слов приводит просто к добавлению какого-либо
свойства к некоторому элементу. Эти УЭ-слова (будем
называть их простыми УЭ-словами) включают
употребительные прилагательные типа "красный", "высокий",
"арабский", если они в данной области не могут просто
пропускаться. Сюда же попадают обычно слова типа "ранний" или
"поздний".
Другие УЭ-слова модифицируют свойства, добавленные
к элементу другим модификатором. Например, в сочетании
about 20 gunmen * около 20 вооруженных людей' в
результате действия числа 20 к элементу, отображающему
вооруженных людей, добавляется информация NUMBER 20,
а слово about меняет эту запись на другую: NUMBER
(APPROX 20). Слова этого класса можно назвать
модификаторами УЭ-слов. Остается неясным, как часто слова
этого класса могут вообще пропускаться. Скорее всего,
большинство этих слов игнорируется почти всегда, но в
440
некоторых случаях их необходимо записывать в ОП и лишь
затем пропускать.
Третий класс УЭ-слов — это имена собственные,
просто добавляющие к элементу информацию о его
имени. Так, в сочетании Kennedy International Airport
'Международный аэропорт им. Кеннеди' слово Kennedy
добавляет к элементу, отображающему аэропорт, его
название. Обработка этих УЭ-слов отличается от обработки
предыдущего подкласса лишь тем, что они не могут
модифицироваться другими модификаторами.
Один общий момент в обработке всех типов УЭ-слов
состоит в том, что в их словарных статьях может
содержаться указание на то, что модифицируемый ими элемент
становится более интересным. Так, Arabic gunman
представляет больший интерес, чем просто gunman, благодаря
тому, что УЭ-слово Arabic обладает высокой степенью
интересности.
Заметим, что обработка по принципу "записать и
пропустить" облегчает анализ тех УЭ-слов, значение которых
зависит от модифицируемых ими слов, так как реальная
дефиниция данного УЭ-слова не подвергается обработке
до тех пор, пока не становится известным соответствующее
СЭ-слово. Такая обработка упрощает также случаи, когда
СЭ-слово активно ищет конкретные типы слов, которые
могут его модифицировать.
Образец словарной статьи (В1)
(WORD—DEF ARABIC («описываемое 'арабский'
слово'
TYPE
SUBCLASS
INTEREST
MEMORY
DEF
TR
STR
2
T
(NATIONALITY. ARABIC)
'тип'
'подкласс'
'интерес'
'память'
'дефиниция'
'УЭ-слово'
'простое
УЭ-слово'
2
Т
'(национальность:
араб)'
В2 - слова, служащие
для уточнения представлений событий
Уточнители событий (event refiners) (сокращенно УС-
слова) очень сходны с УЭ-словами, за исключением того,
что они модифицируют не элементы, а события. Типичными
44J
для этого класса являются наречия типа "быстро", "глупо".
Сюда же попадают слова "здесь", "прочь", так как они
изменяют содержание некоторой позиции в описании
модифицируемого события, например в сочетаниях was shot
here 'был застрелен здесь' или was led away 'был уведен
прочь'. Слова, которые хотелось бы относить к этому
классу, на самом деле подлежат пропуску даже чаще, чем
УЭ-слова. Упоминавшиеся выше наречия на -1у являются
УС-словами в том случае, когда они сохранены в памяти,
но чаще всего они расцениваются как пустые слова и
полностью пропускаются. Как указывалось выше, определение
того, следует ли сохранять данное слово в памяти, зависит
от предметной области. УС-слова разделяются на
стандартные УС-слова и модификаторы УС-слов (аналогично
делению УЭ-слов). Обработка протекает аналогично
обработке УЭ-слов, с тем отличием, что она начинается, когда
создается представление некоторого события; в этом случае
производится поиск УС-слов в последующей части текста,
а также в оперативной памяти.
Образец словарной статьи (В2)
(WORD—DEF AWAY ('описываемое 'прочь'
слово*
TYPE ER 'тип* 'УС-слово'
SUBCLASS SER 'подкласс' 'стандартное
УС-слово'
DEF (ТО. NOT-HERE) 'дефиниция' '(по
направлению к:
нездесь) '
вз - функциональные слова
В английском языке есть важный класс слов, которые
не обладают собственным значением или обладают им в
слабой степени; они существуют исключительно для того,
чтобы направлять процесс обработки текста. Эти слова,
называемые функциональными словами, весьма
употребительны и включают артикли, предлоги и вспомогательные
глаголы. Функциональные слова, вообще говоря, не могут
быть совсем пропущены, но часто процесс анализа никогда
к ним не возвращается во второй раз. Они должны запи-
442
сываться в оперативной памяти, поскольку в случае
появления интересных слов они могут стать важными, но
сами по себе они не нуждаются в обработке.
Роль артиклей (a, an, the) состоит в том, чтобы отмечать
начало именных групп, а также показывать, какие УЭ-
слова относятся к каким СЭ-словам. Когда мы читаем
текст, они записываются вместе с УЭ-словами. Затем, в
процессе обработки некоторого СЭ-слова, мы смотрим
назад на предшествующие слова и пытаемся найти среди
них УЭ-слова. Если мы встречаем артикль, наш поиск
прекращается.
Предлоги (with 'с', 'посредством', to 4k', from 'от'
и т. д.) имеют в английском языке немало функций. Часто
они указывают, каким образом следующее за ними СЭ-
слово должно включаться в создаваемую структуру. В
нашей системе предлоги чаще всего используются пассивным
образом. ПС-слово нередко формирует ожидания для
определенного предлога с указаниями относительно того,
как поступать с СЭ-словом, стоящим после данного
предлога. Так, слово shot 'застрелил' формирует ожидание для
предлога with 'с помощью' и дает указание о том, что СЭ-
слово, следующее после with, должно быть направлено
в позицию ИНСТРУМЕНТА для данного события.
Немало функций несут и вспомогательные глаголы,
например: фиксация времени (did go 'пошел-таки') или
придание событию гипотетического оттенка (may go
'может пойти'). Одно из важнейших употреблений
вспомогательных глаголов — это использование форм глагола to be
'быть' для придания основному глаголу значения пассива.
Когда событие строится в результате действия причастия
прошедшего времени, анализатор проверяет наличие
такого вспомогательного глагола, и если находит его, то
соответствующим образом модифицирует процесс
обработки на низшем уровне.
Образец словарной статьи (ВЗ)
(WORD—DEF А ('описываемое 'неопределенный
слово' артикль'
TYPE FW 'тип' 'функциональное
слово'
SUBCLASS ART) 'подкласс' 'артикль')
443
B4 - реляционные слова
Реляционные слова осуществляют связь между двумя
событиями. Обработка всех этих слов проводится, как
правило, единообразно. Слово хранится в памяти до тех
пор, пока не появляется значительное событие. Тогда
устанавливается нужная связь между этим событием и
предыдущим. Если реляционное слово соединяет в предложении
неинтересные события, то никакой дополнительной
обработки не производится.
Реляционные слова устанавливают два главных вида
связи — временную и причинную. Первая обозначается
словами типа before 'перед тем как', while 'в то время как',
after 'после того как', а вторая — словами типа because
'потому что', since 'так как', therefore 'поэтому'.
Образец словарной статьи (В4)
(WORD—DEF BEFORE ('описываемое'перед тем
TYPE
SUBCLASS
RELATION
RW
TRW
AFTER)
слово
'тип'
'подкласс'
'отношение'
как
'реляционное слово'
'временное
слово'
'после')
с — пропускаемые слова
Неожиданно большой класс слов образуют слова,
которые пропускаются совсем. Когда мы их обрабатываем,
мы абсолютно ничего с ними не делаем. Это один из способов
экономии значительного количества времени в ходе
обработки текста. Из приводившегося выше примера в этот
класс попадают такие слова, как and 'и', who 'который',
speaking 'говорящий'. Важная тема будущих
исследований — определение того, какие именно слова подлежат
полному пропуску. Чем шире класс пропускаемых слов,
тем быстрее будет работать программа. Видимо,
существует мало слов (если такие вообще есть), которые могут
пропускаться во всех предметных областях, для всех
категорий читателей, для любого уровня обработки. Но для
данного читателя, действующего в рамках данной
предметной области, к категории пропускаемых относятся
очень многие слова.
444
Множество пропускаемых слов может также
пополняться в процессе самой работы анализатора, даже за счет,
казалось бы, очень интересных слов. Так, если мы уже
знаем, что реализуется сценарий "захват заложников",
то слова типа "террор", "захват", "стрельба" становятся
пропускаемыми, так как мы уже вывели все умозаключения,
которые могли бы быть подсказаны этими словами.
Относительно таких слов формируются ожидания, которые
нейтрализуют приписанную им интересность. (. . .)
6. ЗАКЛЮЧЕНИЕ
Внимательный читатель заметит, что в окончательных
представлениях, получаемых на выходе нашего
анализатора, мало используются инструменты типа тех, которые
составляли основу теории концептуальных зависимостей
(Schank, 1972, 1975). Этот факт отражает
произведенный в последние годы пересмотр нашей точки зрения на
проблему семантических представлений. В работе Schank
and Abelson, 1977 мы предложили новый уровень
представления, названный уровнем структуры знаний,
который фиксирует более крупные информационные
структуры по сравнению с теми, которые использовались в
нашей первоначальной концепции. В работе Schank
and Carbonell, 1978 было предложено еще одно
дополнение к нашей системе представлений, нацеленное на
обработку информации о социальных и политических
актах, которые весьма слабо поддавались обработке в
рамках предшествующих систем. Мы и раньше, конечно,
сознавали, что существует много факторов, не поддающихся
адекватному представлению в терминах концептуальных
зависимостей. Потребность в новых репрезентационных
схемах была и остается очевидной. Но раньше мы всегда
пытались сначала перевести исходный текст на язык
концептуальных зависимостей, предпочитая разрабатывать
механизмы вывода умозаключений, отталкиваясь именно
от такого способа представления информации. В этом
подходе было два положительных момента. Во-первых, он
позволял большому числу людей, работавших в рамках
нашего проекта, общаться друг с другом (то же относится
и к программам, которые создавались этими людьми).
Язык концептуальных зависимостей играл роль интерлинг-
445
вы, или концептуального эсперанто, с помощью которого
все участники могли общаться. Во-вторых, помимо этого
прагматического достоинства, мы считали, что данный
вариант реализации принципа модульности был
правильным и с теоретической точки зрения. Попросту говоря,
мы верили, что из предложений извлекаются значения,
которые затем подвергаются действию других процессов.
Очевидная альтернатива, которую мы избрали, когда
разрабатывали две дополнительных репрезентационных
системы, упомянутых выше, состояла в том, чтобы
попытаться переводить анализируемый текст непосредственно
в эти репрезентации. Хотя мы продолжали верить, что
люди извлекают значения из того, что они слышат, мы уже
не видели оснований для того, чтобы считать, будто эти
значения могут иметь одну и только одну форму. Если
глагол want 'хотеть' лучше всего представляется на
основе связи с понятием цели и в то же время получает
довольно сложное представление на языке концептуальных
зависимостей, то на каком основании мы должны
полагать, что для получения простого представления человек
должен пройти через этап более сложной формы?
Многочисленные вопросы такого типа лежали в основе
возражений ряда ученых против нашего понятия элементарных
компонентов (primitives). В частности, к обсуждению
наших компонентов несколько раз возвращались Бобров
и Виноград (Bobrow and Winograd, 1977). Они
предложили понятие переменной глубины обработки
(в противовес нашему компонентному представлению). В
некотором смысле система, описанная в настоящей статье,
использует это предложение. Бобров и Виноград правы,
утверждая, что различные уровни обработки имеют смысл
в разных ситуациях. Но мы не согласны с ними в вопросе
о том, каков наилучший набор уровней. Мы не считаем,
что разумными конечными точками являются сами слова
или синтаксические понятия. Отсутствие инструментов
теории концептуальных зависимостей в наших конечных
репрезентациях, приведенных выше, допускает возможность
более широкой точки зрения. Иначе говоря, мы согласны
с тем, что при осуществлении процесса понимания мы
должны идти настолько далеко (или глубоко), насколько
это нам необходимо.
Какова же тогда роль концептуальных зависимостей
и элементарных компонентов? В рамках нашего анализа-
446
тора аппарат концептуальных зависимостей применяется
как своего рода внутренний язык, используемый в
ситуациях, когда целесообразная форма окончательного
представления не является очевидной. Его применение
позволяет осуществлять вывод умозаключений на
концептуальной основе. Как это ни странно, эта его функция стала
приобретать черты сходства с нашим способом
использования синтаксиса в ходе анализа. Иначе говоря, уровень
организации знаний, отражаемый этим метаязыком,—
это нечто, находящееся за сценами и осуществляющее
свое действие скрытым образом, почти без поверхностного
проявления.
Главный вывод из всего этого заключается,
следовательно, в том, что, по нашему мнению, модульные системы
в конечном счете распадутся под действием их собственной
громоздкости. "Человекоподобные" понимающие системы
должны быть интегрированными в такой степени, чтобы они
могли руководствоваться присущими им интересами,
подробно анализируя то, что их привлекает, и пропуская
то, что не вызывает у них интереса. Именно таков
истинный смысл понятия переменной глубины анализа. Другими,
словами, если мы действительно будем уделять одинаковое
внимание всему, что может быть объектом понимания,
может случиться, что мы никогда не закончим процесса
понимания. Учитывая соображения времени обработки,
мы должны констатировать, что безусловное, извлечение
абсолютно всех умозаключений и структур знания в
худшем случае невозможно, а в лучшем — практически
неосуществимо. Человек, понимающий тексты на
естественном языке, руководствуется тем, что он хочет знать (а также
тем, чего он не хочет знать). Это позволяет ему не замечать
всех неоднозначностей, проблем полисемии, бесчисленных
импликаций и других трудностей, кроющихся в том, что
он слышит. Но то, что он теряет в плане совершенства
достигаемого уровня понимания, он компенсирует
скоростью и надежностью процесса обработки текста. Возможно,
настало время предоставить нашим машинам те же
преимущества.
ЛИТЕРАТУРА
Bobrow, D. G. and Fraser, J. В. An Augmented State
Transition Network Analysis Procedure.— In: "Proceeding of the
International Joint Conference on Artificial Intelligence", I, Washington, 1969.
447
Bobrow, D. G. and Winograd, T. An Overview of KRL,
a Knowledge Representation Language.— "Cognitive Science", Vol. 1, No
1, 1977.
"CMU Computer Science Speech Group". (Working Papers in Speech
Recognition-IV. The Hearsay II System, 1976).
Carbonell, J. G. Jr. Subjective Understanding: Computer
Models of Belief Systems. (Research Report 150, Yale University, Department
of Computer Science), 1979.
Cullingford, R. Script Application: Computer Understanding
of Newspaper Stories. (Research Report 116, Yale University, Department
of Computer Science), 1978.
DeJong, G. F. Skimming Newspaper Stories by Computer.
(Research Report 104, Yale University, Department of Computer Science), 1977.
Gershman, A. Analyzing English Noun Groups for Their
Conceptual Content. (Research Report 110. Yale University, Department of
Computer Science), 1977.
Granger, R. H. FOUL-UP: A Program That Figures Out
Meanings of Words from Context.— In: "Fifth International Joint Conference
on Artificial Intelligence". Cambridge, Massachusetts, 1977, August.
Kaplan, R. M. On Process Models for Sentence Analysis.— In:
"Explorations in Cognition" (D. A. Norman and D. E. Rumelhart (eds.)).
San Francisco, W. H. Freeman and Company, 1975.
Lamb, S. Outline of Stratificational Grammar. Georgetown
University Press. Washington, D. C, 1966.
Marcus, M. A Theory of Syntactic Recognition for
Natural-Language. Cambridge, Massachusetts, MIT Press, 1979.
Marslen - Wilson, W. D. Sentence Perception as an
Interactive Parallel Process.— "Science", Vol. 189, 1975, p. 226—228.
Newell, A. Production Systems: Models of Control Structures.-—
In: "Visual Information Processing" (Chase, W. C. (ed.)). New York,
Academic Press, 1973.
Plath, W. J. Tranfsormational Grammar and Transformational
Parsing in the REQUEST System.— In: "Computational and
Mathematical Linguistics" (Zampolli A. (ed.)), 1973.
Riesbeck, CK. Conceptual Analysis.— In: "Conceptual
Information Processing" (Schank R.C. (ed.)). Amsterdam, 1975.
Riesbeck, CK. and Schank, R.C Comprehension by
Computer: Expectation-based Analysis of Sentences in Context. (Research
Report 78, Yale University, Department of Computer Science), 1976.
Schank, R.C. Conceptual Dependency: A Theory of Natural
Language Understanding.— "Cognitive Psychology", Vol. 3, No. 4, 1972.
Schank, R.C. Conceptual Information Processing. Amsterdam,
1975. (См. сноску на с. 256.)
Schank, R.C. Interestingness: Controlling Inferences.
(Research Report 145. Yale University, Department of Computer Science), 1978.
Schank, R.C. and Abelson, R. P. Scripts, Plans, Goals and
Understanding. Lawrence Erbaum Associates, Hillsdale, New Jersey, 1977.
Schank, R. С and Carbonell, J. G. Jr. The Gettysburg
Address: Representing Social and Political Acts. (Research Report 127,
Department of Computer Science, Yale University), 1978.
Schank, R.C and Selfridge, M. How to Learn/What to
Learn.— In: "Fifth International Joint Conference on Artificial
Intelligence". Cambridge, Massachusetts, 1977, August.
448
Schank, R. С. and Tesler, L. A Conceptual Parser for
Natural Language.-— In: "Proceedings of the International Joint Conference on
Artificial Intelligence". Washington, D. C, 1969.
Schank, R. C, Tesler, L. and Weber, S. Spinoza II:
Conceptual Case-Based Natural Language Analysis. (Stanford Artificial
Intelligence Project Memo No AIM-109). California, Stanford, Computer
Science Department, Stanford University, 1970.
Schank, R. С Yale AI Project. SAM — A story understander.
(Research Report 43, Department of Computer Science, Yale University),
1975.
Thorne, J., Brätle y, P. and Dewar, H. The Syntactic
Analysis of English by Machine.— In: D. Michie (ed.). Machine
Intelligence, 3. New York, American Elsevier Publishing Company, 1968.
Wilensky, R. Understanding Goal-Based Stories. (Research
Report 140, Department of Computer Science, Yale University), 1978.
Wilks, Y. An Artificial Intelligence Approach to Machine
Translation.—In: "Computer Models of Thought and Language" (R. С Schank
and K. Colby (eds.)). San Francisco, W. H. Freeman and Co., 1973.
Winograd, T. Understanding Natural Language, New York,
Academic Press, 1972.
Woods, W. A. Augmented Transition Networks for Natural
Language Analysis. (Report CS-1, Computer Lab., Harvard University).
Cambridge, Massachusetts, 1969.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Автоматическая обработка
текста 7, 9—11, 14—15, 16,
171, 214—216, 224, 273,
286—287, 318—320, 373—
387, 399, 401—406, 447
агенс = AGENT 48, 49, 68, 90,
99, 236—237, 324, 328—332,
335, 340
адресат см. слушающий
аксиома 179—180
активизация
— запроса 431, 437
— сцены 85, 88
анализ (parsing) 9, 19, 21, 134—
135, 208, 318, 381, 401—415,
425—429 (см. также
понимание)
— в глубину (depth-first р.)
212—213, 344, 349—350
— в ширину (breadth-first р.)
212—213
— интегральный 425, 433
— минимальный 322
— сверху вниз (top-down р.)
210—211,344, 404,406—407,
411, 414
— снизу вверх (bottom-up р.)
210—211
— частичный 412, 425—432
анализатор (parser) 344, 401—
407, 413, 425
— интегральный 401, 407,
425—432
антецедентная теорема 201—202,
275, 277
антонимия 114
артикль 148—155, 443
атом см. базисный символ
450
База данных 197, 201, 204, 233,
238, 239, 274, 275, 281, 375
базисный символ = атом 195
базовые стандартные
подпрограммы (base routines) 273,
278—279, 281—282, 294, 302
Валентность 91—92
вербализация 18, 35—40
возврат [в рабоге программы]
200, 204—205, 413
вопрос 83, 172—173, 188, 192—
193, 233, 242—244, 269, 280,
284, 381 (см. также запрос
[пользователя]; диалог)
восприятие 36—38, 61
время обработки (processing time)
[текста] 146, 407—415
вывод умозаключений (inference)
20, 134, 151, 171—176, 181,
185—196, 206—207, 272—
277, 282—284, 294—299, 303,
313, 409 (см. также
умозаключения; правила вывода)
— во время обработки
входного текста (read time i.)
188—189
— во время обработки запроса
(question time i.) 188—189
— направленный (problem
occasioned i.) 189—190, 192—
193
— ненаправленный
(non-problem occasioned i.) 189—192,
194, 282, 298—299
выделенность (salience) 18, 64—
67, 99—105
вызов процедур по образцу 199,
201, 204, 283 (см. также
образец)
выражение [смысла] см.
построение [предложений, текста]
высказывание 132—135
вычислительная лингвистика 8,
164, 166
Генеративная лингвистика 76,
165, 167
гипотезы [при моделировании
языка] 163—165
глагол 54, 81—85, 88—93, 97—
105, 255—256 (см. также
предикат)
— вспомогательный 443
глубинная структура 22, 62, 93,
102, 104
говорящий 18, 19, 38—39, 66—69
82, 100, ПО, 126, 131, 138,
149—154
«Демоны» 272—273, 277—279,
312—315
дескрипция = описание
[концептуальной сущности] 145—
146, 150—154
дефиниция = определение 109,
383—384, 441, 442
диалог 82-84, 141, 373—399
(см. также вопрос; ответы
на вопросы)
дизъюнктивная форма (clause
form) 181—183
дуга [направленная] = стрелка
230, 234, 236—239, 246, 268
Запрос (request) [внутримашин-
ный] 22, 345—348, 404, 417—
424, 129—432, 437 (см.
также ожидания)
запрос (request) [пользователя]
193—194, 373 (см. также
вопрос)
знания 37—38, 55, 72, 126, 131,
134, 140, 149—152, 171, 173,
272, 357—359, 447 (см.
также представление знаний;
информация; факт)
- о мире 78, 224, 273, 284,
351, 368—369, 425—426 (см.
также модель мира)
значение (meaning) 19, 81, 126—
127, 132—133, 139—140 (см.
также смысл)
— слова = лексическое
значение 74, 84—88, 93, 118,
140—144, 155, 324, 326,
330-331
— основное 116
Идентификация
[концептуальных сущностей] 154
избыточность 242—244, 343
индивидуализация [при
восприятии] 61
инженерная психология 21, 373
387 399
инструмент 81, 88, 100, 121, 236,
259, 327—328, 335—336
интеллект 14, 17, 127—128
интерес=интересность 22, 409—
414, 433—435, 437—439,
447
интерпретатор 79, 93, НО (см.
также слушающий)
интерпретация 17, 18, 36—37, 40,
61—63, 74, 77, 79—81, 83,
86, 106, 118, 119—120, 151
(см. также понимание)
интерфейс 373—380, 386—387,
399
информация 36, 78, 93, 117, 229—
230 (см. также знания)
— скрытая 156
— частичная 319
использование языка см.
употребление языка
истинность 148, 151, 153—154,
239—241
исчисление предикатов
первого порядка = ИППП 175;
176—187, 193—196, 205—
206, 229, 238, 244—253
Категоризация 18, 39, 49—59,
68, 71
категория [понятийная,
семантическая] 50, 55—59, 114,
389—396
кванторы 178—184
класс [объем понятия ] 232—233,
264—266 (ср. тип)
когнитивные науки 12, 126, 128—
129, 145, 165
когнитивный процесс см.
мыслительная деятельность
451
кодируемость [опыта] 50—54,
57—59, 71
комбинаторный взрыв 186—187,
264—265
коммуникативный акт см.
речевой акт
коммуникация = общение 7, 8,
126, 131, 138—139
компетенция vs. употребление
(competence vs. performance)
136—138 (см. также
употребление языка)
компонент [семантический] см.
семантический элемент
конверсивность 115—116
консеквентная теорема 198, 202,
280
константа 176
контекст 106, 147, 149, 151
концептуальная сущность
(conceptual entity) =
понятийная с.= ментальная с. 129—
130, 144—147, 150—156
концептуальная схема 43—45,
63, 65—67, 110—111, 114
(см. также фрейм)
концептуальные зависимости =
КЗ 255—256, 296, 344, 401—
402, 445—447
концептуальные структуры =
мыслительные структуры
126—127, 429, 433
Лексикализация 120
лексикон см. словарь
лексическое значение см.
значение слова
логические связки (logical
connectives) 177—184
Метафора 118
микромир [системы] =
предметная область 272—273, 319,
402, 425, 439
модель 163—164
— памяти 228—229 (см. также
память)
— мира 19, 107, 110, 130, 132,
292, 294—295 (см. также
фрейм; знания о мире)
модификатор 58
модульный подход [в
программировании] 162, 365, 404—
406, 447
молекулы умозаключений 302
мультидисциплинарный подход
31—33
мыслительная деятельность =
мышление = когнитивный
процесс 17, 19, 125—129,
157, 162, 168
мыслительные структуры
еж.концептуальные структуры
мышление см. мыслительная
деятельность
Надшаблон (paraplate) 324,333—
337
наречия 155—156, 442
научно-техническая революция
11—12
независимость анализа =
отделение (decoupling) а. 360—
362, 365
неоднозначность (ambiguity) 21,
112, 325, 343
— лексическая 174, 189, 215,
325
— местоименно-референцион-
ная 215, 325
— структурная = глубинно-
падежная 174, 189,215, 225,
325
Область действия [переменной]
178—179
образ фрейма = ОФ 310—311
образец (pattern) 197, 204, 275,
321—323, 392 (см. также
вызов процедур по образцу)
образное мышление 59—60
обратная связь 133, 381
общение см. коммуникация
объект1 см. предмет
объект2 [грамматическое
отношение]
— косвенный 90
— прямой 90—103
объект 3 [семантическое
отношение] см. пациенс
объяснение [языковой
деятельности] 158—160, 166—168
огрубление [при анализе] 15, 17
ожидания (expectations) 22, 43,
345, 404, 412—415, 418, 428,
433—434, 437—438 (см.
также запрос [ внутримаши нный]
описание [концептуальной
сущности] см. дескрипция
[концептуальной сущности]
452
определение см. дефиниция
опыт (expierience) 35, 38
организация [базы данных,
знаний, памяти] 38, 175, 185,
206, 263, 274, 275, 282—283,
302—303
орфографические ошибки 376—
377, 382—383, 388—389
ответы на вопросы 141, 171, 172—
173, 192-193, 272, 395 (см.
также диалог)
отделение анализа см.
независимость анализа
отказ [в работе программы] 388
отношение [в семантических
сетях] 230—232, 238 (ср.
падеж [глубинный,
семантический])
отрицание 111, 177, 179—184
Падеж [глубинный,
семантический] = роль
[семантическая] 48, 70, 93—95, 99, 104,
236, 256, 259—260, 327—329,
333—336, 349, 433—434 (ср.
отношение [в семантических
сетя х 1 )
память 35—38, 109, 228—229,
235, 413 (см. также модели
памяти)
— оперативная 36, 417, 438—
439
пациенс = объект 3 = OBJECT
48,49,68,99-100, 101,237,
239, 324, 328—332, 340
перебор 186—187
перевод 173
переменная 176, 277, 309—310
периферия предложения 96, 99,
101 (ср. ядро предложения)
перифразирование 262,376,385—
386, 393—399
перспектива [сцены] 88, 100, 105
поверхностная структура 62, 345
подбор (matching) [ситуативных
типов, образцов] 144—146,
147, 197
поиск [фактов] 195, 280—281,302
— проспективный 275—277
— ретроспективный 275, 276
полнота [системы вывода] 187
понимание 9—10, 13—14, 19, 20,
21,22, 74—79, 86, 124, 125,
135, 401, 406—407, 412, 447
(см. также анализ;
интерпретация)
понятие (concept) 230, 232, 237,
263—266 (ср.
концептуальная сущность)
— -тема (topic concept) 274—
276
порождение 208—210, 392
построение [предложений,
текста] = выражение [смысла]
74 (см. также синтез
[текста])
построение суждения = пропо-
зиционализация 18, 39, 45,
46—49
правила вывода (inference rules)
179—180, 324, 341—342, 343
(см. также вывод
умозаключений)
— частичные 342
прагматика 13—14, 106—107,
135—136
практические задачи
лингвистики 6—7, И
предикат 176, 238, 294 (см.
также глагол)
предлог 443—444
предмет = объект * 46—49
предметная область см.
микромир [системы]
предпочтительность [при
анализе] 325, 331-332, 344
представление — репрезентация
— действий 237, 256—258,
266—267
— знаний 9, 129, 228—229,
272—273, 282—283, 304,
365—368, 415, 435 (см. так-
же знания)
процедурное 268—270
(см% также программа vs.
данные)
— предложения, текста 236—
237, 239—241, 247—250,
253, 255—256
— свойств 195
— семантических сетей в
вычислительной машине 241—
244
— семантическое 12, 93, 174—
175, 184, 206, 255, 273, 282,
324, 434, 440
пресуппозиция 106
прикладная лингвистика 5—7,
453
IO, 14—15, 16 сн., 18,23—33
прилагательное 440
принцип резолюции 180, 181—
184, 186—187
программа vs. данные 283—286
(см. также представление
знаний процедурное)
программа vs. теория 282
программное обеспечение 375
пропозиционализация см.
построение суждения
пропозиция см. суждение
пропуск (skipping) слов [при
анализе] 406—407, 410—412,
417, 419—424, 426—428,
438—445, 447
противоречия 183, 194, 205—206
прототип 81, 114—115, 121, 141,
144 сн. (см. также
ситуативный тип; сцена-прототип)
психолингвистический
эксперимент = тест 15, 18, 40, 50,
51,63—66,67, 100, 141, 188,
190—193, 234—235, 279,
322—323, 342
пустой дизъюнкт (null clause)
183, 186
Ранг 104—105
расчленение эпизода (subchun-
king) 18, 39, 40—45, 63—67
расширенная сеть переходов
(augmented [state]
transition network = ATN) 226, 403
резюмирование (summarizing) =
реферирование 65—66, 67,
69, 173, 406
реляционная грамматика 94—96
репрезентация см. представление
референция 147
— именных групп 273
— местоимений 174, 189, 190—
192, 224, 293, 294, 325, 384
— неопределенная 148
— определенная 148—155
реферирование см.
резюмирование
рефлекторность умозаключений
298
речевой акт = коммуникативный
акт 77, 106, 139—140
риторика 78
роль [семантическая] см. падеж
[глубинный, семантический]
Сегментация текста 329—330
селекционные ограничения 114
семантика 12, 123—125, 135
— антропологическая 74
— вычислительная 8—10,12—
15, 17
— когнитивная 74
— лексическая 74, 120—121
— лингвистическая 12, 15
— vs. прагматика 135—136
— прототип на я 144
— ситуативная 17, 109
— процессуальная =
процедурная (procedural s.) 17, 19,
123, 124, 127, 129, 136, 137,
139, 140, 144, 147, 150—156,
159, 161, 163, 165
семантическая сеть (semantic
net) 21, 78, 228—229, 230-
271
семантические метаязыки см.
представление
«семантические специалисты»
[программы] 220—221
семантический блок 324, 333
семантический элемент
(semantic primitive) = компонент
[семантический] 254, 259,
262, 282, 324, 336, 343, 356,
445—447
семантическое поле 115
семантическое представление см.
представление
семантическое
сжатие текста 18
символическая система (symbol
, system) 126, 127—131, 164
(ср. символьная структура)
символьная структура (symbol
structure) 126, 127—131,
145—147 (ср. символическая '
система)
синонимия ИЗ, 384
синтаксис 39, 105, 137, 173—174,
273, 321, 325, 389, 393,
402—403, 405, 413
синтез [текста] 9, 18 (см. также
построение [предложений,
текста])
системная грамматика 218
системы искусственного интелле-
454
кта = системы ИИ 171,
214—216, 224,254, 286—287,
303, 374, 401—406, 447,
— второго поколения 319—
372
ситуативный тип (exemplar) 141
сн., 142—145 (см. также
прототип)
ситуация 17, 46, 415 (см. также
фрейм)
слово
— абстрактное 119
— конкретное 113
— многозначное 425
— общее ИЗ
— реляционное 444
— уточняющее 440—442
— функциональное 413, 442—
443
— эмоциональное 108
словарная статья 22, 436, 438—
439, 441, 442, 443, 444
словарь=лексикон 24, 91, 425—
428
— и энциклопедия 117—119
сложная система 162—163, 168
слушающий = адресат 19, 38—
39, 82, 106, 126, 131, 138,
149, 153 (см. также
интерпретатор)
смысл (sense) [слова] 174, 226,
259—262, 324, 326, 405
событие 41, 46, 63—67, 235—236,
263, 433—435, 441—442 (см.
также факт)
— главное 435
— интересное 434—435
согласованность при назывании
(agreement on naming) 50—
51, 53-55, 57
содержательно мотивированные
системы 214—216 (ср.
структурно мотивированные
системы)
сознание 36—38, 40, 125
союз 155—156, 444
способности [говорящего] 9, 132
стимул 36, 40
стратегия опорного множества
187
стрелка см. дуга
[направленная]
структура нижнего уровня 228,
229
структурная и прикладная
лингвистика 8
структурно мотивированные
системы 214—216 (ср.
Содержательно мотивированные
системы)
субъект [грамматический] 93—
98
суждение = пропозиция 39, 48,
68, 139
существительное 101
схема см. концептуальная схема
сцена 19, 44—45, 63, 65, 67, 69,
78, 80—87, 88—93, 95, 98,
108, 109—110, 434 (см.
также фрейм)
— -прототип 19, 81, 83—84, 85,
87—88, 108 (см. также
прототип)
сценарий 17, 22, 80, 88, 109, 308,
351, 414—415, 418—424,428,
434 (см. также фрейм)
Творческий характер языковой
деятельности 18, 59—72
текст 75—78, 407, 425, 435, 445,
447
теория 29, 163—164, 282
— аксиоматическая 160—162
терминал фрейма 305—308
тест см. психолингвистический
эксперимент
тип 232—234 (ср. класс; элемент)
типизация [при восприятии] 61—
63
трансформационная грамматика
226—227
Убеждения (beliefs) 36—37, 292
узел 230—244,247, 252, 259—263
266, 328—330, 335, 337
указатели [при поиске информа-
' ции] 175
умозаключения (inferences) 300—
302 (см. также вывод
умозаключений)
«упаковка» (packaging)
информации 39
употребление = использование
(use) языка 124, 131—132,
157, 168 (см. также
компетенция vs. употребление)
упорядочение фактов во времени
(book-keeping) 279
455
усвоение языка 167
устойчивость называния
(consistency in naming) 50—55,
57-58
утверждение (assertion) 197
— фрейма = УФ 308—314
Факт 172—173, 188, 193, 197,206,
243—244, 250, 252, 273—275,
277, 280-282, 288, 293—294
(см. также знания;
событие)
феноменологический уровень
359-360
фокус [категории] 50—51, 55—59
формула [семантическая] 324,
326, 341
фрейм (frame) 19, 43, 110, 113,
303,304—317,319—320, 351,
354, 361, 366—369 (см.
также ситуация; сценарий;
сцена; модель мира;
концептуальная схема)
— vs. «демон» 312—315
— сценарный 308
фундаментальные исследования
6, 26—28
функциональный сдвиг [частей
речи] 121
функции 176—177
— Сколема 181—182
Цель ! [семантический падеж]
99—103, 260
цель 2 [коммуникативная] 13—
14, 126, 132, 133
Шаблон (template) 324, 328—343
Эволюция языка 167
эксперимент см.
психолингвистический эксперимент
экстракция [тип шаблона] 339—
341
элемент (token) 232,» 263, 433,
435—438, 440—441 (ср. тип)
эллипсис 376—379, 382, 386, 389
—392
эпизод (chunk of content) 18, 39,
40, 76
Ядро (nucleus) предложения 96,
98, 100 (ср. периферия
предложения)
язык 7, 8, 10, 19, 33, 36, 38, 138—
139, 157, 166—167
язык мысли 129—131
AGENT см. агенс
ANTE 201, 203
ARPA 399
ASSERT 197
CONSE 198
ELI 404—407
ERASE 202
FIND 202
FRUMP 406—407
GOAL 197—198, 199—206
INTERLISP375,380-381,384-
385, 387, 389
ISA 231—234, 248—250, 252, 264
—266
LADDER 399
LIFER 374—375, 380—393, 398
ggg
LISP 195—196, 204-205, 375
LUIGI 269—270
MARGIE 254
MEMOD 269
MICRO-PLANNER 196-205,
221, 273, 281, 283
OBJECT см. пациенс
PARRY 320—323
PLANNER 196, 204—207, 225—
226, 272, 275, 283, 286
POLITICS 404—405
PROGRAMMAR 226
SAM 406—407
SHRDLU 204, 221, 224—225,
287
SIR 195—196, 230
SPINOZA-II 402—404
STUDENT 214, 224
TOPLE 287—296
УКАЗАТЕЛЬ ИМЕН
Абельсон (Abelson R.) 43, 73, 80,
308, 317, 351, 370, 415, 434,
445, 448
Андерсон (Anderson S. R.) 94, 95
Бах (Bach Е.) 93
Бартлетт (Bartlett F. С.) 43, 61,
65, 72
Бейли (Bailey С—J. N.) 169
Бейтсон (Bateson G.) 168, 169
Белоногов Г. Г. 9
Бертон (Burton) 374, 387,
400
Бирнбаум (Birnbaum L.) 22,
401
Бишоф (Bischof W. F.) 235,
270
Бобров (Bobrow D. G.) 16, 80,
145, 146, 169, 170, 214, 224,
400, 403, 446, 447, 448
Болинджер (Bolinger D.) 136,
169, 221, 328
Браун (Brown H. D.) 16
Браун (Brown R. W.) 50, 72
Браун (Brown J. S.) 374, 387,
400
Брэтли (Bratley P.) 449
Бугарский (Bugarski R.) 6, 25,
33
Бэк (Back О.) 25, 33
Вебер (Weber S.) 328, 355, 372,
449
Вежбицкая (Wierzbicka, Anna)
108
Вейнрейх (Weinreich U.) 221
Вейценбаум (Weizenbaum J.)
127, 170
Вэнс (Vance T. J.) 167, 169
Веттлер (Wettler) 356
Виноград (Winograd T.) 19, 22,
123, 145, 169, 170, 207, 216,
218—227, 268, 287, 319, 337,
339, 350, 361, 363, 365, 368,
370, 403, 446, 448, 449
Витгенштейн (Wittgenstein L.)
144, 170
Виленский (Wilensky R.) 415,
449
Вудс (Woods W. A.) 226—227,
374, 388, 403, 449
Гершман (Gershman A.) 404,
448
Голдман (Goldman N. M.) 254,
271, 344, 371
Голтон (Galton F.) 59, 73
Гордон (Gordon D.) 140, 169
Городецкий Б. Ю. 13
Готтвальд (Gottwald К.) 26, 34
Гоффман (Goffman Е.) 43, 73
Грейнджер (Granger R. H.) 404,
448
Грин (Green С. С.) 180, 207
Грос (Grosz, Barbara J.) 384,
400
Гроссман (Grossmann R. Е.) 167,
169
Де Йонг (De Jong G. F.) 406,
448
Джонсон (Johnson D.) 94
Джонсон-Лэйрд (Johnson-Laird
P.) 356, 371
Доннелан (Donnellan К. S.) 148,
153, 169
457
Доногью (Donoghue M.) 34
Дрейфус (Dreyfus H. L.) 127, 169
Ершов A. П. 9
Есперсен (Jespersen О.) 97
Замполли (Zampolli А.) 448
Звегинцев В. А. 13
Каллингфорд (Cullingford R.)
404, 412, 428, 448
Карбонелль (Carbonell J. G. Jr.)
404, 445, 448
Каплан (Kaplan R.) 16, 164, 169,
227, 400, 403, 448
Катц (Katz J. J.) 128, 169, 221,
328
Кинэн (Keenan, Edward L.) 95,96
Кларк (Clark H.) 342, 372
Колби (Colby К. M.) 16, 80, 320—
323, 355, 362, 370, 371
Коллинз (Collins A.) 16, 80, 169,
235, 400
Комри (Comrie B.) 95, 96
Кордер (Corder S. P.) 16, 25, 30,
33
Коул (Cole R. W.) 35, 74
Куиллиан (Quillian M. R.) 229,
232; 235, 271
Лабов (Labov W.) 114, 169
Лайонз (Lyons J.) 209
Лакофф (Lakoff G.) 80, 140, 143,
169
Лебовиц (Lebowitz M.) 22,
401
Ленерт (Lehnert W. G.) 16
Леннеберг (Lenneberg E. H.) 50,
-72
Леонтьева H. H. 13
Ли (Lea W. A.) 16
Ли (Li С.) 72
Лэм (Lamb S.) 402, 448
МакДермотт (McDermott D. V.)
287—296, 298, 303, 314
МакИнтош (Mcintosh A.) 34
МакКарти (McCarthy J.) 287,
319
Мальмберг (Malmberg B.) 33,
34
Маркс (Marx K.) 6, 10, 11
Маркус (Marcus M.) 448
Марслен-Уилсон (Marslen-Wil-
458
son W. D.) 408, 448
Миллер (Miller G. A.) 37, 73
Минский (Minsky M.) 43, 73, 80,
145, 164, 169, 271, 303—308,
317, 319, 360
Морган (Morgan J. L.) 147, 157
169
Myp (Moore T. E.) 73
Мюнстерберг (Münsterberg H.)
61, 73
Найда (Nida E. A.) 115
Никель (Nickel G.) 34
Новоселов А. П. 9
Норман (Norman D. А.) 145, 169,
170, 235, 267, 268, 269, 271
Ньюэлл (Newell А.) 127, 145, 164,
169, 170, 357, 404, 448
Нэш-Веббер (Nash-Webber В.)
16, 227, 400
Пайлайшин (Pylyshyn Z. W.) 59,
60, 73
Пальме (Palme J.) 251, 253—254,
271
Паркинсон (Parkinson R. С.)
320, 321, 371
Паивио (Paivio А.) 59, 73
Палмер (Palmer H. E.) 33, 34
Перлмуттер (Perlmutter D.) 94,
, 96
Перрен (Perren G.) 34
Перцова H. H. 13
Плат (Plath W. J.) 403, 448
Попов Э. В. 9
Поспелов Д. А. 9
Постал (Postal Р.) 94, 96
Рассел (Rüssel В.) 148, 170
Рафаэл (Rafael В.) 9, 195—196,
207, 230, 316, 345
Ригер (Rieger С.) 254, 271, 296—
303, 337, 343, 344, 351, 352,
363, 364, 368, 369, 371
Ризбек (Riesbeck С. К.) 254, 271,
320, 337, 344—351, 363, 371,
404, 412, 418, 429, 448
Розен (Rosen Е.) 170
Розенберг (Rosenberg) 148, 153,
169, 170
Рош (Rosch, Eleanor H.) 51, 73,
87, 144
Румельхарт (Rumelhart D, E.)
145, 170, 235, 271
Саймон (Simon H. A.) 127, 145,
169, 170
Сейдок (Sadock J. M.) 139,
170
Сейсердоти (Sacerdoti E. D.) 389,
399, 400
Сассман (Sussman G.) 196,
207
Селфридж (Selfridge M.) 417,
448
Серл (Searle J. R.) 139, 140,
170
Симмонс (Simmons R. F.) 264,
259—263, 268, 271, 319
Скороходько Э. Ф. 9
Скрэгг (Scragg G. W.) 8, 20, 184,
208, 228, 251, 253, 269, 285,
337, 354, 362, 368
Слама-Казаку (Slama-Cazacu,
Tatiana) 18, 23, 31, 34
Спиллнер (Spillner В.) 26, 29, 30,
32, 34
Сполский (Spolsky В.) 33,
34
Стерн (Stem H. H.) 30, 34
Стревенс (Strevens P.) 29, 33,
34
Стросон (Strawson P, F.) 148,
152—153, 170
Сэн (San L. J.) 167, 169
Сэндуолл (Sandewall E,) 250,
271
Тейтельман (Teitelman W.) 375,
400
Теньер (Tesniere L.) 92
Теслер (Tesler L.) 402, 449
Торн (Thorne J.) 403, 449
Томпсон (Thompson F. В.) 374,
400
Томпсон (Thompson В, H,) 374,
400
Трейвис (Travis) 148, 153, 169,
170
Трим (Trim J.) 34
Тьюринг (Turing А.) 322, 371
Уилкс (Wilks Y. А.) 8, 12, 20, 21,
171, 189, 190, 204, 208, 228,
254, 268, 272, 282, 288, 293,
299, 318, 319, 320, 324—344,
337, 339, 343, 344, 345, 348,
49, 350, 351, 354, 355, 356,
67, 361, 362, 363, 364, 365,
366, 368, 369, 370, 372, 403,
449
Уилсон (Wilson D.) 136, 170
Уинстон (Winston Р. Н.) 9, 80,
169, 196, 345
Уолкер (Walker D. Е.) 16, 382,
399, 400
Уолц (Waltz D. L.) 374, 400
Филлмор (FillmoreCh. J.) 19, 22,
74, 93, 104, 144, 169, 238,
326
Фодор (Fodor J. A.) 128, 169,
328
Фрейзер (Fraser J.) 403, 447
Фридл (Freedle R. О.) 72
Фэмхэм-Диггори (Famham-Dig-
gory, Sylvia) 169
Хант (Hunt E. В.) 9
Хармс (Harms R.) 93
Хейес (Hayes P. J.) 370, 371
Хейс (Hays D.) 255, 271
Хельбиг (Helbig G.) 92
Херсковиц (Herskovits А.) 333,
371
Хендрикс (Hendrix G. G.) 21,
373, 375, 387
Хилф (Hilf F. D.) 322, 371
Холлидей (Halliday M. А. К.)
29, 33, 34, 218, 227
Хомский (Chomsky N.) 94, 95,
128, 163, 166, 168, 169
Хохберг (Hochberg J. E.) 34, 73
Хьюитт (Hewitt С.) 196
Чарняк (Charniak E.) 8, 10, 20,
80,171,207,208,228,230, 245,
247, 250, 254, 272, 285, 288,
294, 295, 297, 298, 302, 308,
315, 316, 318, 319, 320, 337,
339, 342, 343, 351, 353, 354,
355, 357, 358, 360, 361, 362,
363, 364, 365, 366, 369, 370,
371
Чейф (Chafe W. L.) 18, 22, 35, 39,
68, 69, 72, 79, 448
Щай (Shuy RJ 169
Шенк (Schank R. С.) 12, 16, 17,
459
21, 22, 43, 73, 80, 184, 254—
259, 263, 268, 282, 296, 308,
317, 319, 320, 328, 337, 339,
344, 349, 351, 352—354, 355,
357, 360, 361, 362, 363, 364,
365, 366, 368, 369, 370, 401,
402, 404, 409, 415, 417, 434,
445, 448, 449
Шенкель (Schenkel) 92
Штаммерйохан
(Stammerjohann H.) 30, 34
Шуберт (Schubert L. К.) 240-
241, 247—249, 253, 271
Щерба Л. В. 8, 10, 15
Элетис (Alatis J.) 34
Энгельс (Engels F.) 10
Янссен (Janssen H.) 30, 34
СОДЕРЖАНИЕ
Б. Ю. Городецкий. Актуальные проблемы прикладной
лингвистики 5
Т. Слама-Казаку. Место прикладной лингвистики в
системе наук: отношение ПЛ к лингвистике. Перевод О. В»
Звегинцевой 23
У. Чейф. Память и вербализация прошлого опыта. Перевод
О. В, Звегинцевой 35
Ч. Филлмор. Основные проблемы лексической семантики.
Перевод О. В. Звегинцевой 74
Т. Виноград. К процессуальному пониманию семантики.
Перевод О. В. Звегинцевой 123
Ю. Чарняк. Умозаключения и знания. (Часть I). Перевод
Н. Я. Перцовой 171
Й. Уилкс. Анализ предложений английского языка. (Часть I).
Перевод H. Н. Перцовой 208
Г. Скрэгг. Семантические сети как модели памяти.
Перевод Т. С. Зевахиной , 228
Ю. Чарняк . Умозаключения и знания. (Часть II). Перевод
Я. Я. Перцовой 272
Й. Уилкс. Анализ предложений английского языка. (Часть II).
Перевод Я. Я. Перцовой 318
Г. Хендрикс. Вопросы инженерной психологии при
организации диалога на естественном языке в прикладных
системах. Перевод Я. Л Сабуровой 373
Р. Шенк, М. Лебовиц, Л. Бирнбаум. Интегральная
понимающая система. Перевод Т. С. Зевахиной 401
Предметный указатель. Составитель Т. С. Зевахина 450
Указатель имен. Составитель Т, С. Зевахина 457
ив m 1301
Редактор AI. А. Оборина
Художественный редактор к. III. Баласанова
Технический редактор А. П. Агафошина
Корректор Е. В, Рудницкая
Сдано в набор 18.05.82. Подписано в печать 13.01.83. Формат
84Xl08Vsa. Бумага типогр. № 1. Гарнитура литературная.
Печать высокая. Условн. печ. л. 24,36. Уч.-изд^л. 25,83. Тираж
4800 экз. Заказ № 534. Цена 2 р. 30 к. Изд. № 26696
Издательство «Радуга» Государственного комитета СССР
по делам издательств, полиграфии и книжной торговли.
Москва, 119021, Зубовский бульвар, 17
Набрано и сматрицировано в ордена Октябрьской Революции
и ордена Трудового Красного Знамени Первой Образцовой
типографии имени А. А. Жданова Союзполиграфпрома при
Государственном комитете СССР по делам издательств,
полиграфии и книжной торговли. Москва, М-54, Валовая, 28
Отпечатано в Ленинградской типографии № 2 головном
предприятии ордена Трудового Красного Знамени Ленинградского
объединения «Техническая книга» им. Евгении Соколовой
Союзполиграфпрома при Государственном комитете СССР по делам
издательств, полиграфии и книжной торговли. 198052, г.
Ленинград, Л-52, Измайловский проспект,- 29.