НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ. ВЫПУСК 23. Когнитивные аспекты языка
Дж. Лакофф. Мышление в зеркале классификаторов.
Ч. Филлмор. Фреймы и семантика понимания.
М. Бирвиш. Насколько линейно упорядоченной является языковая обработка.
Т. А. ван Дейк и В. Кинч. Стратегии понимания связного текста.
Д. Шпербер, Д. Уилсон. Релевантность.
Ф. Джонсон-Лэрд. Процедурная семантика и психология значения.
У. Ленерт. Проблемы вопросно-ответного диалога.
М. Минский. Остроумие и логика когнитивного бессознательного.
Предметный указатель. Составила С. Н. Сухомлинова.
Текст
                    НОВОЕ В ЗАРУБЕЖНОЙ
ЛИНГВИСТИКЕ
ВЫП. XXIII
КОГНИТИВНЫЕ АСПЕКТЫ ЯЗЫКА
Составление, редакция
и вступительная статья
В. В. ПЕТРОВА и В. И. ГЕРАСИМОВА
МОСКВА
«ПРОГРЕСС»
1988


ББК 81 H 74 Редколлегия серии «Новое в зарубежной лингвистике»: \В. А. Звегинцев\ (председатель), А. К. Авеличев, И. Д. Арутюнова, Б. Ю. Городецкий, В. К. Журавлев, Ю. И. Караулов, В. П. Нерошак, Т. М. Николаева, М. А. Оборина (отв. секретарь), В. В. Петров, Б. А. Серебренников, Б. А. Успенский Редактор M. А. Оборина Редакция литературы по гуманитарным наукам €) Составление, переводы на русский язык, вступительная статья — издательство «Прогресс», 1988
НА ПУТИ К КОГНИТИВНОЙ МОДЕЛИ ЯЗЫКА 1. Еще сравнительно недавно в лингвистике считалось вполне приемлемым рассматривать язык в качестве некой абстрактной сущности, как если бы естественный язык не являлся частью нашей естественной истории. Многие из нас были свидетелями расцвета структурной лингвистики, область исследований которой ограничивалась ,,языком в себе и для себя". Какие-либо разговоры в рамках этого направления о связи языка и мысли, языка и познавательных процессов не одобрялись и тем более не приветствовались. Вполне допустимо, что язык действительно обладает своей собственной автономной жизнью. Вероятно также, что он может быть описан в таком ракурсе, который игнорирует другие, сопутствующие языку проявления человеческого разума. Однако, хотя подобные трактовки и возможны, все же остается открытым вопрос — какую ценность имеют такие описания? И дело не только в более прагматичном климате восьмидесятых годов, который оставляет все меньше надежд на возможность „чистого", „незамутненного" практическими соображениями теоретизирования. Суть в том, что меняется сама парадигма научных исследований. Если раньше фундаментальные науки „поставляли" теоретические идеи, которые со временем воплощались в соответствующие технологии, то сейчас часто происходит обратное — потребности развития той или иной технологии задают направление и масштаб теоретическим изысканиям. Применительно к лингвистике такой „базовой" технологией является развитие вычислительной техники, перспективных систем с искусственным интеллектом. При этом важно заметить, что если лингвистика окажется не подготовленной к новым условиям своего существования, то она рискует утратить приоритет в изучении ряда важных проблем языковой коммуникации. В середине шестидесятых годов и позднее многие лингвисты придерживались точки зрения, согласно которой существует жесткое разграничение между языковой компетенцией и употреблением языка. Подобное искусственное деление, игнорирующее многие процессы, происходящие в ходе действительного использования языка, привело к известным, весьма серьезным трудностям. Как мы сегодня хорошо понимаем, язык — это лишь небольшая часть того 5
целостного явления, которое мы стремимся познать. Именно поэтому современные исследования языка невозможны без привлечения таких понятий, как интенция, память, действие, семантический вывод и т. д. Участвуя в актах коммуникации, мы либо понимаем то, что говорят другие, либо сами порождаем высказывания. В первом случае нашей действительной целью является понимание мыслей, выражаемых с помощью языка. Язык—это средство передачи мысли и как таковой выступает главным образом в виде своеобразной ,,упаковки". Однако знания, используемые при его декодировании, отнюдь не ограничиваются знаниями о языке. В их число входят также знания о мире, социальном контексте высказываний, умение извлекать хранящуюся в памяти информацию, планировать и управлять дискурсом и многое другое. При этом ни один из типов знания не является более важным для процесса понимания, ни одному из них не отдается явное предпочтение. Только изучение способов взаимодействия и организации всех типов знаний приближает нас к пониманию сути языковой коммуникации, способствует прояснению природы семантического вывода, осуществляемого в повседневной практике употребления языка. Изучение знаний, используемых в ходе языкового общения, рассматривается как одно из ведущих направлений когнитивной науки. В связи с этим обратим внимание и на то, что сам термин ,,когнитивная наука" с середины 70-х годов стал употребляться для обозначения области, в рамках которой исследуются процессы усвоения, накопления и использования информации человеком1. Не случайно один из основных вопросов психологии—вопрос о детерминации поведения человека—получил в когнитивной психологии следующий ответ: поведение человека детерминировано его знаниями. Решающая роль отводится знаниям и в системах искусственного интеллекта, где само понятие интеллекта нередко связывается со способностью использовать ,,необходимые знания в нужное время". Согласно современным представлениям, навеянным во многом разработками в области искусственного интеллекта, основной задачей общей теории языка является объяснение механизма обработки естественного языка, построение модели его понимания. Коль скоро в основе такой модели лежит тезис о взаимодействии различных типов знания, то лингвистика уже не обладает монополией на построение общей модели языка. Ее создание возможно только в рамках всей когнитивной науки. В настоящее время, несмотря на наличие весьма значительного числа работ в области когнитивных аспектов языка2, парадигма 1 См. подробнее: Величковский Б. М. Современная когнитивная психология. М., 1983; ,,Advances in Cognitive Science" (ed. by N. E. Sharkey). New York, 1986. 2 См. последние переводные работы в этой области: ,,Обработка естественных языков" (Тематический выпуск).—,,Труды института инженеров по электротехнике и радиоэлектронике", 1986, том 74, № 7; ,,Представление знаний" (Тематический выпуск).—,,Труды института инженеров по электротехнике и радиоэлектронике", 1986, том 74, № 10. 6
исследований еще окончательно не сложилась. Этим и объясняется известная фрагментарность публикуемых в сборнике статей. Тем не менее нам кажется важным проиллюстрировать различные новые подходы к чрезвычайно сложной и актуальной в практическом отношении проблеме, какой являются когнитивные аспекты функционирования языка. В настоящем сборнике публикуются статьи, в которых обсуждаются две центральные проблемы когнитивного подхода к языку: 1. Структуры представления различных типов знания. 2. Способы концептуальной организации знаний в процессах понимания и построения языковых сообщений. Конечно, предлагаемые работы далеко не полностью покрывают указанные проблемы. Скорее они ориентируют на наиболее перспективные пути исследований, стимулируя тем самым отечественные разработки в области когнитивной лингвистики. 2. Ряд статей сборника посвящен проблемам представления знаний, используемых в процессах языковой коммуникации. При этом эксплицитно выраженные знания составляют лишь незначительную часть общей базы знаний носителей языка. С точки зрения современных подходов, эта база знаний не является статическим „хранилищем информации" — она представляет собой самоорганизующуюся и саморегулируемую систему, подвижную и изменяющуюся на основе новых данных. В состав базы знаний входят по меньшей мере следующие компоненты: 1) языковые знания: а) знание языка—грамматики (с фонетикой и фонологией), дополненное знанием композициональной и лексической семантики; б) знания об употреблении языка; в) знание принципов речевого общения; 2) внеязыковые знания: а) о контексте и ситуации, знания об адресате (в том числе знание поставленных адресатом целей и планов, его представления о говорящем и об окружающей обстановке и т. д.); б) общефоновые знания (то есть знания о мире): знания о событиях, состояниях, действиях и процессах и т. д. Вопросы о составляющих базы знаний исследованы в общем-то достаточно полно. Гораздо большие трудности возникли в ходе поиска соответствующих структур их представления. Отличаются ли, например, структуры, предназначенные для представления прагматической информации, от тех, которые применяются для представления синтаксической информации? Иными словами, существует ли особый уровень синтаксических представлений? Какими представлениями оперирует человек в процессе понимания языка? Вот далеко не полный перечень возникающих вопросов. Одним из важных результатов более чем десятилетнего развития когитологии является идея о неразрывной взаимосвязи процессов, происходящих в человеческой памяти, а также определяющих построение и понимание языковых сообщений. Действительно, пони- 7
мание некоторой новой ситуации сводится прежде всего к попытке найти в памяти знакомую ситуацию, наиболее сходную с новой. Мы можем обрабатывать новые данные, не иначе как обратившись к памяти о ранее накопленном опыте. Этот поиск основывается на том, что структуры, применяемые для обработки новых данных, аналогичны используемым для организации памяти. Фундаментальное значение прошлого опыта для запоминания и понимания языковых высказываний было впервые продемонстрировано еще в тридцатые годы Ф. Бартлеттом, который на основе изучения особенностей припоминания текста обнаружил, что память практически никогда не бывает буквальной3. При воспроизведении текста по памяти нередко производится его модификация, осуществляющаяся в соответствии с познавательными стереотипами и нормами, принятыми в данной социальной среде. Для описания целесообразного представления информации в памяти Ф. Бартлетт использовал понятие схемы, под которой он понимал активную организацию прошлого опыта. Одной из первых и безусловно наиболее простых структур для представления семантических данных высокого уровня явились сценарии4. Сценарий представляет собой набор объединенных временными и причинными связями понятий низшего уровня, описывающий упорядоченную во времени последовательность стереотипных событий. Примером описания некоторой разворачивающейся во времени ситуации с помощью сценария может служить представление последовательности событий, связанных с посещением врача, магазина, ресторана и т. п. В лингвистике—в отличие от теории искусственного интеллекта— утвердилось в большей степени не понятие ,,сценария", а понятие ,,фрейма". В публикуемой обширной статье Ч. Филлмора дается подробная характеристика теории фреймов, сравнивается семантика понимания и семантика истинности. Практически фреймовые представления присутствуют в той или иной степени в большей части статей сборника. Структуры знаний, именуемые фреймами, схемами, сценариями, планами и т. п., представляют собой пакеты информации (хранимые в памяти или создаваемые в ней по мере надобности из содержащихся в памяти компонентов), которые обеспечивают адекватную когнитивную обработку стандартных ситуаций. Эти структуры играют существенную роль в функционировании естественного языка: с их помощью устанавливается связность текста на микро- и макроуровне, обеспечивается вывод необходимых умозаключений, их активацией объясняются, например, некоторые особенности выражения категории определенности/неопределенности в артиклевых языках. Наконец, они „поставляют" контекстные ожидания, позволяющие прогнозировать будущие события на основе ранее встречавшихся сходных по структуре событий. 3 См.: Bartlett F. Remembering. Cambridge, 1932. 4 См. об этом подробнее: Schank R. С. Dynamic Memory. New York, 1982. 8
Хорошим примером структуры, предназначенной для представления прагматических знаний, являются стратегии, детально описанные в книге Т. ван Дейка и В. Кинча ,,Стратегии понимания связного текста", главы из которой публикуются в настоящем сборнике. Авторы уделяют особое внимание динамическим аспектам понимания связного текста5, полагая, что процессы понимания имеют стратегическую природу. Используемые при понимании текста стратегии в большинстве случаев не являются заранее запрограммированными, намеренно осуществляемыми или осознанными — чаще всего они остаются вне сферы сознательного контроля со стороны индивида, использующего язык. Следует отметить и их гибкость, зависимость от наличных когнитивных структур (таких, как знания, установки, планы, намерения) и от когнитивных ограничений типа предельного объема кратковременной памяти. Действие стратегий носит гипотетический и вероятностный характер; с их помощью производится быстрое и эффективное прогнозирование наиболее вероятной структуры или значения воспринимаемых языковых сообщений. Стратегии характеризуются также одновременным действием на нескольких уровнях, способностью использовать неполную информацию и комбинировать как индуктивные, так и дедуктивные способы обработки. Часть стратегий имеет собственно лингвистический характер. Это относится, например, к стратегиям, соотносящим поверхностные структуры текста с базисными семантическими репрезентациями. Другие являются по преимуществу когнитивными—решающее значение для их действия имеют знания о мире, ситуации и другая когнитивная информация. В публикуемых главах из книги Т. ван Дейка и В. Кинча рассматриваются и другие важные вопросы—о связи модели ситуации и репрезентации текста, о роли ситуативного и социально-культурного контекста в понимании и порождении связного текста, обсуждаются различные виды ограничений когнитивной модели обработки языка. Имеет смысл также отметить и полностью противоположный подход к решению проблемы представления знаний6. Его сторонники утверждают, что отнюдь не знания являются ключевым звеном в решении проблемы обработки естественного языка. Поскольку процессы обработки осуществляются конкретными людьми, то решающее значение, с точки зрения этих авторов, имеют те характеристики, которые не подлежат стереотипизации и концептуальному моделированию. Здесь имеется в виду прежде всего целеполагание, формирование и удовлетворение потребностей, эмоциональные состояния, скрытые мотивы, мировоззренческие ценно- 5 См. также: „Text Connectedness: from Psychological Point of View (ed. by I. Petofi). Hamburg, 1986. 6 См.: Dreyfus H., Dreyfus S. Mind over Machines: The Power of Human Intuition and Expertise in the Era of the Computer. Oxford, 1986; „Artificial Intelligence: The Case Against" (ed. by Born R.). London, 1987. 9
сти и т. д. Как бы сочувственно мы ни относились к этой точке зрения, факт создания работающих вычислительных систем, основанных на концепции представления знаний, остается все же бесспорным. 3. Большую часть статей сборника составляют работы, в которых анализируются различные аспекты концептуальной организации знаний в процессах понимания и порождения высказываний. Вообще говоря, проблемы организации знаний и способы их представления теснейшим образом связаны между собой в рамках более общей проблемы обработки естественного языка. Но если методы представления знаний интенсивно развивались в связи с работами в области искусственного интеллекта на протяжении последних двадцати лет, то вопросы организации знаний были поставлены только в последние годы. В восьмидесятые годы было сформулировано несколько конструктивных идей, относящихся к изучению концептуальной организации знаний. К ним, в частности, относится выдвинутая Р. Шенком и его последователями гипотеза об интегральном характере обработки естественного языка. В соответствии с ней обработка языковых данных представляет собой единый процесс и происходит параллельно на всех уровнях—синтаксическом, семантическом и прагматическом. Семантическая интерпретация не обязательно должна осуществляться только после завершения синтаксического анализа. Она может начаться и ранее на основе имеющейся информации о синтаксических структурах, а во время синтаксического анализа может использоваться семантическая и прагматическая информация. Результаты обработки, полученные на каком-либо из уровней, доступны для всех других уровней. Существует два возможных способа межуровневого взаимодействия: в одном случае взаимодействие является иерархически организованным (несмежные уровни взаимодействуют через промежуточные); во втором—имеет место ,,перекрестная коммуникация" между уровнями, при которой каждый из уровней может непосредственно взаимодействовать со всеми другими7. В публикуемой статье М. Бирвиша углубляется идея интеграль- ности обработки и одновременно выявляются многочисленные трудности, стоящие на этом пути. Автор обосновывает преимущества интерактивных моделей, позволяющих осуществлять гибкую обработку языка. В конечном счете, в основе гипотезы об интегральное™ обработки лежит более глобальная идея о существовании единого уровня представления знаний, на котором оказываются совместимыми языковая, сенсорная и моторная информации8. 7 См.: ,,Parallel Distributed Processing: Explorations in the Microstructure of Cognition". Cambridge, 1986. 8 Jackendoff R. Semantics and Cognition. Cambridge, 1984. 10
Вряд ли можно считать правдоподобным, что в конкретных коммуникативных актах используется вся совокупность знаний и представлений, находящихся в распоряжении ее участников. Поэтому необходимой становится разработка такого концептуального средства, которое ограничивало бы множество факторов, привлекаемых к интерпретации высказываний. В связи с этим в литературе фигурируют понятия ,,фокуса" и „релевантности". В публикуемой главе из книги Д. Шпербера и Д. Уилсон обсуждается понятие динамического контекста как ограниченного множества релевантных параметров данной коммуникативной ситуации. Существенная роль фокуса при понимании вопросов и ответов анализируется в статье У. Ленерт. М. Минский, рассматривая в своей статье проблему концептуальной организации знаний, предлагает ввести систему „когнитивных цензоров", запрещающих определенные формы речевого поведения. В его статье содержится немало тонких наблюдений относительно более общих проблем—связи психологии и генетики, аффекта и интеллекта и т. д. Гораздо более широкому кругу проблем, нежели это следует из названия, посвящена и статья известного американского лингвиста Дж. Лакоффа. В настоящее время одним из наиболее перспективных направлений, в котором сочетаются проблемы представления и организации знаний, является процедурная семантика. Представление знаний о динамическом окружении дается здесь не в форме набора правил, а в виде процедур. Такой подход особенно предпочтителен для формулирования экспертных систем, являющихся по своей природе процедурными. Отличаются также, как это показано в работе Ф. Джонсо- на-Лэрда, и способы организации знаний в процедурной форме. Представленный в публикуемых статьях перечень проблем, конечно, далеко не исчерпывающий. Когнитивный подход к языку— динамично развивающееся направление, где результаты обновляются чрезвычайно быстро. Удачные решения, найденные для проблем, возникающих при обработке естественного языка, безусловно, скажутся в области теории и практики вычислительных систем, поисково-информационных систем, машинного перевода. Однако при этом не надо забывать, что исследования в области когнитивных аспектов языка способствуют не только эффективному решению прикладных задач, но и углублению наших представлений о скрытых механизмах языковой коммуникации. Нас по-прежнему, как и много столетий назад, волнуют вопросы о том, что можно сделать, чтобы мы лучше понимали друг друга? В какой степени язык точно и полно выражает наши мысли и чувства? И мы еще, как и ранее, очень далеки от полного прояснения этих проблем. В. И. Герасимов, Б. В. Петров
Дж. Лакофф МЫШЛЕНИЕ В ЗЕРКАЛЕ КЛАССИФИКАТОРОВ* ЖЕНЩИНЫ, ОГОНЬ И ОПАСНОСТЬ Борхес приписывает древней китайской энциклопедии под названием ,,Небесная сокровищница благостных знаний" следующую классификацию животного мира: «На этих древнейших страницах написано, что животные делятся на: (а) принадлежащих императору, (б) набальзамированных, (в) тех, которых можно дрессировать, (г) молочных поросят, (д) русалок, (е) сказочных, (ж) бродячих собак, (з) включенных в данную классификацию, (и) дрожащих, как сумасшедшие, (й) бесчисленных, (к) нарисованных очень тоненькой кисточкой из верблюжьего волоса, (л) прочих, (м) только что разбивших вазу для цветов, (н) издали напоминающих мух» (Borges, 1966, р. 103). Написанное Борхесом относится, конечно, к области фантастики. Перечисленные категории животных не только не являются естественными категориями человеческого мышления — они не могут быть таковыми. Однако по некоторой причине этот отрывок можно отнести к области искусства, а не к области фантастики: он производит примерно такое же впечатление, какое получает европеец, читая описания языков и культур, распространенных за пределами Западной Европы. Дело в том, что различные народы мира классифицируют реалии так, что это поражает своей неожиданностью европейцев и ставит в тупик западных лингвистов и антропологов. В большинстве случаев лингвист или антрополог просто осознает свою беспомощность и ограничивается составлением списка, подобного тому, который было бы неудивительно встретить в произведениях Борхеса. Прекрасный пример такого рода — классификация реалий окружающей действительности, представленная в традиционном варианте дьирбала (Dyirbal) — языка аборигенов Австралии. Классификация встроена в язык, что обычно для всех языков мира. Говорящий на языке дьирбал перед каждым существительным в предложении должен употребить какую-либо из форм одного из следующих четырех слов: bayi, balan, balam, bala. В языке дьирбал с помощью * George Lakoff. Classifiers as a reflection of mind.— In: ,,Noun Classes and Categorization". (Ed. by C. Craig). Amsterdam, 1986. © 1986 by George Lakoff. 12
этих слов классифицируются все предметы окружающего мира. Поэтому, чтобы правильно говорить на этом языке, нужно употреблять перед каждым существительным соответствующий классификатор. С известным упрощением используемая в языке дьирбал классификация реалий может быть представлена следующим образом (по Dixon, 1982): (I) bayi мужчины, кенгуру, опоссумы, летучие мыши, большая часть змей, большая часть рыб, некоторые птицы, большая часть насекомых, луна, грозы, радуги, бумеранги, некоторые типы копий и т. д. (II) balan женщины, бандикуты (сумчатые барсуки), собаки, утконосы, ехидна, некоторые змеи, некоторые рыбы, большая часть птиц, светлячки, скорпионы, сверчки, волосатый червь (the hairy тагу grub), все, связанное с водой или огнем, солнцем и звездами, щиты, некоторые типы копий, некоторые деревья и т. д. (III) balam все съедобные фрукты и растения, на которых они произрастают, клубни, папоротники, мед, сигареты, вино, лепешки (IV) bala части тела, мясо, пчелы, ветер, заостренные палки, некоторые типы копий, большая часть деревьев, трава, грязь, камни, звуки, язык и т. д. Это список, который мог бы доставить удовольствие любому почитателю Борхеса. Но Диксон не ограничился составлением списка. Он стремился узнать, благодаря чему эти категории являются категориями человеческого мышления, значимыми для носителей языка дьирбал,— категориями, которыми все носители дьирбала овладевают в равной степени и которые они употребляют автоматически. В результате полевых исследований Диксон пришел к тому выводу, что носители языка не усваивают категориальную принадлежность каждого существительного, взятого в отдельности, а руководствуются рядом общих принципов. Ход рассуждений Диксона был следующим. Во всех случаях, за исключением тех, когда доминирует какой- либо особый принцип, классификация осуществляется в соответствии с базовой продуктивной и относительно простой схемой. Предложенная Диксоном базовая схема выглядит следующим образом: (I) bayi (человеческие) особи мужского пола; животные (II) balan (человеческие) особи женского пола; вода; огонь; битва (III) balam вегетарианская пища 13
(IV) bala все существительные, не вошедшие в три первых класса. В эту схему укладываются следующие примеры: мужчины, будучи человеческими особями мужского пола, включаются в класс I. Кенгуру и опоссумы, являясь животными, включаются в класс I. Женщины принадлежат классу II, поскольку они — человеческие особи женского пола. Реки и болота, будучи водными поверхностями, принадлежат классу II. Огонь включается в класс II. Дикие винные ягоды принадлежат классу III. Клубни включаются в класс III. Неплодоносящие деревья относятся к классу IV. Камни принадлежат классу IV. Язык включается в класс IV. Особый интерес представляют примеры, в которых Диксону удалось раскрыть еще более глубинные принципы, лежащие в основе приведенной выше схемы классификации. По-видимому, наиболее общий принцип, который Диксон считает само собой разумеющимся и даже не находит нужным сформулировать эксплицитно,— это принцип, который я назвал бы "Принципом сферы опыта". Принцип сферы опыта: Если существует сфера опыта, ассоциирующаяся с А, то все реалии этой сферы, естественно, принадлежат той же категории, что и А. Например, рыбы, будучи одушевленными существами, относятся к классу I. Приспособления для рыбной ловли (остроги, леска и т. п.) также относятся к классу I, хотя, не являясь ни одушевленными, ни съедобными, они могли бы принадлежать классу IV. Точно так же растения, приносящие съедобные плоды, относятся к тому же классу III, что и эти плоды. Если бы Принцип сферы опыта не действовал, можно было бы ожидать, что плодовые деревья включались бы в класс IV вместе со всеми остальными деревьями. И действительно, если речь идет именно о древесине плодового дерева — допустим, в связи с заготовкой дров или изготовлением какого-либо приспособления, — то используется классификатор bala (класс IV). Свет и звезды, относящиеся к той же области опыта, что и огонь, принадлежат наряду с ним классу II. Боевое снаряжение (например, копья) и поле битвы относятся к той же области опыта, что и битва, и поэтому включаются так же, как битва, в класс П. По-видимому, самое поразительное открытие Диксона, позволяющее к тому же интерпретировать случаи наиболее явных отклонений от основной схемы классификации,— это открытие принципа, который я назову ,,Принципом мифа и поверья": Если какое-либо существительное обладает характеристикой X (по которой оно может быть отнесено к определенному классу), но вместе с тем на основе поверья или мифа оно обладает характеристикой Y, то, как правило, оно принадлежит классу, в 14
который включаются существительные с характеристикой Y, а не X. Хотя птицы—одушевленные существа, их не относят к классу I вместе с другими одушевленными существами. У носителей языка дьирбал существует поверье, что птицы—это души умерших женщин, и поэтому птицы принадлежат классу II. В так называемом ,,языке свекрови" или ,,языке тещи" (mother-in-law) племени дьирбал (который используется при общении с табуированными родственниками противоположного пола) для обозначения птиц и душ женщин есть только одно слово — balan muguyngan. Названия некоторых птиц представляют исключения из этого правила. Три вида трясогузок в мифах отождествляются с мужчинами и поэтому так же, как мужчины, включаются в класс I. Существует миф, в котором пестрый дронго (птица из отряда воробьиных) похищает огонь из когтей радуги-змеи, поэтому пестрый дронго принадлежит классу II так же, как огонь. Диксон утверждает, что встречается целый ряд подобных примеров. Так, в мифах сверчки отождествляются со старухами и поэтому включаются в класс II. По мифологическим представлениям, луна и солнце—муж и жена; соответственно луна относится к классу I, как и другие мужья, а солнце—к классу II, как и другие жены. Волосатый червь, ожог которого сравнивается с солнечным ожогом, включается в класс II вместе с солнцем. Ветер относится к классу IV, но грозы и радуга, которые в мифах отождествляются с мужчинами,— к классу I. Диксон формулирует еще один принцип — „Принцип важной особенности": Если подмножество существительных обладает определенной важной особенностью, которая отсутствует у остальных членов множества, то члены этого подмножества в целях маркирования данной особенности могут быть отнесены к иному классу, чем вся остальная часть множества. Чаще всего такой важной особенностью является „вредоносность". Большая часть рыб относится к классу I наряду с другими одушевленными существами, но морской ерш (скорпена) и сарган (морская щука) опасны и поэтому включаются в класс П. Эти два вида рыб не подводятся под родовое понятие ,,рыбы", и поэтому для их обозначения не может быть использовано родовое имя jaby (,,рыба"). Деревья, кусты, ползучие или вьющиеся растения и травы, не имеющие съедобных частей, относятся к классу IV. Но два вида колючих деревьев и жгучая крапива относятся к классу II вместе с прочими вредоносными реалиями. Если бы Принцип важной особенности не действовал, ястреб включался бы в класс II вместе с другими птицами, но, поскольку ястребы опасны, эта их особенность маркируется включением в другой класс—класс I. Во многих случаях эти принципы позволяют интерпретировать классификацию заимствований. Фрукты, мука, пирог (который делают из муки) и вино (которое делают из фруктов) принадлежат 15
классу III. Белый мужчина принадлежит классу I, а белая женщина— классу II. Спички и курительные трубки (которые ассоциируются с огнем) относятся к классу II, к этому же классу принадлежит и огонь, но сигареты (ассоциирующиеся с употреблением листьев табака) относятся к классу III. Однако Диксон не считает, что вся классификация существительных в дьирбале основана на этих принципах. Он приводит небольшое число исключений, которые ему не удалось интерпретировать и для которых, возможно, и не существует интерпретации—или же если она и существовала, то впоследствии была утрачена. Например, неизвестно, почему собаки, сумчатые барсуки, утконос и ехидна относятся к классу II, а не к классу I. Из числа заимствованных слов деньги (не ассоциирующиеся ни с одной из реалий традиционной культуры дьирбала) неожиданно оказываются отнесенными к классу I. Но число подобных исключений невелико. Результаты, полученные Диксоном, поразительны. Ему удалось показать, что классификация, представляющаяся на первый взгляд европейцу столь же фантастической, как и классификация, придуманная Борхесом, является, с точки зрения использующих ее людей, вполне закономерным и основанным на определенных принципах способом классификации окружающей действительности. Попутно Диксон дал великолепный пример того, как работает человеческий разум. Хотя детали представленной категоризации могут быть характерны только для дьирбала, общие принципы, лежащие в ее основе, постоянно обнаруживаются в различных системах классификации. К их числу относятся: — Центральность. Основные члены категории являются центральными. Трясогузки и луна отстоят от центра категории I дальше, чем мужчины. Жгучие растения, сарган и волосатый червь отстоят от центра категории II дальше, чем женщина. — Цепочечная связь. Сложные категории образуются с помощью цепочечной связи; центральные связываются с менее центральными членами категории, которые в свою очередь связываются с периферийными членами, и т. д. Например, женщины ассоциируются с солнцем, которое ассоциируется с солнечным ожогом, который в свою очередь ассоциируется с волосатым червем. Именно благодаря существованию такой цепочки червь принадлежит той же категории, что и женщины. — Сферы опыта. В каждой культуре существуют специфические для нее сферы опыта, которые определяют связи в категориальных цепочках. — Идеальные модели. Существуют идеальные модели мира (в их число входят мифы и различные поверья), которые также могут задавать связи в категориальных цепочках. — Специфическое знание. Специфическое знание получает при категоризации преимущество перед общим знанием. — Прочее. Борхес был прав. В концептуальных системах может быть класс ,,все прочее". Естественно, что в этом классе не может быть центральных членов, цепочечных связей и т. п. 16
— Отсутствие общих характеристик. В целом, в основе категорий не обязательно должны лежать общие для всех членов категории характеристики. Нет никаких оснований предполагать, что для носителей языка дьирбал существует нечто общее между женщинами, огнем, опасными предметами и т. п. Насколько известно, носители языка дьирбал не считают, что в огне или опасности есть нечто женственное или же что женщина каким-то образом связана с огнем или опасностью. Вместе с тем общие свойства играют определенную роль в характеризации основных представителей категории (съедобное растение, человеческая особь мужского пола, человеческая особь женского пола). — Мотивация. Перечисленные выше общие принципы делают классификацию существительных в дьирбале осмысленной, но не позволяют предсказать точно, каковы возможные категории этой классификации. Из всех перечисленных принципов классификации мотивация является наименее очевидным и поэтому заслуживает особого внимания. Существует огромное различие между принципами, которые мотивируют или позволяют осмыслить систему, и принципами, которые порождают или позволяют прогнозировать систему. Исследования Диксона дают возможность объяснить, почему система языка дьирбал является системой, которой могут пользоваться люди, но не предсказывают точно, какова эта система. К примеру, необходимо знать, какие области опыта значимы, а какие незначимы для категоризации. Известно, например, что рыбы живут в воде и что рыбы относятся к классу I, но из этого не следует ни что вода относится к классу I вместе с рыбами, ни что рыбы принадлежат классу II вместе с водой. Сфера обитания вообще нерелевантна для классификации существительных в дьирбале. Носители этого языка просто должны знать, какие области опыта значимы для классификации и какие мифы и поверья учитываются в ней. Предсказуемой является лишь тенденция системы классификации быть структурированной определенным образом, то есть тенденция к организации вокруг центра, наличие цепочечных связей и т. д. Теория категоризации позволяет предсказывать, какими могут и какими не могут быть системы классификации, но не позволяет точно прогнозировать состав какой-либо категории определенного языка или культуры. 1. ДАННЫЕ, ПРЕДСТАВЛЯЕМЫЕ ПРОЦЕССАМИ ВЫМИРАНИЯ ЯЗЫКА В целом, исследование Диксона позволяет осмыслить систему классификации дьирбала. Но как убедиться в правильности такого осмысления? Не может ли оно быть результатом произвольного анализа с внешней по отношению к языку позиции? Не походит ли оно на интерпретацию литературного произведения, навязываемую критиком? Как удостовериться, что анализ Диксона, отражает определенную психологическую реальность.' 2-1182 17
Прежде всего необходимо сказать, что фактически анализ был проведен не самим Диксоном. Пояснения классификации, которые он приводит,— это те самые пояснения, которые давали ему носители языка. Это интерпретации, данные самими носителями дьирбала для тех частей классификационной системы, для которых у них имелось осмысленное объяснение. К тому же существуют некоторые косвенные доказательства того, что в целом интерпретация Диксона верна. Эти доказательства проистекают из одной неблагоприятной ситуации. Первые полевые исследования дьирбала Диксон проводил в 1963 г. В этот период англоязычная австралийская культура еще не так сильно вторглась в традиционную культуру носителей дьирбала. Но в последующие годы дети носителей дьирбала стали учиться в англоязычных школах, а австралийская культура заметно продвинулась в вытеснении культуры дьирбала. В 1983 г., всего через двадцать лет, культура носителей языка дьирбал и сам язык дьирбал вымирают. Для нового, подрастающего поколения основным языком становится английский; оно владеет только очень упрощенным вариантом дьирбала. Опыт этого поколения резко отличается от опыта родителей: этому поколению либо вообще неизвестны мифы, либо оно считает, что мифы не играют какой-либо значительной роли в его жизни. Как и следовало ожидать, одним из результатов этих процессов оказалось существенное изменение системы категоризации, которому имеется документальное подтверждение. Анетта Шмидт (Schmidt, 1983) в своей замечательной работе ,,Дьирбал молодого поколения: австралийский пример вымирания языка" показывает, что представители племени дьирбал в возрасте 45 лет или старше говорят на традиционном дьирбале, тогда как носители языка в возрасте до 35 лет используют более упрощенный вариант этого языка. Исследуя общий процесс вымирания дьирбала, А. Шмидт выделила две стадии вырождения системы категоризации: промежуточную стадию (наблюдаемую в речи 35-летнего носителя языка) и стадию, наблюдаемую в речи юных носителей дьирбала, на которой данная система становится еще более упрощенной. Анализ этих двух стадий вырождения позволяет подтвердить правильность приведенной выше (или сходной с приведенной выше) интерпретации классификационной системы традиционного дьирбала. Для промежуточной стадии характерно отсутствие некоторых гипотетических категориальных связей, благодаря которым ряд реалий, не являющихся особями мужского или женского пола, может быть отнесен к классу I или II. Опасность и битва исключаются из класса П. Так, например, опасные рыбы (морской ерш и сарган) включаются в класс I вместе с другими рыбами. Жгучая крапива относится к классу IV вместе с деревьями. Боевое снаряжение—копья и щиты—уже не принадлежит к классу II, но также включается в класс IV. Приспособления для рыбной ловли—леска и острога—уже не включаются в класс I 18
вместе с рыбами; они вместе с ,,прочими" реалиями также относятся к классу IV. В то же время ряд фрагментов традиционной системы сохраняется. Сохраняются связи, в основу которых положена мифологическая картина мира: луна все еще относится к классу I вместе с мужчинами, а солнце, звезды и птицы—к классу II вместе с женщинами. Огонь и вода по-прежнему принадлежат классу II вместе с женщинами и солнцем. Изменения классификационной системы на промежуточной стадии вымирания языка вызваны утратой двух связей в категориальных цепочках: связи с опасностью в классе II и связи с рыбой в классе I. Реалии, которые включались в подкласс опасных класса II, теперь автоматически распределяются по своим ,,естественным" местам: одни попадают в класс I, другие — в класс IV. Этот факт заставляет предположить, что структура традиционных категорий дьирбала является не произвольной, а организованной примерно так, как это описал Диксон, и что изменение категориальной структуры, может затрагивать звенья категориальных цепочек. На стадии окончательного упрощения в речи самых юных носителей дьирбала традиционная система категоризации оказывается почти полностью разрушенной: сохраняются только центральные части класса I и II, а класс III исчезает вообще. Эта упрощенная система выглядит следующим образом: (I) мужчины (II) женщины (IV) все остальное Эта система может быть интерпретирована двояко. Первая интерпретация учитывает процесс интерференции: юные представители племени дьирбал, усваивающие с самого раннего возраста английский язык, используют систему классификации, характерную для данного языка. Можно предположить и другое, а именно то, что в системе сохраняются только самые центральные члены класса I и II и что мужчины и женщины остаются центральными членами классов на всех стадиях развития языка дьирбал. Однако в настоящий момент у нас нет данных о других промежуточных стадиях существования языка для подтверждения этой гипотезы. 1.1. Некоторые размышления Приведенная выше интерпретация была основана на тех сведениях, которые информанты Диксона сообщили ему о своей системе категоризации. Но они не сказали ему ничего о том, почему животные относятся к той же категории, что и мужчины, и почему огонь, вода и битва включаются в класс II вместе с женщинами. Мне хотелось бы привести несколько соображений по поводу именно такой организации системы. Но предварительно я хотел бы высказать одно предположение, касающееся принципов, сформулированных Диксоном. 19
Мне кажется, что Принцип мифа и поверья и Принцип важной особенности играют такую же роль, что и Принцип сферы опыта. Согласно Принципу сферы опыта, существуют определенные сферы опыта, значимые для категоризации реалий в языке дьирбал. Эти сферы опыта можно задать списком: рыбная ловля, огонь и т. д. Они определяют связи в категориальных цепочках. Например, если рыбы относятся к классу I, то приспособления для рыбной ловли также относятся к классу I. Принцип мифа и поверья можно рассматривать как частный случай Принципа сферы опыта. С этой точки зрения мифы и поверья—это сферы опыта, значимые для категоризации. Так же можно рассматривать и Принцип важной особенности, сформулированный Диксоном. Этот принцип был выдвинут главным образом для того, чтобы интерпретировать классификацию всего, что является вредоносным или опасным. Он действует только в отношении этих важных особенностей. Точно так же как и в других случаях, можно утверждать, что опасность — сфера опыта, релевантная для категоризации в языке дьирбал, и что она входит в тот же список сфер опыта, релевантных для классификации, в какой включены рыбы, огонь и мифы. Таким образом, все, что нам необходимо знать,— это то, какие сферы опыта значимы для классификации, а кроме того, необходимо еще и детальное знание того, что представляет собою каждая сфера. Развивая свою мысль дальше, мы можем интерпретировать систему категорий языка дьирбал следующим образом. Основные классы: (I) bayi мужчины (II) balan женщины (III) balam съедобные растения (IV) bala все прочее Классы I и II находятся в стандартном для категориальных систем различных языков мира отношении минимального противопоставления— женское здесь противопоставляется мужскому. В интерпретации Диксона классы I и II не находятся в отношении минимального противопоставления, равно как и классы II и III или классы III и IV. Важность этого различия между нашей интерпретацией и интерпретацией Диксона вскоре станет понятной. Принцип сферы опыта требует перечисления областей, важных для категоризации: рыбная ловля, огонь, мифы, поверья, опасность. Отсюда вытекает следующее. — Поскольку рыбы относятся к классу I, приспособления для рыбной ловли также относятся к классу I. — Поскольку грозы и радуга в мифологии отождествляются с мужчинами, они относятся к классу I. 20
— Поскольку существует поверье, что птицы—души умерших женщин, то птицы принадлежат классу II, кроме трех видов трясогузок, которые отождествляются с мужчинами и принадлежат поэтому к классу I. — Поскольку сверчки, согласно поверью, отождествляются со старухами, они относятся к классу II. — Поскольку существует поверье, что луна—муж солнца, то луну относят к классу I, а солнце—к классу II. — Поскольку огонь относится к той же сфере опыта, что и солнце, огонь включается в класс II вместе с солнцем. Все, что считается воплощением огня, относится к той же сфере опыта, что и огонь: звезды, раскаленные угли, спички и т. д. Эти рассуждения позволяют нам предположить, что отнесение огня к категории, включающей женщин, производится на основе Принципа сферы опыта. При этом существуют следующие связи: женщины (через миф) — солнце (через важную сферу опыта) — огонь. Таким же образом мы можем связать опасность и воду. Огонь опасен, и поэтому опасные реалии принадлежат той же категории, что и огонь. Вода, которая гасит огонь, относится к той же сфере опыта, что и огонь, и отсюда—к той же категории. Необходимо помнить, что это рассуждения стороннего наблюдателя. Носители языка дьирбал не сообщали Диксону подобных сведений—ни подтверждающих наши соображения, ни опровергающих их. Носители языка, для которых он является родным, лишь в некоторых случаях отдают себе отчет в том, какие принципы лежат в основе структуры их языка. Возможно, что наши рассуждения неверны, но возможно также, что носители языка не осознают принципов, лежащих в основе его структуры, или же что Диксон ставил вопросы информантам неверно. Это, во всяком случае в принципе, эмпирическая проблема, поскольку наши рассуждения позволяют сделать утверждения, несколько отличные от положений, сформулированных Диксоном. Наша интерпретация заставляет предположить, что боевые копья, жгучие растения, сарганы и спички должны быть менее центральными для категории И, чем девочки. Э. Рош и др. (Roseh, 1977) разработали ряд тестов для определения относительного расстояния отдельных членов класса от центра. Неясно, однако, насколько целесообразно использовать эти тесты в отношении старейших членов племени аборигенов. И все же это не пустые рассуждения. Это эмпирическая проблема. Наша интерпретация позволяет сделать и другое предположение. Можно предположить, что в процессе разрушения системы языка разрываются наиболее далеко отстоящие от центра категориальные цепочки. Шмидт приводит пример разрушения связи с опасностью, вследствие чего «опасные» реалии включаются в другие классы. Если исходить из интерпретации Диксона, согласно которой женщины, сражения (или вредоносность) в равной степени являются центральными членами категории, то можно предположить, что женщины, так же как опасные реалии, будут отнесены к другим категориям. Наш же анализ заставляет предположить, что централь- 21
ные члены категории—женщины—могут быть отнесены к другому классу только в последнюю очередь. Это также эмпирическая проблема. Вполне может быть, что носители вариантов языка, возникающих на промежуточных стадиях его угасания, относят все реалии, за исключением женщин, к классу balan. Но тот факт, что на конечной стадии угасания языка класс balan включает только женщин, заставляет отвергнуть это предположение. В соответствии с предложенной нами интерпретацией женщины и мужчины являются центральными членами классов I и II, благодаря чему эти категории находятся в отношении минимального противопоставления. Это позволяет интерпретировать некоторые интересные частные закономерности. В соответствии с нашей интерпретацией можно предположить, что исключения из класса I попадают в класс II, то есть в противопоставленную классу I категорию. II наоборот, можно предположить, что исключения из класса II попадают в класс I. Трудно предположить, что исключения из этих категорий попадут в классы III или IV. Именно так все и происходит. Животные относятся к классу I, но исключения (собаки, утконосы, сумчатые барсуки, ехидны) — к классу II. Змеи включаются в класс I, но полозы и водяные питоны — в класс II. Птицы и опасные предметы принадлежат классу II. Поскольку опасные реалии маркируются отнесением к другому классу, опасные птицы— ястребы—маркируются как исключения отнесением к классу I. Такая интерпретация позволяет раскрыть определенную регулярность даже в исключениях. Мы не коснулись вопроса о том, почему большая часть животных попадает в класс I вместе с мужчинами. По наблюдениям Диксона, в языке дьирбал нет специальных слов для обозначения самок и самцов животных—то есть, например, есть слово, обозначающее кенгуру вообще, и нет специального слова, обозначающего самку кенгуру. Кенгуру (bayi yuri) принадлежит классу I вместе с большей частью животных; если же кто-нибудь хочет специально указать, что речь идет о самке кенгуру, необходимо использовать классификатор класса II (balan yuri). Обратно направленное правило действует для животных, составляющих исключения. Собаки относятся к классу II (balan guda). Если нужно указать, что речь идет о кобеле, необходимо использовать классификатор класса I (bayi guda). Все эти факты позволяют утверждать, что категория рода для животных не маркируется. Очевидно, в данной категориальной системе противопоставлены люди (мужчины и женщины), съедобные растения и неодушевленные предметы. Закономерно, как кажется, предположить, что если в такой системе животные попадают в какой-либо класс, то, скорее всего, они включаются в тот же класс, что и люди, чем в класс, который представлен съедобными растениями. И это понятно: если для животных род не маркируется, то они попадают в один класс с обозначениями людей, где род также не маркирован. В большей части языков, имеющих категорию рода, немаркированным является мужской род. При такой универсальной тенденции ничуть не удивительно, что животные попадают в один класс с мужчинами. 22
Однако все это лишь спекулятивные рассуждения. Диксону не удалось найти подтверждения тому, что категория I является немаркированной. Возможно, дело так и обстоит, но в настоящее время мы не располагаем какими-либо фактами в пользу этой гипотезы. Диксон не хотел делать какие-либо выводы, идущие дальше собранных им фактов, поэтому он включил в свой список мужчин и животных как равноправных членов класса I. По Диксону, летучие мыши отстоят от центра категории I не дальше, чем мальчики. Это положение в принципе может быть проверено. Если бы я мог заключить с кем-нибудь пари—на очень маленькую сумму,— я бы побился об заклад, что мальчики ближе к центру категории, чем летучие мыши. Я высказал эти соображения с целью продемонстрировать возможность рассмотрения закономерностей, выявленных Диксоном, на более глубинном уровне. Помимо этого, мне хотелось показать, что данные проблемы имеют эмпирический характер. Проблемы, подобные этим, поднятым нами, должны ставиться исследователями языков, обладающих системой классификаторов. 1.2. Предварительные выводы. Результаты изложенного выше анализа системы классификаторов языка дьирбал могут быть представлены следующей диаграммой: А BAYI BALAN BALAM BALA Эта диаграмма представляет мир в виде четырех взаимоисключающих областей (на схеме показаны как прямоугольники). Они 23
образуют то, что мы будем называть базисной моделью. Все, о чем базисная модель может поведать нам,— это то, что существует четыре различных класса. Три из них обладают внутренней структурой с центральной группой элементов. Центры отмечены на диаграмме квадратиками. Четвертый класс, составленный всеми теми элементами, которые не вошли в три предыдущих класса, не имеет внутренней структуры. Центры областей, представленных базисной моделью, также структурированы с помощью того, что мы назовем моделью основной оппозиции: мужчины—женщины, или центр I—центр II люди — съедобные растения, или центр I и II — центр III Наконец,— что, пожалуй, является наиболее важной особенностью классификации,—в рамках базисной модели существует цепочечная структура. Наличие четко определенных взаимоисключающих областей в базисной модели не противоречит классической теории категорий. Но в то же время это не делает базисную модель классической системой. Эта модель отличается от классической системы тем, что в ней отсутствуют какие-либо характеристики, общие для всех членов категории и определяющие их категориальную принадлежность. Чтобы описать эту систему, необходимо иметь: — базисную модель, в данном случае очень простую. Она демонстрирует, что имеется четыре взаимоисключающих категории и что четвертая составлена из элементов, не входящих в первые три. — список центральных, или наиболее типичных, подклассов для трех первых категорий. — модель основной оппозиции, определяющей соотношение центров категорий. — список принципов, задающих цепочечные связи, в данном случае Принцип сферы опыта вместе со списком сфер опыта, релевантных для категоризации. — краткий список исключений, которые распределяются в соответствии с моделью основной оппозиции. В системе классификации существительных языка дьирбал выявляется ряд основных механизмов, которые используются человеком в процессах категоризации. Теперь мне хотелось бы обратиться к другому примеру, демонстрирующему иные механизмы категоризации. Я буду основываться на полевом исследовании Памелы Даунинг (результаты которого она сообщила мне в частной беседе) и на обсуждении этих вопросов с профессором X. Аоки. 2. ЯПОНСКИЙ КЛАССИФИКАТОР HON Японский классификатор hon чаще всего используется с обозначениями длинных, тонких, негибких предметов: палок, тросточек, карандашей, свечей, деревьев и т. п. Неудивительно, что он может 24
употребляться и с обозначениями мертвых змей и сушеной рыбы— это длинные и негнущиеся предметы. Но классификатор hon может употребляться и с обозначением реалий, не обладающих столь ярко выраженными характеристиками: — состязания в военном искусстве, в ходе которых используются шесты или деревянные мечи (длинные и негибкие); — удары (а иногда и подачи) в бейсболе (прямые траектории, образованные стремительным движением твердого предмета— мяча,— связываются с бейсбольной битой—длинной, тонкой и негибкой); — броски в корзину в баскетболе, подачи в волейболе и удары в пинг-понге; — матчи дзюдо (состязания в военном искусстве, но без шестов или мечей); — состязания между наставником и учеником в дзен-буддизме, в которых каждый из партнеров пытается поставить другого в тупик с помощью коанов; — мотки или клубки ленты (которые могут быть размотаны и превращены во что-то длинное и тонкое); — телефонные разговоры (которые идут по проводам и являются примером метафоры КАНАЛ, описанной Редди (Reddу, 1979) и Лакоффом и Джонсоном (Lakoff and Johnson, 1980); — программы радио и телевидения (подобные телефонным разговорам, но без проводов); — письма (другой тип коммуникации; в патриархальной Японии письма сворачивались в трубку и поэтому напоминали палки); — кино (подобное радио и телевидению; кроме того, киноленты сматываются в катушки, как катушки магнитофонной ленты); — медицинские инъекции (которые делаются тонкой, длинной и негнущейся иглой). Хотя эти случаи употребления классификатора hon и нельзя предвидеть, использование его не является произвольным. Реалии, о которых идет речь, не имеют ничего общего с длинными, тонкими, негибкими предметами, но их отнесение к общей с этими предметами категории имеет смысл. Посмотрим, почему это так. Начнем с рассмотрения состязаний в военном искусстве, в которых используются шесты или деревянные мечи. Шесты и мечи—длинные, тонкие и негибкие предметы, при обозначении которых всегда употребляется классификатор hon. Шесты и мечи, кроме того, являются главными функциональными предметами в этих состязаниях. Слово, обозначающее победу в таком состязании, также может употребляться с классификатором hon. Таким образом, главная цель этой сферы опыта относится к той же категории, что и основной функциональный предмет. Бейсбольные биты—центральные члены категории hon. Наряду с мячом бейсбольная бита—наиболее важный функциональный предмет, используемый в игре. В центре игры—борьба между питчером (нападающим) и игроком, отбивающим мяч. Главная цель отбивающего— нанести удар по мячу. Когда наносится сильный удар, мяч 25
летит, описывая определенную траекторию, образующую как бы длинную тонкую линию, по которой твердый предмет стремительно движется, влекомый огромной силой. Траектория полета мяча создает образ, принадлежащий категории hon—образ длинной и тонкой линии. Распространение категории hon с бейсбольных бит на удары— еще один пример перехода от главного функционального объекта к главной цели. Это также перенос с одного функционального объекта, который по своей форме принадлежит категории, на образованную другим функциональным объектом траекторию, форма которой также принадлежит категории hon. При этом даже из того небольшого количества сведений о классификаторе hon, которое известно в настоящее время, ясно, что удачные мячи включаются в категорию hon, а неудачные не попадают в нее*. В этом нет ничего удивительного, так как такие мячи не являются целями ударов и их траектории не имеют форм, входящих в категорию hon. Такая связь между схемами образов (в данном случае—между длинными тонкими предметами и траекториями) — общий тип связи, который лежит в основе распространения классификаторов с центральных на периферийные случаи. Рассмотрим три примера из английского языка. The man ran into the woods. 'Человек бежал в лес'. The road ran into the woods. 'Дорога бежала в лес'. В первом случае глагол run 'бежать' используется потому, что в предложении речь идет о (длинной тонкой) траектории. Во втором случае глагол run используется потому, что речь идет о длинном ,,тонком" ,,предмете"—дороге. The bird flew over the yard. 'Птица пролетела над двором'. The telephone line stretched over the yard. 'Телефонный провод тянулся над двором'. В первом предложении предлог over 'над' используется потому, что речь идет о (длинной, тонкой) траектории. Во втором случае он употребляется потому, что речь идет о длинном тонком ,,пред мете"—телефонном проводе. The rocket shot up. 'Ракета взлетела'. The lamp was standing up. 'Лампа стояла'. В первом случае up используется потому, что речь идет о траектории. Во втором случае up используется потому, что речь идет о лампе, форма и положение которой позволяют представить ее как длинный тонкий предмет. Подобные связи являются общими для многих языков, что позволяет предположить существование явления * Foul balls, pop flies, ground balls, bunts. 26
или механизма, который можно назвать „трансформацией схемы образа": СХЕМАТИЧЕСКИЙ ОБРАЗ ТРАЕКТОРИИ — »- СХЕМАТИЧЕСКИЙ ОБРАЗ ДЛИННОГО ТОНКОГО ПРЕДМЕТА Трансформация схемы образа—один из многих типов когнитивных связей, которые могут лежать в основе расширения объема категории. Некоторые носители японского языка включают в категорию hon подачи, а не только удары в бейсболе — опять-таки на основе связи схематических представлений образов в рамках одной и той же сферы опыта. Ряд носителей языка использует классификатор hon с обозначениями подач, имея в виду как траекторию, так и перспективу борьбы подающего и отбивающего мяч игроков. В этих случаях классификатор используется только с обозначениями ударов, рассматриваемых с точки зрения игрока, отбивающего мяч. Другие носители языка употребляют hon с обозначениями подач, только если мяч достигает цели удара. Поскольку главная цель подачи—не дать возможности игроку, отбивающему мяч, принять его, эти носители языка могут употреблять hon только с обозначениями удачных подач, а не подач вообще. Ни одного носителя языка, который употреблял бы hon по отношению к броскам вообще, обнаружить не удалось. Точно так же не удалось обнаружить носителей языка, которые употребляли бы hon с обозначениями неудачных подач. Сходная мотивация лежит в основе распространения употребления hon с обозначениями других понятий спорта. Так, hon употребляется с обозначением бросков в корзину и свободных бросков в баскетболе, но не употребляется с обозначениями передач. Hon может употребляться с обозначениями подач в волейболе и ударов в пинг-понге. В этих случаях играет роль как траектория, так и возможность изменить счет в свою пользу (то есть достигнуть главной цели). Все эти примеры позволяют сделать некоторые выводы. Во-первых, предметы, обозначения которых являются центральными для категории hon,— это конкретные предметы базового уровня: палки, карандаши, бамбуковые шесты, бейсбольные биты и т. д. Употребление классификатора распространяется в направлении от обозначений объектов базового уровня на обозначения других объектов, например на обозначения ударов и подач в бейсболе. Во-вторых, необходима теория мотивации распространения использования классификатора. Необходимыми компонентами этой теории являются трансформации схематических представлений образов и концептуальная метонимия (действующая, например, в случаях, когда обозначение какого-нибудь предмета, например шеста или биты, замещает обозначение цели—победы или удара, достигшего цели). В-третьих, удары в бейсболе и длинные, тонкие, негибкие предметы не имеют общих характеристик. Связь между ними 27
основывается на трансформации схематического представления образа и на метонимии. Отсюда вывод о неадекватности классической теории категоризации, требующей, чтобы включение в категорию было основано на общих характеристиках реалий. В-четвертых, использование классификатора hon с обозначениями ударов в бейсболе может быть объяснено, но не предсказуемо. Оно принадлежит области условности — непредсказуемой, но мотивированной. Таким образом, традиционная точка зрения, согласно которой все случаи распространения категории являются либо предсказуемыми (мотивированными), либо произвольными, в данном случае не подтверждается. Возникает нечто третье: мотивация. Тогда независимо друг от друга трансформация схематического представления образа и метонимический перенос с объекта действия на цель обеспечивают мотивацию. В идеале каждый случай употребления классификатора за пределами центра категории должен быть мотивирован. Мотивация не может возникать ad hoc — нельзя просто придумать метонимический перенос или схему образа, чтобы интерпретировать единичный пример. Мотивация должна основываться на ряде других случаев. Таким образом, возникает критерий адекватности анализа языков, имеющих системы классификаторов. Некоторые исследователи считают, что такой критерий адекватности слишком силен, они утверждают, что ряд классификаций просто произволен и что не существует мотиваций, созданных не ad hoc. Это эмпирический вопрос, и для ответа на него собраны отнюдь не все факты. Но утверждение о произвольности классификаций— это всего лишь спасительная уловка. Даже если и существуют абсолютно немотивированные случаи, к ним можно применить слегка ослабленный критерий адекватности. Выясните, какие направления распространения категории ,,имеют смысл" для носителей языка и какие кажутся „бессмысленными" и попытайтесь интерпретировать осмысленные. Каждое осмысленно расширенное использование классификатора должно быть самостоятельно мотивировано. Ни одно исследование системы классификаторов нельзя считать законченным, пока этого не сделано. Итак, мы увидели, что расширение категории может быть мотивировано метонимией и трансформацией схематического представления образа. Другой важный тип мотивации связан с существованием конвенциональных ментальных образов. Рассмотрим пример с катушкой (или мотком) ленты, которая может быть отнесена к категории hon. Мы знаем, как выглядят катушки и тогда, когда они смотаны, и тогда, когда лента разматывается. Иными словами, мы располагаем конвенциональными ментальными образами ленты и тогда, когда она хранится в смотанном виде, и тогда, когда она используется. Мы знаем также, что, собираясь использовать ленту, мы разматываем ее, и что лента готова для использования, когда она размотана. Конвенциональный образ разматываемой ленты включает два компонента—представление о смотанной ленте и представление о размотанной, то есть готовой для использования ленте. Образ 28
размотанной и готовой для использования ленты соответствует схематическому представлению об образе длинного тонкого предмета, с обозначениями которого употребляется классификатор hon. Образ смотанной ленты не соответствует схематическому представлению образа, центрального для категории hon. Тогда ,,срабатывает" метонимия: функциональный компонент (то есть готовность к употреблению конвенционального образа) замещает весь образ, благодаря чему обеспечивается категоризация. Функциональный компонент соответствует схематическому представлению образа, укладывающемуся в категорию hon. Это и есть, вероятно, мотивация для включения мотков или катушек ленты в категорию hon. Опять-таки мы не можем прогнозировать использование классификатора hon для катушек или мотков ленты; но в наших силах зато сделать нечто чрезвычайно важное. Мы можем показать, почему употребление классификатора hon имеет смысл. Осмыслить категоризацию— немаловажное дело, а показать при этом детально, как работают основные когнитивные механизмы,— еще более серьезное достижение. Чтобы понять, что представляют собой когнитивные аспекты категоризации, необходим детальный анализ на уровне основных когнитивных механизмов. Медицинские инъекции—другой случай, в котором главный функциональный объект (игла)—длинный и тонкий; с обозначениями игл может употребляться классификатор hon, а в результате метонимического переноса этот же классификатор употребляется со словом ,,инъекция". Пока что нам удалось проследить, как в процессе категоризации, осуществляемой с помощью классификаторов, участвуют трансформации схематических представлений образов, конвенциональные ментальные образы и метонимия. Обратимся теперь к примеру, который позволяет, помимо всех перечисленных компонентов процесса категоризации, продемонстрировать еще и действие метафоры. Напомним, что классификатор hon употребляется и с обозначениями телефонных звонков. Стереотипное представление телефонного звонка включает представление об использовании самой функциональной части телефона — телефонной трубки, которая имеет форму длинного, тонкого, негибкого предмета и соответствует центральному схематическому представлению образа, принадлежащего категории hon. Другой важный конвенциональный образ, связанный с телефонными разговорами,— это телефонные провода. В представлении носителей языка они играют основную функциональную роль в телефонной коммуникации и соответствуют схематическому образу длинного тонкого предмета. Кроме того, они реализуют основную метафору коммуникации — КАНАЛ. Короче говоря, употребление классификатора hon с обозначениями телефонных разговоров мотивируется двумя взаимосвязанными, но в то же время самостоятельными факторами. Иными словами, телефонные разговоры включаются в категорию hon по двум причинам, а там, где есть мотивация, чем больше типов мотивации участвует во включении в класс, тем лучше. Это значит, что вопрос о том, какая мотивация верна, 29
вообще не стоит, обе мотивации могут действовать в равной степени и одновременно. Итак, мы видим, что распространение употребления классификатора hon может быть основано на центральном значении этого классификатора. Но такое распространение в свою очередь может служить основой для дальнейшего распространения категорий путем нанизывания, или сцепления. Вспомним, что письма включаются в категорию hon. Для такой категоризации существует ряд мотивов. Во-первых, когда-то письма имели форму свитков, обычно накрученных на длинные тонкие палочки цилиндрической формы. Именно с тех пор они вошли в категорию hon, и этот образ письма остается живым в японской культуре благодаря живописи и традиции каллиграфии. Во-вторых, в стереотипное представление о процессе писания письма входит использование ручки, которая играет основную функциональную роль и также является длинным тонким предметом. В-третьих, письма являются формой коммуникации и соответственно случаем реализации метафоры КАНАЛ. Так различные типы мотивации позволяют hon занять свое место в экологической системе классификаторов японского языка. Письма и телефонные звонки — промежуточные звенья цепи. Радио-и телепрограммы также включаются в категорию hon. Это формы коммуникации на расстоянии, подобные письменной и телефонной коммуникации. Они также реализуют метафору коммуникации КАНАЛ. При том обстоятельстве, что письма и телефонные переговоры включаются в категорию hon, радио-и телепрограммы представляют собой хорошо мотивированное расширение этой категории. Фильмы также входят в категорию hon. Это также примеры коммуникации на расстоянии; помимо всего прочего, один из основных конвенциональных образов, ассоциирующихся с фильмами,— это кинопленка, которая выглядит как катушка киноленты, и обозначение ее также употребляется с классификатором hon. Явление формирования категории путем нанизывания или сцепления очень ясно демонстрирует, что классическая теория категоризации не отражает реального положения вещей. И палки, и телепрограммы включаются в категорию hon, но у них нет общих характеристик, релевантных для классификации. Они принадлежат одной категории в силу ее цепочечной структуры. И наконец, обратимся к матчам дзюдо и состязаниям между буддистскими монахами-наставниками и их учениками. Матчи дзюдо относятся к той же сфере опыта, что и состязания в военном искусстве, в которых используются шесты или деревянные мечи. Победа в матче дзюдо также включается в категорию hon. Подобным же образом состязания между наставниками и учениками в дзенбуддизме принадлежат той же сфере опыта, что и состязания в военном искусстве, и победа в состязании дзен также может быть отнесена к категории hon. Отметим, что использование классификатора hon с обозначениями некоторых периферийных для данной категории предметов варьирует от говорящего к говорящему. Некоторые носители язы- 30
ка не включают в эту категорию подачи в бейсболе, а некоторые— победы в состязаниях буддистских монахов. Но, насколько мне известно, для всех носителей японского языка к центральным членам этой категории относятся свечи, шесты, бейсбольные биты и т. д. Более того, многие случаи распространения употребления классификатора hon стали конвенциональными для всех носителей языка: письма, телефонные разговоры, некоторые термины бейсбола, катушки ниток. Вариантность, о которой мы только что говорили, отражает цепочечные связи, еще не имеющие стабильного характера, но основанные на тех же принципах, что и стабильные. 3. ТЕОРИЯ ПРОТОТИПОВ* С ТОЧКИ ЗРЕНИЯ КОГНИТИВНЫХ МОДЕЛЕЙ Язык относится к числу наиболее характерных типов когнитивной деятельности человека. Для уяснения того, как вообще люди осуществляют категориальную классификацию, нужно как минимум понимать, как осуществляется категориальная классификация в особом случае—в случае естественного языка. Два рассмотренных нами примера позволяют представить, как обычно человек классифицирует слова естественного языка. Какие же особенности интеллекта человека позволяют ему осуществлять категоризацию именно таким, а не каким-либо другим способом? Существует ли какой-то общий для всех людей когнитивный аппарат, результатом действия которого являются подобные категориальные классификации? Проведенный нами анализ позволяет предположить, что для описания процесса категоризации могут быть использованы модели четырех типов. Пропозициональные модели: они вычленяют элементы, дают их характеристики и указывают связи между ними. Большая часть структуры нашего знания имеет форму пропозициональных моделей. Так, модель определенной области опыта, например битвы в языке дьирбал, включает предметы, которые встречаются в этой области (например, боевые копья). Пропозициональная модель нашего знания об огне включает и знание того факта, что огонь опасен. Таксономическая модель, подобная базисной модели для языка дьирбал, приведенной выше, включает четыре элемента, соответствующие каждой из четырех категорий, и условие, согласно которому все единицы, не входящие в первые три категории, включаются в четвертую. Схематические модели образов. Это специфические схематические представления образов, таких, как траектории, длинные тонкие формы или вместилища. Наше знание о бейсбольных подачах включает знание схематического представления траектории. Наше знание о свечах * В отечественной лингвистической литературе существует также традиция использовать для обозначения данного понятия термины ,,архетип" и „стереотип".— Прим. перев. 31
включает схематическое представление о длинных тонких предметах. Метафорические модели. Это модели перехода от пропозициональных моделей или схематических моделей образов одной области к соответствующей структуре другой области. Метафора КАНАЛ, используемая для обозначения процессов и реалий для коммуникации, позволяет перейти от знания о перемещении предметов в контейнерах к пониманию коммуникации как перемещения идей в словах. Метонимические модели. Это модели одного или нескольких описанных выше типов, дополненные указанием функций, выполняемых одним элементом по отношению к другому. Так, модель, которая представляет структуру ,,часть—целое", включает указание функции части по отношению к целому, согласно которой часть может замещать целое. В структуре знания носителей языка дьирбал о волосатом черве знание того, что он обжигает, подобно солнечным лучам, приводит к тому, что обозначение ожога может замещать обозначение самого червя, и тем самым червь относится к той же категории, что и солнце. Такие модели могут характеризовать базисную структуру, указывать, каковы ее центральные члены, и демонстрировать связи во внутренних цепочках. Важно учитывать различие между базисной и внутренней структурой. В языке дьирбал базисная модель позволяет провести четкие границы между категориями, но она не является достаточной для определения внутреннего состава категории. Однако существуют и такие категории, для которых базисная модель оказывается достаточной, чтобы провести границу между членами и нечленами категории, которая при этом обладает внутренней структурой. Рассмотрим, к примеру, категорию, которая соответствует английскому слову bird 'птица'. Существуют критерии, которые позволяют провести разграничение между птицами и всеми остальными живыми существами, не являющимися птицами. У птиц есть крылья, перья, они кладут яйца, у них есть клювы, пара лапок и т. д. Тем не менее, как продемонстрировала Э. Рош, люди считают одних птиц лучшими или более центральными примерами категории, чем других птиц. Так, малиновки и воробьи оцениваются как лучшие примеры птиц, чем орлы, пеликаны, куры, страусы и пингвины. Рош обнаружила, что, очевидно, существует образ, которому соответствуют не все птицы: ,,настоящие" птицы должны уметь летать, не быть хищными, не быть домашними, уметь петь и т. д. В то же время Рипс показал, что этот внутренний образ используется в рассуждениях определенного типа. К примеру, в одном эксперименте испытуемым было сказано, что все малиновки, живущие на острове, заболели какой-то болезнью, после чего испытуемых спросили, считают ли они, что и утки заразятся ею. В целом испытуемые отвечали утвердительно. В обратной ситуации, когда испытуемым 32
было сказано, что все утки, живущие на острове, заболели какой-то болезнью, общей для всех испытуемых была тенденция считать, что малиновки не заболеют ею. Иными словами, некоторые умозаключения могут производиться в направлении от центральных членов к периферийным, но не наоборот. Категория ,,птица", так же как категории bayi, balam и balan, в языке дьирбал имеет и базисную, и внутреннюю структуры. Базисная структура категории ,,птица" позволяет отличать птиц от нептиц. Внутренняя же структура играет в данном случае другую роль в познании. Удалось выделить немало случаев, когда центральные члены категории обладали иными когнитивными характеристиками, чем периферийные. Эти характеристики называются „прототипическими эффектами". Центральные члены категории распознаются быстрее, раньше запоминаются, чаще используются, с ними легче зыполняются тесты по подбору пар, и они функционируют в том, что Рош называет „умозаключение от референта" (reference point reasoning (Roseh, 1981)), то есть в случаях, подобных приведенному выше примеру с малиновками и утками. В целом создается впечатление, что центральные члены категории используются для представления всей категории. Поэтому они облегчают распознавание, запоминание и усвоение членов категории и создают основу для обобщений в ряде ситуаций. Прототипические эффекты имеют поверхностный характер. Они проявляются, когда какая-либо подкатегория, отдельный член категории или частная модель (иногда в ограниченных или ближайших целях) используются для представления категории в целом. Иными словами, существуют случаи, когда часть (подкатегория, член категории или частная модель) замещает всю категорию в целом, что имеет место при умозаключениях, распознавании образов и т. д. В рамках теории когнитивных моделей такие случаи представлены метонимическими моделями. При детальном рассмотрении можно выделить следующие характеристики метонимических моделей. — Существует „целевое" понятие А, которое с определенной целью должно быть воспринято в определенном контексте. — Существует понятийная структура, содержащая как понятие А, так и понятие В. — В либо представляет собой часть А, либо тесно связано с А в этой понятийной структуре. Как правило, в этой структуре выбор В совершенно однозначно определяет А. — По сравнению с А В либо легче понять, проанализировать, распознать либо легче использовать для данной цели в данном контексте. — Метонимическая модель—это модель того, как связаны А и В в понятийной структуре, содержащая также указание на функцию В по отношению к А. Если такая конвенциональная метонимическая модель существует как часть понятийной системы, В может заменить А в результате 3-1182 33
метонимического переноса. Если А—категория, то результатом является метонимическая модель категории. Подобно тому как существует множество типов метонимии вообще (Lakoff and Johnson, 1980, chap. 8), существует немало типов и категориальной метонимии, при которой часть категории замещает всю категорию для какой-либо когнитивной цели. В результате возникает большое количество различных прототипов — их столько же, сколько отмечено случаев потенциальной категориальной метонимии. Ниже я привожу список ряда прототипов, которые мне удалось выявить (я отнюдь не считаю его исчерпывающим). 4. ТИПЫ ПРОТОТИПОВ 4.1. Типичные примеры. Это примеры, подобные следующим: Малиновки и воробьи—типичные птицы. Яблоки и апельсины—типичные фрукты. Пилы и молотки—типичные инструменты. И не вызывающие сомнений примеры из дьирбала: Мужчины—типичные bayi. Женщины—типичные balan. Съедобные растения—типичные balam. Использование типичных членов категории обычно не осознается— оно имеет автоматический характер. В отношении типичных членов категории нет разногласий между носителями языка, и эти члены, по-видимому, имеют стабильный характер. 4.2. Социальные стереотипы. Социальные стереотипы обычно осознаются и могут вызывать разногласия. Они изменяются со временем и могут приобретать характер проблем. Социальные стереотипы используются в рассуждениях, и в особенности в том, что характеризуется как ,,поспешный вывод". Обоснованность использования социальных стереотипов в умозаключениях может быть открыто опровергнута. Приведем несколько примеров: Типичный политический деятель занимает соглашательскую позицию, обладает большим самомнением и бесчестен. Типичная мать—домохозяйка. Типичный холостяк—,,настоящий мужчина", встречается с большим числом женщин, любит одерживать над ними победы, постоянно торчит в барах и т. д. Типичный японец трудолюбив, вежлив и умен. Социальные стереотипы чаще всего используются, чтобы делать быстрые суждения о людях. К ним прибегают также в рекламе и в большей части форм массовой литературы, в особенности в газетных статьях. 34
4.3. Идеалы. Многие категории воспринимаются через абстрактные идеальные образцы, которые при этом могут не быть ни типичными представителями данной категории, ни стереотипами, например: Идеальный муж: хорошо зарабатывает, верен жене, внушает уважение, привлекателен. Стереотипное представление о муже: бездельник, скучный, пузатый. Идеалы используются в суждениях и в планах на будущее. 4.4. Образцы. Мы можем представлять себе категорию в целом на основе знания ее отдельных членов, которые являются либо идеалами, либо их противоположностью. Например, существуют списки десяти лучших и десяти худших, Залы Славы, Академические награды, Книга мировых рекордов и т. п. У нас сложилось представление об „образцовых" бейсболистах, таких, как Бейб Рут, Вилли Мэйз, Сэнди Куфэкс и др. Представления об образцах выражается в языковых конструкциях: „типичный Бейб Рут", ,,еще один Вилли Мэйз" и т. д. Для научных парадигм также существуют образцы. Так, например, эксперимент Михельсона—Морли—образец эксперимента в физике — используется многими людьми для того, чтобы составить представление о том, что такое настоящий физический эксперимент. 4.5. Порождение. В некоторых случаях члены категории определяются или порождаются ее центральными членами, к которым применяются какие- либо общие правила. Лучший пример такого рода—числа. Для большинства людей представление о натуральных числах связано с представлением о целых числах между нулем и девятью, а также с представлением об операциях сложения, таблицах умножения и правилах арифметики. Одноразрядные числа являются центральными членами категории „естественное число", которые по определенным принципам порождают всю категорию числа. В нашей системе чисел одноразрядные числа используются для представления о естественных числах в целом. Свойства больших чисел понимаются через свойства меньших чисел и в конечном счете через свойства одноразрядных чисел. Одноразрядные числа в совокупности с операциями сложения, таблицами умножения и правилами арифметики образуют модель, которая порождает все естественные числа и является метонимической в принятом в контексте данной статьи смысле: категория как целое воспринимается через меньшую подкатегорию. Кроме того, существуют модели, которые делят естественные числа на подгруппы в соответствии с определенными свойствами: четные и нечетные числа, простые и составные и т. д. Эти модели не являются метонимическими. Их действие основывается на классических аристотелевых принципах. Но они определяют только подкате- з* 35
гории естественных чисел. Категория же как целое определяется с помощью метонимического переноса и порождения на основе одноразрядных чисел и правил арифметики. Другие типы чисел тоже задаются метонимическими порождающими моделями, что делает картину еще более сложной: рациональные числа, действительные числа, комплексные числа, трансфинитные числа и т. д. Так, рациональные числа понимаются как отношения натуральных чисел, а действительные числа понимаются как бесконечные последовательности натуральных чисел. Иными словами, рациональные числа и действительные числа определяются посредством метонимии через натуральные числа—подкатегорию, которая используется, чтобы порождать более крупные категории. 4.6. Частные модели. Категория может восприниматься также через частную модель. Вернемся вновь к категории натуральных чисел. Наиболее употребительная частная модель—это подкатегория чисел, представляющих собой степень от десяти: десять, сто, тысяча и т. д. Мы используем эту частную модель, чтобы представить себе относительную величину чисел. Компоненты частной модели представляют собой такие единицы, которые Э. Рош называет когнитивными точками референции. Когнитивные точки референции занимают особое место в умозаключениях. Некоторые частные модели имеют биологическую основу: основные цвета, основные эмоции и т. д. Остальные частные модели обусловлены культурой, например семь смертных грехов и т. д. 4.7. Самые характерные примеры. Обычно для того, чтобы представить себе всю категорию в целом, люди используют хорошо им известные, запоминающиеся или особенно характерные примеры. Так, если ваш лучший друг вегетарианец и вы не знакомы близко ни с какими другими вегетарианцами, вы можете составить себе общее представление о вегетарианцах, исходя из черт вашего друга. 5. ИСТОЧНИКИ ПРОТОТИПИЧЕСКИХ ЭФФЕКТОВ Источники прототипических эффектов могут быть самыми разнообразными. Во всех описанных выше случаях прототипические эффекты возникали тогда, когда представление о категории составлялось с помощью метонимического переноса, на основе подкатегории, члена категории или частной модели. Поэтому чрезвычайно важно попытаться выявить источники этих эффектов. Представляется, что для понимания того, как возникают эти эффекты, необходима такая теория когнитивных моделей, которая позволит охарактеризовать типы метонимических моделей. 36
5.1. Экспериенциальные * кластеры. Метонимические модели не являются единственными источниками прототипических эффектов. Условимся использовать термин „базисная модель" для обозначения моделей, которые являются „обычными" скорее, чем метонимическими. Часто множество базисных моделей пересекается, образуя сложное соединение, которое психологически является в большей степени базисным, чем сами модели. Мы будем называть такие объединения моделей экспериенциальными кластерами. 5.1.1. Мать. Пример экспериенциального кластера—понятие „мать". Согласно классической теории, возможно перечисление необходимых и достаточных условий, которые позволят охватить все случаи употребления слова „мать" и в равной степени могут быть применены к ним. Эти условия могут быть отражены таким определением слова „мать", как женщина, которая родила ребенка. Но, как мы сможем убедиться позже, такое определение не может охватить весь диапазон употреблений слова „мать". Мать — понятие, в основе которого лежит сложная модель, образованная пересечением ряда частных базисных моделей, образующих экспери- енциальный кластер. Он включает следующие модели: — Модель, связанная с родами: лицо, которое рожает ребенка,— мать. Эта модель обычно сочетается с генетической моделью, хотя с тех пор, как в медицине вошла в практику имплантация яйцеклеток и эмбрионов, эти две модели не всегда совпадают. — Генетическая модель: женщина, которая поставляет генетический материал,—мать. — Модель, связанная с выращиванием и воспитанием: взрослая женщина, которая воспитывает и растит ребенка,—мать этого ребенка. — Брачная модель: жена отца—мать. — Генеалогическая модель: женщина первого предшествующего поколения—мать. Понятие мать обычно включает сложную модель, в которой все эти частные базисные модели объединяются, формируя кластер. Но сложность жизни в современном мире привела к тому, что они расходятся все больше и больше. Тем не менее многие люди испытывают искушение выбрать какую-либо одну базисную модель как самую „правильную", как ту, которая действительно определяет, что такое „мать". Но хотя можно пытаться доказать, что только одна из этих моделей связана с „действительным" понятием матери, данные языка не подтверждают этого. Как показывают следующие предложения, существует более чем один критерий „настоящего" материнства: От английского слова experience 'опыт'.—Прим. перев. 37
— Меня усыновили, и я не знаю, кто в действительности моя мать. — Я не умею воспитывать детей, и поэтому я не думаю, что когда-нибудь смогу стать настоящей матерью какому-нибудь ребенку. — Моя мать умерла, когда была беременна мною, меня заморозили и пересадили в матку другой женщины, которая родила меня. — У меня была генетическая мать, от которой была взята яйцеклетка, пересаженная в матку моей настоящей матери, которая родила и вырастила меня. — С помощью генной инженерии гены в яйцеклетке, оплодотворенной моим отцом, были образованы соединением генов двадцати различных женщин. Ни одну из них я не могу назвать своей настоящей матерью. Моя настоящая мать—это женщина, которая родила и вырастила меня, хотя у меня и нет генетической матери. Короче говоря, более чем одна из этих моделей вносит свой вклад в представление о настоящей матери, и в то же время любая из этих моделей может отсутствовать в этом представлении. Тем не менее сама по себе идея, что существует такое понятие, как „настоящая мать", требует выбора из числа этих моделей там, где они расходятся. Было бы странно, если бы кто-нибудь сказал: — У меня четыре настоящие матери: женщина, которая была донором генов, женщина, которая родила меня, женщина, которая вырастила меня, и женщина, являющаяся женой моего отца в настоящее время. Если модели, которые в своей совокупности исчерпывают содержание понятия, расходятся, остается все же сильная тенденция рассматривать одну из них как главную. Это получило отражение в лексикографической практике. Каждый словарь по сложившейся традиции должен выделять основное значение, если слово обладает более чем одним значением. Неудивительно, что выбор основного значения у разных авторов различен. Доктор Джонсон в качестве основного выбрал значение, в основе которого лежит модель, связанная с родами, и многие специалисты по прикладному языкознанию во избежание риска следовали его примеру. Однако так поступали не все. В словаре Фанка и Вогналла (Funk and Wagnall) в качестве основной избрана модель, связанная с воспитанием, а в словаре ,,American College Dictionary" в качестве основной избрана генеалогическая модель. Хотя выбор, сделанный авторами словарей, не имеет особого научного значения, он все же отражает тот факт, что люди, занимающиеся созданием словарных дефиниций профессионально, по-разному решают вопрос о том, какая модель лежит в основе такого общеизвестного понятия, как „мать". Результатом расхождения базисных моделей, связанных с понятием „мать", является возникновение сложных выражений типа stepmother 'мачеха', surrogate mother 'суррогатная мать', adoptive mother 'приемная мать', foster mother 'кормилица', biological mother 38
'биологическая мать', donor mother 'мать-донор' и т. д. Такие сложные понятия, безусловно, не соответствуют простым подкатегориям, например типам матерей в обычном смысле. Скорее они возникают при отражении участков реального мира, в отношении которых нет совпадений между моделями. И неудивительно, что различные модели выступают в качестве базисных для расширения понятия „мать". Например, модель, связанная с родами, является основой метафорического смысла выражения: Necessity is the mother of invention. 'Необходимость—мать изобретений'. Модель, связанная с опекой, лежит в основе производного глагола в предложении: Не wants his girlfriend to mother him. 'Ему хочется, чтобы его девушка нянчилась с ним'. Генеалогическая модель является основой метафорических значений слов мать и дочь в деревьях, которые используются лингвистами для представления структуры предложения. Если узел А находится непосредственно над узлом В дерева, то А—мать, а В — дочь. Даже в случае метафорического переноса трудно выделить какую-либо единственную модель, лежащую в его основе. Это соответствует приведенным выше примерам, которые демонстрируют, что понятие „мать" определяется кластером конвергентных базисных моделей. Это явление не укладывается в рамки классической теории. Понятие „мать" невозможно раз и навсегда четко определить через необходимые и достаточные условия. На самом деле нет нужды в том, чтобы для всех случаев употребления слова ,,мать" были определены одни и те же необходимые и достаточные условия: понятие материнства включает и понятие биологических матерей, и матерей-доноров (от которых берется яйцеклетка), и суррогатных матерей (которые вынашивают детей из чужих яйцеклеток), и матерей приемных детей, и незамужних матерей, которые отдают своих детей приемным родителям, и мачех. Все они являются матерями благодаря связи с идеальным случаем, где сопрягаются все базисные модели. Этот идеальный случай—один из многих, в результате которых возникают прототипические эффекты. 5.1.2. Работающие матери. У категории ,,мать" два уровня прототипической структуры. Один уровень определяется вышеописанным экспериенциальным объединением моделей. Существование второго уровня связано с тем фактом, что наряду с идеальным случаем, при котором сопрягаются все базисные модели, существует также и стереотипное представление о матери как о домохозяйке. У нас нет словосочетания ,,мать-домохозяйка" (housewife mother) — оно не необходимо, поскольку отражает ситуацию, являющуюся нормой. Но сама подкатегория мать-домохозяйка (housewife mother) существует, доказательством чего является наличие другой, проти- 39
вопоставленной ей категории, имеющей языковое обозначение — working mother 'работающая мать'. Стереотипное представление о матери как о домохозяйке существует на основе стереотипного же представления о воспитании, которое связано с моделью воспитания. Согласно общепринятой точке зрения, матери, которые не остаются дома со своими детьми на весь день, не могут правильно воспитать их. Одновременно существует стереотипная точка зрения, в соответствии с которой работа рассматривается как деятельность вне дома, поэтому ведение домашнего хозяйства и воспитание детей не считаются работой. Это тот стереотип, который опровергается рекламным щитом „Все матери—работающие матери". Стереотип представления о матери как о домохозяйке определяется поэтому относительно модели, связанной с воспитанием. Этот факт кажется само собой разумеющимся, но он отнюдь не тривиален. Он доказывает, что метонимические модели так же, как стереотипы, необязательно определяются в отношении всего объединения моделей в целом. В данном случае метонимическая модель связана только с одной моделью кластера—с моделью воспитания. Вот достаточно тонкое подтверждение этому: Представим себе мать-одиночку, отдавшую своего ребенка приемным родителям и затем начавшую работать. Она продолжает оставаться матерью в силу того, что она родила ребенка (то есть в соответствии с моделью, связанной с родами), и она работает, но она не является работающей матерью! Причина такого положения вещей в том, что для понятия „мать" релевантной является модель воспитания, а не модель родов. Так, биологическая мать, которая не несет ответственности за воспитание ребенка, не может считаться работающей матерью, тогда как приемная мать, безусловно, может считаться таковой. Приведенный нами пример демонстрирует следующее: — Социальный стереотип (например, мать-домохозяйка) может быть определен в отношении только одной из базисных моделей экспериенциального кластера (например, модели воспитания). — Подкатегория (например, работающая мать) может быть определена через противопоставление стереотипу (например, мать- домохозяйка). — Когда налицо и социальный стереотип, и базисная модель, то для определения подкатегории (например, работающая мать) используется только релевантная базисная модель (например, модель воспитания). Таким образом, только те матери, которые воспитывают своих детей, могут в то же время считаться работающими матерями. Мачехи и приемные матери могут также быть работающими матерями, но биологические матери, отдавшие своих детей приемным родителям, и суррогатные матери, родившие ребенка для какой-нибудь другой женщины, не могут считаться работающими матерями даже в том случае, если они работают. 40
Такие модели стереотипов важны для теории понятийных структур по целому ряду причин. Прежде всего, как мы видели, они могут быть использованы, чтобы мотивировать и определить противопоставленную подкатегорию, такую, как работающая мать. Это положение представляется нам очень важным, так как с точки зрения классической теории случаи типа ,,работающая мать" невозможны. В классической теории социальные стереотипы не имеют когнитивной функциональной нагрузки, им не отводится никакой роли в определении понятий и понятийных категорий. Однако тот факт, что понятийная категория „работающая мать" формируется противопоставлением стереотипу ,,мать-домохозяйка", доказывает, что стереотипы, безусловно, играют роль в формировании понятий. Помимо этого, стереотипы определяют нормативные установки, что получает языковое выражение. Например, слово but в английском языке используется, чтобы маркировать ситуацию, противопоставленную модели, считающейся нормативной. Этой функции могут служить стереотипические модели. Она мать, но не домохозяйка (нормальное высказывание). Она мать, но она домохозяйка (отклоняющееся от нормы высказывание). Последнее предложение могло бы быть употребленным только в том случае, если бы стереотипное представление о матери не включало представления о том, что мать должна быть домохозяйкой. Итак, существует два типа моделей для понятия ,,мать". — Идеальная модель, представляющая собой кластер конвергентных базисных моделей. — Стереотипическая модель, которая является метонимической, а не базисной моделью. Обе модели являются прототипическими, но каждая по-своему. Вместе они формируют кластер со сложным прототипом: лучший пример матери—биологическая мать, которая является домохозяйкой, главным образом занята воспитанием детей, не работает, принадлежит к поколению, непосредственно предшествующему поколению ребенка, и является женой отца ребенка. Сложный прототип накладывает на категорию то, что может быть названо структурой репрезентативности: чем ближе женщина к прототипу, тем более репрезентативной (типичной) матерью она является. Структуры репрезентативности имеют линейный характер. Они не отражают ничего, кроме близости к прототипу, скрывая, таким образом, большую часть богатства структуры когнитивных моделей, характеризующих категорию. Структуры репрезентативности, хотя и существуют в действительности, не более, чем ,,тени" когнитивных моделей. Важно иметь в виду этот факт, поскольку иногда считают, что теория прототипов включает только линейные структуры репрезентативности, но не когнитивные модели. Такая точка зрения чрезвычайно обедняет теорию прототипов. Исследование структур репрезентативности сыграло важную роль в истории теории прототипов. Это исследование показало 41
главным образом, что прототипы действительно существуют, и, кроме того, оно было первым шагом на пути выяснения того, что такое прототипы и какими свойствами они обладают. Но исчерпывающее исследование структуры категории не должно ограничиваться выделением прототипа и указанием близости непрототипических случаев к прототипу с помощью их линейного упорядочения. По крайней мере это исследование должно выявлять те элементы когнитивных моделей, на основе которых возникают структуры репре зентативности. 5.2. Радиальные структуры. Назовем некоторые из существующих типов матерей. — Центральный случай, где конвергируются все модели. Это мать, которая является в данный момент и всегда была женщиной и которая родила ребенка, отдала свою половину генов будущему ребенку, вынянчила его, является женой его отца, принадлежит к поколению, непосредственно предшествующему поколению ребенка, и является законным блюстителем интересов ребенка. — Мачеха: она не рожала ребенка и не была поставщицей генов, но в настоящее время замужем за отцом ребенка. — Приемная мать: она не рожала ребенка и не была поставщицей генов, но является законной блюстительницей интересов ребенка, и на ней лежит обязательство вырастить его. — Мать, родившая ребенка. Существует система усыновления детей, при которой женщина, родившая ребенка, но не желающая его воспитывать, имеет право выбрать для него приемных родителей. В этой системе женщина, которая родила ребенка, называется ,,мать-роженица" (birth mother). — Мать-кормилица. Ей платит государство за то, что она вскармливает ребенка. — Биологическая мать. Она родила ребенка, но не растит его, и существует другая женщина, которая выполняет по отношению к ребенку такие обязанности, что заслуживает права называться матерью какого-либо типа. — Суррогатная мать. Она заключает контракт, в соответствии с которым не берет на себя никаких обязательств, кроме рождения ребенка. Она может получить или же не получить чужие гены, она не замужем за отцом ребенка и не обязана кормить и нянчить его. По контракту она отказывается от права опеки над ребенком. — Незамужняя мать (мать-одиночка). Она не замужем за отцом ребенка ко времени его рождения. — Генетическая мать. Мне случалось встречать этот термин, он используется для обозначения женщины, предоставившей свою яйцеклетку для имплантации в матку какой-либо другой женщины и больше не имеющей никакого отношения к ребенку. Насколько мне известно, это понятие еще не стало общепринятым. Все перечисленные подкатегории матерей воспринимаются как отклонения от центрального понятия. Но отнюдь не все случаи варьирования центрального понятия существуют как категории. 42
Например, женщины, которые юридически являются опекунами детей, но не воспитывают их сами, а нанимают для этой цели кого-то другого, не включаются в категорию матерей. В категорию матерей не включаются трансмутанты, которые родили ребенка, а затем с помощью хирургической операции изменили свой пол. Некоторые из перечисленных категорий появились только в XX в., являются продуктом века и ранее просто не существовали. Дело в том, что центральное понятие матери не порождает всех этих категорий. Согласно общей точке зрения, подкатегории воспринимаются просто как варианты центрального понятия. Общего правила порождения различных категорий матерей не существует. Они обусловлены культурой и должны быть усвоены ее носителями. Нет никакого сомнения в том, что в разных культурах существуют разные типы матерей. На Тробриандских о-вах* женщина, родившая ребенка, часто отдает его на воспитание другой, пожилой женщине. В архаическом японском обществе женщина, как правило, отдавала своего ребенка на воспитание своей сестре. В нашей культуре не существует типов матерей, в точности соответствующих этим последним. Категория матери в нашей культуре имеет структуру, которую мы назовем радиальной. Для радиальной структуры характерно существование одного центрального члена и его общепринятых модификаций. Категории, которые порождаются центральным членом по каким-то общим регулярным правилам—как, например, натуральные числа,—исключаются из радиальной структуры. Мы ограничиваем радиальные структуры только такими, в которых модификации центрального члена являются конвенциональными для данного общества и должны быть усвоены носителями языка. Мы также исключаем из числа радиальных структур такие, в которых нецентральные члены отличаются от центральных лишь большим количеством свойств, но не имеют принципиальных различий с центральным, более общим членом. Классы I, II и III в языке дьирбал имеют радиальную структуру. Класс IV, в который вошло все то, что не попало в первые три, не имеет радиальной структуры. Категория hon в японском языке имеет радиальную структуру. Категории, имеющие радиальную структуру, широко распространены во всех естественных языках. 6. РАЗМЫТОСТЬ: ГРАДУИРОВАННЫЕ И НЕГРАДУИРОВАННЫЕ ИСТОЧНИКИ Существует огромное различие между прототипичностью и размытостью. Размытость налицо, когда можно говорить о большей или меньшей степени принадлежности члена категории. Все рассмотренные нами выше примеры были примерами прототипичности разного рода, но не примерами размытости. Члены категории могут отстоять от центра дальше или быть к нему ближе, не будучи при этом размытыми. Так, мать может не соответствовать стереотипному * О-ва в юго-западной части Тихого океана.—Прим. перге. 43
представлению о матери-домохозяйке, но не переставать при этом быть матерью. Утки и ястребы не соответствуют стереотипному представлению о птицах, но не перестают от этого быть птицами. Размытость и прототипичность часто путают, и это имеет довольно серьезные причины. В результате размытости возникают прототипические эффекты. При этом существует два главных источника размытости: наиболее очевидный источник—существование параметрических (градуируемых) понятий, о которых в течение многих лет писал Л. Заде (Lofti Zadeh). Это такие понятия, как высокий, богатый, среднего возраста и т. д. Значение этих слов предполагает шкалирование. Люди богаты в определенной степени; они могут быть более или менее среднего возраста. Рассмотрим категорию мужчина средних лет. Пятидесятилетний мужчина— лучший пример мужчины среднего возраста, чем тридцатипятилетний. Когда человеку исполняется семьдесят лет, абсолютно ясно, что его средний возраст далеко позади. Понятие ,,мужчина среднего возраста"—параметрическое понятие, определяющееся шкалой. Размытость здесь заключена в самом понятии, прототипические же понятия—это понятия, абсолютно четко принадлежащие категории. Источником размытости могут быть и неградуируемые понятия— понятия, определяющиеся моделями, не включающими шкалу. Филлмор (Fillmore, 1982) приводит освященный веками пример слова холостяк. Он показывает, что понятие ,,холостяк" определяется относительно идеализированной модели мира, в котором есть социальный институт брака, причем брак является моногамным и заключается между людьми разного пола. Эта идеализированная модель не предполагает возможности развода, а также не учитывает существования священников, монахов, гомосексуалистов, двоеженцев, евнухов и людей, связанных интимными отношениями на протяжении многих лет, но не состоящих в браке. Эта модель предполагает, что мужчина становится зрелым и что каждый зрелый мужчина обеспечен настолько, что может содержать жену. Такая идеализированная модель служит основой для определения понятия «холостяк». По этой модели каждый зрелый мужчина либо женат, либо не женат. Неженатые мужчины — холостяки. Эта идеализированная модель укладывается в рамки классической теории категорий. По этой модели холостяк—весьма четко определенная аристотелева категория. Но эта идеализированная когнитивная модель не соответствует реальному миру, который мы очень хорошо знаем. Когда эта модель помещается в контекст всего нашего остального знания о мире, появляется размытость, источником которой является не сама модель, но несоответствие исходных посылок, лежащих в основе модели, нашему знанию о мире. Приведем несколько примеров, доказывающих несостоятельность исходных посылок, в результате чего оказывается невозможным дать ясный, недвусмысленный ответ на вопросы: — Тарзан холостяк? — Холостяк ли папа римский? 44
— Является ли мусульманин, который имеет трех жен и должен жениться на четвертой, холостяком? — Если священник слагает с себя сан в пятьдесят лет, является ли он холостяком? Ответы на эти вопросы не могут быть четкими по той причине, что идеализированная модель, в отношении которой определено понятие „холостяк", может не укладываться в контекст нашего знания. В данном случае источник размытости не в самой модели, но во взаимодействии этой модели с другими моделями, отражающими другие аспекты нашего знания о мире. В результате такой размытости возникают прототипические эффекты—представления о лучших и худших образцах холостяков. Слова лучше и хуже в данном случае отражают степень уверенности, с которой можно утверждать, что данное лицо является членом категории. Слово холостяк представляет собой особенно интересный случай, поскольку оно имеет еще один источник прототипиче- ских эффектов, причем такой источник, в котором вообще отсутствует размытость и точно определяется принадлежность категории. Этот источник—стереотипное представление о холостяках. Рассмотрим ситуации, в которых налицо все условия, лежащие в основе понятия „холостяк". Среди людей, считающихся холостяками, некоторые соответствуют стереотипному представлению о холостяках, а другие—нет. Стереотип холостяка — это мужчина, который встречается с разными женщинами, стремится одерживать любовные победы, проводит много времени в барах, не любит выполнять работу по дому, заботиться о детях и т. п. Нет сомнения, что Джо Намат принадлежит к этой категории. Мужчина, который любит заботиться о детях, работает в детском саду, не стремится одерживать победы над женщинами и никогда не ходит в бары и ночные клубы, в то же время может, без всяких сомнений, быть включенным в категорию холостяков, хотя и не является таким хорошим примером холостяка, как Джо Намат, поскольку не соответствует стереотипу. Таким образом, стереотип— это еще один источник прототипических эффектов. 7. ИСТОЧНИКИ НЕКЛАССИЧЕСКИХ ЭФФЕКТОВ Согласно классической теории, категория имеет четкие, хорошо очерченные границы и принадлежность к категории определяется необходимыми и достаточными условиями, общими для всех членов категории. Поскольку эти условия являются общими для всех членов категории, ни один из ее членов не может быть лучшим или более центральным, чем остальные. Однако ни один из рассмотренных нами примеров не соответствует этому положению. Это не значит тем не менее, что точка зрения Аристотеля в корне неверна. Вернемся к анализу слова холостяк у Филлмора. Базисная модель холостяка — это идеализированная модель, которая исключает из рассмотрения множество существующих в действительности 45
случаев. Если ограничиваться только случаями, предусмотренными данной моделью, то базисная модель—это модель классическая. Эта базисная модель — и многие другие—включает классические условия. Неклассический эффект возникает лишь тогда, когда приходится выйти за пределы модели, чтобы рассмотреть не учтенные ею, но на деле существующие случаи. Как получается, что когнитивная модель, которая отвечает классическим условиям, в то же время порождает неклассические эффекты? Причина заключается в том, что классическая теория категорий не является когнитивной теорией. Эта теория рассматривает отношения между реалиями естественного мира, но не рассматривает того, как человек осмысливает мир. Если в классической теории и есть зерно истины, то оно явно не совпадает с тем, которое имел в виду Аристотель. Классическая теория категорий верна лишь постольку, поскольку она частично — и только частично—применяется к когнитивным моделям, которые используются при осмыслении мира. Иными словами, существуют идеализированные модели мира, которые действительно содержат классические условия. Но эти модели не являются классическими категориями. Они порождают прототипические эффекты, что не должно быть присуще классическим категориям. Когнитивные модели, включающие как часть классические категории, предназначены для того, чтобы выполнять значительно более скромную функцию, чем классические категории,— они должны помочь осмыслить ту часть опыта человека, которая ограничена человеком и воспринимается самим человеком. Классическая же теория ставила перед собой задачу выявить независимо от мышления человека необходимые и достаточные условия для последовательной классификации всех реалий мира. Классификация, которую осуществляет сам человек, просто не укладывается в эту теорию, так же как—есть причины предполагать это—не укладывается и весь реальный мир. Как мы убедились, категориальные классификации мира, которые осуществляет человек, весьма отличаются от классических. Источники неклассических эффектов могут быть самыми разнообразными: различные типы базисных моделей, кластеры базисных моделей, модели параметрических понятий и взаимодействие между идеализированными классическими моделями и знанием, необходимость отражения которого не была учтена при создании этих моделей. 8. КЛАССИФИКАТОРЫ—КАТЕГОРИИ МЫШЛЕНИЯ ИЛИ ПРОСТО СЛОВА Вполне возможно, что проведенный нами анализ вызовет возражение, заключающееся в том, что классификаторы — это чисто языковые единицы, не отражающие категории мышления. Так, нам могут возразить, что реалии, с названиями которых в японском языке используется классификатор hon, не образуют единой категории мышления. Исходя из этого, можно предположить, что анализ 46
использования классификатора hon может раскрыть факты структуры языка, но ничего не говорит о системе понятий. В качестве возражения на это можно выдвинуть следующее предположение. Каким бы ни был их точный когнитивный статус, языковые правила являются в большей или меньшей степени частью нашего когнитивного аппарата. Какова же область приложения этих языковых правил? В частности, эти правила применяются во всех случаях, которые мы рассматривали в связи с анализом классификатора hon: — центральные и периферийные члены — центральные объекты базисного уровня — конвенциональные ментальные образы — знание о конвенциональных ментальных образах — трансформации схематических представлений образов — применение метонимического переноса в образном мышлении — применение метонимического переноса к сферам опыта — концептуальные метафоры (которые переводят одну концептуальную сферу в другую). Эти механизмы необходимы независимо от того, считать их языковыми или же нет. Более того, по-видимому, они принадлежат той сфере, которую хочется назвать концептуальной — ментальные образы и трансформации образов не являются чисто языковыми категориями. Помимо того, языковые категории могут использоваться при неязыковой деятельности, как показали Кэй и Кемптон (Kay and Kempton, 1983). Но независимо от того, используются они в неязыковой деятельности или нет, языковые категории—это категории, и они составляют часть нашего когнитивного аппарата. Оказывают им честь или нет, называя их ,,концептуальными", языковые категории — это категории нашей когнитивной системы, и исследование всех категорий нашей когнитивной системы должно включать также и исследование языковых категорий. 8.1. Когнитивные категории или просто пережитки. Другое возражение, которое иногда вызывает наш анализ, заключается в том, что нецентральные члены категории существуют просто «в силу исторической традиции», но не являются частью живой когнитивной системы. Своими выводами о том, что носители дьирбала не сознают принадлежности каждого члена, взятого в отдельности, к категории, но овладевают общими принципами системы, Диксон уже опроверг это возражение. Более того, проведенное А. Шмидт исследование вымирания языка дьирбал предоставило драматические доказательства того, что анализ Диксона был в целом верен и соответствовал психологической реальности. В дополнение к этому следует сказать, что положение о классификаторах как о ,,реликтах древней системы" вообще несостоятельно. Даже когда дело касается ,,просто" исторических реликтов, здесь ничего не может быть ,,просто". Когда в ходе исторического 47
развития языка происходит распространение категорий, для него необходима какая-то когнитивная основа. Возможно, что используются когнитивные базы, очень похожие на рассмотренные нами. В то время, когда происходит распространение категории, такие механизмы абсолютно реальны. 9. ЭКСПЕРИЕНЦИАЛЬНЫЙ, ОБРАЗНЫЙ И ЭКОЛОГИЧЕСКИЙ АСПЕКТЫ МЫШЛЕНИЯ Теперь мы можем перейти к рассмотрению того, как система классификаторов отражает экспериенциальный, образный и экологический аспекты мышления. Начнем с экспериенциального аспекта. Как пишет Денни (Denny, 1976), «...семантические функции классификаторов состоят в том, чтобы распределить объекты по классам, отличающимся и дополнительным по отношению к классам, на которые делятся существительные. Реалии распределяются по классам с точки зрения того, какую роль они играют в жизни человека». Денни отмечает, что независимо от языка выделяется три основных семантических типа классификаторов, причем все они играют определенную роль в жизни человека: «физическое взаимодействие (такое, как перемещение), функциональное взаимодействие (такое, как использование предмета в качестве инструмента) и социальное взаимодействие (например, правильное общение с человеком, отличное от общения с животным, или с лицом, стоящим на более высокой ступени общественной иерархии, в отличие от общения с лицом более низкого социального статуса)». Денни убедительно доказывает, что диапазон классификаторов для обозначения типов физического взаимодействия находится в прямой зависимости от значимых для данной культуры типов физической деятельности. Наблюдения Денни хорошо укладываются в картину, описанную Берлином, Рош и другими учеными, работающими над проблемой категоризации базового уровня. Так же как Денни, они обнаружили, что категоризация на базовом уровне зависит от рода повседневного человеческого взаимодействия как в вещном мире, так и в культуре (Berlin et al., 1974; Rosch, 1977). Для категоризации на базовом уровне важны такие факторы, как образное восприятие, физическое взаимодействие, ментальные образы и роль реалий в культуре. Все эти соображения подтверждают точку зрения, согласно которой наша концептуальная система зависит от нашего физического и культурного опыта и непосредственно связана с ними. В то же время эти наблюдения опровергают классическую точку зрения, согласно которой понятия абстрактны и не связаны с опытом человека. Примеры употребления классификатора hon в японском языке, так же как анализ классификаторов в языке дьирбал, проведеный Диксоном, показывают, какое место занимают образные аспекты в человеческом мышлении, в особенности это касается использования ментальных образов, трансформаций схематических представлений образов, концептуальной метонимии и концептуальной метафоры. 48
И наконец, тот факт, что распространение категории не является ни прогнозируемым, ни произвольным, но, наоборот, мотивировано, демонстрирует экологический характер человеческого мышления. Мотивация зависит от характеристик концептуальной системы в целом, а не от какой-либо отдельно взятой категории. Существование в дьирбале класса, включающего разнообразные реалии, не вошедшие в другие классы, также показывает, что категоризация является не локальной, но по меньшей мере зависит от существующих в системе противопоставлений. 10. ТОЧКА ЗРЕНИЯ ЭНТУЗИАСТА КОМПЬЮТЕРИЗАЦИИ Достижения последних лет в области теории программирования привели к тому, что метафорическое представление об интеллекте как о компьютере стало популярным не только среди неспециалистов, но и среди ученых, занимающихся когнитивной психологией. Согласно этой точке зрения, мышление — это компьютер на биологической основе, работающий по таким же программам, какие в настоящее время составляются для ЭВМ. Я назову такую точку зрения точкой зрения энтузиаста компьютеризации. Результаты, о которых мы только что говорили, в целом несовместимы с этой точкой зрения. Наше первое возражение связано с тем, что у компьютеров нет тел. Если верно, что наша концептуальная система основывается на физическом, социальном и прочих видах опыта и понимается через них, тогда компьютеры просто ничего не понимают сейчас и ничего не поймут никогда. Более того, без привлечения важных аспектов перечисленных видов опыта электронная модель мышления не сможет объяснить процесс усвоения базисных понятий и структурирования таксономических систем. Наконец, современный вычислительный подход не позволил нам хотя бы приблизиться к адекватному представлению образного аспекта мышления. Хотя частичные успехи были достигнуты в области изучения метафоры и репрезентации ментальных образов, современная методика исследования не позволяет даже приблизительно раскрыть механизм использования образных средств при построении таксономических систем. Что же касается метонимии и схематических представлений образов, то, насколько мне известно, они даже не попадали в сферу внимания исследователей—и в настоящее время мы не видим пути подхода к их моделированию на ЭВМ. Более того, тот факт, что метафора, метонимия и трансформации схематических представлений образов основываются на опыте, еще более затрудняет их трактовку в терминах вычислительной лингвистики. Анализ экологического аспекта мышления также выходит за рамки подхода энтузиаста компьютеризации. Во всех существующих системах обязательно присутствует дихотомия предсказуемого / произвольного. Предсказуемость отождествляется с вычислимостью, и все объекты могут быть либо вычислимыми, либо нет. Точка 4-1182 49
зрения энтузиаста компьютеризации не оставляет никакого выбора. Тем не менее система мышления человека допускает третью возможность— мотивацию, и именно мотивация используется чаще всего. Мотивация—это экологическая характеристика системы мышления в целом. Современные компьютерные модели не могут должным образом учитывать наличие мотивации. Наш современный уровень понимания вычислительных процессов не позволяет создать программу, которая обучалась бы, запоминала и рассуждала в случаях, когда имеется выраженная мотивация; наша программа может с величайшим трудом работать лишь для слабомотивированных случаев. Иными словами, современные компьютерные системы не располагают таким аппаратом, который позволил бы отличать непредсказуемые случаи, встречающиеся в сложных концептуальных системах, от непредсказуемых случаев, которые не укладываются в систему, работая при этом более успешно в случаях, которые укладываются в систему. Более того, такой аппарат даже не начинал серьезно разрабатываться. Создание такого аппарата требует гораздо более сложного подхода, чем простой, компьютерный. Наличие системы классификаторов — лишь одно из многих явлений, присущих естественным языкам, которое невозможно интерпретировать, исходя из точки зрения на интеллект как на компьютер. Формальная лингвистика в ее нынешнем состоянии пусть упрощенно, но все же укладывается в рамки компьютерной парадигмы. Формальный синтаксис предполагает алгоритмические операции над неинтерпретированными символами. Формальная семантика предполагает интерпретацию этих символов в терминах моделей, сходных с базами данных, которые используются в современных системах искусственного интеллекта. Ни формальный синтаксис, ни формальная семантика в сегодняшнем понимании неспособны адекватно анализировать экспериенциальный, образный и экологический аспекты мышления. Возможно, поэтому специалисты по формальной лингвистике упорно игнорируют исследования систем классификаторов. 11. ЧЕМ ЖЕ НЕ ЯВЛЯЕТСЯ ТЕОРИЯ ПРОТОТИПОВ? Ряд сторонников вычислительного подхода неверно интерпретировали теорию прототипов как согласующуюся с их взглядами. Показателен пример работы Ошерсона—Смита (Osherson and Smith, 1981), которые пишут о теории прототипов следующее: «Теория прототипов трактует принадлежность категории как градуированную, определяющуюся на основе сходства с ,,лучшим" образцом категории (или на основе какого-нибудь другого параметра, определяющего близость к центру категории)». Иными словами, Ошерсон и Смит понимают теорию прототипов как теорию, основным положением которой является утверждение о том, что категориальная принадлежность полностью прогнозируется прототипом и исчисляется сходством с ним. Такая трактовка теории прототипов позволяет уложить ее в рамки компьютерного подхода, делающего акцент на алгоритмическом вычислении и дихотомии предсказуемого/произвольного. Но 50
эта трактовка теории прототипов весьма далека от той теории прототипов, которую создали и развивали в своих работах Берлин, Кэй, Рош, Филлмор, я сам и многие другие. Интерпретация теории прототипов специалистами по вычислительной лингвистике упускает из виду именно то, что делает ее чрезвычайно интересной для специалистов по когнитивной антропологии и для лингвистов, а именно внимание к экспериенциальному, образному и экологическому аспектам мышления. Как мы убедились, не учитывая эти аспекты мышления, невозможно адекватно интерпретировать системы классификаторов. Системы классификаторов не только показывают несостоятельность классической теории категорий, но и подрывают интерпретацию теории прототипов, которую выдвигают энтузиасты компьютеризации. ЛИТЕРАТУРА Berlin, Kay, 1969=Berlin, В., Кау,Р. Basic Color Terms: Their Universality and Evolution. Berkeley: Univ. of California Press, 1969. Berlin, Breedlove, Raven, 1974=Berlin, В., Breedlove, D. E., Raven, P. H. Principles of Tzeltal Plant Classification. New York: Academic Press, 1974. Borges, 1966=Borges, J. L. Other Inquisitions 1937—1952. New York: Washington Square Press, 1966. Brugman, 1981=Brugman, Claudia. Story of OVER. University of California, Berkeley, M. A. Thesis, 1981. Denny, 1976=Denny, J. Peter. What are noun classifiers good for?—In:,»Proceedings of the Twelfth Regional Meeting of the Chicago Linguistic Society", 1976. Dixon, 1968=Dixon, R. M. W. Noun classes.—„Lingua", XXI, 1968, p. 104—125. Dixon, 1982=Dixon, R. M. W. Where have all the adjectives gone? and other essays.— In: „Semantics and Syntax". Berlin: Mouton, 1982. Fillmore, 1982=Fillmore, Charles. Towards a descriptive framework for spatial deixis.— In: „Speech, Place and Action". Ed. by Jarvella and Klein. London: J. Wiley, 1982. Kay, McDaniel, 1978=Kay, Paul and Chad M с Daniel. On the linguistic significance of the meaning of basic color terms.— „Language", vol. 54, № 3, 1978. Kay, Kempton, 1983=Kay, Paul and Willet Kempton. What is the Sapir— Whorf hypothesis?—In: Berkeley Cognitive Science. Report № 8, Institute for Human Learning, Univ. of California at Berkeley, 1983. Lakoff, 1973=Lakoff, George. Hedges: A study of meaning criteria and the logic of fuzzy concepts.— „Journal of Philosophical Logic", 2, 1973, p. 458—508. Lakoff, 1981=Lakoff, George. Getting the whole picture: The role of mental imagery in semantics and pragmatics.— In: „Proceedings of the Seventh Annual Meeting of the Berkeley Linguistics Society", 1981. Lakoff, 1982=Lakoff, G. Categories and cognitive models. Berkeley Cognitive Science. Report № 2. Institute for Human Learning, Univ. of California at Berkeley, 1982. Lakoff, Johnson, 1980=Lakoff, George and Mark Johnson. Metaphors We Live By. Chicago: Univ. of Chicago Press, 1980. Lindner, 1981=Lindner, Susan. A lexico-semantic analysis of verb-particle constructions with UP and OUT. San Diego: Univ. of Calif. (Ph. D. Dissertation), 1981. Osherson, Smith, 1981 = Osherson, Daniel and Edward Smith. On the adequacy of prototype theory as a theory of concepts.— „Cognition", vol. 9, № 1, 1981, p. 35—58. Reddy, 1979=Reddy, Michael. The conduit metaphor.—In: „Metaphor and Thought". (Ed. by A. Ortony). Cambridge: Cambridge Univ. Press, 1979. Rosch, 1973=Rosch, Eleanor. Natural categories.— „Cognitive Psychology", № 4, 1973, p. 328—350. Rosch, 1977=Rosch, Eleanor. Human categorization.—In: „Studies in Cross- Cultural Psychology". (Ed. by N. Warren). London: Academic, 1977. Rosch, 1981=Rosch, E. Prototype Classification and Logical Classification: The Two Systems. (Unpublushed ms.), 1981. Schmidt, 1983 = Schmidt, Annette. Young People's Dyirbal: An Example of Language Death from Australia. (M. A. Thesis. Australian National University). Canberra, 1983.
Ч. Филлмор ФРЕЙМЫ И СЕМАНТИКА ПОНИМАНИЯ* ВВЕДЕНИЕ В этой статье я сопоставляю семантические теории, основывающиеся на понимании языка (в широком смысле), с семантическими теориями, в основе которых лежат суждения об (относительной) истинности. Для удобства я буду говорить о них как о семантике понимания (П-семантике) и семантике истинности (И-семантике). Теория П-семантики видит свое назначение в разработке общего представления об отношениях между языковыми текстами, контекстами, в которых они встречаются, и процессом, а также результатами их интерпретации. Существенно, что такая теория не начинается с множества предположений о различиях между (1) теми сторонами процесса интерпретации, которые входят в сферу интересов собственно лингвистики, и (2) тем, что может принадлежать теориям речевого сотрудничества, рассуждения и систем представлений говорящих. Такие разграничения могут появиться в результате уточнения теории, однако нет никаких оснований для предположения, что именно суждения об истинности определяют границы наиболее существенных противопоставлений. И-семантика, наоборот, начинает с предположения, что ее цель заключается в описании условий, в которых отдельные высказывания данного языка могут быть определены как истинные1. Наличие условий удовлетворительности употребления, которые могут служить альтернативой суждений об истинности для неутвердительных (поп- assertoric) предложений,— общая черта И-семантических теорий, однако все известные мне И-семантические теории начинаются с обращения к утвердительным предложениям, допускающим сужде- * Charles J. Fillmore. Frames and the semantics of understanding.— ,,Quaderni di semantical Vol. VI, no. 2, December 1985, p. 222—254. © 1985 by Quaderni di Semantica. 1 При анализе таких суждений необходимо сделать важный выбор относительно той сущности, которой приписывают истинность или отказывают в ней: является ли эта сущность предложением, произнесением предложения в контексте или пропозицией, передаваемой в произнесении данного предложения в данном контексте. Я думаю, что не всегда аккуратное использование мною этих противопоставлений не приведет в последующем обсуждении к нежелательным последствиям. В наиболее точном употреблении следует говорить о пропозиции, выражаемой при произнесении в определенном контексте (повествовательного) предложения, относительно которого уместны суждения об истинности и ложности; однако в тех случаях, когда путаница маловероятна, я буду довольствоваться использованием слова предложение. 52
ния об (относительной) истинности или ложности, и основываются на них2. В этой статье я отстаиваю (пока еще несколько неопределенную) концепцию семантики понимания, в основе которой лежит понятие фрейма интерпретации. Я предполагаю, что теория фреймов представляет собой полезный инструмент лексической семантики, грамматической семантики и семантики текста. Я доказываю, что рассмотрение значения в терминах таких фреймов интерпретации влечет за собой следствия, многие из которых представляют значительную проблему для семантики истинности. Далее я задаюсь вопросом, действительно ли П-семантика может что-то утверждать об истинности и отрицании (суждений, которые лежали в основе развития формальной семантики), и прихожу к выводу, что и понятие истинности и использование отрицания, необходимые для формальной И-семантики, вторичны для понимания тех концептов, которые возникают в исследованиях по П-семантике. В заключение я рассматриваю проблему, вызвавшую десять лет назад большой интерес,—проблему так называемых пресуппозиций. Я предполагаю, что имеется нечто общее между фреймами интерпретации и определенными видами пресуппозиций, и показываю, что некоторые аргументы, ставившие под сомнение понятие пресуппозиции (как необходимый компонент теории семантики естественного языка), будучи вновь рассмотрены в свете П-семантики, становятся слабыми и неясными. И-семантика, формировавшаяся в соответствии со своими собственными нуждами, снабдила лингвистику антиинтуитивным представлением о пресуппозиции и истине и, установив границы семантических исследований, вывела за их пределы многие аспекты понимания языка; есть надежда, что должным образом продуманная теория П-семантики сможет включить в себя всю сферу лингвистического значения и в то же время даст естественное и удовлетворительное представление о понятиях истинности и пресуппозиции. СЛОВА И ИХ ФРЕЙМЫ Мы бы определенно удивились, обнаружив в программе, предназначенной для изучения лексики английского языка, скажем, студентами-иностранцами, что слово Thursday 'четверг' вводится в первом уроке, Sunday 'воскресенье' — в четвертом, а прочие названия дней недели беспорядочно разбросаны по всему учебному плану. Не рассчитываем мы встретить отдельно друг от друга слова father 'отец', mother 'мать', son 'сын', daughter 'дочь', brother 'брат' и sister 2 В этом понимании истинность „относительна" в двух смыслах:'она относится к моделям (или мирам и ситуациям) и к другим предложениям. В первом случае мы говорим, что пропозиция истинна в такой-то и такой-то ситуации, если в этой ситуации установлено наличие таких-то и таких-то фактов. В последнем случае мы говорим, что пропозиция Р истинна тогда, и только тогда, когда истинна и вторая пропозиция Q. 53
'сестра' или buy 'покупать', sell 'продавать', pay 'платить', spend 'тратить' и cost 'стоить' или day 'день', night 'ночь', noon 'полдень', midnight 'полночь', morning 'утро', afternoon 'время после полудня' и evening 'вечер'. Эти слова образуют группы, каждую из которых лучше изучать как единое целое, потому что каждая группа является лексическим представителем некоторой единой схематизации опыта или некоторого знания. В каждом случае, для того чтобы понять смысл одного из членов группы, необходимо до некоторой степени понять, что значат они все. И поскольку знание, которое лежит в основе значений слов каждой группы, постигается как целостная сущность, было бы естественным ожидать, что студенты будут изучать слова соответствующей группы одновременно. Такие группы слов удерживает вместе то, что они мотивируются, определяются и взаимно структурируются особыми унифицированными конструкциями знания или связанными схематизациями опыта, для которых можно использовать общий термин фрейм3. Если мы хотим четко выразить наше понимание названий дней недели и других связанных с ними слов, мы можем обратиться к единому фрейму интерпретации, который предполагает: (1) понимание естественного цикла, порождаемого каждодневным кажущимся путешествием солнца, (2) знание стандартных способов вычисления того, когда один дневной цикл кончается и начинается новый, (3) знакомство с большим календарным циклом из семи дней, (4) принятую в нашей культуре практику связывать различные части недельного цикла с работой и досугом. Имплицитное владение этой специфической организацией нашего физического и социального мира обеспечивает концептуальный базис для довольно значительного корпуса лексического материала, включающего общие имена типа week 'неделя' и day 'день', их адъективные дериваты, индивидуальные названия дней недели и такие особые категории, как week-end 'конец недели' и fortnight 'две недели'. Заимствуя язык гештальт- психологии, мы можем сказать, что предполагаемый базис знания и практики—сложный фрейм, стоящий за этой областью словаря,— являет собой общее основание образа, который может быть представлен любым из отдельных слов. Такой фрейм образует особую организацию знания, составляющую необходимое предварительное условие нашей способности к пониманию тесно связанных между собой слов. Исходные интуитивные представления, лежащие в основе поня- 3 К настоящему времени для обозначения тех видов структур, которые мы имеем в виду, предложено довольно много разнообразных терминов: ,,фрейм" (Minsky, 1975; Winograd, 1975; Charniak, 1975), „схема" (Bartlett, 1932; Rumelhart, 1975), „сценарий" (Schank & Abelson, 1977), „глобальная модель" („global pattern") (De Beaugrande & Dressler, 1981), „псевдотекст" (Wilks, 1980), „когнитивная модель" (Lakoff & Johnson, 1980), „основание" („base") (в противоположность „профилю") (Langacker, 1984), „сцена" (Fillmore, 1977) и др. Эти термины используются самыми разнообразными способами; некоторые ученые пользуются несколькими из них, различая их по статичности и динамичности, по типам выводов, которые они позволяют сделать, и т. д. 54
тия фрейма, ни в коем случае не оригинальны. Это можно увидеть, например, в трактовке Дж. С. Миллем (Mill, 1846) противопоставления коннотации и денотации по отношению к тому, что он называет соотносительными (correlative) терминами. Милль показывает, что в то время, как слова son 'сын' и father 'отец' „денотатируют" различные сущности (things), „коннотатируют" они одну и ту же сущность, а именно историю событий, приведших к возникновению родственного отношения, на которое указывает каждое из этих слов. «Действительно, если мы возьмем какие-нибудь два соотносительных термина, например отец и сын, то хотя означать (denote) они будут два различных предмета, но соозначение (connote) их обоих будет, очевидно, в известном смысле одно и то же. Нельзя, конечно, сказать, что они соозначают один и тот же признак: быть отцом—не то же, что быть сыном; однако, когда мы одного человека называем отцом, а другого — его сыном, мы скрыто утверждаем некоторую совокупность фактов, совершенно одинаковую как в одном, так и в другом случае. Сказать об А, что он отец Б, а о Б, что он сын А, значит выразить различными словами один и тот же факт. Эти два предложения совершенно равнозначны; ни одно из них не утверждает чего-либо большего, чем другое. Отцовство А и сыновность Б — это не два различных факта, а два способа выражения одного и того же факта, и если этот факт проанализировать, то окажется, что он состоит из некоторого ряда физических событий или явлений, к которому причастны как А, так и Б, и от которого они получили свои имена. Действительное соозначение этих названий представляет цепь известных событий; в этом их содержание, и притом все содержание, которое мы хотим в них вложить. Можно сказать, что этот ряд фактов составляет отношение: схоласты называли это „основанием отношения" (fundamentum relationis) (Mill, 1846: 29)» *. Идея исходной структуры отношения (fundamentum relationis), на основе которой понимаются слова типа son и father, очень близка понятию семантического фрейма: мы можем знать значения отдельных слов только при предварительном осознании фактического основания отношения, которое они определяют. Только что цитированный абзац из главы «Об именах» из книги «Система логики» поясняет и иллюстрирует тезис Милля о том, что «отношения», обычно интерпретируемые логиками как более таинственные, чем другие типы «атрибутов», на самом деле должны рассматриваться как менее таинственные именно потому, что они основываются на не-оккультных ,,фактах". В обсуждении, следующем за цитированным абзацем, Милль говорит: «Существование относительных имен объясняется, по-видимому, наличностью такого события, к которому причастны два индивидуума: основанный на таком факте признак может быть приписан как одному, так и другому из них. Поэтому относительным называется имя тогда, когда, кроме означаемого им предмета, оно указывает на существование еще другого, происхождение названия которого связано с тем же фактом, на котором основано и происхождение названия первого. Или (что то же самое в других словах) имя будет относительным в том случае, если его значение нельзя объяснить, не упоминая о другом предмете, кроме того, который им обозначается. Можно еще сказать и так: имя будет относительным, если нельзя * Перевод книги Дж. Милля дается по: Милль Дж. С. Система логики. М., 1914, р. 37.—Прим. перев. 55
придать ему в речи значения, не говоря или не подразумевая другого предмета, помимо того, которому оно служит названием» (Mill, 1846: 29) *. ,,Факты" (представленные в отрывке из книги Милля), которые объединяют двух людей, связанных отношением „отец—сын", следует рассматривать как фрагмент более значительной сети родственных отношений между людьми; эта сеть может быть определена в терминах деторождения (роль матери), обеспечения возможности деторождения фоль отца), наличия тела, предназначенного для одной или другой из этих функций (свойство быть мужчиной или женщиной), и института брака (создание признаваемых социумом семей). Здесь мы сталкиваемся с понятийной структурой, в рамках которой можно охарактеризовать неограниченно много вариантов родственных отношений между людьми и на которую может быть наложено значительное количество вторичных отношений (например, свойство ,,быть супругом/супругой", распределение по возрастному критерию, приписывание роли в семье, отдаленность от ego по поколениям и т. д.). Именно такой интерпретативный фрейм лежит в основе универсальных характеристик терминологических систем родственных отношений, в категориях которых носитель английского языка выбирает и интерпретирует такие термины, как father, son, granddaughter 'внучка', brother-in-law 'зять', niece 'племянница', third cousin four time removed 'седьмая вода на киселе' и все прочие5. Заметим, что, признавая важность фактического основания для „относительных имен", Милль считает также полезным подчеркнуть значимость связанных между собой в этой области слов. Повторю еще раз отрывок из приведенной ранее цитаты: «Имя не может быть использовано в дискурсе как имеющее значение до тех пор, пока не введено и не понято имя некоторой другой вещи». В лингвистике существуют весьма развитые школы лексической семантики, ориентированные именно на исследование структурных отношений между словами в специфических семантических областях. Я имею в виду теорию лексического поля, связанную с именами И. Трира (см., в особенности, Trier, 1931) и Й. Л. Вайсгербера (см., в особенности, Weisgerber, 1962), которая была затем развита такими учеными, как Эугенио Косериу, Бернард Потье и другими (см. обсуждение 4 В последующей аргументации Дж. Милля сбивает с толку то, что он, как кажется, забывает о женщинах, что в такой ситуации довольно странно,—все они имеют отцов, и многие из них — сыновей. Быть отцом—это не то же самое, что иметь сына, и быть сыном — не одно и то же, что иметь отца. * Милль Дж. С. Система логики. М., 1914, с. 37, 38. 5 Ученые, склоняющиеся к „структурализму", призывают к описанию этих областей лексики в терминах модели отношений между словами, существующих исключительно в „системе языка". Обычно исследование семантики терминов родства основывается не на системе, непосредственно соотносящейся с такими понятиями „полового и семейного воспитания", которые я упомянул, а на более абстрактных свойствах и моделях родственных отношений, выбранных для того, чтобы обеспечить возможность показа внутренней языковой структуры обсуждаемой области лексики возможно более экономным образом. Тем не менее в семантике фреймов считается необходимым описывать концептуальные основы лингвистически кодированной понятийной системы независимо от таких мнимых и чисто внутриязыковых структур. 56
этого в Geckeier, 1971). Концептуализация фрейма имеет немало общего с исследованиями лексических полей; поскольку весьма правдоподобно как то, что понятие фрейма может быть построено на достоинствах лингвистической теории поля, так и то, что теория фреймов, по-видимому, подвержена той же критике, которая направлялась в адрес теории лексического поля, может оказаться полезным кратко рассмотреть, чем эти две концептуализации похожи и в чем они различаются6. В традиции исследований лексических полей парадным примером лексем, интерпретация которых зависит от структурированного исходного знания, является набор отметок, использовавшихся в Германии в первой половине этого века для оценки успеваемости учащихся в школе; суть, конечно, в том, что оценка или интерпретация отдельного термина зависит от полного списка используемых терминов и от фиксированного положения данного термина в ряду других терминов7. Легко найти похожие ситуации среди более близких нам реалий. Сравните, например, систему оценок, которые используются для классификации отелей и сервиса в индустрии 6 Обсуждение и критику традиции Трира см., в особенности, в: Dornseiff, 1938; Betz, 1954; Oksaar, 1958; S ре псе, 1961. См. также введение Ван дер Ли и Райхмана к составленному ими собранию трудов Трира (Trier, 1971). 7 Детали заслуживают внимания. Будут ли учащиеся довольны, получив за свою работу, скажем, оценку gut 'хорошо' или mangelhaft 'не вполне удовлетворительно, неудовлетворительно', несомненно, должно зависеть от их знания полного списка категорий, из которого выбирается слово. Как показано у Вайсгербера (Weisgerber, 1962: 99), термины для оценки успеваемости могли выбираться из четырехчленной (,,А"), пятичленной (,,В") и шестичленной („С") системы, например: „С" sehr gut 'отлично' gut 'хорошо' befriedigend ' удовлетворительно' ausreichend 'достаточно' mangelhaft 'не вполне удовлетворительно ' ungenugend 'неудовлетворительно' Учащийся, успеваемость которого была оценена на ,,gut", мог быть доволен, узнав, что это слово представляет вторую от начала категорию (во всех приведенных выше случаях), однако он посчитал бы эту оценку более приемлемой, если бы она была второй от начала в системе из шести оценок, чем если бы она была выбрана из четырехчленной системы. Аналогично получение за работу оценки „mangelhaft" могло бы быть менее обескураживающим, если бы было известно, что есть по крайней мере еще одна более низкая категория (как это имеет место в системах ,,В" и ,,С", но не в системе ,,А"); однако это утешение оказывается меньшим в том случае, когда оценке „mangelhaft" предшествует еще четыре более желательных категории оценок (как в примере ,,С"), чем в ситуации, когда таких категорий лишь три (как в примере ,,В"). (Конечно, такое рассуждение последовательно только при том условии, если отметки классифицируют работу учащегося более или менее равномерно.) sehr gut 'отлично' gut 'хорошо' genugend 'удовлетворительно' mangelhaft ' неудовлетворительно' sehr gut 'отлично' gut 'хорошо' genugend 'удовлетворительно' mangelhaft 'не вполне удовлетворительно' ungenugend 'неудовлетворительно' 57
путешествий, или обозначения размеров и количества коммерческих продуктов. Неопытные туристы, считающие, что они провели в путешествии достаточно времени и заслуживают самого лучшего, иногда бывают разочарованы, обнаружив, что их отель первого класса находится совсем неподалеку от куда более шикарного заведения; они чувствуют себя обманутыми, выяснив, что в официальной терминологии индустрии путешествий классификационная оценка первый класс стоит на четвертом месте сверху и что вызывающий зависть соседний отель принадлежит к классу люкс. Покупатели магазинов самообслуживания в Соединенных Штатах иногда становятся в тупик, обнаружив, что размер упаковки мыльной стружки, помеченный ярлыком large 'большой', оказывается самым маленьким из имеющихся; большие же размеры маркируются такими надписями, как jumbo 'большой, громоздкий', economy 'экономичный', giant 'гигантский' и family size 'семейный'. На примерах шкалы школьных оценок, разрядов отелей для путешественников, классификации размеров упаковок товаров мы сталкиваемся с употреблением „технического языка" в таких контекстах, где его использование вовсе не обязательно. Мы можем объяснить замешательство покупателей в последних двух случаях тем, что слова, используемые в этих случаях в особых фреймах, заимствованы из более знакомых фреймов и мотивируются ими в своем употреблении. Неправильное понимание может возникнуть вследствие того, что реципиент сообщения приписывает слову ту интерпретацию, которая ему знакома,— например рассматривает слово first 'первый' в нормальном фрейме счета—и не подозревает о наличии в данном контексте специально обусловленной интерпретации. Мы считаем, что обращение к фреймам необходимо как для описания конкурирующих между собою употреблений этих слов, так и для объяснения неправильного понимания. Выбравшие неправильную интерпретацию не просто потерпели неудачу в „понимании" слов; они не смогли определить, какая „фреймовая" структура имелась в виду в данном контексте. В только что рассмотренных случаях мы имели дело с фреймами, которые скорее создаются языком, чем отражаются в нем. В таких примерах нормативной терминологии нет достойных внимания групп „фактов", которые можно исследовать независимо от их языковых отражений. Больший интерес для общей эмпирической семантики представляют, конечно, семантические поля „основного лексического фонда". И действительно, в литературе по исследованию лексических полей содержится много детальных разборов (на материале значительного числа языков) словаря таких областей лексики, как цвет, температура, мебель и артефакты, отношения родства, интеллект, домашний скот, характеристики особенностей местности и т. п.8 В теории лексического поля аналогом нашего представления о 8 Примеры и обсуждение таких исследований по лексическим полям см. в: Schwarz, Kandier, 1959; Hoberg, 1970; Geckeier, 1971; Gipper, 1973. 58
фрейме является, конечно, понятие „поля". Оказывается, что в основе метафоры Трира, по крайней мере в первом приближении, лежит концепт „поля" как множества участников соревнования (Gipper, 1973: 442), так как, согласно Триру, для понимания „значения" отдельного термина необходимо осознание интерпретатором позиции слова в поле и какого-то числа других „соревнующихся слов66. Трир пишет: «Soll der Horer verstehen, so muss Zahl und Lagerung der sprachlichen Zeichen dieses Begriffsfelds ihm unausgesprochen gegenwartig sein». (Trier, 1931:7)*. Здесь Трир говорит о терминологии школьных оценок, однако в следующем параграфе он добавляет: «Fur nicht mathematisierte, fur ganz normale Felder, gilt genau das Gleiche»**. Другими словами, он полагал, что в общем случае понимание значения слова сводится к пониманию структуры, в которой это слово функционирует, и что эта структура существует именно потому, что существуют другие слова. Исследования лексических полей в основном лексическом фонде сконцентрировали внимание на анализе специфических для каждого языка способах организации изолированных семантических областей лексики. В теоретических построениях, касающихся лексических полей, бытовало представление о том, что анализируемая семантическая область полностью покрывается данной сетью терминов, что слова в поле конкурируют между собой за семантическую территорию и что тем самым они находятся в парадигматической оппозиции друг к другу. В лингвистике принято рассматривать существующие в данном языке определенные закрытые классы морфем или функциональных слов как множества, содержащие точные оппозиции, или как фиксированные множества элементов, противопоставленных друг другу таким образом, что понимание функции любого из знаков этих множеств требует осознания того, что выбран именно этот знак, а не любой другой из его конкурентов. Многие видят в понятии лексического поля свидетельство того, что словарь языка как единое целое образован определяемыми семантически замкнутыми классами слов; в каждом случае понимание значения одного элемента поля требует возможности просмотра всех имеющихся в нем слов для того, чтобы выяснить, чему соответствует данное слово. Опять процитируем Трира: «Worte sind sinnlos, wenn ihre Kontrastworte aus dem gleichen Begriffsfeld dem Horer fehlen, und sie sind unscharf und verschwommen, wenn ihre begrifflichen Nachbarn nicht mit auftauchen, ihren Anteil am Begriffsfeld beanspuchen und durch ihr Heranrucken die Grenzen des ausgesprochenen Wortes scharf hervortreten lassen» (Trier, 1931:8)***. * «Для того чтобы понять, слушающий должен имплицитно представлять себе число и расположение языковых знаков этого понятийного поля». ** «Для нематематических, совершенно обычных полей имеет место абсолютно то же самое». *** «Слова бессмысленны, если слушающему не известны противопоставленные им другие слова из того же понятийного поля; и они неопределенны и расплывчаты, если не появляются их ,,концептуальные соседи", которые претендуют на свою часть понятийного поля и своим появлением четко выделяют границы произнесенного слова». 59
Наличие тенденции к соотнесению группирующихся в лексические поля слов с единуми понятийными структурами, которые могут познаваться независимо друг от друга, позволило Триру утверждать, что в сознании интерпретатора должны быть сами слова, а не лежащие в их основе ,,понятия" или ,,факты" (или что-либо подобное). Как мы видели, по существу, такой же точки зрения придерживается Милль; она характерна и для последователей Трира (Weisgerber, 1962; Coseriu, 1967 и др.). Аргумент, согласно которому лексическое значение в большей степени связано со своим понятийным основанием, чем со стоящими в одном с ним ряду словами, легко доказывается терминами ,,технического" словаря. Например, мы сможем понять слово гипотенуза, только если мы предварительно знаем о ,,прямоугольном треугольнике": гипотенуза является стороной прямоугольного треугольника, лежащей против прямого угла. В английском варианте теоремы Пифагора другие стороны прямоугольного треугольника называются просто ,,двумя другими сторонами"9; ср. пример (1): (1) В прямоугольном треугольнике квадрат гипотенузы равен сумме квадратов двух других сторон. Между английской и немецкой формулировками теоремы Пифагора существует интересное различие, заключающееся в том, что в немецком варианте боковые стороны прямого угла имеют специальное название. Они известны как Katheten 'катеты'. На немецком языке теорема формулируется так: (2) In einem rechtwinkligen Dreieck ist das Quadrat uber der Hypotenuse gleich der Summe der Quadrate uber den beiden Katheten*. В отличие от leg (см. сноску 10) это слово не заимствовано из другой области. Единственное семантическое предназначение немецкого слова Kathete состоит в том, чтобы служить названием стороны, примыкающей к прямому углу в прямоугольном треугольнике. Подход семантики фреймов должен непосредственно связывать каждый из релевантных терминов с лежащим в их основе фреймом, а именно со знанием характеристик прямоугольного треугольника. С другой стороны, теория лексического поля, понятая буквально, должна предсказывать, что английское слово hypotenuse и его немецкий омограф обладают различными значениями, потому что только в немецком языке действительно существуют релевантные лексемы-партнеры, обеспечивающие эффект „взаимного определе- 9 Пример, возможно, не вполне корректен, поскольку в некоторых учебниках для обозначения одной из этих „других двух сторон" используется слово leg 'сторона (треугольника)', досл, 'нога'; однако я обнаружил, что в небольшой группе информантов, получивших американское образование, большинство опрошенных не подозревало об этом факте. И во всяком случае, слово leg имеет и другие употребления.— Моим предшественником, использовавшим лексему гипотенуза для иллюстрации семантического противопоставления фигура : основание (в его терминологии базис : профиль), был Рональд Лангакер (Langaker, 1984). * *В прямоугольном треугольнике квадрат гипотенузы равен сумме квадратов обоих катетов'. 60
ния". Далее, теория лексического поля должна предсказывать, что для немецких школьников, знающих слово гипотенуза, оно имеет иное значение, нежели для их одноклассников, не выучивших еще слово катет. В это, конечно, трудно поверить. В техническом языке довольно легко найти подтверждения непосредственного соответствия слову фрейм, но многие исследователи лексических полей отвергли бы (как Косериу) релевантность таких данных для положений теории поля. Однако в то же время можно выдвинуть аргумент—и он энергично выдвигался,— что многие слова, попадающие в одну область „основного словаря", не определяют друг друга ожидаемым образом. Исследование Дорнзей- фом (Dornseiff, 1938) семантики некоторых терминов, обозначающих передвижение с помощью обеих ног (springen 'прыгать', laufen 'бежать', hupfen 'прыгать, скакать' и ряда других) убедительно подтвердило эту точку зрения; к тем же результатам привело изучение Оксааром (Oksaar, 1958) лексики, описывающей скорость. (По существу, такая же точка зрения, не связанная, правда, с проблемами теории поля, выражена Вайнрихом при обсуждении ,,не-терминологизованной" лексики (Weinrich, 1963: сноска 69). В качестве иллюстрации привлекались слова из области, исследованной Дорнзейфом. Примерами Вайнриха были глаголы bound 'прыгать', hop 'прыгать, подпрыгивать', jump 'прыгать, скакать', leap 'прыгать, перепрыгивать', prance 'становиться на дыбы, гарцевать, танцевать, прыгать', skip 'скакать, перескакивать' и vault 'прыгать, перепрыгивать (опираясь на что-либо)')10. Теория лексических полей отличается от семантики фреймов прежде всего своей приверженностью к исследованию групп лексем ради них самих и интерпретацией лексико-семантических областей как собственно языковых феноменов. Семантика фреймов допускает возможность того, что говорящие могут в полной мере обладать знанием данного слова, входящего в некоторую область лексики, даже если они вообще не знают никаких других слов этой области или знают лишь некоторые из них. Семантика фреймов рассматривает множество фреймов интерпретации, определяемых языком11, как 10 Мое собственное понимание этих наблюдений основано на том предположении, что наличие общего семантического содержания не гарантирует вхождения в единый фрейм интерпретации. С моей точки зрения, такие слова, как skip, hop, leap и т. д., соответствуют отдельным фреймам, каждый из которых представляет свою собственную схему передвижения с помощью ног. Не существует контекстно-свободного фрейма, в котором эти термины занимали бы различные ,,слоты**, хотя такой фрейм может легко сформироваться, если возникнет необходимость (скажем, в сфере спортивной терминологии) установления между ними точных различий. 11 Для удобства я использую здесь выражение „определяемые языком**. В известном смысле фреймы определяются совсем не языком. Язык определяет зависимость между выбором языковых выражений и фреймами интерпретации; некоторые фреймы, действительно, „созданы языком**, однако о большинстве фреймов можно сказать, что они существуют независимо от языка. Ситуация с фреймами интерпретации подобна тому, что Фоконье сказал о ментальных пространствах: «Они не являются частью языка как такового... однако язык не может обойтись без них» (Fauconnier, 1985:1). 61
альтернативные „способы видения вещей"12 и, следовательно, не настаивает на том, что они, находясь в тесной зависимости друг от друга, образуют связный «мир-посредник» (Zwischenwelt) (в смысле Вайсгербера), который отражает способы выражения содержания, характерные для языка: в целом наиболее существенно то, что семантика фреймов допускает существование фреймов, каждый из которых имеет единственного представителя в сфере лексики— возможность, в принципе отвергаемая теорией лексического поля. (Мы довольно хорошо понимаем лексические единицы типа devein или scratch 'царапина', не ощущая никакой необходимости знать какие бы то ни было слова, которым они парадигматически противопоставлены). Все эти различия определяются тем, где концентрируется поиск структуры—в языковой системе или вне ее. П-СЕМАНТИКА И И-СЕМАНТИКА13 Исходный набор данных любой теории, предназначенной для объяснения семантической структуры естественного языка, должен включать: (1) множество засвидетельствованных и возможных языковых форм; (2) контексты или окружения, в которых эти языковые формы реально представлены или могут быть представлены, и (3) множество интуитивных суждений об этих формах, реализованных в соответствующих контекстах. 12 Эта особенность функционирования фреймов (framing) в наиболее явном виде предстает при исследовании метафор в Lakoff and Johnson, 1980. В ином смысле мы можем увидеть альтернативное металингвистическое по своей сути функционирование фреймов, опирающееся на неосознаваемые «народные теории» речи и осознаваемые теории мира, при использовании таких ограничительных выражений (hedges), как loosely speaking 'говоря в общем' и technically 'технически, в специальном смысле1, которые рассматривались в недавней работе Поля Кэя (Kay, 1983). Альтернативная интерпретация тех же феноменов с помощью фреймов при использовании обыденного языка без ограничителей и метафор нередко проявляется в общественном сознании, например в различиях между оптимистами и пессимистами при выборе выражений наполовину полный versus наполовину пустой, а также в предпочтении сторонниками ,,свободы выбора" (,,pro-choice") versus ,,императива жизни" (,,pro-life") терминов плод (fetus) versus ребенок (baby) для обозначения нерожденного ребенка. Поскольку лексический инструментарий языка обеспечивает возможность привлечения альтернативных схематизации данной ситуации, поскольку аппарат метаязыковых ограничителей позволяет с помощью своих категорий привлекать самые разные способы интерпретации и поскольку на каждом уровне существуют возможности использования метафор для того, чтобы ,,видеть нечто в ином обличье", трудно предполагать, что любой язык как таковой делает связными для его носителей представления о жизни. 13 Важное различие между П- и И-семантикой вводится в книге Лакоффа и Джонсона (Lakoff and Johnson, 1980: 156—184). Меня интересуют здесь предложения, которые, бесспорно, истинны в одних контекстах, но истинностная оценка которых в то же время далеко не очевидна в других контекстах; Лакофф и Джонсон делают особый упор на метафорические высказывания, для которых, хотя и может быть установлено соответствие между тем, что значит предложение, и тем, как воспринимается описываемая им ситуация, вопрос об ,,истинности" как таковой не возникает. 62
В И-семантике языковые формы обычно ограничены отдельными предложениями; контексты мыслятся как сущности, с помощью которых определяется прагматический индекс предложения (служащий для соотнесения референтных выражений с индивидуумами в некотором мире и объединяющий грамматические показатели времен в некотором мире с повествованием и т. д.), а интуиция в большей или меньшей степени сводится к суждениям о приемлемости, многозначности, синонимии и следовании (см. Gaz dar, 1979: 11). В П-семантике языковые формы являются словами и текстами; контексты включают доступные для подробного описания предпосылки, перспективы, ориентации, продолжающиеся виды деятельности и т. д., а интуитивные суждения составляют исходные данные для понимания. Далее П-семантика отличается от И-семантики тем, что в ней считается целью анализа и как ее достичь. Формулировку истинности в И-семантике можно пояснить, сказав, что предложение типа (3) (3) My dad wasted most of the morning on the bus. 'Мой папа большую часть утра провел (букв, потратил) на автобусе'. истинно только тогда, когда лицо, на которое указывает именная группа my dad 'мой папа', действительно провело большую часть утра на автобусе (который в свою очередь соотносится с именной группой the bus 'автобус') в тот день, который подразумевается в выражении the morning 'утро'. Если мой папа провел большую часть утра на автобусе, то предложение ,,Му dad wasted most of the morning on the bus" (произнесенное мною сегодня) истинно. Здесь понятие истинности определяется так называемой корреспондентной теорией истины и в общем случае допускает формулировку (4) ,,Р" истинно, если Р. Задача П-семантики, как я говорил ранее, заключается в раскрытии сущности связи между языковыми текстами и достижением полного понимания этих текстов в их окружении. Это скорее ,,эмпирическая", чем ,,формальная" задача, в том смысле, что она связана с попыткой обнаружения всех способов соотнесения конкретных выражений с ситуациями, которые они описывают. При анализе предложения о ,,папе, автобусе и трате времени" П-семантика должна учитывать тот факт, что использовано слово dad 'папа', а не father 'отец', и тот, что употребляется словосочетание my dad 'мой папа', а не просто dad, то есть те факты, которые соответствуют особым видам отношений между говорящим и его отцом и между говорящим и адресатом (говорящий и адресат не являются членами одной семьи). При рассмотрении этого предложения с точки зрения П-семантики должно быть отмечено, что слово morning обычно используется в нормальной беседе скорее для обращения к дополуденному промежутку „времени бодрствования" или „рабочего дня", чем для отсылки к предшествующим полудню двенадцати 63
часам „календарного дня", и следует считать (в отсутствие контекстных причин для отказа от этой интерпретации «по умолчанию»), что определение того, „большая" часть утра была потрачена или нет, должно основываться на таком понимании. Слово wasted 'потерял, потратил (время)' в большей степени, чем, скажем, spend 'проводить (время)', актуализирует представление о том, что время было использовано непродуктивно или не так продуктивно, как его можно было использовать где-нибудь еще; и это определяется интерпретацией времени во фрейме в качестве ограниченного ресурса (см. Lakoff and Johnson, 1980). Выбор предлога on, а, скажем, не in, помещает человека в автобус, находящийся ,,в процессе использования". Исследование таких предложений в рамках П-семантики должно иметь целью воссоздание из частей предложения более или менее полной «картины» окружения, в которой может иметь место соответствующее высказывание, и ситуации, о которой можно сказать, что она существует, если предложение произносится с честными намерениями. Подход П-семантики „композиционен" в том смысле, что его функционирование зависит от знания значений отдельных лексических единиц, фразеологических единств и грамматических конструкций, однако он ,,не-композиционен" в том отношении, что процесс создания семантического представления не определяется сверху донизу чисто символическими операциями. В П-семантике, придающей решающее значение использованию фреймов интерпретации, считается, что кодируемые в языке категории (не только слова и устойчивые выражения, но также различные виды грамматических признаков и синтаксических моделей) предполагают особую структуру понимания культурных установлений, представлений о мире, общего опыта, нормальных и привычных способов поведения в мире и его видения. Лексические единицы могут рассматриваться как сущности, служащие для различения, ситуационной привязки, классификации и именования функций или, возможно, просто для выполнения функции подтверждения категории 14 в рамках таких структур или на их основе. Как мы видели на примере рассматривавшегося выше календарного фрейма, во многих случаях можно считать, что в основе больших групп семантически связанных между собой слов лежит одна и та же скрытая понятийная структура. Однако такое лексическое структурирование не является существенной частью понятия фрейма. Вполне обычная ситуация, когда противопоставленные друг другу пары слов объединяются во фреймы, каждый из которых обслуживает одну- единственную семантическую оппозицию (up 'вверх' и down 'вниз', dead 'мертвый' и alive 'живой', front 'передняя сторона' и back 'задняя сторона' и т. д.). И конечно, вполне возможен случай, когда изолированное слово является единственным лексическим представителем фрейма в нашем смысле (как предполагалось ранее, скажем, 14 Под ,,функцией подтверждения категории" я имею в виду те „обязательные" аккомодационные изменения, которые представлены согласованием по роду, выбором числовых классификаторов (в языках, которые их имеют) и т. д. 64
для hop 'прыгать, подпрыгивать' или для skip 'скакать, прыгать'). Последние десять лет природа и функционирование фреймопо- добных структур знания обсуждались преимущественно в исследованиях по искусственному интеллекту и когнитивной психологии, а также в трудах таких авторов, как Г. Бейтсон и Э. Гофман15. В этой литературе всесторонне анализировалась роль фреймоподобных структур в различных когнитивных процессах (в восприятии, распознавании, запоминании, понимании текста и т. д.), однако в большинстве подобных исследований не указывалось на наличие непосредственной связи между понятийными фреймами и лингвистическим описанием как таковым. Кроме того, рассматривая фреймы как средства организации опыта и инструменты познания, мы должны также видеть во фреймах инструменты описания и объяснения лексического и грамматического значений. СЕМАНТИКА ФРЕЙМОВ Фреймы интерпретации могут быть введены в процесс понимания текста вследствие их активации интерпретатором или самим текстом. Фрейм активируется, когда интерпретатор, пытаясь выявить смысл фрагмента текста, оказывается в состоянии приписать ему интерпретацию, поместив содержание этого фрагмента в модель, которая известна независимо от текста. Фрейм активируется текстом, если некоторая языковая форма или модель обычно ассоциируется с рассматриваемым фреймом. Например, в предложении „Мы ни в коем случае не откроем наши подарки до утра" нет никакого упоминания о рождестве, тем не менее интерпретатор, обладающий определенным знанием культуры, должен немедленно (в предлагаемой здесь терминологии) активировать контекст рождества; стоит только заменить простое имя подарки на рождественские подарки, как тем самым мы введем слово, которое будет активировать тот же самый контекст. Некоторые фреймы, несомненно, являются врожденными, в том смысле, что они естественно и неизбежно возникают в процессе когнитивного развития каждого человека (примером здесь может быть знание характерных черт человеческого лица). Другие фреймы усваиваются из опыта или обучения (например, знание артефактов и социальных установлений), крайний случай представляют те фреймы, существование которых полностью зависит от связанных с ними языковых выражений (таких, как единицы измерения: дюйм, фут и т. д., единицы календаря, например неделя и названия месяцев). С точки зрения исследования процесса понимания вряд ли могут вызвать возражения утверждения о важности таких структур знания (фреймов). Однако действительно спорным является предположе- 15 См., например, Bobrow and Collins, 1975, и собранные там работы, особенно статьи Абельсона, Румельхарта и Винограда; Charniak, 1975; Schank and Abelson, 1977; Rumelhart and Ortony, 1977; Sacerdoti, 1977; Spiro, 1977; Thorndyke, 1977; Goffman, 1974; Metzing, 1980. 5-1182 65
ние о том, что такое знание подлежит лингвистическому описанию. В семантике фреймов считается необходимым давать представление о таком знании при описании вклада, вносимого в семантику языкового выражения отдельными лексемами и грамматическими конструкциями, а также при объяснении процесса создания интерпретации текста из семантических представлений его компонентов. Нельзя считать осмысленным требование к лингвистике о том, чтобы она ввела в сферу своего исследования все знания такого рода; однако лингвистика должна представлять себе, как возникает такое знание, как оно функционирует в формировании категорий значения, как оно действует в процессе понимания языка и т. д. Можно сказать, что в этом отношении подход семантики фреймов к значению существенно более энциклопедичен, чем подход традиционный. В частности, она не стремится установить априорное различие между собственно семантикой и (идеализированным) концептом понимания текста; она, скорее, исходит из того, что единицы и категории языка возникали прежде всего как средства, служащие целям общения и понимания. В семантике, непосредственно ориентированной на объяснение коммуникации и понимание текста, необходимо по-новому взглянуть на то, что может скрываться за внутриязыковой семантической репрезентацией предложения. В рамках П-семантики в принципе не может быть формального объекта, о котором можно было бы сказать, что именно он является семантической интерпретацией предложения. Скорее, внутриязыковой семантический анализ предложения должен рассматриваться просто как демонстрация лексического, грамматического и семантического наполнения предложения, и эта демонстрация служит созданию ,,рабочего чертежа" (метафора Фоконье), пользуясь которой интерпретатор воссоздает картину целого. Интерпретатор достигает этого, обогащая ,,рабочий чертеж" множеством знаний, в особенности знаниями о фреймах интерпретации, которые активируются или могут быть активированы при анализе требуемого предложения, а также знанием о большей структуре (о ,,тексте"), в которой это предложение представлено. Объяснение способов использования такого знания в процессе интерпретации ни в коем случае не относится к традиционным задачам лингвистической семантики; однако мне представляется, что истинная теория семантики естественного языка нуждается в исследовании того, как знание вводится в процесс интерпретации, какие его части обычно получают отражение в языковых формах и т. д. Важно осознавать, что П-семантика не проводит различия между конвенциональным значением предложения и тем, что может значить произнесение предложения в данном контексте. Конвенциональное (или ,,буквальное", или ,,собственно лингвистическое") значение предложения—это множество условий, накладываемых на понимание предложения и фигурирующих во всех контекстах его употребления; определяя ситуационно привязанное значение предложения, характеризующее его узус, мы объединяем конвенциональное значение предложения с его лингвистическим и экстралингвистическим 66
контекстом. Тем самым конвенциональное значение предложения включает те аспекты значения, которые обычно относятся к прагматике (особенно в тех случаях, когда отдельные слова или грамматические конструкции как бы предназначены для определенных прагматических целей), а также общие ,,инструкции" по поиску материала для интерпретации языкового выражения в данном контексте (как это имеет место в случае с некоторыми анафорическими процессами, ранее не существовавшими сложными существительными и т. д.). Я рассматриваю процесс интерпретации естественноязыкового текста как такую процедуру, которая позволяет получить максимально богатую интерпретацию текста, интерпретацию, извлекающую из текста все, что только возможно16. Успешно действующий в рамках такого процесса интерпретатор достигнет понимания текста, определив для каждой его конвенциональной языковой формы имплицитный ответ на вопрос: Почему в языке существует категория, которую представляет данная форма? и получив возможность вычислить (обычно мгновенно) ответ на другой вопрос: Почему говорящий выбрал данную форму в данном контексте? Быть способным к ответу на первый вопрос означает иметь доступ к абстрактному фрейму, мотивирующему прежде всего эту категорию: это значит—иметь доступ к ,,исходной структуре" (background) в смысле Сёрля (Searle, 1980). Способность к ответу на второй вопрос предполагает знание того, где мы находимся в процессе создания интерпретации целого текста: знание фреймов, активированных в мире текста, в данном месте, и оценок, приписанных их слотам, а также знание тех функций, которые способен выполнять только что введенный фрейм в рассматриваемом окружении. Создавая интерпретацию текста как целого, интерпретатор должен далее активировать те виды знания, которые позволяют определить ответы на эти вопросы, касающиеся обнаруженных в тексте отдельных лексических единиц и грамматических конструкций. Необходимо отметить, что второй вопрос относится к причинам выбора говорящим некоторой особой языковой формы, а не к тому, почему говорящий сказал то, что он сказал. Эти объяснения напоминают рассуждения, используемые для определения имплика- тур в духе Грайса (Grice, 1975), за исключением того, что в данном случае подход основывается на конвенциональных значениях языковых форм. 16 В семантике, ориентированной на процесс коммуникации, за исходный пункт может приниматься как точка зрения кодирующего, так и точка зрения декодирующего. По различным причинам представляется более легким подойти к процессу коммуникации с точки зрения декодирующего, то есть интерпретатора. Обсуждение этого см. в Fillmore, 1982. 5* 67
Что касается значений слов, то семантика фреймов ориентирована на понимание причин, приведших языковое сообщество к созданию категории, представляемой данным словом, и на объяснение лексического значения на основе выявления этих причин и их экспликации. Что касается интерпретации текста, то здесь подход семантики фреймов может рассматриваться как попытка понять процесс введения фреймов в текст для создания и расширения его контекста. СОПОСТАВЛЕНИЕ П- и И-ПОДХОДОВ Я предположил, что для семантики фреймов более важны суждения о понимании, чем суждения об истинности. Под этим я имел в виду, что, хотя в семантике фреймов мы действительно занимаемся изучением способности к познанию условий, необходимо выполняемых в любой ситуации или в любом „мире", в которых или относительно которых данный языковой текст может быть признан „обоснованным", эта способность не требует умения решать, когда отдельные предложения можно назвать „истинными". Феноменологические исходные данные для теории языка—это данные, касающиеся скорее „понимания", чем такие теоретически производные данные, которые квалифицируют предложение как „истинное", или такие третьестепенные данные, как суждения носителя языка об условиях истинности, характеризующих синонимию и логическое следование. Семантика фреймов требует объяснения способности носителя языка „воссоздавать" „мир" текста, опираясь на интерпретацию его элементов. Различие в подходах И- и П-семантики можно легко показать на примере краткого исследования одного из употреблений английского предлога on 'на'. В выражениях английского языка, используемых для сообщения о „пространственных" отношениях между пассажиром и транспортным средством, выбор предлогов on и in V иногда определяется легко понимаемыми семантическими правилами, соотносимыми с основными значениями этих предлогов, иногда— отдельными соглашениями, которые могут устанавливаться относительно связанных с ними имен, но иногда (например, когда мы говорим о передвижении на самолете, автобусе, дирижабле или поезде) оказывается существенным довольно сложный комплекс представлений. В частности, фрейм, вызываемый при использовании предлога on, определяет ситуацию, в которой рассматриваемое транспортное средство находится в процессе использования (в противоположность нерабочему состоянию) и в которой транспортное средство предназначается для путешествия куда- либо ,7. Следовательно, можно говорить о пассажирах, находящихся on the train 'на поезде', on the bus 'на автобусе', on the airplane 'на самолете', on the Graf Zeppelin 'на „Графе Цеппелине'" и т. д., несмотря на то, что, когда эти средства передвижения (или их части, На последнее условие мое внимание обратил П. Кэй. 68
в которых находятся пассажиры) воспринимаются как „вместилища", более приемлемым оказывается предлог in. Примером ситуации, в которой предлог on нежелателен, a in — совершенно нормален, может служить игра группы детей в брошенном бесколесном автобусе, стоящем на пустыре. Мы не можем сказать о них (до тех пор, пока мы сами не вступим в игру), что они находятся на (on) автобусе: они могут быть описаны только как находящиеся в (in) автобусе. (Предлог on вполне уместен, только если автобус „используется непосредственно".) Что касается условия, в соответствии с которым обсуждаемое транспортное средство должно быть предназначено для путешествия куда-либо, то мы можем рассмотреть следующую гипотетическую ситуацию: я беру верх над водителем автобуса, высаживаю пассажиров и, приставив к голове водителя револьвер, заставляю его повернуть в противоположном направлении, чтобы направиться к моему любимому месту покупок. Если интуиция, которую мы пытаемся эксплицировать, правильна, то в такой ситуации нельзя сказать, что я еду в магазин на (on) автобусе. Описанная ситуация слишком отличается от той, которая должна соответствовать фрейму предлога on. Опрошенные мною носители американского варианта английского языка как будто были единодушны в суждениях, касающихся понимания этих примеров. Однако оказалось невозможным рассчитывать на уверенные суждения об условиях, определяющих „истинность" таких предложений. Рассмотрим ситуацию, в которой некто полностью соглашается с только что предложенными суждениями, касающимися сферы П-семантики, однако он настойчиво требует от нас суждений о том, можно ли сказать о данных предложениях, относящихся к этим суждениям, что они „истинны". «Конечно,— может сказать это лицо,— нельзя говорить о детях, играющих в брошенном автобусе, что они играют на автобусе, но я пытаюсь сейчас добиться от вас, можно ли считать, что такое утверждение сообщает хоть что-то истинное». Я убежден, что носители языка посчитали бы, что на такой вопрос трудно, а то и вовсе невозможно ответить, как это и было со значительным числом моих собственных информантов. Я говорю не просто о неестественности таких вопросов в нормальной беседе. Даже если кто-нибудь захочет принять участие в игре, целью ее будет установление истинностных оценок предлагаемых предложений, его интуиции окажется недостаточно для однозначного решения вопроса о том, что сказать в таком случае. Это та ситуация, при которой вопросы об истинности кажутся неприемлемыми18. Когда ситуация, в которой использовано высказывание, соответствует его естественной интерпретации, суж- 18 Конечно, я говорю об употреблении английского слова true 'истинный' и о суждениях, связанных с его использованием. Можно научиться использовать это слово по-новому (таким же образом, как мы обучаемся специальным значениям слов large и first class — см. выше), например говорить, что во всех случаях, когда условия применимости фрейма не выполняются, утвердительное предложение ,,не истинно", а отрицательное „истинно". 69
дение об истинности представляется совершенно очевидным. Однако при несоответствии ситуации интерпретации высказывания существенно различать случаи, когда высказывание просто ложно („Нет, дети вон там на пляже, они еще не на автобусе") и когда непонятно, что сказать. Очевидно, что здесь мы сталкиваемся с ситуацией, в которой конвенциональное значение предложения содержит нечто большее, чем просто набор условий истинности. Я думаю, что пример с предлогом on показывает, что иногда представленные в языковых выражениях семантические категории далеко не очевидны (аналитику), что приводит к необходимости детального анализа их вклада в понимание и требует тщательного отбора данных с помощью тонкого исследования и аргументации. Вполне возможно, что для случаев употребления предлога on с фразами, сообщающими о таких транспортных средствах, как автобусы и поезда, правильного описания пока еще не существует. Среди моих собственных излюбленных примеров терминов, требующих тонкого анализа (Fillmore, 1982), есть контексты, противопоставляющие фрейм land — sea 'суша—море' фрейму ground — air 'земля — воздух'. Благодаря этим оппозициям мы осознаем, что определение местонахождения чего-либо ,,на сухой поверхности земли" требует выбора одного из этих фреймов в зависимости от того, чему противопоставлено данное местоположение— нахождению в воде или в воздухе. Если мы услышим о виде птиц, проводящих жизнь на земле (on the ground), то мы должны заключить, что им может быть присуща способность плавать, но не летать; услышав же о птицах, живущих на суше (on land), мы должны соответственно сделать вывод, что они могут обладать способностью летать, но не плавать. Если мы узнаем от кого-либо, что некто сумел провести сегодня два часа на суше (on land), мы вправе предположить, что на два часа было прервано морское путешествие, а не полет на самолете. Примеры такого рода всегда заставляют вспомнить категорию релевантности Грайса (Grice, 1975), поскольку легко понять, что сделанные выводы о птицах и путешественнике основываются не на том, что сказано прямо, а на том факте, что нам сказано то, что сказано. Только что рассмотренные феномены интерпретации обычно объясняются не композиционными принципами лингвистической семантики, а применением ,,Максимы Релевантности". В этом случае релевантность ,,А" (скажем, on land) позволяет нам заключить, что ,,не В" (не at sea); релевантность и информативность указания на то, что некоторое количество времени было проведено на суше (on land), дает нам возможность сделать вывод, что остальная часть времени должна была быть проведена в море (at sea). Однако нет сомнений в том, что именно фрейм, отождествляемый по языковой конвенции с буквальным значением этих выражений, обеспечивает материал для осуществления таких выводов. Принцип релевантности Грайса и его роль в выводе умозаключений часто больше, чем просто соображения прагматического характера, основывающиеся на 70
языковом описании ситуаций; он часто сопровождает языковую схематизацию и использует ее. В другой своей работе (Fillmore, 1982) я предположил, что во многих употреблениях слова shore 'берег' и coast 'берег, побережье' различаются в отношении границы между сушей и водой, рассматриваемой со стороны водных масс или со стороны суши. Услышав, что наши знакомые reached the other shore before dark 'достигли другого берега до темноты', мы можем предположить, что они плыли по воде; а услышав, что другая группа наших знакомых reached the coast by Tuesday 'достигла побережья во вторник', мы можем предположить, что они путешествовали по суше. Наиболее четко это различие прослеживается в словосочетаниях, обозначающих, скажем, расстояние from shore to shore 'от берега к берегу' в противоположность расстоянию from coast to coast от побережья к побережью. Путешествие от западного побережья Африки к восточному побережью Южной Америки нельзя описать как путешествие от побережья к побережью (from coast to coast); эти особые фразеологические единицы создаются в соответствии с фреймами слов, определяющих способ структурирования характеристик земной поверхности. Принцип релевантности Грайса, будучи значимым и здесь, не может функционировать независимо от языкового знания. Вклад значений слов в понимание текста иногда имеет очень глубокие истоки. Предположим, что в тексте на английском языке мы натолкнулись на выражения out west 'дальний запад' и back east '(досл.) ,,тыловой" восток' или на одно из них в стилистически немаркированных локативных выражениях. Если мы поймем вклад этих выражений в интерпретацию текста, нам станет ясно, что они мотивированы историческими событиями: переселенцы прибывали на восточную часть американского континента и мигрировали с течением времени на запад; зная этот факт о мире и зная, что в нашем языке именно этим выражениям (out west и back east) приданы значения, связанные с историей, мы естественно и непроизвольно обнаружим, что мир текста пространственно привязан к Северной Америке и темпорально ориентирован на события после начала колонизации европейцами Американского континента. В тексте может быть эксплицитно не выражено, что события происходят в Северной Америке, однако мы в любом случае имеем возможность узнать это. Даже если географическая/историческая категоризация, лежащая в основе использования обсуждаемых выражений, никак не существенна для изложения, интерпретатор тем не менее в какой-то степени осознает исходные условия, мотивирующие рассматриваемые выражения, и это осознание обусловливает общую интерпретацию19. Использование этих выражений для описания восточного и западного районов Чили не может быть признано правильным. 19 Следует подчеркнуть, что если бы кто-нибудь предложил мне в качестве контрпримера к только что выдвинутым положениям другую столь же хорошо структурированную территорию с похожей историей миграции с востока на запад, потребовалось бы не только представить ее как конкурента мотивации наших двух 71
Существуют языковые формы и категории, выбор которых отражает точку зрения или перспективу, из которой исходит говорящий. И опять при том, что суждения, касающиеся понимания таких образований, совершенно обычны, вопросы об истинности предложений с этими конструктами вызывают некоторое недоумение. В английском языке глаголы come 'приходить' и go 'идти' наряду с глаголами bring 'приносить' и take 'брать' представляют широкие возможности для перспективизации; см. Fillmore, 1971; Clark, 1974. Предположим, что мы хотим выразить суждение о таком высказывании, как (5) Не moved to California as a teenager and never came back east until he had reached retirement age. 'Он прибыл в Калифорнию подростком и никогда не возвращался на восток до достижения преклонного возраста', принадлежащем, скажем, жителю Гавайских островов, которому нет причины придерживаться точки зрения, выражаемой словосочетанием ,,back east", или о таком высказывании, как (6) The prices will come down again soon. 'Цены скоро опять упадут', принадлежащем в данном случае лавочнику (точка зрения которого заставила бы его сказать скорее go down 'снизятся', чем come down 'упадут'), а не покупателю. Перспективизация, связанная с формами этих предложений, столь непроизвольна, что трудно представить себе высказывание, в котором отрицаются соответствующие способы видения ситуации. И опять суждения о понимании, непосредственно вытекающие из буквального конвенционального значения рассматриваемых предложений, интуитивно очевидны, притом что суждения об истинности в этих случаях никак не охватываются доступными разграничениями. Живя в постоянно меняющемся обществе, мы часто обнаруживаем, что имена хорошо знакомых нам вещей изменились и что мы теперь вынуждены ,,видеть" эти хорошо знакомые вещи в новом свете. Например, если вы сообщите мне, что вам легче определять время по аналоговым часам (analog watch—выражение, не имевшее никакого смысла всего несколько лет назад), то я буду знать, что вы говорите об обычном ручном хронометре, всем нам знакомом с детства, который совсем недавно был известен как часы. Мой вывод основывается на фразе, которую вы использовали для идентификации объекта; он состоит в том, что вы находите обычные часы более предпочтительными по сравнению с цифровыми (digital) часами, то выражений, но и показать, что именно в данном сообществе фразы out west и back east традиционно характеризуются этими значениями. Другими словами, необходимо проводить различие между ситуацией исходной мотивации схемы, использованием выражения и объяснением его использования; мы знаем, почему out west и back east значат то, что они значат; однако следует иметь в виду, что эти значения у них могут вообще отсутствовать. 72
есть с тем видом часов, которому они противопоставлены (на это указывает слово аналоговые). Единственная причина выбора вами слова аналоговый состояла в том, что оно противопоставлено слову цифровой, и вы ожидали, что использование этого слова приведет к активации в моем сознании другого члена оппозиции. Это несомненный пример рассуждения, опирающегося скорее на фрейм, чем на знание класса объектов, на который указывает описание. Используемое вами слово помогает мне понять сказанное не только благодаря тому, что позволяет узнать типы объектов, которые вы обозначили, но и благодаря тому, что дает возможность определить то, чему это слово противопоставлено. Существует немало ,,обычных" вещей, получивших особые имена только потому, что в описании, предусматриваемом особым именем, они становились элементами контрастивного множества, другой элемент которого и мотивировал контраст. Группа примеров, подобных словосочетанию аналоговые часы, включает такие выражения, как акустическая гитара — обычная гитара, описанная в противопоставление электрической гитаре; первая мировая война, не называвшаяся первой до тех пор, пока вторая мировая война не инициировала счетный фрейм; мать по рождению (birth mother), отличающаяся от генетической матери только потому, что современная технология сделала возможным перенесение яйцеклетки из тела одной женщины в тело другой. Имея в виду приведенные примеры, мы можем представить, как кто-нибудь в 1984 г. говорит: (7) During World War I, Ronald Reagan's birth mother dropped his analog watch into the sound hole of the acoustic guitar. 'Во время первой мировой войны мать (по рождению) Рональда Рейгана уронила его аналоговые часы в отверстие деки акустической гитары'. Этому высказыванию может соответствовать совершенно обыденное событие, однако большая часть представленных в его описании слов не могла быть использована в момент совершения самого события. В то время не могло быть никаких причин для активации фреймов, на которые указывают выражения мать по рождению, аналоговые часы, акустическая гитара и первая мировая война. Заметим также, что вопрос об истинности нашего предложения не возникает совсем. Мы могли интерпретировать произнесение говорящим нашего предложения как утверждение о том, что миссис Рейган, мать Рональда, уронила его (обычные) часы в ее (обычную) гитару в некоторый момент во время первой мировой войны. Обладая этой интерпретацией, мы могли бы сказать нечто осмысленное относительно того, было ли истинным то, что сказал говорящий. Однако было бы бессмысленно спрашивать, является ли истинным само предложение. Опять соображения Грайса выступают в роли дымовой завесы: если мы чувствуем, что в случае с часами, гитарой и матерью нам дали «слишком много информации» (другими словами, говорящий нарушил максиму количества), то мы должны 73
осознавать, что этот вывод основывается не на знании того, что эти слова обозначают, а на знании того, что представляет собой контрастивное множество, какие слова в него входят и какой фрейм ему соответствует, и мы обнаружим, что нельзя интерпретировать предложение без учета такой информации. СЕМАНТИКА ФРЕЙМОВ И ИСТИННОСТЬ Любая версия И-семантики, включающая в сферу своего исследования естественный язык, должна предоставить свой вариант интерпретации широкого феномена «понимания», и собственно ситуационная семантика, связанная с прагматикой, системами представлений, общей семиотикой и другими подобными концепциями в рамках единой теории, пришла к этому. Соответственно теория П-семантики нуждается в формировании взгляда на использование естественного языка в рассуждении и логике. В особенности нам необходимо иметь возможность сказать что-либо о суждениях говорящих, использующих обычное английское слово true 'истинный', и о том, что говорящие делают, когда порождают отрицательное предложение. Слова true и false 'ложный' в нормальной беседе соответствуют одному фрейму, однако их использование в логическом дискурсе должно пониматься в терминах более технического фрейма, приблизительно так же, как словосочетание первый класс в „техническом" значении языка индустрии путешествий. Я покажу, что техническое значение слова true, характерное для сферы логической семантики, паразитично по отношению к естественному употреблению этого слова. В коммуникации на естественном языке имеются многочисленные случаи, когда участники не знают, можно ли сказать, что ,,Р" истинно, и причина лежит в том, что они не уверены в соответствии контекста предложения его фреймам. (Вспомните неопределенность суждения об истинности приводившегося ранее высказывания с предлогом на: ,,на автобусе".) Тем не менее существует второй—технический—смысл слова true, которому носители естественного языка могут научиться; он предполагает ориентацию на принципиально иные нормы. В корреспондентной теории истины предложение является „истинным" тогда, когда все условия использования его фреймов удовлетворены и описываемая ситуация имеет место. Отрицательные предложения истинны во всех случаях, когда соответствующие им утвердительные предложения истинны. Отрицательные предложения могут оцениваться двояко (другими словами, отрицательные предложения допускают двусмысленные интерпретации) в зависимости от того, считаются ли выполненными условия использования фреймов. Выражая в терминах П-семантики истинностные суждения, мы должны интерпретировать значение высказывания вида (8) ,,Р" истинно (И-семантически) как 74
(9) Лицо, произносящее ,,Р", должно совершать (П-семантически) истинное утверждение и говорить, ориентируясь на сотрудничество и честно. Оцениваемое таким образом предложение всегда допускает истинностную оценку без очевидных случаев неопределенности (таких, которые наблюдались выше в примерах с предлогом on). Если условия, в которых Р может быть признано истинным, налицо, то большее предложение (в которое входит Р) истинно, в противном случае оно ложно. Реконструировав значение true в этом смысле, можно приучить носителей английского языка оперировать двузначной логикой20. Отрицание в формальной семантике непременно определяется в терминах истинности, и это выглядит довольно просто: если одна пропозиция истинна, то ее отрицательный двойник ложен, и наоборот. В семантике фреймов для естественноязыковой «истинности», ограниченной высказываниями, контексты которых удовлетворяют их фреймам, предусматривается такое же отношение. Однако семантика фреймов, признавая существование контекстов, в которых суждение об истинности утвердительного предложения невозможно, должна предусматривать такую возможность и для отрицательных предложений. 20 Решение считать английское слово true полностью соответствующим логической оценке «Истина» в двузначной логике аналогично соглашению при бросании монеты, в соответствии с которым выпадение «орла» влечет ваш выигрыш, в других же случаях выигрываю я, причем «другие случаи» распространяются не только на ситуации, в которых монета падает на ребро или подхватывается высоко в воздухе летящей птицей, но и на тот случай, когда я вообще не бросаю монету! (Эта метафора, исключая последний эпизод, заимствована из [Black, 1952].) Здесь я сравниваю «до-теоретическую» фреймовую интерпретацию категории с теми ре- интерпретациями, которые обслуживают определенные виды формально ограниченных дискурсов. До-теоретическое понимание слова angle 'угол' ассоциируется с образом изогнутой палки (Arnheim, 1969: 183) и поддается анализу в терминах «прототипа»: одни углы в большей степени соответствуют исходному понятию, чем другие. Теоретический фрейм, наложенный на то же самое слово, настраивает понимание на градусы вращения луча вокруг точки и допускает такие понятия, как угол в 180 и 360 градусов. До-теоретическое понимание слова color 'цвет', без сомнения, включает в эту категорию черный и белый цвета; однако такие, ,,не имеющие цвета" результаты перцепции исключаются из научных рассуждений об этом концепте. Теперь, когда появились теоретически мотивированные вторичные операциональные определения понятий, они совсем не обязательно замещают старое определение, а существуют бок о бок с ними. Можно заметить, что слова real 'действительный, настоящий' или really 'действительно, на самом деле' могут свободно взаимодействовать и с теоретическим, и с наивным фреймами. Так, мы легко можем понять, что имел в виду говорящий, опиравшийся на до-теоретический контекст, при произнесении высказывания ,,Of course, а 180 degree angle isn't a real angle" 'Угол в 180 градусов, конечно, нельзя считать настоящим", точно так же мы имеем возможность определить, что подразумевал этот человек, когда, исходя из „технического" фрейма, говорил нам, что черный и белый не относятся к настоящим цветам. И-семантическое понятие истинности, несомненно, ценно при разработке фрагментов формальных языков определенных видов. В этой статье меня занимает вопрос о том, может ли считаться И-семантическое описание естественного языка единственным способом разработки адекватной теории лингвистической семантики и определена ли граница между тем, что принадлежит теории семантики, и тем, что находится за ее пределами. 75
В семантике фреймов необходимо установить некоторые частично пересекающиеся разграничения, касающиеся произнесения говорящим отрицательных высказываний. Поскольку мы признаем, что отрицательные предложения часто произносятся в контекстах, способствующих установлению истинности соответствующего утвердительного предложения (см. обсуждение этого в Gazdar, 1979: 67), мы должны также признать, что существуют многочисленные ситуации, когда связь с контекстом вообще отсутствует. Нам следует установить разграничение между контекстно-связанным отрицанием, соответствующим упомянутому условию, и контекстно- свободным отрицанием, которое может интерпретироваться без такой опоры в контексте. Несомненно, что любое отрицательное предложение должно интерпретироваться относительно некоторой структуры, в которой его пропозиция противопоставляется соответствующей ей противоположной пропозиции; обсуждаемое разграничение относится к тому, введена ли эта релевантная структура в контекст, непосредственно предшествующий высказыванию. Во-вторых, мы должны различать два важных способа взаимодействия отрицания и фреймовой интерпретации. В особенности следует четко представлять себе различие между „внутрифреймо- вым" (within-frame) отрицанием и ,,межфреймовым" (cross-frame) отрицанием или тем, что можно по-другому назвать как отрицание, принимающее фрейм и отвергающее его. В случае внутрифреймового отрицания фреймовая интерпретация ситуации признается приемлемой и один из элементов фрейма характеризуется в противопоставлении другим. При межфреймовом отрицании требуется удовлетворение различных условий коммуникации. В общем случае межфреймовое отрицание имеет место тогда, когда (1) в процессе беседы первый говорящий только что ввел фрейм для описания ситуации, в рамках которого второй говорящий не хочет вести разговор; (2) предложение произносится в такой форме или с такой просодической моделью, которая специфична для отрицания фрейма, и (3) предложение (обычно) сопровождается „объяснением" причин неприятия фрейма или экспликацией желательной фреймовой интерпретации рассматриваемой ситуации. Внутрифреймовое отрицание может быть и контекстно-свободным, и контекстно-связанным; под контекстом имеется в виду предшествующая часть дискурса; межфреймовое отрицание непременно контекстно-связанно. Контекстно-свободное внутрифреймовое отрицание можно проиллюстрировать предложением типа (10). (10) Her father doesn't have any teeth. 'У ее отца нет зубов'. Это отрицание ,,контекстно-свободно", потому что данный дискурс не нуждается в формировании каких бы то ни было ожиданий о лице человека. Отрицание в таком предложении не требует установления связи с чем-либо в предшествующем дискурсе. Фрейм представлений о человеческом лице всегда находится в нашем распоряжении, и необходимость привлечения данных контекста 76
отпадает; таким образом обсуждаемое предложение может рассматриваться как указание интерпретатору на использование фрейма человеческого лица и на модификацию этого фрейма так, чтобы в возникшем представлении отсутствовали зубы. В противоположность примеру (10) предложение типа (11) (11) Her husband doesn't have any walnut shells. 'У ее мужа нет скорлупок грецкого ореха'. требует привлечения контекста, в котором обсуждается возможность того, что у ее мужа могут иметься скорлупки грецкого ореха. Другими словами, фрейм, необходимый для интерпретации первого предложения, возникает (активируется) со словом зуб, в то время как фрейм, определяющий ситуационную привязку второго предложения, должен создаваться предшествующим контекстом. Это значит, что произнесение hors contexte* фразы У него нет зубов допускает достижение правильного ,,видения" данного фрагмента текста на его собственной основе, а произнесение фразы У него нет скорлупок грецкого ореха требует привлечения предшествующего контекста, в котором представлена интерпретативная структура определенного вида, предполагающая наличие или отсутствие скорлупок грецких орехов . Доказательство важности использования фреймов в отрицании можно увидеть в том факте, что часто ожидается совпадение числа имени (единственного или множественного) при отрицательном предикате с числом, которое предусмотрено для этого имени в немоди- фицированном фрейме. То есть мы предпочтем предложение (12) с единственным числом существительного нос фразе, представленной в (13): (12) Your drawing of the teacher has no nose. 'На вашем рисунке у учителя нет носа'. (13) Your drawing of the teacher has no noses. 'На вашем рисунке у учителя нет носов'. Вместе с тем предложение (15), где есть существительное пальцы во множественном числе, оказывается для нас более приемлемым, чем пример (14) с единственным числом того же существительного. (14) The statue's left foot has no toe. 'На левой ноге статуи нет пальца'. (15) The statue's left foot has, no toes. 'На левой ноге статуи нет пальцев'. * Вне контекста (франц.).— Прим. перев. 21 Джордж Лакофф в беседе со мной высказался в пользу более сложного набора противопоставлений по сравнению с тем, который вводится здесь. Он предлагает делать различие между внутрифреймовым отрицанием и отрицанием применимости фрейма (frame-accepting negation); первое характерно для понятий, которым отрицание внутренне присуще (ср. быть больным, промахнуться по мишени и т. д.), и отражает тот факт, что некоторые категории отрицательны, так сказать, по «внутреннему определению». Здесь этим противопоставлением я не пользовался. 77
Если отрицательные предложения имеют только стандартную ожидаемую интерпретацию, связанную с условиями истинности, то придется считать, что их значения основываются на одном и том же—на том, что количество носов и пальцев равно нулю, и это должно оцениваться как истина или ложь, в зависимости от того, было ли правильным утверждение о числе релевантных частей тела. Семантика, в основе которой лежат суждения о понимании, требует большего22 . Однако в дополнение к внутрифреймовому отрицанию только что рассмотренного типа существует важная категория отрицания, которая наилучшим образом интерпретируется в терминах отказа говорящего от фрейма, непосредственно перед этим введенного в беседу. Эта категория отрицания всегда привязана к контексту. Контекст должен дать говорящему возможность для произнесения отрицательного предложения, обеспечив появление в беседе фрейма, в рамках которого данный говорящий не желает продолжать процесс коммуникации; в такой ситуации высказывание должно считаться отказом от использования фрейма. Этот тип отрицания может рассматриваться как объявление нарушения коммуникативного сотрудничества. В случае внутрифреймового отрицания сам фрейм принимается без возражений, а отрицается содержащийся в нем контрастивный элемент. При отклонении фрейма сообщение говорящего воспринимается как отрицание применимости самого фрейма к описанию актуальной ситуации. Есть фреймы, элементы которых резко противопоставлены друг другу; полярными точками одного из них являются лексемы stingy 'скупой' и generous 'щедрый', связанные с оценкой отношения человека к использованию денег и другой собственности; существует еще один фрейм, полюса которого представлены словами thrifty 'бережливый' и profligate 'расточительный', характеризующими присущее человеку свойство характера—заботясь о будущем, расходовать свое имущество с осторожностью. Поскольку оба этих фрейма имеют дело с оппозицией между накоплением денег и их расходованием, мы можем в каждом случае выделить высокую и низкую степень проявления соответствующего свойства, т. е. в случае stingy: generous—положительная моральная оценка относится к высокой степени, а в примерах с thrifty: profligate—к низкой. В рамках каждого из этих фреймов акт отрицания одного полюса (степени проявления свойства) может восприниматься как утвержде- 22 Заметьте, что семантика, основывающаяся на понимании, должна привести к некоторому уровню представления о содержании даже в тех случаях, когда значения слова неизвестны. Предложения, содержащие неизвестные слова типа There's по wibble in your drawing of the troly 'У нарисованного тобой тролля нет вибла', позволяет нам по крайней мере узнать, что у тролля предполагается наличие лишь одного вибла. П. Кэй напомнил мне, что в контекстах, требующих привлечения скалярных интерпретаций (в смысле Фоконье (Fauconnier, 1975)), имя в единственном числе совершенно нормально функционирует в отрицательном предложении. (Предложение За время всего нашего отпуска мы не поймали ни одной рыбы, конечно, не понимается как отрицание, в основе которого лежит ожидание поймать только одну рыбу.) 78
ние другого; однако имеется и второй смысл отрицания, который должен восприниматься как отрицание применимости фрейма как такового. Рассмотрим примеры с (16) по (19): ВНУТРИФРЕЙМОВОЕ („ПРИЗНАЮЩЕЕ ФРЕЙМ") ОТРИЦАНИЕ (16) [You're wrong about John]. He isn't stingy; he's really very generous. '[Ваше мнение о Джоне ошибочно]. Он не скупой; на самом деле он очень щедрый'. (17) [Your impression of John is wrong]. He isn't thrifty: he's actually quite careless with his money. '[Ваше впечатление о Джоне неверно]. Он не бережлив; в действительности он абсолютно легкомысленно тратит свои деньги'. МЕЖФРЕЙМОВОЕ („ОТВЕРГАЮЩЕЕ ФРЕЙМ") ОТРИЦАНИЕ (18) John isn't being thrifty, he's just downright stingy. 'Джон отнюдь не бережлив; он откровенно скуп—это правда'. (19) John isn't stingy; it's just that he's thrifty. 'Джон не скупой; он бережлив—это правда'. В примере (16) говорящий соглашается с уместностью такой схематизации характера человека, одним полюсом которой является stingy, а другим—generous, и отрицает, что Джона следует оценивать на том конце шкалы, которому соответствует stingy. Во фразе (17) происходит обращение к другому фрейму, и соответствующее предложение указывает на различные полюса этого фрейма. Однако в примерах (18) и (19) отвергается сама структура, в рамках которой используются слова thrifty или stingy. В каждом из двух последних случаев говорящий высказывается в том смысле, что схема оценки, в которую включено использованное слово, неприложима к обсуждаемому индивидууму, или по крайней мере неприложима в отношении тех характеристик индивидуума, которые обсуждаются в данный момент. Следует подчеркнуть, что интерпретация высказывания, отрицающего фрейм, требует активации особого интерактивного или риторического фрейма. В только что рассмотренных случаях интерпретация предложений может происходить при использовании акту- ализованного оценочного фрейма, связывающего воедино два лексически-активированных фрейма. Содержание наших примеров с отрицанием фрейма допускает следующую экспликацию: Вы отнес- ли его к разряду хороших [плохих]; я отношу его к разряду плохих [хороших]. Явление, названное здесь отрицанием фрейма, обсуждалось в несколько иных терминах Д. Уилсон в Wilson, 1975, в главе о не-теоретико-истинностной семантике. В своем анализе она отмечает, что основу отрицания в случаях такого рода составляет намерение говорящего воспрепятствовать тем вполне естественным выво- 79
дам, которые могут быть сделаны из соответствующего утвердительного предложения. Приводя среди своих примеров фразу (20): (20) He didn't lose his little finger: they removed his whole arm. 'Он лишился не мизинца: он потерял всю руку', Уилсон говорит следующее: «Ложность р является превосходным основанием для утверждения не-р, однако столь же хорошим основанием для отрицательного утверждения могло бы послужить нежелание говорящего утверждать р не потому, что оно ложно, а по совершенно иным причинам. И такой достаточно очевидной причиной для нежелания утверждать р может быть то, что оно вводит в заблуждение, например предполагает то, с чем нельзя согласиться... Таким образом, в ситуации, когда вполне возможно, что произнесение р повлечет q, и когда говорящий не хочет, чтобы предполагалось q, он может сказать не-р не потому, что возможна ложность р, а потому, что оно может ввести в заблуждение». (Wilson, 1975:151). Она дополняет свой тезис следующим: «Что касается трактовки отрицания, то я теперь считаю, что такая интерпретация все же должна оказаться правильной и не затрагивать существующих условий истинности». (Wilson, 1975:151). Признавая существование в естественном языке семантики, основанной не на условиях истинности, Уилсон тем не менее считает необходимым принимать решения об истинности предложений, семантика которых определяется вовсе не истинностью. Другими словами, требуется объявить, что предложение ,,Не didn't lose his finger" в данной ситуации „истинно". Отрицание фрейма определенным образом взаимодействует с введенным выше металингвистическим понятием истинности. Отрицательное предложение, истолкованное как непринятие фрейма, можно перефразировать приблизительно так, как это сделано в (21). (21) Сказав ,,Р", вы не сообщили ничего, что было бы одновременно истинным и ориентированным на сотрудничество. Отрицание фрейма как таковое может использоваться в тех случаях, когда отрицаемое предложение само по себе выражает нечто истинное; ср. первое предложение примера (22). (22) I don't think I'm right; I know I'm right. 'Я не думаю, что я прав; я знаю, что я прав'. Здесь отрицается правомерность использования фрейма в контексте данного дискурса, поскольку это ведет к ошибочному представлению о слабой степени уверенности эпистемического утверждения; конечно, говорящий действительно «думает», что он прав. Такой эффект предложения объясняется тем, что мнение и знание помещаются на прагматическую шкалу, и в соответствии с моделью 80
скалярного отрицания производится высказывание, которое сообщает нечто вроде „Не просто А, но даже В". Уилсон рассмотрела также ,,не-истинностное" (non-truth- functional) отрицание фреймов, связанных с лексемами, сопоставив слова spare 'избавлять' и deprive 'лишать'. Здесь она относит к собственно „семантике" тот тип суждений, с помощью которых интерпретируются предложения типа (23). (23) You didn't spare me a day at the seaside: you deprived me of one. 'Нельзя сказать, что Вы избавили меня от дня на побережье: вы лишили меня его'. Предикат spare [someone something], отрицательный или положительный, помещает предотвращенное событие во фрейм, в котором оно рассматривается как нечто нежелательное, в то время как во фрейме предиката deprive [someone of something] оно определяется как желательное. Я думаю, что вид отрицания, иллюстрируемый именно такими примерами, в общем случае аналогичен так называемому „внешнему" отрицанию и что он везде имеет метаязыковой характер. В последующем обсуждении проблемы пресуппозиций я намереваюсь показать, что „не-истинностное" понятие отрицания, которое по предположению Уилсон в любом случае необходимо для полного описания семантики языка, может быть разумным образом использовано при рассмотрении критических замечаний в спорах о роли и сущности семантических пресуппозиций. ПРЕСУППОЗИЦИЯ В трактовке пресуппозиций П- и И-семантика ведут к различным выводам, и это объясняется присущими им особенностями в подходе к понятиям истинности и отрицания. Я хочу выдвинуть тезис, согласно которому интуитивные представления о пресуппозициях и так называемый „тест на отрицание" хорошо согласуются при „нормальном" или внутрифреймовом отрицании; что же касается кажущихся контрпримеров, то они представляют собой случаи „не-истинностного" отрицания в духе Уилсон, которые я приравниваю к межфреймовому отрицанию. Представляется, что по крайней мере некоторым феноменам из огромного множества интуитивных представлений и наблюдений, называвшихся пресуппозициями, может быть дано адекватное описание в терминах фреймов. В любом случае естественно постулировать наличие связи между основанием (тем, что не требует доказательства), предпосылкой (тем, что составляет пресуппозицию) и фигурой (тем, что представляется, высвечивается, излагается). Я хочу заново исследовать интуитивные представления, связанные с пресуппозициями, в контексте семантики, ориентированной на понимание, а не на истинность. Неформальное понятие пресуппозиции имеет своим источником осознание того факта, что существуют предложения, выглядящие 6-1182 81
как одно утверждение, анализ которых тем не менее обнаруживает наличие двух одновременных сообщений; используя удобную терминологию Освальда Дюкро, можно провести различие между тем, что в предложении излагается (poses), и тем, что предполагается (presupposes). Предложения, предположительно содержащие пресуппозиции, представлены ниже, в примерах (24)—(31), там же приводятся результаты двунаправленного семантического анализа, в процессе которого отделялось то, что излагается в предложении (i), от того, что в нем предполагается (ii)23: (24) JOHN REGRETTED SIGNING THE LETTER. 'Джон сожалел, что подписал письмо'. (i) 'Джон чувствовал себя плохо из-за того, что подписал письмо', (ii) 'Джон подписал письмо'. (25) JOHN DOESN'T REALIZE WHO YOU ARE. 'Джон не представляет себе, кто вы'. (i) 'У Джона отсутствует полная информация о вас', (ii) 'Джону должно быть важно знать вас'. (26) DID BILLY HIT SUSIE AGAIN (at t)? 'Билли опять ударил Сюзи (в момент t)?' (i) 'Билли ударил Сюзи (в момент t)?' (ii) 'Билли (в момент времени, предшествующий t) уже по крайней мере единожды бил Сюзи'. (27) FRED STOPPED RUNNING (at t). 'Фред прекратил бег (в момент t)'. (i) 'Фред не бежал (после t) \ (ii) 'Фред бежал (до t)'. (28) I POURED MYSELF ANOTHER CUP OF COFFEE (at t). 'Я налил себе еще одну чашку кофе (в момент t)'. (i) 'Я налил себе чашку кофе (в момент t)'. (ii) 'У меня уже был кофе (до t)'. 23 В примерах встречаются выражения в скобках со значком „t", отсылающие к временным отношениям, которые связаны с грамматическими временами предложений; эти выражения служат для введения в процесс понимания пресуппозиции тех частей смысла, которые обычно определяются из меняющегося контекста, характеризующего развитие текста в целом. Во многих работах по пресуппозициям глагол pretend 'притворяться, делать вид' рассматривается как просто контрфактивный; между тем то, что составляет пресуппозицию, при его использовании связано с представлениями лица, ведущего себя соответствующим образом. Человек, делающий вид, что он адмирал, может просто еще не знать о документах, подтверждающих его производство в чин. (См. также Kempson, 1975: 71.) Полное описание глагола pretend требует более аккуратной формулировки, поскольку предлагаемая в примере (30) парафраза не покрывает случаев поведения человека в одиночестве (Whenever Г m alone, I pretend you're with me 'Всегда, когда я оказываюсь в одиночестве, я делаю вид, что ты со мной'). В примере с глаголом realize 'представлять себе, понимать' реализуется особый аспект значения этого предиката, характеризующий его использование в вопросительных и восклицательных предложениях с вопросительными словами, который замечался довольно редко. Список примеров на пресуппозиции, включающий различные хорошо известные случаи, не приводится. Более полное исчисление структур, которые, как считается, порождают пресуппозиционные интерпретации, см. в Levinson, 1983: 181 —183. 82
IF SHE HAD TAKEN THE MEDICINE (by t), SHE WOULD HAVE SURVIVED. 'Если бы она приняла лекарство (к моменту t), она бы выжила', (i) 'Принятие лекарства влечет ее выживание', (ii) 'Она не приняла лекарства (до момента t)'. НЕ PRETENDED ТО BE AN ADMIRAL (at t). 'Он делал вид, что он адмирал (в момент t)'. (i) 'Он вел себя так, что это вызывало представление о том, что он адмирал', (ii) 'Он считал (в момент t), что он не адмирал'. BOTH OF JOHN'S CHILDREN ARE A BURDEN TO HIM. 'Оба ребенка Джона представляют для него обузу', (i) 'Два человеческих существа—дети Джона — представляют для него обузу', (ii) 'У Джона есть только два ребенка'. Интуиция, приведшая к теории семантических пресуппозиций, была связана с ощущением, что способность каждого из представленных выше предложений к изложению чего-либо зависит от истинности того, что в нем предполагается, и на предполагаемую часть указывают некоторые аспекты формы предложений (например, выбор лексем или грамматических конструкций)24. В П-семанти- ке возникает целый комплекс важных представлений относительно связи между излагаемым и предполагаемым. Среди них можно отметить следующие: 1. В большинстве случаев то, что составляет пресуппозицию предложения, не подвержено действию модальности условия (выражение если он опять тебя ударит предполагает наличие первого удара), вопроса (вопрос Вы хотите еще одну чашку кофе? предпола- Может оказаться необходимым сказать несколько слов о том, что действительно выражает пресуппозицию. Иногда говорится, что, например, слово regret 'сожалеть' предполагает фактивность придаточного предложения. Этот способ выражения, которому я среди прочих потворствовал, был подвергнут критике за неточность. Если и далее допускать такую терминологию, то следует оговориться, что в некоторых случаях информация, связанная со словом, дает возможность интерпретатору воссоздать пресуппозицию высказывания, содержащего соответствующую лексему. Я думаю, что выражение «лексическая пресуппозиция» по сути своей верно, поскольку мы знаем, как реконструировать ситуацию, включающую людей, которые выбором особых языковых форм передают пресуппозиции сказанного; это позволяет закрепить за языковыми единицами пресуппозиционную функцию. Я думаю, что между лексическими единицами и фреймами, которые они представляют, есть связь. И в определенных условиях, рассматриваемых ниже, она может быть сформулирована как обобщенное понятие пресуппозиции. Пресуппозиционное отношение требует аккуратного определения. Иногда работы по этой проблематике создают впечатление, что пресуппозиции высказывания охватывают любые представления, которые могут быть приписаны говорящему; но это, несомненно, должно привести к включению в пресуппозиции знаний типа «Вы слушаете меня», «Вы понимаете язык, на котором я говорю», «Все тавтологии суть тавтологии» и так до бесконечности. Однако нас интересуют только те представления, которые, как нам кажется, оправданно приписываются говорящему в силу особых лексико-грамматических свойств рассматриваемого высказывания. 83 6* (29) (30) (31)
гает, что была первая чашка) или отрицания (фраза Он бы не перестал кричать пресуппозицирует наличие «крика»). 2. Прямые реплики второй стороны, поддерживающие или оспаривающие высказывание с пресуппозицией, воспринимаются как поддержка или возражение на то, что излагается, а не на то, что пресуппозицируется. Поэтому, например, в диалоге типа (32): (32) A: Does she realize who I am? 'Она представляет себе, кто я?' В: I don't think so. 'Я так не думаю.' ответу В трудно приписать значение „Я сомневаюсь, что выяснение того, кто вы, может представлять для нее какой-нибудь интерес"; скорее ответ выражает сомнение, что „она" знает, кем является А, оставляя в неприкосновенности предположение о потенциальной важности для ,,нее" идентификации А в данных обстоятельствах. 3. В случае нарушения пресуппозиции, по выражению Стросона, вопрос об „истинности" не встает. Так, если я собирался сказать нечто вроде (33): (33) Even I couldn't lift the box. 'Даже я не мог поднять ящик'. в ситуации, когда среди членов релевантной группы я являюсь скорее слабейшим, чем сильнейшим, то вопроса об „истинности" сказанного (поскольку я действительно не смог поднять ящик) просто не возникает. 4. Императивы, связанные с пресуппозициями, могут быть разделены на случайные (occasional) и постоянные (standing). Случайные императивы уместны только в тех случаях, когда их пресуппозиции удовлетворены (ср. „Хватит лгать!"). Постоянные императивы требуют не истинности пресуппозиций, а того, чтобы они имели силу (holds). Обвинения в неповиновении постоянным императивам из-за нарушения пресуппозиций нельзя признать обоснованными. (Нельзя быть виновным в том, что не удалось уступить дорогу на перекрестке из-за того, что некому было уступать.) 5. Понятие пресуппозиции в семантике понимания предполагает учет того, что „пресуппозицируется" в акте произнесения высказывания в зависимости от его положения в текущем дискурсе. Так, о предложении типа (34) (34) John was put in jail on Monday and escaped on Tuesday. 'Джона посадили в тюрьму в понедельник, а бежал он во вторник'. нет необходимости спрашивать, обладает ли оно как целое пресуппозицией, согласно которой Джон находился в таком месте, из которого так просто не выйдешь; тем не менее второе предложение имеет такую пресуппозицию. Наличие важной связи между пресуппозицией и временем повествования делает бессмысленным вопрос, 84
„пресуппозицирует" ли что-либо сложное предложение с двумя компонентами, связанными как части продолжающегося повествования, как единая сущность. По тем же причинам о примере типа (35) (35) If Bill and Sue have children, I bet their children are beautiful. 'Если Билл и Сью имеют детей, держу пари, что их дети красивы'. не возникает вопроса, обладает ли предложение в целом пресуппозицией о том, что у Билла и Сью есть дети; второе предложение имеет такую пресуппозицию, однако, только в сфере кондициональности, очерчиваемой первым. (См. Gaz dar, 1979: 70 и цитируемые там источники.) КЛЮЧЕВОЙ МОМЕНТ Литература по лингвистике и лингвистической философии середины семидесятых годов была наводнена проектами и дискуссиями относительно правильной интерпретации феномена «пресуппозиция». В центре внимания этих дебатов оказались вопросы о том, возможно ли такое, достаточно точное определение понятия пресуппозиции, которое позволило бы идентифицировать что-либо познаваемое; каковы источники пресуппозиций — слова, предложения, высказывания или говорящие; где должна исследоваться асимметрия «двунаправленного» анализа того типа, который иллюстрировался выше,— в теории семантики, или в лингвистической прагматике, или вообще нигде; какая логика — двузначная или трехзначная — лежит в основе правильной теории семантики естественного языка и вообще применима ли на самом деле для естественного языка теоретико- истинностная семантика; что можно сказать о пресуппозициях сложного предложения в условиях, когда мы можем кое-что сказать о пресуппозициях, которые обычно ассоциируются с его частями (о «проблеме проекции пресуппозиций» см. Langendoen and Savin, 1971). Исключительную важность в этой дискуссии приобрела проблема отрицания предложения с пресуппозициями в условиях ложности одной или нескольких из них. Проанализируем заново случаи использования глаголов regret, realize и pretend, представленные выше в примерах (24), (25) и (30). В каждом случае вторым аспектом проводившегося анализа была пресуппозиция, в то время как первый представлен тем, о чем прежде всего говорится в предложении. Вторичное обращение к тесту на отрицание, использовавшемуся, в частности, Стросоном, должно привести к такой интерпретации релевантных примеров25, 25 Некоторые структуры с пресуппозициями характеризуются скалярной интерпретацией в смысле Хорна (Horn, 1972) и поэтому имеют только внутрифреймовое отрицание. Соответственно эти структуры не входят в сферу действия грамматического отрицания, и ,,тест на отрицание" не существен для их интерпретации. (Здесь я имею в виду структуры с предикатами only 'только', even 'даже' и др.) 85
при которой пресуппозиция предложения не подвергается действию отрицания. Основное предположение сводится к тому, что в предложении типа (36) (36) John regretted signing the letter. 'Джон сожалел, что подписал письмо'. «пресуппозицируется» то, что Джон подписал письмо, а «излагается» то, что Джон сожалеет о содеянном. В отрицании этого предложения; ср. (37) (37) John didn't regret signing the letter. 'Джон не сожалел, что подписал письмо'. мы обнаруживаем пресуппозицию о поступке Джона нетронутой, однако в нем говорится, что Джон не испытывает сожаления о содеянном. Аналогично при введении отрицания меняются на противоположные „излагаемые" части представленных ранее предложений с глаголами ,,pretend" и „realize", а ,,пресуппозиционные" части остаются неизменными. И в примере (38), и в примере (39) поддерживается представление о том, что Джон не является (или он думает, что не является) адмиралом: (38) John pretended to be an admiral. 'Джон делал вид, что он адмирал'. (39) John didn't pretend to be an admiral. 'Джон не делал вида, что он адмирал'. С другой стороны, и в примере (40), и в примере (41) нас не покидает ощущение, что ,,вы" важны для Джона: (40) John realizes who you are. 'Джон представляет себе, кто вы'. (41) John doesn't realize who you are. 'Джон не представляет себе, кто вы'. Пресуппозиция, определяемая нами в утвердительном предложении, остается без изменений и в его отрицательном аналоге. (Однако см. ниже.) В формальной семантике такая интерпретация не вызвала энтузиазма, поскольку она потребовала признания существования осмысленных высказываний, имеющих форму утверждений, которым, однако, не может быть приписана истинностная оценка. Поскольку доводы в пользу пресуппозиций оказались единственным возражением против применимости в лингвистической семантике двузначной логики, среди приверженцев И-семантики получили широкое распространение попытки избавиться от этого понятия и отказать ему в признании. В подходе, элиминирующем пресуппозиции, две пропозиции предложения, которые должны были бы распределяться между его „излагаемой" и ,,пресуппозицируемой" частями, рассматриваются как выражение связи между всем предложением и соотносимой с 86
ним пресуппозицией, определяемой скорее как ,»следствие", чем нечто столь таинственное и обременительное, как пресуппозиция. Для того чтобы избавиться от понятия пресуппозиции, мы, конечно, должны переосмыслить приведенные наблюдения об отрицательных предложениях с глаголами regret-, pretend- и realize. Что мы скажем о таких предложениях в ситуациях ложности пропозиции, входящей в состав пресуппозиции? Сторонник теории пресуппозиции должен был бы заявить, что в таком случае предложение просто нельзя использовать (другими словами, что у него отсутствует истинностная оценка), тогда как противник пресуппозиций должен был бы сказать, что оно истинно, поскольку в нем корректно отрицается то, что ложно. Рассмотрим четыре ситуации использования предложений с пресуппозициями, сопоставив: (I) позитивные предложения („Не regrets joining the church". 'Он сожалеет, что стал верующим'). (II) негативные предложе- (,,Не doesn't regret joining the ния church". 'Он не сожалеет, что стал верующим.') с ситуациями, в которых пресуппозиции таких предложений (A) истинны (он стал верующим) или (B) ложны (он не стал верующим). Позитивное предложение с пресуппозицией истинно, если обе его пропозиции истинны (случай IA), и ложно, если „излагаемая часть" ложна, а ,,пресуппозиционная часть" истинна (случай IIA). Если пресуппозиционная часть ложна, то об утвердительном предложении, конечно, нельзя сказать, что оно истинно (случай IB). (Как теории пресуппозиций, так и теории логического следования единодушны в том, что утвердительное предложение ,,делает неизбежной" эту особенность функционирования пресуппозиций (Boer & Lycan, 1976).) Такие суждения, обеспечивавшие до сих пор возможность прочтения выражения ,,нельзя сказать, что оно истинно" в ситуации IB в смысле ,,оно ложно", соответствуют ожиданиям при интерпретации отношений между предложением и выводимыми из него заключениями в терминах логического следования. Ключевой вопрос состоит в том, что мы должны сказать об отрицательном предложении, пресуппозицонная часть которого ложна (случай IIВ)? Здесь мы сталкиваемся с проблемой. Сторонник семантики, основывающейся на логическом следовании, должен был бы сказать, что отрицательное предложение истинно, в то время как сторонник теории пресуппозиций утверждал бы, что оно вообще не допускает истинностной оценки. Оставаясь в рамках наших примеров, мы должны быть в состоянии сформулировать суждения о высказываниях John didn't 87
regret signing the letter 'Джон не сожалел, что подписал письмо' (при условии, что Джон в действительности не подписывал письма). John didn't pretend to be an admiral 'Джон не делал вида, что он адмирал' (в ситуации, когда Джон на самом деле был адмиралом и знал, что он адмирал) и John doesn't realize who you are 'Джон не представляет себе, кто вы' (в условиях, когда говорящий полагает, что знание ,,вас" не представляет особого интереса для Джона). Выделяются два свойства наших странных IIB-высказываний, которые должны объясняться адекватной семантической теорией: (1) Они необычны в том смысле, что их появление в нормальном общении возможно только при наличии совершенно особых прагматических условий. (2) Они тем не менее могут использоваться для передачи некоего сообщения, а именно сообщения, передаваемого в ситуациях межфреймового отрицания. Сторонники семантики логического следования легко объясняют второе свойство IIВ-высказываний, говоря, что эти предложения просто истинны и имеют в точности ту интерпретацию, которая должна быть им приписана. Они представляют собой отрицания ложных предложений. Такие теоретики должны были бы использовать вспомогательную теорию, теорию прагматики (включающую принцип коммуникативного сотрудничества Грайса) для объяснения интуиции, согласно которой в этих предложениях есть нечто странное и что их нельзя считать ни нормальным, ни ориентированным на сотрудничество способом выражения того, что в них говорится. В обычном диалоге, когда говорящие в соответствии с принципом коммуникативного сотрудничества информативны, не следует стремиться к отрицанию, если можно считать доказанным, что некоторое следствие этого отрицания ложно. Таким образом, элиминируя причиняющее беспокойство понятие пресуппозиции и отстаивая двузначную логику, теория И-семантики при помощи лингвистической прагматики—которая, как мы знаем, так или иначе добивается признания своей необходимости для языковой теории—пытается сохранить благолепие в сфере описания естественного языка. В противоположность этому сторонник пресуппозиций доказывает, что свойство (1) объясняется ,,обычными" семантическими принципами (высказывание необычно, потому что его пресуппозиция ложна) и что свойство (2) нуждается в некотором особом истолковании. В случае со сторонником пресуппозиций таким особым принципом истолкования становится межфреймовое отрицание. Когда я, со значением, произношу фразу (42) (42) John didn't regret signing the letter. 'Джон не сожалел, что подписал письмо.', имея в виду, что причиной отсутствия сожаления было то, что он на 88
самом деле не подписывал письма 6, я произвожу метаязыковой комментарий о неприемлемости использования фрейма, соотносящегося с лексической единицей ,,regret" для описания данной ситуации. Мне представляется, что такая интерпретация подтверждается тем, что для этого высказывания мы подразумеваем (1) наличие контекста, в котором возникает вопрос о сожалении Джона в связи с подписанием письма (например, из-за того, что собеседник спросил об этом), (2) необходимость особого просодического выделения слова ,,regret" и (3) невозможность прекращения беседы на этом этапе, поскольку высказывание, отрицающее фрейм, требует появления другого высказывания, в большей степени соответствующего описываемой ситуации27. С точки зрения семантики фреймов пресуппозиции, которые мы ассоциируем со словами, подобными regret и pretend, выводятся из использования этих лексем в интерпретации текста; они представляют собой знания о фреймах, образующих часть семантики этих глаголов. Предназначение слова regret состоит в том, что оно используется в разговоре о чувствах людей по отношению к уже происшедшим событиям. Связанный с этим словом фрейм является историческим фреймом или сценарием, в котором то, о чем выражается сожаление, представлено ситуацией признания содеянного или признанием существования некоторого положения вещей. Слово pretend "занимается тем', что позволяет нам говорить о людях, чей образ мыслей и способ действий противоречат реальности. В такой интерпретации отрицание пресуппозициональных глаголов касается того, что излагается, а не того, что предполагается. В ситуации, когда известно, что пресуппозиция ложна, отрицательное предложение может использоваться для отрицания применимости фрейма к рассматриваемой ситуации. 26 В раннем варианте этого примера „Джон писал письмо, а не подписывал его". Я весьма обязан Руфь Кемпсон, указавшей мне на то, что в первом случае сочетание глагола типа write 'писать', „создающего" объект, с определенным артиклем лексемы letter 'письмо' самостоятельно порождает соответствующую „пресуппозицию". 27 Поль Кэй (устное сообщение) и Ларри Хорн (Horn, 1984) высказали предположение о существовании более широкого класса отрицательных речевых актов по сравнению с тем, что вводится здесь под названием межфреймового отрицания, а именно была предложена категория метаязыкового отрицания. Используя метаязыко- вое отрицание, второй говорящий получает возможность корректировать сказанное даже на уровне просодии и грамматической формы. („That's not an interesting phenomena, though of course it might be an interesting phenomenon" 'Это не интересные феномены, хотя, конечно, это может быть интересный феномен'.) Эти наблюдения стали мне известны слишком поздно, и я не смог учесть их здесь в своих выводах. Тем не менее кажется совершенно ясным, что (i) одной из причин появления метаязыкового отрицания может служить некорректное, с точки зрения адресата, использование фрейма в высказывании—для описания ситуации — и что (ii) понятие применимости фрейма (framing) носит достаточно общий характер для того, чтобы с его помощью рассматривать условия соответствия речевого акта ситуации. 89
эпилог Я думаю, что теория П-семантики, вооруженная фреймами интерпретации, может обеспечить разработку разумной программы исследования лексического значения, определения и экспликации семантики грамматических конструкций и осмысления процесса понимания текста, причем все это на основе интуитивно приемлемого представления об истинности и пресуппозиции. Необходимо провести границу между теми аспектами понимания языковых выражений, которые в первую очередь входят в описание языка, и теми, которые в точном смысле относятся к описанию различных видов деятельности и рассуждения, в сферу которых вовлекаются носители языка в процессе порождения и понимания языковых текстов; такая граница должна определяться в терминах ,,соглашений", то есть на основе того, что знает индивидуум как носитель языка, а не в терминах суждений об относительной истинности. Однако при том, что признается возможность выделения в П-семантическом описании множества «чисто языковых» элементов, нам нет нужды отказываться от разработки более полной картины. С точки зрения П-семантики языковая компетенция носителей языка взаимодействует с другими видами знаний и умений; П-семантика стремится к пониманию всего процесса в целом. В рамках этого направления предложения, об истинности которых можно высказывать суждения, образуют строгое подмножество тех предложений, которые допускают понимание, и это понимание составляет предпосылку суждений об истинности. ЛИТЕРАТУРА Arnheim, 1969 = Arnheim, R. Visual Thinking. Berkeley: University of California Press, 1969. Bartlett, 1932 = Bartlett, F. Remembering. Cambridge: Cambridge University Press, 1932. Beaugrande de, Dressler, 1981 =Beaugrande, R., Dressler, W. Introduction to Text Linguistics, N.Y.: Longmans, 1981. Betz, 1954 = Вetz, W. Zur Uberprufung des Feldbegriffes.—„Zeitschrift fur vergleichende Sprachforschung", 1954, 71, S. 24—45. Black, 1952 = Black, M. Definition, presupposition and assertion.—„Philosophical Review", 1952, vol. 61, p. 24—45. Black, 1954 = В lack, M. Problems of Analysis: Collected Essays. Ithaca, N.Y.: Cornel's University Press, 1954. Bobrow, Collins, 1975 = Bobrow, D., Collins, A. (eds.). „Representation and Understanding: Studies in Cognitive Science", N.Y.: Longmans, 1975. Boer, Lycan, 1976 = Boer, S.G., Lye an, W.C. The Myth of Semantic Presupposition. (Indiana University Linguistics Club, mimeo), 1976. Charniak, 1975 = Charniak, E. Organization and Inference in a Frame-Like System of Common Sense Knowledge. Castagnola, ISCS, 1975. Clark, 1975 = Clark, E.V. Normal states and evaluative viewpoints.—„Language", 1974, vol. 50, p. 316—332. Cole, Morgan, 1975 = Cole, P., Morgan, J.L. (eds.) „Syntax and Semantics, 3: Speech Acts". N.Y.: Academic Press, 1975. Cole, Sadock, 1977 = Cole, P., Sadock, J.M. (eds.) „Syntax and Semantics, 8: Grammatical Relations". N.Y.: Academic Press, 1977. Copeland, 1984 = Copeland, J.E. (ed.) „New Directions in Linguistics and Semantics". Houston: Rice University Studies, 1984. 90
Coseriu, 1967 = Coseriu, E. Lexikalische Solidaritaten.—„Poetica", 1967, N 1, p. 293—303. Dornseif f, 1938 = Dorn seif f, F. Das Problem des Bedeutungswandels.— „Zeitschrift fur deutsche Philologie", 1938, vol. 63, S. 119—138. Duc rot, 1972 = Duc rot, O. Dire et ne pas dire. Paris: Hernmann, 1972. Duden, 1973 = Duden. Grammatik der deutschen Gegenwartsprache, 3rd revised and expanded edition. Vol. 4. Mannheim: Dudenverlag, 1973. Fauconnier, 1975 = Fauconnier, G. Pragmatic scales and logical structure.— „Linguistic Inquiry", 1975, N 6, p. 353—375. Fauconnier, 1985 = Fauconnier, G. Mental Spaces. Cambridge, Mass.: Bradley Books, 1985. Fillmore. 1971 = Fillmore, Ch.J. Verbs of judging: an exercise in semantic description.— In: Fillmore. Langendoen, 1971, p. 273—290. Fillmore, 1975 = Fillmore, Ch.J. An alternative to checklist theories of meaning.— In: „Proceedings of the First Annual Meeting of the Berkley Linguistic Society", 1975, vol. 1, p. 123—131. Fillmore, 1977 = Fillmore, Ch.J. The case for case reopened.— In: Cole, Sadock, 1977, p. 59—82. Fillmore, 1982 = Fillmore, Ch.J. Ideal readers and real readers.— In: Tannen, 1982, p. 248—270. Fillmore, 1982 = Fillmore, Ch.J. Frame semantics.— In: „Linguistics in the Morning Calm", The Linguistic Society of Korea. Seoul: Hanshin, p. Ill —137. Fillmore, 1984 = Fillmore, Ch.J. Lexical semantics and text semantics.— In : Copeland, 1984, p. 123—147. Fillmore, Langendoen, 1971 =Fillmore, Ch. J., Langendoen, D.T. Studies in Linguistic Semantics. N.Y.: Holt, Reinhart and Winston, 1971. Gazdar, 1979 = Gazdar, G. Pragmatics: Implicature, Presupposition and Logical Form. N.Y.: Academic Press, 1979. Geckeler, 1971=Geckeler, H. Strukturelle Semantic und Wortfeldtheorie. Munchen: Wilhelm Fink Verlag, 1971. Gipper, 1973 = Gipper, H. Das sprachliche Feld.—In: Duden, 1973, p. 442—452. Goff man, 1974 = Goffman, E. Frame Analysis: An Essay on the Organization of Experience. N.Y.: Harper Colophon, 1974. Greenberg, 1963 = Greenberg, J.H. (ed.) Universals of Language. Cambridge, Mass.: M.I.T. Press, 1963. Grice, 1975 = Grice, H.P. Logic and conversation.— In: Cole, Morgan, 1975, p. 41—58. Hoberg, 1970 = Hoberg, R. Die Lehre vom sprachlichen Feld. Dusseldorf, 1970. Horn, 1972 = Horn, L.R. On the Semantic Properties of the Logical Operators in English. Indiana University Linguistic Club (mimeo), 1972. Kay, 1983 = Kay, P. Linguistic competence and folk theories of language: two English hedges.—In: BLS, 9. Berkeley, CA: Berkeley Linguistic Society, 1983. Kempson, 1975 = Kemp s on, R.M. Presuppositions and Delimitation of Semantics. Cambridge: Cambridge University Press, 1975. Lakoff, 1983 = Lakoff, G. Categories: an essay in cognitive linguistics,— In: „Linguistics in the Morning Calm". Linguistic Society of Korea (ed.). Seoul: Hanshin, 1983, p. 139—194. Lakoff, Johnson, 1980 = Lakoff, G., Johnson, M. Metaphors we Live by. Chicago: University of Chicago Press, 1980. Langacker, 1984 = Langacker, R. Active zones.—In: BSL, 10. Berkeley, CA: Berkeley Linguistics Society, p. 172—188. Langendoen, Savin, 1971 = Langendoen, D.T., Savin, H. The projection problem for presupposition.— In: Fillmore, Langendoen, 1971, p. 55—60. Levinson, 1983 = Levinson, S.C. Pragmatics. Cambridge: Cambridge University Press, 1983. Metzing, 1980 = Metzing, D. Frame Conceptions and Text Understanding. Berlin: de Gruyter, 1980. Mill, 1846 = Mill, J.S. A System of Logic. N.Y.: Harper and Brothers, 1846. Minsky, 1975 = Minsky, M. A framework for representing knowledge.— In : Winston, 1975, p. 211—277. 91
Oksaar, 1958 = Oksaar, E. Semantische Studien im Sinnbereich der Schnelligkeit. Plotzlich, schnell und ihre Synonymik in Deutsch der Gegenwart und des Fruh-, Hoch- und Spatmittelalters, Stockholm and Uppsala.—,,Acta Universitatis Stockholmiens" (Stockholmer Germanistische Forschungen 2), 1958. Rumelhart, 1955 = Ru mein art, D.E. Notes for a schema for stories.— In: Bobrow, Collin, 1975, p. 211—236. Rumelhart, Ortony, 1977 = Rumelhart, D.E., Ortony, A. The representation of knowledge in memory.— In: Anderson, Richard C, Rand Spiro and W. Montague (eds.). Schooling and Acquisition of Knowledge. Hillsdale (N.J.): Erlbaum, p. 90—135. Sacerdoti, 1977 = Sacerdoti, E. A Structure for Plans and Behavior. N.Y.: Elsevier, 1977. Schank, Abelson, 1977 = Schank, R., Abelson, R. Scripts, Plans and Understanding. Hillsdale, N.Y.: L. Erlbaum, 1977. Schwarz, Kandier, 1959 = Schwarz, H., Kandier, G. Sprache — Schussel zur Welt. Dusseldorf: Padagogischer Verlag Schwann, 1959. Searle, 1980 = Searle, J.R. The background meaning.— In: Searle, Kiefer, Bierwish, 1980, p. 221—232. Searle, Kiefer, Bierwish, 1980 = Searle, J.R., Kiefer, F., Bierwish, M. (eds.) Speech Act Theory and Pragmatics. Dordrecht: D. Reidel, 1980. Spence, 1961 = Spenee, N.C.W. Linguistic fields, conceptual systems, and the weltbild.—In: „Transaction of the Philological Society", 1961, pp. 87—106. Tannen, 1982 = Tannen, D. (ed.) Analyzing Discourse: Text and Talk. (Georgetown University Roundtable on Languages and Linguistics). Washington, D.C.: Georgetown University Press, 1982. Thorndyke, 1977 = Thorndyke, P. Cognitive structures in comprehension and memory of narrative discourse.—„Cognitive Psychology", 9, 1977, p. 77—110. Trier, 1931 = Trier, J. Wortschatz des Verstandes, Band 1. Heidelberg: Carl Winters Universitatsbuchhandlung, 1931. Trier, 1971 = Trier, J. Aufsatze und Vortrage zur Wortfeldtheorie, ed. by Anthony van der Lee and Oskar Reichman. The Hague: Mouton, 1971. Weinreich, 1963 = Weinreich, U. On the semantic structure of language.— In: Weinreich, 1980, p. 37—96. Weinreich, 1980 = Weinreich, U. On Semantics. (Papers by U. Weinreich, ed, by W. Labov and B.S. Weinreich.) Philadelphia: University of Pennsylvania Press, 1980. Weisgerber, 1962 = Weisgerber, J.L. Grundzuge der Inhaltbezogenen Grammatik. Dusseldorf: Padagogischer Verlag Schwann, 1962. Wilks, 1980 = Wilks, Y. Frames, semantics, and novelty.— In: Metzing, 1980, p. 134—163. Wilson, 1975 = Wilson, D. Presuppositions and Non-Truth-Conditional Semantics. N.Y.: Academic Press, 1975. Winograd, 1975 = Winograd, T. Frame representations and the declarative- procedural controversy.— In: Bobrow, Collins, 1975, p. 185—210. Winston, 1975 = Winston, P.H. (ed.). The Psychology of Computer Vision. N.Y.: McGraw-Hill, 1975.
M. Бирвиш НАСКОЛЬКО ЛИНЕЙНО УПОРЯДОЧЕННОЙ ЯВЛЯЕТСЯ ЯЗЫКОВАЯ ОБРАБОТКА?* СУЩНОСТЬ ПРОБЛЕМЫ Большое количество работ, исследующих природу понимания языка, посвящены выяснению роли грамматически определенных структур, прежде всего синтаксических, в процессе анализа языковых высказываний. В последнее время некоторые присущие этому ,,структурному подходу" положения были поставлены под сомнение в связи с переносом исследовательских интересов на реальные процессы понимания языка. Весьма радикальная версия такого «процессуального подхода» развивается Марслен-Уилсоном, Тайле- ром и другими в ряде интересных работ (например: Marslen- Wilson, 1975; Marslen-Wilson, Tyler, 1980; Marslen-Wilson, Tyler, Seidenberg, 1978 и др.). Строго линейно упорядоченный**, развивающийся слева направо, процесс языкового понимания резюмируется Марслен-Уилсоном и другими (Marslen-Wilson et al., 1978: 242—243) следующим образом: «Представляется, что слушающий пытается произвести прямое пословное отображение воспринимаемого высказывания в единую внутреннюю репрезентацию. В своей наиболее полной форме эта репрезентация могла бы соответствовать тому, что мы называем пониманием (comprehending) предложения, и вряд ли она может быть описана в строго языковых терминах, так как должна включать в себя умозаключения, сделанные слушающим на основе нелингвистических знаний. Таким образом, сама по себе она не является ни синтаксической, ни семантической репрезентацией, хотя для ее построения могут использоваться как синтаксические, так и семантические аспекты воспринимаемого высказывания». Для определения общих контуров последующего обсуждения я сформулирую три положения, отличающие, на мой взгляд, эту * Manfred Bierwisch. How On-line is Language Processing? — В книге: ,,The Process of Language Understanding" (Edited by G. B. Flores d'Arcais and R. J. Jarvella), 1983. Печатается с некоторыми сокращениями. © 1983 by John Wiley & Sons Ltd. Publishers. ** В данной статье английский термин on-line используется не только для обозначения линейной упорядоченности, но и для обозначения оперативности обработки информации. 93
концепцию от альтернативных точек зрения, которые она предполагает заменить: (A) Интерпретация речевого сигнала является строго линейно- упорядоченной, разворачивающейся слева направо, пословной обработкой, использующей все виды информации, доступные на каждом этапе. (B) Результатом интерпретации речевого сигнала являются не отдельные синтаксические и семантические структуры, а скорее единая репрезентация частично нелингвистического характера. (C) Данная интерпретация является результатом использования как лингвистических, так и нелингвистических знаний, так что в общем случае невозможно выделить чисто лингвистические этапы этого процесса. Утверждение (А) прямо противопоставлено всем положениям, в которых предполагается необходимость обработки синтаксически определенных составляющих—обычно некоторых типов простых предложений и оборотов—до начала семантической и прагматической интерпретации. В более общем плане (А) отрицает, что восприятие предложения осуществляется последовательно на нескольких уровнях, на которых для достаточно больших частей высказывания строятся сначала синтаксическая, затем семантическая, и, наконец, контекстуальная репрезентации1. Утверждение (В) направлено против положения о том, что различные уровни структуры, определяемые лингвистически адекватной грамматикой, строятся непосредственно в процессе анализа предложения. Другими словами, (B) отрицает, что строится какая бы то ни было структура, отличная от «конечной» структуры, представляющей полное понимание высказывания. Наконец, (С) направлено против положения, утверждающего, что реальные процессы понимания языка естественным образом подразделяются на лингвистическую и нелингвистическую части. Хотя Марслен-Уилсон, Тайлер и их единомышленники в определенном общем смысле утверждают, что (А) — (С) представляют связную концепцию понимания языка, в их предположении содержится серьезный изъян; прояснение существующих ограничений является обязательной предпосылкой для каких бы то ни было оценок предложенной концепции. Наиболее слабым местом в данном предположении является отсутствие какого бы то ни было определения той внутренней репрезентации, в которую переводится воспринимаемое высказывание. Без такого определения утверждения (А) — (C) остаются неопределенными и подвергаются опасности предстать либо как словесная уловка, либо как тривиальность. Таким образом, цель данной статьи—рассмотреть утверждения (А) — (С) на базе минимального количества, я надеюсь, бесспорных положений, касающихся условий, которым должна удовлетворять внутренняя репрезентация. В частности, я постараюсь доказать, что (С) в основном верно, (В) в основном ошибочно, а (А) требует разъяснения и уточнения. В качестве более конкретной аргументации я рассмотрю как важнейший компонент понимания языка требования, участвующие в определении сферы действия. В резуль- 94
тате будут сформулированы некоторые выводы относительно процессуально-ориентированных концепций понимания языка. Необходимо сделать еще три предварительных замечания. Во- первых, связь между утверждениями (А) — (С) достаточно свободная2. Нет никакой логической необходимости принимать или отвергать их все вместе. Некоторые, более слабые связи между этими тремя утверждениями будут рассмотрены ниже. Во-вторых, представленные Марслен-Уилсоном, Тайлером и их сотрудниками в высшей степени интересные экспериментальные данные релевантны только для утверждения (А); они указывают, что не обязательно ожидать окончания конкретного синтаксического разбора, чтобы перейти к семантической и контекстуальной интерпретации. Строго говоря, они не имеют никакого отношения к утверждениям (В) и (С). В пользу этих утверждений невозможно привести какое-либо доказательство, поскольку нельзя доказать, что непосредственно не воспринимаемые структуры не существуют; и, с другой стороны, имеются многочисленные свидетельства, указывающие, что данные структуры действительно играют определенную роль в процессе анализа. Что касается (С), которое не является основной темой данной статьи, то здесь ситуация несколько сложнее и ее мы кратко обсудим ниже. Наконец, предложения Марслен-Уилсона и других не являются единственным современным подходом, принимающим утверждения (А) — (С). Развиваемый в искусственном интеллекте подход к пониманию языка, например Ризбеком и Шенком (Riesbeck—Schank, 1978), хотя и основывается на весьма отличных общих посылках, ориентируется на те же положения, которые указаны в (А) — (С)3. Я не буду обсуждать здесь различия между возможными концепциями, удовлетворяющими условиям (А) — (С), а сосредоточу внимание на самих утверждениях. УРОВНИ ПОНИМАНИЯ Для того, чтобы дальнейшее обсуждение было ясным, я считаю необходимым ввести несколько предварительных понятий. Прежде всего следует заметить, что слушающий может достичь разных уровней понимания. Для наших целей необходимо различать следующие возможности—для данного слушающего H и высказывания и: (1) Я понимает и на фонетическом уровне, (2) H понимает и на синтаксическом уровне, (3) H понимает и на семантическом уровне, (4) H понимает и в контексте. Каждый из названных типов понимания может быть истолкован следующим образом: слушающий получает сенсорный сигнал s и интерпретирует его как языковое высказывание и, приписывая ему внутреннюю структуру определенного типа. Говоря более конкретно, результирующая структура будет называться фонетической структурой Р высказывания и в случае (1), синтаксической структурой S высказывания и в случае (2), логической формой LF 95
высказывания и в случае (3) и контекстуальным значением С высказывания и в случае (4). Следовательно, прояснение уровней понимания (1) — (4) очевидным образом зависит от более точной характеристики соответствующих типов структур. Пока я буду считать, что Р является каким-то вариантом репрезентации, основывающейся на фонетических признаках. (Меня не интересует вопрос, может или должен уровень (1) подразделяться на фонетический и фонематический уровни понимания.) S и LF будут подробнее рассмотрены в разд. 4. В отношении (4) представляется необходимым выделить две возможности: кроме, или часто вместо, прямой интерпретации, и может быть приписана не прямая (косвенная, фигуральная, метафорическая и т. п.) интерпретация. Поэтому (4) может быть дальше разбито на: (5) (а) H понимает и буквально, (b) H понимает и косвенно. Следовательно, мы должны различать прямое и непрямое контекстуальное значение C1 и Сn соответственно для (5а) и (5b)4. Заметим, что и C1, и Сn являются вариантами контекстуального значения, будучи альтернативными примерами того, что Кларк (Clark, 1978) называет „намеренной интерпретацией". Хотя они строятся иногда с помощью весьма различных процессов и определяются различными типами правил, они являются структурами одного и того же общего типа и сходны в том, что обе зависят от контекстуальной информации и фоновых знаний, в терминах которых интерпретируется м. В последующем изложении я буду говорить просто о контекстуальном значении С везде, где различие прямого и непрямого значения не является темой обсуждения5. Ниже я кратко коснусь характера контекстуального значения. Различные уровни понимания, выделенные в (1) — (4), должны рассматриваться как чисто интуитивные понятия, суть которых наилучшим образом может быть выявлена при разборе различных случаев непонимания высказывания и слушающим Н. Так, он может не понять и на фонетическом уровне из-за слишком сильного шума или из-за нечеткой артикуляции речевого сигнала s. Точно так же слушающий может не понять и на синтаксическом уровне—из-за синтаксической сложности высказывания. Хорошо известные случаи множественного самовложения, как в (6), далеко не единичный пример. (6) The girl the man the cats and one of the dogs belong to adopted recovered. 'Девочка, которую удочерил человек, которому принадлежат кошки и одна из собак, выздоровела'. Ни фонетические, ни семантические, ни контекстуальные факторы не играют роли в примерах такого типа. В-третьих, слушающий может не понять и на семантическом уровне, например в логически неясных случаях типа (7), который не представляет никаких проблем на синтаксическом уровне. 96
(7) (a) No disease is small enough not to be ignored. 'Никакая болезнь не является настолько незначительной, чтобы ее не игнорировать', (b) The cathedral is much too wide in order to be higher than it is long. 'Собор слишком широк, чтобы его высота была больше, чем длина,' Наконец, существует множество случаев, когда слушающий может не понять высказывание на контекстуальном уровне. Неудачи, связанные с невозможностью установить соответствующие референты местоимений или определенные дескрипции, составляют лишь один такой класс. Другой класс неудач иллюстрируется примерами типа (8), где, несмотря на ясную синтаксическую и семантическую структуру, слушающий, по-видимому, не сможет приписать сочетанию language of the sculpture ни прямого, ни косвенного контекстуального значения. (8) Не tried to eliminate the language of the sculpture. 'Он постарался уничтожить язык скульптуры'. Утверждения (1) — (5) не исчерпывают всех уровней и случаев, когда высказывание может или не может быть понято. Можно понять, например, все предложения поэмы, философского эссе или математического доказательства практически на всех обсуждаемых здесь уровнях и тем не менее упустить в них главное. По очевидным причинам эти ,,более высокие" уровни понимания не входят в рамки данной статьи. Различные типы непонимания представляют дополнительную иллюстрацию уровней понимания, выделенных выше. Непонимание— это по существу только конкретный тип понимания, при котором H приписывает и внутреннюю репрезентацию, отличающуюся на одном или нескольких уровнях от репрезентации, которую ей следует приписать по намерению говорящего. Легко видеть, что для каждого типа непонимания может быть обнаружен тот уровень, на котором он возникает. Некоторые более конкретные проблемы, встающие при определенных типах непонимания, обсуждаются в разд. 7. С рассматриваемой точки зрения понимание (включая непонимание) можно объяснить как процесс, осуществляющий конкретную функцию отображения воспринимаемой информации в соответствующую внутреннюю репрезентацию. Так, согласно утверждениям (1) — (4), мы имеем следующие функции: (Г) Fi(s) = P (2') F2(s) = S (3') F3(s) = LF (4') F4(s, c) = C Как и раньше, Р, S, LF и С представляют соответственно фонетическую структуру, синтаксическую структуру, логическую форму и контекстуальное значение, a s является акустическим сигналом, в котором воплощается данное высказывание. Наиболее 7-1182 97
важным моментом здесь является то, что функция F4 зависит от двух входных переменных, то есть она переводит s совместно с контекстуальной информацией с в контекстуальное значение С. Интуитивно, по-видимому, ясно, что F1—F4 образуют порядок, восходящий от фонетического к контекстуальному пониманию. Ниже я постараюсь показать, что этот порядок лучше всего рассматривать как импликацию, заключающуюся в том, что вычисление значения Fi обычно предполагает вычисление F,-i при i>l, однако обратный порядок не обязателен. (Это не означает, однако, что построение Р, S, LF и С происходит именно в этом порядке.) Предвосхищая это положение, мы можем определить синтаксическое, семантическое и контекстуальное понимание несколько иначе: (2") F2(s) = <P, S> (3") F3(s)=<P, S, LF> (4") F4(s, c)=<P, S, LF, C> Мне кажется, что различие между F3 и F4 в основном соответствует различию, которое часто проводится—большей частью имплицитно— между восприятием и пониманием речи: изучение первого касается преимущественно процессов, реализующих различные аспекты F3, изучение последнего связано с реализацией F4. Заметим, однако, что различие между восприятием и пониманием, соответствующее F3 и F4, характеризует избранную перспективу исследований, а не обязательно отдельные этапы процессов, обычно участвующих в понимании языка: хотя можно изучать приписывание Р, S или LF данному сигналу s только на основе стимула s, нет никаких причин исключать возможность того, что по крайней мере некоторые компоненты общих фоновых знаний и, следовательно, некоторые фрагменты контекстуальной информации автоматически вовлекаются в данный процесс. Чтобы объяснить различия между прямым и непрямым пониманием, необходимо соответствующее разделение F4. Так как в данной статье проблема непрямой интерпретации затрагивается лишь мимоходом, я не буду вдаваться в детали. На основе всего вышеизложенного достаточно просто определить понятие частичного понимания, опять же по отношению к различным уровням понимания, и соответствующие понятия частичного непонимания и частичного недопонимания. Основная идея заключается в следующем: H понимает и частично на одном из данных уровней, если H приписывает и на зтом уровне неполную репрезентацию. Хотя более реалистическое объяснение обычных ситуаций языкового понимания несомненно требует наличия таких понятий, я воздержусь в данной статье от более детальной их характеристики. БАЗОВЫЕ ПОЛОЖЕНИЯ В этом разделе я сформулирую ряд базовых положений, касающихся процессов языкового понимания, и некоторые следствия, вытекающие из этих положений. 98
Первое положение совершенно бесспорно: процесс языкового понимания обязательно включает приписывание фонетической структуры Р воспринимаемому сигналу s6. Менее очевидны точная природа Р и процессы, с помощью которых она строится. Однако два положения, по-видимому, достаточно ясны. Во-первых, фонетические репрезентации, хотя и основываются на признаках и сегментах, организованы в единицы более высокого порядка, в которых слова (или скорее словоформы) являются перцептивно преобладающими единицами. В той мере, в какой эти единицы строятся из последовательности более элементарных единиц, даже на низшем уровне обработки речевое восприятие не является строго линейно- упорядоченным, а скорее организовано в терминах хранящихся в памяти интегрированных шаблонов. Во-вторых, фонетическая репрезентация содержит важные сигналы или индикаторы, относящиеся к возможной синтаксической организации воспринимаемого высказывания. Наиболее очевидными индикаторами этого типа являются суперсегментные признаки, главным образом ударение и интонация, однако, как показали, среди прочих, Нутебум, Брокс и де Руй (см. Nooteboom, Brokx and de Rooij, 1978), сегментные признаки, такие, как долгота гласных, также вносят свой вклад в определение синтаксической структуры. Суммируя вышесказанное, мы получаем следующее первое положение: (AI) Обычное понимание языка включает отображение речевого сигнала s в фонетическую репрезентацию Р, которая организована в виде последовательности фонетически определенных словоформ и релевантных суперсегментных признаков. Заметим, что (AI) не предполагает, что данное высказывание должно быть фонетически понято в указанном выше смысле до того, как начнется обработка на более высоком уровне. В действительности, построение Р часто будет зависеть от структур более высокого уровня, о чем свидетельствует тот факт, что мы часто понимаем вещи, которых не слышим, и даже вещи, которых нет в речевом сигнале. Идентификация словоформ также обычно сопровождается активацией их лексического значения. Фактически в этом и заключается суть экспериментальных результатов, полученных Марслен- Уилсоном и его коллегами. Ниже я постараюсь показать, что для достижения нормального семантического и контекстуального понимания высказывания это необходимое, но не достаточное условие. Второе положение сводится просто к тому, что понимание языка обычно требует контекстуальной интерпретации С. Не вдаваясь в чревычайно сложные и противоречивые детали относительно истинной природы С, я приму как данное, что контекстуальное значение высказывания должно по крайней мере определять внутреннюю репрезентацию более или менее сложной ситуации и определенное отношение к этой ситуации, выраженное высказыванием. В качестве первого приближения можно считать, что репрезентация данной ситуации—, пропозициональное содержание" высказывания— 7* 99
характеризуется теоретико-множественной структурой, содержащей систему единиц и различные типы атрибутов и операций7. Что же касается предполагаемых пропозициональных установок, то в настоящее время удовлетворительного решения нет8. С учетом этих дополнительных замечаний можно сформулировать второе положение: (А2) Обычное понимание языка включает внутреннюю репрезентацию контекстуального значения С, зависящую от структуры, приписанной речевому сигналу s, и контекстуальной информации с. Структура, приписанная s, включает, кроме фонетической репрезентации Р, синтаксическую структуру S и логическую форму LF. Прежде чем перейти к этим структурам и их связующей роли между s, с и С, я бы хотел пояснить следующий момент: хотя (А2) не предполагает, что полная фонетическая, синтаксическая и семантическая репрезентации должны быть построены до того, как может быть построено контекстуальное значение, построение С в общем случае не может быть строго линейно-упорядоченным в любом разумном смысле этого термина. Это можно показать, например, с помощью референциальной интерпретации местоимений, которая безусловно входит в характеристику С. Рассмотрим предложения (9) и (10): (9) Mary asked Sally where to go, but, you know, she isn't the right person to give a clear answer. 'Мэри спросила Салли, куда идти, но, вы знаете, она не тот человек, который дает четкий ответ'. (10) Mary asked Sally where to go, but, you know, she isn't the right person to wait for an answer. 'Мэри спросила Салли, куда идти, но, вы знаете, она не тот человек, который ждет ответа'. При обычных фоновых знаниях единственный способ понять (9)—это соотнести she с Sally, а единственный способ понять (10) — соотнести she с Магу. Ясно, что такое соотнесение не может быть произведено до тех пор, пока не будет проинтерпретирован предикат give a clear answer 'дает четкий ответ' или wait for the answer 'ждет ответа'. Таким образом, в случаях типа (9) и (10) основные части контекстуального значения не могут быть получены на основе непосредственной линейно-упорядоченной интерпретации. Это явление, конечно, не ограничивается референциальной интерпретацией местоимений. Точно так же интерпретация book 'книга' в (11) в качестве 'типа' или 'экземпляра' возможна только после того, как будет обработано последнее слово предложения9: (И) In preparing the lecture, he badly missed the book, as it was full of important { Pot.e?, 1 ^ ^ insights] 100
'При подготовке лекции ему очень не хватало книги, так как в ней содержалось много ( заметок на полях! важных^ глубоких MbICjieft.J Хотя формулировка (А2) нейтральна в отношении прямой или косвенной интерпретации, но, говоря о (9) — (11), я имею в виду только прямую интерпретацию. Легко видеть, однако, что в огромном большинстве случаев косвенная интерпретация еще труднее поддается строго оперативной обработке в реальном масштабе времени. Я не буду вдаваться здесь в эти проблемы, а перейду к положениям, касающимся связующих синтаксической и семантической структур. Как уже говорилось, я считаю, что синтаксическая структура и логическая форма предложения служат связующим звеном между его фонетической и контекстуальной интерпретацией. В отношении синтаксической структуры это порождает следующее положение: (A3) Понимание естественного языка включает приписывание синтаксической структуры S речевому сигналу s, так, что 5 определяет способ, с помощью которого Р соотносится с логической формой LF. Я склонен рассматривать положение (A3) как очевидное или даже тривиальное. Поскольку оно открыто отрицает утверждение (В) в разделе 1, то я хотел бы подчеркнуть, что существует немало различных случаев, когда приписывание 5 в качестве структуры независимого уровня может быть прямо представлено как обязательное условие для понимания высказывания и. Чтобы только показать один из таких случаев, сравним (12) и (13): (12) The girl you mentioned recently came to the office. 'Девушка, о которой вы упомянули недавно, пришла в контору'. 'Девушка, о которой вы упомянули, недавно пришла в контору'. (13) The girl you mentioned recently has visited the office. 'Девушка, о которой вы недавно упомянули, побывала в конторе'. С соответствующей интонацией, (12) неоднозначно, поскольку recently 'недавно' определяет либо придаточное относительное, либо главное предложение. (Заметим, что эти две интерпретации могут, хотя и не обязательно, выделяться суперсегментными показателями.) Предложению (13), однако, нельзя приписывать вторую интерпретацию, которую можно было бы выразить, например, как (14): (14) The girl you mentioned has recently visited the office. 'Девушка, о которой вы упомянули, недавно побывала в конторе'. 101
Основное здесь то, что приписывание recently к той или иной составляющей в (13) — чисто синтаксическое явление, о чем говорит семантическая правильность предложения (14), и, безусловно, необходимое условие для правильного понимания (13). Приписывание структуры 5 и, следовательно, более детальная характеристика (A3) является, как указывалось выше, главным содержанием большого числа исследований по пониманию языка. Следует указать, однако, что разработанные в связи с этим концепции никоим образом не предполагают построения полной синтаксической структуры до начала семантического анализа. В качестве только одного примера можно привести разработанную в последнее время двухступенчатую систему обработки Фрейзера и Фодора (Frazier and Fodor, 1978), которая хотя и имеет дело только с синтаксическими аспектами понимания языка, однако оставляет возможность проведения последующего параллельного или даже предшествующего семантического анализа. Таким образом, (A3) противоречит утверждению (В), но не (А). Отдельный вопрос: в какой степени утверждение (А), то есть строгая линейная упорядоченность обработки, может быть выдержано по отношению к S. Фодор (Fodor, 1978) рассматривает систематические случаи — приписывание препозиционных Wh-групп их ,,исходным" синтаксическим позициям, что едва ли может быть осуществлено строго линейно-упорядоченной обработкой, и скорее в той или иной форме требует хранения получаемых промежуточных результатов обработки 10. Предложения типа (15) представляют собой еще один пример на то же самое явление: (15) Daruber wunscht sich der Direktor genauer zu informieren, 'Относительно этого директор хочет навести более детальные справки'. Слова, выделенные в этом предложении курсивом, должны быть, как показано в (16), идентифицированы в качестве составляющих подчиненного инфинитивного оборота с тем, чтобы приписать им логическую форму. (16) Der Direktor wunscht (daruber genauer sich zu informieren). 'Директор хочет (относительно этого навести более детальные справки)'. Заметим, что предложение (16), которое выводится из (15) с помощью трансформаций топикализации и перемещения клитики, не является само логической формой предложения (15), но просто клаузальной структурой, в терминах которой организованы в (15) связи между составляющими11. Ясно, что процесс приписывания 5 в подобных случаях не может быть линейно-упорядоченным и требует некоторого вида промежуточной памяти. Хотя граница между синтаксической и семантической структурами в общем случае весьма расплывчата, я приму как данное существование принципиального различия между структурами этих уровней и сформулирую следующее положение: 102
(A4) Понимание естественного языка включает приписывание логической формы LF речевому сигналу s в соответствии с Р и 5, так что LF определяет контекстуальное значение С в контексте с. То, что LF нельзя отождествить ни с синтаксической структурой, ни с контекстуальным значением, видно на простых примерах типа (17): (17) John has only seen him. 'Джон только видел его'. Здесь S определяет, среди прочего, сферу действия или фокус наречия only 'только', а именно глагол see 'видеть'; LF определяет семантические результаты этого приписывания, а именно отрицание того факта, что некто по имени Джон сделал нечто большее, чем (или кроме того, что) увидел лицо, являющееся референтом местоимения him 'его'; а С содержит контекстуально зависимую информацию, чем может оказаться это нечто. Должно быть очевидным, что в той степени, в какой идентификация LF зависит от спецификации S, приписывание LF в общем случае не может производиться строго линейно-упорядоченным способом. Простой иллюстрацией этого служат предложения типа (15). Ниже я постараюсь показать, что приписывание LF часто влечет дополнительные отклонения от строго линейно-упорядоченной обработки. Это утверждение основывается на том факте, что LF ни в коей мере не является последовательностью значений слов (или, скорее, значений лексических выражений), но иногда требует весьма сложных, взаимосвязей, не соответствующих линейному порядку лексических единиц в предложении. Прежде чем перейти к этим проблемам, я сформулирую два положения, дающих определенную перспективу для объяснения и подтверждения положений (A1) — (A4). (А5) Понимание естественного языка есть в высшей степени автоматический и в значительной степени спонтанный процесс. Из этого общего, хотя и очевидного положения, можно вывести следующее утверждение: если верно, что в определенных случаях идентификация синтаксической структуры предложения является необходимым условием для его семантической и контекстуальной интерпретации,— а соответствующие примеры типа (13), (15) и (17) легко умножить,—тогда естественным выводом из (А5) будет то, что синтаксическая структура предложения автоматически вычисляется даже в тех случаях, когда для определения контекстуальной интерпретации предложения ее полная спецификация может и не потребоваться. Сходные соображения безусловно относятся к фонетической структуре и логической форме. Эти рассуждения ни в коей мере не являются странными и искусственными. Скорее это естественное расширение наших знаний, полученных на основе других видов высоко структурированного поведения. По существу именно автома- 103
тический характер приписывания структур делает возможным порождение и восприятие речи, и только на этой основе должны анализироваться все виды процессов деавтоматизации. Более того, эти соображения очень хорошо согласуются с тем широко известным фактом, что при нормальных условиях данные структуры недоступны (или доступны не полностью) для сознательного отображения, точно так же, как обычно не поддаются такому отображению компоненты, в терминах которых организовано видимое поле. Я утверждаю, и докажу это более обстоятельно, что приписывание S, LF и С (и возможно даже Р) в общем случае не является строго линейно-упорядоченным процессом, но требует различных ступеней промежуточного хранения, ведущих к задержкам и ожиданиям. Я не считаю это возвратом к положению (которое отрицалось (А)) о том, что понимание языка проходит все этапы, начиная с Р, через S и LF до С даже в тех случаях, когда решения на ,,более высоких" уровнях зависят от предшествующей информации, полученной на ,,более низких" уровнях. Скорее я предлагаю следующее положение: (А6) Обычное понимание языка есть многоуровневый параллельный процесс, строящий структуры на всех соответствующих уровнях, причем конечный результат—это спецификация структурной интерпретации Р, S, LF, С речевого сигнала s в контексте с. В дальнейшем я попытаюсь сказать нечто более существенное о (А6), тем самым имплицитно проясняя утверждение (С), опровергая утверждение (В) и модифицируя положение (А), представленные в разд. 1. В связи с этим необходимо поставить два вопроса: во- первых, каковы должны быть взаимосвязи операций в процессе параллельной обработки для того, чтобы можно было построить соответствующую структурную интерпретацию речевого сигнала в контексте? Во-вторых, как могут быть согласованы лакуны, возникающие в процессе оперативной обработки, с принципиально последовательным развертыванием входного сигнала слева направо, особенно в тех случаях, когда различные уровни не «синхронизированы»? Ответ на оба вопроса зависит как от структурных, так и от операционных аспектов, которые будут обсуждаться в разделах 4 и 5 соответственно. Более подробно это будет проиллюстрировано на примере, касающемся проблемы определения сферы действия. ХАРАКТЕР СТРУКТУРНЫХ РЕПРЕЗЕНТАЦИЙ Так как любое разумное обсуждение проблем, группирующихся вокруг (А6), зависит, в частности, от характеристики обсуждаемых структур, то здесь уместно сделать несколько замечаний о формальной природе Р, S, LF и С. Для начала я приму, что Р, S и LF структурированы и 104
взаимосвязаны в соответствии с системой грамматических правил и условий G. Это означает, что G определяет результат Fi(s) постольку, поскольку может быть выделен уровень семантического понимания, но это ни в коей мере не предполагает, что G определяет действительные шаги, с помощью которых достигается в конечном счете этот результат. (Я вернусь к этой проблеме в разд. 5). Без какого бы то ни было принципиального обсуждения формы G я просто приму, что эта система состоит из фонологических, морфологических, синтаксических, семантических и лексических правил языка. Предполагаемые знания, представленные этими правилами, фиксируются в процессе языкового усвоения. Далее я приму, что С, так же, как контекст с, принадлежит к области концептуальной структуры и что определение С на основе LF с учетом с управляется общими принципами контекстуальной интерпретации. Переходя к характеристике структурных репрезентаций, определяемых G, я хочу повторить, что Р должна быть истолкована как преимущественно линейная репрезентация фонетических признаков, определяющих сегментную, суперсегментную информацию и информацию о границах, приписанную s в соответствии с правилами и условиями G. Хотя Р включает группировку базовых признаков в терминах сегментов, слогов, фонологических слов и фраз, а также и интонационных оборотов,2, в основе своей она имеет последовательный характер, соответствующий временной протяженности сигнала s. Несмотря на такое весьма тесное соответствие между внешним стимулом s и его внутренней репрезентацией Р, нельзя утверждать, что функция Fi (s) могла бы приписать Р строго линейно- упорядоченным способом, как уже указывалось выше в связи с (AI). Приведу только два примера: Будет ли начальная цепочка конкретного сигнала s иметь вид [hiz], как в (18а), или [hi:+z] (где ' + '—граница между морфемами), как в (18Ь), по-видимому, зависит от информации, которая оказывается доступной лишь после восприятия нескольких последующих слов. (18) (a) His coming to the unexpected, highly informative... 'Его приход на неожиданное, в высшей степени информативное...' (b) He's coming to the unexpected... 'Он подходит к неожиданному...' Точно так же, хотя и по другим причинам, приписывание соответствующей степени ударения первым двум существительным в (19а) и (19Ь), по-видимому, возможно только после того, как будут идентифицированы сочинительная структура и относительное придаточное предложение: (19) (a) The girl, the boy, and a little dog were still waiting. 'Девочка, мальчик и маленькая собачка все еще ждали', (б) The girl the boy was looking for was still waiting. 'Девочка, которую искал мальчик, все еще ждала'. 105
Обратная идентификация свойств Р—безусловно, широко распространенное явление, так как, с одной стороны, структура Р часто не полностью определяется конкретным сигналом s, а с другой стороны, она определяется не только фонологическими правилами G, но частично может зависеть также от морфологических, синтаксических и даже семантических правил и условий. Таким образом, примеры типа (18) и (19) указывают, что даже фонетическая интерпретация сигнала s часто требует большего, чем идентификация последовательности словоформ. Поскольку в последующем обсуждении меня не интересуют специальные проблемы понимания на фонетическом уровне, то в качестве субститута Р будет достаточна обычная орфографическая запись, и ее линейный порядок можно рассматривать как приблизительное соответствие временному параметру s. Переходя к синтаксической репрезентации 5, я буду считать, что в ней в основном представлены два типа информации: во-первых, иерархия составляющих, наложенная на цепочку лексических единиц, фонологическая характеристика которых лежит в основе Р, и, во-вторых, некоторые отношения связанности (binding relations) между конкретными составляющими. S может содержать пустые места, играющие роль в организации составляющих и отношениях связанности, хотя они не заполнены лексическими единицами, фонетически реализуемыми в Р. Для большей конкретности я буду считать, что S может быть представлена в основном в форме поверхностных структур, описанных в работе Хомского (Chomsky, 1977) и в связанных с этим работах. Так, нечто типа (21) будет описанием синтаксической структуры S предложения (20), где одинаковые индексы указывают на упоминаемые выше отношения связанности, а единый элемент е определяет незаполненные места: (20) Who promised you to stay? 'Кто обещал вам остаться?' Репрезентации, как на схеме (21), включают ряд положений, касающихся принципов и деталей, которые требуется прояснить и обосновать в рамках теории синтаксических структур. Для наших целей мы можем ограничиться непротиворечивыми положениями, которые будут обсуждены в надлежащем месте. Общее положение о том, что нечто вида (21) необходимо и достаточно для отражения свойств S, составляет возможность выбора различных типов правил, порождающих S, и соотносящих ее с другими грамматически определенными репрезентациями13. Оно также оставляет открытым вопрос о том, как определяются синтаксические категории, хотя для конкретности я буду считать, что одна из версий Х-теории в том виде, в каком она предложена в Jackendoff, 1977, объясняет общую природу синтаксических категорий. Следует, однако, допустить, что G не только порождает класс синтаксических репрезентаций S, но что ее правила и условия определяют также два отображения: А, отображающее S в Р, и J, отображающее S в LR Отображение Л соотносит S с (одной из) ее фонетических репрезентаций и в основном состоит из морфологических орфогра- 106
(21) S COMP s Щ NPj AUX VP V NP S /4 COMP s NPi VP I II III I Л who e Past promise you e e to stay фических правил (как они рассмотрены, например, в Bierwisch, 1967) и фонологических правил наряду с определенными правилами опущения и фильтрами в смысле Хомского и Лэсника (Chomsky and Lasnik, 1977) 4. На основе A мы можем определить инверсивное отображение А', такое, что А' (Р) — это синтаксический разбор S, приписанный Р на основе G. Очевидно, что ни А, ни его инверсия А' не являются единственными отображениями, их множественность соответствует свободной вариативности в случае А и синтаксической неоднозначности в случае А'. Прежде чем перейти к LF и тем способам, с помощью которых интерпретирующая функция I соотносит LF с 5, я бы хотел добавить два общих соображения относительно природы S и ее соотношения с Р. Первое соображение связано с линейными и нелинейными аспектами S. С одной стороны, S имеет собственный линейный порядок, поскольку ее терминальные элементы—соразмерность определенных морфологических и фонологических согласований— соответствуют линейно упорядоченным частям Р. Формально этот аспект проявляется в том, что S представлена упорядоченным деревом. Благодаря этой упорядоченности, S соотносится с временной протяженностью речевого сигнала s в той степени, в какой с ней 107
соотносится Р. С другой стороны, S собственно выходит за пределы линейного порядка, так как она содержит иерархию составляющих, определяющую отношения доминирования и управления, и включает определенные отношения связанности, приписанные своим составляющим. Следовательно, А отображает линейно упорядоченную иерархию в линейную структуру, тогда как А ' приписывает линейной структуре нелинейные отношения. С точки зрения понимания языка, линейный порядок S может быть более или менее непосредственно выведен из s, тогда как нелинейные свойства должны восполняться на основе грамматических знаний. Все это тривиальные вещи, но мы не должны их забывать, имея в виду утверждение (А), касающееся линейной упорядоченности понимания языка. Менее тривиальное попутное замечание касается отношений между синтаксической и просодической иерархиями. Как упоминалось выше, просодическая информация обеспечивает, даже в пределах Р определенную встроенную иерархию, которая может, хотя и не обязательно, подготовить почву для организации синтаксических составляющих. Кроме того факта, что просодическая и синтаксическая иерархии не совпадают структурно, по-видимому, имеется кардинальное различие в отношении их перцептуального статуса: просодические единицы проявляются, вообще говоря, в доступных для восприятия свойствах речевого сигнала—основной частоте, распределении энергии, паузах—тогда как синтаксические составляющие и отношения являются в основном абстракцией в том смысле, что они непосредственно не соотносятся с сенсорной информацией. Простыми примерами в этом плане являются неоднозначность предложения типа (22) или минимальные пары типа (23),5: (22) (a) [s John will [Vp buy [Np the book] [PP for Susan]]] '[s Джон [vp купит [np книгу] [pp для Сьюзэн]]]' (b) [s John will [vp buy [Np the [N book [PP for Susan]]]]] (23) (a) WhOi did you expect [s ei to stay at the meeting] 'Ktoi вы ожидали [s ej останется на собрании]' (b) WhOi did youj expect [s ej to see ei at the meeting] 4KorOi Bbij ожидали [s ej увидеть ej на собрании]' Ситуация вполне ясная в случаях типа (23): кроме различий между [stey] и [si:], здесь нет никакого противопоставления в фонетической репрезентации, которое соответствовало бы синтаксическому различию двух предложений. В случае (22) дело обстоит несколько сложнее, так как можно было бы попытаться увидеть факультативное фонетическое различие, соответствующее различной организации составляющих этих двух прочтений. Но даже если и существует такая возможность, предполагаемое различие не является обязательным. Другими словами, имеется по крайней мере один систематический способ реализации, при котором различию в организации составляющих в (22) не соответствует никакое систематическое свойство s16. 108
Второе замечание относительно S и ее соотношения с Р вызвано тем фактом, что грамматические описания обычно постулируют различные промежуточные уровни структурной репрезентации. Так, фонологическая теория Хомского и Халле (Chomsky and Halle, 1968), которую я принял в качестве основы для определения Р, допускает исходный фонематический уровень репрезентации, промежуточный между синтаксической и фонетической репрезентациями. Дополнительные шаги должны быть приняты во внимание. Отсюда возникает вопрос: почему только Р и S постулируются в качестве структур, релевантных для понимания языка? Я бы хотел в отношении этого сделать три замечания. (i) Р и S (так же, как LF и С) должны быть признаны необходимыми уровнями репрезентации, характеризующими структурные аспекты нормального, автоматического понимания языка. Это, однако, не исключает возможности того, что дополнительные аспекты структурной организации могут оказаться релевантными. (ii) Хотя вид репрезентации, разработанный в рамках порождающей лингвистики, дает наиболее приемлемую точку отсчета для характеристики аспектов языкового понимания, a priori нет необходимости идентифицировать Р или S только с одним уровнем репрезентации при порождении, определяющем структуру высказывания и в соответствии с G. Так, Р может в основном соответствовать системной фонетической репрезентации в смысле Хомского и Халле (Chomsky and Halle, 1968), включая, однако, дополнительную информацию относительно характеристик, которые являются отражением фонематических инвариантов в отличие от свободных или условных вариантов. Сходные соображения относятся к S и ее соотношению с поверхностной грамматической структурой17. Короче, внутренние репрезентации, релевантные для процессов понимания языка, не обязательно должны находиться во взаимнооднозначном соответствии с уровнями репрезентации, постулируемыми для наиболее эксплицитной спецификации структурных свойств и отношений выражений данного языка. (Дальнейшие комментарии см. в разд. 5.) (iii) Какие бы поправки в смысле (i) ни оказались необходимыми, я считаю Р и S уровнями организации, которые необходимы и, вероятно, достаточны для объяснения структурных свойств нормального понимания на синтаксическом уровне. Особый статус этих двух уровней объясняется относительно общими организационными свойствами, особенно собственным линейным характером структуры Р, соответствующим ее сенсорным (и моторным) коррелятам, и абстрактным иерархическим характером 5, наложенным на ее терминальную цепочку. Должно быть очевидным, что рассуждения типа (i) — (iii) сходным образом применимы к LF и С и их отношению к соответствующим уровням грамматических дериваций. Переходя к LF, в качестве исходного пункта я приму, что ее формальная характеристика должна минимально отклоняться от стандартной логики предикатов. Это, конечно, скорее эвристическая 109
ориентация, чем обоснованное утверждение, однако она имеет ряд преимуществ. Во-первых, она предоставляет достаточно наглядную рамку как для формальных свойств, так и для референциальной (или, скорее, контекстуальной) интерпретации. Во-вторых, она позволяет до поры до времени избежать множества все еще не решенных проблем, касающихся деталей логической формы и семантической структуры естественных языков, оставив открытым вопрос, до какой степени и в каком направлении должна быть расширена стандартная версия логики предикатов. В-третьих, в качестве экспериментального направления она ограничивает до предела теоретический аппарат, отрицая его случайную выразительную силу. Придерживаясь этой ориентации в качестве эвристической основы, сделаем следующее более конкретное утверждение. В соответствии с главным свойством логики предикатов, LF основывается на функциональной структуре, то есть на отношениях функтор- аргумент, объединяющих элементарные единицы в единицы более высокого порядка. Это предполагает категоризацию элементарных и сложных единиц с помощью соответствующих категорий функтора и аргумента, которые наиболее естественно выражаются в терминах некоторой версии категориальной грамматики Айдукевича (Ajdukiewicz, 1935). В качестве иллюстрации рассмотрим такую систему категорий: (24) (а) п и р — базовые категории (для имен и пропозиций соответственно) ; (Ь) если Со, Си ...,ск — категории, то <co/ci...ck> — категория k-местного функтора, который на основе аргументов, относящихся соответственно к категориям с и ..., с к, строит сложную единицу, относящуюся к категории Со- Семантические атомы LF являются либо константами, либо переменными в обычном смысле, представленными в последующем изложении соответственно прописными и строчными буквами. В качестве примера рассмотрим (27) как первое приближение к логической форме предложения (25), синтаксической структурой которого является (26): (25) Who promised you to melt the gold? 'Кто обещал вам расплавить золото?' (26) [s whoi [s ei Past [vp promise you [s ei to melt the gold]]]] [(27) — см. схему на след. стр.—Прим. ред.] Из этой огрубленной схемы должно быть очевидно, что (24) определяет то, что можно было бы назвать синтаксисом LF. Она накладывает категоризованную иерархию на элементарные единицы LF. Более того, она требует связывания переменных в соответствии с обычными принципами теории кванторов. К рассматриваемому вопросу в (27) относится WHICH*—некоторый вид квантора, который связывает первые аргументы предикатов PROMISE и MELT. Как можно видеть при сравнении (26) и (27), существует довольно 110
(27) WHICH x PAST x PROMISE YOU x MELT THE GOLD «p/p>/n> n <p/p> n «p/n>/np> n n «p/n>/n> <n/<p/n» <p/n> тесное соответствие между S и LF в отношении иерархии и отношений связанности18. Существует, однако, ряд кардинальных различий. Прежде всего, составляющие S в общем случае не совпадают с композиционной структурой LF, как мы это увидим ниже в ряде соответствующих случаев19. Во-вторых, 5 и LF, по-видимому, различаются в отношении природы категорий, даже если имеются уровни, на которых составляющие соответствуют друг другу. Так, в то время как who 'кто' в S является именной группой наравне с you 'вы' или the gold 'золото', ее интерпретация WHICH* в LF является пропозициональным оператором, который имеет довольно отличный категориальный статус. Можно было бы легко привести другие различия, которые должны объясняться различными принципами, лежащими, с одной стороны, в основе организации составляющих S и, с другой стороны,—в функциональном характере LF. 111
Третье различие является, возможно, наиболее важным в данном контексте. Как уже указывалось, S имеет свойственный ей линейный порядок, то есть формально она основывается на системе связей. В отличие от нее LF образует иерархию, в которой линейный порядок отсутствует и, таким образом, формально основывается на системе множеств. Таким образом, тогда как последовательный порядок в синтаксических деревьях отражает собственно свойство репрезентируемых структур, порядок в семантических деревьях — просто выбор нотации. Поэтому (28а)—(28 с) представляют одну и ту же LF: (28) (а) [р[пДЖОН] [<р/п> [п МЭРИ] [«Р/п>/п> ЛЮБИТ]]] (b) [р[пДЖОН] [<р/п> [«Р/п>п> ЛЮБИТ] [п МЭРИ]]] (c) [Р[ <p/n> [<<р/п>/п> ЛЮБИТ] [п МЭРИ]] [п ДЖОН]] Утверждение, что в LF не существует порядка слева направо, подтверждается рядом фактов. Например, один из них: предложения типа (29) и (30) несмотря на различия их синтаксических структур должны иметь в основном одну и ту же логическую форму, чему наиболее естественно удовлетворяет чисто иерархическая структура LF: (29) Who* will youj try [sej to sell ei the book] 'Кому! Tbij постараешься [sej продать ei книгу]?' (30) Wemi willst duj [sejei das Buch zu verkaufen] versuchen 'Кому* Tbii [sejei книгу продать] собираешься?' Обсуждение других аспектов нелинейной природы LF содержится в (Wexler and Culicover, 1980)20. Последствия, связанные с характером понимания языка слева направо, будут рассмотрены ниже. Необходимо упомянуть еще три пункта относительно природы LF. Первый относится к семантическим атомам LF и к степени разложения лексических единиц, которая должна быть постулирована. До сих пор я в общем отождествлял семантические атомы с лексическими единицами. Так вот, лексические единицы характеризуются семантическими отношениями, которые, среди прочего, играют основную роль в идентификации слова, как это ясно показывает один из главных выводов, полученных в работах по лексическому доступу. Сейчас обсуждается два способа отразить эти отношения: (а) использование постулатов значения и (Ь) компонентный анализ. В соответствии с (а) семантические атомы LF являются значениями лексических единиц, взаимодействующими на основе сложной системы аксиом или правил, определяющих логические выводы, которые могут быть выведены из предложений, содержащих эти лексические единицы. В соответствии с (Ь) лексические единицы разлагаются на более элементарные единицы, и именно эта композиционная структура определяет данные семантические отношения и с помощью того же самого символа— потенциальные логические выводы. Подход (а) решительно отстаива- 112
ет Фодор (см. Fodor, 1975 и следующую его работу)21, тогда как подход (b) присущ большинству лингвистических работ по семантическому анализу. Одну из последних, тщательно разработанных версий, можно найти, например, у Миллера—Джонсона-Лэрда (Miller and Johnson-Laird, 1976). К тому же следует заметить, что эти два подхода не являются взаимоисключающими, то есть можно предположить, что постулаты значения должны соотносить семантические атомы, даже если они в общем случае представляют собой не значения лексических единиц, а компоненты этих значений. [...] Второй момент, который необходимо отметить в связи с LF, касается различия между частями, называемыми обычно ассерцией и пресуппозицией. Не вдаваясь в длинную и сложную дискуссию, связанную с этой проблемой22, я просто выдвину следующие два положения: во-первых, логическая форма LF высказывания и состоит из пары [PR, AS], где PR — пресуппозиция, a AS—ассерция и. И PR, и AS являются категоризованными иерархиями семантических атомов LF в указанном выше понимании. Во-вторых, PR может рассматриваться как сложное условие, определяющее класс контекстов с, которые допускают контекстуальную интерпретацию С высказывания и. Интуитивно можно сказать, что PR связывает и с определенными свойствами контекста, релевантными для интерпретации и. Например, мы можем перефразировать (34) примерно как (35), где (а) и (b) приблизительно выражают пресуппозиционную и ассертивную части (34): (34) Mike also has problems with him. 'У Майка тоже с ним сложности'. (35) (a) Someone other than Mike has problems with him. 'Некто, отличный от Майка, имеет с ним сложности', (b) Mike has problems with him. 'У Майка с ним сложности'. Эти наметки даже отдаленно не предполагают адекватного объяснения проблемы пресуппозиций, но они могут объяснить некоторые аспекты определения сферы действия, предпринятое ниже23. Третий и последний пункт, связанный с LF, должен быть упомянут только для полноты. До сих пор все замечания о структуре LF—включая различия в пресуппозиции и ассерции — относились к пропозициональному содержанию, которое следует отличать от направленных на это содержание различных видов отношений или намерений; последние, по-видимому, тоже должны быть выражены в высказывании. Некоторые мысли по поводу этих проблем содержатся в: Bierwisch, 1980b. Поскольку я не собираюсь рассматривать ту особую роль, которую это различие может играть при понимании языка, я опускаю рассуждения на эту тему. Заключая свои замечания относительно LF, я добавлю два комментария, касающихся отображения I, соотносящего S с LF. Во-первых, как уже упоминалось, я буду считать, что это отображение определяется правилами грамматики G. Говоря более конкретно, 8-1182 113
I определяют два множества правил. Первое множество — это просто система лексических правил, связывающих фонологическую матрицу с ее синтаксическими характеристиками и семантической интерпретацией. В рамках компонентного анализа таким правилом будет правило, соотносящее melt с (31). Соответствующее правило в рамках постулатов значения просто переведет melt в смысловой атом LF, а именно MELT. Второе множество включает различные типы правил, оперирующие на синтаксически организованных структурах. Это множество включает интерпретирующие правила для преференции в смысле Хомского (Chomsky, 1977 и др.), условия на связанность и правила лямбда-конверсии, совместно порождающие композиционную иерархию LF на основе синтаксической репрезентации S. Детали зависят от конкретной организации G, которую здесь нет необходимости обсуждать. Во-вторых, из предшествующего изложения ясно, что I отображает упорядоченную категоризованную иерархию синтаксических элементарных единиц на неупорядоченную иерархию семантических атомов. Другими словами, тогда как А — отображение S в Р—соотносит цепочку с иерархией, I соотносит упорядоченную иерархию с неупорядоченной. Я перехожу, наконец, к замечаниям, касающимся контекстуальной интерпретации С. Скорее это будут лишь наброски, потому что, во-первых, кроме общих рассуждений, мы располагаем здесь весьма малым числом положений, которые были бы ясны настолько, чтобы стать общепринятыми, и, во-вторых, потому, что я не собираюсь обсуждать специальные проблемы, связанные с контекстуальным пониманием. С интересует меня в той степени, в какой она помогает и даже необходима в прояснении понимания на более ,,низких" уровнях24. Как упоминалось выше, С не входит в сферу действия G, то есть она не принадлежит к уровням лингвистической структуры. Это означает, что С может содержать элементы и отношения, которые не определяются грамматическими правилами и знанием языка. Тем не менее, поскольку С явно участвует в спонтанном процессе контекстуального понимания, должно существовать систематическое взаимодействие между грамматикой и теми правилами и условиями, которые в своей основе определяют структуру С. Некоторые предварительные соображения о статусе и характере С содержатся в моих замечаниях о ,,ситуационной структуре" (Bierwisch, 1980 с); более конкретно об этих структурах, называемых автором ,,ментальными моделями", говорится в книге Джонсона- Лэрда (Johnson-Laird, 1980). В общем плане С может быть приписана некоторая теоретико- множественная структура, которая, вообще говоря, не является иерархией или деревом. Я считаю это одним из главных отличий С от LF. В качестве иллюстрации вообразим себе, например, что на уровне ментальных моделей объекты или лица представлены сущностями (возможно сложными), которым могут быть приписаны свойства, отношения и т. п. Положим далее — и это выглядит вполне разумно,— что на указанном уровне любое конкретное лицо пред- 114
ставлено лишь один раз, независимо от того, как часто к нему осуществляется референция, в скольких ситуациях он участвует и т. д. Это положение присуще, между прочим, концепции теоретико- модельной семантики, формальный аппарат которой может быть взят в качестве первого приближения формального объяснения понятия ментального мира и ментальной модели. Учитывая эти положения, очевидно, что для предложений типа (36) С содержит только одно упоминание лица, с которым соотносятся John и himself 'сам'. В LF, как показано в (37), к этому лицу осуществлено по крайней мере четыре референции: (36) John expected to be able to nominate himself. 'Джон ожидал, что он сможет выставить свою кандидатуру'. (37) [For x=JOHN] [х EXPECT [х BE ABLE[x [NOMINATE x]]]] '[Для х=ДЖОН] [x ОЖИДАЕТ [jc СМОЖЕТ [x ВЫДВИГАТЬ КАНДИДАТУРУ jc]]]] Ясно, что какой бы ни был выбран формат репрезентации для С, она не может быть иерархической структурой, если она, с одной стороны, должна соответствовать множественности условий, содержащихся в (37), а с другой — свести различные случаи референции, связанные с этими условиями, к одному и тому же лицу, к одной сущности. Следовательно, С должна быть организована в терминах теоретико-множественной структуры обобщенного типа. Независимые аргументы, основывающиеся на интерпретации кванторов и определенных дескрипций и приводящие к тому же самому результату, содержатся в: Johnson-Laird and Garnham, 1980. Сказать, что ментальные модели не являются деревьями,— и, естественно, линейно не упорядочены,— это значит никак не прояснить, чем же они являются. Ответ на этот вопрос потребовал бы, в частности, объяснения, каким образом эти модели соотносятся со зрительными и другими моделями восприятия, спецификации тех ментальных операций, которым они подвергаются25, и выяснения онтологического статуса этого уровня репрезентации. Все это выходит далеко за пределы настоящей статьи и далее не рассматривается. Следует добавить, однако, еще одно замечание. Уровень репрезентации, о котором идет речь, релевантен не только для С, но и для спецификации контекста с. Это означает, что контекст с, в котором должно быть проинтерпретировано высказывание и, является ментальной репрезентацией, даже если за контекстуальную интерпретацию ответственна реальная, ,,внешняя" ситуация. (В таких случаях— это ментальное отражение внешней ситуации, функционирующее как релевантный контекст с). Даже предварительные размышления показывают, что это не просто методологический прием, объединяющий действительные, фиктивные, прошедшие, будущие и все другие типы предполагаемых контекстов; фактически это означает, что мы можем осуществлять референцию к действительной ситуации только при условии создания ментальной структуры, интерпретирующей эту ситуацию. 8* 115
Наконец, мы должны постулировать отображение V, которое соотносит логическую форму LF высказывания и с его контекст- туальной интерпретацией С в контексте с. В основном V определяется принципами референции и денотации, которые обусловливают интерпретацию констант и переменных LF, принимая во внимание композиционную структуру LF. Мы можем предположить, что V должно быть развито, по крайней мере частично, в соответствии с положениями теоретико-модельной семантики, которая определяет условия истинности и уместности для LF по отношению к некоторой модели, в данном случае — с, представляющей собой релевантную модель. С этой точки зрения V является функцией, отображающей LF и с в С, то есть V (LF, с)=С, где С—либо конфигурация внутри с, либо конфигурация, добавляемая к с26. Рассматривая композицию LF в терминах пары [PR; AS], мы можем более конкретно предположить, что V(PR, с) определяет конфигурацию в с, называемую обычно прагматической пресуппозицией, тогда как V(AS, с) определяет то, что должно быть добавлено к с или изменено в с. Следовательно, в некотором смысле V(AS, с) определяет новую информацию высказывания в контексте с. Другими словами, V(PR, с) — это структура, которой удовлетворяет PR в с, a V(AS, с) — структура, определяемая в соответствии с с, которая потенциально обогащает или модифицирует с. Заметим, между прочим, что, по-видимому, V(LF) и особенно V(PR) интуитивно кажутся гораздо более конкретными, чем LF или PR. Имеется в виду конкретизация квантифицированной переменной. Рассмотрим снова в качестве примера предложение (34), прессуппо- зицией которого является (35а). Большинство контекстов породит прагматическую пресуппозицию, которая обеспечивает конкретную референцию к лицу, отличному от Майка. Предложение (35с) могло бы быть парафразой одной из таких возможностей: (34) Mike has also problems with him. 'У Майка тоже с ним сложности'. (35) (a) Someone other than Mike has problems with him. 'Некто, отличный от Майка, имеет с ним сложности', (с) The speaker and the addresse have problems with him. 'Говорящий и слушающий имеют с ним сложности'. Хотя это весьма туманные высказывания о природе V, вероятно, их можно сделать точными в терминах обычных принципов приписывания значения переменной, денотации и уместности. Следует заметить, однако, что V должно опираться также на менее установленные принципы. Для иллюстрации рассмотрим предложения типа (38) или (39): (38) (a) I left the university about ten in the morning. 'Я ушел из университета около 10 утра', (b) I left the university in the early sixties. 'Я ушел из университета в начале шестидесятых'. 116
(39) (a) He badly missed the book, as it was full of notes. 'Ему очень не хватало книги, так как в ней было много заметок на полях', (b) Не badly missed the book, as it was full of insights. 'Ему очень не хватало книги, так как в ней содержалось много глубоких мыслей'. В (38а) университет должен быть проинтерпретирован как физический объект, в (38b) — как учреждение. Параллельное различие применимо к уходить, которое относится к физическому действию в (38а) и к изменению социального окружения в (38b). Хотя на концептуальном уровне университет и уходить — это четко различающиеся сущности, они, безусловно, не являются лексически неоднозначными в том смысле, например, как bank 'берег', 'банк' или post 'пост', 'почта'. Следовательно, все предложение Я ушел из университета является однозначным, но его интерпретация С различается в зависимости от контекста, причем его смысл зависит от того, упоминается ли в контексте час или год. Аналогичные рассуждения применимы к интерпретации книга в (39). Проблема, иллюстрируемая этими примерами, имеет много последствий, правильное решение которых абсолютно не ясно. Некоторые рассуждения на этот счет содержатся в Nunberg, 1979. Должно быть очевидным, однако, что если здание и учреждение концептуально различны (и, следовательно, различаются в С), а университет лексически однозначен и, следовательно, не различается в LF, то V должно отразить это различие в интерпретации. Поэтому V должно основываться не только на принципах референции и денотации, но также на принципах, которые можно было бы назвать концептуальной спецификацией. Заметим, между прочим, что эти принципы опять же не допускают строго линейно-упорядоченной интерпретации: вопрос о том, какая из интерпретаций должна быть приписана словам уходить и университет в (38) или книга в (39), не может быть решен до тех пор, пока мы не дойдем до конца предложения27. Наконец, я хочу указать, что в соответствии с общими характеристиками LF и C,V должно быть отображением неупорядоченных иерархий в теоретико-множественные структуры, не являющиеся ни упорядоченными, ни иерархическими. Другими словами, тогда как при I теряется линейность, при V разрушается древесная структура. Суммируя эти длинные — хотя все еще весьма неполные — замечания, мы получаем следующие общие характеристики структурных репрезентаций, соответствующих уровням понимания, представленным в (1)—(4) в разд. 2: (40) Р: последовательность (пучок) фонетических признаков, сгруппированных в более крупные перцептуально воспринимаемые единицы (такие, как слог, фонологическое слово, интонационная группа). (41) S: категоризованное, упорядоченное дерево, наложенное на синтаксические формативы, которые соответствуют пос- 117
ледовательностям Р (включая пустую цепочку е) и связаны отношениями связности. (42) LF: категоризованное, неупорядоченное дерево, наложенное на семантические атомы, которые являются либо константами, либо переменными, организованными в виде функтор-аргументных отношений с переменным числом связей. (43) С: теоретико-множественная структура, не подлежащая упорядочению и условиям, налагаемым на деревья, детерминированная внутренней онтологией ментального мира (чем бы это ни оказалось). Опуская интересные в других отношениях детали, можно схематично представить общие характеристики, наиболее важные с точки зрения линейной упорядоченности обработки: (44) Р S LF С линейная упорядоченность да да нет нет древесная структура нет да да нет Не забывая о большом упрощении данной схемы, мы можем сказать, что при понимании языка происходит перевод строго линейной, последовательной во времени структуры через иерархиза- цию—сначала упорядоченную, затем неупорядоченную — во вневременную пространственно-неупорядоченную репрезентацию. Хотя положение это тривиально, оно имеет важные последствия для объяснения процесса понимания языка. (Тривиально характеристики инверсионного отображения определяют порождение речи). Перевод этих структур, как указывалось выше, детерминирован отображениями А, I и V. Мы можем в терминах этих отображений перестроить функции F2, F3, Fa из раздела 2 следующим образом: (45) (a) A'(P)=S (b) I (S)=LF (c) V (LF, c)=C Вставив эти отображения в F 2, F3, F л, мы получаем: (46) Fi(s)=P(cm. (Г), выше) (47) F2(s)=A'(F,(s))=S (48) Fi(s)=I(A'(Fi(s)))=LF (49) F4(s, c)=V(I(A'(Fi(s))), c)=C Анализируемые таким образом, F2, F3, F4 автоматически превращаются в F2, F3, Fi, поскольку все предшествующие (или ,,более низкие") уровни репрезентации должны быть идентифицированы, с тем, чтобы применить правила, образующие следующие отображения. (Следует помнить, что полный процесс построения этих отображений может породить промежуточные ступени между Р, S, LF и С, которые, однако, по-видимому, не релевантны в качестве отдельных репрезентаций при понимании языка). 118
ГРАММАТИКА И ОБРАБОТКА ИНФОРМАЦИИ Несмотря на то, что многие проблемы остаются, а другие требуют дальнейшего прояснения, предположим, что нечто, сходное с рассмотренными в предыдущем разделе репрезентациями и отображениями, требуется в качестве концептуального каркаса для объяснения процесса понимания языка. Даже если бы были добавлены все недостающие детали и возможные коррекции, этот каркас сам по себе не мог бы объяснить процесс понимания языка, поскольку репрезентации Р, 5, LF и С так же, как и отображения А (или — в данном случае—А'), I и V, являются чисто структурными сущностями и отношениями, которые, безусловно, следует отличать от реальных процессов, с помощью которых они производятся или идентифицируются. Это возвращает нас к старому и постоянно возникающему вопросу о соотношении компетенции и употребления или грамматики и обработки информации28. По крайней мере после выхода работы Фодора и Гаррета (F о d о г and Garrett, 1966) ясно, что любая попытка идентифицировать грамматические правила с этапами обработки обречена на неудачу. Судьба так называемой деривационной теории сложности (ДТС), с помощью которой пытались объяснить степень сложности понимания в терминах количества трансформаций, является наиболее явным примером такой неудачи29. На основе этого наблюдения Фодор и Гаррет приходят к выводу об абстрактности отношений между грамматикой и обработкой. Почти ничего не добавляя по существу этого утверждения, я заменю его следующим, слегка конкретизированным положением: (А7) Грамматика G определяет потенциальные объекты для уровней понимания языка и структурных отображений между ними. Другими словами, при условии, что фонетическое, синтаксическое, семантическое и контекстуальное понимание участвуют в спонтанной обработке — положение, требующее подтверждения на независимой эмпирической и теоретической основе,— G определяет структуру и отображения, в конечном счете реализуемые соответствующими процессами. (Более точно это положение будет сформулировано ниже.) С данной точки зрения прояснение соотношения между грамматиками и процессами обработки равносильно задаче определения механизмов, операции которых должны контролироваться грамматически определенными структурами и отображениями. Мне кажется, что большинство работ, появившихся после того как была доказана несостоятельность ДТС и сходных концепций, лучше всего понимаются в этом русле. Относительно строгая программа для этой цели могла бы быть сформулирована следующим образом: (D) Существуют такие механизмы Mi—М4, что М\ реализует Fi, М2 реализует А', М3 реализует I и М4 реализует V. 119
Задача, если принять (D), состояла бы в определении различных характеристик Мь М2, Мз и М4 и их возможного взаимодействия. Отметим прежде всего, что (D) не требует, чтобы синтаксический анализ был закончен до начала семантической интерпретации и т. п., поскольку можно предположить, что различные механизмы работают параллельно. Таким образом, (D) согласуется с утверждением (А) (хотя, безусловно, противоречит как (В), так и (С)). Объясню кратко, почему я считаю (D) неверным. Рассмотрим предполагаемый механизм Mi, отвечающий за интерпретацию s в терминах Р. При нормальных условиях идентификация Р предполагает, конечно, лексический доступ, организующий Р как последовательность словоформ. Однако лексические правила, как бы они ни отличались в деталях, безусловно, предоставляют не только фонетическую, но и синтаксическую и семантическую информацию. Так как синтаксическая категоризация релевантна для S, а семантические свойства лексических единиц составляют часть отображения J, было бы абсурдным постулировать механизмы Мг и М3, реализующие А и I независимо от Mi. Поэтому я полагаю, что А, I и V, несмотря на свои существенные различия (последние были рассмотрены выше), не могут быть реализованы строго независимыми механизмами обработки. Заметим, между прочим, что (D) — отнюдь не фиктивное утверждение, приведенное только для того, чтобы легче было опровергнуть утверждаемое. На самом деле большинство работ, моделирующих механизмы обработки, нужно считать попыткой определения Мг, которое переводит Р (или, скорее, последовательность словоформ) в S. В частности, в различных версиях грамматики расширенных сетей переходов (ATN) довольно детально разработаны механизмы, проясняющие способы, с помощью которых правила структуры составляющих (и даже определенные трансформации) могут контролировать реальный процесс отображения цепочек в категоризованные деревья. В той степени, в какой грамматики ATN разрабатываются как частичные модели реальных процессов понимания языка, они ограничены программами типа (D), по крайней мере в отношении Mi . Не обсуждая больше технических аспектов грамматик ATN, например спорной адекватности магазинной памяти как части обрабатывающей модели, я просто скажу, что нет особых оснований полагать, как указано в (D), что понимание языка осуществляется с помощью отдельных механизмов. В качестве хорошо известной проблемы упомянем различия в степени сложности восприятия предложений типа (50) и (51), которое не может быть объяснено в терминах грамматик ATN: (50) The teacher who the boy you visited mentioned left. букв. 'Учитель, о котором мальчик, которого вы посетили, упомянул, ушел'. (51) The ice cream that the boy you mentioned bought melted, букв. 'Мороженое, которое мальчик, о котором вы упомянули, купил, растаяло'. 120
Хотя оба предложения трудно понять по чисто синтаксическим причинам, (51) в какой-то мере легче поддается обработке, так как вложенные конструкции легче выделяются на семантической почве31. Чтобы объяснить эти и подобные, менее искусственные явления, необходимо отказаться от идеи независимых механизмов, осуществляющих фонетическую, синтаксическую, семантическую и контекстуальную интерпретацию. Необходимо подчеркнуть, однако, что спорный вопрос о независимых обрабатывающих механизмах в смысле (D) не следует путать с автономностью грамматики G и ее различных компонентов. Вполне возможно, что правила грамматики G образуют в рассмотренном смысле модульные автономные системы, как, например, в Chomsky, 1980а, которые определяют объекты для различных типов обработки, в то время как операции обработки осуществляют различными способами интеракцию между уровнями структурной организации. Такая возможность по существу изначально заложена в самом противопоставлении компетенции и употребления. Прежде чем перейти к вопросу, как заменить (D) альтернативными понятиями, я приведу некоторые соображения относительно способа, каким временные характеристики обработки соотносятся с пространственными характеристиками различных типов репрезентаций, суммированных в (44). Начнем с общего, весьма неопределенного и почти тривиального положения (А8): (А8) Любая операция обработки О характеризуется реальным интервалом времени t. Две операции 01 и О2 связаны временным отношением, если существует такой интервал t, что t=t1t2. Это положение может быть уточнено по нескольким направлениям. Оно ничего не говорит о характере и сложности Оi, порядке величины ti, степени вариативности операционного времени или о ряде других параметров. Оно оставляет также открытым вопрос, следуют ли связанные временным отношением операции просто одна за другой или они в каком-то смысле связаны операционно. Данное положение просто соотносит операции с временными координатами и определяет понятие временной последовательности операции. Все это тривиальные вещи. (Отметим, однако, что нечто типа (А8) предполагается всеми видами хронометрического анализа.) Менее тривиальна проблема определения набора возможностей для параллельной обработки: последовательности операций могут частично или полностью совпадать, они могут расщепляться на две и более параллельных последовательности, параллельные последовательности могут быть независимыми, а могут и зависеть друг от друга— все это наиболее очевидные возможности. Даже поверхностная систематизация потребовала бы дополнительных понятий, кроме понятия временной связанности. Я не буду здесь вдаваться в эти проблемы, а просто буду считать, что временной порядок играет решающую роль во всех этих случаях. Теперь можно прямо соотнести временную упорядоченность 121
операций обработки в случае (А8) с линейным характером Р и 5. По крайней мере для меня это наиболее приемлемый, если не единственный способ истолковать понятие обработки слева направо (которое было принято в (А) (см. разд. 1)). Это не означает, однако, что данное соотношение просто и очевидно32. Оставляя в стороне запутанные детали, мы тем не менее имеем ряд принципиальных проблем, из которых две особенно важны: во-первых, соотношение нелинейных, в том числе иерархических, аспектов структуры и временной упорядоченности обработки и, во-вторых, соотношение хранения или памяти с временным характером обработки. Рассмотрим эти проблемы по очереди. С логической точки зрения существует два способа связать линейную обработку с нелинейной структурой: (52) Последовательная обработка. Операции просматривают (или строят) нелинейную структуру в последовательном порядке, соответствующем определенным условиям линеаризации. (53) Параллельная обработка. Операции просматривают (или строят) нелинейную структуру параллельно в соответствии с определенными условиями интеракции. В качестве иллюстрации рассмотрим структуру типа (54), которая могла бы быть обработана либо в соответствии с (52), то есть так, как указано в (55а), либо в соответствии с (53), как указано в (55Ь): (54) (55) (а) 1.5 В (55) стрелка с индексом / представляет операцию О, с интервалом времени *,. Любая стрелка указывает на результат операции О,. Так, результатом 0\ в (55а) и Oij в (55Ь) является идентификация (или построение) D, а результатом Оъ и Ог\ — 122
идентификация В и ее связей с D и Е. Из последнего условия следует, что О21 может быть применена только после O1.2. (Следовательно, определенное временное отношение определено даже для параллельной последовательности Ou, O2.J и О3.k в (55b); к этой проблеме мы еще вернемся.) В зависимости от ,,содержания" различных операций можно представить себе другие способы обработки (54), согласующиеся либо с (52), либо с (53). Возможно даже объединение параллельной и последовательной обработки, например, последовательная обработка DEFG и параллельная—узлов ВС А (в таком порядке)33. Заметим, что ни (55а), ни (55Ь) не предполагают действительной процедуры для обработки синтаксического или семантического дерева. Они предназначены лишь для иллюстрации принципов (52) и (53). Следует указать, однако, что грамматики ATN в основном являются реализацией (52), их операции определены таким образом, что результирующая цепочка представляет собой скорее (55с) (см. прим. 33), чем (55а)34. Необходимо сделать четыре следующих замечания. Во-первых, при применении к упорядоченному дереву (или к любой другой линейно упорядоченной иерархии) последовательность(-и) временных интервалов операций как для (52), так и для (53) может по-прежнему соотноситься с линейным порядком терминальных элементов и, следовательно, с временной координатой s. Соотношение это гораздо менее непосредственное, чем для чисто линейных структур, но принципы вполне очевидны35. Во-вторых, и (52), и (53) можно распространить на неупорядоченные деревья; основное различие при этом заключается в том, что последовательность операций тогда не детерминирована линейными свойствами обрабатываемой структуры. Однако поскольку само понятие обработки по сути своей связано с протяженностью во времени, на структуру будет налагаться определенный порядок благодаря способу, которым она будет обрабатываться. Это относится, безусловно, как к последовательной, так и к параллельной обработке. Это положение требует дальнейшего развития. В настоящий же момент я просто укажу, что последовательность операций может быть частично определена линейными свойствами других структур, обработка которых влияет на обработку неупорядоченных структур. В частности, линейные аспекты S могут вызывать нечто типа вторичной линейности LF в соответствии с интеракцией операций на том и на другом уровнях. Именно в этом смысле следует понимать то, что интуитивно значение первых слов высказывания воспринимается раньше, чем значение более поздних слов, хотя в самой LF такого упорядочения смысловых компонентов нет. (В действительности, как мы увидим ниже, все не так просто, как кажется интуитивно.) В-третьих, ни (52), ни (53) не ограничены деревьями. На самом деле, оба способа обработки могут быть обобщены на произвольные структуры, согласно содержанию имеющихся операций. Это могут быть, в частности, структуры, предположительно предложенные для С (и ментальных моделей вообще). Очевидно, что замечания, сделанные выше относительно линеаризации, справедливы и при таком обобщении. В-четвертых, обобщение 123
(52) и (53) на произвольные структуры включает также две или более структуры, которые соотносятся с помощью структурно определенных отображений. Следовательно, оно включает не только LF и С, но даже полные структурные репрезентации <Р, S, LF, О, уровни которых соотносятся с помощью отображений А, I и V, как описано в разделе 436. Ниже мы в основном будем опираться на это понятие, которое, конечно, требует соответствующих характеристик предполагаемых операций. Я несколько раз говорил о понятии ,,содержание операции О", которое сейчас требует некоторых пояснений. Не претендуя на серьезную полную теорию операций обработки, следует признать в качестве необходимого—но ни в коей мере не достаточного— определения то, что результатом О является некоторое изменение внутреннего состояния обрабатываемой системы. Точнее, результатом О может быть добавление или опущение некоторой единицы А и/или установление связи А с другими единицами. Это, естественно, предполагает, что внутренние состояния должны характеризоваться в терминах единиц и отношений. Я считаю, что это утверждение настолько неопределенно и общо, что едва ли может быть опровергнуто какой бы то ни было попыткой придать смысл понятию обработки. Я буду называть изменение, к которому приводит О, объектом (target) О. На этой основе положение (А7), определяющее отношение между грамматикой и процессом обработки, может быть уточнено следующим образом: (А7') Объект операции О, участвующий в обработке языка, определяется единицей или конфигурацией внутри структуры, детерминированной грамматикой G. Так, объект операции Ох в (55а) будет определен D, объект Оъ — [вDE], принимая во внимание, что G определяет (54) как возможную репрезентацию. Положение (А7') достигает двух целей. Во-первых, оно в какой- то степени более точно определяет, как должны соотноситься грамматика и процесс обработки. Во-вторых, оно ограничивает операции, участвующие в обработке языка, теми изменениями, которые могут быть определены в терминах грамматических атомов (или скорее, чтобы включить С—грамматических и концептуальных атомов). Другими словами, хотя возможны участвующие в обработке языка операции, объекты которых не могут быть определены грамматически, они не являются операциями обработки языка. Скорее они либо части рассматриваемых операций (которые тогда являются сложными операциями в другом отношении), либо они являются операциями сопутствующих процессов (таких, как,скажем, выяснение эмоционального состояния говорящего в зависимости от определенных параметров s). Следующий шаг в направлении конкретизации—осознание того факта, что для достижения своего объекта О может зависеть от определенных условий. Так, Оъ в (55а) так же, как Огл в (55Ь) в 124
качестве условия достижения объекта [в DE] должны иметь D и Е. Следовательно, О характеризуется в обязательном порядке своим объектом и факультативно—своим условием. Это ведет к следующему, более полному определению: (56) Операция О определяется парой <ОС, ОТ>9 где ОС— условие, а ОТ—объект О. Мы будем называть пару <ОС, ОТ>, где ОС может быть пустым, структурным содержанием О. На основе (56) мы можем модифицировать (А7) следующим образом: (А7") Содержание операции О, участвующей в обработке языка, определяется структурной конфигурацией, детерминированной G. Характеризация, приведенная в (56), формально близка понятию продукций, которые получили широкое распространение после важной работы Ньюэлла и Саймона (Newell and Simon, 1972), особенно в подходах к когнитивным процессам, разрабатываемым в искусственном интеллекте (AI). На самом деле, так как мы ничего конкретно не сказали об ОС и ОТ (кроме того, что они могут быть определены в структурных терминах), формально даже грамматические правила удовлетворяют (56). Поэтому важно подчеркнуть различие между операциями обработки и грамматическими правилами, лежащее в основе (А7"). Правила определяют структурные свойства и отношения и не имеют никаких временных характеристик, тогда как операции подчинены реальному ходу времени . Мне кажется, что настойчивая тенденция не замечать этого различия является одной из глубоких концептуальных ошибок в исследованиях по искусственному интеллекту. Отметим далее, что структурное содержание, как оно определено в (56), не характеризует операцию полностью для всех случаев. В общем случае О достигнет своего объекта ОТ на основе определенного входа или причины, который не должен автоматически отождествляться с условием ОС Ясный пример, относящийся к данному вопросу,— отображение s в Р. Каковы бы ни были элементарные операции, они должны быть ослаблены для обработки сенсорного входа s, который, по определению, не может быть определен в грамматических терминах. Так как я не преследую цели дать полную характеристику операции, я просто укажу на неполноту (56), не вдаваясь в формальные детали. Важнее в настоящий момент определить связь между операциями с привлечением понятий условия и объекта, которую можно представить следующим образом: (57) 0} операционно связана с Oi, если объект Ох входит в условие Oj. Заметим, что операционная связь независима от временной связи, представленной в (А8) (см. выше), хотя существует связь между интервалами времени операционно связанных операций. Эта взаимосвязь может быть определена так: 125
(58) Если Oj операционно связана с О/, то ti предшествует t\. Мотивация для (58) является очевидной, что было уже продемонстрировано выше. Заметим, что операционно связанные операции не должны быть обязательно связанными по времени, что можно видеть на простом примере (55а): Оъ операционно связана с Ох (она предполагает объект О О, хотя между ними вклинивается операция О 2, нарушающая их временную связь. Несколько более сложно обстоят дела с операционно связанными операциями при параллельной обработке. Для иллюстрации привлечем еще раз (55Ь), релевантную часть которой представляет здесь (59): (59) ^ в 2.1 УЧ > D > Е ^ F ^ G *- 1.1 1.2 1.3 1.4 1.5 О2.1 операционно связана с O1.1 и О1.г и по времени—с 01.г. Кроме O2.1, с O1.2 связана по времени (хотя, конечно, не операционно) О и, что является сутью параллельной обработки. Что можно сказать об О2.2? Она, конечно, связана операционно и с Ou, и с Охл и, кроме того, по времени — с 01.4- Чего мы пока не можем объяснить, так это интуитивного убеждения, что О2.2 должна быть связана со своей „предшественницей" Огл для того, чтобы достичь параллельной обработки в предполагаемом смысле3 . По-видимому, характеризовать О должны не только ОС и ОТ, но и то состояние, при котором О начинает действовать. Это вполне естественное утверждение, которое непосредственно может быть добавлено к предыдущему: (60) Операция О характеризуется тройкой <OS, ОС, ОТ>, где ОС и ОТ определены в (56), a OS есть (частичная) характеристика начального состояния О. Если мы переопределим „структурное содержание О" как тройку <OS, ОС, ОТ>, то (60) сразу же переносится на (А7"). Опять же я полагаю, что OS определяется в структурных терминах грамматикой G. С этой поправкой О22 при предполагаемых связях будет охарактеризовано тройкой <В, FG, [cFG]>. Итак, для того чтобы соотнести грамматические структуры, характеризующиеся различными формальными измерениями, с временными характеристиками обработки, мы ввели систему О операций О, охарактеризованных в (60) и соотносящихся со временем и структурой, как указано в (А7") и (А8). 126
Прежде чем оставить эту тему, я добавлю три общих замечания. Во-первых, конечно, О представляет собой почти аморфную совокупность, разрешающую любые виды абсурдных операций. Интересно, однако, что один из способов ограничить ее каким-то разумным образом указан в (AT): структурное содержание допустимых операций определено G. Таким образом, ограничения на G автоматически предполагают ограничения на О. Это условие, все еще довольно неопределенное, может по крайней мере наметить подход к объяснению фундаментального утверждения Хомского о том, что теория употребления должна включать в качестве своей составной части теорию компетенции. Во-вторых, дальнейшие ограничения на О можно произвести в терминах общих условий на допустимые операции, независимо от соответствующих типов структур. Время, сложность и пространство обработки указывают предполагаемые параметры таких общих условий39. Они должны были бы быть подтверждены эмпирическими данными, что, однако, не может быть сделано независимо от G, поскольку, хотя О и характеризуется независимыми свойствами, она всегда связана со структурными условиями, определяемыми G (или другими системами когнитивных структур). В-третьих, О может структурироваться (и тем самым быть скорее обогащенной, чем ограниченной) в зависимости от таких свойств, как относительная сила или вероятность операций, объясняющая предпочтительную или даже стереотипную последовательность операций. Это порождает вполне реальную возможность объяснить ряд различных, хотя, вероятно, связанных между собой явлений, которые зависят от лингвистических структур, но не могут быть обоснованно отнесены к лингвистической (или какой-либо другой) компетенции. Начать с того, что перцептивные стратегии, в том смысле, в каком они рассмотрены Бивером (Вever, 1970), легко могли бы быть истолкованы как более или менее интегрированные последовательности операций. Другой момент—это то, что относительно большое количество явлений афазии естественно подразделяется на различные типы дезинтеграции или интерференции в пределах частей обрабатывающей системы О, не предполагая при этом утраты или нарушения G. Я не могу дальше развивать эти положения, которые сами по себе заслуживают серьезнейшего рассмотрения, и упомянул их только, чтобы указать дальнейшие перспективы в этом направлении. Возвращаясь к главной теме соотношения временных характеристик и различных типов структурных репрезентаций, я бы хотел повторить, что мы различаем два случая: (a) Линейность структуры: временная упорядоченность обработки в общем соотносится со связями в структурных репрезентациях. (b) Упорядоченность обработки: временная упорядоченность обработки вызывает переход линейной упорядоченности в репрезентации, структурно неупорядоченные. 127
Случай (а) относится к Р и S, за важными исключениями, которые мы немедленно рассмотрим. Случай (b), с другой стороны, относится к LF и С. Он, безусловно, влечет за собой следующий вопрос: какой порядок вызывается и как. Необходимо различать два фактора. Во-первых, в нелинейных репрезентациях имеются некоторые следы структурной упорядоченности. Они детерминируются операционными связями и их соотношением с временными интервалами, как отмечено в (58). Так, например, Он должна была бы следовать за 0\.\ и 0\.г в нашем примере (59), даже если (59) рассматривается как неупорядоченная иерархия, именно потому, что ОС операции Огл требует предварительной идентификации D и Е в том или ином порядке. Назовем этот фактор „внутренним условием". Второй фактор будет соответственно „внешним условием". Он вступает в дело при отсутствии внутреннего условия именно потому, что операции должны быть связаны друг с другом некоторым временным отношением. Так, если мы рассматриваем (59) как неупорядоченную структуру, Ом и Oi.2, которые не связаны операционно, могут быть применены в любом порядке40. Какой в конце концов будет порядок, никак не зависит для (59) от какого бы то ни было внутреннего структурного условия. Отвлекаясь на время от проблемы хранения и отображения, представим себе, что понятие неупорядоченной репрезентации равносильно возможности того, что она будет обработана альтернативными порядками, которые эквивалентны внутренним условиям. Так, если мы рассмотрим функциональное выражение f(a), где /—функтор, а а—аргумент, то совершенно равносильными будут случаи, когда вначале идентифицируется /, которое применяется затем к а, или когда вначале идентифицируется а, а затем к нему применяется /. Именно в этом смысле LF и С, но не S, неупорядочены. Суть здесь заключается в том, что LF является объектом внешних условий на порядок обработки, если мы рассматриваем LF изолированно от других структурных репрезентаций; однако эти условия превращаются во внутренние условия, как только мы рассматриваем LF в качестве значения структурно определенной функции J, отображающей S в LF. Чтобы понять, о чем идет речь, достаточно рассмотреть / в той степени, в какой оно определено лексическими правилами. Если мы продолжаем придерживаться того положения, что идентификация слова W есть (сложная) операция, объектом которой являются фонетические, а также синтаксические и семантические свойства W, тогда, безусловно, структурная линейность Р и S становится внутренним условием на порядок обработки <Р, S, LF, О, а, следовательно, также LF и С. Таким образом, как следствие структурной линейности мы получаем даже для LF и С хотя бы частичный порядок обработки слева направо. Основная идея этого соображения почти тривиальна, однако ее детали весьма сложны, как это будет видно из следующего раздела. В заключение при обсуждении структурной упорядоченности и порядка обработки я рассмотрю понятие линейно-упорядоченной обработки. Мы имеем здесь дело, конечно, с метафорой, заимство- 128
ванной из лексикона вычислительных наук. Она означает приблизительно то, что входной сигнал и процесс его обработки происходят одновременно. Определение ее в данном контексте, однако, не очень ясно. Ради доказательства я приму поэтому более конкретное понятие, заключающееся в том, что если имеются промежуточные операции, требующие сохранения предшествующих результатов для последующей обработки, то обработка перестает быть линейно- упорядоченной. Говоря более конкретно, меня интересует то, что может быть названо ,,строго линейно-упорядоченной обработкой" (strict on-line processing), приблизительно в следующем смысле: (61) О, является операцией, строго следующей за цепочкой Oi, ..., Оj-i, тогда и только тогда (a) когда О, связана временным отношением с 0,--i и (b) если Oi операционно связана с некоторой операцией 0} при l^j<i, то не найдется ни одной операции О к при k>j, такой, что О, не связана операционно с О*. (62) Цепочка операций Oi, ... Оп является строго линейно- упорядоченным процессом тогда и только тогда, когда О, является строго последующей операцией в отношении Оi-\ при Ki^n. Условие (61а) ясно; условие (6lb) исключает все промежуточные операции из строго линейно-упорядоченной обработки. Если представить это по-другому, то строго последующая операция может собирать любое число объектов, достигнутых в процессе предшествующих операций, пока отсутствуют операции, объект которых нерелевантен для строго последующей операции. Идея заключается в том, что строго линейно-упорядоченная обработка не разрешает обработку каких бы то ни было данных, нарушающих операционные связи. Хотя (62) относится только к последовательной обработке, она легко может быть расширена на параллельную обработку, например, таким образом: О является строго линейно-упорядоченной операцией тогда и только тогда, когда все параллельные цепочки операций, составляющие О, являются строго линейно-упорядоченными. Мы ввели довольно специальное понятие, которое может быть модифицировано несколькими способами. Хотя оно не является эмпирическим утверждением, оно может быть использовано при объяснении некоторых эмпирических данных. Один из интересующих нас моментов следующий. С одной стороны, данная структура (такая, как наш простой пример (54)) может быть обработана несколькими различными способами, причем некоторые из них являются линейно-упорядоченными, другие — нет41. Возникает эмпирический вопрос, имеет ли язык и в какой степени (например, в отношении сложности операций) тенденцию быть строго линейно- упорядоченным при наличии альтернатив. С другой стороны, существуют структуры, которые вообще не разрешают никакой строго линейно-упорядоченной обработки. Это опять же эмпирический 9-1182 129
вопрос, касающийся соотношения между структурами естественного языка и условиями обработки. Случаи связывания, как в (63), являются очевидными примерами: (63) Whoi did youj expect [ej to see e* at the meeting]? 'Когоi выj ожидали [ej увидеть ei на собрании]?' Операция, идентифицирующая и устанавливающая связь el9 имеет в качестве своего условия местоимение whoi и, таким образом, операционно связана с операцией, от которой отделена большим числом промежуточных операций. То же самое относится к е}. Все это достаточно очевидно, и мы могли бы прийти к тому же заключению, не привлекая определений типа (61). Однако имеются более интригующие случаи, которые, как мы увидим ниже, демонстрируют те же свойства. Переходя далее к трудной проблеме памяти при обработке, я ограничусь тремя общими замечаниями, поскольку практически ничего не могу добавить к обширной литературе по различным аспектам памяти, которая к тому же в большой степени основывается либо на технологических, либо на интуитивных метафорах при интерпретации самого понятия памяти. Первое замечание: То, что результат понимания высказывания должен в том или ином виде храниться в памяти, является логической необходимостью. Это просто вытекает из того факта, что по крайней мере некоторое время в сознании находится нечто, чего там не было до обработки высказывания. Однако в отношении того, что сохраняется и как долго, существуют важные различия. Так, как показали Джервелла и Херман (Jarveil a and Herman, 1972), буквальное воспроизведение, основанное на сохранении в памяти Р (или Р и S?), возможно в общем случае только для предложения, услышанного последним. Для других уровней репрезентации используются другие условия. Может быть так, например, что LF сохраняется только на время самой обработки. Мне кажется, что соображения такого типа являются разумным объяснением вышеприведенного утверждения (В) о том, что в процессе понимания языка не строится отдельно синтаксическая и семантическая репрезентации: они не играют независимой роли при хранении и поиске. Мне нет нужды углубляться в детали, так как я не затрагиваю здесь специальных проблем припоминания4 . Второе замечание: Кроме хранения в памяти, в целях возможного припоминания, в процессе понимания необходима также промежуточная память, функция которой обычно называется оперативной памятью. Очевидно, что все процессы, которые не являются строго линейно-упорядоченными в определенном выше смысле, в основном опираются на промежуточную память. Если оперативную память в этом смысле требуется отличать от кратковременной памяти, то это невозможно сделать в терминах объема памяти или временных характеристик, что можно видеть на примерах типа (64): (64) Horti der Pianist... noch vor der Probe Г zu uben auf ei 1 die Bander an e; 130
{'Перестал ли упражняться] „„__ „ »0> {Слушает ли пленку } пианист пеРед Репетицией? Здесь многоточие может быть заполнено придаточными относительными произвольной сложности, увеличивающими расстояние между отдельными частями hort и auf/an немецких слов aufhoren 'переставать' и anhoren 'слушать'. Следовательно, время, которое требуется для оперативной памяти, может легко превысить, например, время, обычно допустимое для дословного припоминания. Другими словами, данное различие может быть проведено только в терминах структурных и/или процессуальных характеристик43. Предпочтительная идея в этом плане — охарактеризовать оперативную память в терминах магазинной памяти или других достаточно ограниченных видов памяти. В отличие от этого, другие предложения, например Арбиба и Каплана (Ar bib and С ар Ian, 1979), основываются на некотором виде ничем не ограниченного полного дисплея44. Хотя я скептически отношусь к метафоре магазинной памяти, у меня нет никаких конкретных соображений на этот счет, за исключением того, что для многочисленных случаев отклонений от строго линейно-упорядоченной обработки должна быть гарантирована промежуточная память. Третье замечание. По-видимому, в качестве необходимого допущения должно быть взято нечто типа полного или симультанного дисплея, по крайней мере в отношении ментальных моделей (то есть уровня с и С), разрешающего ряд обращений к памяти при обработке последующих (частей) высказываний. Хотя совершенно не ясно, чем должен быть этот «внутренний дисплей» (опять метафора!), он, по-видимому, играет решающую роль в понимании языка. (В качестве некоторой иллюстрации см. разд. 7, ниже.) По существу, внутренняя репрезентация, представленная в утверждении (В) как результат понимания языка, может быть наиболее осмысленна в терминах такого типа свободно доступного дисплея. Заметим, что все три аспекта памяти, о которых я говорил,— кратковременная память для припоминания и распознавания, оперативная память и симультанный дисплей — отличаются от того, что обычно называют долговременной памятью. Они тесно взаимосвязаны в терминах операций обработки, но мне нечего по этому поводу добавить, кроме положений, уже содержащихся в (А7) и его уточнениях. Теперь мы готовы сформулировать понятие отдельных обрабатывающих механизмов, альтернативное принятому в (D). Основная идея такова: функция Fi определяет уровни структуры и их взаимосвязи, построенные в процессе понимания высказывания и, основывающегося на сигнале s с учетом контекста с. Эти уровни структурной репрезентации строятся с помощью параллельной обработки, которая является насколько возможно строго линейно-упорядоченной в отношении s, с и содержания используемых операций. Чтобы сформулировать эту мысль более точно, я введу следующие вспомогательные понятия: 9* 131
(65) Fa (s, с) является максимальной в отношении к G и V тогда и только тогда, когда она содержит все спецификации, которые совместимы с s, с и G, и принципы референции и денотации, составляющие отображение V. Так, если Fi(s) является фонетической репрезентацией слова W, то F'4(s, с) максимальна, если она состоит из фонетических характеристик W, его синтаксической категоризации, его лексического и контекстуального значения с учетом с. Например, если F\(s) является фонетической формой именной группы типа some of the boys 'некоторые мальчики', то максимальная Fi обеспечивает также ее полную синтаксическую, семантическую и контекстуальную репрезентацию в той степени, в какой они могут быть определены на основе s, с, G и V. Следует обратить внимание на два момента. Во-первых, F'4(s, с) может в некоторых отношениях быть неполной. Эта проблема будет рассмотрена ниже. Во-вторых, нет необходимости в том, чтобы F'4 была однозначно определена даже при учете конкретного контекста, хотя многие неоднозначности будут сняты при обращении к с. Чтобы не затемнять обсуждение этой проблемы, проигнорируем на время проблемы неоднозначности. Как мы увидим, они в конечном счете могут быть сведены к частному случаю предыдущего положения. Предположим далее, что s — начальная часть s', то есть существует некоторое s", такое, что s'=ss". Тогда мы определим полноту следующим образом: (66) F'4(s, с) является полной по отношению kG, V и s' тогда и только тогда, когда максимальная Fifa, с) не модифицирует и не производит дальнейших спецификаций в F'4(s, с). Некоторые уточнения требуются еще для объяснения понятия модификации и определения специфики репрезентации, но суть (66) должна быть достаточно понятна: F4 обладает полнотой тогда и только тогда, когда она не затрагивается обработкой последующих частей высказывания. Отношение между полнотой и максимальностью очевидно: (67) Для любой начальной части s сигнала s ' : если F'4(s, с ) характеризуется полнотой в отношении к G, V, s\ то она максимальна по отношению к G, V, однако обратное не обязательно. Все случаи, которые по структурным причинам не могут быть обработаны строго линейно-упорядоченным способом, содержат примеры начальных частей, которые могут быть максимальными, но не могут быть полными. Мы рассмотрели немало таких примеров. Рассмотрим, например, последний — случай (64): Fi не может обладать полнотой для всех начальных частей, пока не будут идентифицированы отдельные префиксы auf или an (и, следовательно, лексические единицы aufhoren или anhoren)45. В определении полноты ничего не говорится о том, в какой момент обработки она 132
достигается. Так, пропущенный префикс можно ожидать достаточно рано благодаря роли с и по крайней мере он будет предсказан при обработке инфинитива zu uben. Это ведет к более эксплицитной формулировке той идеи, что понимание языка является, насколько это возможно, линейно- упорядоченным : (А9) F\(s, с) обычно максимальна, но не обязательно характеризуется полнотой для любой начальной цепочки s поступающего сигнала s ' высказывания и. Данная формулировка—это эмпирическое утверждение, которое, если оно правильно, ставит ряд условий для любой теории, пытающейся объяснить процесс понимания языка. Однако оно не очерчивает такой теории. Скорее оно может удовлетворить различные теоретические модели, выдвигающие конкретные положения о свойствах оперативной системы О, о памяти и дисплее и, конечно, о G и V. Положение (А9), строго говоря, не исключает утверждения (D), но оно не является объектом тех возражений, которые могут быть выдвинуты против (D) и фактически развиты в нескольких направлениях, несовместимых с утверждением об автономности обрабатывающих механизмов. Два последних замечания. Во-первых, определения в (65) и (66) легко можно расширить на ,,более низкие" уровни понимания, определяемые Fi, Fi и F3. (А9), соответственно, выполняется также для случаев внеконтекстного, чисто синтаксического или семантического понимания. Во-вторых, мы можем объяснить неоднозначность на основе понятия полноты следующим образом: любая неоднозначность при интерпретации начальной части и, которая отбрасывается при обработке последующих частей и, равносильна конкретному типу спецификации, которая, таким образом, делает полной Fi данной части. Обобщая это положение, можно сказать, что (А9) предполагает, что понимание языка является насколько возможно однозначным. определение сферы действия В этом разделе я вкратце проиллюстрирую предыдущие положения на несколько более замысловатых примерах структурных ограничений на строго линейно-упорядоченную обработку. А именно, я разберу два случая, подпадающих под понятие сферы действия. По практическим соображениям я ограничусь анализом F3, то есть в основном не буду учитывать роли контекстуальной интерпретации. Понятие сферы действия взято из логики, где оно характеризует область действия операторов типа отрицания, кванторов и модальных операторов. В терминах функциональной структуры, которую мы приняли для LF в разд. 4, можно дать следующее определение: (68) А является сферой действия В в LF тогда и только тогда, когда А относится к категории а, В относится к категории <b/а> и [ВА] относится к категории Ь. 133
Это определение обобщает понятие сферы действия, поскольку включает, например, аргумент(ы) предиката; как бы то ни было, это обобщение естественно во всех релевантных отношениях. Понятие сферы действия, таким образом, относится к LF, однако сфера действия может быть определена также для S, с тем, чтобы она могла быть применена обычным способом. Это можно сделать следующим образом: (69) х является сферой действия у'а в S тогда и только тогда, когда I(S)=LF, a A и В—соответствующие отображения х9а и у'а в LF при I, и А является сферой действия В в LF. Сложность здесь заключается в том, что в естественном языке дерево LF в общем случае не совпадает с деревом S и, таким образом, определение сферы действия превращается в весьма запутанную проблему, включающую два уровня. Возьмем, например, предложения (70а) и (70Ь), имеющие одну и ту же синтаксическую структуру и отличающиеся только модальными словами сап 'может' и must 'должен'. Их LF различаются, однако, таким образом, что они представляют собой почти синонимы, как показывают парафразы (71а) и (71Ь): (70) (a) John cannot distribute the monograph. 'Джон не может распространить монографию', (b) John must not distribute the monograph. 'Джон не должен распространять монографию'. (71) (a) It is not possible for John to distribute the monograph. 'Для Джона невозможно распространить монографию', (b) It is necessary for John not to distribute the monograph. 'Для Джона необходимо не распространять монографию'. Интуитивно ясно, что в (70а) модальный глагол находится в сфере действия not, а в (70Ь) отношение обратное. Это чисто идеосинкрати- ческое свойство английских модальных глаголов, и для нас оно важно по двум причинам. Во-первых, хотя различие в сфере действия глаголов сап и must зависит от самих этих лексем, оно не может быть представлено ни на уровне только словоформ, ни на уровне полной синтаксической репрезентации S. Скорее здесь включается S и ее отображение в LF. (Заметим, между прочим, что не помогло бы также утверждение о том, что предметом обсуждения является построение С на основе цепочки слов, так как проблема именно и состоит в определении того, как С зависит от Р.) Следовательно, вопреки утверждению (В), 5 и LF широко участвуют в процессе понимания языка. Во-вторых, в то время как синтаксическая и семантическая сферы действия глагола must приблизительно совпадают, они различаются в отношении порядка и иерархии у глагола сап. Релевантные части S и LF следующие: 134
(72) (a) S: [... can not [...] ...] LF: [... NEG [CAN [...]] ...] (b) S: [... must not [...] ...] LF: [... MUST [NEG [...]] ...] Решающий момент заключается в том, что (72а) не может быть построена строго линейно-упорядоченным способом, так как not следует за словом, входящим составной частью в сферу его действия. Заметим, что проблема возникает не потому, что S и LF различаются порядком — в LF порядка как такового нет,— а скорее потому, что у них разные иерархии сфер действия. Другими словами, F'i для John cannot... не может обладать полнотой, даже если она максимальна. Можно возразить, что все это несущественные проблемы, поскольку сап и not расположены рядом и при стяжении могут быть даже объединены в одну единицу can't. Однако то же самое явление обнаруживается при любом числе вставленных составляющих. Рассмотрим следующие примеры: (73) (a) John can distribute only the monograph. 'Джон может распространить только монографию', (b) John must distribute only the monograph. 'Джон должен распространить только монографию'. Основное отношение—между модальными глаголами и лексемой only 'только', содержащей элемент отрицания, как показывает близкая ей парафраза nothing but 'ничего, кроме'. Этот отрицательный элемент имеет ту же сферу действия в LF, что и обычное not. Так, используя приблизительные парафразы, такие, как в (71), получаем (74): (74) (a) It is not possible for John to distribute anything but the monograph. 'Для Джона невозможно распространить что-либо, кроме монографии', (b) It is necessary for John to distribute nothing but the monograph, букв. 'Джону следует распространить ничего, кроме монографии' *. Как показывает (74а), в (73а) сап находится в сфере действия (части) only. На самом деле, для понимания (73а) важно сознавать, что отрицание применяется к модальности. В этом примере, однако, рассматриваемые элементы не являются более соседями, а промежуточных составляющих между ними может быть гораздо больше: (75) John can distribute the monograph you are so urgently looking for only once. 'Джон может распространить монографию, которую вы так настойчиво ищете, только один раз'. * В русском языке должно быть двойное отрицание 'Джону не следует распространять ничего, кроме монографии'.— Прим. перев. 135
Как мы увидим ниже, проблема осложняется еще и тем, что only не только требует определения сферы действия своего отрицательного компонента, но и порождает пресуппозицию для всего предложения. Вообще определение сферы действия является непременным условием понимания языка. Рассматриваемое явление в основном зависит от взаимодействия S и LF, или, говоря точнее, от отображения S в LF. Следовательно, вопреки утверждению (В), как 5, так и LF неизбежно участвуют в понимании языка. Более того, синтаксические и семантические сферы действия (как они определены в (68) и (69)) в естественном языке могут и не совпадать. Расхождения между ними обычно ведут к нарушению строго линейно-упорядоченной обработки; наиболее простой случай — пример (72а). А это вызывает упомянутую вначале частичную модификацию (А). Считая эти заключения не требующими доказательств, я при рассмотрении других случаев определения сферы действия покажу, что это не периферийные странности, а одна из центральных проблем понимания языка. В этом отношении наиболее часто обсуждаемая проблема — интеракция сфер действия кванторов. Я, однако, не буду вторгаться в эту область, а рассмотрю две проблемы, одна из которых гораздо проще, а другая гораздо сложнее, чем сферы действия кванторов. Я дал довольно общее определение сферы действия, так что в нее включаются все виды функтор-аргументных структур в LF. Весьма простым случаем этого типа являются атрибутивные прилагательные, как в green chair 'зеленый стул' или rapid move 'быстрое движение'. Опустив тонкости, нерелевантные для обсуждаемой проблемы, мы можем представить S и LF сочетания the green house 'зеленый дом' следующим образом46: (76) S: [Np[Det the] [n[a green] [N house]]] (77) LF: [n[ <n/cn> THE] Lcn|_ <cn/cn> GREEN] [en HOUSE]]] Так, chair 'стул' входит в сферу действия green 'зеленый', a green house—в сферу действия the. Пока сферы действия в S и LF полностью параллельны. Рассмотрим далее прилагательные типа big 'большой', tall 'высокий', narrow 'узкий' (и вообще так называемые „относительные прилагательные"), которые предполагают сравнение с определенной нормой или стандартом. Так, large house 'большой дом' означает нечто типа house larger than the average 'дом, больший, чем средний дом', при этом норма или стандарт обеспечивается определяемым именем. Первое упрощенное приближение к LF сочетания the large house — S которого идентична S в (76) при замене green на large — будет (77а): (77а) [n THEcn[<cn/cn> LARGER THAN AVERAGE HOUSE] [он HOUSE]]] Эта структура основывается среди прочего на лексическом правиле для large, семантическая часть которого представляет собой приблизительно (78): 136
(78) x [ [ LARGER THAN [ AVERAGE x ] ] x ] < cn/cn > При применении (78)* к значению слова house лямбда-конверсия порождает сп -часть в (77а)47. Здесь можно сделать два интересных наблюдения. Во-первых, F3 начальной части the large... должна быть неполной, так как переменная, обозначающая стандарт, не может быть конкретизирована до идентификации слова house. Во-вторых, в данном случае это не препятствует возможности строго линейно- упорядоченной обработки, так как внутренняя структура large, как она дана в (78), не соотносится последовательно с частями s. Таким образом, несмотря на нетривиальное соотношение синтаксической и семантической сфер действия, между ними нет расхождений. Ситуация меняется, когда мы рассматриваем случаи типа the large green house 'большой зеленый дом'. Фактически здесь выделяются два варианта, различающихся в отношении S и LF и факультативно— в отношении Р. Они отличаются и орфографически: (79) (a) the large, green house (b) the large green house * На схеме опущена связь между верхней левой категорией <<cn/cn>/cn> и расположенной в центре схемы <сп/сп>.—Прим. редакции. 137
Несколько упрощая положение, можно сказать, что (79а) относится к дому, большому и зеленому, а (79Ь)—к дому, который больше, чем другие зеленые дома. Опуская нерелевантные детали, представим S и LF для (79а) и (79Ь) как соответственно (80) и (81): (80) S: [np the [n[a large] [A green] [N house]]] LF: [„ THE [[LARGER THAN [AVERAGE HOUSE]] [GREEN HOUSE]]] (81) S: [np the [N [a large] [fl[A green] [N house]]]] LF: [„ THE [[ LARGER THAN [AVERAGE [GREEN HOUSE]]] [GREEN HOUSE]]] Так же, как в примере the large house, F\ начальной части the large... не обладает полнотой. Но теперь дальнейшая строго линейно- упорядоченная обработка невозможна, и причины этого для (80) и (81) различны. Возьмем сначала „сочинительный" пример (80). Хотя второе определение green не влияет на спецификацию переменной х в семантике large, его наличие требует, чтобы данная промежуточная единица была обработана, хотя результат ее обработки не является объектом операции, идентифицирующей отсутствующую спецификацию х. Другими словами, идентификация стандарта, с которым производится сравнение, откладывается из-за промежуточного однородного определения. Возьмем следующий, „подчинительный", пример (81). Здесь green участвует в срецификации рассматриваемой переменной, но только как определение к house. Оно находится в сфере действия large, но само является функтором, в сферу действия которого входит house. Это вложение сфер действия ведет к двум логически возможным способам обработки. Первая возможность—это сначала объединить large и green в сложный функтор, который затем можно будет применить к house. Вторая возможность—сначала применить green к house, а затем результат подставить на место переменной в large. [...] Те же самые проблемы, что имеют место в (79), возникают и в случаях, когда промежуточные составляющие имеют разную степень сложности: (84) (a) The large, frequently visited house of Lord Nobody. 'Большой, часто посещаемый дом лорда Никто', (b) The large, gorgeous, but ridiculous house of Lord Nobody. 'Большой, пышный, но нелепый дом лорда Никто'. Переходя к весьма сложным вопросам определения сферы действия even 'даже', only 'только', also 'также' и ряда соответствующих частиц, я ограничусь основными проблемами, имеющими отношение к обсуждаемым вопросам48. Соответствующие факты могут быть проиллюстрированы следующими примерами: (85) (a) John even visited Mary. 'Джон даже посетил Мэри'. 138
(b) John didn't even visited Mary. 'Джон даже не посетил Мэри'. Место ударения является основным условием для интерпретации этих предложений. Их значение было бы другим, если бы ударение падало на Mary, а не на visit. При указанном месте ударения значение может быть перефразировано следующим образом: (86) (a) John visited Mary, although it was less likely for him to visit her than to x her. 'Джон посетил Мэри, хотя для него было менее вероятным посетить ее, чем х ее', (b) John didn't visit Mary, although it was less likely for him not to visit her than not to x her. 'Джон не посетил Мэри, хотя для него было менее вероятным не посетить ее, чем не х ее'. Частица even добавляет к значению предложения, в котором она содержится, пресуппозицию, содержание которой выражено в (86) уступительным предложением. Для более формальной репрезентации LF этих предложений нам необходимо ввести вероятностную функцию р, аргументами которой являются пропозиции, и порядок вероятностей>. [...] Чтобы показать, как в этих случаях LF соотносится с 5, нам необходимо, кроме понятия сферы действия, ввести понятие фокуса. Весьма упрощенно оно может быть представлено так: (89) Фокус х у-а в S есть составляющая jc в сфере действия у-а, которая связана у-ом. Чтобы получить единое и удовлетворительное понятие фокуса, требуется еще многое прояснить. Для наших целей, однако, определение (89) достаточно. В сферу действия even и частиц того же типа попадает простое предложение, в котором они содержатся; фокусом их является составляющая, на которую падает главное ударение в предложении49. [...] ОШИБКИ ВОСПРИЯТИЯ Для проникновения в глубь механизмов порождения речи используются оговорки. По крайней мере две основных причины не позволяют ошибкам при восприятии играть столь же полезную роль для определения механизмов понимания. Одна причина чисто наблюдательного плана: чтобы идентифицировать ошибку при восприятии, необходимо проверить и то, что действительно произнес говорящий, и то, что услышал слушающий, в то время как оговорки могут быть выявлены на основе лишь речевого сигнала. Грубо говоря, оговорки в принципе могут быть записаны на пленку, ошибки слушающего всегда должны быть ,,записаны в сознании" (,,mind-recorded"). Следовательно, данных будет мало. Вторая причина относится к аналитическим последствиям, которые должны быть отсюда выведе- 139
ны. В то время как ошибки говорящего позволяют обычно довольно четко определить источник ошибки, что ведет к достаточно четкому выделению структур и механизмов, участвующих в этом процессе, ошибки восприятия, по-видимому, не позволяют выявить такого локального источника ошибки. Рассмотрим следующий пример: (93) произнесенное: Da mussen Hunderttausende drinstecken. услышанное: Da mw?'n Hunderttausende drinstecken. Фонетически в (93) мы фиксируем две ошибки в отмеченных местах: [у] воспринято как [и] и [э] — как [эг]. Грамматически, однако, эти две ошибки приводят к единой ошибке в числе (множественное число заменено единственным), которая по очереди проявляется в трех взаимосвязанных локальных ошибках: mussen переходит в mu?, при этом инфинитивное окончание -en интерпретируется как неопределенный артикль (ei)n, который должен заменить нулевой артикль именной группы множественного числа, и, наконец, окончание единственного числа -er заменяет окончание множественного числа -е. Можно только предполагать, какие из этих ошибок— причина и какие — следствие; другими словами, в каком месте локализуется то решение, которое приводит к выбору неверной интерпретации. Считая первое осложнение делом случая, который обрекает анализ ошибок восприятия на не более, чем случайный эвристический механизм50, я превращу второе осложнение в аргумент, касающийся природы понимания языка. Рассмотрим следующий достаточно поучительный случай. В конце вечеринки Л и В договариваются, кто кого подвезет: (94) высказывание А : Wieviel hast'n du getrunken? 'Сколько ты выпил?' восприятие В: Wie fahrst'n du betrunken? 'Как ты ведешь машину в пьяном виде?' Было бы в какой-то степени искусственным давать фонетическую транскрипцию, которая представляет возможную акустическую ошибку. Начальная часть, вероятно, должна быть вида [vi:flastn du:]. Я, однако, считаю акустический аспект не очень важным. Более явным сигналом является реакция В, опровергающая предполагаемую пресуппозицию Л: (95) высказывание В: Ich bin gar nicht betrunken! 'Я совершенно не пьян!' Разберем эти факты подробнее. Фонетически здесь два несоответствия: [fi:lhast] воспринята как [fe:rst] (конкретнее: [i:lha] воспринята как [e:r]), a [g] — как [Ь]). (Между прочим, не трудно определить релевантные фонетические признаки, которые остаются неизменными при той и при другой интерпретации.) Обе ошибки безусловно связаны, хотя и довольно замысловатым образом. Что касается идентификации лексем, то в зависимости от точки зрения выделяются либо две, либо три ошибки. Viel и hast заменяются на fahrst, а 140
причастие прошедшего времени глагола trinken заменяется на причастие прошедшего времени глагола betrinken. Эти слова встраиваются в весьма отличные синтаксические структуры. На уровне LF дальнейшей классификации различий нет. Можно скорее сказать, что оба участвующих элемента остаются. Речь идет о Wh-вопросе, как указывает вопросительное местоимение wie, который содержит где-то элемент DRINK. По-видимому, основным моментом является то, что высказанное и воспринятое предложения содержат совершенно различные пресуппозиции. В предложении А предполагается, что слушающий что-то пил, и спрашивается, какое количество, в предложении В предполагается, что слушающий собирается вести машину в пьяном состоянии, и спрашивается, как он это делает. Очевидно, что эти различные пресуппозиции выбирают (или по крайней мере предпочитают) весьма различные контекстуальные признаки, в терминах которых интерпретируется ситуация. Можно только гадать, с самого ли начала это предпочтение определяет интерпретацию на всех других уровнях, включая фонетический, хотя такая догадка кажется весьма правдоподобной, подтверждаемой ответом (95). Безотносительно к этой догадке можно сделать три вывода. Во-первых, даже если имеются локальные точки, в которых можно выявить ошибки — в (94) две таких точки,— их нельзя идентифицировать как источник ошибки. В некотором смысле здесь вообще нет никаких ошибок. Слушающий просто интерпретирует сигнал с учетом своего контекста. И места очевидных ошибок коррелируются благодаря общей структуре, которую слушающий продолжает строить. Во-вторых, в тех пределах, в каких первоначальный сигнал неправильно понят, оправдывается вывод о том, что понимание языка в решающих аспектах основывается скорее на обработке сверху вниз, чем на обработке снизу вверх. Этот вывод становится особенно убедительным, если две или более фонетических ошибки взаимосвязаны общими признаками результирующих репрезентаций более высокого уровня. Это не возврат к модели ,,анализ через синтез" понимания языка. Более вероятная интерпретация обеспечивается моделью, основывающейся на параллельной обработке, которая для построения структуры опирается на акустический вход. В-третьих, характер и взаимосвязь ошибок в (93) и (94) четко показывают, что понимание языка организовано в грамматически определенных структурах. Они могут отличаться в деталях от тех, которые предложены в предыдущих разделах, но их существование не вызывает сомнения51. В противном случае неправильная идентификация отсутствующего глагола farst была бы полнейшей тайной. В этом отношении еще более убедительно согласование множественного числа в (93), так как это чисто морфо-синтаксическое явление. Если принять предположение о ,,ведущей" роли контекстуальных интерпретаций, подкрепляемое (94), то необходимо сделать четвертое замечание: понимание языка базируется на двух видах входа, доминирующая роль которых может меняться в зависимости от 141
различных внешних условий. В одних случаях может превалировать s, в других—с. Поэтому процесс понимания языка должен осуществляться с обоих концов в соответствии с потенциальными промежуточными структурами и отображениями, построенными на основе G. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Итак, я постарался на основе ряда положений прояснить утверждение (А), доказать справедливость утверждения (С) и опровергнуть утверждение (В). Меня особенно занимал способ, с помощью которого правила грамматики и грамматически определенные структуры могут быть соотнесены с процессами понимания языка. Положения (AI) — (А9) основываются на эмпирических наблюдениях и теоретических презумпциях, являющихся, на мой взгляд, в достаточной степени непротиворечивыми. Следовательно, (AI) — (А9) предназначены главным образом для разъяснения последствий этих допущений. Разработанное на этой основе понятие выражено в (А6), где говорится, что понимание языка есть обычно многоуровневый параллельный процесс, в котором участвуют Р, S, LF и С; его можно назвать ,,расточительной точкой зрения на понимание языка", в отличие от того, что можно было бы назвать ,,позицией крайней необходимости", отстаиваемой, например, Ризбеком и Шен- ком (Riesbeck—Schank, 1978). В соответствии с этой концепцией, не делающей различий между LF и С, синтаксис привлекается только в случаях необходимости. Не вызывает сомнения, что во многих случаях можно обойтись без синтаксиса и логической формы или семантики, например при неполном владении языком. Но, по-видимому, столь же очевидно, что это исключительный случай (возможно, поддержанный стратегией, не срабатывающей при нормальном свободном понимании языка). Заостряя эту мысль, можно сказать, что крайний случай — это скорее отсутствие синтаксиса, чем его использование. Очевидно, что (A1) — (А9) ни в коей мере не обрисовывают теорию понимания языка. Скорее их задача состоит в концептуальном прояснении условий, которым так или иначе должны удовлетворять теоретические модели, призванные объяснить процессы понимания языка. Помимо того, дальнейшее прояснение языковых и концептуальных правил и структур, основных положений в отношении операций обработки и характеристик памяти имеет, видимо, первоочередное значение. В отношении последнего прогресса можно добиться главным образом (или возможно только) с помощью построения и тестирования моделей для конкретных аспектов обработки. Как я пытался подчеркнуть, эти попытки содержат две трудности, которые необходимо преодолеть: во-первых, эксплицитные модели обработки легко склонны отождествлять грамматические правила с обработкой, тем самым либо дискредитируя языковую компетенцию, либо превращая употребление в псевдограмматическую операцию. Во-вторых, 142
эксплицитное моделирование конкретных аспектов, хотя в принципе и необходимо, однако имеет тенденцию затемнять существо дела, а именно тот факт, что понимание языка, хотя и определено хорошо очерченными отдельными уровнями структуры, является тем не менее гибким, интерактивным процессом. Об этом необходимо помнить. ПРИМЕЧАНИЯ 1 Еще более крайнюю позицию, исключаемую посредством (А), представляло бы утверждение, что все высказывание (или, скорее, предложение) должно быть проанализировано синтаксически до того, как оно будет проинтерпретировано семантически и прагматически. Я опущу любые дальнейшие соображения относительно этой возможности, так как, по-видимому, никто всерьез не воспринимает идею о том, что семантическая интерпретация предложения начинается лишь после того, как завершается синтаксический разбор его последней составляющей. 2 Конечно, утверждение, что, вопреки (А), восприятие речи должно пройти этап синтаксического анализа, прежде чем перейти к семантической и прагматической интерпретации, предполагает хотя бы частичное отрицание (В). Однако обратное неверно: можно считать, вопреки (В), что обычно для каждого воспринимаемого высказывания строятся полные синтаксическая и семантическая репрезентации, не отрицая в то же время линейной упорядоченности этого процесса, утверждаемого (А). 3 Одно важное различие заключается в том, что Шенк отстаивает весьма детально разработанную концептуальную репрезентацию, которая является результатом процесса, моделирующего понимание языка. 4 Обсуждение различий между С1 и Сn с лингвистической точки зрения см. в: Bierwisch, 1979, с психологической—в Clark, 1978. 5 Я употребляю ,,контекстуальное значение" скорее, чем, скажем, „прагматическая структура" с тем, чтобы учесть все виды зависимостей от контекста употребления, который может включать общие фоновые знания наряду с прагматическими условиями в более узком смысле. 6 Я игнорирую здесь конкретные проблемы, связанные с пониманием письменного языка, хотя взаимоотношение фонетической и графемной структур отнюдь не тривиально. 7 Такой подход позволяет использовать аппарат теоретико-модельной семантики при условии, что она рассматривается как объяснение когнитивных структур и операций в предложенном мною (Bierwisch, 1979) смысле. Однако для решения основных проблем концептуальной и перцептивной репрезентаций необходимы ее дальнейшая разработка и адаптация. 8 Некоторые рассуждения на эту тему содержатся в Bierwisch, 1979 и Lang, 1979. 9 Я не считаю указанное различие действительной неоднозначностью лексического значения book, сравнимой, скажем, с неоднозначностью letter 'письмо', 'буква' или trial 'испытание', 'суд' и т. п., так как такая неоднозначность предполагала бы различные репрезентации на уровне логической формы. Легко, однако, видеть, что хорошо известный феномен обратного разрешения неоднозначности в случаях типа Finally, I found the paper I was supposed to write on/about 'Наконец, я нашел бумагу (статью), на/о которой я собирался писать' имеет ту же самую схему обработки, что и контекстуальная интерпретация в случаях типа предложений (9) — (11). 10 В данном случае не имеет значения, какой из различных видов памяти, рассматриваемых Фодором (первым введен — последним выведен, первым введен— первым выведен или равнодоступное хранение), будет использован. II Между прочим предложения типа (15) также представляют трудности для гипотезы о клаузальной обработке. В соответствии с этой гипотезой, идентификация глубинной структуры простого предложения или оборота является основным начальным шагом при понимании предложения. По очевидным причинам идентификация главного предложения и инфинитивного оборота в (15) не может организовать синтаксической обработки: она может скорее явиться ее результатом. Марслен- Уилсон и др. (Marslen-Wilson et al., 1978) с иной точки зрения подвергли 143
клаузальную гипотезу критическому анализу, хотя их выводы в других отношениях могут быть спорными. 12 Систематическое рассмотрение этих группировок содержится BLibermann and Prince, 1977; Selkirk, 1980 и в приведенных там ссылках. Следует заметить, что иерархическая структура, наложенная благодаря этим группировкам на репрезентацию в терминах фонетических признаков, разработанную в: Chomsky and Halle, 1968, не совпадает с иерархией синтаксических составляющих, к которой мы теперь перейдем. Я не могу здесь продолжать обсуждение сложного и в высшей степени интересного вопроса о том, как просодическая и синтаксическая иерархии взаимодействуют в процессе восприятия предложения—вопроса, который едва ли ставился в систематическом виде. 13 Так, S может быть получена трансформационным отображением исходной структуры или может быть прямо порождена правилами структуры составляющих в совокупности с некоторыми условиями на коиндексацию и связанность (см. некоторые замечания по этому вопросу в Chomsky, 1977:106). Можно считать также, что S—это терминальная цепочка синтаксического дерева, как в грамматике Монтегю, при условии, что организация составляющих каким-то образом указана, возможно, в соответствии с предложением Парти (Partee, 1976: 64). Или о ней можно говорить как о выходе грамматики расширенных сетей переходов (ATN) соответствующего типа. Мы упоминаем лишь некоторые обсуждаемые в последнее время версии синтаксической теории. Хотя выбор среди такого типа альтернатив ни в коей мере не является произвольным и скорее представляет собой наиболее значимую часть теории, для наших целей это не имеет значения, так как в описательном смысле различные системы представляют эквивалентные репрезентации соответствующих синтаксических свойств. 14 Заметим, между прочим, что в основном именно отображение Л формально объясняет приписывание Р сигналу s ,,в соответствии с правилами и условиями G", как было оговорено выше. Другими словами, фонетические признаки, в терминах которых интерпретируется s, находятся в соответствии с правилами и условиями G именно потому, что Р является значением A(S) некоторой синтаксической репрезентации 5. 15 Ради простоты я буду впоследствии представлять S с помощью помеченных скобок, а не дерева, опуская детали, несущественные для обсуждаемой ситуации. 16 Тот факт, что (22а) — гораздо более предпочтительная интерпретация, отвергающая, вероятно, даже возможные акустические указатели, является следствием совершенно нефонетических аспектов (22). В качестве альтернативной попытки объяснить эту предпочтительность в терминах общих свойств синтаксических обрабатывающих механизмов см.: Frazier—Fodor, 1978 и Wanner, 1980. 17 Фактически правила передвижения в теории следов, принятой в Chomsky, 1977 и других соответствующих работах, представляют информацию о ,,более ранних" синтаксических репрезентациях как часть самой репрезентации поверхностной структуры, что в какой-то степени совпадает с тем, что было сказано о Р. Однако S может отклоняться в определенных отношениях даже от такого расширенного понятия поверхностной структуры. Сюда может относиться статус так называемых стилистических правил, результат которых исключается из поверхностной структуры, но, возможно, должен быть представлен в S. Так как у меня нет конкретных аргументов в этом отношении, я оставляю вопрос открытым. В отношении статуса S см. также прим. 13. 18 Неясно, насколько тесным должно быть это соответствие, в частности насколько отношения связанности в LF параллельны отношениям связанности в 5. Имея в виду правила, которые обеспечивают перевод S в LF, Хомский делает предположение, что LF должна иметь форму маркера синтаксической составляющей. Для последующих соображений, по-видимому, можно принять слегка ослабленную версию этого предположения, а именно, что S и LF демонстрируют основные свойства маркеров синтаксических составляющих, но отличаются в некоторых других отношениях. 19 Некоторая версия строгого соответствия композиций 5 и LF может считаться основным принципом грамматики Монтегю. Хомский (Chomsky, 1977: 197 и далее, а также во многих других местах) показывает, что это утверждение не обосновывается эмпирическими данными. 144
20 На самом деле, Уэкслер и Куликовер (Wexler and Culicover, 1980) рассматривают данную проблему в рамках так называемой стандартной теории, которая предполагает, что LF соотносится скорее с глубинной структурой, чем с поверхностной. В принципе, однако, их соображения справедливы для принятого здесь подхода, предполагая обобщенные поверхностные структуры, которые могут быть непосредственно проинтерпретированы семантически. 21 Один из основных аргументов, выдвигаемых Фодором против компонентного анализа (или ,,определения", как он его называет), относится к скорости понимания, которая не свидетельствует о наличии репрезентации со сложной внутренней структурой лексических единиц, тем более, что различия в сложности композиционной структуры обычно не соответствуют временным различиям их восприятия. (Он искал это, по-видимому, не более трудно для восприятия, чем Он нашел это, хотя искать имеет более сложную компонентную структуру, чем находить: фактически лексическая репрезентация глагола находить является соответствующей частью значения глагола искать.) Фодор (Fodor, 1975: 150 и сл.) предлагает объяснять эти наблюдения постулированием двух систем: системы понимания предложения, которая приписывает семантические репрезентации речевому сигналу, и логической системы, которая с помощью постулатов значения выводит возможные следствия из этих репрезентаций. Система понимания работает быстро и в основном линейно- упорядоченно, выводная система неоперативна и не имеет временных ограничений. Однако в связи с этими предложениями возникают различные проблемы. Заметим прежде всего, что на основе той же аргументации должно быть отвергнуто не только семантическое разложение, но и анализ в терминах фонетических признаков, то есть матрица фонетических признаков должна быть замещена определенными общими репрезентациями, соотносящимися друг с другом на основе чего-то, подобного правилам фонетического сходства. Во-вторых, предположение о двух различных системах соответственно для понимания и вывода—безусловно достаточно правдоподобная гипотеза (соответствующая в некотором смысле различию между спонтанным пониманием и пониманием ,,более высокого" порядка, рассмотренными выше). Однако кажется достаточно сомнительным, что выводы определены только—или даже преимущественно — на LF, а не на контекстуальной интерпретации С. Я упомянул эти темы, так как они непосредственно соотносятся с аспектами понимания языка, указывая, что полемика, касающаяся двух данных подходов, далеко не закончена. В разд. 6 я постараюсь доказать, однако, что по крайней мере некоторое лексическое разложение должно быть принято для LF. 22 Соответствующая литература настолько разнообразна, что ее даже трудно перечислить. Один из последних обзоров некоторых ключевых проблем, рассмотренных с точки зрения единого формального подхода, содержится в Karttunen and Peters, 1978. Я не стану использовать здесь формальных деталей, предложенных ими, но в основном буду придерживаться их общей концепции. Карттунен и Петере утверждают, в частности, что отражению данного явления более соответствует не понятие пресуппозиции, а понятие конвенциональной импликатуры. Хотя такой сдвиг, возможно, позволит сделать соответствующие обобщения, я буду придерживаться традиционной терминологии. 23 Заметим, между прочим, что структура [PR; AS] делает в некотором смысле относительным утверждение о строгой иерархичности LF. Строго говоря, LF следует рассматривать как множество иерархий. Так как никаких важных последствий для настоящего изложения из такой модификации не вытекает, я по-прежнему буду считать LF категоризованной неупорядоченной иерархией. 24 Даже терминология, относящаяся к данному уровню репрезентации, чрезвычайно разнообразна и иногда противоречива. Так, в то время как Хомский (Chomsky, 1977) выделяет логическую форму и ,,более полные репрезентации значения", которые он называет семантическими репрезентациями, и которые определяются логической формой совместно с другими когнитивными системами, Джекендофф (Jackendoff, 1977), по-видимому, не рассматривает такого различия, несмотря на сходные в других отношениях понятия, поскольку то, что он называет концептуальной структурой, включает в себя как логическую форму, так и дополнительные когнитивные аспекты. Трудности в определении сходств и различий базисных положений возникают в отношении книги Фодора ,,Язык мышления" (Fodor, 1975), концептуальных репрезентаций Миллера и Джонсона-Лэрда (Miller and Johnson- Laird, 1976) и большинства относящихся к данной теме работ по искусственному 10-1182 145
интеллекту. Достаточно четкое разграничение, соответствующее принятому в настоящей статье, выражено в Weхle г and Culicover (1980: 459 ff.) в терминах семантической репрезентации и ментального мира, где первое соответствует нашему уровню LF, а второе — нашему уровню С. Точно так же ,,ментальные модели" в более поздней работе Джонсона-Лэрда (Johnson-Laird, 1980) или „дискурсивные модели" в Johnson-Laird and Garnham (1980) достаточно близки понятию контекстуального значения С, которое основывается на общих знаниях о мире и знаниях о ситуации, участвующих в интерпретации высказывания. 25 Эти операции, возможно, будут включать правила вывода и дедукции, так как большинство логических операций (в упомянутом в прим. 21 смысле), возможно, основываются на репрезентациях этого уровня. Иллюстративные примеры, подводящие к такому заключению, содержатся в Johnson-Laird, 1980. 26 Последняя альтернатива обсуждалась в несколько отличном контексте в интересной статье Даля (Dahl, 1977). В соответствии с предложением Даля, LF может интерпретироваться либо как некоторый вид списка, определяющий модели, которые удовлетворяют проверочным условиям, либо как инструкция, позволяющая строить модели в соответствии с данными условиями. Хотя, как указывает Даль, обе возможности во многих отношениях эквивалентны, они позволяют, как мы это сразу же увидим, провести полезное разграничение. 27 Фактически они, по-видимому, нарушают даже гораздо более абстрактный принцип композиционности в смысле Фреге, что видно из (38): V (УХОДИТЬ, с) зависит от V (УНИВЕРСИТЕТ, с), и наоборот, что противоречит требованиям композиционности интерпретации при любых приемлемых положениях относительно деталей LF. 28 Хотя разные части грамматики покрывают только репрезентации Р, S и LF и отображения Ли/, эта проблема непосредственно захватывает С и отображение V точно так же, как другие когнитивные системы, такие, как зрительное восприятие, музыка, арифметическое вычисление и т. п. Таким образом, последующее обсуждение грамматики и процессов обработки относится в равной степени и к ментальным моделям, и к отображению V, переводящему в эти модели. 29 Следует заметить, что хотя развернувшаяся относительно DTC дискуссия группируется вокруг синтаксических трансформаций, еще более сильное утверждение может быть сделано относительно фонологических правил. Сравним, например, немецкие Bottich 'чан' и zottig 'лохматый', имеющие фонетическую репрезентацию соответственно [botic] и [cotic]. Так как вторая репрезентация выводится из исходной [cotig] с помощью трансформаций оглушения конечного согласного и превращения его в спирант, которые не применяются к первой, zottig должно было бы быть более сложным для восприятия, чем Bottich, тогда как формы множественного числа zottige и Bottiche в этом отношении не различаются, что является, конечно, абсурдным предположением. Вообще даже поверхностный взгляд на фонологические деривации четко показывает, что между деривационной и перцептивной сложностью нет абсолютно никакой корреляции. Очевидно, по-видимому, что сходные соображения относятся к другим уровням репрезентации и отображениям между ними. (Заметим, что это вызывает дополнительные сомнения относительно возражений Фодора против компонентного анализа, упоминаемых в прим. 21). Заметим далее, что общность этих соображений делает нерелевантным тот факт, что модификации, касающиеся места трансформации в синтаксической теории, катастрофически уменьшают влияние исходной версии DTC. 30 Это не относится в том же смысле, скажем, к обрабатывающей системе, предложенной Фрейзером и Фодором (Frazier and Fodor, 1978). Эта система отвечает за построение только одного аспекта S, а именно — ее древесной структуры, в соответствии с двумя общими положениями; во-первых, построение S осуществляется в два этапа и, во-вторых, на первом этапе ее мощность ограничивается шестью словами, которые ,,упакованы" для дальнейшей интеграции на втором этапе. Эта система не отвечает за установление отношений связанности wh-предложений и т. п. и не образует, следовательно, автономного механизма синтаксической обработки. Другими словами, она пытается объяснить определенные предпочтения в приписывании категоризованных древесных структур цепочкам слов двумя условиями обработки, которые, однако, не образуют отдельного механизма. (Дальнейшие комментарии содержатся в прим. 34). Как указывает Уоннер (Wanner, 1980), эта попытка не может быть полностью 146
успешной, но она не попадает автоматически в тот класс возражений, которые должны быть выдвинуты против (D). 31 Следует отметить, что это наблюдение ни в коей мере не противоречит сделанным ранее замечаниям относительно самовложения типа (6). Ясно, что трудности, возникающие при восприятии (50) и (51), чисто синтаксические, что можно видеть на примере понятности предложений (50') и (51'), которые семантически идентичны предложениям (50) и (51) и отличаются от них только отсутствием синтаксического самовложения. (50') The teacher left who the boy mentioned who you visited. букв. 'Учитель ушел, о котором мальчик упомянул, которого вы посетили'. (51') The ice cream melted that the boy brought who you mentioned. букв. 'Мороженое растаяло, которое мальчик принес, о котором вы упомянули'. Суть в том, что семантические связи могут в определенной степени помочь преодолеть трудности, возникающие при синтаксической обработке. 32 Положим, например, что фонетическая обработка s организована в некотором смысле как пословный процесс, предполагающий идентификацию слова в качестве некоей автономной операционной единицы. Сразу же очевидно, что она должна рассматриваться как весьма сложная совокупность операций (если мы даже на время забудем, что идентификация слова выполняет в одно и то же время фонетическую и частично синтаксическую и семантическую интерпретацию). Согласно «когортной» теории Марслен-Уилсона и Тайлера (Marslen-Wilson and Tyler, 1980), идентификация начальной части слова активизирует ,,когорту" соответствующих слов, которая постепенно сокращается, пока, в конце концов, не остается требуемое слово. Таким образом, здесь действует не только последовательность более элементарных операций, но, вероятно, весьма сложный набор частично параллельных операций. Другие модели предлагают отличные совокупности элементарных операций для распознавания слов. Допустим, однако, ради доказательства, что идентификация фонетических слов производится операциями Оi в смысле (А8), так, что t=t1t2... tk является временем отображения s в Р, где Р = W1W2... Wk является последовательностью словоформ и Wi идентифицируется с помощью операции Оi. Нет необходимости предполагать, что ti имеют одинаковую продолжительность, однако Оi- должны рассматриваться как самостоятельные операционные единицы, какой бы сложности они ни были. Мы можем предположить, что t соотносится с временной координатой t' сигнала s следующим образом: (i) Для любых моментов времени t'j интервала t' существует соответствующий момент времени tj интервала t, такой, что tj=t'j—rj, где задержка r колеблется в очень ограниченных пределах. Другими словами, мы предполагаем, что идентификация Р происходит приблизительно синхронно с s в зависимости от некоторого параметра задержки г. Эти предположения противоречат реальности во многих отношениях и в лучшем случае имеют силу, если Р рассматривать как изолированный список словоформ. Во всех случаях естественного понимания высказываний О/ не являются независимыми, и имеются явные результаты ожиданий и отсрочек (кроме параметра г), которые влияют на время обработки t, противопоставленное f сигнала s. Тем не менее, (i) может служить первым приближением к способу, который соотносит друг с другом линейность репрезентаций, упорядоченность во времени обрабатывающих операций и временные характеристики сигнала s. С этой точки зрения решающей задачей для любой теории действительных процессов понимания языка можно считать объяснение систематических отклонений от (i) в терминах, имеющих место соотношений между О,, а также отношений между О, и операциями более высокого уровня. 33 Широкое исследование принципов, лежащих в основе последовательной обработки иерархически организованных структур (называемых „планами"), представлено в основополагающей книге Миллера, Галантера и Прибрама (см. Miller. Galanter and Pribram, 1960). Согласно развиваемым там принципам, (54) будет обработано следующим образом: 10* 147
34 Это, между прочим, определяет другое кардинальное различие между грамматиками ATN и обрабатывающей системой Фрейзера и Фодора (Frazier and Fodor, 1978), упомянутой в примечании (30): в то время как грамматики ATN используют преимущественно последовательную обработку в соответствии с (52), в двухступенчатой системе Фрейзера и Фодора по этому поводу нет никаких конкретных утверждений. Она не определяет ни последовательной, ни параллельной обработки, а скорее устанавливает определенные условия на границы, ограничивающие совокупность одного вида операций. 35 Нам нет необходимости рассматривать детали. Основная идея такова: для (52) принцип (i) в примечании (32) означает, что t включает временные интервалы не только операций, идентифицирующих терминальные элементы, а интервалы всех операций данной последовательности. Поэтому соответствие между моментами времени t иг' для некоторых интервалов будет более ,,уплотненным", чем для других. Например, если бы DEFG в (54) были словоформами, соответствующими отрезкам s с временными интервалами ti, *2> *з> и г4> то t\ соответствовал бы t\ операции 0\, тогда как tf2, t'i, соответствовали бы f2, h> U> a t\ соответствовал бы ts-, te, t-j. Для (53) соответствие, указанное в (i), должно быть расширено на п частично пересекающихся последовательностей операционного времени, на которых в свою очередь устанавливаются внутренние временные отношения, о чем уже упоминалось выше в связи с Оц, О г.j и О3.k. 36 Фактически отвергаемая (А) идея относительно того, что в процессе понимания сначала идентифицируется 5, затем строится ее семантическая репрезентация и, наконец, контекстуальная интерпретация, должна рассматриваться как особая версия (52), тогда как параллельная обработка, выраженная в (А) имплицитно, является версией (53) применительно к <Р, S, LF, С>. 37 Чтобы еще больше прояснить этот момент, я добавлю, что при конкретных требованиях правила могут переводиться в (сложные) операции. Так, если в процессе решения грамматической задачи предложение типа Джон здесь переводится в Здесь ли Джон?, то трансформация вопроса превращается в часть сложной операции, происходящей в реальном времени. Заметим, однако, что, конечно, это «приложение» грамматического правила не должно смешиваться с его исходным статусом как части грамматики, определяющей возможные объекты для обработки языка. Фактически, оно не только основывается на выведенной интерпретации грамматического правила, но образует некоторый тип ментальной обработки, которая резко отличается от основывающегося на правилах грамматики спонтанного процесса понимания языка. Хотя все это чересчур очевидно, пренебрежение этим различием вызывает большую путаницу. Оно имеет еще дальше идущие последствия, так как существуют менее очевидные пограничные случаи между правилами и операциями. Интересный момент представляет собой, например, то, что логические выводы (базирующиеся на С и/или LF), предложенные Фодором (Fodor, 1975) (см. прим. 21), могут быть операциями, которые превращаются в операции, действующие в реальном масштабе времени. В 148
более общем плане мы должны представлять себе различие между операциями, которые производят структурные характеристики ментальных состояний, и операциями, которые оперируют такими структурными репрезентациями. Именно во вторые могут превращаться правила грамматики (или другие когнитивные системы). Они, безусловно, предполагают первый тип операций. 38 Заметим, что если бы мы должны были представить временные и операционные связи более строго, то (59) превратилось бы в (59'): (59') 1.1 2.1 1.3 Хотя здесь еще сохраняется некоторый вид параллельной обработки, так как, например, и 0\Ъ и О2 i связаны временным отношением с Ои, последовательность операций напоминает больше (55а), чем (55Ь), тем самым затемняя саму идею параллельной обработки. 39 Если я не ошибаюсь, предложение Арбиба и Каплана (Аrbib and Kaplan, 1979) о развитии вычислительного понятия нейролингвистики наилучшим образом может быть понято как дающее несколько более точное содержание общих свойств О в развиваемом здесь смысле. С этой точки зрения, основная идея Арбиба и Каплана согласуется с возражениями, выдвигаемыми, на мой взгляд, правильно Кином и Смитом (Kean and Smith, 1979) против недифференцированного глобального характера модели и утверждающими, что модульному характеру ментальных процессов должно быть отдано предпочтение как с методологической, так и с эмпирической точки зрения. Суть заключается в том, что, с одной стороны, могут существовать общие характеристики О, в то время как G, являющаяся строго модульной системой, имплицитно накладывает модульные характеристики на О, благодаря связи, обусловленной (А7"). 40 Это не совсем правильно, если мы примем во внимание начальное состояние операции. Так, O12 должна следовать за О11, так как D определяет ее начальное состояние OS. Положим поэтому, что начальное состояние всех операций Оц, применяемых в (59), есть некоторый структурный признак F, который является частью всех терминальных элементов D, Е, F, G. 41 Так, и (55а), и (55b) строго линейно упорядочены, в то время как (55с) и, следовательно, обработка в грамматиках ATN в общем случае нет. 42 Предварительный обзор, посвященный кратковременной памяти для различных уровней структуры, содержится в Bierwisch, 1975. 43 Языки, по-видимому, различаются в отношении объема структурно обусловленной промежуточной памяти, который они склонны допустить. Так, «расщепления» лексических единиц в немецком с помощью перемещения личного глагола в главных предложениях, как показано в (64), часто представляют собой крайние случаи, когда даже идентификация слова перестает быть строго линейно-упорядоченной. Сходное явление вызывает в английском перемещение частицы в примерах типа put NP about, однако оно гораздо более ограниченно, так как на место NP может быть вставлена только простая, несложная именная группа. 44 Некоторый вид общего дисплея присущ также двухступенчатой системе Фрейзера и Фодора (Frazier and Fodor, 1978), однако там содержится дополнительное условие, что ,,упаковывающая" ступень ограничивается приблизительно шестью синтаксическими примитивами. Это, таким образом, третье отличие этой системы от грамматик ATN, которые в основном основываются на магазинной памяти. (Относительно других отличий см. примечания 30 и 34). 149
45 Хотя могут существовать промежуточные части, являющиеся полными. Например, на полноту именной группы der Pianist... не влияет неполнота глагола hort (auf) 'перестал'. 46 Я опускаю здесь проблемы надлежащей семантической категоризации именных групп, анализ определяющих слов и статус именных групп во множественном числе. Я просто буду продолжать приписывать именным группам семантическую категорию п. Для ясности <р/п> сокращенно обозначается сп (,,common noun" 'нарицательное имя существительное'). 47 На самом деле (78) является упрощением, в определенных отношениях вводящим в заблуждение. Более тщательный анализ должен был бы определить различные измерения, на которых основывается сравнение в large 'большой' в отличие от high 'высокий', long 'длинный' и т. д. 48 Более тщательное, хотя по-прежнему неполное исследование рассматриваемых синтаксических и семантических аспектов проведено Карттуненом и Петерсом (Karttunen and Peters, 1978), идеям которых с небольшими упрощениями я следую. 49 Имеется глубокая связь между главным ударением и фокусом, хотя в общем случае отношение это гораздо более сложное. Подробный разбор данного вопроса увел бы нас далеко в сторону. 50 Конечно, можно легко добиться того же результата, предъявляя, скажем, информантам высказывания с локально замаскированными речевыми сигналами. Систематическое изменение структурных свойств замаскированных мест могло бы использоваться для идентификации конкретных условий обработки. Сохраняющееся различие — это различие между естественной и экспериментальной ситуацией. 51 Следует подчеркнуть, что это заключение не ослабляется случайным характером данных. С методологической точки зрения утверждение о существовании может быть доказано даже одним-единственным убедительным примером. Хотя это не отрицает необходимости дополнительных данных. ЛИТЕРАТУРА Ajdukiewicz, 1935=Ajdukiewicz, К. Die syntaktische Konnexitat.— ,,Studia Philosophica", 1935, 1, S. 1—27. Arbib and С aplan, 1979=Arbib, M. А., Сaplan, D. Neurolinguistics must be computational.—,,The Behavioral and Brain Sciences", 1979, 2, p. 449—460. В ever, 1970=Bever, T. G. The cognitive basis for linguistic structures.— In: ,,Cognition and the Development of Language" (Hayes, J. R. (ed.)). New York: Wiley, 1970. Bierwisch, 1967=Bierwisch, M. Syntactic features in morphology.— In: ,,To Honor Roman Jakobson". The Hague: Mouton, 1967. Bierwisch, 1975=Bierwisch, M. Psycholinguistik. Interdependenz kognitiver Prozesse und linguistischer Strukturen.—,,Zeitschrift fur Psychologie", 183, 1975, S. 1—52. Bierwisch, 1979=Bierwisch, M. Wortliche Bedeutung—eine pragmatische Gretchenfrage.— In: ,, Sprechakttheorie und Semantik". (Grewendort, G. (ed.)). Frankfurt/Main: Suhrkamp, 1979. Bierwisch, 1980(a)=Bierwisch, M. Utterance meaning and mental states.— In: ,,Memory and Cognition". (Klix, F. and Hoffman, J. (eds.)). Berlin: Deutscher Verlag der Wissenschaften, 1980. Bierwisch, 1980(b)=Bierwisch, M. Semantic structures and illocutionary force.— In: ,,Speech Act Theory and Pragmatics". (Searle, J. R., Kiefer, F., Bierwisch, M. (eds.)). Dordrecht: Reidel, 1980. Bierwisch, 1980(c)=Bierwisch, M. Sprache und Gedachtnis: Ergebnisse und Probleme.— In: ,,Psychologische Effekte sprachlicher Strukturkomponenten" (Bierwisch, M. (ed.)). Munchen: Fink; and Berlin: Akademie-Verlag, 1980. Chomsky, 1977=Chomsky, N. Essays on Form and Interpretation. Amsterdam: North-Holland, 1977. Chomsky, 1980(a)=Chomsky, N. On binding.—,»Linguistic Inquiry". 1980, 11, p. 1—46. Chomsky, 1980(b)=Chomsky, N. Rules and Representations. New York: Columbia University Press, 1980. 150
Chomsky and Halle, 1968=Chomsky, N., Halle, M. The Sound Pattern of English. New York: Harper & Row, 1968. Chomsky and Lasnik, 1977=Chomsky, N., Lasnik, H. Filters and control.— „Linguistic Inquiry", 1977, 8, p. 425—504. Clark, 1978=Clark, H. H. Inferring what is meant.— In: „Studies in the Perception of Language" (Leve It, W. J. M., Flores d'Arcais, G. В. (eds.)). Chichester: Wiley, 1978. Dahl, 1977=Dahl, O. Games and models.— In: Dahl, O. (ed.). Logic, Pragmatics and Grammar. Goteborg: Department of Linguistics, University of Goteborg, 1977. Fodor, 1975=Fodor, J. A. The Language of Thought. New York: Crowell, 1975. Fodor and Garrett, 1966=Fodor, J. A., Garrett, M. Some reflections on competence and performance.— In: „Psycholinguistic Papers". (Lyons, J., Wales, R. J. (eds.)). Edinburgh: Edinburgh University Press, 1966. Fodor, 1978=Fodor, J. D. Parsing strategies and constraints on transformations.— „Linguistic Inquiry", 1978, 9, p. 427—473. Frazier and Fodor, 1978=Frazier, L., Fodor, J. D. The sausage machine: A new two-stage parsing model.— „Cognition", 1978, 6, p. 291—325. Jackendoff, 1977=Jackendoff, R. X syntax: A study of phrase structure.— „Linguistic Inquiry Monograph", 2. Cambridge, Mass.: M.I.T. Press, 1977. Jarvella and Herman, 1972=Jarvella, R. J., Herman, S. J. Clause structure of sentences and speech processing.— „Perception and Psychophysics", 1972, 11, p. 381—384. Johnson-Laird, 1980=J oh n son-Laird, P. Mental models in cognitive science.—„Cognitive Science", 1980, 4, p. 71 — 115. Johnson-Laird and Garnham, 1980=John son-Laird, P., Garn h am, A. Descriptions and discourse models.— „Linguistics and Philosophy", 1980, 3, p. 371—393. Karttunen and Peters, 1978=Karttunen, L., Peters, S. Conventional implicature.— In: „Syntax and Semantics". (Dinneen, D. A., Choon-Kyu Oh (eds.)). Vol. 11. Presupposition. New York: Academic Press, 1978. Kean and Smith, 1979=Kean, M. L., Smith, G. E. Commentary on 'Neurolingu- istics must be computational' by M. A. Arbib and D. Caplan.— „The Brain and Behavioral Sciences", 1979, 2, p. 469—470. Lang, 1979=Lang, E. Zum Status der Satzadverbiale.— „Slovo a Slovesnost", 1979, 40, p. 200—213. Levelt and Flores d'Arcais, 1978=„Studies in the Perception of Language". (Levelt, W. J. M., Flores d'Arcais, G. B. (eds.)). Chichester: Wiley, 1978. Libermann and Prince, 1977=Libermann, M., Prince, A. On stress and linguistic rhythm.— „Linguistic Inquiry", 1977, 8, p. 249—336. Marslen-Wilson, 1975=Mar si en-Wilson, W. D. Sentence perception as an interactive parallel process.— „Science", 1975, 189, p. 226—228. Marslen-Wilson et al., 1978 = Marslen-Wilson. W. D., Tyler, L. K., Seidenberg, M. Sentence processing and the clause boundary.— In: „Studies in the Perception of Language" (Levelt, W. J. M., Flores d'Arcais, G. B. (eds.)). Chichester: Wiley, 1978. Marslen-Wilson and Tyler, 1980=Marslen-Wilson, W. D., Tyler, L. K. The temporal structure of spoken language understanding.—„Cognition", 1980, 8, p. 1—71. Miller, 1978=Miller, G. A. Semantic relations among words.— In: „Linguistic Theory and Psychological Reality". (Halle, M., Br es nan, J., Miller, G. A. (eds.)). Cambridge, Mass.: M.I.T. Press, 1978. Miller et al., 1960=Miller, G. A., Galanter, E., Pribram, К. H. Plans and the Structure of Behavior. New York: Holt, Rinehart and Winston, 1960. Miller and Johnson-Laird, 1976=Miller, G. A., Johnson-Laird, P. Language and Perception. Cambridge. Mass.: Harvard University Press, 1976. Newell and Simon, 1972=Newell, A., Simon, H. A. Human Problem Solving. Englewood Cliffs, N. J.: Prentice-Hall, 1972. Nooteboom et al., 1978=Nooteboom, S. G., Brokx, J. P. L., de Rooij, J. J. Contributions of prosody to speech perception.— In: „Studies in the Perception of Language". (Levelt, W. J. M., Flores d'Arcais, G. B. (eds.)). Chichester: Wiley, 1978. Nunberg, 1979=Nunberg, G. The non-uniqueness of semantic solutions: Polysemy.— „Linguistics and Philosophy", 1979, 3, p. 143—184. 151
Partee, 1976=Partee, B. H. Some transformational extension of Montague grammar.— In: ,,Montague Grammar". (Partee, B. H. (ed.)). New York: Academic Press, 1976. Riesbeck and Schank, 1978=Riesbeck, C. K., Schank, R. C. Comprehension by computer: Expectation-based analysis of sentences in context.— In: ,,Studies in the Perception of Language". (Levelt, W. J. M., Flores d'Arcais, G. B. (eds.)). Chichester: Wiley, 1978. Selkirk, 1980=Selkirk, E. O. The role of prosodie categories in English word stress.—,»Linguistic Inquiry", 1980, 11, p. 563—605. Wanner, 1980=Wanner, E. The ATN and the sausage machine: Which one is baloney?—„Cognition", 1980, 8, p. 209—225. Weigl and Bierwisch, 1970=Weigl, E., Bierwisch, M. Neuropsychology and linguistics: Topics of common research.— „Foundations of Language", 1970, 6, p. 1—18. Wexler and Culicover, 1980=Wex 1er, K., Culicover, P. W. Formal Principles of Language Acquisition. Cambridge, Mass.: M.I.T. Press, 1980.
T. A. ван Дейк и В. Кинч СТРАТЕГИИ ПОНИМАНИЯ СВЯЗНОГО ТЕКСТА Глава I. К СОЗДАНИЮ МОДЕЛИ СТРАТЕГИЧЕСКОЙ ОБРАБОТКИ СВЯЗНОГО ТЕКСТА* 1.1. Исследование связного текста 1.1.1. История вопроса. В последнее время в ряде гуманитарных и социальных наук возрос интерес к изучению связного текста, или дискурса. Интерес к проблеме, возникший на рубеже 1970-х гг., имеет давние истоки. Более 2000 лет назад в классической поэтике и риторике были разработаны структурные модели текстов, относящихся к поэзии, драме, политике и праву (Wellek, 1955; Wimsatt & Brooks, 1957; Lausberg, 1960; Corbett, 1971). Разработанная классической риторикой концептуальная система оставалась непревзойденной вплоть до распространения структурализма в лингвистике, поэтике и антропологии в конце 1960-х гг. Структурализму на более раннем этапе предшествовали так называемый русский формализм (Erlich, 1955) и чешский структурализм (Ihwe, 1972; Culler, 1975), возникшие в период между двумя мировыми войнами. Так, работа русского фольклориста Владимира Проппа, посвященная исследованию русских сказок (1928), стала примером структурного подхода к повествованию, который спустя 30 лет взяли на вооружение французские антропологи и исследователи литературы: Леви- Строс, Барт, Бремон, Тодоров, Греймас и др.; затем этот подход стали использовать в психологии, в работах по грамматике рассказа (Rumelhart, 1975; van Dijk, 1980a). Хотя с точки зрения современной лингвистики и психологии классические и структуралистские теории связного текста не отвечают требованиям эксплицитности, все же многие их теоретические положения сохраняют свою значимость и по сей день. 1.1.2. Лингвистика текста. До начала 1970-х гг. американская лингвистика редко выходила за рамки предложения. Господствующая генеративно-трансформационная парадигма сосредоточивалась на фонологических, морфологических, синтаксических, позднее — на семантических структурах контекстно-свободных предложений или предложений, изолированных от текста, совершенно игнорируя * Т. A. van Dijk, W. Kintsch. Strategies of Discourse Comprehension. Chap. 1: Toward a model of strategic discourse processing; Chap. 10: The Cognitive Model. New York etc.: Academic Press, 1983, p. 1 — 19; p. 333—404. ©Academic Press, Inc., 1983. 153
раннюю основополагающую работу по анализу связного текста (Harris, 1952). Интерес к лингвистическому изучению дискурса проявляли в основном представители менее влиятельных школ, таких, как тагмемика (Pike, 1967; Grimes, 1975; Longacre, 1976), которые разрабатывали методы анализа дискурса, необходимые для полевых исследований бесписьменных языков. Европейская лингвистика, в особенности в Англии и Германии, оказалась более тесно связанной со структуралистской традицией, которая не стремилась к четкому соблюдению границ лингвистики вообще и предложения в частности (Halliday, 1961; Hartmann, 1964; 1968; Harweg, 1968; Petofi, 1971; van Dijk, 1972; Dressler, 1972; Schmidt, 1973). И действительно, некоторые из этих исследований связного текста проводились на стыке грамматики, стилистики и поэтики (Leech, 1966; Crystal & Davy, 1969). Первоначально теоретические предположения, основанные на том, что грамматика должна объяснять системно-языковые структуры целого текста, превращаясь, таким образом, в грамматику текста, оставались декларативными и по- прежнему слишком близкими по своему духу генеративной парадигме. Однако вскоре и грамматика текста, и лингвистические исследования дискурса разработали более независимую парадигму, которая была принята и в Европе и в Соединенных Штатах (van Dijk, 1977а; van Dijk & Petofi, 1977;Dressler, 1978; Sinclair & Coulthard, 1975; Coulthard, 1977 и др.; в качестве обзорного и вводного материала см.: de Beaugrande & Dressler, 1981; de Beaugran- de, 1980). Более или менее параллельно с этим направлением, после ранних работ по тагмемике, в американской лингвистике обнаружилась тенденция в сторону тексто- и контекстно-зависимого анализа, проявившаяся в рамках так называемой функциональной парадигмы (Givon, 1979а). 1.1.3. Социальные науки и анализ связного текста. На рубеже 1970-х гг. исследование дискурса приобрело еще большее значение, после того как было осознано, что анализ языка не должен ограничиваться грамматическим анализом абстрактной или идеальной языковых систем, но эмпирическим объектом лингвистических теорий должно стать актуальное использование языка в социальном контексте. В частности, в социолингвистике не только пробудился интерес к изучению социальной вариативности языкового употребления, но и возросло внимание к его разнообразным формам, таким, как словесная дуэль и повествование (Labov, 1972а, 1972b). Эти работы пересекались с аналогичными исследованиями в антропологии и этнографии, где структурный анализ мифов, сказок, загадок и других форм устного творчества подготовил почву для более широких исследований способов коммуникации в различных культурах (Gumperz & Hymes, 1972; Bauman & Scherzer, 1974; Sanches & Blount, 1975). Наконец, можно отметить также общую тенденцию к изучению речи в естественных условиях и в микросоциологии, где этнометодо- 154
логические принципы исследования применялись к повседневному и разговорному общению (Sudnow, 1972; Sacks, Schegloff & Jefferson, 1974; Schenkein, 1978). Анализ разговора приобрел такую популярность, что его стали отождествлять с анализом дискурса, и его значение в современной лингвистике существенно возросло (Frank, 1980; Coulthard & Montgomery, 1981). 1.1.4. Психология и искусственный интеллект. Следуя преобладающему генеративно-трансформационному направлению, представители психологии и психолингвистики не решались признать значимость дискурса для изучения языкового восприятия. Ранние психолингвистические модели 1960-х гг. ограничивались синтаксисом или семантикой изолированных предложений (Clark & Clark, 1977; Fodor, Bever & Garrett, 1974). И здесь опять-таки в начале 1970-х гг. произошла перестройка парадигмы. Растущий интерес к проблемам семантической памяти привел к использованию данных дискурса и к созданию первых вариантов когнитивной модели понимания связного текста (Kintsch, 1972, 1974; Bower, 1974; обзор других работ см. в гл. 2). В то же время представители педагогической психологии, осознав, что обучение часто происходит на основе текста, проявили вскоре интерес к исследованию соотношения памяти и дискурса (Rothkopf, 1972; Meyer, 1975). Таким образом, мы стали свидетелями возрождения интереса к изучению дискурса в рамках традиции теории гештальтов, в значительной мере основанной на работе Ф. Бартлетта (Bartlett, 1932), к которой раньше на протяжении сорока лет ученые обращались лишь эпизодически (Cofer, 1941; Gomulicki, 1956; Paul, 1959; Slamecka, 1959; Pompi & Lachman, 1967). Это возрождение интереса не только к теориям понимания текста, но и к различным теориям организации памяти (теориям схем) было отмечено также и в области искусственного интеллекта. Здесь решающая перестройка парадигмы произошла в 1972 г. (Winograd, 1972; Charniak, 1972; Simmons, 1972). Компьютерное моделирование понимания языка потребовало разработки программ автоматической обработки текстов. Центральное место в исследованиях заняло моделирование знаний о мире, необходимых, например, для понимания историй или рассказов. Так понятие ,,схемы" Бартлетта было снова взято на вооружение, причем в более эксплицитной форме; оно стало фигурировать под такими названиями, как ,,схема", ,,сценарий" или ,,фрейм"; эти названия должны были указывать на роль способов представления знаний о мире в понимании дискурса и в других сложных когнитивных задачах (Schank & Colby, 1973; Minsky, 1975; Bobrow & Collins, 1975; Norman & Rumelhart, 1975; Schank & Abelson, 1977). С начала первых интересующих нас исследований в области лингвистики, психологии, искусственного интеллекта и социальных наук прошло десять лет. Если вначале исследования проводились более или менее независимо и автономно друг от друга, то теперь мы 155
становимся свидетелями растущей интеграции многих теоретических разработок. По проблемам междисциплинарного изучения дискурса в рамках новой и широкой области когнитивной науки опубликованы многочисленные книги и статьи, основаны два специальных журнала („Discourse Processing" (1978), ,,Text" (1981)) и регулярно проводятся конференции. Можно отметить многочисленные взаимные контакты между лингвистикой и психологией, лингвистикой и микросоциологией, а также между психологией и этнографией. Уже в наших первых работах по когнитивным моделям понимания текста (Kintsch & van Dijk, 1975, 1978; van Dijk & Kintsch, 1978) мы стремились к интеграции разных точек зрения и подходов к дискурсу, в особенности если это касалось наших собственных работ в данной области. Так, общая модель памяти была разработана на основе предыдущих работ по семантической памяти (Kintsch, 1970, 1972), а различные структуры текста, в частности локальная и глобальная когерентность, макроструктуры и суперструктуры анализировались либо в связи с их ролью в понимании и порождении текста—через призму ранних работ по лингвистике текста (van Dijk, 1972, 1977а), либо с точки зрения их значения для психологии (Kintsch, 1974). Хотя междисциплинарная модель понимания дискурса на протяжении последних лет постоянно обогащалась и совершенствовалась как самими авторами, так и независимо от них другими исследователями (см. обзор этих работ в главе 2), представленную в настоящей книге модель следует считать не только результатом прежней работы, но и новым подходом к когнитивному моделированию понимания и порождения текста. Если нашу раннюю модель можно охарактеризовать скорее как структурную, то теперь мы предлагаем более динамичную, процессно-ориентированную, оперативную (on-line) модель, основанную на подходе, который мы назвали стратегическим, 1.2. Основные положения Охарактеризовав исторические предпосылки нашей модели, представим теперь в произвольной форме основные положения, с помощью которых не только определяются основные теоретические понятия и компоненты модели, но и выявляются необходимые взаимосвязи с другими моделями функционирования дискурса, разработанными в лингвистике и социальных науках. В следующем параграфе дается описание основных компонентов модели, которая на теоретическом и экспериментальном уровнях подробно разрабатывается в последующих главах. 1.2.1. Когнитивные основания. Представим себе ситуацию, в которой некто оказался свидетелем дорожного происшествия. Мы исходим из того, что у человека конструируется ментальное представление этого происшествия, а его понимание наблюдаемых событий выражается в конструировании данного представления и его 156
последствий, остающихся в памяти. Предположим, что другой человек слушает рассказ об этом происшествии. Мы считаем, что понимание рассказа также требует построения ментального представления. Конечно, репрезентация самого происшествия и репрезентация рассказа о происшествии не будут совпадать. Во втором случае мы получим представление уже вербализованной версии говорящего о случившемся (Hormann, 1976). Но общая характерная черта того и другого когнитивного процесса состоит в том, что свидетель происшествия и слушающий историю конструируют в памяти некоторое представление на основе визуальных или языковых данных. Мы называем это конструктивистским основанием модели. Далее мы полагаем, что свидетель происшествия и слушатель рассказа о происшествии конструируют не просто некоторое представление на основе визуальных и вербальных данных—таких, как движение объектов, поведение людей (происходящие события) или произнесение высказываний, образующих рассказ, но, скорее, интерпретацию событий и высказывания (Loftus, 1979). В обоих случаях они конструируют значение: события интерпретируются как „происшествие", а языковое сообщение—как рассказ о происшествии. Мы называем это интерпретирующим основанием модели. В дальнейшем мы в основном будем иметь дело именно с этим семантическим аспектом обработки дискурса. Мы полагаем также, что конструирование представления происшествия или рассказа о происшествии, и в частности значения воспринимаемого материала, происходит практически одновременно с осуществляющейся обработкой этого материала. Другими словами, мы не считаем, что свидетель и слушающий в нашем примере сначала обрабатывают и запоминают данные, относящиеся к соответствующим событиям, и только потом приписывают им значение. Это значит, что понимание осуществляется оперативно (on-line), то есть параллельно с обработкой воспринимаемых данных. Это постепенно развивающийся процесс, а не процесс, происходящий post hoc. Используя метафору из области вычислительной техники, мы назовем это оперативным основанием обработки дискурса (см.: Marslen-Wilson & Tyler, 1980). Люди, понимающие реальные события или речевые события, способны сконструировать ментальное представление, и в особенности осмысленное представление, только при том условии, что они располагают более общими знаниями о таких событиях. Чтобы интерпретировать какое-то событие как дорожное происшествие, люди должны знать кое-что об обычном дорожном движении, о событиях, в которых участвуют машины и водители; что касается рассказов, то нужно иметь более общие знания о них и об их взаимосвязях с описываемыми событиями. Сходным образом очевидец и слушатель (в нашем примере) могут интерпретировать события в свете прошлого опыта, для которого были характерны аналогичные события и который может привести к формированию более общих знаний. Помимо этих знаний, у слушателя и свидетеля 157
может быть и другая когнитивная информация: убеждения, мнения или установки, относящиеся к подобным событиям, а, кроме того, мотивации, цели или особые задачи, связанные с обработкой соответствующей информации. В общем, мы полагаем, что понимание включает в себя не только обработку и интерпретацию воспринимаемых данных, но и активацию и использование внутренней, когнитивной информации. Поскольку такую информацию можно рассматривать в качестве когнитивных предпосылок (presuppositions) конструирования модели, то мы можем назвать ее пресуппозицион- ным основанием модели. Как будет показано более подробно ниже, восприятие и понимание каких-либо событий происходит не в вакууме, а в рамках более сложных ситуаций и социальных контекстов. Понимание этих событий означает поэтому также и то, что человек использует или конструирует информацию о взаимосвязях между событиями и ситуациями. Таким образом, понимающий располагает тремя видами данных, а именно: информацией о самих событиях, информацией о ситуациях или контексте и информацией о когнитивных пресуппозициях. Имеющаяся информация может быть объединена эффективным способом, чтобы как можно скорее и лучше (то есть осмысленно и целенаправленно) было сформировано ментальное представление события. Это означает, например, что наблюдающий за происшествием может конструировать значения, основанные на его пресуппозиционной информации, в то время как внешние данные отсутствуют; все это справедливо и для слушающего историю. У него могут возникнуть ожидания того, что будет сказано, прежде чем он это услышит в действительности, и это может облегчить ему процесс понимания, когда он действительно получит релевантную внешнюю информацию. На каждом этапе нет фиксированного порядка следования между воспринимаемыми данными и их интерпретацией: интерпретации могут быть сначала сконструированы и только позднее сопоставлены с воспринимаемыми данными. Мы видим, что людям присуща способность гибкого использования различных видов информации, что информация может обрабатываться несколькими возможными способами, что интерпретируемая информация может быть неполной и что главная цель процесса заключается в возможно более эффективном конструировании ментальных представлений. Это мы называем стратегическим основанием модели. Если другим основаниям было уделено должное внимание в прежних моделях когнитивной обработки дискурса, то в центре внимания настоящей книги находится как раз стратегический подход. Мы увидим, что он нерасторжимо связан с другими основаниями, в особенности с оперативным (on-line) основанием комплексной информационной обработки событий и связных текстов. В заключение мы можем сказать, что важнейшие характеристики нашей модели основаны на представлении о том, что когнитивная обработка дискурса, равно как и любая другая комплексная обработка информации, является стратегическим процессом, в результате которого с целью интерпретации (понимания) дискурса в памяти 158
конструируется его ментальное представление. В соответствующих процессах используется как воспринимаемая информация, так и информация, содержащаяся в памяти. Конечно, рассмотренные общие основания имеют много различных следствий и импликаций. Так, у конструктивистского основания есть важное следствие, заключающееся в том, что постепенное и оперативное (on-line) конструирование представления возможно только на основе структурного анализа и синтеза, обеспечивающих выявление на различных уровнях значимых единиц, а также способов, с помощью которых эти единицы могут объединиться в более сложные единицы. Эти и другие следствия из приведенных оснований будут рассмотрены в соответствующих главах книги. 1.2.2. Контекстуальные основания. Мы уже высказали предположение о том, что связные тексты вроде рассказа о каком-либо происшествии не существуют в вакууме. Они производятся и воспринимаются говорящими и слушателями в конкретных ситуациях, в рамках широкого социокультурного контекста. Поэтому обработка дискурса—не просто когнитивное, но в то же время и социальное событие. Это утверждение, конечно, очевидно, но здесь мы хотели бы подчеркнуть, что социальные характеристики дискурса взаимодействуют с когнитивными. Другими словами, когнитивная модель должна отражать тот факт, что связный текст и соответственно процесс понимания текста осуществляется в социальном контексте. Это мы называем основанием (социальной) функциональности. Наиболее очевидное когнитивное следствие из этого основания состоит в том, что пользователи языка конструируют представление не только соответствующего текста, но и социального контекста, и эти два представления взаимодействуют. Точнее говоря, мы полагаем, что история о дорожном происшествии рассказывается и понимается в процессе коммуникации, в ходе которого слушатель получает информацию от говорящего, в данном случае о некотором дорожном происшествии (и о способе, с помощью которого говорящий кодирует это происшествие в своей памяти). Помимо всего прочего, коммуникативное основание может означать, что слушающий не просто пытается сконструировать свое представление рассказа, но сопоставляет эту интерпретацию с представлением о том, что намеревался сказать ему говорящий. Так как дискурсу присущи намерения, или интенции, нам приходится иметь дело не только с лингвистическими объектами, но и с результатами некоторых форм социальной деятельности. Так, рассказывая историю, говорящий принимает участие в социальном (в данном случае—речевом) акте, утверждающем что-то или предупреждающем слушателя о чем-то. Формы и интерпретации рассказа могут быть обусловлены этой речеактовой функцией высказывания. Мы называем ее прагматическим основанием модели обработки дискурса. Одно из когнитивных следствий этого основания состоит, например, в том, что человек, интерпретирующий рассказ, конструирует также представление соответствующих речевых актов, припи- 159
сывая определенную функцию или категорию действия речевому сообщению, а отсюда и говорящему. В этом случае слушатель оценивает дискурс с точки зрения его предназначенности к выполнению определенных прагматических функций: рассказ может быть прагматически приемлем в качестве речевого акта, только если контекстуальные условия соответствуют некоторым текстуальным свойствам. Далее, надо полагать, что интерпретация дискурса как определенного речевого акта (или серии речевых актов) является частью интерпретации взаимодействия участников коммуникации в целом. В процессе общения и у говорящего, и у слушающего есть свои мотивы, цели и намерения; то же самое относится и к другим действиям, осуществляемым в данной ситуации, с которыми связаны речевые действия. Следовательно, прагматическое основание следует обобщенно считать интерактивным основанием. Опять-таки это ведет к предположению, что пользователи языка конструируют когнитивное представление вербального и невербального взаимодействия в той или иной ситуации. Отсюда следует, например, что представление дискурса в памяти зависит от предположений слушающего о целях и других мотивациях говорящего, а также от собственных целей и мотиваций слушающего рассказ или историю. Наконец, как мы уже говорили, процесс взаимодействия участников коммуникации, включающий в себя обработку связного текста, сам по себе является частью социальной ситуации. Участники речевого общения могут исполнять определенные функции или роли; могут существовать различия в обстановке и местонахождении; наконец, могут иметь место особые правила, условия или стратегии, контролирующие взаимодействие в такой ситуации. Нельзя говорить что угодно в любой ситуации. Возможные действия, а, следовательно, возможные цели и тексты ограничены определенными параметрами ситуации. О происшествии можно рассказать в баре, дома, своему другу или случайному попутчику в автобусе, но вряд ли такой рассказ является допустимым речевым актом на экзамене. Поэтому, чтобы понять рассказ, мы должны связать его прагматическую функцию с общими интерактивными ограничениями, детерминированными социальной ситуацией или же детерминирующими ее; и это возможно только в том случае, если мы определим в нашей модели, как в ней когнитивно репрезентирована социальная ситуация. Выражаясь более конкретно, скажем, что интерпретация значения и функций рассказа о происшествии будет различной в зависимости от того, рассказывается ли история друзьям, в неформальной обстановке, или же она сообщается свидетелем в суде. Значит, в конце концов, мы должны учитывать ситуационное основание когнитивной обработки дискурса. В качестве пресуппозиций оно может включать общие нормы и ценности, установки и условности, относящиеся к участникам и возможностям взаимодействия в определенной ситуации. Несомненно, что все контекстуальные основания когнитивной обработки дискурса могут быть самостоятельно разработаны в 160
рамках социологических моделей использования языка. Но и наши функциональные основания связаны с предположением, что процесс понимания включает в себя разные виды контекстуальной информации, а представления конструируются на основе речевого акта, коммуникативного взаимодействия и всей ситуации; наконец, эти представления стратегически взаимодействуют с пониманием самого связного текста. Следовательно, понимание—это уже не просто пассивное конструирование репрезентации языкового объекта, а часть интерактивного процесса, в котором слушатель активно интерпретирует действия говорящего. Исследование характера представлений и процессов интерпретации контекстуальной информации не является нашей основной задачей, но мы постараемся их учитывать при описании процессов понимания связного текста. 1.2.3. Ограничения. У нас нет возможности рассматривать основания модели во всех подробностях. Поэтому мы, исходя из самых общих оснований, образующих базис модели, охарактеризуем только некоторые из ее компонентов. Хотя мы приводим здесь некоторые общие соображения о способах их взаимодействия, мы все же считаем, что сами компоненты могут быть описаны более или менее самостоятельно (Simon, 1969). Теперь перечислим три важнейших ограничения нашей модели: 1. Лингвистический анализ. Мы не полностью моделируем процессы анализа (или синтеза) языковой информации и ее семантической интерпретации; по большей части модель ограничена обработкой семантической информации. 2. Представление и использование знаний. Мы не будем полностью описывать базу знаний или другую когнитивную информацию, например мнения, убеждения и цели,— все, что дает необходимую информацию для различных семантических операций, используемых при понимании связного текста; используемое знание носит случайный и интуитивный характер, и мы будем останавливаться только на некоторых аспектах использования знания. 3. Мы не станем также заниматься систематическим представлением контекстуальной информации в процессах когнитивной обработки дискурса, то есть релевантными речевыми актами—общением и ситуацией; опять-таки эта информация будет использоваться для данного случая при необходимости определения семантических процессов. Поскольку мы сформулировали более или менее общие гипотезы о взаимосвязях между семантическим и другими компонентами и в некоторых отношениях довольно подробно охарактеризовали их взаимодействие, то можно считать, что принципы семантической модели достаточно четко ограничены характером других компонентов. Кроме теоретической неполноты, у модели есть ряд более эмпирических ограничений. До сих пор мы говорили о понимании 11-1182 161
связного текста вообще, используя пример понимания рассказа. Однако когнитивная обработка текста осуществляется также при участии в разговоре, беглом просмотре газеты, чтении лекции, чтении учебника, составлении полицейского отчета. Следовательно, можно считать, что принципы когнитивной обработки текста могут быть сформулированы на уровне, который охватывает все эти различные типы связного текста. Очевидно, что каждый тип текста имеет свои языковые и когнитивные различия, но мы их учитываем лишь от случая к случаю. Далее, могут встречаться весьма различные пользователи языка. Они могут обладать различными знаниями и мнениями, исполнять различные социальные роли, могут быть взрослыми или детьми, мужчинами или женщинами, могут иметь разное образование и т. д. До определенного момента мы абстрагируемся от этих различий в надежде создать такую модель, в которую все эти вещи легко могут быть включены. Наконец, существуют различные типы, стили и способы понимания. (Мы уже упоминали о просматривании газетной заметки). С другой стороны, можно активно изучать или даже заучивать наизусть текст учебника, можно читать текст с большим или меньшим вниманием, располагать или не располагать отвлекающей контекстуальной информацией. От всех этих особенностей мы также абстрагируемся, исходя из того, что пользователь языка обрабатывает всю информацию, конструирует полное представление и прекращает это конструирование, как только оно удовлетворяет ряду условий, например условиям локальной и глобальной (макрострук- турной) связности. Однако наш стратегический подход подчеркивает тот факт, что пользователи языка часто обрабатывают информацию не полностью или неточно и тем не менее чувствуют, что они понимают текст. Соответственно и мы ограничиваем модель собственно семантическим пониманием. Мы уже подчеркивали, что понимание прагматических и интерактивных аспектов дискурса не будет рассматриваться подробно, но это влечет за собой недостаточное внимание к личному опыту и взаимоотношениям слушателя, а также проблемам социального и идеологического понимания дискурса, или проблемам понимания самой личности, порождающей дискурс; такое понимание требует привлечения различных мотивацион- ных и личностных структур. Не может быть единого и однородного процесса понимания—в разных ситуациях пользователи языка демонстрируют различное понимание разных типов текста. Впрочем, наша модель отличается достаточной гибкостью и общим характером, чтобы постепенно учитывать всевозможные различия. В дальнейшем мы больше не будем всякий раз оговаривать ее теоретическую и эмпирическую неполноту. Точно так же не хотели бы особо подчеркивать идеализированный характер моделируемого процесса понимания. Перечисленные в этом разделе ограничения следует считать границами модели и в дальнейшем, то есть на протяжении всей книги. 162
1.3. Общая характеристика модели 1.3.1. Общие свойства. Многие модели языка и языкового использования, будь то в лингвистике или психологии, строятся на уровневой основе: морфонология, синтаксис, семантика и прагматика. Хотя такой принцип уместен в абстрактном описании, он не совсем пригоден с точки зрения моделей когнитивной обработки. Одно из основных допущений когнитивной модели состоит в том, что для процессов понимания и порождения текста характерно достаточно сложное взаимодействие информации, поступающей от разных уровней. Семантическая интерпретация не обязательно должна осуществляться только после завершения синтаксического анализа. Она может начаться и ранее на основе неполной информации о поверхностных синтаксических структурах, а во время синтаксического анализа может использоваться информация семантического и прагматического уровней. Хотя мы и пользуемся такими понятиями, как семантические и синтаксические единицы, все же наша модель оперирует более сложными образованиями. Так, мы будем анализировать понимание текста, начиная от слов и кончая самыми общими темами, или макроструктурами. Для понимания и интеграции всех этих различных единиц могут быть использованы различные виды информации. Так, для построения макроструктур мы можем использовать слова, в частности тематические слова, а для понимания слов использовать макроструктуры. Наша модель ориентирована не на уровни, а на комплексность описания: мы идем от понимания слов к пониманию составных частей предложения и сложных предложений, затем — к последовательностям предложений и самым высшим структурам текста. Но существует постоянная обратная связь между менее сложными и более сложными единицами: понимание функции слова в предложении зависит от функциональной структуры предложения в целом, включая синтаксический и семантический уровень. Значит, вместо традиционной структурной модели понимания и порождения текста мы оперируем стратегической моделью. Понятие «стратегии понимания» было введено в 1970 г. Бивером (Вever, 1970) в связи с рассмотрением некоторых проблем понимания предложения. Ряд других исследователей использовали это понятие, не отводя, однако, ему той центральной роли, которую сохраняем для него мы в нашей модели. Прежние представления о стратегии были часто ограничены определенными уровнями, например синтаксическим анализом. Мы хотим использовать это понятие более широко, прежде всего перейдя от уровня предложения к уровню текста. Во-вторых, нам хотелось бы использовать данное понятие на разных уровнях: для текстуальной и контекстуальной, а также внутренней и внешней информации. Стратегические процессы во многом противоположны процессам алгоритмическим, или управляемым правилами. Примером последних является порождающая грамматика, дающая структурное описание предложения с помощью правил синтаксического анализа. Процесс 163
может быть сложным, долгим, утомительным, но он гарантирует успешное достижение цели, если правила верны и применяются корректно. В стратегическом процессе такого гарантированного успеха нет, как нет и единого представления текста. Применяемые стратегии похожи на эффективные рабочие гипотезы относительно правильной структуры и значения фрагмента текста; дальнейший анализ может их и не подтвердить. Стратегический анализ зависит не только от текстуальных характеристик, но и от характеристик пользователя языка, его целей и знаний о мире. Это значит, что читатель пытается реконструировать не только предполагаемое (intended) значение текста—выраженное автором различными способами в тексте или в контексте,— но и значение, наиболее релевантное с точки зрения его интересов и целей. Стратегии—это часть нашего общего знания: они представляют собой знание о процессах понимания. Стратегии образуют открытый список. Они нуждаются в изучении и заучивании, пока они не станут автоматизированными процессами. Новые типы дискурса и формы коммуникации могут потребовать разработки новых стратегий. Если некоторые из них, например стратегии понимания слов и простых предложений, усваиваются в относительно раннем возрасте, то со стратегией формулирования основной мысли текста это происходит гораздо позже. Что же касается схематических стратегий понимания структуры психологических статей, то они могут быть усвоены только после специального обучения. Наконец, стратегии могут быть представлены в виде продукций (Newell, 1973). Если некоторые условия удовлетворены, то должно быть предпринято определенное действие. В эти условия часто входит различная информация из разных источников. Стратегия высшего уровня, которую мы расчленяем на серию более конкретных стратегий, предназначена для построения текстовой базы, которая является семантическим представлением воспринимаемого текста в эпизодической памяти. Стратегия высшего уровня, направленная на создание текстовой базы, бывает успешной, если только текстовая база удовлетворяет ряду минимальных критериев, например критериям локальной и глобальной связности. Отсюда следует, что две основные субстратегии предназначены для установления такого рода локальной и глобальной связности. Текстовые базы будут определены в терминах пропозиций и связей между пропозициями. Хотя есть и другие, формально эквивалентные способы представления значения, мы будем придерживаться этого хорошо известного принципа, который применяется в лингвистике и философии. Однако мы приписываем пропозициям больше структурных свойств, чем это обычно делается в логике, которая следует функционалистским разработкам в лингвистике (Fillmore, 1968; Dik, 1978, 1980; Givon, 1979b). Основным свойством нашей модели является предположение, что понимание текста подразумевает не только представление текстовой базы в эпизодической памяти, но также активацию, обновление и другие способы функционирования так называемой ситуационной 164
модели в эпизодической памяти: это когнитивное представление событий, действий, лиц и вообще ситуаций, о которых говорится в тексте. Ситуационная модель может инкорпорировать предыдущий опыт и, следовательно, предыдущие текстовые базы, связанные с такими же или похожими ситуациями. В гл. 10 будут приведены доводы в пользу такого рода двойного представления в эпизодической памяти. Если в следующих главах мы конкретизируем стратегии конструирования семантической текстовой базы в эпизодической памяти, то это означает, что данное представление постоянно сравнивается с ,,тем, что мы уже знаем о подобных ситуациях", то есть с эпизодической моделью. Этот процесс очень важен, поскольку дает возможность ограничить текстовую базу информацией, выраженной или подразумеваемой самим текстом, без интерполяции большого объема активированного знания. Эпизодическое и семантическое знание должно быть включено в более полную ситуационную модель, с которой постоянно сравнивается текстовая база. Это значит, что понимание ограничено оценкой текстовой базы не только в связи с локальной и глобальной когерентностью, но также и в связи с соответствующей ситуационной моделью. Таким образом, мы познаем не только концептуальное, но и референциальное значение текста. Тем самым мы вводим в когнитивную психологию хорошо известное в философии различие между интенсиональной (связанной со значением) семантикой и семантикой экстенсиональной (референциальной). Одно из очевидных преимуществ ситуационной модели связано с тем, что пользователь языка имеет возможность приписывать текстам такие фундаментальные понятия, как истина или ложь. Другим важным компонентом модели является ее управляющая система. При необходимости обработки какого-либо текста управляющая система насыщается определенной информацией о типах ситуации и текста, целях читающего, слушающего или пишущего/говорящего, схематической суперструктурой и макроструктурами (основное содержание, суть темы) текста или планами его порождения. Управляющая система контролирует обработку в кратковременной памяти, активирует и актуализирует необходимое эпизодическое и более общее семантическое знание, обеспечивает взаимодействие информации высших и низших уровней в долговременной памяти и т. д. Управляющая система гарантирует приведение в действие всех стратегий, направленных на производство информации, то есть создание семантических (а также прагматических и прочих интерактивных и контекстуальных) представлений, согласованных с основными целями понимания. Управляющая система объединяет всю информацию, которая необходима для переработки в кратковременной памяти, но в которой и не нуждается и не имеет возможности хранить на каждом этапе кратковременная буферная память. Используя при моделировании памяти аналогию с отсеками, мы полагаем, что управляющая система локализована в эпизодической памяти (если не считать, что существует более или менее отдельная управляющая память), и поэтому имеющаяся в ней информация 165
доступна как для кратковременной, так и для долговременной памяти. В гл. 10 различные функции хранилищ памяти будут рассмотрены более подробно, но в целом мы считаем, что действие стратегий осуществляется под общим контролем управляющей системы. Наконец, к решающим свойствам модели относится использование больших объемов знания, во-первых, эпизодического, а во- вторых, более общего и абстрактного знания, представленного в семантической памяти. Полагаем, что быстрый доступ и эффективный поиск жизненно важен для стратегического понимания связного текста; такой эффективный поиск возможен только при условии хорошо организованного знания, например в соответствии со схемным (или схематическим) принципом, выдвинутым в теории искусственного интеллекта и в психологических исследованиях последних лет. Но, как уже говорилось, мы не описываем здесь полностью формат для представления знаний. Полагаем, что могут быть различные формы его организации, но эти формы должны быть более гибкими, а не такими жесткими, как фреймы и сценарии. Со своей стороны мы уделяем особое внимание стратегиям использования знания. Вместо более или менее сплошной активации всего имеющегося знания, нужного для понимания слова, предложения или конструкции с глобальной темой, имеет место, как мы полагаем, стратегическое использование знания, которое зависит от целей пользователя языка, объема знания, имеющегося в тексте и контексте, уровня переработки или степени связности, необходимых для понимания и являющихся критериями стратегического использования знания, контролируемого управляющей системой. Все сказанное о знании относится и к любой другой подразумеваемой когнитивной информации, то есть к убеждениям, мнениям и установкам. И снова мы не можем представить конкретных моделей репрезентации, но, очевидно, что в большинстве случаев понимание связано с личными мнениями и оценками. Без этого вообще не могут быть установлены определенные виды локальной и глобальной связности, которые как раз предполагают личные мнения (например, о причинности) или оценки. Дальнейшее изучение проблем когнитивной обработки текста должно учитывать роль этих видов ,,горячего познания" (Abelson, 1979; Carbonell, 1978; van Dijk, 1982a: Wegman, 1981). На основе рассмотренных общих свойств модели обратимся к другим ее компонентам. 1.3.2. Препозиционные стратегии. На первом этапе работы нашей семантической модели происходит стратегическое конструирование пропозиций. Разумеется, этот этап предполагает поверхностное структурное декодирование фонетических или графических цепочек, отождествление фонем/букв и конструирование морфем, но эти чисто поверхностные стратегии мы описывать не будем. Достаточно подчеркнуть, что распознавание слов основывается на лежащей в основе семантической интерпретации, порождающей ожидания о 166
возможных значениях и, следовательно, возможных классах слов и общей синтаксической структуре предложения. Таким образом, пропозиции конструируются в нашей модели на основе значений слов, активированных в семантической памяти, и синтаксических структур предложений. Считаем, что в принципе должно быть одно-однозначное отношение между пропозициями и простыми предложениями: одно простое предложение (clause) выражает одну пропозицию. Но это значит, что наши пропозиции должны быть сложными, такими, как обычные модели в логике и философии. Лексические значения соответствуют, как правило, так называемым атомарным пропозициям. [...] Итак, мы считаем, что атомарные пропозиции организованы в пропозиционные схемы при помощи структурных отношений или функций. Схема является стратегической единицей: она обеспечивает быстрый анализ поверхностных структур и выстраивание относительно простой и жесткой семантической конфигурации. Так, существительному или местоимению в функции грамматического подлежащего, обозначающему лицо, стратегически приписывается в схеме позиция агенса, даже до завершения анализа остальной части предложения. Точно так же сложные предложения анализируются как сложные пропозиционные схемы, в пределах которых может происходить координация и взаимное объединение пропозиций в соответствующие функциональные категории. И в этом случае поверхностное упорядочение и иерархия простых предложений служат стратегическими показателями первичной организации этих сложных пропозиционных схем, хотя другая семантическая информация, имеющаяся, например, в предыдущих предложениях или во всей макроструктуре, может повлиять на окончательное установление структуры семантического представления предложения. 1.3.3. Стратегии локальной когерентности (связности). Если большинство психолингвистических моделей языкового понимания, не выходящих за рамки предложения, здесь и останавливаются, в нашей модели когнитивной обработки текста в качестве следующей задачи является установление значимых связей между предложениями текста. Ряд этих стратегий мы объединяем под общим названием стратегий локальной когерентности (связности), то есть мы считаем, что основной задачей понимания на данном этапе является конструирование локальной связности. Основное абстрактное условие локальной связности состоит в том, что сложные пропозиции обозначают факты некоторого возможного мира (van Dijk, 1977а). Следовательно, стратегическое установление локальной когерентности в когнитивной модели требует, чтобы пользователь языка по возможности эффективно проводил поиск потенциальных связей между фактами, обозначенными пропозициями. Часто соотнесенные таким образом факты обозначают тождественные референты: индивидуальные объекты или лица. Поэтому одной из возможных стратегий является поиск аргументов пропозиции, которые находят- 167
ся в отношении кореферентности с одним из аргументов предыдущей пропозиции. В нашей предыдущей работе эта стратегия рассматривалась как стратегия повторения аргументов (Kintsch, 1974; Kintsch & van Dijk, 1978). Но это только один из возможных аспектов более сложной стратегии локальной связности, которая требует, чтобы были связаны все пропозиции и все факты. Установление общей связи между пропозициями происходит на основе линейного упорядочения предложений, эксплицитных связок и знания, хранящегося в долговременной памяти. Установление локальной связности происходит в кратковременной памяти под общим контролем управляющей системы и, следовательно, в рамках макропропозиции. В нашей прежней модели понимания текста (Kintsch & Dijk, 1978) мы исходили из того, что оно происходит после полной обработки всех предложений. Теперь же, при разработке стратегической модели мы считаем вероятным, что пользователи языка стремятся к установлению связности как можно скорее, не ожидая завершения предложения или фразы. Например, они сразу пытаются связать с помощью кореференции первую же именную группу и лежащие в ее основе понятия (атомарные пропозиции) с соответствующими понятиями предшествующей пропозиции; это делается на основе информации о функциональной структуре, предшествующей пропозиции и на основе тема-рематической структуры в последующих предложениях (Givon, 1979b) или же на предполагаемой роли понятия в обрабатываемом предложении. 1.3.4. Макростратегии. Центральный компонент модели состоит из множества макростратегий. С помощью этих стратегий образуются макропропозиции, имеющие ту же структуру, что и предшествующие пропозиции. В свою очередь таким же стратегическим способом макропропозиции могут связываться в последовательности. Более того, используя релевантные стратегии вывода повторно, мы можем получить несколько уровней макропропозиций, в совокупности образующих макроструктуру текста. Это теоретическое понятие применяется для обозначения того, что обычно называется сутью, общим содержанием, темой или топиком текста. По контрасту с абстрактными макроправилами, установленными в наших прежних работах (van Dijk, 1977а, 1980b; Kintsch & van Dijk, 1978), макростратегии отличаются гибкостью и имеют эвристический характер. Языковому пользователю нет необходимости дожидаться конца абзаца, главы или целого текста, чтобы понять, о чем идет речь в тексте или в его фрагменте. Другими словами, вполне вероятно, что пользователь языка может догадаться о теме текста уже после минимума текстовой информации из первых пропозиций. Догадку может подтвердить самая различная информация: заглавие, тематические слова, тематические первые предложения, знание о вытекающих глобальных событиях или действиях и информация из контекста. Мы вновь видим, что целесообразная стратегия способна оперировать самыми различными видами информации, каждый из 168
которых в отдельности может быть и недостаточен для образования релевантных гипотетических суждений. 1.3.5. Схематические стратегии. Во многих типах дискурса проявляется традиционная, культурно-обусловленная схематическая структура—одна из высших форм, организующая макропропозиции (глобальное содержание текста). Так, рассказам обычно приписывается нарративная схема, состоящая из иерархической структуры таких традиционных категорий, как Завязка, Кульминация и Развязка. Свои схемы имеют доказательства и отчеты о психологических исследованиях. Мы называем эти схемы суперструктурами текста, так как термин ,,схема" имеет, с нашей точки зрения, слишком общий и расплывчатый характер. Суперструктура обеспечивает обобщенный синтаксис глобального значения и макроструктуры текста. Пользователи языка управляют суперструктурами стратегическим путем. Они пытаются активировать релевантную суперструктуру из семантической памяти сразу же после появления в тексте или контексте первого стимула. Начиная с этого момента, схема может быть использована как мощное средство переработки по принципу ,,сверху вниз" для приписывания релевантных категорий суперструктуры (глобальных функций) каждой макропропозиции—или последовательности макропропозиций — и в то же время обеспечивать некоторые общие ограничения на возможные локальные и глобальные значения текстовой базы. 1.3.6. Продукционные стратегии. Хотя наша модель направлена, главным образом, на понимание текста, все же полная модель когнитивной обработки текста должна включать в себя и продукционный компонент. В абстрактной теории текста не имеет значения, как выделены структуры — с помощью анализа или синтеза, поскольку правила могут быть сформулированы двумя способами: как соответствия между семантическими представлениями и поверхностными структурами и как их упорядочение. Однако в когнитивной модели и в особенности в стратегической модели мы не можем просто направить процесс отображения в обратную сторону. В каждый момент понимания продукционного процесса у слушающего и говорящего есть доступ к различного рода информации, так что релевантные стратегии тоже весьма неодинаковы. Это значит, что читатель или слушатель должен каким-то сложным способом представить себе тему дискурса, в то время как говорящий в большинстве случаев, за исключением некоторых форм спонтанного разговора, уже знает тему продуцируемого текста. Следовательно, главной задачей говорящего является построение такой макроструктуры, как семантический план текста, состоящий из элементов общего знания и в особенности из элементов ситуационной модели (включая модель слушающего и его знания, мотивации, прошлые действия и намерения—и коммуникативный контекст). 169
После создания макроплана следующей важной задачей является стратегическое управление текстовой базой на локальном и линейном уровне; при этом производится выбор между эксплицитной и имплицитной информацией, устанавливается и соответствующим образом отмечается локальная связность и, наконец, формулируются поверхностные структуры с различными семантическими, прагматическими и контекстуальными данными. В соответствии с характером стратегии понимания следует полагать, что образования локальной пропозиции и формулировки локальной поверхностной структуры не происходит после образования полных семантических макроструктур или локальных пропозиций соответственно. Говорящие, по-видимому, начинают формулировать предложения до построения полной семантической репрезентации предложения; то же самое происходит на более глобальном уровне, так что частично или ранее сформированные макроструктуры могут быть изменены ввиду локальных информационных ограничений. В особенности это относится к разговору и к тем видам монолога, в которых используется контекстуальная обратная связь со слушателями или параллельное восприятие происходящих событий или действий. К настоящему времени мы знаем очень мало о конкретных продукционных стратегиях. Хотя эти операции и их упорядочение отличаются от тех, которые используются в процессе понимания, все же вряд ли пользователи языка располагают совершенно различными и независимыми системами стратегий. Это не согласуется и с нашим основным положением, которое сводится к тому, что понимание—это не просто пассивный анализ, а конструктивный' процесс. Так, важная роль переработки по принципу ,,сверху—вниз" в процессе понимания предполагает частичное планирование (или ожидание) структур и значений предложений и целых текстов. 1.3.7. Другие стратегии. Рассмотренные основные типы стратегий понимания текста, разумеется, не исчерпывают всех возможных стратегий. И в процессах порождения, и при понимании текста действует ряд стилистических стратегий. Они дают возможность пользователям языка производить выбор между альтернативными способами выражения примерно одного и того же значения; выбор осуществляется с учетом типа текста и контекстуальной информации (тип ситуации, уровень неформальности общения, типы участников и характер общих целей). Пользователь языка должен стремиться к установлению некоторой формы стилистической связности, отбирая или интерпретируя слова определенного регистра и показатели определенной личной или социальной ситуации. Для слушателя это означает, в частности, стратегическое использование стилистических маркеров для определения различных свойств говорящего или социального контекста, таких, как гнев, любовь, стремление к сотрудничеству или проявлению власти, классовая принадлежность и другая информация, жизненно необходимая для успешного общения (Sandell, 1977). 170
Кроме того, можно выделить риторические стратегии (например, фигуры речи). Если основная функция стилистической вариантности— это указание на связи между текстом и личностным или социальным контекстом, то риторические структуры используются для повышения эффективности дискурса и коммуникации. Следовательно, они являются стратегическими по определению, так как используются исключительно в целях вербальной коммуникации, а именно понимания, восприятия дискурса и успешности речевого акта. Сами по себе они не ведут к построению семантического представления, но помогают этому процессу. Фигуры речи могут привлекать внимание к важным понятиям, выступать в качестве стимулов локальной и глобальной связности, способствовать приемлемым прагматическим интерпретациям (например, обещание, а не угроза) и придавать элементам семантического представления структурную организованность, что облегчает поиск. Параллельно с собственно вербальной коммуникацией пользователи языка стратегически перерабатывают невербальную информацию: жесты, мимику, позы и т. д. Хотя сама по себе она редко ведет непосредственно к семантическим представлениям (например, „разгневанное лицо" означает, что „говорящий в гневе"), но в целом способствует стратегиям понимания и производства текста. Жесты и выражения лица указывают на то, какой из речевых актов используется, какие семантические импликации должны быть выведены из локальных пропозиций; они могут указывать и на референтов дейктических выражений (см. Marslen-Wilson, Levy & Tyler, 1982) и на то, какие понятия требуют специального внимания и могут быть маркерами возможных макроструктур. Таким образом, в невербальной коммуникации содержится информация, существенная для всех стратегий, которые будут рассмотрены в книге и для стратегий коммуникации вообще. (Goffman, 1967, 1969; Kendon, Harris & Key, 1975; Kendon, 1981; Scherer & Ekman, 1982). Упомянутые стратегии играют особенно важную роль в диалоговых типах дискурса, например в повседневных разговорах. Поэтому как на текстуальном, так и на паратекстуальном (невербальном) уровне есть целый ряд стратегий разговора (конверсационных стратегий), в которых используются социальные и коммуникативные функции дискурсивных единиц: речевых актов или пропозиций. Система очередности в разговоре, сформулированная обычно в виде правил, в когнитивной модели должна быть переформулирована в терминах соответствующих стратегий участников применительно к распределению и присвоению роли говорящего. Кроме информации, содержащейся в данном высказывании, о пограничных синтаксических сигналах или семантическом завершении (closure) сложных пропозиций, эти стратегии поочередного участия в разговоре основываются на такой невербальной информации, как направление взгляда, жесты, паузы или сопутствующие действия участников коммуникации в сочетании с более общими социальными характеристиками этих участников и спецификой контекста (кто имеет 171
право — и силу — участвовать или вступать в разговор? См. Sudnow, 1972; Sacks, Schegloff & Jefferson, 1974; Schenkein, 1978; Franck, 1980). Стилистические, риторические, невербальные, конверсационные или другие коммуникативные стратегии, лишь упомянутые здесь, не могут быть рассмотрены в книге. Очевидно, однако, что во многих случаях они действуют параллельно с обсуждаемыми нами стратегиями, повышая, в частности, эффективность семантической интерпретации. Например, благодаря устранению неоднозначности или подчеркиванию личных мотиваций и намерений говорящих, они помогают установлению функции дискурса в рамках коммуникативного контекста или адекватного порождения и понимания речевых актов. Исследования же невербальной коммуникации и разговора следует поэтому переформулировать с точки зрения стратегической когнитивной модели, и тогда то, что было проанализировано структурными методами или с помощью интерактивных стратегий, может получить солидную когнитивную основу. 1.4. Заключение В этой главе были описаны междисциплинарные подходы, а также основные положения нашей модели. Она очерчивает макроструктуру всей книги, а именно различные компоненты стратегического подхода к переработке дискурса. Однако в ней подчеркивается, что в настоящее время модель не в состоянии обеспечивать анализ поверхностной структуры и давать полное представление знаний. Кроме того, в ней указаны различные способы, с помощью которых модель может и должна быть расширена в будущем: это и роль мнений, оценок и отношений; характер и роль стилистических, риторических, конверсационных и коммуникативных стратегий; в целом же предусматривается включение данной модели в более общую модель стратегической вербальной коммуникации в социальном контексте. С другой стороны, мы указывали на то, что у такой социальной модели должна быть в то же время когнитивная основа, которая обеспечивается репрезентацией социальных контекстов, ситуаций, участников коммуникации и интерактивных процессов. И действительно, стратегии семантической интерпретации дискурса могут быть включены в дальнейшие теоретические разработки понимания, планирования и участия в процессе коммуникации. Если в настоящее время существует некоторый разрыв между лингвистической теорией языка и дискурса и теорией социальной коммуникации, то наша когнитивная модель обеспечивает между этими двумя теориями потенциальную связь. Поскольку мы переводим абстрактные текстуальные структуры в более конкретные, интерактивные и когнитивные процессы стратегического характера и одновременно проделываем то же самое с абстрактными структурами коммуникации и социальных ситуаций, то тем самым мы получаем возможность комплексного объединения этих элементов в модели дискурсивной коммуникации. Разумеется, выполнение этой программы является 172
нетривиальной задачей, важнейшей целью будущих исследований в области междисциплинарной когнитивной науки. Глава 10. КОГНИТИВНАЯ МОДЕЛЬ В предыдущих главах мы довольно подробно рассмотрели различные процессы, связанные с пониманием связного текста. Теперь посмотрим, как это все происходит в реальном времени. Напомним, каким в самом деле сложным является „это все". Невероятным представляется то, как много задач люди могут решать одновременно, за сколькими вещами им приходится следить, сколько ограничений соблюдать в процессе понимания связного текста—и, как правило, без особых усилий, автоматически: — Воспринимаемый поток звуков должен быть интерпретирован в терминах фонем, последовательности фонем — в терминах морфем, а структурированные последовательности морфем— в терминах предложений. Максимум в течение нескольких секунд этим структурам должно быть приписано значение, и при максимальном темпе произношения приписывание значения лексическим единицам должно осуществляться в интервале от 0,1 до 0,2 сек. — Одновременно с этим части предложений должны быть объединены в предложения, должны быть выявлены отношения, обеспечивающие связность данных предложений, в целях определения топика, или темы, данного фрагмента должны быть установлены его глобальные макроструктуры. — Интерпретация текста зависит от общих или эпизодических знаний о мире, которые должны быть найдены, выборочно активированы и приведены в действие. Для установления локальной и глобальной связности необходимы умозаключения, основанные на знаниях. — И в то же время слушатель должен учитывать многообразные данные коммуникативного контекста, в том числе относящиеся к типичной социальной ситуации, говорящему, типам взаимодействия, условиям речевого акта. Интерпретация этих данных опять-таки основывается на памяти (например, на эпизодической памяти о говорящем). — Эти различные уровни интерпретации не являются независимыми, они должны быть связаны друг с другом. Поверхностные сигналы могут быть релевантными не только для стандартной лексической или синтаксической интерпретации, но и для выражения макроструктур, типов речевых актов и различных свойств коммуникативного взаимодействия. Это характерно и для других отношений между синтаксисом, семантикой и прагматикой. — Помимо этого, слушающий должен учитывать различные типы информации, необходимой для управления процессом интерпретации, включая фрейм коммуникативного взаимодействия (например: ,,это урок", ,,это суд"), речевой макроакт, 173
семантическую макроструктуру, схематические суперструктуры и некоторые другие параметры, относящиеся, например, к стилистике и риторике. — При осуществлении этих процессов должно быть активировано не только знание, но и мнения, установки, ценностные ориентации и эмоции, необходимые, например, для оценки содержания или коммуникативного намерения связного текста. — Наконец, одновременно со всем этим слушатель должен учитывать свои собственные желания, интересы, цели и планы, которые оказывают воздействие на все другие компоненты процесса понимания. Так или иначе, описывая этот процесс с научной точки зрения, мы достигли того, что процесс понимания, казавшийся интуитивно простым и элегантным, теперь представляется весьма сложным. Однако, как мы показали в предыдущих главах, все эти факторы действительно влияют на понимание и связаны с ним определенным образом. За кажущейся простотой понимания связного текста скрывается очень многое. Вместе с тем, как показывает анализ, понимание дискурса по своей сложности необязательно превосходит другие виды человеческой деятельности, не связанные с употреблением языка. Так, например, если столь же детально проанализировать такое действие, как передвижение человека в толпе (например, студента, идущего на лекцию), то уровень сложности описания будет ненамного меньше. Таким образом, простые, на первый взгляд, типы поведения требуют сложных описаний и теорий. Задачей когнитивной теории является конструирование системы, в рамках которой могут быть представлены и скоординированы (без нарушения известных ограничений на информационные способности человека) все процессы, происходящие при понимании связного текста. К наиболее важным ограничениям, которые здесь нас интересуют, относятся ограничения на запоминание и обработку информации (processing constraints). Перцептивные ограничения известны лучше и здесь не рассматриваются. Ограничения на обработку информации, проявляющиеся при понимании дискурса, исследуются с недавнего времени и пока еще плохо изучены (см. одну из первых работ на эту тему: Britton, Meyer, Hodge & Glinn, 1980, а также Эксперимент 3, разд. 6.6). В принципе когнитивные процессы, как нам представляется, могут осуществляться параллельно и при определенных обстоятельствах, не препятствуя друг другу (обзор соответствующей литературы см в: Kintsch, 1977а, Ch. 3). Однако возможности параллельной обработки ограничены пределами ресурсов и данных возможностей. Пределы данных возможностей очевидны, когда индивидуум не в состоянии чего-то сделать даже в благоприятных обстоятельствах (например, человек не способен прыгнуть на 100 м или решить сложную физическую проблему без соответствующей базы знаний). Пределы ресурсов имеют место, когда что-то можно сделать в принципе, но не в реальной ситуации (например, испытуемые в одном из проведенных нами экспериментов могли 174
строить макроструктуры, но для некоторых трудных текстов они оказались не в состоянии это сделать после первого прочтения, поскольку были слишком перегружены выполнением других задач, необходимых для понимания текста. Ограничения на ресурсы могут быть обойдены с помощью автоматизации поведения. Так, стратегия понимания, которую нужно использовать сознательно и которая требует особых усилий, имеет ограниченное применение, поскольку во многих реальных ситуациях для применения такой стратегии в наличии имеются лишь ограниченные ресурсы. С другой стороны, хорошо отработанные, полностью автоматизированные стратегии могут работать параллельно, не перегружая систему. Ограничения на обработку информации, несомненно, окажутся в ближайшие годы в центре внимания исследований по дискурсу. Хотя и нельзя сказать, что в своем весьма поверхностном обсуждении данной проблемы мы уделили ей должное внимание, однако больше мы к ней возвращаться не будем. Вместо этого обратимся к проблеме ограничения на запоминание. Ограничения на запоминание бывают двух типов. Во-первых, хорошо известны ограничения кратковременной памяти. По данным некоторых экспериментов (Broadbent, 1975), возможности кратковременной памяти ограничены примерно четырьмя ,,порциями" информации (chunks) или примерно двумя единицами в экспериментах по свободному припоминанию, где для поддержания кратковременной памяти могут использоваться меньшие ресурсы (Glanzeг & Razel, 1974). Мандлер считает, что сознание ограничивается одной- единственной идеей (Mandler, in press). Понятно, что в кратковременной памяти нет места для всей информации, которую необходимо обрабатывать и поддерживать в процессе понимания текста, как бы мы ее ни членили. Ясно также, что большая часть происходящих процессов при понимании текста не осознается, и поэтому нет причин для отнесения их к кратковременной памяти. Какова все же роль кратковременной памяти в понимании? Второй тип ограничений памяти, интересующий нас здесь, связан с ограничениями поисковых возможностей. Чтобы найти в памяти какой-либо элемент, поисковый стимул, или ключ (cue), должен, по крайней мере, частично совпадать с закодированной единицей. Стимул, или ключ, должен подходить к коду. Эффективность памяти определяется не кодированием или поиском, а взаимодействием кодирования и поиска. Это и есть принцип специфического кодирования Тулвинга—Томсона (см. Tulving & Thomson, 1973). Принятая нами точка зрения относительно кодирования очень проста. Память — это побочный продукт обработки информации; каждый запоминает то, что он делает. Важное значение имеет глубина и детализация обработки: более глубокие и детализированные процессы обработки информации оставляют в памяти больше следов, которые позднее могут быть восстановлены. Множественное кодирование оставляет следы, с которыми может совпасть большее число поисковых стимулов. Таким образом, от характера кодирования в значительной степени зависит, насколько хорошо запомнится 175
то или иное событие: детализированное, семантически осмысленное кодирование событий и хранение их в развитых и легкодоступных структурах обеспечивает высокую степень запоминания. Решающую роль при этом играет образность. Далее мы покажем, что понимание связного текста совершенно естественно порождает благоприятные условия для кодирования информации в памяти. Поисковый стимул эффективен, если частично совпадает с закодированным в памяти эпизодом. Затем этот эпизод может быть найден и восстановлен в кратковременной, активной памяти. Однако эффективность поиска обычно не просто зависит от эффективности изолированного стимула, но от его действенности в поисковой системе. В такой системе поисковый сигнал не только приводит к восстановлению в памяти нужной информации; одновременно с этим порождается другой сигнал, позволяющий найти расширенную информацию. Поэтому хранящиеся в памяти эпизоды, интегрируемые в такую систему, обнаруживаются гораздо легче, чем неорганизованные, изолированные следы памяти. Ниже мы постараемся показать, что понимание связного текста по самой своей природе ведет к созданию высокоинтегрированных поисковых систем и, тем самым, к высокоорганизованной памяти, в особенности если сравнить соответствующие процессы с запоминанием неорганизованных списков слов в классических исследованиях памяти. Однако прежде чем перейти к рассмотрению этих проблем, мы вынуждены внести в нашу картину понимания связного текста еще одно усложнение, весьма существенное для исследования памяти. Дело в том, что с точки зрения процессов, происходящих в памяти, целью понимания дискурса является не просто его запоминание, а, скорее, запоминание того, что в нем содержится, то есть того, о чем говорится в связном тексте. Этот очевидный факт имеет далеко идущие последствия, которые необходимо рассмотреть, прежде чем мы сможем продвинуться далее в исследовании динамики запоминания связного текста. 10.1. От репрезентации текста к модели ситуации Если мы обратимся к моделям обработки связного текста, то заметим, что в большинстве случаев носитель языка постепенно конструирует представление текста в эпизодической памяти. В принципе репрезентация текста включает в себя не только поверхностную— семантическую и прагматическую — информацию, но и схематические суперструктуры. Кроме того, считается, что репрезентация текста имеет иерархическую природу, включающую микроструктуры, организованные посредством линейных связей в терминальные категории. В предыдущих главах мы указывали на ограничения, характерные для данной концепции. В достаточно общем виде проблема состоит в том, что в репрезентацию текста включаются не только элементы текста, но и элементы знания. Сколько таких элементов входит в состав репрезентации текста? Другими словами, является 176
ли она содержательно богатой и разветвленной структурой, как подсказывает нам интуиция и эксперименты, или же в основном ограничивается представлением самого текста? Где нужно провести границу? В настоящей книге мы последовательно проводим точку зрения, в соответствии с которой репрезентация текста является относительно однородной и не очень сложной; мы полагаем, что в нее необходимо включить только те умозаключения, которые необходимы для установления когерентности на локальном или глобальном уровнях. Другие исследователи выдвигали гипотезы о более обогащенных репрезентациях, включающих в себя дискурс и его контекст, а также внутреннее знание, привлекаемое в процессе интерпретации. Грессер продемонстрировал, например, как тексты в процессе понимания могут обогащаться выводами и следствиями (Graesser, 1981). Мы же считаем, что эти усложнения, за исключением тех, которые текстуально необходимы, являются не частью собственно текстовой репрезентации, а скорее входят в состав конструируемой слушателем или читателем ситуации, модели, обозначенной в тексте. Именно эта модель собирает и поставляет всю релевантную информацию для адекватного понимания текста... Различие между репрезентацией ситуации и текста не является абсолютно новым. В нашей работе (van Dijk, 1977а) это различие разрабатывалось с помощью таких понятий, как ,,факты", „возможные миры" и ,,мод ели дискурса". Аналогичные понятия использовались и другими исследователями; ср. ,,дневники референции" Кларка я Маршалла (1978), ,,референты дискурса" Картунена (1976), „дискурсивные сущности" Нэш-Веббер (1978а), ,,сети референции" Хабеля (1982), „теорию текста—мира" Петефи (1980), „репрезентации дискурса" Кампа (1981) и „ментальные модели" Джонсона-Лэрда (1980). Различаясь в деталях, все эти понятия мотивированы одним и тем же интуитивным представлением: чтобы понять текст, мы должны представлять себе, о чем он. Если мы не в состоянии представить себе ситуацию, в которой индивидуумы обладают свойствами или отношениями, обозначенными в тексте, то не сможем понять и сам текст. Если мы не понимаем отношений между локальными и глобальными фактами, о которых говорится в тексте, то мы не понимаем и текста. Сказанное является прямым следствием, вытекающим из наших представлений о роли использования знания в понимании текста. Использование знания в понимании текста означает способность соотносить текст с некоторой имеющейся структурой знания, на основе которой и создается модель ситуации. В процессе этого вспоминаются прошлые ситуации, как конкретно-эпизодические, так и обобщенно-семантические ситуации. (Schank, 1979). В большинстве интерпретированных нами текстов описываются объекты, лица, места или факты, уже известные нам из прошлого опыта. Хранящиеся в памяти ситуации входят в состав (пересекающихся) структур (или кластеров), образованных по признаку сходства. Поскольку они имеют эпизодический характер, то, разумеется, они субъективны и различны у каждого человека. Так, у каждого из нас есть субъек- 177
тивные кластеры опыта, связанные с городом, в котором мы живем, с домом, друзьями, местом работы и основными событиями жизни. Точно так же у каждого из нас есть в той или иной мере сходные кластеры опыта, связанные с такими понятиями, как страны, города, исторические события, политические события, известные люди. С другой стороны, в случае деконтекстуализации, опыт становится почти или совершенно общим; ср., например, знание арифметики или правил шахматной игры. Мы полагаем, что в процессе понимания подобные кластеры отыскиваются и используются в качестве основы для модели новой ситуации. Иногда можно непосредственно использовать имеющуюся модель, иногда же ее нужно сконструировать из нескольких частично пригодных, уже существующих моделей. Выдвигалось предположение (Carbonell, 1982), что рассуждение по аналогии является мощным средством для преобразования имеющихся, но неподходящих моделей в модели, отвечающие требованиям определенной задачи. Так, текст напоминает понимающему о некотором прежнем опыте, а затем этот опыт используется для создания модели данной ситуации. Обычно для этого требуется трансформировать каким-то образом старую структуру опыта, и в связи с этим Карбонелл рассматривает различные операторы, которые можно использовать для постепенной трансформации существующей структуры в новую структуру, основанную на анализе „средства—цель". В этом смысле понимание связного текста можно рассматривать как решение определенной задачи. Сконструированная таким образом модель ситуации представляет собой основу для интерпретации текста. Она охватывает все знание, включая то, которое содержится в тексте имплицитно или же подразумевается. Общее знание используется точно так же, как специфический опыт: и то, и другое образуют основу для моделей ситуаций и, следовательно, для кодирования нового опыта. 10.1.1. Для чего нужна модель ситуации. Теперь рассмотрим ряд специальных лингвистических и психологических понятий, нужных для демонстрации того, что модели ситуации являются не просто правдоподобными, но действительно необходимыми для анализа феноменов понимания дискурса и памяти. Референция. В философии и лингвистике стало привычным проводить различие между „значением" и „референцией". Мы используем слова или референциальные выражения для обозначения различных объектов — отдельных предметов, свойств, отношений и фактов (истинностных значений) в некотором возможном мире. В психологии различием между значением и референцией обычно пренебрегали. Этот недостаток может быть устранен с помощью модели ситуации. Обозначаемый мир не является когнитивно релевантным: то, что мы видим или представляем,— опять-таки некая конструкция, модель ситуации. Это репрезентация того фрагмента мира, о котором говорится в тексте. Конечно, многое из этого фрагмента остается недоговоренным в тексте, главным образом 178
потому, что слушатель уже многое знает об этом. С другой стороны, главная (семантическая и прагматическая) функция текста состоит в обогащении модели — в получении знания. Все это относится не только к семантической информации в ассертивных контекстах, но и к угрозам, обещаниям и извинениям: эти речевые акты информируют нас о нуждах, желаниях или мнениях говорящего по отношению к нашим действиям. Это значит, что кроме чисто ,,семантической" модели ситуации, нам нужна коммуникативная модель контекста, представляющая речевые акты и лежащие в их основе намерения, а также дополнительная информация о говорящем, слушающем и контексте. Мы можем предположить, что именно коммуникативная модель контекста устанавливает связь между моделью ситуации и репрезентацией текста. Репрезентация текста—это, так сказать, семантическое „содержание" коммуникативного акта, референциальной основой которого является модель ситуации. Здесь мы не можем полнее раскрыть точный смысл коммуникативной модели контекста и ее отношений с репрезентацией текста или моделью ситуации. Кореференция. Выражения в дискурсе относятся не к другим выражениям или лежащим в их основе понятиям текста, а к индивидуумам в модели ситуации. Выражения ,,мой брат" и „адвокат" могут иметь различные концептуальные значения, но и то и другое может относиться к одному и тому же индивидууму, скажем Джону. Модель ситуации содержит репрезентацию того же индивидуума. Понятие кореференции не будет иметь существенного значения в когнитивной процедурной теории понимания, если у нас нет возможности координировать репрезентацию с моделью ситуации. Джонсон-Лэрд и Гарнэм (1980), Кларк и Маршалл (1978), Карттунен (1976) и Веббер (1978а) углубили разработку этого положения. Когерентность (связность). В одной из наших предыдущих работ мы подчеркивали, что локальная и глобальная связность основываются на отношениях между пропозициями. Грубо говоря, текстовая база является локально связной, если обозначаемые факты связаны, например, условными, временными или причинно- следственными отношениями. Опять-таки реальные факты внешнего мира нерелевантны для когнитивной теории, поэтому нам нужна их репрезентация, то есть модель. Если в модели ситуации, построенной слушающим, репрезентируемые факты связаны, тогда данный фрагмент текста является когерентным. Ситуационные параметры. Такие же аргументы можно привести и в отношении роли, выполняемой в дискурсе параметрами возможного мира, времени и места. Мы уже видели, что в отдельных предложениях текста они часто остаются невыраженными. Иногда эти элементы подразумеваются, выводятся из контекстной информации или только однажды упоминаются в тексте, так что их область действия распространяется на интерпретацию последующих предложений. В репрезентации текста этот вид локализации соответствующих пропозиций объяснить нелегко, а то и невозможно. В модели это было бы очевидно. Модель точно определяется параметрами 179
обстоятельств; она на самом деле является „моделью ситуации". Перспектива, В связных текстах могут быть выражены различные и изменяющиеся перспективы, или точки зрения (Black, Turner & Bower 1979). Это означает, что различные люди видят, интерпретируют, описывают и говорят о фактах или ситуациях с различных точек зрения. Однако мы знаем, что описываются одни и те же факты. Это интуитивное представление можно легко объяснить, если у нас имеется устойчивая точка отсчета, а именно— модель ситуации, более или менее независимая от актуального дискурса и его точки зрения. Перевод. Перевод — это не просто операция по превращению одной поверхностной формы в другую, и даже не превращение одной текстовой репрезентации в другую, но скорее соотнесение текстовых представлений через посредство модели ситуации. Это не так легко заметить, если у двух языков примерно одна и та же база знаний, которая во втором языке столь же имплицитна, что и в первом. Но если дело обстоит по-другому, когда, например, культурный код языка-источника сильно отличается от языка перевода, тогда для перевода требуется эксплицитная модель ситуации, иначе его не удастся сделать осмысленно. Этот момент подчеркивал Хатчинз (Hutchins, 1980), который перевел запись спора о земельных правах жителей островов Тробрианд. Текст кажется совершенно бессмысленным („примитивным", „алогичным") до тех пор, пока мы не соотнесем его с лежащей в основе моделью ситуации— земельным правом и обычаями на Тробриандских островах, которые нам совершенно чужды; но эти права и обычаи известны и обычны для участников спора и имплицитно подразумеваются ими. После такого соотнесения текст становится таким, каков он есть на самом деле: сложным, связным и логичным рассуждением. Индивидуальные различия в понимании. Хорошо известно, что два человека могут получить одну и ту же информацию, но воспринять ее как два совершенно различных сообщения. Иногда это может сопровождаться построением различающихся репрезентаций текста. Ранее мы обсуждали, как цели и интересы могут привести читателей к построению различных макроструктур одного и того же текста. Возможности искажения микроструктуры текста являются, как правило, меньшими. Однако интерпретационные различия не обязательно должны относиться к уровню репрезентации текста, они скорее появляются на уровне моделей ситуации. Мы слышим одно и то же сообщение, но понимаем его по-разному. Литературные тексты часто не ограничивают жестко модель ситуации, давая читателю большой простор для создания собственной модели. Дебаты о том, что „значит" классический текст, часто ведутся не о самом тексте, а о той модели ситуации, которую нужно построить на его основе. Уровень описания. В идеальном случае тексты предназначаются для своей аудитории: они предполагают совершенно определенный объем, не утомляющий читателя излишней информацией, но и не лишающий его информации необходимой, то есть той, которая у 180
читателей отсутствует. Это ведет к большой экономии в коммуникации, при условии общей требуемой базы знаний. Если этого нет, то возникает ситуация, в которой часто оказываются этнографы и дети,—и тогда требуется изменение уровня дискурса: в нем должна быть передана наряду с информацией и необходимая модель ситуации. Память, В психологической литературе приведено несколько четких демонстраций того, что в определенных условиях люди запоминают модель ситуации, а не репрезентацию текста. Обычно это бывает в условиях, когда очень трудно построить репрезентацию текста, например из-за того, что используется очень много похожих предложений, что приводит к значительной интерференции, поэтому понимающий отвлекается от репрезентации текста и сосредоточивается целиком на модели ситуации, обычно явной и простой (например: Bransford & Franks, 1972; Potts, 1972; Barclay, 1973). Так, легко запомнить, что ,,ястребы умнее медведей, которые умнее львов, которые умнее, чем волки", но почти невозможно запомнить целую группу сравнительных предложений со всеми аргументами в различных комбинациях. Функция этих предложений состоит единственно в том, чтобы помочь слушателю сконструировать соответствующую модель ситуации, но не текстовую базу (которая в любом случае была бы чрезвычайно обедненной). Другой способ показать, что запоминается модель ситуации, а не текстовая база, состоит в представлении испытуемым таких пар предложений, которые демонстрируют, что различия в их текстовой базе минимальны (скажем, различие относится только к употреблению предлогов), но зато существуют немалые различия в модели ситуации (один-единственный предлог способен резко изменить описываемые ситуации). В этом случае испытуемые опять-таки смешивают предложения, но не ситуации (Bransford, Barclay & Franks, 1972; Garnham, 1981). И, наоборот, бывают ситуации, когда люди запоминают текст, вообще не имея модели ситуации, например, когда детей учат петь древнееврейские тексты и тексты Корана, а они их не понимают. Однако обычно долговременная память заполняется очень скудно, если отсутствует понимание, или, что то же самое, модель ситуации; это было продемонстрировано, например, хорошо известными работами Брэнсфорда и Джонсона (Bransford & Johnson, 1972). Существуют достаточно серьезные теоретические объяснения того, почему память должна быть теснее связана с моделью ситуации, а не с самой текстовой базой; поиск скорее всего производится в том случае, если эпизод, содержащийся в памяти, входит в более крупную структуру, которая может служить поисковой системой. В силу своей природы модели ситуации стремятся к вхождению в такие системы и образуют часть более крупной модели, тогда как текстовая база более свободно ассоциируется с этими структурами, часто через соответствующую модель. Тогда поиск текстовой базы требует активации модели, но не наоборот. Это, разумеется, верно не во всех случаях, поскольку хотя и возможно отыскать текстовую базу непосредственно по 181
какому-то одному элементу текста, но это скорее исключение, чем правило. Далее, сама текстовая база, выполнив свою основную функцию в качестве переходной ступени к модели ситуации, редко активируется повторно, тогда как корреспондирующая модель, при условии, если она содержит важную для индивидуума информацию, может подвергаться широкому использованию и обновлению, как мы увидим в дальнейшем. Эта поисковая практика чрезвычайно усиливает поисковые способности модели (Hogan & Kintsch, 1971), в то время как сама текстовая база не обладает такими преимуществами. Переупорядочивание. Когда людям рассказывают истории, в которых нарушен порядок событий, они часто пересказывают их в канонической форме (см. Kintsch, Mandel & Kozminsky, 1977). Есть два способа объяснить этот феномен, и оба они используют модель ситуации. Во-первых, возможно, что при пересказе люди реконструируют рассказ на основе модели ситуации, сформировавшейся у них при прослушивании рассказа в искаженной форме: и когда у них появляются соответствующие схемы знаний, они получают возможность из искаженной последовательности построить каноническую модель; при пересказе они работают именно с этой моделью, а не с собственно текстовым представлением. Возможен и другой случай, когда, несмотря на искаженный источник, текстовое представление вводится в память в правильной последовательности. Однако единственная возможность произвести такое упорядочение связана с построением модели ситуации в канонической форме, после такого построения ее используют для перестройки текстового представления. В любом случае переупорядочивание искаженного повествования предполагает построение модели ситуации. Межмодальная интеграция. Часто встречаются случаи, когда необходима интеграция информации из текстовых и нетекстовых источников. Модель ситуации, которую можно модифицировать либо с помощью прямого восприятия и действия, либо через посредство дискурса, образует столь необходимую связь между модальностями. Решение задач. Модель ситуации играет особенно важную роль, когда на основе чтения текста нужно выполнить какое-либо действие, например, решить задачу. Основой для решения задач является не сама текстовая база непосредственно, а выведенная из нее модель. Техника решения задач, например, математика и логика, применяется к модели, а не прямо к естественному языку. Поэтому логика—неподходящий формализм для языкового представления. Язык просто дает сигналы, указывающие на то, какой тип модели нужно сконструировать, а понимающие интерпретируют эти сигналы стратегически. Модель ситуации, являющаяся результатом интерпретирующего процесса, образует основу для дальнейших когнитивных операций, таких, как формальное логическое рассуждение и другие виды выводов и решения задач. В заключительном разделе этой главы мы опишем случаи, когда модель ситуации образует основу для использования арифметических операций, как это происходит при решении словесных задач в арифметике. 182
Обновление и соотнесение. Это две наиболее важные функции использования модели ситуации. Репрезентации текста связаны с другими элементами в памяти — общим знанием, а также личным опытом — в значительной степени через соответствующие им модели. Таким образом, они участвуют в сети памяти, которая определяет их дальнейшее использование с помощью моделей, построенных на их основе. Точнее говоря, не всегда бывает так, что каждый текст ведет к построению отдельной и новой модели ситуации. Гораздо чаще уже существующая модель ситуации изменяется под воздействием нового текста. Это происходит, например, при обновлении знаний после сообщения новостей. То, что мы помним о таких широко освещаемых в печати событиях, как, например, Уотергейт, обновляется часто, и так же часто модифицируется модель ситуации, которая интегрирует разнообразный опыт и содержит в себе не только декларативные утверждения, но и мнения, установки, эмоции и даже, возможно, мораль. Несмотря на чрезвычайно важную роль обновления знаний, экспериментальные исследования и теоретические разработки в этой области находятся пока на начальном этапе. Интересная работа по обновлению памяти на основе сообщаемых новостей была проделана Ларсеном (Larsen, 1982) и Финдалом и Хейджером (Findah1 and Hoijer, 1981); теоретические аспекты процесса обновления были исследованы с помощью моделирующей программы Колоднером (Kolodner, 1980). Обучение. Последней по порядку, но не по значимости является использование модели ситуации в качестве основы обучения. Обучение по тексту — это обычно не заучивание текста. Концептуально лучше всего представить себе обучение как модификацию модели ситуации. Вопросы о том, какие модификации заслуживают названия ,,обучение", как они осуществляются, какие здесь действуют механизмы и ограничения, выходят за рамки настоящей книги. Однако после долгого отставания теория обучения вновь выходит на передний край, уже в рамках когнитивной науки (см., например, Anderson, 1982). Мы можем только надеяться, что представленная здесь теория понимания связного текста обеспечит надежную основу для исследования связи обучения и текста. И с практической, и с теоретической точек зрения, потенциально — это одно из наиболее важных направлений исследований. 10.1.2. Почему также необходимы текстовые базы. Приведенные в предыдущем разделе рассуждения, разъясняющие, почему необходимы ситуационные модели, производят убедительное впечатление. Действительно, они являются таким сильным доводом в пользу ситуационной модели, что возникает искушение радикально упростить модель понимания дискурса, отбросив вообще понятие репрезентации текста. Должны ли мы в самом деле настаивать на многоуровневой пропозициональной текстовой базе? Разве не можем мы просто иметь слова с одной стороны, а модель ситуации—с другой? Какую роль играет репрезентация? Приведем сначала несколько доводов в пользу того, почему 183
представления поверхностной структуры являются необходимыми компонентами текстовой базы: 1. Тексты не просто выражают значения или соотносятся с фактами, элементами и отношениями, они делают это особым, лингвистическим способом. По ряду причин необходимо запоминать поверхностные структуры. Для грамматических отношений, выходящих за пределы предложения, существенное значение может иметь и точная поверхностная структура предыдущего предложения. 2. Тексты могут различаться по стилю: даже если мы говорим об одних и тех же фактах, способ их описания может быть различным. Эти стилистические особенности получат семантические, прагматические и интерактивные интерпретации: и носители языка как на протяжении текста, так и гораздо позже воспринимают данный стиль и его особенности либо непосредственно, либо с помощью поиска релевантных семантических или интерактивных функций. 3. На каждом из уровней текста могут действовать различные риторические операции. Опять-таки эти операции используются не столько для выражения фактов, сколько в коммуникативных целях, чтобы сделать дискурс более эффективным. И снова у пользователей языка может возникнуть различная реакция на такие риторические средства, как рифма, аллитерация, метафора и т. п. Однако процессы понимания не могут быть ограничены поверхностными структурами — они требуют привлечения концептуальных процессов, основанных на пропозициональных репрезентациях: 1. Дискурсы иногда имеют особую суперструктурную схему. Будучи либо канонической, либо трансформированной, схема чаще всего не зависит от обозначаемых фактов и связана скорее с глобальным упорядочением макросемантической или макропрагмати- ческой информации. 2. На глобальном уровне происходят также возможные (переупорядочения в представлении пропозиций в соответствии с когнитивными, прагматическими, стилистическими, риторическими или интерактивными ограничениями. Эти переупорядочения не столько зависят от фактов, сколько от способа их представления слушателю. 3. То, что было сказано ранее о перспективе, может быть выражено по-другому следующим образом: если речь идет об одних и тех же фактах, мы можем описывать их с разных точек зрения, чтобы люди получали доступ к описаниям с различной перспективой. Таким образом, существует двойная необходимость в репрезентации текста. С одной стороны, это необходимая стадия на пути к ситуационной модели. По крайней мере, в излагаемой здесь теории мы просто не можем сконструировать эксплицитную модель ситуации без промежуточной пропозициональной репрезентации текста. Впрочем, вряд ли и другие теории могут обойти эту промежуточную стадию, не введя через черный ход некоторого нотационного варианта. Но, с другой стороны, мы должны отделить репрезентацию текста от ситуационной модели, поскольку представление текста 184
и представление ситуации не всегда совпадают. Представление текста вполне может иметь свое собственное и особое существование в памяти. Точно так же, как обычно скорее вспоминают ситуацию, обозначаемую текстом, чем сам текст, могут и часто на самом деле вспоминают текст per se—его организацию, его макроструктуру, которая может (хотя и не обязательно) иметь какие-то общие свойства со структурой ситуации. Для представителя когнитивной науки решающим является выяснение того, что мы относим к тексту и его производным, специфичным только для него структурам типа пропозициональной текстовой базы, и что мы относим к внешнему миру. Эти две вещи смешивать нельзя. 10.1.3. О репрезентации ситуационных моделей. Мы уже приводили ряд доводов в пользу ситуационных моделей. В то же время эти аргументы обеспечивают критерии для создания адекватной теории ситуационных моделей. Критерии должны допускать формулировку различных явлений и процессов в терминах структуры и использования таких моделей. Здесь мы не можем ставить себе целью создание полной теории эпизодических ситуационных моделей, но, тем не менее, некоторые предположения могут послужить предпосылками для создания такой теории. Мы уже видели, что модель ситуации— это интегральная структура эпизодической информации, вобравшая в себя прошлую эпизодическую информацию о какой-то ситуации и задействованную общую информацию из семантической памяти. Далее, при понимании текста модель ситуации должна обеспечивать обновление и, наконец, формировать основу для обучения. Поскольку предшествующие входные данные, а также обобщенный выход и способ использования информации в различных задачах, как правило, различны по структуре, мы должны предположить, что модель ситуации также имеет схематический характер. Подобно сценариям и фреймам, она должна допускать существование переменных терминальных категорий. Это—приемлемая гипотеза, поскольку она позволяет нам (а) использовать (части) сценариев и фреймов в качестве каркаса ситуационной модели, и наоборот; (б) легко переходить от модели ситуации к более абстрактному деконтекстуализован- ному сценарию или фрейму с помощью процесса обучения. В самом деле, если нам довелось только раз лететь на самолете, у нас еще нет сценария, а есть только одна-единственная ситуационная модель соответствующего эпизода (об эпизодической иллюстрации формирования сценариев у детей см. Schank & Abelson, 1977). Приобретаемый позднее опыт такого рода дополнит, скорректирует основанную на опыте схему и одновременно войдет в нее. Другими словами, модель ситуации отличается от фрейма или сценария тем, что носит гораздо более личностный характер, основана на личном опыте и охватывает многие детали, от которых можно абстрагироваться при обучении. Теперь представим на минуту, что такой эпизодический след прошлой информации связан со сложным событием или эпизодом вроде дорожного происшествия. Или потому, что мы были участниками такого происшествия, или потому, что 185
видели подобное или слышали рассказ о таком событии, у нас формируется представление об этом сложном событии. В соответствии с нашей теорией комплексной обработки информации прошлый опыт, скорее всего, недоступен во всех деталях. Гораздо более вероятно, что прошлое событие будет доступно в результате поиска на макроуровне. Другими словами, модель ситуации формируется — и обновляется—главным образом, предшествующими макропропозициями (на основе восприятия, действия или дискурса) вкупе с некоторыми случайными деталями. Соблазнительно выдвинуть гипотетическое предположение, что структура ситуационной модели образуется фреймом, подобным пропозициональному фрейму: на вершине его предикат, содержащий информацию ,,участие в дорожном происшествии", а затем следует список участников, расположенных, например, таким образом, что роль агента может быть заполнена самим действующим лицом ,,Я", после чего могут следовать другие участники. Затем событие локализуется по месту, времени и условиям. Отметим, что макропропозиция, представляющая прошлую информацию, может быть менее полной и не включать, например, других участников и информацию о других подробностях. Однако в модели ситуации должна быть полная схема, в которой по мере накопления опыта могут заполняться ,,пустые" категории. Коль скоро мы предположили, что пропозициональная схема в качестве терминальных единиц имеет атомарные пропозиции, то опыт, получаемый об аналогичных событиях (дорожных происшествиях), может накапливаться путем заполнения терминальных категорий соответствующими пропозициями. Конечно, можно представить себе, что эти пропозиции как-то упорядочены. Во-первых, может быть упорядочение по новизне с размещением в каждой категории новейшей информации сверху. Но наряду с этим может быть и упорядочение по релевантности: мы, без сомнения, лучше помним аварию, случившуюся с нами 5 лет назад, чем происшествие, о котором мы читали в газете 5 дней назад (и которое может быть даже понято без обращения к личным воспоминаниям о перенесенной аварии). В любом случае информация о некоторых конечных категориях может в свою очередь стать настолько сложной, что сама будет суммирована в какие-то макропропозиции: мы можем сгруппировать опыт дорожных происшествий в определенный класс и проделать то же самое с аналогичными условиями происшествий. Отметим, что подробности каждой ситуации могут быть легко вписаны в такой фрейм модели: дополнительные характеристики участников могут быть размещены под терминальными категориями участников, и то же самое относится к свойствам самого события и его локализации. Точно так же у нас есть обратные макроправила, позволяющие нам разложить макрособытие на подготовительные или обусловливающие события, составляющие события и последствия. Этот вид формата ситуационной модели легко отыскивается и хорошо согласуется с другими основными положениями. В процессе понимания текста мы прежде всего стремимся установить некоторую 186
временную (provisional) макропропозицию. Эта макропропозиция станет отличным поисковым стимулом для обнаружения макропропозиции, доминирующей над комплексной ситуационной моделью. И наоборот, множество порций, или ,,кусков" (chunks), информации, полученных из воспринимаемого текста, четко вписывается в соответствующие релевантные категории ситуационной модели на различных макроуровнях. Можно предположить также, что недавнее использование модели ситуации или частое обращение к ней дает возможность понимающему обнаруживать сравнительно больше деталей, относящихся к предыдущей ситуации. Кроме того, если модель ситуации используется часто, многие детали и подробности ее терминальных категорий могут не быть—и обычно не бывают—доступными для последующего понимания. В этом случае имеет место обобщение и декон- текстуализация, то есть обучение: для ситуации данного вида мы формируем фрейм или сценарий. Такой общий сценарий или фрейм (или пакет организации памяти—ПОП) легче использовать в дальнейшем с помощью простого обращения к нему, и он может предоставить все релевантные задействованные подробности вместе с новой информацией об актуальной ситуации. В этом случае, возможно, понадобится отыскать в прошлых состояниях ситуационной модели только недавний или очень релевантный прошлый опыт. Так, чтобы иметь возможность поехать в метро в Нью-Йорке, мне достаточно просто сценария, или фрейма ,,поездка в метро", если таковой имеется, и наличия новой релевантной и специфичной информации о ситуации. Но в то же время я могу—даже если езжу в метро каждый день—вспомнить о вчерашней поездке, во время которой мне встретился какой-то странный человек, или о прошлогодней поездке, когда в метро был пожар. Если же у меня нет ни сценария, ни фрейма, я могу вспомнить только давнюю и нечеткую информацию (то есть макроинформацию) на основе модели, построенной мною несколько лет назад после поездки в метро в Нью- Йорке, или на основе похожих ситуаций (поездка в метро в Париже). Другой важный момент связан с возможной уникальностью ситуационных моделей. Являются ли они моделями одной уникальной ситуации, о которой мы получаем дополнительную информацию (например, о гражданской войне в Сальвадоре), или модель ситуации— это гибкая схема, допускающая собирание сходных ситуаций? Последнее предположение кажется более вероятным: эпизодическая память — это не просто неорганизованная свалка несметного количества ситуационных моделей; скорее всего, сходный опыт собирается в ней воедино. Хотя это не значит, что у нас нет возможности селективного поиска в памяти какой-то специфичной ситуации: мы можем делать это либо с помощью выборочного поиска деталей из терминальных категорий ситуационной модели, либо при помощи поиска репрезентации текста или других репрезентаций, которые у нас есть об этом специфичном событии. Только обобщенное понятие ситуационных моделей допускает эффективный поиск сходной информации и всевозможные обобщения в процессах 187
обучения. С помощью теории макроструктур можно объяснить стратегические процессы организации и поиска различных событий в рамках одних и тех же макропропозиций. И все же мы знаем очень мало об условиях, благоприятствующих или препятствующих конструированию ситуационных моделей из текстов. Ранее мы рассматривали некоторые исследования, где выдвигалось предположение о том, что если имеются очень сложные тексты, хотя описываемые ситуации просты, то читатели могут обойтись без репрезентации текста и сосредоточиться на модели. Соответственно можно представить, что простые тексты, описывающие сложные и непонятные ситуации, побуждают к тому, чтобы сосредоточиться на текстовой базе, отвлекаясь от модели. 10.2. Основные характеристики модели переработки В результате обсуждения ситуационной модели у нас теперь есть все необходимые составные части для построения процессуальной модели, описывающей понимание связного текста. Вряд ли, конечно, стоит полагать, что может существовать только одна процессуальная модель понимания текста. В гл. 1 говорилось о нечеткости и размытости, свойственных термину ,,понимание". Существует множество видов понимания связных текстов. Поэтому все, что мы можем здесь предпринять, сводится к представлению основных характеристик процессуальной модели или, так сказать, инструкций для построения такой модели в некоторой конкретной и четко определенной ситуации. Модели понимания для специфических, конкретных ситуаций могут и должны быть эксплицитными, полными и проверяемыми. Однако общие характеристики, излагаемые здесь, по необходимости должны оставаться нечеткими и недоопределенными, поскольку они должны прилагаться к широкому разнообразию типов поведения, называемому пониманием связного текста. Здесь (и в разделе 10.5) мы опишем эти характеристики и покажем, как они могут быть использованы для разработки определенной модели переработки в конкретной экспериментальной ситуации. Сейчас мы просто суммируем то, что уже было высказано или подразумевалось в различных частях книги. На рис. 10.1 иллюстрируется сущность предлагаемой процессуальной модели. Она содержит многочисленные уровни репрезентации обработки, участвующие в понимании связного текста и считающиеся важными на всем протяжении книги. На этот раз вопрос состоит в том, как эти многочисленные уровни работают и взаимодействуют в реальном времени. Последовательное течение переработки при понимании изображено на схеме центральным кругом. За пределами круга расположены различные системы памяти, взаимодействующие между собой. В основном представлены три больших класса этих систем. Во-первых, это сенсорный регистр, хранящий в свернутом виде поступающую перцептивную информацию и делающий ее доступной для центрального процессора. Для наших целей вполне достаточно 188
Поверхностные Л^Г^-^ ^^ Ситуационная признаки C^^-j *. модель Макроструктура Пропозиционная структура Эпизодическая текстовая память Рис. 10.1. Схема действия системы памяти в процессе понимания связного текста. Круг изображает рабочую память, содержащую слова и пропозиции; Рк находится в процессе конструирования, тогда как предшествующая пропозиция Pk-i хранится в буферной памяти с ограниченной емкостью. стандартное описание этого процесса (обзор литературы см. в работе Kintsch, 1977а, chap. 3). Отметим, что в любой момент времени процессору доступны только некоторые перцептивные признаки. Во-вторых, существует долговременная память понимающего. Для наших целей необязательно проводить четкое различие между общим знанием и личным опытом. Как мы неоднократно подчеркивали, и то и другое может служить релевантным источником знания в 189
процессе понимания. Они различаются только условиями, в которых проводится их поиск, а не способами использования в процессе понимания. Некоторые из этих структур знания предположительно являются активными в любой нужный момент, как, например, лексическое знание, которое требуется по мере обработки слов, или более крупные системы знания, формирующие сценарии или фреймы, которые служат основой порождаемых пропозициональных структур. К долговременной памяти мы отнесли также, до некоторой степени произвольно, цели и задачи понимающего, его желания, интересы и эмоции, то есть активную управляющую структуру. К третьему компоненту относится конструируемая репрезентация памяти, эпизодическая текстовая память, а также модель ситуации, В эпизодической текстовой памяти выделяется поверхностная память, пропозициональная текстовая база и макроструктура. Другие взаимосвязи, которые могут наличествовать в различных зонах памяти, не представлены в явном виде на рис. 10.1. Конструируемые в памяти репрезентации текста можно вообразить в виде стеков, устроенных по магазинному принципу (push-down stacks), то есть при добавлении новых элементов старые элементы отодвигаются все дальше и глубже. Таким образом, поиск по сигналам новизны осуществим только для нескольких новых элементов в каждом стеке. Однако элементы стека не только упорядочиваются по новизне, они еще и тесно связаны друг с другом (по крайней мере, пропозициональные представления и модель ситуации), а также скоординированы с соответствующими элементами в параллельных структурах. Следовательно, элементы могут быть найдены не просто с помощью сигналов новизны, но и по их взаимосвязям с другими элементами как в одном и том же стеке, так и в параллельных стеках. Поскольку модель ситуации является наиболее взаимосвязанной и интегрированной структурой, ее найти легче всего, в то время как сигналы новизны уже более неэффективны. С другой стороны, поиск в пословной поверхностной памяти возможен только с помощью частичного совпадения, в результате которого оказываются доступными порции информации, содержащиеся в поверхностной памяти. Реальная поисковая система для поверхностной памяти отсутствует. Пропозициональная структура, включающая макроструктуру, это сеть взаимосвязей и отношений, в пределах которой одна пропозиция ведет к другой, образуя в целом эффективную поисковую структуру. В центре рис. 10.1, окруженный этими системами памяти изображен центральный процессор. В этом устройстве происходят все когнитивные операции. Так, чтобы изменить какой-то элемент в системах памяти, его необходимо перенести в центральный процессор. Единственная операция, которая может быть выполнена с элементами памяти вне процессора,— это поиск. Центральный процессор имеет центр и периферию. Хотя и не существует ограничений на объем обработки информации, которая может быть выполнена в центральном регистре (за исключением ограничений на ресурсы, о которых упоминалось ранее), есть 190
серьезные ограничения на количество информации, которое может поддерживаться в активном состоянии в рабочем регистре. Хорошо известны ограничения емкости кратковременной памяти. Мы полагаем (и это указано на рис. 10.1), что в общем кратковременная память способна удерживать порцию информации, которая находится в состоянии текущей обработки, и плюс к этому некоторую информацию для установления связи, перенесенную из предшествующей порции. Обрабатываемая порция состоит из сложной пропозиции Рk, содержащей ряд атомарных пропозиций Р. Каждая из атомарных пропозиций выведена из некоторых фрагментов текста, обозначенных на рис. 10.1 буквой W. В общем сложная, или комплексная, пропозиция Рk часто соответствует некоторым фразам или предложениям на языковом уровне. Отсюда следует, что в любой момент ПРОИСШЕСТВИЕ переворот (Люси, парусная лодка) \- СРЕДСТВО ПЕРЕДВИЖЕНИЯ парусная лодка новая Ь- ЛИЦО Люси Ь- ВРЕМЯ (X, день) — ветреный I— МЕСТОНАХОЖДЕНИЕ при выходе из ( X, гавань) \ \ сразу Саусалито процесса понимания в кратковременной памяти содержатся поверхностные представления одного или двух последних простых предложений и выведенные из них атомарные пропозиции, объединенные на основе некоторой структуры знаний и образующие пропозициональную единицу Р. Кроме того, кратковременная буферная память содержит некоторую остаточную информацию из предшествующей текстовой пропозиции Рk-1 В общем, это будет не какая-то целостная единица, включающая все свои подчиненные атомарные пропозиции и актуальные языковые формы, из которых они выведены, а ,,скелетная" версия Рk-1-ь Если Р основано на структуре знания (на фрейме или сценарии, построенном для этой цели), то эффективная стратегия будет заключаться в том, чтобы дойти только до основных ячеек (,,слотов") Pk-1, удаляя несущественную информацию, вроде той, которая приписывается в схеме позициям модификатора. 191
Нельзя точнее охарактеризовать принципы, управляющие этой буферной памятью в данный момент, поскольку они могут контролироваться стратегически и до некоторой степени изменяться в зависимости от ситуации. Рассмотрим, однако, следующий пример. Предположим, мы поняли предложение On a stormy afternoon, Lucy overturned her new sailboat just outside Sausalito harbor. ('Ветреным днем Люси перевернулась на своей новой парусной лодке сразу при выходе из гавани Саусалито') как ,,происшествие" и пришли к следующей сложной пропозиции (чтобы не отвлекаться от существа дела, используем нестрогую нотацию) (см. схему на стр. 191). Предположим, что буферная память ограничена тремя атомарными пропозициями (это разумное число—в свете некоторых оценок, полученных в предыдущей работе, использующей модель Кинча— ван Дейка; см. Kintsch & van Dijk, 1978). В данном случае в комплексной пропозиции будут сохранены три верхних ячейки, специфицирующие характер происшествия, средство передвижения и лицо участника. Модификаторы будут отброшены, и в данном случае это относится к ячейкам времени и местонахождения. Отброшенными оказываются и поверхностные языковые выражения, из которых была извлечена пропозициональная информация. (,,Отбросить" здесь означает просто удалить из кратковременной памяти—следы, конечно, останутся в эпизодической текстовой памяти). Таким образом, если будет прочитано следующее предложение She got away with a scare, but the expensive new boat was badly damaged ('Она сама отделалась испугом, но новая дорогая лодка оказалась серьезно повреждена'), то теперь его можно интерпретировать в терминах пропозиции происшествия, все еще сохраняющегося в кратковременной памяти и устанавливающего связь между этими двумя предложениями. Если для интерпретации воспринимаемого предложения требуется более ранняя информация, то, чтобы найти ее, нужно проделать в эпизодической памяти реактивирующий поиск. Предположим, что в нашем примере речь дальше пойдет не о Люси и ее лодке, а о самом дне происшествия (напомним, что информация о нем не хранится в памяти в активном состоянии): On the same afternoon, three other boats sank in the bay ('В тот же день в заливе потонули еще три лодки'). В этом случае реактивирующий поиск временной ячейки окажется необходимым. Поскольку поиск нацелен на непосредственно предшествующее предложение, он будет скорее всего успешным и потребует немного ресурсов, в отличие от поиска информации, содержащейся в более ранних предложениях. Как уже неоднократно отмечалось, обработка текстов не ограничивается контекстом схематической репрезентации предшествующего предложения или фразы — есть множество и других факторов, активно влияющих на обработку. В нашей таблице они размещены на границе между центральным процессором кратковременной памяти и окружающими его системами памяти. Для этих активных элементов используется термин управляющая система. В разные моменты процесса понимания активно используются различные структуры знания. Они не входят в кратковременную память, но 192
могут оказывать на нее влияние. То же самое относится к целям и интересам, управляющим целостным эпизодом понимания, и в наиболее значительной степени—к самой текстовой базе. Только что сконструированная макропропозиция влияет на текущую переработку текста в любой из моментов времени самым непосредственным образом; в кратковременную память она при этом не вводится. Будучи активной структурой знания, она непосредственно участвует в процессе. Точно так же активно участвует в процессе, ограничивает и контролирует его последний по времени компонент ситуационной модели. Конечно, создание новых макропропозиций и новых вариантов ситуационной модели происходит в центральном компоненте, хотя и при участии предшествующей модели или макропропозиции, располагающихся на границе данной системы. Почему управляющая система помещена нами на границе, а не внутри круга? Главным образом потому, что, по нашим представлениям, центральный процессор обладает некоторыми свойствами и кратковременной памяти, и сознания. Теперь мы знаем, что в процессе обработки текста должно участвовать гораздо большее число элементов, чем может поместиться в ограниченный объем кратковременной памяти. Теоретически это даже может быть аргументом против того, чтобы вообще включать кратковременную память, как она понимается в традиционной литературе, в модель понимания связного текста. Однако это значительно ослабило бы объяснительную силу нашей модели как в прежнем варианте, так и в нынешнем. Кроме того, такой шаг было бы трудно согласовать с данными по использованию кратковременной памяти в понимании текста, о чем говорится в следующем разделе главы. Представляется, что наилучшим решением было избранное нами объединение признаков кратковременной памяти и сознания в традициях Уильяма Джеймса. Сознание, по мнению Мандлера (Mandler, in press), содержит в каждый момент времени только одну идею. При рассмотрении понимания текста представляется вполне разумным отождествлять идею с (комплексной) пропозицией. Правда, обычно признают, что ряд идей может находиться на границе сознания; подобные идеи непосредственно доступны сознанию, но, как правило, не осознаются. Аналогичный случай имеет место со структурами знания при понимании текста: они используются, но обычно это не осознается. То же относится к целям, а также к топику и основным темам самого текста (макроструктуре и модели ситуации): в сознании они отсутствуют, хотя и влияют активно на способ понимания дискурса и в любой момент могут быть помещены в фокус внимания. Обычно мы осознаем только слова и их значения. Поэтому мы предполагаем, что центральный процессор на рис. 10.1 состоит из активного, сознающего, но ограниченного по своей емкости центра и периферийной области, где расположены управляющая система и структуры памяти, воздействующие на процесс обработки информации; при этом они непосредственно не осознаются и не имеют ограничений по емкости. Структуры знания, находящиеся за пределами этой границы, то есть вне активных макропропозиций, фреймов 13.-1182 193
и целей, могут участвовать в переработке текста только при условии успешного поиска. Пояснения к рис. 10.1 вызывают множество вопросов, но на многие из них нет ответа на общем уровне. Необходимо экспериментальное исследование процессов кратковременной памяти, участвующих в понимании текста в конкретных, четко ограниченных ситуациях, чтобы построить конкретные эксплицитные модели этих процессов. Только в этом случае можно надеяться на какое-то понимание этих бесконечно сложных явлений. Но чтобы строить конкретные модели, необходимо иметь общую концепцию, если мы хотим избежать случайных решений. Вкратце следует указать на связь между данной моделью обработки текста и предшествующим ее вариантом (Kintsch & van Dijk, 1978). Модель 1978 г. можно считать конкретной подмоделью в рамках новой конструкции. Важно подчеркнуть, что прежняя модель, не отличаясь принципиально от новой, является более простым вариантом, в котором опущено многое из изложенного здесь. Например, здесь подробно объясняется, как конструируются комплексные пропозиции, что остается в кратковременной памяти и почему. Все эти процессы рассмотрены с точки зрения того, как знания используются в понимании текста. В прежней модели мы обошли эти проблемы с помощью некоторых формальных правил и статистических данных. Раньше мы считали, что вся обработка происходит циклами, а сейчас полагаем, что все слова немедленно привлекаются к обработке, хотя и циклы играют свою роль в использовании кратковременной памяти, поскольку комплексные пропозиции образуются обычно в кратковременной памяти на границах предложений и фраз точно так же, как в модели 1978 г. Эта модель может оказаться вполне пригодной для некоторых целей, например в тех случаях, когда не нужно вникать в более мелкие подробности, а ограничиваться более общими проблемами памяти, забывания, обобщения и т. д. Таким образом, создание новой модели не означает отказа от прежней модели, несмотря на всю ее неполноту. [...] 10.4. Поиск в эпизодической текстовой памяти Кратковременная память обнаруживает в процессах понимания текста примерно те же свойства, которые описаны в традиционной литературе. Конечно, порции дискурса—это не то же самое, что список слогов, не имеющих смысла, но их количество и способы испытываемой ими интерференции сравнимы. Зато использование долговременной памяти при понимании текста сначала представляется совсем по-другому. Запоминание текста происходит гораздо лучше, чем запоминание списков слов или бессмысленных слогов. Если люди могут припомнить не более полудюжины из списка случайных слов, то после прочтения странички связного текста они припоминают в десять раз больше. Такое очевидное различие может 194
навести на мысль, что теория запоминания, основанная на экспериментах по заучиванию, не является адекватной теорией запоминания связного текста. Однако можно привести доводы и в пользу классической теории запоминания (Kintseh, 1982b): она достаточно хорошо объясняет, почему запоминание текста происходит гораздо лучше, чем запоминание отдельных слов. Причина заключается в том понимании способов, с помощью которых порождаются репрезентации текста, являющиеся эффективными поисковыми структурами. В модель Кинча—ван Дейка (1978) не входит описание процессов поиска в явном виде. Все, что имеет в ней отношение к памяти, основано на широко известной гипотезе: припоминается лучше то, что подвергается более тщательной обработке. Некоторые текстовые пропозиции остаются в кратковременной памяти дольше других, поскольку они отбираются для установления связности—в зависимости от их структурной значимости в текстовой базе. Эти пропозиции вспоминаются лучше пропорционально объему дополнительной обработки. Эта дополнительная обработка опять-таки отражается в возрастающей вероятности припоминания. В этом новая модель не отличается от прежней, за исключением того, что она имеет другую основу для отбора пропозиций в кратковременную буферную память...; она связана с тем, что текст организуют фреймы и схемы, то есть структуры знания. Учитывая эту модификацию, уровень припоминания можно предсказать на основе новой модели точно так же, как и на основе модели 1978 г. и модели 1981 г. (Miller & Kintsch, 1981). Однако память, конечно,— это не просто воплощение различительной силы кодирования. Доминирующую роль играет поиск, взаимодействующий с процессами кодирования. Модель поиска почти непосредственно зависит от характера самой текстовой базы, а также от наличия и структуры ситуационной модели, которую мы здесь временно не учитываем, хотя то, что говорится о поиске в текстовой базе, равным образом относится и к поиску в ситуационной модели. И действительно, характер текстовой базы диктует, по крайней мере в общих чертах, форму модели. Начиная поиск с любого элемента текста, можно обнаружить другие элементы, связанные непосредственно с ним. Найденные элементы становятся затем исходными точками новых поисковых операций, и после их многократного повторения два элемента в репрезентации текста (макропропозиции, текстовые пропозиции, атомарные пропозиции и даже фразы, если мы хотим изучать вербальную память) могут быть связаны длинной поисковой цепочкой с промежуточными узлами. Если текстовая база когерентна, тогда, независимо от начала поиска, в принципе могут быть найдены все элементы. Но если каждая поисковая операция носит вероятностный характер, то поисковые неудачи накапливаются по мере увеличения числа узлов, которые необходимо пройти в процессе поиска. Каковы на самом деле ограничения в этом сетевом поиске, пока точно неизвестно. Но легко могут быть разработаны и испытаны на эмпирических текстах 13* 195
конкретные подмодели, характеризующиеся определенным набором ограничений. Приведем две иллюстрации. Во-первых, рассмотрим модель свободного припоминания, целиком построенную по принципу ,,сверху вниз". Это значит, что поиск всегда начинается с верхнего узла и доходит до более нижних узлов репрезентации текста. Пусть г означает вероятность успеха поисковой операции. Тогда пропозиция Р, связанная с верхним узлом посредством к промежуточных макропропозиций М, расположенных только на одной поисковой цепочке, будет найдена с вероятностью rk. Если целевая пропозиция может быть достигнута также через вторую цепочку, содержащую j промежуточных макропропозиций, то поисковая вероятность будет равна rk +rj+rk+j при условии независимости цепочек. Эту схему можно дополнить различными способами. Предположим, например, что поисковая вероятность равна г для связей между макропропозициями (М—М) и между макропропозициями и текстовыми пропозициями (М—Р), но эти разные поисковые вероятности привлекаются для операции в рамках самой пропозициональной схемы. Например, кажется весьма правдоподобным, что атомарные пропозиции Р, заполняющие ячейки в схеме, отыскиваются с вероятностью s, большей, чем вероятность t поисковых пропозиций, которые не заполняют ячейку, но просто добавляются в схему, например, как модификаторы. Далее, можно создать условия, чтобы связи между пропозициями того же уровня также могли использоваться для поиска, например с некоторой вероятностью с. Так, если рассмотреть фрагмент текстовой базы, изображенный здесь, то можно получить следующие поисковые вероятности для атомарных пропозиций Р\—Ру. рr (поиск Pi)=rt+r2s-r3st pr (поиск P2)=r2s+r2tc-r4stc рr (поиск P3)=r2t+r2sc-r4stc 196
Мы просто следуем по каждой цепочке из верхнего узла до целевой пропозиции, умножая по пути вероятности. Затем вероятности цепочек складываются, а их пересечения при независимости цепочек вычитаются. Если P1—Р3 найдены успешно и вероятности подсчитаны, тогда их кодирующая сила определяет вероятность их припоминания. Точнее, если пропозиция Р в течение i циклов обработки находится в кратковременной памяти, то вероятность ее припоминания при условии успешного поиска предположительно будет равна р (припоминание /i ) = 1 -( 1 -п ) i, где п есть вероятность успешного кодирования микропропозиции во время одного цикла обработки. Таким образом, формула означает, что припоминание происходит, если имеется по крайней мере один успешный шанс кодирования элемента. Точно так же, если пропозиция Р участвовала в конструировании j>l макропропозиций, то сила припоминания будет равна р (припоминание/j)=1— (1-m)j, где m — это вероятность успешного кодирования макропропозиции в течение одного цикла обработки, р (припоминание/О и р (припоминание/j) взаимодополнительны и независимы. Точно такие же предположения были высказаны в работе Кинча и ван Дейка (Kintsch & van Dijk, 1978). Модель 1978 г. следует рассматривать как ограниченный вариант настоящей модели, где r=s=c = 1. Очевидно, и некоторые другие предположения о поисковых вероятностях могут быть столь же обоснованными. Мы не располагаем необходимыми данными, чтобы решить, какие из этих предположений наиболее адекватны1. Если же такие данные будут, то появится возможность сравнить друг с другом различные модели вроде описанной выше. В качестве второй иллюстрации рассмотрим, как работает в этой модели стимулируемое припоминание. Как и раньше, мы можем построить различные альтернативные модели: связи между интересующими нас элементами определяются текстовой базой, и мы можем установить, как различные типы связей поддерживают поиск. Если, используя снова наш пример, мы знаем, что припомнилась Р2, то можно подсчитать условные вероятности припоминания P1 и Р3 с различным набором предположений. Если в нашем распоряжении окажется соответствующий набор данных, то такой анализ может нам многое рассказать о поисковых процессах в связном тексте. Однако в основном модель используется не для количественной проверки конкретных гипотез, а для получения качественного 1 Данные работы Миллера и Кинча (см. Miller & Kintsch, 1980), примененные для оценки модели 1978 г., здесь бесполезны. Для применения нашей теперешней модели нужны какие-то идеи о характере структур знания, которые использовались бы испытуемыми для понимания текста. Различные экспериментальные возможности сами по себе предполагают, например, предварительную подготовку или контроль за тем, как испытуемые выражают свои ожидания (предсказания) на различных участках текста. 197
объяснения наиболее важных явлений при запоминании дискурса и прежде всего его эффективности. После рассмотрения описанной выше поисковой модели хорошее запоминание текста уже не кажется такой загадкой. В процессе понимания текста происходит образование структур, которые представляют собой весьма эффективные поисковые системы. Материал организуется в порции информации, конструируемые в соответствии с существовавшими прежде единицами памяти, при этом порции тесно взаимосвязаны, что обеспечивается связностью микро- и макроструктур текстовой базы. Благодаря макроструктурам порции информации имеют иерархическую организацию, они связаны с подобными же «порциями» в ситуационной модели. Это как раз такой тип системы, который, в соответствии с теорией памяти, может быть идеальным для поиска. Он не похож на то, что конструируют испытуемые в лабораторных экспериментах. В традиционных экспериментах по запоминанию списков испытуемые сталкиваются с незнакомой задачей, незнакомым материалом и вынуждены изобретать стратегию кодирования на месте, нередко без соответствующей ситуационной модели. Испытуемые могут опираться только на некоторые общие, но слабые стратегии кодирования, и результат часто бывает далек от оптимального поиска. Когда же испытуемым предлагают простые тексты на какую-то знакомую тему, они оказываются в совершенно другой ситуации. Они могут опираться на богатое фоновое знание и привлекать хорошо освоенные или автоматизированные стратегии понимания. В результате возникает текстовая база, являющаяся одновременно эффективной поисковой системой. Испытуемые являются своего рода экспертами по пониманию: они обладают точными знаниями и необходимыми, хорошо отработанными стратегиями. Подобно экспертам в других областях, их память отражает их квалификацию. Поэтому текстовую память следует сравнивать с другими видами экспертной памяти, изучавшимися в лабораториях: спецификой памяти опытных телеграфистов (Bryan & Harter, 1899), памятью специалистов по быстрому счету (Muller, 1911; Hunter, 1962), памятью шахматистов (de Groot, 1966; Chase & Simon, 1973), памятью испытуемых, обученных мнемоническим средствам (Bower, 1972; Chase & Ericsson, 1981) и, кроме того, с древним искусством запоминания, которое демонстрировали античные ораторы (Yates, 1966). В свете этих сравнений текстовая память вовсе не выглядит чем-то экстраординарным. Владеющие мнемоникой были экспертами в использовании определенной мнемонической техники, но, столкнувшись с материалом, выходящим за рамки их квалификации, выглядели так же слабо, как и любой другой на их месте. В этом смысле экспертами являются и рядовые читатели: они очень хорошо запоминают простые и знакомые тексты, но память тут же подводит их, если им дается текст, который они не могут вполне понять как следует — либо из-за отсутствия нужной базы знаний (например, при чтении технического текста из незнакомой области), либо потому, что у них не разработаны правильные стратегии 198
(например, при обращении к таким необычным видам дискурса, как поэтические тексты). Чтобы более подробно проследить параллели между текстовой и экспертной памятью, нужно обратиться к некоторым основным характеристикам экспертной памяти. Они превосходно описаны в работе Чейза и Эрикссона (см. Chase & Ericsson, 1981). Чейз и Эрикссон изучали испытуемого, запоминавшего ряды из 80 и более цифр за одно прослушивание. Запоминание сразу более 80 цифр выглядит загадочным в свете хорошо известных ограничений кратковременной памяти. Ограниченная емкость (span) кратковременной памяти часто считается ее определяющим свойством, и кажется странным, что она может быть так расширена. Однако Чейз и Эрикссон показали, что никакого чудесного расширения не происходит. Емкость кратковременной памяти испытуемого была совершенно нормальной и неизменной. Формируемые им ,,порции" информации состояли из трех-четырех цифр; кодируемые последовательности не превышали пяти-шести фонем. Таким образом, рабочая емкость памяти испытуемого не отличалась от емкости памяти обычных людей, которые могут запомнить не более семи или девяти единиц. Описанный эффект вообще не относится к кратковременной памяти, он обязан продуктивному использованию долговременной памяти. Чейз и Эрикссон обнаружили, что это объясняется в основном процессами деления на порции информации и построением эффективной поисковой системы. Трюк состоял в использовании механизма деления на порции информации для связывания следов стимула в иерархическую семантическую структуру. Испытуемый Чейза и Эрикссона придумывал сложный набор стратегий для кодирования последовательностей цифр. С этой целью он использовал хорошо знакомую ему базу знаний: его хобби был бег, и он кодировал цепочки цифр как результаты забегов, которые потом служили ему уникальным поисковым стимулом (cue) для цепочки. Подобно древнеримскому оратору, он размещал запоминаемые числа в имеющейся у него семантической структуре результатов по бегу. Классических ораторов учили запоминать речи, деля их на сцены, которые кодировались как живописные образы и размещались в определенной последовательности (по хорошо известному маршруту). Поиск затем происходил как мысленное движение по маршруту и подбирание по пути соответствующих образов. Такое связывание в поисковую структуру происходит в рабочей памяти и является формой деления информации на порции: богатая, хорошо организованная база знаний результатов по бегу помогает непосредственно распознавать релевантные модели, связывая их с семантическими признаками (например, результат бега на 1 милю, почти мировой рекорд и т. д.). Семантические признаки оказались взаимосвязанными и образовали поисковую структуру, которая вела мнемониста от одного места в памяти к другому. Существует две необходимых предпосылки для такой поисковой структуры. Во-первых, необходима богатая база знаний типа развет- 199
вленной сети результатов бега, имевшейся у испытуемого Чейза и Эрикссона. Во-вторых, все операции по накоплению и поиску должны происходить быстро и без усилий — иначе произойдет переполнение кратковременной памяти. Таким образом, скорость имеет решающее значение. Поэтому прежде чем такие операции станут достаточно автоматизированными, нужна очень большая практика. Есть несколько поразительных аналогий с текстовой памятью. Текстовая память очень хороша, если ее поддерживает развитая база знаний. Стратегии понимания освоены и заучены до автоматизма. Элементы текста привязаны к основным структурам знания в пропозициональных схемах и используются для деления текста на ,,порции". Иерархические макроструктуры образуют эффективные поисковые системы. По крайней мере так обстоит дело, когда нужно запомнить простые, знакомые тексты. Если же читаются тексты, для которых нет соответствующей базы знаний, память становится плохой — все это аналогично тому, когда экспертам даются материалы, выходящие за рамки их компетенции. Хорошо запоминаются чаще всего простые повествовательные тексты и гораздо труднее — тексты-описания (Kintsch, Kozminsky, Streb у, McKoon & Keenan, 1975; Graesser, Hoffman & Clark, 1980). Память отказывает читателям и в том случае, когда они не могут определить, о чем говорится в данном тексте, поскольку авторы умело это скрывают (Bransford & Johnson, 1982). Так, например, отрывок о стирке белья, написанный таким образом, что читатели не могут определить, о чем в нем говорится, и, следовательно, не могут активировать необходимые знания, запоминается так же плохо, как и список случайных слов (3,6 из 14 единиц содержания текста). Заглавие, из которого читатель узнает, о чем текст, и которое позволяет ему оперировать стратегиями понимания, значительно улучшает запоминание того же отрывка (8 единиц содержания текста). Непонятый абзац плохо запоминается и воспроизводится потому, что без релевантной структуры знания и без соответствующей макропропозиции (выраженной заглавием) нельзя сформировать поисковой схемы. Испытуемые пока еще понимают предложения на локальном уровне и сохраняют в памяти информацию, но хранится она в несвязной форме и поэтому ее невозможно найти (Alba, Alexander, Harker & Carniglia, 1981). Предпосылкой связной репрезентации текста является способность построения связной ситуационной модели. Без этого запоминание текста распадается на куски, в пределах которых поиск проводить так же сложно, как и в списке случайных слов. Некоторые предварительные экспериментальные результаты, подтверждающие излагаемую здесь интерпретацию текстовой памяти, приведены в работе Кинча (см. Kintsch, 1982b). Если пропозиции используются для деления текста на порции информации, то они должны функционировать аналогично другим единицам памяти. Точнее говоря, эффективность фрагмента текста в качестве поискового стимула должна зависеть от границ порции информации. 200
Материал легче припоминается, если он содержится в одной и той же порции, а не в различных. Этот классический результат был получен в другой ситуации, где эксперты использовали стратегию деления на порции информации. Например, Чейз и Эрикссон (1981) наблюдали это явление при исследовании того, как их эксперт по памяти использовал порции информации для запоминания цепочек случайных чисел. Они могли довольно точно определить, какого рода порции используются (на основании анализа протокола и других результатов, которые дал эксперимент). Так, они могли выбирать небольшие группы цифр, с тем расчетом, чтобы они не совпадали с границами порции информации. По мере представления одной из этих цифровых групп, испытуемый должен был припомнить цифры, следующие за этой группой в первоначальной цепочке. Это он мог делать очень хорошо, пока стимул и следующие за ним цифры относились к одной и той же порции информации. Но когда стимул воспроизведения приходился на границы порции и оказывалось, что цифры, которые нужно было вспомнить, принадлежали разным порциям, результаты испытуемого значительно ухудшались. Порции информации, определяемые анализом протокола, очевидно, также функционировали и как единицы воспроизведения. Что касается дискурса, то на основании пропозиционального анализа текста можно предсказать, где проходят границы порций информации. Поэтому, следуя Чейзу и Эрикссону, мы ожидаем, что фрагмент текста, образующий начало порции, является хорошим поисковым стимулом для остальной ее части. Но фрагмент текста, который совпадает с границами порции информации, менее эффективен при поиске последующего текста, находящегося за пределами данной порции. Пять испытуемых прослушивали отрывки по 250 слов из отчета по психологии. После каждого отрывка повторялась фраза из 6—19 слов из только что прочитанного текста, и испытуемые должны были устно воспроизвести слова, непосредственно следующие за этой фразой в оригинальном тексте. Воспроизведение должно было быть, по возможности, дословным. Если испытуемым это не удавалось, они должны были сказать то, что они запомнили. Для иллюстрации качественной стороны результатов приведем только два примера. В первом примере стимул воспроизведения заканчивается в середине фразы. Для завершения пропозициональной порции необходимы слова, непосредственно следующие за ним. Так, испытуемые должны были вспомнить следующее: СТИМУЛ: This discrepancy reflects not only our 'Это противоречие отражает не только' ПРОДОЛЖЕНИЕ: society's concentration of formal educational effort... 'сосредоточенность нашего общества на формальных усилиях в области образования...' 201
Ниже приводятся реакции некоторых испытуемых: РЕАКЦИЯ (a): society's concentration of effort... 'сосредоточенность нашего общества на усилиях...' РЕАКЦИЯ (b): society's focus on formal education... 'сосредоточенность нашего общества на формальном образовании...' РЕАКЦИЯ (с): the shift of concentration of educational research... 'сдвиг концентрации исследований в области образования...' Очевидно, что во всех трех случаях реакция испытуемых в той или иной мере дополняет пропозициональную единицу. Кроме того, окончания фраз воспроизводятся практически буквально: в (а) дается буквальное воспроизведение, если не считать двух пропущенных слов; в (b) есть пропуски и синонимичная замена; только в (с) не совсем точное завершение фразы, но даже здесь два важных слова воспроизведены дословно. В целом результат можно считать отличным, учитывая, что испытуемые слышали текст только раз, да еще после этого им зачитывался посторонний текст размером в 150 слов. Ясно, что испытуемые не воспроизводили продолжение текста из кратковременной памяти. По-видимому, фраза, использованная как стимул, частично совпадает с порцией памяти на очень раннем уровне анализа, и тем самым эта порция на этом уровне становится доступной и в целом. Таким образом, воспроизводится не только значение, но и словесное выражение дополняемой фразы. Сейчас мы не будем уточнять, вызваны ли пропуски ошибками в кодировании или в поиске. Рассмотрим теперь стимул воспроизведения, который завершается определенной порцией информации и поэтому вынуждает испытуемого отыскивать следующую порцию. В этом случае задача сводится не только к реинтеграции данной порции информации на основе частичного совпадения, но и к поиску следующей порции в иерархии текстовой базы: СТИМУЛ: As shown primarily by the work of Schaie 'Как было впервые показано в работе Шайе', ПРОДОЛЖЕНИЕ: a peak of intellectual performance occurs later for current adult cohorts... 'пик интеллектуальной деятельности у взрослых в данных группах возникает позднее...' А теперь приведем некоторые реакции: РЕАКЦИЯ (d): some abilities don't reach their peak until sometime later. 'некоторые способности не достигают своего пика вплоть до определенного момента'. 202
РЕАКЦИЯ (е): a peak occurs much later than previously believed and no decline in intelligence. 'пик появляется гораздо позднее, чем считали раньше, и никакого упадка интеллекта нет'. РЕАКЦИЯ (f): (после долгой паузы): He was finding results that differed from previously held ideas. 'Он получал результаты, которые отличались от прежних представлений'. По своему характеру эти реакции отличаются от реакций (а)—(с). Реакции (d) и (е) представляют собой скорее перифразы, чем дословное воспроизведение. Это наводит на мысль, что процесс поиска не происходит прямо в репрезентации текста, а соответствующее продолжение обнаруживается косвенно, через посредство подчиняющей макропропозиции, соединяющей две порции информации, к которым относятся стимул и продолжение. Процесс направлен скорее не на поиск словесной формулировки продолжения, а на использование пропозиционального уровня (в предыдущем же случае сравнение происходило и на языковом, и на пропозициональном уровнях). Для того, чтобы после обнаружения соответствующей макропропозиции достичь языкового уровня, требуется еще один этап поиска, подверженный в свою очередь ошибкам и неудачам. В случае (f) — перед нами очевидная реконструкция: по- видимому, испытуемый оказался не в состоянии найти последующую пропозицию и вместо этого произвел частичную реконструкцию, возможно, при помощи макропропозиции, доминирующей над данной порцией текста и имеющей примерно такой смысл: «Прежние исследования демонстрировали X.— В отличие от них Шайе продемонстрировал Y». Реакция (f) необычна: гораздо чаще случается, что если не находится последующая пропозиция, то испытуемые вообще не дают ответа. И в самом деле, примерно в 1/3 случаев не были получены реакции на стимулы, совпадающие с границами порции информации, но совсем не было отказов, если стимул прямо указывал на пропозициональную порцию информации. Несмотря на предварительный характер этих данных, можно сделать вывод, что стимулированное воспроизведение текста демонстрирует то же деление на порции информации, что и стимулированное воспроизведение цифр специалистом по их запоминанию. Конечно, чтобы окончательно подтвердить это, потребуется гораздо больше данных, но и те, что у нас есть, свидетельствуют: текстовая память,— по крайней мере в идеальных условиях, обеспечивающих адекватное понимание,— по самой своей природе является разновидностью ,,экспертной" памяти. Не нужно постулировать новых, но еще не исследованных принципов работы памяти для объяснения того факта, что текстовая память гораздо лучше той, которую мы обычно наблюдаем в лабораторных условиях, в экспериментах по заучиванию списков. И в том и другом случае действуют те же самые принципы, однако в процессе понимания дискурса создаются весьма благоприятные условия для запоминания. Хорошо структури- 203
рованная, многоуровневая, когерентная текстовая база, являющаяся результатом процесса понимания, функционирует как эффективная поисковая система, так что даже чтение или прослушивание текста обеспечивает приемлемый уровень воспроизведения. Правда, это не означает, что невозможно достичь лучшего уровня с помощью специальных процедур кодирования в памяти, описанных, например, в работе Левина (см. Levin, 1982). Конечно, в естественных условиях воспроизведение текста несовершенно, в особенности это относится к деталям, которые нельзя назвать макрорелевантными; для улучшения воспроизведения могут быть использованы различные мнемонические приемы. Например, вполне вероятно, что текстовую память может существенно улучшить использование образности, не влияющее никак на само понимание и построение текстовой базы (за исключением, впрочем, случаев, когда образность может помочь созданию хорошей ситуационной модели). Понимание и воспроизведение связаны только до определенного момента, и улучшение памяти может происходить без воздействия на процесс понимания. [...] 10.6. Эпилог Завершая книгу, мы хотим кратко охарактеризовать сущность общей теории стратегий понимания. Ее нельзя отнести ни к лингвистике, ни к психологии — это, так сказать, и рыба, и мясо одновременно. С самого начала было ясно, что теория не может охватить все аспекты процесса понимания, хотя в тех границах, которые мы установили для себя, мы попытались достичь полного охвата. Было также ясно, что, несмотря на все усилия, многие положения теории остаются недоработанными. На самом деле, мы представили не столько теорию, сколько ее основания, пытаясь установить принципы ее построения, если дана определенная ситуация понимания. Не может быть такой теории понимания, которая одновременно была бы и общей и частной, потому что нет единого, целостного процесса ,,понимания". Каждый раз, когда мы пытаемся вникнуть в процесс понимания дискурса, он кажется чуточку иным. Поэтому нужны как раз основы исследования, ряд принципов и методов анализа, которые можно приложить к конкретным случаям. Каждый раз могут получаться несколько иные результаты. Однако, поскольку для построения используются одни и те же блоки, это дает возможность обойтись без произвольных миниатюрных моделей, подгоняемых под данный случай (ad hoc), которые могут быть очень простыми и элегантными, однако по сравнению с реальной сложностью процесса понимания способны лишь вводить в заблуждение. Ясно, что не только новые ситуации, но и разные теоретические цели требуют новых и отличающихся от прежних моделей. Так, если мы стремимся понять, как используется знание для решения устных (словесных) арифметических задач, то для этого требуется совсем другой уровень анализа, нежели когда нашей целью является 204
предсказание среднего уровня припоминания прочитанного ранее рассказа. Для последнего случая вполне годится вариант нашей модели (см. Kintsch & van Dijk, 1978), который совершенно неадекватен для других целей. Нечто подобное можно сказать и о принятой системе обозначений, в частности об использованных здесь пропозициональных представлениях. Нет никакой необходимости делать ее сложней, чем нужно. Для грубого членения текста на единицы содержания достаточна довольно поверхностная система обозначений: чем тоньше цели анализа, тем сложнее должна быть данная система. В рамках разработки общей концепции возможно много различных подходов. Не только не нужно, но и нежелательно разрабатывать проблему на всю глубину ее сложности. При наличии общей концепции всегда можно установить, где и когда мы пошли на упрощения, и судить о том, насколько эти упрощения оправданны. Как оценить адекватность изложенной здесь общей концепции исследования понимания? Хотя, конечно, и возможны сделанные на основе интуиции и анализа литературы самые общие и нестрогие оценки того, что известно о понимании связного текста (а никакие точные оценки — по самой своей природе — невозможны), теория должна быть предельно гибкой и предельно общей. С нашей точки зрения основными критериями ее успеха должна стать наша способность к построению на ее основе эффективных ситуационных и проблемно-специфических моделей, а также возможность экспериментальной проверки различных принципов и импликаций этих моделей. Например, с помощью методов экспериментальной психологии можно получить некоторые эмпирические оценки, хотя и несколько непривычным путем. Сама по себе теория в целом носит слишком общий характер, чтобы ее можно было подвергнуть экспериментальной проверке, но накопление результатов наблюдений и экспериментов в конце концов приведет к ее верификации, или же она будет отвергнута. Описанные здесь эксперименты — не более чем начало. По сравнению с достигнутыми скромными результатами можно и нужно сделать гораздо больше. Мы же в основном располагаем серией демонстраций того, что процессы, развивающиеся в соответствии с теорией, можно действительно наблюдать при соответствующих, тщательно контролируемых лабораторных условиях... Проведение экспериментальных исследований, дополняющих более традиционную функцию эксперимента—функцию проверки теоретических предсказаний,—должно распространиться гораздо шире и сыграть в будущем более важную роль, ибо теории в когнитивной науке становятся все сложнее и все менее доступными для прямой проверки. Мы видим несколько путей, по которым может развиваться работа в ближайшем будущем. Один из них подразумевался ранее: теперь, когда у нас есть то, что можно назвать приемлемой основой изучения понимания текста, исследование деталей этого процесса сильно упростилось, но для углубления описания необходимо изучить как можно больше этих деталей. Работа будет носить не только 205
теоретический характер, связанный с созданием эксплицитных и конкретных моделей, описывающих четко определенные ситуации; она будет также экспериментальной в том смысле, как об этом говорилось выше. Второе направление связано с выходом за те жесткие рамки, о которых говорилось ранее, и, в частности, с более подробным изучением процессов анализа текста, а также с изучением новой области так называемого ,,горячего познания" (это мнения, установки и т. п.), которая представляется чрезвычайно интересной. Наконец, третьим направлением будет построение эксплицитного когнитивного перехода к коммуникативному контексту: ситуационному и социокультурному контексту понимания и порождения связного текста. ЛИТЕРАТУРА Abelson, 1979=Abelson, R. P. Differences between belief and knowledge systems.— „Cognitive Science", 3, 1979: 355—366. Alba, Alexander, Harker and Carniglia, 1981=Alba, J. W., Alexander, S. G., Harker, L. and Carniglia, K. The role of context in the encoding of information.—„Journal of Experimental Psychology: Human Learning and Memory", 7, 1981: 283—292. Anderson, 1982=Anderson, J. R. Acquisition of cognitive skill.— „Psychological Review", 89, 1982: 369—406. Barclay, 1973=Barclay, J. R. The role of comprehension in remembering sentences.—„Cognitive Psychology", 4, 1973: 229—254. Barthes, 1966=Barthes, R. Introduction a l'analyse structurale des recits.— „Communications", 8, 1966: 1—27. Bartlett, 1932=Bartlett, F. C. Remembering: An Experimental and Social Study. Cambridge: Cambridge University Press, 1932. Bauman and S herz er, 1974=Explorations in the Ethnography of Speaking (Bauman, R. and Sherzer, J. (eds.)). London: Cambridge University Press, 1974. de Beaugrande, 1980=de Beaugrande, R. Text, Discourse and Process. Hillsdale, N. J.: Erlbaum, 1980. de Beaugrande and Dressier, 1981=de Beaugrande, R. and Dressler, W. Introduction to Text Linguistics. London: Longman, 1981. Bever, 1970=Bever, T. G. The cognitive basis for linguistic structures.— In: „Cognition and the Development of Language" (Hayes, J. R. (ed.)). New York: Wiley, 1970. Black and Bower, 1979=Black, J. B. and Bower, G. H. Episodes as Chunks in narrative memory.—„Journal of Verbal Learning and Verbal Behavior", 18, 1979: 309—318. Black, Turner and Bower, 1979=Black, J. В., Turner, T.J. and Bower, G. H. Point of view in narrative comprehension, memory and production.— „Journal of Verbal Learning and Verbal Behavior", 18, 1979: 187—198. Bobrow and Collins, 1976=Bobrow, D. G. and Collins, A. Representation and Understanding: Studies in Cognitive Science. New York: Academic Press, 1976. Bower, 1972=Bower, G. H. Mental imagery and associative learning.— In: „Cognition in Learning and Memory" (Gregg, L. W. (ed.)). New York: Wiley, 1972. Bower, 1974=Bower, G. H. Selective facilitation and interference in retention of prose.—„Journal of Educational Psychology", 66, 1974: 1—8. Bransford, Barclay and Franks, 1972=Bransford, J. D., Barclay, J. R. and Franks, J. J. Sentence memory: a constructive versus interpretive approach.—„Cognitive Psychology", 3, 1972: 193—209. Bransford and Franks, 1972=Bransford, J. D. and Franks, J. J. The abstraction of linguistic ideas.—„Cognitive Psychology", 2, 1972: 331—350. Bransford and Johnson, 1972=Bransford, J. and Johnson, M. K. Contextual prerequisities for understanding: some investigations of comprehension and recall.— „Journal of Verbal Learning and Verbal Behavior", 11, 1972: 717—726. 206
Bremond, 1973=Bremond, С. Le logique du recit. Paris: Seuil, 1973. Britton, Meyer, Hodge and Glynn, 1980=Britton, В. К., Meyer, В. J. F., Hodge, M. H. and Glynn, S. Effect of the organization of text on memory: Tests of retrieval and response criterion hypotheses.—, Journal of Experimental Psychology: Human Learning and Memory", 6, 1980: 620—629. Broadbent, 1975=Broadbent, D. E. The magical number seven after 15 years.— In: „Studies in Long-Term Memory" (Kennedy, R. A. and Wilkes, A. (eds.)). New York: Wiley, 1975. Bryan and Harter, 1899=Bryan, W. L. and Harter, N. Studies on the telegraphic language: the acquisition of a hierarchy of habits.—„Psychological Review", 6, 1899: 346—375. Carbonell, 1978=Carbonell, J. G., Jr. POLITICS: Automated ideological reasoning.—„Cognitive Science", 2, 1978: 1 —15. Carbonell, 1982=Carbonell, J. G., Jr. Learning by analogy: formulating and generalizing plans from past experience.— In: „Machine Intelligence: An Artificial Intelligence Approach" (Michalski, J., Carbonell, J. G. and Mitchell, T. M. (eds.)). Palo Alto, Calif.: Tioga Press, 1982. Charniak, 1972=Charniak, E. Toward a model of children's story comprehension. (Ph. D. Dissertation. Massachusetts Institute of Technology), 1972. Chase and Ericsson, 1981=Chase, W. G. and Ericsson, K. A. Skilled memory.— In: „Cognitive Skills and Their Acquisition" (Anderson, J. R. (ed.)). Hillsdale, N. J.: Erlbaum, 1981. Chase and Simon, 1973=Chase, W. G. and Simon, H. A. Perception in chess.—„Cognitive Psychology", 4, 1973: 55—81. Clark and Clark, 1977=Clark, H. H. and Clark E. V. Psychology and Language. New York: Harcourt Brace Jovanovich, 1977. Clark and Marshall, 1978=Clark, H. H. and Marshall, C. Reference diaries.— In: „Theoretical Issues in Natural Language Processing" (Waltz, D. (Ed.)). Urban — Champaign: Center for the Study of Reading, 1978. Cofer, 1941=Cofer, Ch. N. A comparison of logical and verbatim learning of prose passages of different lengths.—„American Journal of Psychology", 54, 1941: 1—20. Corbett, 1971 =Corbett, E. P. J. Classical Rhetoric for the Modern Student (2nd ed.). New York: Oxford University Press, 1971. Coulthard, 1977=Coulthard, M. An Introduction to Discourse Analysis. London: Longman, 1977. Coulthard and Montgomery, 1981 = „Studies in Discourse Analysis" (Coulthard, M. and Montgomery, M. (eds.)). London: Routledge and Kegan Paul, 1981. Crystal and Davy, 1969=Crystal, D. and Davy, D. Investigating English Style. London: Longman, 1969. Culler, 1975=Culler, J. Structuralist Poetics. London: Oxford University Press, 1975. van Dijk, 1972=van Dijk, T. A. Some Aspects of Text Grammars. The Hague: Mouton, 1972. van Dijk, 1976=van Dijk, T. A. Philosophy of action and theory of narrative.— ..Poetics", 5, 1976: 287—338. van Dijk, 1977(a)=van Dijk, T. A. Text and Context. London: Longman, 1977(a). van Dijk, 1980(b)=van Dijk, T. A. Macrostructures. Hillsdale, N.J.: Erlbaum, 1980(b). van Dijk, 1981(a)=van Dijk, T. A. Studies in the Pragmatics of Discourse. The Hague: Mouton, 1981(a). van Dijk, 1982(a)=van Dijk, T. A. Opinions and attitudes in discourse comprehension.— In: „Language and Comprehension". (Le Ny, J. F. and Kintsch, W. (eds.)). Amsterdam: North-Holland, 1982(a). van Dijk and Kintsch, 1978=van Dijk, T. A. and Kintsch, W. Cognitive psychology and discourse: recalling and summarizing stories.— In: „Current Trends in Text Linguistics" (Dressier, W. U. (ed.)). Berlin/New York: de Gruyter, 1978. van Dijk and Petofi, 1977=„Grammars and Description" (van Dijk, T. A. and Petofi, J. S. (eds.)). Berlin/New York: de Gruyter, 1977. Dik, 1978=Dik, S. С Functional Grammar. Amsterdam: North —Holland, 1978. Dik, 1980=Dik, S. C. Studies in Functional Grammar. New York: Academic Press, 1980. 207
Dressler, 1972=Dressler, W. U. Einfuhrung in die Textlinguistik. Tubingen: Niemeyer, 1972. Dressler, 1978=Dressler, W. U. Current Trends in Textlinguistics (Dress 1er, W. U. (Ed.)). Berlin/New York: de Gruyter, 1978. Erlich, 1955=Erlich, V. Russian Formalism. The Hague: Mouton, 1955. Fillmore, 1968=Fillmore, С. J. The case for case.— In: ,,Universale of Linguistic Theory" (Bach, E. and Harms, R. T. (eds.)). New York: Holt, Rinehart and Winston, 1968. Findahl and Hoijer, 1981=Findahl, O. and Hoijer, B. Studies of news from the perspective of human comprehension.— In: ,,Mass Communication Review Yearbook" (Vol. 2) (Wilhoit, G. С and Bock, H. de (eds.)). Beverly Hills, Calif.: Sage Publications, 1981. Fodor, Bever and Garret, 1974=Fodor, J. A., Bever, T. G. and Garret, M. F. The Psychology of Language. New York: McGraw-Hill, 1974. Franck, 1980=Franck, D. Grammatik und Konversation. KonigStein, Ts.: Scriptor, 1980. Garnham, 1981=Garnham, A. Mental models as representations of text.— „Memory and Cognition", 9, 1981: 560—565. Givon, 1979(a)=Syntax and Semantics 12: Discourse and Syntax (Givon, T. (ed.)). New York: Academic Press, 1979(a). Givon, 1979(b)=Givon, T. On Understanding Grammar. New York: Academic Press, 1979(b). Glanzer and Razel, 1974=Glanzer, M. and Razel, M. The size of the unit in short-term storage.—„Journal of Verbal Learning and Verbal Behavior", 13, 1974: 114—131. Goffman, 1967=Goffman, E. Interaction Ritual. New York: Anchor Books, 1967. Goffman, 1969=Goffman, E. Strategic Interaction. Philadelphia: University of Pennsylvania Press, 1969. Gomulicki, 1956=Gomulicki, B. R. Recall as an abstractive process.—„Acta psychologies, 12, 1956: 77—94. Graesser, 1981=Graesser, A. C. Prose Comprehension Beyond the Word. New York: Springer—Verlag, 1981. Graesser, Hoffman and Clark, 1980=Graesser, A. C, Hoffman, N. L. and Clark, L. F. Structural components of reading time.—„Journal of Verbal Learning and Verbal Behavior", 19, 1980: 135—151. Greimas, 1966=Greimas, A. J. Semantique Structurale. Paris: Larousse, 1966. Grimes, 1975=Grimes, J. The Thread of Discourse. The Hague: Mouton, 1975. de Groot and Frijda, 1981=de Groot, A. D. and Frijda, N. H. Selz and His Work. The Hague: Mouton, 1981. Gumperz and Hymes, 1972=Gumperz, J. D. and Hymes, D. Directions in Sociolinguistics: The Ethnography of Communication (Gumpertz, J. D. and Hymes, D. (eds.)). New York: Holt, Rinehart and Winston, 1972. Habel, 1982=Habel, C. Zur Geschichte von Referenzobjekten. Teil 1: Diskursmodelle.—In: „Sprachen und Welten" (Finke, P. and Gust, H. (eds.)), 1982. Halliday, 1961 =Halliday, M. A. K. Categories of the theory of grammar.— „Word", 17, 1961: 241—292. Harris, 1952=Harris, Z. S. Discourse analysis.—„Language", 28, 1952: 1—30. Hartmann, 1964=Hartmann, P. Text, Texte, Klassen von Texten.—„Bogawus", 2, 1964: 15—25. Hartmann, 1968=Hartmann, R. Textlinguistik als linguistische Aufgabe.— In: „Konkrete Dichtung. Konkrete Kunst" (Schmidt, S. (ed.)). Karlsruhe: Privatdruck, 1968. Harweg, 1968=Harweg, R. Pronomina und Textkonstitution. Munich: Fink, 1968. Hogan and Kintsch, 1971=Hogan, R. M. and Kintsch, W. Differential effects of study and text trials on long-term recognition and recall.—„Journal of Verbal Learning and Verbal Behavior", 10, 1971: 562—567. Hor mann, 1976=Hormann, H. Meinen und Verstehen. Frankfurt: Suhrkamp, 1976. (English translation: To mean — to understand. Berlin: Springer, 1981). Hunter, 1962=Hunter, M. L. An exceptional talent for calculative thinking.— „British Journal of Psychology", 53, 1962: 243—258. Hutchins, 1980=Hutchins, E. Culture and Inference. Cambridge, Mass.: Harvard University Press, 1980. 208
Ihwe, 1972=Ihwe, J. Linguistik in der Literaturwissenschaft (2 vols.). Munich: Bayerischer Schulzbuch Verlag, 1972. Johnson-Laird, 1980=Johnson-Laird, P. N. Mental models in cognitive science.—„Cognitive Science", 4, 1980: 72—115. Johnson-Laird and Garnham, 1980=Johnson-Laird, P. H. and Garnham, A. Descriptions and discourse models.—„Linguistics and Philosophy", 3, 1980: 371—393. Kamp, 1981=Kamp, H. A Theory of truth and semantic representation.— In: „Formal Methods in the Study of Language" (Groenendijk, J. A. G., Janssen, T. M. and Stockhof, M. В. J. (eds.). Amsterdam: Mathematical Centre Tracts, 1981. Kartunen, 1976=Kartunen, L. Discourse referents.— In: „Syntax and Semantics" (Vol. 7) (McCawley, J. D. (ed.). New York: Academic Press, 1976. Kendon, 1981=Interaction and Gesture (Kendon, A. (ed.)). The Hague: Mouton, 1981. Kendon, Harris and Key, 1975=Organization of Behavior in Face-to-face Interaction (Kendon, A., Harris, R. M. and Key, M. R. (eds.)). The Hague: Mouton, 1975. Kintsch, 1970=Kintsch, W. Models for free recall and recognition.— In: „Models of Human Memory" (Norman, D. (ed.)). New York: Academic Press, 1970. Kintsch, 1972=Kintsch, W. Notes on the structure of semantic memory.—In: „Organization of Memory" (Tulving, E., Donaldson, W. (eds.)). New York: Academic Press, 1972. Kintsch, 1974=Kintsch, W. The Representation of Meaning in Memory. Hillsdale, N. J.: Erlbaum, 1974. Kintsch, 1977(a)=Kintsch, W. Memory and Cognition. New York: Wiley, 1977(a). Kintsch, 1982(b)=Kintsch, W. Memory for text.—In: „Text Processing" (Flammer, A. and Kintsch, W. (eds.)). Amsterdam: North-Holland, 1982(b). Kintsch and van Dijk, 1975=Kintsch, W. and van Dijk, T. A. Comment on se rapelle et on resume des histoires.—„Languages", 40, 1975: 98—116. Kintsch and Dijk, 1978=Kintsch, W. and van Dijk, T. A. Toward a model of text comprehension and production.—„Psychological Review", 85, 1978: 363—394. Kintsch, Kozminsky, Streby, McKoon and Keenan, 1975=Kintsch, W., Kozminsky, E., Streby, W. J., McKoon, F. and Keenan, J. M. Comprehension and recall of text as a function of content variables.—„Journal of Verbal Learning and Verbal Behavior", 14, 1975: 196—214. Kintsch, Mandel and Kozminsky, 1977=Kintsch, W., Mandel, T. S., and Kozminsky, E. Summarizing scrambled stories.—„Memory and Cognition", 5, 1977: 547—552. Kolodner, 1980=Kolodner, J. L. Retrieval and Organizational Strategies in Conceptual Memory: A Computer Model (Technical Report, 187). Department of Cognitive Science: Yale University, 1980. Labov, 1972(a)=Labov, W. Language in the Inner City. Philadelphia: University of Pennsylvania Press, 1972(a). Labov, 1972(b)=Labov, W. Sociolinguistic Patterns. Philadelphia: University of Pennsylvania Press, 1972(b). Larsen, 1982=Larsen, S. F. Memory for radio news.— In: „Text Processing" (Flammer, A. and Kintsch, W. (eds.)). Amsterdam: North-Holland, 1982. Lausberg, 1960=Lausberg, H. Handbuch der literarischen Rhetorik. Munich: Hueber, 1960. Leech, 1966=Leech, G. H. English in Advertising. London: Longman, 1966. Levin, 1982=Levin, J. R. Pictures as prose learning devices.— In: „Text Processing" (Flammer, A. and Kintsch, W. (eds.)). Amsterdam: North-Holland, 1982. Levi-Strauss, 1960=Levi-Strauss, С. L'analyse morphologique des contes russes.—„International Journal of Slavic Linguistics and Poetics", 3, 1960: 122—149. Levi-Straus, 1963=Levi-Straus, С. Structural anthropology. (Translated from the French). New York: Basic Books, 1963. Lof tus, 1979=Loftus, E. Eyewitness Testimony. Cambridge, Mass.: Harvard University Press, 1979. Longacre, 1979=Longacre, R. E. The Paragraph as a grammatical unit.— In: „Syntax and Semantics 12: Discourse and Syntax" (Givon, T. (Ed.)). New York: Academic Press, 1979. Marslen-Wilson, Levy and Tyler, 1982=Marslen-Wilson, W., Levy, E. and 14-1182 209
Tyler, L. К. Producing interpretative discourse: the establishment and maintenance of reference.— In: „Speech, Place and Action" (Jarvella, R. J. and Klein, W. (eds.)). Chichester: Wiley, 1982. Marslen-Wilson and Tyler, 1980=Marslen-Wilson, W. and Tyler, L. K. The Temporal structure of spoken language understanding.—„Cognition", 8, 1980: 1—71. Meyer, 1975=Meyer, B. J. F. The Organization of Prose and Its Effects of Memory. Amsterdam: North-Holland, 1975. Miller and Kintsch, 1980=Miller, J. R. and Kintsch, W. Readability and recall of short prose passages: a theoretical analysis.—„Journal of Experimental Psychology: Human Learning and Memory", 6, 1980: 335—354. Minsky, 1975=Minsky, M. A Framework for representing knowledge.— In: „The Psychology of Computer Vision" (Winston, P. (ed.)). New York: McGraw-Hill, 1975. Muller, 1911=Muller, G. E. Zur Analyze der Gedachtnistatigkeit und des Vorstellungsverlaufes.—„Zeitschrift fur Psychologie". Erganzungsbang, V, 1911. Nash-Webber, 1978=Nash-Webber, B. L. Description formation and discourse model synthesis.— In: „Theoretical Issues in Natural Language Processing", Vol. 2 (Waltz, D. (ed.)). Urbana—Champaign, 1978. Newell, 1973=Newell, A. Production systems: models of control structures.— In: „Visual Information Processing" (Chase, W. G. (ed.)). New York: Academic Press, 1973. Norman and Rumelhart, 1975=Norman, D. A. and Rumelhart, D. E. Explorations in Cognition, San-Francisco: Freeman, 1975. Paul, 1959=Paul, I. Studies in remembering: the reproduction of connected and extended verbal material.—„Psychological Issues", 2, 1959, 1. Petofi, 1971=Petofi, J. S. Transformationsgrammatiken und eine ko-textuelle Texttheorie. Frankfurt: Athenaeum, 1971. Pike, 1967=Pike, K. L. Language in relation to a unified theory of human behavior. The Hague: Mouton, 1967. Pompi and Lachman, 1967=Pompi, K. F. and Lachman, R. Surrogate processes in the short-term retention of connected discourse.—„Journal of Experimental Psychology", 75, 1967: 143—150. Potts, 1972=Potts, G. R. Information processing strategies used in encoding linear orderings.—„Journal of Verbal Learning and Verbal Behavior", 11, 1972: 727—740. Propp, 1968=Propp, V. Morphology of the Folktale (2nd ed.). Austin: University of Texas Press, 1968 (см. оригинал на русском языке: Пропп В. Я. Морфология сказки. Л.: „Academia", 1928; изд. 2-е. М.: „Наука", 1969). Rothkopf, 1972=Rothkopf, E. Z. Structural text features and the control processes in learning from written material.— In: „Language Comprehension and the Acquisition of Knowledge" (Carroll, J. and Freedle, R. O. (eds.)). Washington, D. C, 1972. Rumelhart, 1975=Rumelhart, D. E. Notes on a schema for stories.—In: „Representation and Understanding" (Bobrow, D. G. and Collins, A. (eds.)). New York: Academic Press, 1975. Sacks, Schegloff and Jefferson, 1974=Sacks, H., Schegloff, E. A. and Jefferson, G. A Simplest systematics for the organization of turntaking for conservation.—„Language", 50, 1974: 696—735. Sanches and Blount, 1975.=Sociocultural dimensions of language use (Sanehes, M. and Blount, В. G. (eds.)). New York: Academic Press, 1975. Sandell, 1977=Sandell, R. Linguistic style and persuasion. London: Academic Press, 1977. Schank and Abelson, 1977=Schank, R. C. and Abelson, R. P. Scripts, plans, goals and understanding. Hillsdale, N. J.: Erlbaum, 1977. Schank and Colby, 1973=Computer Models of Thought (Schank, R. С and Colby, K. (eds.)). San-Francisco: Freeman, 1973. Schenkein, 1978=Studies in the organization of conversational interaction (Schenkein, J. (ed.)). New York: Academic Press, 1978. Scherer and Ekman, 1982=Handbook of Methods in Nonverbal Behaviour Research (Scherer, К. M. and Ekman, P. (eds.)). Cambridge: Cambridge University Press 1982 Schmidt, 1973=Schmidt, S. J. Texttheorie. Munich: Fink, 1973. Simmons, 1972=Simmons, R. F. Some semantic structures for representing English Meanings.— In: „Language Comprehension and the Acquisition of Knowledge" 210
(Carroll, J. В. and Freedle, R. O. (eds.)). Washington, D. C, 1972. Sinclair and Coulthard, 1975=Sinclair, J. and Coulthard, M. Towards an Analysis of Discourse. London: Oxford University Press, 1975. Slamecka=Slamecka, N. J. Studies of retention of connected discourse.— ,,American Journal of Psychology", 72: 409—416. Sudnow, 1972=Sudnow, D. Studies in Social Interaction (Sudnow, D. (ed.)). New York: Free Press, 1972. Todorov, 1968=Todorov, T. Grammaire du Decameron. The Hague/Paris: Mouton, 1968. Tulving and Thompson, 1973=Tulving, E. and Thompson, D. M. Encoding specificity and retrieval processes in episodic memory.—„Psychological Review", 80, 1973: 352—373. Webber, 1981= Webber, В. C. Discourse model synthesis: preliminaries to reference.— In: „Elements of Discourse Understanding". (Joshi, A. K., Webber, B. C, Sagg, I. A. (eds.)). Cambridge, England: Cambridge University Press, 1981. Wegman, 1981=Wegman, C. Conceptual representations of belief systems.— „Journal for the Theory of Social Behavior", 11, 1981: 279—305. Wellek, 1955=Wellek, R. A history of literary criticism. New Haven: Yale University Press, 1955. Wimsall and Brooks, 1957=Wimsall, W. K., Jr. and Brooks, С Literary Criticism. New York: Random House, 1957. Winograd, 1972 = Winograd, T. Understanding natural language. New York: Academic Press, 1972. Yates, 1966=Yates, F. A. The art of memory. London: Routledge and Kegan Paul, 1966.
Д. Шпербер, Д. Уилсон РЕЛЕВАНТНОСТЬ * 1. УСЛОВИЯ РЕЛЕВАНТНОСТИ В предыдущей главе мы ввели понятие контекстуального эффекта и рассмотрели несколько типов подобных эффектов: контекстуальные импликации, противоречия и подтверждения (strengthenings). Понятие контекстуального эффекта является весьма существенным для описания процесса понимания. По мере развития дискурса слушающий извлекает из памяти (или конструирует) и затем обрабатывает значительное число допущений (assumptions), которые образуют постепенно изменяющийся фон, используемый для обработки новой информации. Интерпретация высказывания предполагает не только идентификацию эксплицитно выраженного допущения: ее непременным условием является выявление тех следствий, к которым ведет добавление данного допущения к множеству допущений, уже прошедших когнитивную обработку. Это требует, иначе говоря, рассмотрения контекстуальных эффектов соответствующего допущения в контексте, определяемом (по крайней мере частично) предшествующими актами понимания. В любой момент развития дискурса в центре внимания слушающего находится специфический набор допущений, которые, возможно, никогда вместе не обрабатывались и никогда уже не будут обрабатываться вместе. Слушающий, выявив синтетические следствия, вытекающие из данного набора допущений, может получить новую информацию, которая могла бы быть безвозвратно утерянной после демонтажа данного набора допущений, а допущения, входящие в состав этого набора, могут быть забыты или помещены в различные участки энциклопедической памяти слушающего. Дело не только в том, что данные допущения, возможно, в первый и последний раз сочетаются в сознании слушающего, важно то, что они собираются в определенной последовательности и, предположительно, в той же последовательности подвергаются когнитивной обработке. Таким образом, каждое новое допущение обрабатывается в контексте определенного набора допущений, многие из которых совсем недавно подверглись когнитивной обработке. Dan Sperber, Deirdre Wilson. Relevance: Communication and Cognition. Ch. 3. Oxford, 1986, p. 118—171. © Harvard University Press., 1986. 212
Понятие контекстуального эффекта содействует описанию следующих двух существенных свойств понимания высказывания: понимание включает в себя совокупную обработку определенного набора допущений; некоторые из допущений, входящих в данный набор, выделяются как новая информация, обрабатываемая в контексте той информации, которая была обработана ранее. Понятие контекстуального эффекта является существенным для определения релевантности. Мы попытаемся показать, что наличие контекстуальных эффектов является необходимым условием для релевантности, а также что при прочих равных условиях релевантность тем больше, чем больше число контекстуальных эффектов. Прежде чем приступить к осуществлению данного проекта, мы хотели бы пояснить, что мы, собственно, намерены сделать. Мы не стремимся определить значение английского слова relevance в его обыденном употреблении. ,,Relevance" — слово, не имеющее четкого семантического содержания, оно используется по-разному разными людьми и разным образом одними и теми же людьми в разное время, в некоторых языках оно не имеет эквивалентов. Нет оснований считать, что адекватный семантический анализ английского слова relevance охарактеризует должным образом понятие, относящееся к области психологии. Мы убеждены, тем не менее, что психология нуждается в понятии достаточно близком к обыденноязыковому понятию релевантности. Иначе говоря, мы убеждены в существовании важного психологического свойства—свойства ментальных процессов, которое приблизительно отражается обыденным понятием релевантности и которое поэтому можно назвать релевантностью, используя этот термин в техническом смысле. Мы стремимся именно к тому, чтобы дать описание этого свойства, то есть определить «релевантность» как теоретически полезное понятие. Мы предполагаем, что люди имеют интуитивное представление о релевантности: они последовательно отличают релевантную информацию от нерелевантной, а в некоторых случаях более релевантную информацию от менее релевантной. Однако эти интуитивные представления нелегко выявить или использовать в качестве эмпирических данных. Тот факт, что в обыденном языке существует понятие релевантности с нечетким и изменчивым значением, является скорее сдерживающим, чем благоприятствующим фактором. Более того, интуитивные представления о релевантности соотносятся с конкретными контекстами, и вместе с тем не существует какого-либо способа, позволяющего точно установить, какой именно контекст представлен в сознании индивида в данный момент. [...] Несмотря на эти трудности, мы предполагаем использовать интуитивные представления о релевантности. Вместе с тем мы считаем необходимым обратить внимание, во-первых, на то, что утверждения о релевантности одного допущения и нерелевантности другого или о большей релевантности одного допущения и меньшей другого используются нами исключительно для того, чтобы подчеркнуть некоторое различие между данными допущениями. При этом 213
неважно, используете ли вы в подобных случаях для обозначения данного различия слово „релевантность". Во-вторых, мы считаем данные интуитивные суждения о релевантности заслуживающими внимания, но не являющимися основой для окончательных выводов. Они служат для нас отправным пунктом, однако не могут рассматриваться в качестве уникальных и окончательных критериев. Ценность предлагаемого нами теоретического понятия релевантности обусловлена в конечном счете ценностью психологических моделей, в которых это понятие используется и, в особенности, ценностью теории понимания языковых сообщений, которую оно позволяет сформулировать. Интуитивные суждения о релевантности не являются единственными интуитивными суждениями, используемыми в процессе понимания. Если взять некоторый конкретный набор допущений {С} и добавить к нему произвольно выбранное допущение Р, то вряд ли можно ожидать, что Р будет в какой-либо мере релевантным в контексте {С} или иметь какой-либо контекстуальный эффект для данного набора допущений. Предположим, например, что, читая данное предложение, вы имеете в вашем сознании набор допущений {С}. Представьте теперь, что мы сообщаем вам (1) 5 мая 1881 г. в Кабуле был солнечный день. Допущение, эксплицитно выраженное с помощью (1), вряд ли будет иметь какие-либо контекстуальные эффекты в {С} или быть релевантным (в любом смысле) относительно {С}. Интуитивно ясно, что допущение, выраженное с помощью (1), является нерелевантным в {С}. Мы можем объяснить это, указав на тот факт, что (1) не имеет каких-либо контекстуальных эффектов в {С}: в данном контексте не существует допущений, в сочетании с которыми (1) могло бы производить какие-либо контекстуальные импликации; данное высказывание не производит также никакого воздействия на «силу» допущений, уже имеющихся в данном контексте. Это объясняется тем, что (1) никак не связано с рассматриваемым контекстом. Существуют и другие возможности, определяющие отсутствие контекстуальных эффектов у допущения. Представим, например, что мы произносим следующее высказывание (2) Сейчас вы читаете книгу. Допущение, эксплицитно выраженное в (2), вероятно, будет нерелевантным в контексте любых допущений, имевшихся в вашем сознании непосредственно перед прочтением данного высказывания. И это также может быть объяснено ссылкой на то, что оно не имеет контекстуальных эффектов в данном контексте. По всей вероятности, вы осознавали то, что читаете книгу, поэтому любые возможные следствия, к которым могло бы привести (2) в данном контексте, уже были, вероятно, выработаны. Более того, вы, наверное, считаете данное допущение самоочевидным, и поэтому его сила не может быть увеличена. 214
В качестве третьего примера, являющегося нерелевантным в силу иных обстоятельств, рассмотрим высказывание (3): (3) Вы крепко спите. Допущение, эксплицитно выраженное в (3), является несовместимым с рядом неопровержимых допущений, существующих в вашем сознании. Вы наверняка осознаете не только то, что в настоящий момент вы читаете книгу, но и то, что такого рода деятельность несовместима с крепким сном. Поскольку, как бы вы ни доверяли нам, в данном вопросе вы с полным на то основанием гораздо больше доверяете себе; противоречие, возникающее при добавлении к контексту допущения, выраженному в (3), приводит к стиранию этого высказывания. Иначе говоря, (3) не может иметь контекстуальных эффектов в данном контексте и именно поэтому оно интуитивно осознается как нерелевантное. Таким образом, существует три типа случаев, в которых допущение может не иметь контекстуальных эффектов и быть нерелевантным в некотором контексте. В первом, иллюстрированном с помощью (1), допущение может сообщать новую информацию, однако эта информация никак не связывается с информацией, уже представленной в данном контексте. Во втором, иллюстрированном примером (2), данное допущение уже имеется в контексте, и оно не усиливается с помощью вновь представленной информации; эта вновь представленная информация является таким образом совершенно неинформативной и нерелевантной. В третьем типе случаев, иллюстрируемом с помощью (3), допущение противоречит контексту и является слишком слабым для того, чтобы его разрушить; когнитивная обработка этого допущения оставляет таким образом контекст без изменений. Необходимо подчеркнуть, что во всех приведенных примерах именно эксплицитно выраженное в высказывании допущение не имеет контекстуальных эффектов и является нерелевантным —тот факт, что говорящий предпочел выразить нерелевантное допущение, может быть сам по себе весьма релевантным. Это может быть использовано с целью изменить предмет обсуждения, и само желание это сделать может быть релевантным. В качестве реального примера можно рассматривать и использование нерелевантных допущений в (1)—(3) с целью сделать (хотелось бы надеяться) релевантные замечания. Релевантность может быть достигнута путем выражения нерелевантных допущений, по крайней мере в тех случаях, когда использование данных средств выражения является само по себе релевантным. На основе приведенных примеров мы считаем возможным утверждать, что допущение, не имеющее контекстуальных эффектов в заданном контексте, является нерелевантным в этом контексте. Иначе говоря, наличие какого-либо контекстуального эффекта в конкретном контексте является необходимым условием для релевантности. 215
Следующий вопрос состоит в том, является ли наличие контекстуальных эффектов не только необходимым, но и достаточным условием для релевантности. В пользу этого существуют некоторые свидетельства. Рассмотрим, например, следующий зарегистрированный пример речевого взаимодействия: (4) Продавец флажков: «Вы не хотите купить флажок Королевского общества спасания на водах?» Прохожий: «Нет, спасибо. Мы с сестрой всегда проводим отпуск в Бирмингеме.» Для того чтобы осознать релевантность ответа прохожего, слушающий должен воспользоваться чем-то вроде предпосылок в (5) и произвести нечто вроде контекстуальной импликации в (6): (5) (а) Бирмингем расположен вдали от побережья. (б) Королевское общество спасания на водах является благотворительным. (в) Покупка флажка является способом записаться в благотворительное общество. (г) Тот, кто проводит отпуск вдали от побережья, не нуждается в услугах Королевского общества спасания на водах. (д) Тот, кто не нуждается в услугах благотворительного общества, как правило, в него не записывается. (6) Нельзя ожидать, что прохожий запишется в Королевское общество спасания на водах. Ответ прохожего интересен тем, что он указывает на весьма тесную связь между осознанием релевантности (а, точнее, релевантности, входящей в намерения говорящего) и способностью извлечь из данного ответа определенную контекстуальную импликацию. Представляется очевидным, что человек, неспособный обеспечить нечто вроде контекста в (5) и произвести нечто вроде контекстуальной импликации в (6), будет неспособен осознать преднамеренную релевантность этого ответа и, наоборот, любой человек, осознавший данную импликацию, будет считать данный ответ релевантным в соответствующем контексте. Осознание контекстуального эффекта допущения кажется поэтому достаточным для признания его релевантным. Соблазнительным в связи с этим представляется следующее определение: (7) Релевантность Некоторое допущение является релевантным в определенном контексте тогда и только тогда, когда оно имеет в данном контексте какой-либо контекстуальный эффект. Приведенное определение отражает, в частности, интуитивное представление, согласно которому допущение, для того чтобы быть релевантным в определенном контексте, должно каким-либо образом 216
связываться с этим контекстом. Оно дает объяснение этому интуитивному представлению путем выявления характера требуемой связи. Так, например, это определение предсказывает, что ответ прохожего в (4) является релевантным в контексте (5 а—д), то есть он связывается с этим контекстом и производит контекстуальную импликацию (6). [...] Хотя определение (7) соответствует некоторым интуитивным суждениям о релевантности, мы можем ожидать, что существуют и другие суждения, которые, как представляется, могут противоречить ему и, в особенности, утверждению о том, что наличие контекстуального эффекта, каким бы малым он ни был, является достаточным условием для релевантности. Интуитивные суждения о корректном использовании термина „релевантность" сходны с интуитивными суждениями о корректном использовании такого, например, термина, как „гибкость" чем труднее согнуть какой-либо предмет, тем мы менее склонны называть его гибким, хотя мы должны признать, что формально предмет является гибким, если его хоть сколько-нибудь можно согнуть. То же самое относится и к интуитивным суждениям о релевантности: чем слабее контекстуальные эффекты допущения, тем менее мы склонны считать его релевантным, хотя и может быть показано, что с формальной точки зрения допущение, имеющее какой-бы то ни было контекстуальный эффект, является релевантным. [...] 2. СТЕПЕНИ РЕЛЕВАНТНОСТИ: ДОСТИГАЕМЫЕ ЭФФЕКТЫ И ЗАТРАЧИВАЕМЫЕ УСИЛИЯ Предложенное выше определение релевантности является недостаточным в силу по крайней мере двух обстоятельств: во-первых, релевантность имеет градуированный характер, а в данном определении ничего не говорится о том, каким образом определяются степени релевантности; во-вторых, релевантность была определена как отношение между допущением и контекстом, однако ничего не было сказано о том, как определяется контекст. Следовательно, к настоящему времени мы просто определили некоторое формальное свойство, отношение которого к психологической реальности остается неясным. Рассмотрим вначале вопрос о степенях релевантности. [...] Контекстуальные эффекты допущения в конкретном контексте не являются единственным фактором, который следует принимать во внимание при оценке степени релевантности. Контекстуальные эффекты обеспечиваются определенными ментальными процессами, которые, как и все биологические процессы, требуют затраты определенных усилий, некоторого расхода энергии. Усилия, необходимые для когнитивной обработки при производстве контекстуальных эффектов, являются вторым фактором, который необходимо учитывать при оценке степеней релевантности. Затрачиваемые усилия на обработку являются отрицательным фактором: при прочих 217
равных условиях чем больше усилий затрачивается, тем меньше релевантность. В последнем разделе нами было рассмотрено определение релевантности, выраженное в терминах необходимых и достаточных условий, то есть релевантность была определена как классификационное понятие. Там же мы отметили, что подобное определение, хотя и достаточно корректное, не отражает того факта, что релевантность является также (и это даже важнее) сопоставительным (comparative) понятием. Сопоставительные понятия определяются наилучшим образом в терминах так называемых ,,условий меры" (,,extent" conditions). [...] Мы можем усовершенствовать определение релевантности (7), используя данные условия: (8) Релевантность Условие меры 1: допущение является тем релевантнее в некотором контексте, чем больше его контекстуальные эффекты в данном контексте. Условие меры 2: допущение является тем релевантнее в некотором контексте, чем меньше когнитивные усилия, необходимые для его обработки. Это определение подразумевает необходимое и достаточное условия определения (7), которые поэтому не нуждаются в отдельной констатации. [...] Достаточно легко выявить множество факторов, позволяющих предсказать, какая информация будет иметь наибольшие контекстуальные эффекты. Так, например, при прочих равных условиях более сильные допущения имеют большие контекстуальные эффекты. Сходным образом на основе некоторого множества факторов может быть произведено сопоставление объема когнитивных усилий, необходимых для решения каких-либо двух задач. Например, обработка большего объема информации в одном и том же контексте или той же информации, но в более широком контексте требует больших усилий. Индивиды могут воспользоваться этими способностями к сопоставлению при попытках максимализировать релевантность обрабатываемой ими информации. Каким образом могут быть сбалансированы два основополагающих фактора оценки релевантности, какого рода эффекты заслуживают тех или иных усилий? В чисто формальной системе решение этого вопроса потребовало бы скорее всего выработки некоторой договоренности, а не теоретического открытия. При использовании ЭВМ в экономических целях, например, затраты и эффекты могут получить точное измерение в долларах и центах. Если же говорить о психологических процессах, то эта проблема представляется неподдающейся какому-либо общему решению, а при более пристальном рассмотрении оказывается, что она и не нуждается в каком-либо общем решении. 218
Весьма сомнительно, что относительная значимость эффектов и затрачиваемых усилий на когнитивную обработку является постоянной при всех условиях и для всех индивидов. Так, например, изменения в восприимчивости могут оказать влияние на желание индивида затратить некоторые усилия на когнитивную обработку; в некоторых случаях для этого достаточно лишь надежды на достижение требуемого уровня контекстуального эффекта, в других этого будет недостаточно. Кроме того, некоторые люди отличаются особой восприимчивостью, поэтому все, что только может быть релевантным, для них будет более релевантным, чем для менее восприимчивых людей. Говорящие, которые не осознают, как относятся слушающие к обсуждаемому предмету, рискуют тем, что они могут потребовать от слушающих чересчур больших усилий, или же тем, что их сообщение будет иметь слишком малые эффекты. Когнитивные эффекты и усилия являются нерепрезентационными свойствами ментальных процессов. Релевантность как производная от эффектов и когнитивных усилий также является нерепрезентаци- онным свойством. Иначе говоря, релевантность—это свойство, которое не нуждается в репрезентации (не говоря уж о «вычислимости»). В тех случаях, когда она имеет репрезентацию, последняя осуществляется в терминах сопоставительных суждений или абсолютных суждений общего характера („нерелевантный", „малорелевантный", „весьма релевантный" и т. п.), но не в терминах абсолютно точных (то есть количественных) суждений. Поскольку мы заинтересованы в рассмотрении релевантности как психологического свойства, у нас нет побудительных причин для ее количественного определения. Необходимым для себя мы считаем представление эмпирического материала, подтверждающего приведенное выше сопоставительное определение релевантности. Это может быть сделано путем рассмотрения того, как выявляется и достигается релевантность в ментальных процессах, в особенности в процессах понимания языковых сообщений. Нашим первым шагом является отказ от чисто формальной характеризации контекста в пользу более эмпирической характеризации и рассмотрение возможных последствий такого решения. 3. является ли контекст заданным или избираемым? Ранее мы высказали предположение, что контекст, который используется для обработки новых допущений, является, в сущности, некоторым подмножеством уже имеющихся у индивида допущений, сочетаясь с которыми новые допущения производят ряд контекстуальных эффектов. Мы предложили также два критерия для сопоставления релевантности различных допущений в данном контексте. Однако перед нами по-прежнему стоит серьезный вопрос: каким образом формируется контекст, то есть каким образом избирается конкретное подмножество из существующих в сознании индивида допущений. [...] 219
В данном разделе мы рассмотрим различные подходы, которые основываются на представлении о том, что в любой заданный момент в распоряжении индивида имеется лишь один контекст, и постараемся показать, что данные подходы являются неудовлетворительными именно потому, что они основываются на этом представлении. В следующем разделе нами будет предложен альтернативный подход. Во многих исследованиях так или иначе выражается убеждение в том, что контекст, необходимый для понимания высказывания, не является предметом выбора: в любой момент речевого взаимодействия контекст рассматривается как уникально определенный, то есть как заданный. Более того, как правило, предполагается, что контекст задан уже до начала процесса понимания. При этом допущение, эксплицитно выраженное в высказывании, рассматривается как сочетающееся с контекстом, представленным в сознании индивида к моменту произнесения данного высказывания. Простейшим вариантом этой точки зрения является гипотеза, согласно которой контекст, необходимый для понимания данного высказывания, представляет собой множество допущений, эксплицитно выраженных в предшествующих высказываниях диалога или дискурса. Данная гипотеза, как может показаться, подкрепляется следующим примером: (9) (а) Питер: «Я устал.» (б) Мэри: «Если ты устал, я приготовлю ужин.» Легко представить себе ситуацию, в которой ответ Мэри будет интуитивно релевантным. В речевом контексте, состоящем из допущения, выраженного Питером, допущение, выраженное Мэри, контекстуально имплицирует (10), и тем самым объясняется тот факт, что оно является релевантным: (10) Мэри приготовит ужин. Однако рассмотрим другой вариант этого диалога: (11) (а) Питер: «Я устал.» (б) Мэри: «Я приготовлю ужин.» Интуитивно мы не усматриваем особых различий между ответами Мэри в (9) и (11): оба они релевантны более или менее одинаково. Однако, если бы контекстом, необходимым для понимания, было лишь допущение, эксплицитно выраженное Питером, нам бы пришлось рассматривать два ответа Мэри как совершенно различные: (11б) в отличие от (9б) не имеет каких-либо контекстуальных эффектов в такого рода контексте и не является таким образом релевантным. Рассмотрим в связи с этим в качестве второй гипотезы утверждение о том, что контекст, необходимый для понимания, содержит не только все допущения, эксплицитно выраженные в предшествующих высказываниях дискурса, но также и все допущения, имплицируемые данными высказываниями. У нас есть основания предполо- 220
жить, что в ситуации, в которой реплика Питера является релевантной, она имплицирует нечто вроде (12): (12) Питер хочет, чтобы Мэри приготовила ужин. При условии, что (12) входит в состав контекста, как (9б), так и (11б) контекстуально имплицируют (13): (13) Мэри сделает то, чего желает Питер. Обе эти реплики будут, следовательно, релевантными в данном контексте, причем сходным образом. Хотя (9б) имеет две контекстуальные импликации, тогда как (11б)—только одну, это компенсируется тем, что (9б) имеет более сложную логическую форму, чем (11б) и требует больших когнитивных усилий для обработки. Тот факт, что два ответа Мэри являются интуитивно сходными по своей релевантности, получает таким образом четкое объяснение. Рассмотрим, однако, третий вариант того же диалога: (14) (а) Питер: «Я устал.» (б) Мэри: «Десерт уже готов. Сейчас я приготовлю основное блюдо.» Ни одна из рассмотренных ранее гипотез не может объяснить тот факт, что ответ Мэри в (14б) по своей релевантности в общем аналогичен ее ответам в двух предыдущих версиях диалога. (14б) не имеет контекстуальных эффектов в контексте, состоящем из допущений, эксплицитно выраженных в предшествующем дискурсе, или же из ранее выраженных и имплицированных допущений. Чтобы объяснить релевантность (14б), в контекст, используемый слушателем, необходимо включить предпосылку типа (15): (15) Ужин состоит по крайней мере из основного блюда и десерта. При добавлении (15) к контексту из (14б) может быть выведена следующая контекстуальная импликация: (16) Мэри приготовит ужин. Тогда на основе (16) и (12) (Питер хочет, чтобы Мэри приготовила ужин) может быть получена контекстуальная импликация (13) (Мэри сделает то, чего желает Питер) совершенно так же, как она могла быть получена (в более ограниченном контексте) из (9б) или (11б). Предположение, согласно которому при обработке ответа Мэри (14б) используется контекстуальная предпосылка типа (15), относится к уровню здравого смысла. Однако оно несопоставимо с гипотезой о том, что необходимый для понимания контекст представляет собой набор ранее выраженных или имплицированных предшествующими высказываниями допущений. Слова Питера о том, что он устал, не утверждают и не имплицируют того, что ужин состоит по крайней мере из основного блюда и десерта. Предпосылка (15) 221
должна быть специально извлечена из энциклопедической статьи, относящейся к понятию „ужин". Мы должны, следовательно, рассмотреть в качестве третьей гипотезы утверждение о том, что необходимый для понимания контекст состоит не только из выраженных или имплицированных предшествующими высказываниями допущений, но и из энциклопедических статей, относящихся к любым из использованных в данных допущениях понятий. Так, например, если начальная реплика Питера имплицирует, что он хочет, чтобы Мэри приготовила ужин, то энциклопедическая статья, относящаяся к ужину, и, в частности, допущение (15) (Ужин состоит по крайней мере из основного блюда и десерта) автоматически добавляется к контексту, в котором будет интерпретирован ответ Мэри. С помощью этой гипотезы релевантность (146) получает объяснение. Рассмотрим, однако, четвертую версию диалога: (17) (а) Питер: «Я устал». (б) Мэри: «Десерт готов. Сейчас я приготовлю оссо-бакко». Интуитивно мы не ощущаем особых различий между релевантностью ответов Мэри в (176) и (146). Очевидным объяснением этого является предположение, что контекст, в котором интерпретируется (176), содержит допущение типа (18): (18) Оссо-бакко является основным блюдом. При включении в контекст (18) допущение, эксплицитно выраженное Мэри в (146) («Десерт готов. Сейчас я приготовлю основное блюдо»), контекстуально имплицируется ее четвертым ответом (176), что и объясняет сходство в релевантности (146) и (176). Однако допущение (18) относится к энциклопедической статье блюда оссо-бакко. Понятие оссо-бакко не присутствует в выраженных или имплицированных Питером допущениях, оно впервые вводится в ответе Мэри. Это несопоставимо с гипотезой, согласно которой контекст, необходимый для понимания, состоит из допущений, выраженных или имплицированных предшествующими высказываниями, а также энциклопедических статей, соотносящихся с любым из понятий, использованных в данных допущениях. Соблазнительной в связи с этим может показаться еще одна гипотеза для объяснения четвертой версии диалога: контекст, необходимый для понимания высказывания, включает в себя допущения, выраженные или имплицированные предшествующими высказываниями, плюс энциклопедические статьи, относящиеся к любому из понятий, использованных в данных допущениях, плюс энциклопедические статьи, относящиеся к любому из понятий, использованных в этом новом высказывании. Обратите внимание на то, что контекст в соответствии с данной гипотезой, хотя и уникально определяемый, не является фиксированно заданным до начала процесса понимания. Напротив, согласно данной гипотезе, одна из предварительных стадий понимания состоит в идентификации понятий, используемых 222
в новом высказывании, и включении в контекст относящихся к ним энциклопедических статей. Однако и в данном случае проблема выбора контекстов не ставится. В соответствии с этой гипотезой (18) входит в состав контекста, в котором интерпретируется ответ Мэри (176), чем и объясняется его релевантность. Рассмотрим, однако, пятую версию этого диалога: (19) (а) Питер: «Я устал». (б) Мэри: «Десерт готов. Сейчас я приготовлю фирменное блюдо ресторана „Капри".» Чтобы установить релевантность ответа Мэри (196), слушающий должен получить доступ к энциклопедической статье о ресторане „Капри", выявить, что фирменным блюдом этого ресторана является оссо-бакко, а затем получить доступ к энциклопедической статье „оссо-бакко" и узнать, что оссо-бакко является основным блюдом, то есть прийти к допущению (18). Понятие оссо-бакко не фигурирует тем не менее ни в ответе Мэри, ни в допущениях, выраженных или имплицированных репликой Питера. Таким образом, в соответствии с четвертой гипотезой, (18) не входит в состав контекста, необходимого для интерпретации (196). Это может побудить нас, если терпение наше еще не иссякло, к формулировке пятой гипотезы: контекст, необходимый для понимания высказывания, включает в себя допущения, выраженные или имплицированные предшествующими высказываниями, плюс энциклопедические статьи, относящиеся к любым из понятий, использованных в данных допущениях и в новом высказывании, плюс энциклопедические статьи, относящиеся к любому из понятий, использованных в энциклопедических статьях, уже добавленных к контексту. В соответствии с четвертой гипотезой к контексту добавляется один слой энциклопедических статей, в соответствии с пятой гипотезой—два таких слоя. Недостатки такого рода рассуждения становятся теперь очевидными. В соответствии с двумя последними гипотезами контекст автоматически насыщается огромным количеством энциклопедической информации, большая часть которой (а иногда и вся) не способствует повышению контекстуального эффекта обрабатываемой новой информации. Поскольку любое расширение контекста означает увеличение необходимых для обработки когнитивных усилий, этот метод формирования контекста может привести к общему падению релевантности. [...] На других примерах можно было бы показать, что в соответствии с представленным рассуждением объем привлекаемой энциклопедической информации все более возрастает вплоть до включения в контекст всей имеющейся в памяти энциклопедической информации. Если бы контекст включал в себя всю содержащуюся в памяти слушающего энциклопедическую информацию, то любая новая информация, выраженная говорящим, оказалась бы релевантной, 223
поскольку практически любая новая информация имела бы в столь огромном контексте тот или иной контекстуальный эффект. С другой стороны, при столь значительном объеме контекста для достижения этих эффектов потребовались бы громадные усилия на когнитивную обработку, не говоря уже о затратах времени на те же цели. Поскольку с возрастанием когнитивных усилий релевантность уменьшается, это означало бы, что, хотя любая новая информация и легко получала бы релевантность, эта релевантность для любой информации была бы минимальной. Кроме того, любого рода напоминания никогда бы не были релевантными, поскольку они просто дублировали бы информацию, уже включенную в контекст. Становится очевидным, что эту линию рассуждения продолжать не стоит. Вплоть до настоящего момента мы исходили из широко распространенной точки зрения, согласно которой контекст, необходимый для интерпретации какого-либо допущения, является однозначно детерминированным. Мы рассматривали контекст как некоторую данность, сформированную до начала процесса понимания или же на одной из предварительных стадий этого процесса. Мы постарались показать, что принятие тезиса об однозначной детерминации контекста приводит к абсурдным выводам. Вместе с тем ни природа самого контекста, ни природа процесса понимания не исключают возможности альтернативных способов формирования контекста, а также его перестройки в ходе процесса понимания. В следующем разделе эта возможность будет рассмотрена подробнее. 4. ВЫБОР КОНТЕКСТОВ [...] Мы считаем, что решающее значение в обработке новой информации (в особенности передаваемой с помощью языковых средств) имеет объединение ее с контекстом—адекватно избранным множеством фоновых допущений, извлеченных из памяти дедуктивного устройства. Для любой новой информации в качестве контекста может быть избран ряд различных множеств допущений, извлеченных из различных источников—долговременной памяти, кратковременной памяти и восприятия. Сказанное не означает, что контекстом может быть любое произвольное множество допущений из общей совокупности допущений, имеющихся в распоряжении индивида. Организация энциклопедической памяти индивида и деятельность его сознания ограничивают класс потенциальных контекстов, из которых в данное время может быть избран необходимый контекст. [...] Выбор контекста, необходимого для вывода умозаключений вообще и для понимания, в частности, в любой момент частично предопределяется содержанием памяти дедуктивного устройства (содержанием кратковременной памяти общего назначения и энциклопедической памяти) и информацией, которая может быть получена непосредственно из окружающей обстановки. Эти факторы определяют не единственный контекст, а спектр возможных контекстов. Чем же определяется выбор конкретного контекста из данного 224
спектра? По нашему убеждению, этот выбор определяется стремлением к определению релевантности. Во многих исследованиях по прагматике предполагается, что события разворачиваются в следующем порядке: вначале устанавливается контекст, затем осуществляется интерпретация высказывания, после чего производится оценка его релевантности. Релевантность, иначе говоря, рассматривается как некоторая переменная, задаваемая функционированием предопределенного контекста. Однако с психологической точки зрения эта модель понимания вызывает большие сомнения. Люди не просто занимаются оценкой релевантности новой информации: они пытаются обработать информацию наиболее продуктивным образом, другими словами, они стремятся получить от каждой новой порции информации максимальный контекстуальный эффект, заботясь в то же время о минимальном расходовании когнитивных усилий на ее обработку. Оценка релевантности является не целью процесса понимания, а средством к достижению цели, цель заключается в максимальном повышении релевантности любой обрабатываемой информации. Если это так, то из этого следует, что в процессе понимания события разворачиваются в порядке прямо противоположном. Неверно, что вначале определяется контекст, а затем производится оценка релевантности; напротив, люди исходят из представления о том, что обрабатываемое допущение является релевантным (иначе они бы и не стали его обрабатывать), и они стремятся избрать контекст, который бы соответствовал данному представлению, и именно тот контекст, который обеспечит максимум релевантности. То, что именно релевантность трактуется как данное, а контекст— как переменная, особенно наглядно обнаруживается в процессах понимания языковых сообщений. В связи с этим изменением перспективы возникает закономерный вопрос: мы определили релевантность как отношение между некоторым допущением и некоторым контекстом. Однако, если контекст не является заданным (а именно так, по нашему убеждению, обстоят дела в процессах понимания), как может быть определена релевантность некоторого допущения? Отвечая на этот вопрос, мы используем наше формальное определение релевантности в контексте в качестве основы для характеризации психологически более адекватного понятия—релевантности для индивида. 5. РЕЛЕВАНТНОСТЬ ДЛЯ ИНДИВИДА По завершении любого дедуктивного процесса в распоряжении индивида оказывается некоторое множество доступных контекстов. Это множество является частично упорядоченным: каждый контекст (за исключением исходного) содержит один или несколько меньших контекстов, и каждый контекст (за исключением максимальных контекстов *) входит в состав одного или нескольких более крупных * Под максимальным контекстом автор понимает контекст, который не может быть расширен в силу имеющихся ограничений памяти.— Прим. перев. 15-1182 225
контекстов. Множество доступных контекстов является, таким образом, частично упорядоченным с помощью отношения включения. Это формальное отношение имеет психологическое соответствие: порядок включения соответствует порядку доступности. Исходный (минимальный) контекст является непосредственно доступным; доступ к контекстам, единственной составляющей которых является исходный контекст, может быть осуществлен в один шаг; это наиболее доступные контексты; доступ к контекстам, включающим в себя исходный контекст, а также наиболее доступные контексты, осуществляется в два шага и т. д. Обратите внимание на факт, имеющий существенное значение для теории релевантности: доступ к контексту (аналогично обработке информации в некотором контексте) требует определенных усилий. Чем менее доступным является контекст, тем больших усилий требует доступ к нему (верно и обратное). Рассмотрим некоторое новое допущение А. Оно может быть релевантно в нескольких, во всех или ни в одном из контекстов, доступных индивиду в данный момент. Это зависит от того, содержат или не содержат А некоторые или все из данных контекстов, имплицируют они или нет А и от относительной силы, с которой допущение А принималось ранее и принимается в настоящий момент. В этом отношении могут быть выделены шесть ситуаций (список не является исчерпывающим, но он достаточен для наших целей): (20) (а) А уже содержится в исходном контексте или имплицируется этим контекстом, обладая в каждом из этих случаев максимальной силой. Тогда новое предъявление А в данном контексте является нерелевантным. То же самое относится и ко всем другим доступным контекстам, поскольку все они включают в себя исходный контекст. В этой ситуации нет смысла устанавливать релевантность вне исходного контекста, так как это непродуктивно. (б) А не содержится и не имплицируется ни одним из доступных контекстов и ни в одном из них не имеет никаких контекстуальных эффектов. В этом случае А является также нерелевантным во всех доступных контекстах и нет никакого смысла расширять исходный контекст в целях выявления релевантности. (в) А содержится в исходном контексте или имплицируется им; то же справедливо и в отношении всех доступных контекстов, сила А при этом меньше максимальной. В этом случае подкрепление А путем его нового предъявления обеспечит его релевантность во всех доступных контекстах. В этой ситуации расширение контекста будет обоснованным, если А будет иметь в расширенном контексте большие контекстуальные эффекты, чем в исходном контексте, и при том условии, что выигрыш в контекстуальных эффектах не 226
перевешивается дополнительными усилиями, необходимыми для обработки А в расширенном контексте. (г) А не содержится и не имплицируется ни одним из доступных контекстов, но имеет некоторые контекстуальные импликации в исходном контексте. В этом случае А является релевантным во всех доступных контекстах, в которых оно сохраняет данные контекстуальные импликации. Расширение контекста здесь будет обоснованным также до тех пор, пока оно дает большие контекстуальные эффекты и пока возрастание контекстуальных эффектов не перевешивается возрастанием усилий, необходимых для обработки. (д) А не содержится и не имплицируется ни одним из контекстов, однако оно имеет определенные контекстуальные эффекты при некотором расширении исходного контекста. В этом случае А является релевантным в некоторых доступных контекстах. В этой ситуации никакая релевантность не может быть обеспечена без расширения контекста. Расширение контекста должно производиться с учетом положений, высказанных в пунктах (в) и (г). (е) А не содержится и не имплицируется исходным контекстом, однако оно содержится в некоторых из более крупных доступных контекстов и имеет в них максимальную силу; А имеет контекстуальные эффекты в некоторых из контекстов, в которых оно не содержится (к ним может относиться и исходный контекст). В этом случае А будет релевантным в одном из доступных контекстов и его релевантность будет заключаться в напоминании. Напоминание релевантно только в тех контекстах, которые не содержат данную информацию, его функция заключается в обеспечении доступа к данной информации ценой меньших затрат на обработку, чем те, которые могли бы потребоваться для ее получения путем последовательного расширения контекста. [...] Теперь мы в состоянии дать классификационное определение релевантности для индивида: (21) Релевантность для индивида (классификационная). Допущение является релевантным для индивида в данное время тогда и только тогда, когда оно релевантно в одном или нескольких из контекстов, доступных этому индивиду в данное время. Однако мы менее заинтересованы в классификационных, чем в сопоставительных определениях релевантности. Поэтому мы поступим аналогично тому, что мы сделали в отношении релевантности в контексте, и охарактеризуем сопоставительное понимание релевантности для индивида в терминах эффектов и требуемых когнитивных усилий. Рассматривая когнитивные усилия, необходимо принять во внимание не только те усилия, которые требуются для обработки некоторого допущения в данном контексте, но и усилия, которые 15* 227
требуются для доступа к данному контексту. Эффекты и когнитивные усилия будут различными для любого из доступных индивиду контекстов; различной в связи с этим будет и релевантность. Действительно, доступ к одному и тому же контексту может быть обеспечен различными способами, требующими различающихся по своей величине усилий и, следовательно, различной релевантности. Мы могли бы поэтому попытаться охарактеризовать релевантность некоторого допущения для индивида в терминах набора количественных оценок релевантности, каждая из которых соответствовала бы одному из возможных способов обработки данного допущения, то есть одному из возможных контекстов и одному из возможных способов обеспечения доступа к этому контексту. Однако, с точки зрения психологии, результат столь сложной процедуры не представлял бы особого интереса. Мы считаем, что индивид автоматически стремится к достижению максимальной релевантности, и именно представления о максимальной релевантности оказывают воздействие на его когнитивную деятельность. Достижение максимальной релевантности требует выбора наиболее подходящего контекста из тех, в которых может быть произведена когнитивная обработка данного допущения, то есть контекста, позволяющего наилучшим образом сбалансировать затрачиваемые усилия и предполагаемые эффекты. В тех случаях, когда искомая сбалансированность достигнута, мы будем говорить, что данное допущение было оптимально обработано. Говоря о релевантности некоторого допущения для индивида, мы будем иметь в виду релевантность, достигаемую при его оптимальной обработке. Теперь можно сформулировать следующее определение: (22) Релевантность для индивида (сопоставительная). Условие меры 1: релевантность допущения для индивида тем больше, чем больше контекстуальные эффекты, достигаемые при его оптимальной обработке. Условие меры 2: релевантность допущения для индивида тем больше, чем меньше когнитивные усилия, необходимые для его оптимальной обработки. Так же как определение (8) (сопоставительное определение релевантности в контексте), данное определение релевантности для индивида не обеспечивает возможности сопоставления во всех случаях. Возьмем, например, два независимых допущения, каждое из которых релевантно для двух разных индивидов в разное время. Является ли допущение А 1 более релевантным для Билла в момент t1, чем допущение А2 для Джоан в момент t2? Наше определение, как правило, не позволяет отвечать на подобные вопросы, ну а с психологической точки зрения это и не требуется. Единственными сопоставлениями релевантности, имеющими психологическую значимость, являются сопоставления, подчиненные цели достижения максимальной релевантности, это может быть релевантность для самого участника коммуникации или релевантность для аудитории, рассматриваемая с точки зрения коммуниканта. [...] 228
6. РЕЛЕВАНТНОСТЬ ЯВЛЕНИЙ И СТИМУЛОВ Когнитивная среда индивида представляет собой совокупность всех доступных его сознанию фактов. Воздействие какого-либо явления на когнитивную среду состоит в том, что с его помощью получают выражение (или более яркое выражение) некоторые факты. В результате индивид может осуществить ментальную репрезентацию этих фактов в форме сильных (или более сильных) допущений и, возможно, использовать их для производства дальнейших допущений, которые, хотя и не соответствуют непосредственно наблюдаемым фактам, могут тем не менее быть доступными сознанию индивида. Благодаря некоторому явлению может стать очевидным большое число допущений. Это не означает, однако, что в сознании индивида действительно сформируются хотя бы некоторые из этих допущений. В доме, например, всегда присутствуют привычные запахи, индивид не обращает на них внимания и не конструирует каких-либо относящихся к ним допущений. Допустим, однако, что в доме явно ощущается запах газа. Весьма вероятно, что индивид в связи с этим сформулирует допущения (23) и (24): (23) В доме пахнет газом. (24) В доме произошла утечка газа. Менее вероятно, что он формулирует допущение (25), хотя оно и является для него очевидным: (25) Служащие газовой компании сегодня не бастуют. Почему же индивид формулирует одни допущения, а не другие? Во-первых, существуют определенные допущения, которые индивид не может не сформулировать в данной когнитивной среде. Возьмем к примеру слуховое восприятие. Способность к слуховому восприятию делает для нас доступным множество разнообразных шумов, но лишь немногие из них достигают уровня осознанного восприятия, то есть приводят к конструированию концептуальных репрезентаций и использованию их в центральных мыслительных процессах. Механизмы слухового восприятия функционируют в качестве фильтра, обрабатывая и отфильтровывая большую часть акустической информации на уровне подсознания. Эти подсознательно обрабатываемые явления могут стать доступными сознанию индивида, но только в тех случаях, когда центральные мыслительные процессы „обращаются" к механизмам восприятия с целью получить информацию о данных явлениях. Однако некоторые акустические явления автоматически привлекают внимание, приводя к автоматическому возникновению соответствующих допущений и умозаключений на концептуальном уровне. Механизмы восприятия организованы таким образом, чтобы обеспечить некоторым типам явлений беспрепятственный доступ к центральным мыслительным процессам. Восприятие некоторых из этих 229
привилегированных типов явлений является, вероятно, генетически обусловленным. Так, например, автоматическое внимание ко всем неожиданным громким звукам способствовало выживанию вида и выработалось, вероятно, в результате естественного отбора. Другие типы явлений могут автоматически овладевать вниманием в результате той или иной формы обучения. Даже едва слышимый плач ребенка, например, привлекает внимание его родителей. Запах газа привлекает внимание людей, использующих его в быту. Если индивид почувствует запах газа, он неизбежно сформулирует допущение (23) о том, что в доме пахнет газом. Автоматическое отфильтровывание одних явлений и автоматическое внимание к другим может рассматриваться как своего рода эвристическое средство, нацеленное на повышение когнитивной эффективности: в принципе отфильтровываются явления, релевантность которых имеет минимальную вероятность, а автоматически овладевают вниманием явления, релевантность которых имеет максимальную вероятность. Другими словами, механизмы восприятия и перцептивная выделенность явлений ориентированы на релевантность. [...] [...] Стимул—это явление, предназначенное для достижения когнитивных эффектов. Сказанное о релевантности явлений относится поэтому и к релевантности стимулов. Как было ранее показано, когнитивная обработка явлений в целом, а следовательно, и стимулов, ориентирована на усиление релевантности. Поэтому индивид, стремящийся к достижению определенного когнитивного эффекта, должен произвести стимул, который, будучи оптимально обработанным, приведет к достижению искомого эффекта. Этот эффект может быть достигнут на уровне сознания или же подсознания. Так, например, если ребенок хочет, чтобы родители его пожалели, ему лучше всего ,,искренне" расплакаться—внимание родителей будет, наверняка, привлечено, и наиболее релевантным для них допущением будет то, что ребенок чем-то расстроен. [...] Мы заинтересованы в рассмотрении стимулов, используемых для достижения более тонких когнитивных эффектов, а именно стимулов, используемых коммуникантами для взаимного ознакомления с их информативными намерениями. Остенсивные стимулы, как мы будем называть подобные стимулы в дальнейшем, должны удовлетворять двум требованиям: во-первых, они должны привлекать внимание аудитории, и, во-вторых, они должны фокусировать внимание на намерениях коммуниканта. Остенсивно-инференциальная коммуникация* не может осуществляться на уровне подсознания—она неизбежно требует констру- * Остенсивно-инференциальной коммуникацией авторы называют тот тип коммуникации, при котором адресант с помощью доступных ему средств выражения стремится довести свои информативные намерения до сознания адресата, который, в свою очередь, основываясь на получаемой информации, производит необходимые умозаключения об информативных намерениях адресанта. Термины „остенсивно- инференциальная", „остенсивная" и ,,инференциальная коммуникация" используются авторами в качестве синонимов.— Прим. перев. 230
ирования концептуальных представлений и участия центральных мыслительных процессов. Вот почему большая часть стимулов, используемых в остенсивной коммуникации, автоматически привлекает внимание. Типичными примерами таких стимулов могут быть неожиданные громкие звуки, звонки в дверь, бросающиеся в глаза зрительные стимулы (размахивание руками, вспышки света, яркие плакаты), сильные тактильные ощущения, например уколы. Особенно важно то, что внимание автоматически привлекается устными высказываниями на родном языке, которые при их хорошей слышимости практически невозможно отфильтровать в качестве фонового шума. [...] Второе требование к остенсивным стимулам состоит в фокусировании внимания аудитории на намерениях коммуниканта. Иначе говоря, допущение о том, что данный стимул является остенсивным, должно быть достаточно очевидным и достаточно релевантным для того, чтобы вести к оптимальной обработке. Этому требованию обычно отвечают те стимулы, которые автоматически привлекают внимание и которые являются нерелевантными, если не воспринимаются в качестве остенсивных стимулов. Это очевидно в отношении кодируемых сигналов, используемых в остенсивной коммуникации, и особенно в отношении языковых сообщений, которые в тех случаях, когда они не воспринимаются в качестве остенсивных, представляют собой нерелевантные шумы или знаки на бумаге. [...] Но и наилучшие остенсивные стимулы являются нерелевантными, если они не воспринимаются в качестве остенсивных. Весьма релевантный сам по себе стимул может получить неверное остенсив- ное употребление, например, когда человек, руки которого, по убеждению всех, были парализованы, имитирует вождение автомобиля. В этом случае тот факт, что руки его слушаются, может оказаться настолько релевантнее всего остального, что информативное намерение может остаться незамеченным. [...] Однако для остенсивного стимула недостаточно привлечь внимание и сосредоточить его на намерениях коммуниканта. Он должен также раскрывать намерения коммуниканта. Каким образом он может это сделать? Мы попытаемся показать, что решающее значение здесь имеет то, что остенсивный стимул обладает, так сказать, гарантией релевантности. Вообще говоря, не существует гарантий того, что какое-либо явление окажется релевантным. Некоторые явления вообще не являются релевантными и поэтому не заслуживают обработки на концептуальном уровне, другие могут быть весьма релевантными и способными к инициации целой цепочки умозаключений. В принципе в отношении явлений не существует априорных ожиданий релевантности. В случае остенсивных стимулов ситуация является совершенно иной: производя высказывание, говорящий тем самым требует внимания со стороны слушателя; требуя внимания, говорящий тем самым дает понять, что его высказывание этого внимания заслуживает. Это относится не только к речевым сообщениям, но и ко всем другим формам остенсивной коммуникации. Остенсивные стимулы 231
вызывают определенные ожидания в отношении релевантности, достижимой при условии выявления информативного намерения коммуниканта. В следующем разделе мы разовьем эту идею и представим ее как принцип релевантности. [...] 7. ПРИНЦИП РЕЛЕВАНТНОСТИ [...] В намерения коммуниканта входит сообщение некоторого множества допущений {I}. Адресат, конечно, заинтересован в том, чтобы {I} включало в себя информацию наиболее релевантную из имеющейся в распоряжении коммуниканта. Однако интересы коммуниканта и адресата могут в данном случае и не совпадать: в интересы коммуниканта, например, может не входить сообщение наиболее релевантной информации, он может быть также заинтересован в передаче менее релевантной информации. В интересы коммуниканта входит сообщение не просто любого произвольного набора допущений, а некоторого конкретного набора допущений {I}. Поскольку, однако, коммуниканту необходимо внимание со стороны адресата, он не может не довести до его сознания, что {I} является достаточно релевантным для того, чтобы произвести необходимую обработку воспринимаемых стимулов с целью выявления данного набора допущений. [...] Для достижения своего коммуникативного намерения коммуникант должен из доступных ему средств выражения выбрать те, с помощью которых его информативное намерение может быть сделано взаимно очевидным. При этом мы предполагаем, что коммуникант отказывается от тех стимулов, использование которых требует чрезмерных усилий (ср., например, изображение карты в тех случаях, когда достаточно словесного описания) или же является предосудительным (например, в силу действия культурных норм, запрещающих употребление некоторых слов). В большинстве случаев область возможных средств выражения остается тем не менее весьма широкой, и адресат весьма заинтересован в том, чтобы из этой области коммуникантом были отобраны наиболее релевантные стимулы, а именно те, которые потребуют наименьших когнитивных усилий для своей обработки. В этом интересы коммуниканта и адресата совпадают. Если коммуникант искренне стремится что-либо сообщить, то он заинтересован в понимании, а, следовательно, и в том, чтобы это понимание потребовало от адресата минимальных усилий. Если адресат сомневается в том, что коммуникантом избраны наиболее релевантные стимулы, соответствующие его коммуникативным и информативным намерениям (подобные сомнения возможны, например, когда слушающий убежден в том, что говорящий сознательно и без особых на то причин затемняет дело), он может усомниться в подлинности коммуникации и обоснованно отказаться от расходования каких-либо усилий на обработку воспринимаемых стимулов. Все это является взаимно очевидным, взаимно очевидным поэтому является и намерение коммуниканта довести до 232
сознания адресата, что им избраны наиболее релевантные стимулы, способствующие достижению его намерений. Мы считаем, что существует уровень релевантности, на котором во внимание принимаются как интересы коммуниканта, так и интересы адресата. Назовем его уровнем оптимальной релевантности. Теперь мы можем сформулировать презумпцию оптимальной релевантности, содержащуюся в любом акте остенсивной коммуникации: (26) Презумпция оптимальной релевантности (а) Набор допущений {I}, который коммуникант намеревается довести до сознания адресата, является достаточно релевантным для того, чтобы потребовать от адресата приложения необходимых усилий для обработки остенсивных стимулов. (б) Остенсивные стимулы, используемые коммуникантом, являются наиболее релевантными из тех, которые могли быть использованы для передачи {I}. Вслед за этим можно сформулировать принцип релевантности: (27) Принцип релевантности Любой акт остенсивной коммуникации содержит презумпцию своей собственной оптимальной релевантности.
Ф. Джонсон-Лэрд ПРОЦЕДУРНАЯ СЕМАНТИКА И ПСИХОЛОГИЯ ЗНАЧЕНИЯ* Лет десять назад экспериментальная психолингвистика установила, что индивиды обычно не запоминают ни поверхностную форму предложений, ни их глубинную синтаксическую структуру. Рассмотрев полученные данные, я выдвинул следующее предположение: «Естественно задать вопрос, действительно ли предложение является самой крупной единицей, обычно участвующей в воспроизведении текста по памяти (recall of language). Возможно, что из значений предложений в связном дискурсе слушающий имплицитно создает сильно сокращенную и не обязательно языковую модель повествования и что воспроизведение текста по памяти в большой мере является активной реконструкцией, базирующейся на том, что сохранилось от этой модели. Там, где модель не полна, может быть даже непреднамеренно досочинен материал, делающий припоминаемое либо более осмысленным (meaningful), либо более правдоподобным — процесс, параллельный изначальному построению модели. Хороший писатель или рассказчик, возможно, обладает способностью приводить в действие процесс, весьма похожий на тот, который развертывается, когда мы действительно воспринимаем (или воображаем) события, а не просто читаем или слышим о них (Johnson- Laird, 1970)». В этой цитате содержатся исходные представления теории понимания (comprehension), которая развивалась мною в последние десять лет. Брансфорд, Баркли и Фрэнке (Bransford, Barclay and Franks, 1972) выдвинули сходную гипотезу, разграничив „интерпретативный" и „конструктивный" подход к семантике. Интерпретативная теория предполагает, что семантическая интерпретация, приписываемая предложению, обеспечивает полный анализ его значения. Конструктивная теория, отстаиваемая авторами, постулирует, что индивиды строят интерпретации, выходящие за рамки информации, представленной в языковой форме. Баркли (Barclay, 1973) проиллюстрировал это различие с помощью эксперимента, в ходе которого двум группам испытуемых предлагались предложения, * Р. N. Johnson-Laird. Mental Models. Chap. 11. Procedural semantics and the psychology of meaning. London et al.: Cambridge University Press, 1983. © 1983 by P. N. Johnson-Laird; Cambridge University Press. 234
описывающие порядок, в котором следуют друг за другом пять животных, поставленных в ряд. Одной группе было предложено выяснить порядок, а от другой группы, которой не было сказано, что предложения описывают порядок следования, требовалось просто запомнить предложения. В тесте на узнавание первая группа не могла надежным образом отличить предъявлявшиеся предложения от других предложений, в которых описывается тот же порядок следования животных, тогда как вторая группа—запоминавшие— была способна отличить лишь предложения, в которых вводились объекты, исходно не связанные между собой, от остальных предложений теста на запоминание. Прямых статистических сопоставлений между результатами работы обеих групп Баркли почему-то не провел. Наши данные по запоминанию описаний пространственных отношений говорят в пользу выделения в понимании (comprehension) двух стадий. На первой стадии поверхностное понимание (understanding) высказывания создает пропозициональную репрезентацию, которая близка к поверхностной форме предложения. Эта символическая репрезентация строится на ментальном языке, словарь которого по своему богатству можно сравнить со словарем естественного языка— гипотеза, которую независимо от нас отстаивают Кинч (Kintsch, 1974) и Фодор Дж. Д., Фодор Дж. А. и Гаррет М. Ф. (см. Fodor, Fodor and Garrett, 1975). В пропозициональных репрезентациях закодировано достаточно информации для того, чтобы обеспечить дословное воспроизведение информации, по крайней мере в течение короткого промежутка времени. Эти репрезентации являются экономным средством представления дискурса, особенно неопределенных описаний. Они, по всей вероятности, напоминают поверхностную форму, а не прямую фонетическую (или графемную) транскрипцию высказывания, поскольку для говорящего на своем родном языке почти невозможно подавить процесс идентификации слов и выявления некоторых синтаксических отношений. Вторая стадия понимания, которая является факультативной, использует пропозициональные репрезентации в качестве основы для построения ментальной модели, структура которой аналогична положению дел, описываемому дискурсом. Следовательно, выявление пропозициональной репрезентации необходимо предшествует построению ментальной модели. Этот конструктивный процесс базируется также на информации, извлекаемой из контекста и имплицитных умозаключений, основывающихся на знании о мире. Высказывание — это скорее ключ к конструированию модели, чем чертеж, по которому она могла бы быть построена. Возьмем пример из Джонсона-Лэрда (Johnson-Laird, 1975b). Допустим, что вас спросили, понимаете ли вы следующее предложение: Пожилой джентльмен часто ходил по улицам города. Если вы достаточно хорошо говорите по-русски, то вы без труда уловите его значение. Вы знаете значения составляющих его 235
слов, и вы знаете, как сочетать их в соответствии с их синтаксическими отношениями. Но улавливаете ли вы смысл (significance) этого утверждения, то есть пропозицию, которое оно выражает? Конечно, нет. Это просто предложение, которое встретилось вам на страницах учебника по языку. Однако, если бы вы прочитали его в путеводителе по городу и заключили, что пожилой джентльмен относится к Эйнштейну, а город—к Принстону, тогда бы вы не только поняли предложение, но и узнали бы, о ком и о чем идет речь. Тем самым вы бы существенно приблизились к пониманию его смысла, так как выявили бы ту самую пропозицию, которую оно передает в контексте. Возможно, вы бы не уяснили до конца его смысл до тех пор, пока не установили бы намерения автора. Реплики (remarks), место которых в интенциональной структуре не ясно, обычно вызывают недоумение. Конечно, может быть не ясна их иллокутивная сила, и основополагающим для высказывания является следующий вопрос: употреблено ли оно с целью произвести утверждение, задать вопрос или отдать приказание. Теория ментальных моделей, как мы увидим, разъясняет эту вторую стадию понимания. Существенный контекст высказывания может быть представлен в ментальной модели, и коммуникативный смысл высказывания устанавливается путем соотнесения его пропозициональной репрезентации с этой моделью и со знаниями о мире. Когда референты идентифицированы, новая информация, передаваемая высказыванием, может быть добавлена к модели, чтобы привести ее в соответствие с текущим моментом. Этот процесс, впрочем, вполне может происходить на уровне предикативных синтагм (clause) или составляющих, а не на уровне полных предложений. Эмпирические свидетельства в пользу двух уровней репрезентации были представлены в гл. 7. Ясно, что построение ментальной модели на основе пропозициональной репрезентации требует дополнительных когнитивных усилий по сравнению с формированием одной лишь пропозициональной репрезентации, и эта разница позволяет предсказать, что модель должна запоминаться лучше, чем пропозиция. Действительно, модель выходит за рамки буквального значения дискурса, потому что в ней воплощаются умозаключения, активированные схемы и отсылки; значение предложения невосстановимо по модели. Экспериментальные исследования подтвердили эти гипотезы. Конструктивный процесс, по всей вероятности, замедляется любыми выражениями, которые трудно интерпретировать, например отрицательными элементами и семантически „маркированными" словами, но как только модель построена, эти переменные не должны оказывать сколько-нибудь заметного влияния—гипотеза, которая также была экспериментально подтверждена (см. Glushko and Cooper, 1978). Следует отметить и другое явление, так как оно проясняет различие между пропозициональными репрезентациями и моделями. Существование эвфемизмов и их действенность зависят от возможности поверхностной интерпретации дискурса. Если бы слово всегда 236
вызывало в сознании полную репрезентацию своего денотата, тогда почти универсальное человеческое пристрастие называть лопату не лопатой, а 'инструментом для рытья земли' было бы совершенно немотивированным. Экзотическая терминология смерти и погребального ритуала, столь замечательно высмеянная Ивлином Во в ,,Незабвенной", никогда не была бы изобретена. Эвфемизмы рассчитаны на пропозициональную репрезентацию, они удерживают нас от полной интерпретации. Непристойные слова в их буквальных значениях, напротив, служат для того, чтобы вести нас прямо к модели мира. Помимо того что они используются эмотивно, в качестве бранных слов, они столь ярко напоминают о вещах, которые называют, что даже взрослые впадают в ошибку, принимая имя за вещь. Поэтому, хотя во многих контекстах (включая труды по когнитивным наукам) допускается упоминание о сексуальном акте, употребление в этих целях непристойного слова шокировало бы не меньше, чем изображение самого акта. Придумать новое непристойное слово в отличие от эвфемизма, очень трудно, потому что такое изобретение требует создания нового непристойного акта. ТЕОРИЯ ПОНИМАНИЯ Учение о двух стадиях интерпретации необходимо развить в более общую теорию. В этой главе мы сосредоточимся на второй, менее изученной стадии—отображении пропозициональных репрезентаций в ментальные модели для представления смысла дискурса. Теория, предлагаемая мною, основывается на ряде независимых допущений, которые я кратко охарактеризую, прежде чем перейду к детальному анализу. 1. Процессы понимания вымышленного дискурса не отличаются по существу своему от процессов понимания истинных утверждений. Вот почему, наверное, язык—столь мощное средство формирования верований. То, как мы понимаем, скажем, «Войну и мир», мало чем отличается от того, как мы понимаем нашу ежедневную газету. Это не значит, что вопросы соответствия действительности не важны—разумеется, важно знать, существует ли сейчас во Франции король и существует ли бог. Но представляется, что эти вопросы не затрагивают лингвистической обработки текста. 2. В процессе понимания мы создаем единую ментальную модель дискурса. Дискурс может быть истинным относительно бесконечного множества возможных положений вещей, поэтому как же мы можем быть уверены, что выбрали правильную модель? (Ср. вопрос Витгенштейна (Wittgenstein, 1953), цитированный выше: может ли один листок быть схемой для всех листьев или же он представляет собой всего лишь индивидуальную форму? Витгенштейн ответил, что может, но это зависит от того, как используется этот конкретный образец. Увы, он не рассказал нам, как именно конкретные образцы могут использоваться в этих целях.) Если бы нас интересовало, как абстрактный автомат строит модель дискурса, мы могли бы прибег- 237
нуть к ловкому теоретическому трюку: постулировать недетерминированное устройство, которое всегда строит правильные модели, то есть указывает верный ответ посредством волшебства (недетерминированность более подробно освещается в гл. 13). Следовательно, для создания правдоподобной психологической теории мы должны имитировать такое устройство, и следующее допущение связано с характером такой имитации. 3. Интерпретация дискурса зависит как от модели, так и от процессов ее построения, расширения и оценки. Единичная модель может символизировать бесконечное множество возможных моделей, потому что, хотя и строится только одна модель (основанная на ряде произвольных допущений), она может рекурсивно пересматриваться в свете последующего дискурса. Благодаря процессу рекурсивного пересмотра, который мы опишем далее, и имитируется требуемый недетерминизм, поскольку этот процесс может произвести любые из возможных моделей, совместимых с данным дискурсом. 4. Функции, строящие, расширяющие, оценивающие и пересматривающие ментальные модели, в отличие от функций интерпретации в теоретико-модельной семантике, не могут трактоваться абстрактно. Должны существовать эксплицитные алгоритмы для вычислений функций, отображающие пропозициональные репрезентации в ментальные модели. Как мы увидим, из этого требования вытекает несколько важных следствий для психологических теорий значения, основанных на постулатах значения, семантических сетях и словарных статьях, производящих декомпозицию значения на элементы. 5. Дискурс истинен, если он имеет по меньшей мере одну ментальную модель, удовлетворяющую его условиям истинности, которая может быть встроена в модель, соответствующую действительному миру. Эта формулировка относится, разумеется, только к утверждениям, которые имеют определенные условия истинности. Последствия первого допущения—что дискурс, основанный на фактах, и дискурс, основанный на вымысле, понимаются одинаковым образом — станут очевидными только после того, как мы рассмотрим интерпретацию дискурса в целом. В следующем разделе я перейду к процессам построения и оценки моделей (остальным допущениям), затем я опишу опыт машинной реализации данной теории и, наконец, рассмотрю ее следствия. ПРОЦЕДУРНАЯ СЕМАНТИКА ДЛЯ МЕНТАЛЬНЫХ МОДЕЛЕЙ Наша теория предполагает существование процедур, которые строят модели на базе значений выражений. Этот взгляд унаследован нами от так называемой „процедурной семантики"—подхода к психологии значения, в основе которого лежали идеи программирования для ЭВМ (см. Woods, 1967; Davies and Isard, 1972; Longuet-Higgins, 1972). Точки зрения на характер и задачи 238
процедурной семантики весьма разнообразны, и, к сожалению, отсутствие единства в этом вопросе породило ряд недоразумений. Одна из распространенных ошибок—полагать, что процедурная семантика связана с определенной позицией в споре сторонников „процедурного" и „декларативного" подходов, который разгорелся несколько лет тому назад в среде специалистов по искусственному интеллекту. По существу, спор шел о том, в каком виде следует хранить в базе данных системы предложения типа „Все художники неврастеники": в виде утверждений, записанных на каком-либо формальном языке, близком, например, к исчислению предикатов, или в виде процедур, которые немедленно добавят информацию о том, что определенное лицо является неврастеником, если утверждается, что это лицо—художник. Иногда утверждалось, что это различие связано со знаменитым разграничением Райла (Ryle, 1949) между „знанием что"и „знанием как". Подобные заявления кажутся нам сомнительными, потому что мы не можем выявить, какие серьезные эмпирические последствия может иметь утверждение о том, что определенный фрагмент информации хранится в памяти процедурно, а не декларативно. Выбор формы представления зависит прежде всего от задач, решаемых системой. Более серьезную ошибку совершают те, кто думает, что процедурная семантика обязательно предполагает отождествление значения предложения с процедурой, выполнение которой определяет истинностное значение этого предложения. Эта идея восходит к доктрине верификационизма логических позитивистов, согласно которой значение утверждения (отличного от логической истины) есть процедура, с помощью которой оно верифицируется, а если такой процедуры нет, то это утверждение бессмысленно. Данная доктрина сталкивается с неразрешимыми проблемами (см., например, Passmore, 1967), и смешение условий истинности утверждения с процессом, в ходе которого можно проверить их выполнение, является ошибкой. Ясно, почему это так: если я говорю Вам, что в соседней комнате на столе сидит черная кошка, то для того, чтобы Вы поняли мое высказывание, вовсе не требуется, чтобы Вы удостоверились, что в соседней комнате существует нечто, являющееся черной кошкой, и нечто, являющееся столом, и что первый объект сидит на втором. Более того, действия, которые Вам пришлось бы выполнить, чтобы проверить истинность этого утверждения, с очевидностью не входят в состав его значения. Предполагать обратное — значит совершать не менее грубую ошибку, чем совершали в свое время бихевиористы, отождествляя значение слова с вызываемой им реакцией. Когда кто-то описывает великолепное произведение кулинарного искусства, у вас может начаться слюноотделение, но слюноотделение, будучи обусловлено вашим пониманием описания, не есть само понимание. Была предпринята попытка связать язык с миром процедурно. Вудс (Woods, 1981) заявил, что эта связь улавливается с помощью абстрактных процедур. Их роль, как нам представляется, во многом 239
похожа на роль функций интерпретации в теоретико-модельной семантике; они не могут быть выполнимыми процедурами, потому что утверждения могут отсылать к событиям, удаленным во времени или пространстве, и потому что выполнимые процедуры с неизбежностью включали бы действия, нерелевантные для условий истинности утверждений. В этой связи остается неясным, каковы преимущества замены абстрактной функции интерпретации абстрактной процедурой. Читатель должен иметь в виду, что в нашей теории процедурная семантика служит для связывания языка не с миром, а с ментальными моделями. В обыденном употреблении слово может выступать в высказываниях разного рода—вопросах, требованиях, утверждениях и в полном комплекте иллокуций. Следовательно, репрезентация значения слова должна вписываться в ряд различных ментальных процессов. Сходным образом утверждение может использоваться разными способами. Если вам говорят: ,,Джон стоит рядом с хозяином", то вы можете представить их себе стоящими рядом или вы можете воспользоваться этой информацией для установления того, кто является хозяином, или для установления того, кто является Джоном, или для проверки того, что Джон стоит рядом с хозяином. Вы можете употреблять слова для того, чтобы сформулировать описание данного положения вещей, для того, чтобы обратиться с просьбой, и т. д. Все эти разнообразные процессы зависят от знания значений слов и предложений; ни один из них не должен отождествляться с этим знанием—они, я подчеркиваю, обусловлены им. Рассмотрим процесс перевода утверждения в ментальную модель более подробно. Нам потребуются следующие процедуры общего характера. 1. Процедура, которая начинает построение новой ментальной модели всякий раз, когда утверждение не содержит отсылки, эксплицитной или имплицитной, к какой-либо сущности в имеющейся модели дискурса. 2. Процедура, которая при наличии в утверждении отсылки хотя бы к одной сущности, представленной в имеющейся модели, должным образом добавляет к этой модели другие сущности, свойства или отношения. 3. Процедура, которая объединяет две или более модели, до этого момента разделенные, если в утверждении устанавливается взаимосвязь между входящими в них сущностями. 4. Процедура, которая в случае репрезентации в имеющейся модели всех сущностей, упомянутых в утверждении, проверяет, выполняются ли в этой модели утверждаемые свойства или отношения. Процедура верификации не всегда может установить истинностное значение утверждения, так как информация об интересующем нас свойстве или отношении может отсутствовать. Так, например, модель Джона, стоящего рядом с хозяином, не позволяет установить истинностное значение утверждения ,,Джон выше хозяина". Для таких случаев существует следующая процедура. 240
5. Процедура, которая должным образом добавляет к модели соответствующее свойство или отношение (приписанное в утверждении). Поскольку для одного утверждения строится только одна модель, процедуры построения моделей неизбежно будут вынуждены принимать произвольные решения, ибо обыденные утверждения всегда совместимы с более чем одним положением дел. Такое решение может оказаться неправильным и приводит к конфликту с вновь поступающей информацией в дискурсе (что вскрывается процедурой верификации). В этой связи необходимы две рекурсивные процедуры, чтобы справиться с задачей имитации ,,недетерминистского" устройства, всегда строящего единственно правильную модель. Эти процедуры воплощают фундаментальный семантический принцип обоснованности. 6. Если устанавливается (с помощью процедуры верификации) истинность утверждения относительно имеющейся модели, тогда настоящая процедура проверяет, нельзя ли модифицировать модель так, чтобы она соответствовала предшествующим утверждениям, но воспринимаемое утверждение делала бы ложным. В тех случаях, где такая модификация невозможна (в пределах допустимой интерпретации значений предшествующих утверждений), воспринимаемое утверждение не добавляет нового семантического содержания: оно является обоснованным выводом из предшествующих утверждений. 7. Если устанавливается (с помощью процедуры верификации) ложность утверждения относительно имеющейся модели, то настоящая процедура проверяет, нельзя ли модифицировать модель так, чтобы она соответствовала предыдущим утверждениям, но воспринимаемое утверждение при этом становилось бы истинным. В тех случаях, когда такая модификация невозможна (в пределах допустимой интерпретации значений предшествующих утверждений), воспринимаемое утверждение противоречит предшествующим. Если бы рекурсивные процедуры для пересмотра моделей работали с исчерпывающей полнотой и без ошибок, то они составили бы „разрешающую процедуру" для любого вывода, который может быть воплощен в ментальной модели; но, как свидетельствуют данные, рассмотренные нами в предшествующих главах книги, мало кому удается обойтись без ошибок. В процессе понимания пропозициональная репрезентация высказывания вызывает одну из этих семи процедур благодаря содержащимся в ней референтным выражениям, контексту, представленному в имеющейся ментальной модели, и фоновым знаниям, задействованным с помощью этого предложения. Так модель создается, расширяется или оценивается в соответствии с тем, что известно об условиях истинности данного утверждения. Тем самым шаг, с помощью которого это знание условий истинности соединяется с процедурой общего характера, является решающим, и один из способов его осуществления будет проиллюстрирован в следующем разделе. 16-1182 241
ПРОГРАММА ИНТЕРПРЕТАЦИИ ОПИСАНИЙ ПРОСТРАНСТВЕННЫХ ОТНОШЕНИЙ Я обрисовал в общих чертах теорию использования процедурной семантики для получения ментальных моделей. Применимость этой теории была проверена с помощью построения малой „действующей модели" этой теории в виде машинной программы. Программа не претендует на имитацию всех сложностей человеческого поведения, не следует видеть в ней и опыт по созданию искусственного интеллекта. Цель ее — представить принципы нашей теории в наглядном виде. На вход программы поступают пропозициональные репрезентации следующего вида: Посылка (Справа, А, В), которые принимаются в качестве соответствующих поверхностным репрезентациям таких утверждений, как: А находится справа от В. Выбор именно такой формы пропозициональных репрезентаций никак эмпирически не обоснован: они с тем же успехом могли соответствовать поверхностной форме предложений. Имея пропозициональные репрезентации, соответствующие описанию: А находится справа от В С находится перед В D находится слева от С, программа строит пространственную структуру: В А D С которая удовлетворяет данному описанию. Проблема рекурсивного пересмотра модели тесно связана с практической задачей разработки программы, обеспечивающей ведение и пополнение базы данных. (Хорошая программа для базы данных должна включать также определенные процедуры, которые не строго обязательны для семантической интерпретации, например процедуру замены большого количества отдельных конкретных утверждений одним всеобъемлющим обобщением.) Как правило, эти программы предназначены для ответа на вопросы к базе данных, и обычно они имеют весьма ограниченные возможности для обработки утверждений с целью обновления хранящейся в базе информации. Утверждений опасаются именно потому, что не знают, как поступать с неопределенными или противоречивыми описаниями. Вопросно- ответная программа предоставляет решение этого вопроса разработчику базы данных, но программа, обрабатывающая утверждения, обойти этот вопрос не может. Один из подходов к проблеме, пропагандируемый некоторыми специалистами по искусственному интеллекту,— это формализация немонотонной логики. В ортодок- 242
ортодоксальной логике, когда определенное заключение выводится из набора посылок, оно будет выводиться и при добавлении к этим посылкам дополнительного утверждения. Но когда мы основываем наши рассуждения на умолчании, мы можем прийти к имплицитному умозаключению, от которого следующее затем утверждение заставляет нас отказаться. Например, нам что-то сказали о собаке, и мы по умолчанию заключаем, что у нее четыре лапы, а затем узнаем, что в действительности у нее их только три. Несмотря на отдельные попытки формализовать немонотонную логику (см., например, McDermott and Doyle, 1980), она по-прежнему ставит перед исследователями ряд, по всей видимости, неразрешимых проблем. Альтернативный подход состоит в использовании рекурсивных процедур пересмотра моделей, и наша программа воплощает обе рекурсивные процедуры, которые были описаны в предыдущем разделе. Она отвечает на утверждения, несовместимые с построенной к данному моменту структурой, либо изменением своей модели предшествующих посылок, с тем чтобы привести их в соответствие с воспринимаемым утверждением, либо, если такая модификация невозможна, указанием на несовместимость воспринимаемого утверждения с тем, что ему предшествовало. Она отвечает на утверждение, соответствующее тому, которое уже имеется в построенной к данному моменту структуре, проверкой того, существует ли альтернативная модель предшествующих предложений, несовместимая с воспринимаемым утверждением. Если имеется такая интерпретация, программа указывает, что пока истинность воспринимаемого утверждения лишь возможна; если такой интерпретации нет, то программа указывает, что истинность воспринимаемого утверждения с необходимостью вытекает из того, что ему предшествовало. Короче говоря, программа делает выводы из простых утверждений о пространственных отношениях между объектами, и, таким образом, она, по сути дела, способна отвечать на вопросы. Если пользователь хочет знать, находится ли X перед Y-ом в определенном расположении объектов, тогда соответствующее утверждение вызовет один из следующих ответов (при условии, что и X и Y ранее упоминались): Истинность посылки была ранее возможной, но не необходимой. Посылка уже с необходимостью истинна. Ложность посылки была ранее возможной, но не необходимой. Посылка уже с необходимостью ложна. Если X или Y не входят в построенную к данному моменту структуру, то программа принимает утверждение за истинное и выполняет соответствующее построение. Программа содержит ряд процедур общего характера, соответствующих тем, которые постулировались в общей теории. (Одна процедура опущена—та, которая вызывается, когда процедура верификации не справляется с установлением истинностного значения,— в связи с тем, что в мире данной программы такой ситуа- 16* 243
ции возникнуть не может.) В программу соответственно входят: 1. Процедура, начинающая построение новой пространственной структуры всякий раз, когда она встречается с утверждением, в котором не упоминается ни один из объектов имеющейся структуры. Она вставляет объекты, упомянутые в утверждении, в структуру в тех позициях, какие удовлетворяют требуемому пространственному отношению. 2. Процедура, которая в случае, если один объект, упомянутый в утверждении, обнаруживается в имеющейся структуре, вставляет другой объект в структуру в позиции, которая удовлетворяет значению утверждения. 3. Процедура, которая в случае, если один объект из утверждения обнаруживается в одной структуре, а другой объект из утверждения обнаруживается в другой, отдельной от первой структуре, объединяет обе структуры в единую структуру, удовлетворяющую значению утверждения. 4. Если оба объекта из утверждения обнаруживаются в одной и той же структуре, то существует процедура, которая проверяет, связаны ли они в этой структуре требуемым пространственным отношением. 5. Если утверждение истинно относительно построенной к данному моменту структуры, тогда процедура рекурсивно проверяет, может ли структура быть перестроена так, чтобы это не противоречило предшествующим утверждениям, но делало воспринимаемое утверждение ложным. 6. Если утверждение ложно относительно построенной к данному моменту структуры, то процедура рекурсивно проверяет, может ли данная структура быть перестроена так, чтобы это соответствовало предшествующим утверждениям, но делало воспринимаемое утверждение истинным. Детали большинства из этих процедур достаточно просты для того, чтобы читатель сам мог их себе представить, но более сложные процедуры (5) и (6) для пересмотра структур заслуживают более внимательного рассмотрения. Когда одна из этих процедур пытается поменять место одного объекта в структуре, могут оказаться и другие объекты, позиции которых были описаны со ссылкой на этот объект, и, следовательно, прежде чем его передвинуть, необходимо проверить, можно ли передвинуть эти другие объекты. Однако они в свою очередь могут быть связаны с какими-то другими объектами, и поэтому прежде, чем их передвигать, необходимо проверить, могут ли быть передвинуты эти объекты.., и т. д. Например, если программе дано крайне неопределенное описание: А находится справа от В С находится слева от А, то она строит следующую модель: С В А 244
Если вслед за этим ей говорят: С находится справа от В, то процедура верификации (3) сначала дает истинностное значение ложно. Это значение автоматически вызывает процедуру общего характера (6), которая проверяет, существует ли какой-либо способ перестроить модель так, чтобы сделать данное утверждение истинным. Очевидно, процедура должна проверить, что будет, если В и С поменять местами: будет ли результат по-прежнему совместим с описанием. (Следовательно, необходимо хранить записи пропозициональных репрезентаций, чтобы проверить, исключается ли сразу предлагаемое изменение в модели определенной посылкой.) В данном конкретном случае ничто не препятствует перемене места. Предположим теперь, что предшествующее описание содержало также утверждение о том, что D находится перед В: С В А D В этом случае, прежде чем поменять В и С местами, необходимо проверить, может ли быть соответственно изменена позиция D. В самом деле, посылки, которая исключала бы такое передвижение, нет, и программа построит реорганизованную модель: В С А D Рассмотрим, однако, еще один случай. Пусть другие, ранее введенные утверждения констатировали, что Е находится перед С и слева от D, что дает модель: С В А Е D В этот момент программе сообщается, как и раньше, что С находится справа от В. Теперь она должна сначала попытаться поменять В и С местами, но она обнаруживает, что перед В поставлено D, а перед С — Е. Следовательно, программа должна проверить все множество посылок, чтобы определить, можно ли поменять местами D и Е; оказывается, такая мена невозможна из-за предшествующей посылки, констатирующей, что Е расположено слева от D. Только теперь выясняется, что В и С нельзя поменять местами, и потому программа объявляет, что новое утверждение несовместимо с предшествующим описанием. Число зависимых единиц структуры, проверка которых может потребоваться для определения возможностей реорганизации модели, в принципе не ограничено. Вот почему этот процесс обслуживается процедурой, которая может вызывать сама себя рекурсивно. Читатель, интересующийся техническими подробностями, может обратиться к табл. 1, где кратко описана рекурсивная функция, которая используется при попытках перестроить структуру так, 245
чтобы воспринимаемое утверждение согласовывалось с ней. Эта функция — центральный компонент процедуры (6). Программа для каждого предложения в описании обеспечивает вызов соответствующей общей процедуры, учитывая при этом как значение данного предложения, так и контекст, в котором оно встречается. Если программе дается утверждение: А расположено перед В, то в зависимости от настоящего состояния структуры вызывается та или иная общая процедура. Если как А, так и В уже присутствуют в структуре, программа вызывает процедуру верификации (4), чтобы определить, истинно ли данное утверждение, а ее результат затем вызывает процедуру (5 или 6), которая проверит, можно ли эту структуру реорганизовать. Таблица 1. Краткое описание рекурсивной функции REMAKE, которая используется в программе умозаключения о пространственных структурах в ходе рекурсивных попыток перестроить структуру с тем, чтобы она согласовывалась с предшествующим дискурсом и текущим утверждением. Функция REMAKE принимает три аргумента: две единицы X и Y существующей структуры и направление, в котором X должно переместиться, чтобы создать требуемое отношение между X и Y. Она содержит пять основных шагов, три из которых могут рекурсивно вызывать данную функцию: 1. Если существует посылка, связывающая X и Y, которая противоречит требуемому перемещению X, то выдай значение ложно и выйди из программы. 2. Если существует посылка, связывающая X с какой-либо единицей в том направлении, в котором X должен переместиться, то Если эта единица занимает то место, на которое X предполагается передвинуть, то Если REMAKE не может переместить эту единицу, то выдай значение ложно и выйди из программы. 3. Если существует посылка, связывающая X с какой-либо единицей, ортогональной к направлению, в котором должен переместиться X, то Если REMAKE не может переместить эту единицу с сохранением ее положения относительно X, то выдай значение ложно и выйди из программы. 4. Если в данной структуре имеется единица, занимающая ту позицию, в которую X должен быть помещен, то Если REMAKE не может убрать эту единицу с дороги, то выдай значение ложно и выйди из программы. 5. Перемести X в требуемую позицию, выдай значение истинно и выйди из программы. Если ни А, ни В не входят в структуру, то данное высказывание, так сказать, открывает новую тему и вызывает процедуру (1), создающую новую структуру, которая, впрочем, может в конечном счете соединиться со старой структурой, если появится утверждение, которое связывает их единицы между собой. Если только одна из единиц—А или В — входит в структуру, то процедура (2) вставит в структуру вторую единицу в соответствующей позиции. Конкретные детали осуществляемой процедуры определяются соответственно референтами выражений, содержащихся в утверждении. В этом отношении программа отражает общий интерпретативный принцип, 246
хотя очевидно, что существуют другие факторы, определяющие действительную реакцию слушающего на высказывание. Выбрав общую процедуру, мы должны при ее применении пользоваться значением утверждения. Внедрение значения утверждения в общую процедуру — это решающий шаг. Он может быть осуществлен несколькими способами, но наша программа использует метод «замораживания» значений переменной в функции. В ходе этого процесса создается новая функция с меньшим числом аргументов, чем у исходной функции. Например, такая простая арифметическая функция, как сложение, принимает две переменных — х и у—и при вызове ее с помощью инструкции типа ADD (х, у) имеющие место значения х и у складываются. Новая функция может быть получена из ADD с помощью замораживания, то есть фиксации значения одной переменной, превращения ее в константу. Так, можно в качестве значения второй переменной зафиксировать 5 и затем полученной новой функции присвоить имя, например ADD5. Язык программирования РОР-10 позволяет выполнить эту операцию, используя следующее выражение: ADD (% 5%)-*ADD5, которое частично применяет функцию ADD с тем, чтобы получить новую функцию ADD5. Новая функция принимает только одну переменную и прибавляет 5 к ее значению, например: результат ADD5(2) есть 7. Этот простой вычислительный прием имеет естественные расширения и может найти многообразные применения: вместо фиксации числовых значений переменных можно фиксировать функции в качестве значений переменных. В частности, можно фиксировать значение выражения в любой общей процедуре. Допустим, к примеру, что при обработке предложения ,,А находится перед В" была выбрана та общая процедура, которая вставляет в структуру А, поскольку В уже присутствует в имеющейся структуре. Эта общая процедура используется при создании более конкретной процедуры, которая вставляет новую единицу перед старой; и эта конкретная процедура создается фиксацией значений переменных в общей процедуре. Каждая общая процедура имеет механизм сканирования, действующий в любом произвольно выбранном направлении. Его работа состоит в том, что он многократно повторяет одно и то же действие: увеличивает значение обеих координат позиции, сканируемой в данный момент. Конкретные размеры увеличения зависят от значений, приписанных двум параметрам общей процедуры DI и DJ, которые соответственно определяют направление сканирования. Рис. 1 иллюстрирует направление сканирования позиций перед единицей В в некоторой структуре. Поскольку все общие процедуры используют один и тот же механизм сканирования, условия истинности перед можно определить очень простым способом: 247
Function Infront f; f (% 1,0%); End J I 1 2 3 4 5 6 7 8 il 2 3 В I 4 5 6 7 8I При условии, что В находится в позиции 1=3, J=4, установка параметров DI=1 и DJ=0 обеспечивает сканирование последовательности позиций, многократно повторяя увеличение координаты I на 1 и оставляя при этом значение координаты J без изменений (увеличивая его на 0). Последовательность позиций—это, как показано, (4,4), (5,4), (6,4)... Рис. 1. Последовательность сканируемых позиций, находящихся перед единицей В в некоторой структуре. Это реальная запись на языке РОР-10 из нашей программы. Первая строка указывает, что функция имеет имя infront 'перед' и что она принимает один аргумент, f, который на деле всегда является одной из общих процедур, описанных выше. Вторая строка приводит к фиксации значений 1 и 0 у двух крайних справа параметров общей процедуры, которые соответствуют DI и DJ. В результате получается сканирующая функция, последовательно увеличивающая координату I на 1, а координату J на 0 (то есть оставляя J без изменений). Следовательно, когда функция infront применяется к процедуре для добавления новой единицы к данной структуре, она создает конкретную процедуру, добавляющую новую единицу перед старой в первой же доступной позиции. При этом можно не бояться «упасть с края света»: структура по мере необходимости разрастается, чтобы принять в себя новую единицу. Процедурна или декларативна вышеприведенная словарная статья для перед? Ответ состоит в том, что на деле она имеет совершенно особый характер, находясь примерно на полпути между обычной процедурой и фрагментом декларативной информации. Это процедура, которая не может быть выполнена сама по себе: она принимает другие процедуры в качестве аргументов и создает из них новые, более конкретные. Ее результат—определение вклада перед в условия истинности предложений, в которых эта лексема встречает- 248
ся, потому что новые конкретные процедуры служат именно для того, чтобы строить модели, удовлетворяющие этим условиям истинности, проверять существующие модели с целью установить, соответствуют ли они этим условиям или нет, и т. д. Я полагаю, что ментальный лексикон содержит сходные спецификации, которые используются в разных процедурах для манипулирования ментальными моделями. Программа умозаключения о пространственной структуре является, я повторяю, упрощенным приложением процедурной теории понимания. Одно из самых грубых упрощений состоит в том, что говорящие обычно не считают, что для удовлетворения условий истинности пространственного отношения один объект должен располагаться точно на одной линии с другим. Они допускают определенную степень неточности, которая, вероятно, меняется в зависимости от действительных форм и размеров объектов. Другое упрощение касается обработки референтных выражений: программа имеет дело только с именами собственными. Однако, как предполагается, основные аспекты программы отражают психологическую реальность. как обойтись без постулатов значений, семантических сетей и компонентного анализа лексики Теоретико-модельная семантика позволяет разграничить условия истинности и семантические отношения. Вклад в условия истинности, который вносят такие выражения, как справа от, может быть определен с помощью функции интерпретации, которая задает множество упорядоченных пар индивидов в модельной структуре, находящихся в указанном отношении друг к другу. Его семантические свойства и отношения к другим выражениям могут улавливаться множеством постулатов значения, таких, как: Для любого х, у и z, если х находится справа от у и у находится справа от z, то х находится справа от z. Для любого х и у, если х находится справа от у, то у находится слева от z. Таким образом, не может быть модели, в которой было бы истинно, что х находится справа от у, а у—справа от z, но ложно, что х находится справа от z. Аналогичным образом не может быть модели, в которой х помещался бы справа от у, но у не располагался бы слева от х. Сторонники психологических теорий, основанных на постулатах значения, семантических сетях или компонентном анализе лексических значений, молчаливо проводят то же самое разграничение между семантическими свойствами и условиями истинности. Они доказывают вместе со многими лингвистами и философами, что семантическая репрезентация предложения отражает его логическую или семантическую форму. То есть следствия из предложения выводятся с помощью операций над его семантической репрезентацией 249
цией, при которых используются либо постулаты значения, либо следование по дуге в сети, либо сравнение результатов одного семантического анализа с другим. Репрезентация условий истинности, в силу которых предложение ,,А находится справа от В", соответствует порядку В А — это совершенно отдельный вопрос, о котором рассмотренным теориям сказать нечего или почти нечего. Процедурная теория, в отличие от теоретико-модельной семантики, не может просто принять существование абстрактных функций, которые отображают предикаты в модели. Как мы видим, психологические теории должны содержать эксплицитные алгоритмы, осуществляющие эти процессы. Для психологических теорий, основанных на постулатах значения, семантических сетях или компонентном анализе лексических значений, это требование оборачивается катастрофическими последствиями. Эти теории претендуют на объяснение семантических свойств и отношений между выражениями, но они не описывают условий их истинности. Коль скоро функция интерпретации дает полное описание условий истинности, как того требует процедурная семантика, совершенно излишне давать независимую формулировку семантических свойств и отношений. Они естественным образом вытекают из условий истинности. Чтобы понять, почему это так, посмотрим хотя бы на то, как в программе представлена транзитивность отношения перед. Получив описание: А находится перед В В находится перед С, программа строит структуру, показанную на рис. 2. I 1 2 3 J I С в А Рис. 2. Структура, построенная программой для репрезентаций утверждений: ,,А находится перед В", ,,В находится перед С". Пусть вслед за этим на вход поступает следующее предложение: Л находится перед С. Программа обнаруживает, что это утверждение истинно в данной структуре, затем пытается перестроить структуру так, чтобы сделать его ложным, но это ей не удается, и, наконец, она печатает следующее сообщение: Посылка уже с необходимостью истинна. Следовательно, программа делает транзитивный вывод, хотя она не пользуется никакой эксплицитной информацией о транзитивности или нетранзитивности. 250
Некоторые теоретики заявили, что аппарат пространственных структур протаскивает принцип транзитивности через черный ход (Джерри Фодор и Зенон Пылышин независимо друг от друга высказали такое предположение в беседе с автором, но было бы несправедливо считать, что они серьезно придерживаются такого мнения). Видимость правдоподобия такой точки зрения проистекает из смешения ее с совершенно иной точкой зрения, а именно с мнением о том, что транзитивные отношения могут быть заданы на модельных структурах, являющихся пространственными структурами. Очевидно, что если транзитивное отношение должно быть репрезентируемо в структуре, то это условие должно выполняться. Однако транзитивность не встроена в пространственные структуры: если бы это было так, то пространственные структуры не могли бы репрезентировать нетранзитивные отношения или отношения разной степени транзитивности. О том же говорит проводимый ниже детальный разбор. Рассмотрим, как может быть устроена модель для утверждений о натуральных числах (0, 1, 2...). Чтобы построить модели, которые удовлетворяют утверждениям типа х>у, мы должны эксплицитно указать, как вычисляется характеристическая функция для этого отношения. Любая вычислимая функция может быть сведена к трем основным типам базовых функций: нулевой функции, функции следования (successor function) и функции тождества. Характеристическую функцию для х >у, которая выдает значение истинно, если х больше, чем у, и значение ложно в противном случае, можно легко определить в терминах этих функций: _, истинно, если (х—у)^0 Х>У~\ ложно, если (дс-у)=0, где (х— у) определяется как вычитание, за исключением того, что она выдает 0 вместо отрицательного числа: х-0=х х -следующий (у)=предшествующий (х-у) и: предшествующий (0)=0 предшествующий (следующий (у))=у Ясно, что, имея полную спецификацию функции и модель, состоящую из натуральных чисел (0, 1, 2, 3...), мы не нуждаемся в специальном указании на то, что данное отношение транзитивно. Для любых х, у, и z всякий раз, когда функция выдает значение истинно для х>у и для y>z, она должна выдать истинно и для x>z. Однако принцип транзитивности очевидным образом не выражен ни в одном из трех типов базовой функции: он возникает из определенной комбинации этих функций в данном примере, но не в других. 251
То же рассуждение может быть перенесено непосредственно на транзитивность в пространственных структурах. Структура—это множество позиций, которые задаются парами целых чисел. При описании семантики пространственных отношений могут быть использованы специфические процедуры, которые избирают исходную пару чисел, например (3,4), и многократно применяют к ним функцию следования, чтобы получить соответствующую последовательность позиций, а именно (3,5), (3,6), (3,7)... Специальная процедура верификации, создаваемая с помощью фиксации в ней этой семантики, будет проверять каждую позицию, чтобы установить, включена ли в нее нужная единица. Таким образом, хотя данная процедура может породить транзитивность, она использует только базовые функции, которые сами в себе транзитивности не содержат. Этот принцип нигде в программе не репрезентирован; он проявляется в работе программы. ОТКЛОНЕНИЯ В УМОЗАКЛЮЧЕНИЯХ Сведение семантических свойств к условиям истинности имеет большое преимущество: оно позволяет объяснить явление, которое иначе оставалось бы загадочным,— отклонения в умозаключениях, осуществляемых в обыденной жизни. Умозаключения, обсуждавшиеся ранее, которые опирались на посылки типа: Матфей сидит справа от Марка Марк сидит справа от Луки, зависимы от нашего представления о том, что человеческие существа имеют внутренне присущие им правую и левую сторону (см., например, Miller and Johnson-Laird, 1976, разд. 6.1.3). Такие умозаключения легко осуществить в моделях, которые удовлетворяют условиям истинности посылок по отношению к системе координат, определяемой позицией и ориентацией указанных лиц. При этом достаточно простой линейной семантики для x находится справа от у. Основная идея состоит в том, чтобы сначала установить местоположение требуемого индивида, например Марка, затем установить систему координат, основанную на его ориентации, и, наконец, употребить эту семантику для добавления к модели Матфея в позиции, находящейся в правой стороне поперечной оси, проходящей через Марка. Когда этот процесс осуществляется по отношению к лицам, сидящим за круглым столом, как показано на рис. 3, та же самая линейная семантика для справа порождает все требуемые отклонения в умозаключениях. Транзитивное умозаключение: А находится справа от В В находится справа от С Следовательно, А находится справа от С 252
Рис. 3. Системы координат для группы лиц, сидящих за столом. приемлемо, так как А располагается довольно близко от оси, проходящей через позиции, находящиеся справа от С. Однако транзитивное умозаключение: Л находится справа от В В находится справа от С С находится справа от D H находится справа от I Следовательно, А находится справа от I неприемлемо, так как А находится почти что напротив I и очень далеко от оси, проходящей через позиции, лежащие справа от I. В предшествующем разделе мы установили, что не было нужды улавливать семантические свойства посредством постулатов значения, семантических сетей и т. д.; данное упражнение по процедурной семантике показывает, что в некоторых случаях это привело бы к ошибке, а именно в тех случаях, когда имеются заметные отклоне- 253
ния в обоснованности умозаключения данного вида. Измените, к примеру, план расположения за столом, и даже вывод: Л находится справа от В В находится справа от С Следовательно, А находится справа от С потеряет свою обоснованность. Критерий обоснованности чисто семантический, он состоит в невозможности построения такой модели посылок и их контекста, в которой заключение является ложным. СТАТУС СЕМАНТИЧЕСКИХ ЭЛЕМЕНТОВ Теория процедурной семантики проливает свет на статус семантических элементов. Значение базовых пространственных терминов типа правый и левый не может быть описано в виде стандартной словарной статьи, в которой оно было бы разложено на элементы, поскольку определить эти слова в более элементарных терминах невозможно. Однако тот факт, что они неопределяемы, не означает, что они элементарны. Напротив, овладевая семантикой этих слов, пространственная программа использует процедурные элементы, такие, как фиксация параметров увеличения. Значения слов языка- объекта (сильно ограниченного подмножества английского языка) формулируются в процедурных терминах, которые не находятся в простом—не говоря уже о взаимнооднозначном — соответствии с языком-объектом. Что касается языка-объекта, то на нем эти элементы выразить нельзя, точно так же как и подлинные семантические элементы, лежащие в основе нашего языкового употребления, которые неизбежно становятся задачей научного исследования. Наша программа показывает необходимость использования таких элементов для установления условий истинности выражений. Она устанавливает эти условия не по отношению к реальному миру, но по отношению к моделям мира. Человек знает, как соотнести выражения с моделями мира; в отличие от программы он, однако, располагает средствами построения таких моделей, не зависящими от языковой информации, поступающей на вход. Исходя из своей теоремы мимикрии, Андерсон (Anderson, 1978) заявил, что любое психологическое поведение, основанное на семантических элементах, может быть столь же хорошо смоделировано на компьютере и с помощью постулатов значения. Хотя теорема верна, основанное на ней заявление ложно. Постулаты значения вводятся в психологическую теорию для объяснения выводов (Fodor, 1975, р. 149). Они репрезентируют семантические свойства слова и его семантические отношения к другим словам, но не его вклад в условия истинности. Условия истинности многих слов действительно невозможно сформулировать на языке-объекте, точно так же как, например, не существует способа определить значение справа и слева на входном языке компьютерной программы. Таким образом, в подобных случаях не удается описать условия истинности с 254
использованием постулатов значения, связывающих между собой термины в языке-объекте. А вот семантика, основанная на процедурных элементах, может репрезентировать условия истинности. Следовательно, теория, которая использует семантические элементы, превышает имитационные способности постулатов значения. Теория ментальных моделей предполагает, что то, что должны усвоить дети,—это условия истинности выражений—точнее, вклад этих выражений в условия истинности предложений. Как только они активно овладевают этим аспектом слова, они имплицитно овладевают его логическими свойствами при условии, что общие навыки построения ментальных моделей и манипулирования ими они уже приобрели. Но интенсионалы слов определяются не изолированно. Как показал наш предшествующий анализ размытости, слова организованы таксономически, и, следовательно, путь к овладению их интенсионалами, вероятно, также таксономичен. Процедурные элементы, следовательно, скорее всего, организованы в таксономическое устройство типа таблицы принятия решения (Miller and Johnson-Laird, 1976), которая задает структуру соответствующей области лексики. Более того, дети, размышляющие над инвариантными свойствами слов, могут со временем прийти к представлению их в виде постулатов значения. Например, многие дети любят играть в игру , »противоположностей" : Что противоположно высокому? Низкое. Что противоположно толстому? Тонкое. И так далее. Уровень мастерства в этой по существу своему металингвистической игре, видимо, зависит от эксплицитного улавливания отношений между словами в таксономии. Этот тип знаний вполне может репрезентироваться постулатами значения. Но если бы дети в первую очередь узнавали постулаты значения, то было бы крайне трудно объяснить отклонения в логических свойствах многих терминов. Они естественно вытекают из условий истинности, усвоение которых образует фундамент семантических знаний. выводы Теоретико-модельная семантика отображает выражения языка в модельные структуры, а для естественного языка, как считали Монтэгю (Montague, 1974) и другие, эти структуры состоят из «возможных миров». Такая семантика не может непосредственно использоваться при моделировании мышления, потому что возможных миров бесконечно много. Парти (Partee, 1979) и Джонсон-Лэрд (Johnson-Laird, 1982) бились над задачей приближения семантической теории к психологии. В этой главе я показал, что существует прямое решение этой задачи: ментальная модель есть единичный представительный образец из множества моделей, удовлетворяющих утверждению. При этом не предполагается, что множество 255
моделей, удовлетворяющих тексту, уже построено, и из этого множества выбирается образец. Напротив, понимание обычно ведет только к одной-единственной модели, которая строится процедурной семантикой из того, что известно об условиях истинности утверждения. Если следующее утверждение показывает, что данная конкретная модель неверна, тогда рекурсивные процедуры пытаются перестроить модель так, чтобы она удовлетворяла имеющемуся набору утверждений. Следует особо подчеркнуть, что коммуникативный смысл (significance) утверждения зависит как от модели, так и от процедур манипулирования ими и их оценки. Эти процедуры рассматривают данную модель как всего лишь одну из бесконечно большого множества разных возможностей. Таким образом, конкретная модель является представителем всего множества, и, поскольку она построена на базе умозаключений по умолчанию из знаний о мире, она является экземпляром вероятной ситуации, описываемой текстом. Но рекурсивные процедуры могут на самом деле заменить один образец другим, хотя на практике объем рабочей памяти ограничивает масштабы рекурсивных перестроек. Ментальная модель имеет ограниченные размеры, но люди могут также рассуждать о множествах неограниченного размера, таких, как множество натуральных чисел. Основа этой способности—тема, которую я отложу до гл. 15. А пока читатель должен отметить, что ментальные модели могут репрезентировать бесконечное число разных возможностей; теория ментальных моделей совместима с теоретико-модельной семантикой для конечных областей. Даже если все семантические свойства и отношения таких пространственных терминов, как правый и левый, могли бы быть описаны с помощью семантического разложения, связей в сетях или постулатов значения, которые каким-то образом справились бы с отклонениями транзитивности, то все же было бы необходимо указать, как эти слова включаются в определение условий истинности предложений, в которых они встречаются. Процедурная теория, очерченная в этой главе, принимает эту цель за свою исходную точку. И в результате оказывается, что если должным образом позаботиться об условиях истинности, то не придется давать отдельное описание семантических свойств выражений. Они будут непосредственно вытекать из условий истинности. ЛИТЕРАТУРА Anderson, 1978.=Anderson, J. R. Arguments concerning representations for mental imagery.—„Psychological Review", 85, 1978, p. 249—277. Barclay, 1973.=Barclay, J. R. The role of comprehension in remembering sentences.— „Cognitive Psychology", 4, 1973, p. 229—254. Bransford, Barclay and Franks, 1972.=Bransford, J. D., Barclay, J. R., and Franks, J. J. Sentence memory: a constructive versus interpretive approach.— „Cognitive Psychology", 3, 1972, p. 193—209. Davies and Isard, 1972.=Davies, P. J., Isard, S. D. Utterances as Programms.— In: Michie, D. (ed.) Machine Intelligence, vol. 7. Edinburgh: Edinburgh University Press, 1972. 256
Fodor, 1975. = Fodor, J. A. The Language of Thought. Hassocks, Sussex: Harvester Press, 1975. Fodor, Fodor and Garrett, 1975.=Fodor, J. D., Fodor, J. A. and Garrett, M. F. The psychological unreality of semantic representations.—,«Linguistic Inquiry", 4, 1975, p. 515—531. Glushko and Cooper, 1978.=Glushko, R. J. and Cooper, L. A. Spatial comprehension and comparison processes in verification tasks.— „Cognitive Psychology", 10, 1978, p. 391—421. Johnson-Laird, 1970.=Johnson-Laird, P. N. The perception and memory of sentences.— In: Lyons, J. (ed.). New Horizons in Linguistics. Harmondsworth: Penguin, 1970. Johnson-Laird, 1975.=Johnson-Laird, P. N. Meaning and the mental lexicon.— In: Kennedy, A. and Wilkes, A. (eds.). Studies in Long Term Memory. London: Wiley, 1975. Johnson-Laird, 1982.= Johnson-Laird, P. N. Formal semantics and the psychology of meaning.— In: Peters, S. and Saarinen, E. (eds.). Processes, Beliefs and Questions. Dordrecht: Reidel, 1982. Kintsch, 1974. = Kintsch, W. The Representation of Meaning in Memory. Hillsdale, N. J.: Erlbaum, 1974. Longuet-Higgins, 1972.=Longuet-Higgins, H. C. The algorithmic description 3f natural language.— In: Proceedings of the Royal Society of London. B, 182, p. 255—276. McDermott and Doyle, 1980.=McDermott, D. and Doyle, J. Non-monotonic logic I.—„Artificial Intelligence", 13, 1980, p. 41—72. Miller and Johnson-Laird, 1976.=Miller, G. A. and Johnson-Laird, P. N. Language and Perception. Cambridge, Mass.: Harvard University Press, 1976. Montague, 1974.=Montague, R. Formal Philosophy: Selected Papers. New Haven: Yale University Press, 1974. Partee, 1979=Partee, B. H. Semantics-mathematics or psychology?—In: Bauerle, R., Egli, U., von Stechow, A. (eds.). Semantics from Different Points of View. Berlin: Springer-Verlag, 1979. Passmore, 1967.=Passmore, J. Logical Positivism.— In: Edwards, P. (ed.). The Encyclopedia of Philosophy. New York: Collier-Macmillan, 1967. Ryle, 1949.=Ryle, G. The Concept of Mind. London: Hutchinson, 1949. Woods, 1967.=Woods, W. A. Semantics for a question-answering system.— Mathematical Linguistics and Automatic Translation Report NSF-19, Harvard Computational Laboratory, 1967. Woods, 1981.=Woods, W. A. Procedural semantics.— In: Joshi, A. K., Sag, I. and Webber, B. L. (eds.). Elements of Discourse Understanding. Cambridge: Cambridge University Press, 1981. Wittgenstein, 1953.=Wittgenstein, L. Philosophical Investigations. (Translated by G. E. M. Anscombre.) New York: Macmillan, 1953.
У. Ленерт ПРОБЛЕМЫ ВОПРОСНО-ОТВЕТНОГО ДИАЛОГА 1. ВВЕДЕНИЕ Научные исследования в области автоматизации процесса ответа на вопрос всегда были непосредственно связаны с исследованиями в других областях. Так, программа Вудса LSNLIS отвечает на вопросы, относящиеся к характеристикам лунных пород (см. Woods, 1972). Разработанная Виноградом система SHRDLU отвечает на вопросы о том, как обращаться с кубиками, находящимися на столе (см. Winograd, 1972). Система MYCIN Шортлифа, отвечая на заданные ей вопросы, помогает врачам диагностировать болезни и выписывать лекарства (см. Shortliffe, 1974). Система SAM, созданная Шенком (см. Schank et al., 1975), читает небольшие рассказы и отвечает на разнообразные вопросы по прочитанному материалу. Хотя все эти системы и программы ориентированы на вопросно- ответный диалог, каждая из них моделирует его по-своему. Каждая из перечисленных программ имела свои индивидуальные особенности, в связи с которыми ей вплотную пришлось столкнуться с проблемой автоматизации ответа на вопрос. Так, программа Вудса предназначалась для ученых в качестве надежной информационно- поисковой программы, тогда как Виноград использовал ответы на вопросы, чтобы продемонстрировать интеллектуальные возможности компьютера в понимании мира кубиков. Шортлиф хотел разработать программу, которую могли бы использовать врачи, обращающиеся к базе знаний системы за различными объяснениями, тогда как Шенка интересовало то, как используются самые общие знания о мире при автоматической переработке текстов на естественных языках. Мои собственные научные исследования в области вопросно-ответных диалоговых систем были связаны с системой SAM и другими концептуальными системами понимания текстов на естественном языке, для которых умение отвечать на вопросы является демонстрацией понимания (см. Lehnert, 1975а; Lehnert, 1976; Schank and Abelson, 1976). Wendy Lehnert. Problems in question answering.— In: „Cognitive Constraints on Communication" (eds. by L. Vaina and J. Hintikka), 1984. © 1984 by D. Reidel Publishing Company. 258
Вот пример рассказа, который был введен в систему SAM: ВХОД В SAM: Джон поехал в Нью-Йорк на автобусе. По дороге он разговорился с некоей пожилой леди. Перед тем как выйти из автобуса, он поблагодарил водителя. Он поехал в метро в ресторан „Леон". В метро его обчистили. Он вышел из метро и вошел в ,,Леон". Он заказал порцию супа с лапшой. Когда принесли счет, он обнаружил, что ему нечем расплачиваться. Хозяин сказал ему, чтобы он пошел мыть тарелки на кухню. Когда он вышел из ресторана, он поехал на автобусе в Нью-Хейвен. После того как система SAM обработала данный текст, имел место следующий диалог. На вход в SAM были поданы вопросы, ответы на которые давала система. В1: С какой целью Джон поехал в Нью-Йорк? Ol: Джон поехал в Нью-Йорк, потому что он хотел пойти в „Леон". В2: Каким образом Джон добрался до „Леона"? 02: Джон поехал в Нью-Йорк на автобусе, а затем он поехал в „Леон" в метро. ВЗ: Случилось ли что-нибудь в автобусе? 03: В моей памяти об этом нет никаких сведений. В4: Случилось ли что-нибудь необычное в метро? 04: Вор обчистил карманы Джона. В5: Что заказал Джон? 05: Джон заказал суп с лапшой. В6: Случилось ли что-нибудь необычное в ресторане? О6: Джон обнаружил, что не может оплатить счет, и поэтому он должен был идти мыть тарелки. В7: Почему Джон не мог оплатить счет в ресторане? Ol: Потому что у него не было денег. В8: Почему у Джона не было денег? 08: Потому что вор обчистил карманы Джона. В9: Каким образом смог Джон доехать на автобусе в Нью- Хейвен? 09: Вероятно, у него был билет. Если вы попытаетесь создать программу, отвечающую на вопросы того же рода, что и SAM, то перед вами встанут различные сложные проблемы, отражающие реальные сложные ситуации, с которыми сталкивается при ответе на вопрос человек. В настоящей работе будут затронуты некоторые проблемы, связанные с тем, как понимает человек заданные ему вопросы и каким образом дает на них ответы. Интеллектуальные процессы, лежащие в основе вопросно-ответной (В/О) деятельности, занимают весьма обширное место в сфере человеческого познания. Самые заметные из них являются составной частью социального взаимодействия и вербального поведения ведущих диалог людей. Наиболее скрытые процессы имеют отношение к форме представления и организации информации в памяти. Некоторые из процессов, описываемые в этой работе, были реализованы в компьютерных программах типа SAM. Я буду каждый 17* 259
раз указывать, какие фрагменты В/О диалога были смоделированы в вычислительной программе. Поскольку мой интерес к автоматизации В/О-процессов возник из занятий моделированием В/О деятельности человека, нет необходимости различать процедуры, применяемые вычислительным устройством, и процедуры, используемые человеком; я придерживаюсь того мнения, что искусственный интеллект различных устройств должен определяться и описываться через интеллект человека, а разработки в области интеллектуальной деятельности машин должны явиться следствием работ по моделированию деятельности человека. Полное содержание В/О-диалога может быть рассмотрено на трех уровнях. На самом высоком уровне В/О-диалоги представляют собой разновидность социального взаимодействия между людьми или среди людей. На следующем уровне создание В/О-диалога предполагает обработку текста на естественном языке. Под этим я прежде всего имею в виду способность понимать и порождать фразы на естественном языке, письменном или устном. Наконец, на третьем, самом низком, уровне мы можем подойти к ответам и вопросам с точки зрения организации памяти и поиска хранящейся в ней информации. Многое можно сказать о семантической характеристике вопросов и ответов, но только если рассматривать их на всех трех уровнях. Представленный в работе анализ вопросов и ответов иерархично организован в соответствии с этими тремя уровнями. Далее мы будем говорить о них как об уровнях социального взаимодействия, языковой обработки и поиска в памяти. II. СОЦИАЛЬНЫЕ ВЗАИМОДЕЙСТВИЯ А. Социальные контексты На самом высоком уровне семантическое описание высказывания в вопросно-ответном диалоге осуществляется через социальный контекст. Существует четыре класса социальных контекстов, в которых интерпретируется вопрос. Соответственно выделяются и четыре класса ответов. (1) СПРАВОЧНЫЙ вопрос / ИНФОРМАТИВНЫЙ ответ B10: Сколько сейчас времени? О10: 3.25 Справочный вопрос предназначается для получения какой-либо информации. Эта информация содержится в ИНФОРМАТИВНОМ ответе. (2) Вопрос-ПРОСЬБА / ответ-ДЕЙСТВИЕ В11: Не могли бы вы передать соль? О11: (соль передается) Вопрос-просьба сообщает адресату о заинтересованности спрашивающего в совершении адресатом некоторого действия. Ответ- действие является фактическим выполнением этого действия. 260
(3) ЛЮБЕЗНЫЙ вопрос / ЛЮБЕЗНЫЙ ответ В12: Как вы себя чувствуете? 012: Хорошо, спасибо. ЛЮБЕЗНЫЙ вопрос представляет собой некую социальную условность. ЛЮБЕЗНЫЙ ответ — это некоторый уместный в данной ситуации ответ, социально обусловленный и не противоречащий вопросу. (4) СТРАТЕГИЧЕСКИЙ вопрос / СТРАТЕГИЧЕСКИЙ ответ В13: Кто сказал тебе, что ты можешь войти сюда? 013: А кто сказал, что я не могу? Обмен стратегическими репликами представляет собой сложную форму социального взаимодействия. Стратегический вопрос передает некоторую информацию и имеет целью заставить отвечающего занять оборонительную позицию. Стратегический ответ на стратегический вопрос — это ответ, назначение которого признать стратегию, выраженную в вопросе, и отреагировать на нее более сильной. В приведенном примере первый вопрос вряд ли следует интерпретировать как подлинный, как запрос о некоторой информации. В действительности перед нами выражение неодобрения, которое на самом деле означает «Я не хочу, чтобы ты был здесь». Такая стратегия говорящего ставит его в позицию неявного превосходства над слушающим. Ответная реплика указывает, что отвечающий понимает, что происходит игра стратегий, иначе бы он понял вопрос „буквально", то есть как справочный вопрос, и его ответ—это еще один псевдовопрос, который в действительности означает ,,У тебя нет никакой власти надо мной". Все эти классы социальных контекстов играют важную роль в семантической интерпретации В/О-диалогов. Пары, элементами которых являются классы вопросов и классы ответов, могут быть охарактеризованы как стандартные и нестандартные. Когда обмен В/О репликами осуществляется при стандартных комбинациях типов вопросов и ответов, диалог осмыслен и воспринимается как типичный и обычный. При нестандартных комбинациях В/О взаимодействие воспринимается либо как бессмысленное, либо как неестественное, нарушающее обычный обмен репликами, либо, наконец, как смешное. Стандартными комбинациями являются следующие: СПРАВОЧНЫЙ вопрос / ИНФОРМАТИВНЫЙ ответ, вопрос-ПРОСЬБА / ответ- ДЕИСТВИЕ, ЛЮБЕЗНЫЙ вопрос / ЛЮБЕЗНЫЙ ответ, СТРАТЕГИЧЕСКИЙ вопрос / СТРАТЕГИЧЕСКИЙ ответ. Примеры этих комбинаций даны выше. Пара ,,вопрос-ПРОСЬБА / ИНФОРМАТИВНЫЙ ответ" является стандартной комбинацией, когда ответ передает информацию, соответствующую содержащейся в вопросе просьбе. Поскольку просьбы всегда относятся к действиям, которые требуется совершить в будущем (,,Не могли бы вы передать соль?"), вполне уместной будет информативная реакция на них, если выполнение действия собираются отложить (,,Да, минуточку") или же вообще 261
его не выполнять (,,Простите, но я не могу"). По-видимому, это единственный случай, когда комбинации ПРОСЬБЫ с ИНФОРМАТИВНЫМ ответом являются стандартными. Приведем некоторые нестандартные комбинации. СПРАВОЧНЫЙ вопрос / ЛЮБЕЗНЫЙ ответ В14: (при обращении к человеку, которого только что сбила машина) Как вы себя чувствуете? О14: Спасибо, хорошо, а вы? Вопрос-ПРОСЬБА / ИНФОРМАТИВНЫЙ ответ В15: У вас есть сдача с доллара? Ol5: Да (без всякого сопутствующего действия). СТРАТЕГИЧЕСКИЙ вопрос / ИНФОРМАТИВНЫЙ ответ В16: Как же вы голосовали за Никсона? 016: Ну, сначала я внес свое имя в список избирателей, затем я ЛЮБЕЗНЫЙ вопрос / ИНФОРМАТИВНЫЙ ответ В17: Как поживаете? 017: Ужасно. В прошлом месяце задавили мою собаку, потом... Во всех этих вопросно-ответных парах ощущается какая-то неправильность, однако нам она кажется скорее забавной, потому что все эти пары выглядят как почти правильные. Их никак нельзя назвать абсолютно бессмысленными. Они являются почти допустимыми, поскольку вопрос можно интерпретировать как относящийся к другому контекстному классу, для которого ответ будет стандартным. Например, вопрос „Как вы себя чувствуете?" можно было бы счесть любезностью, не будь он задан человеку, которого только что сбила машина. В другом случае любезный ответ был бы вполне уместен. ,,У вас есть сдача с доллара?"—этот вопрос мог бы быть справочным, если бы задающий его хотел просто получить соответствующую информацию для последующих ссылок на нее. При такой интерпретации стандартным был бы информативный ответ. Точно так же к справочным можно было бы отнести и вопрос ,,Как же вы голосовали за Никсона?", и тогда на него был бы уместен информативный ответ. Наконец, если понять вопрос «Как вы поживаете?" „буквально", как справочный, то он повлечет за собой информативный ответ. Внезапный переход от одной контекстуальной рамки к другой вызывает комический эффект. При обработке таких диалогов вы вначале интерпретируете вопрос как относящийся к одному контекстному классу, но, когда доходите до ответа, вы начинаете понимать, что ответ не попадает в класс стандартных ответов. Тогда вы снова возвращаетесь к вопросу и пытаетесь переосмыслить его так, чтобы соответствующий класс вопросов мог легко сочетаться с классом ответов. Поскольку для каждого из этих вопросов суще- 262
ствуют переинтерпретации, переводящие пары в разряд стандартных, то создается впечатление, что в конце концов мы решим нашу задачу. Иными словами, в надежде прийти к стандартной комбинации реплик мы идем сначала по неверному пути и затем нам приходится возвращаться назад. Как следствие такой обработки диалога возникает комический эффект. Некоторые комбинации контекстных классов, видимо, вообще не встречаются. Ответы-действия могут быть вызваны только вопросами-просьбами, так как выполнение некоторого действия в силу самого определения происходит в ответ на просьбу, выраженную в вопросе. С другой стороны, очень трудно отреагировать на просьбу, справочный или стратегический вопрос любезным ответом. Естественно, что отдельные вопросы и ответы могут попадать сразу в несколько классов. Например, вопрос ,,Не хотите сигарету?" одновременно является любезным вопросом и справочным вопросом. Поскольку все допустимые ответы на этот вопрос указывают либо на принятие предложения, либо на отказ от него, то все они являются информативными. Сказанное наводит на мысль, что типы вопросов упорядоченны. Представляется, что иерархия вопросов устроена следующим образом: первыми следуют стратегические вопросы, затем — вопросы-просьбы, за ними следуют справочные вопросы; и, наконец, самое низкое положение в этой иерархии занимают любезные вопросы. В случае если данный вопрос попадает более чем в один класс, допустимые ответы заимствуются из класса, занимающего более высокое положение. Вот почему В/О пары 14—16 выглядят странными. В14 мог бы быть справочным, но на него ответили так, как если бы он был просто любезным. В15 мог бы быть просьбой, но был воспринят как справочный. В то же время В16 был истолкован как справочный, а не как стратегический. Если бы эти вопросы были проинтерпретированы в соответствии с иерархией предпочтения, неправильной интерпретации бы не возникало. Проблема с В17 возникла по той причине, что существуют ситуации, в которых вопрос „Как вы поживаете?" может быть истолкован как настоящий справочный вопрос. Однако без задания полного контекста окружения, как в В14, прийти к справочной интерпретации этого вопроса не удается. Важно понять, что в реальных диалогах все интерпретации ограничены полным контекстом диалога. Предложенная здесь иерархия классов вопросов оказывается полезной лишь тогда, когда контекстное окружение не навязывает ограничений на интерпретацию вопросов. В. Использование социального контекста при понимании Когда люди понимают В/О-диалог, один уровень семантической информации извлекается ими из социального контекста диалога. Каждый вопрос и ответ интерпретируется в некотором контекстуальном классе. Сначала следующие друг за другом вопросы и ответы проверяются на их принадлежность тем или иным комбинациям 263
классов, и если встречается нестандартная комбинация, то может понадобиться дополнительная обработка диалога. Некоторые нестандартные комбинации требуют привлечения общих механизмов вывода. Например, если стратегический ответ следует за не-стратегическим вопросом, приводится в действие механизм, исследующий социальный статус участников диалога. Если отвечающий имеет более низкий социальный статус, то диалог следует воспринимать как вызов. Если оба участника диалога имеют одинаковый статус, диалог интерпретируется как шутка. Наконец, если отвечающий имеет, бесспорно, более высокий социальный статус, то обмен репликами нужно интерпретировать как демонстрацию власти, показ силы или превосходства одного участника над другим. Для иллюстрации действия указанного механизма вывода рассмотрим диалог: «Не могли бы вы передать соль?» — «Только если вы скажете „пожалуйста"» — в трех разных социальных контекстах: во-первых, как диалог между двумя детьми—двумя родными братьями—старшим и младшим (вызов), затем как диалог между двумя взрослыми людьми (шутка) и, наконец, как диалог между ребенком и его родителем (демонстрация власти). Знание такого рода социальной динамики очень важно для понимания диалогов. После того как установлен тип социального контекста, можно выдвигать различные гипотезы, которые будут использоваться при понимании последующего диалога. Например, в контексте вызова словесная баталия имеет смысл только как борьба за статус. Но если перед нами контекст шутки, то трудно понять, почему такое сражение должно иметь место. В качестве иллюстрации продолжим предыдущий диалог. А: Не могли бы вы передать соль? В: Только если вы скажете „пожалуйста". А: Мне нужна соль. В: Нет. Хотя нетрудно вообразить, что такой диалог происходит между двумя детьми или даже между ребенком и родителем, однако трудно представить себе, чтобы так могли разговаривать друг с другом двое взрослых. Этот диалог имеет смысл только как вызов или демонстрация власти, но невероятно, чтобы такого рода словесную перепалку из-за какой-то соли вели двое взрослых. При большом воображении можно все же было бы представить, что разговор происходит между двумя взрослыми людьми, которые ,,ведут себя как дети". Этот диалог нельзя понять как шутку, если не считать его пародией. Но даже воспринятый как пародия, он имитирует вызов или демонстрацию власти. Рассматриваемый в социальном контексте вызова диалог описывает начало жаркого сражения, в котором противоборствующие стороны борются за более высокий статус. Рассматриваемый как демонстрация власти, диалог показывает нам уверенно сидящего на троне правителя и мятежника, терпящего неудачу. 264
Эти три социальных контекста обусловливают порождение разных множеств выводов об участниках диалога. Вывод — это допущение, которое может быть и ложным, а способность делать выводы из некоторых исходных посылок является важнейшей частью понимания языка (см. Schank, 1975а). Например, если диалог интерпретируется как вызов, то можно сделать вывод, что бросающий вызов человек надеется на успех, а человек, к которому обращен вызов, по всей видимости, находится где-то в пределах континуума от ощущения угрозы до чувства раздражения, в зависимости от того, как он воспринимает данную ситуацию. При этом человек, к которому обращен вызов, ни на йоту не отступил от своих позиций, и потому мы можем сделать вывод, что вызов не очень сильно испугал его и что спектр испытываемых им эмоций, видимо, не очень широкий, а колеблется от волнения до раздражения. С другой стороны, если диалог интерпретируется как демонстрация силы [или власти], мы ожидаем от бунтаря, что тот будет расстроен и сердит, а от правителя, что тот, скорее всего, будет просто раздражен. Такого рода выводы, касающиеся участников диалогов, должны быть получены по правилам интерпретации диалогов, учитывающих социальную динамику контекстов, в которых они произносятся. Имеется огромное количество сведений о социальных взаимодействиях людей, которые необходимо знать, чтобы понимать диалоги вообще и В/О-диалоги в частности. Однако степень понимания текста, о которой шла речь выше, отражает глубокую предварительную обработку текста. Возможен и другой уровень понимания, когда диалог понимается каким-то одним образом, но не другим. Например, ребенок мог бы понять диалог несколькими способами, при этом полностью игнорируя отдельные тонкие моменты, с которыми можно встретиться только на более высоких уровнях социального взаимодействия. То же самое происходит и в случае, когда диалог носит в какой-то степени эзотерический характер или когда социальный контекст диалога известен и понятен лишь его участникам. Например, закрытый характер часто имеют диалоги, происходящие между супружескими парами, и их социальный контекст известен и понятен только данной конкретной паре. Несколько иерархически организованных уровней имеет и семантическая характеристика в языке. Возможно понимание рассказа или диалога на каком-то одном уровне и при этом неполное его понимание на другом, более высоком уровне. Нельзя, однако, понять текст на более высоком уровне, не поняв его на более низких. Многим из того, что связано со знанием типов возможных взаимодействий партнеров по диалогу, можно пренебречь без существенных потерь для понимания. III. ЯЗЫКОВАЯ ОБРАБОТКА ТЕКСТОВ Следующий уровень семантического описания В/О-диалогов имеет отношение к пониманию языка на более эксплицитном уровне. 265
Обсуждая вопросы и ответы в терминах классов социальных контекстов, мы видели, как можно понять вопрос „буквально", интерпретируя его в контексте более поверхностного уровня, тогда как небуквальное осмысление предполагает интерпретацию диалога в контексте более глубинного уровня. Например, вопрос „Как вы голосовали за Никсона?" следует интерпретировать в стратегическом контексте, но если его воспринимать буквально, то это справочный вопрос. Уровень семантической обработки, который мы сейчас рассмотрим, связан с пониманием в буквальном смысле. Мы обсудим ряд проблем, которые возникают в классе вопросов и ответов, попадающих в класс СПРАВОЧНЫЙ ВОПРОС / ИНФОРМАТИВНЫЙ ОТВЕТ В/О-реплик. Этот класс включает в себя все эмпирические ситуации (письменные или устные), в которых один из собеседников пытается получить доступ к состоянию знаний другого. Часто В/О-диалоги— это единственный способ узнать, как человек понимает данный предмет или данную проблему. Например, если кто-то читает рассказ, то его способность отвечать на вопросы по тексту является убедительной демонстрацией понимания текста. Все примеры, которые будут приведены далее в настоящей статье с целью проиллюстрировать некоторые проблемы, возникающие на более глубоких уровнях семантической обработки, даются в контексте ответов на вопросы по тексту рассказов. А. Семантический анализ и контекст Весьма рискованно говорить о семантической репрезентации вопроса, рассматривая вопрос изолированно от естественного контекста его употребления. Во второй главе мы видели, как воздействуют на значение вопросов сдвиги внутри классов контекстов. То же самое происходит и на более глубоких уровнях семантического анализа. Рассмотрим, например, следующий рассказ. Контекст 1 Джон только что купил новую машину. Он так радовался покупке, что ездил на машине при каждом удобном случае. Поэтому вчера вечером, когда он решил пообедать в городе, он сел в машину и поехал на ней в ресторан „Леон". Когда Джон туда приехал, ему пришлось подождать, пока освободится столик... В18: Почему Джон поехал в „Леон"? Допустимыми ответами на В18 будут: „Потому что он только что приобрел новую машину и ему хочется ездить на ней при каждом удобном случае", „Потому что он счастлив, что ему удалось приобрести новую машину" или „Потому что он обожает водить машину" и т. д. Все дело в том, что здесь вопрос интерпретируется именно как вопрос о вождении автомобиля. Рассмотрим теперь другой рассказ. 266
Контекст 2 Джон так сильно увлекся Мэри, что потерял из-за нее голову. Но Джон был очень стеснительным, и потому ему было хорошо уже от одной возможности быть около нее поблизости. Так, он привык следовать за Мэри повсюду. Джон знал, что она часто бывает в „Леоне". Поэтому вчера вечером, когда он решил поехать куда-нибудь пообедать, он поехал в „Леон". Когда Джон приехал туда, ему пришлось подождать, пока освободится столик... В19: Почему Джон поехал в „Леон"? Теперь этот вопрос имеет уже другое значение. Допустимыми ответами будут: ,,Потому что он знал, что там обедает Мэри", ,,Потому что он надеялся встретить там Мэри" или „Потому что ему хотелось увидеть Мэри" и т. д., и т. п. Здесь уже вопрос интерпретируется как вопрос о ,,Леоне". Семантическая репрезентация вопроса зависит от контекста, в котором он задается. Будучи взятым в контексте, вопрос ,,Почему Джон поехал в „Леон"?" абсолютно однозначен. В действительности, с семантической точки зрения, эти два употребления, В18 и В19, нельзя считать одним вопросом. В первом контексте предложение „Почему Джон поехал в „Леон"?" семантически эквивалентно вопросу „Почему Джон поехал пообедать на машине?", тогда как во втором контексте это предложение равносильно вопросу „Почему Джон заехал именно в „Леон"?". Но вопросы „Почему Джон поехал пообедать на машине?" и „Почему Джон заехал именно в „Леон"?" не взаимозаменимы за пределами своих контекстов. Если спросить „Почему Джон заехал именно в „Леон"?", оставаясь в рамках первого контекста, то в этом вопросе будет содержаться требование сообщить сведения, которые там отсутствуют. Аналогично, нельзя ответить на вопрос „Почему Джон поехал пообедать на машине?" в пределах второго контекста. При ответе на вопрос первоочередной задачей является определение семантического содержания вопроса. Поскольку семантическое содержание вопроса вычисляется по контексту, рассматривать примеры вне контекста было бы крайне рискованным. В. Роль фокуса при понимании вопросов и ответе на них Вышеприведенные примеры служат иллюстрацией такого явления, как фокус высказывания. При семантической интерпретации вопроса очень часто его фокус определяется по контексту. В контексте первого рассказа фокус приходится на акт поездки на машине, тогда как в контексте второго рассказа фокусируется выбор ресторана. Хотя в одних случаях фокус вопроса устанавливается по контексту, в других случаях приходится привлекать общие знания о мире. Как-то утром Джон встал ужасно голодным. Он надел на ноги роликовые коньки и покатил в ресторан завтракать. 267
B20: Почему Джон поехал в ресторан на коньках? Люди не всегда дают семантическую интерпретацию вопросам, опираясь на информацию, которая им может быть сообщена в ответе. Они ответят на В20 ,,Я не знаю", указав, что фокусом этого вопроса является поездка в ресторан на коньках. Если бы фокус приходился на цель поездки Джона, то на В20 можно было бы ответить в соответствии с информацией, которая эксплицитно представлена в рассказе: ,,Почему Джон поехал в ресторан на коньках?— Потому что он был ужасно голоден". Однако в случае В20 фокус вопроса устанавливается исходя из общих знаний о мире. Хорошо известно, что обычно взрослые люди не пользуются роликовыми коньками как средством транспорта. Текст не содержит никакой информации, которая указывала бы на то, что Джон ребенок. Более того, вывод о том, что Джон взрослый, подкрепляется сообщением, что он отправился в ресторан один. Следовательно, читающие данный рассказ чувствуют, что Джон ведет себя странным образом. Если установление фокуса вопроса требует привлечения общих знаний о мире, то следует при этом учесть существование определенной иерархии предпочтений, дающей возможность выявить наиболее интересные детали, относящиеся к вопросу. Так, если элемент вопроса соотносится с чем-то неожиданным или относительно интересным, то именно этот элемент становится фокусом. Поскольку в рассматриваемом нами вопросе речь идет о странном поведении Джона, то это поведение и является фокусом этого вопроса, а сам вопрос интерпретируется как имеющий фокус на странном поведении Джона. Принцип, согласно которому в фокус попадают разные варианты прочтения вопроса, а не гипотезы, применяется не только при ответах на вопросы, но также и при их понимании. Например, в системе SAM используется следующий способ обнаружения фокуса вопроса. О21 показывает путь, по которому следует SAM при ответе на В21 после прочтения рассказа: ВХОД в SAM: Джон зашел в ресторан. Администратор дал ему меню, и он заказал гамбургер*. Официантка принесла ему гамбургер, и он съел его. В21: Официантка дала Джону меню? 021: Нет, меню ему дал администратор. Людям, как правило, свойственно тщательно обдумывать свою ответную реплику, прежде чем дать отрицательный ответ на да/нет вопрос. Но что толкает их на размышления? Думается, что стимулом к обдумыванию ответа является то, что в действительности люди дают ответы на незаданные вопросы, в данном случае на вопрос „Кто дал меню Джону?". Тем самым мы свели проблему поиска плана ответа к проблеме поиска правильного незаданного вопроса. Допустим, что при поиске ответа мы опираемся на другой * Гамбургер, или бифштекс по-гамбургски,— популярный в США бутерброд с мясной котлетой или сама котлета.— Прим. перев. 268
незаданный вопрос: „Что дала официантка Джону?" В результате ответом была бы реплика „Нет, официантка дала Джону гамбургер". Хотя ответ этот и нельзя признать абсолютно неправильным, он кажется гораздо менее естественным, чем первоначальный. Чтобы выбрать правильный путь к одному из двух возможных ответов, следует опереться на некоторые общие сведения о ресторанах. Когда вы слышите рассказ о том, как кто-то ест в ресторане, вы выдвигаете по ходу рассказа много разных гипотез о том, что там могло бы произойти, даже если в рассказе на этот счет ничего не говорится. Так, из приведенного выше рассказа вы делаете выводы о том, что перед тем, как заказать что-то, Джон сел за столик, что официантка отдала его заказ повару и что повар приготовил для Джона бифштекс по-гамбургски. Между тем, в тексте рассказа ничего такого не сообщается. Все такие заключения делаются на основании самых общих сведений о ресторанах. Такого рода самая обычная информация о том, что бывает в ресторанах, должна быть использована при поиске наилучшего ответа на заданный вопрос. Ответив „Нет" на вопрос „Меню Джону дала официантка?", мы не оправдали имплицитных ожиданий спрашивающего: ведь тот полагал, что меню Джону, скорее всего, дала или должна была дать официантка. Строя свой ответ, мы хотим учесть это обстоятельство и объяснить, почему мы действуем вопреки ожиданиям спрашивающего. Говоря о еде в ресторане, необходимо указать на одно действие, вероятность которого очень велика. Речь идет о получении меню. Мы знаем, что меню может быть получено от официанта, официантки, администратора или метрдотеля; возможно также, что клиент сам его возьмет. Но от кого бы меню ни поступило, мы ожидаем, что клиент получит его в любом случае. И именно это ожидание подсказывает нам, как строить свой ответ. За вопросом „Меню Джону дала официантка?" стоит предположение, что Джон, по всей видимости, где-то достал меню. Поэтому в ответе на этот вопрос наиболее естественным будет сообщение, откуда у Джона появилось меню. Проблема фокуса играет важную роль как при анализе вопросов, так и при анализе ответов. Удалось ли правильно определить семантическое содержание вопроса, часто зависит от того, верно ли установлен его фокус. А ответы, показывающие, что „не поймана суть вопроса",— это как раз те, в которых неверно определен фокус. Примером диалога с неправильно выбранным фокусом вопроса может служить пара „Почему Джон полетел в Нью-Йорк?"— „Потому что туда слишком далеко идти пешком". Описание эвристик, используемых в системе SAM, в том числе и тех, которые способствуют установлению фокуса, см. в работах Lehnert, 1975а; Lehnert, 1976. С. Семантические категории вопросов Мы уже видели во второй главе, что существует полезная классификация вопросов и ответов, построенная на основе изучения 269
социальных контекстов и их употребления. Эти классы имеют определенный смысл, так как с их помощью можно описать процессы вывода, необходимые для понимания рассказов. Однако на более глубоких уровнях обработки текста такая классификация вопросов была бы полезной только в том случае, если бы по ней можно было бы судить, какого рода техника поиска должна применяться для получения ответа на вопрос. При обсуждении понятия фокуса мы уже упоминали о важности семантического содержания вопроса. Так, если два вопроса отличаются друг от друга на лексическом уровне, но вызывают одинаковые ответы, то они семантически эквивалентны и допускают одну и ту же обработку с точки зрения организации памяти и поиска в ней информации. С другой стороны, если два вопроса неотличимы друг от друга на лексическом уровне, но предполагают разные ответы (в различных контекстах), тогда они семантически различаются и требуют разной обработки в терминах поиска (по памяти). Таким образом, если классифицировать вопросы по типу обработки, необходимой для ответа на них, то самыми полезными оказываются категории, которые подлежат описанию на языке семантических представлений. Традиционно классификация вопросов строится в соответствии с их лексическими характеристиками. При таком подходе мы получаем множества как -вопросов, почему -вопросов, когда -вопросов, что- вопросов и т. д. Хотя это очень простой способ расклассифицировать вопросы, в такой классификации не слишком много смысла. Рассмотрим разные виды процессов, происходящих в памяти интеллектуального устройства, которые вызваны как -вопросами*. КВАНТИФИКАЦИОННЫЕ ВОПРОСЫ Какой она длины? Сколько это стоит? Как часто это происходит? Как он тебе нравится? Как твой муж? ВОПРОСЫ-ВОЗМОЖНОСТИ Как вы смогли купить это, раз у вас нет денег? Как у вас хватает на все это времени? Как вы могли слышать, что он сказал? ИНСТРУМЕНТАЛЬНЫЕ ВОПРОСЫ Как вы сюда добрались? Как вы дали ему знать об этом? КАУЗАЛЬНО-АНТЕЦЕДЕНТНЫЕ ВОПРОСЫ Как это произошло? Как разбился этот стакан? * В английском языке все нижеследующие вопросы начинаются со слова How 'Как'.— Прим. перев. 270
ПРОЦЕДУРНЫЕ ВОПРОСЫ Как вы это сделали? Как мне добраться до вашего дома? Как вы получите поблизости отсюда какую-нибудь работу? Зная семантическую репрезентацию вопроса со словом „как", можно определить, к какой из перечисленных категорий он относится. Точно так же как контекст может изменить значение вопроса посредством смещения его фокуса, контекст может изменить и его значение, меняя тип семантической категории. Например, ,,Как вы разбили этот стакан?"—это вопрос из типа ВОЗМОЖНОСТЬ, если по контексту устанавливается преднамеренность данного действия. Но тот же самый вопрос будет КАУЗАЛЬНО-АНТЕЦЕДЕНТНЫМ в контексте случайного, непреднамеренного действия. Такого типа категории вопросов полезны сразу на двух уровнях обработки текста. Если пользоваться языком поиска по памяти, то эти категории указывают, какого рода структуры памяти следует рассмотреть, чтобы найти удовлетворительный ответ на заданный вопрос. Вопрос „Как разбился стакан?" вызывает такую же ответную реакцию, как и вопрос „Что произошло со стаканом?". Если оба эти вопроса на семантическом уровне представлены одинаково как КАУЗАЛЬНО-АНТЕЦЕДЕНТНЫЕ вопросы, то они вызывают одни и те же процессы поиска информации в памяти. Следовательно, в обоих случаях мы получаем один и тот же ответ. В наших компьютерных программах используется семантическая репрезентация на языке концептуальных зависимостей в духе Р. Шенка (см. Schank, 1975а). При такой записи смысла вопрос легко может быть подвергнут желаемой семантической категоризации. Еще одно преимущество указанной классификации вопросов можно увидеть, если обратиться к понятию вывода. Хотя под вопросами обычно понимают языковые единицы, обращенные к некоторому лицу с целью получить от него информацию, вопрос передает не только запрос об информации, но и некоторую информацию. Часть информации, заключенной в вопросе, определяется по его семантическому типу и проявляется в форме вывода. Например, вопрос-ВОЗМОЖНОСТЬ передает определенную степень удивления со стороны лица, задающего вопрос. Вопрос „Как вы смогли заплатить за обед?" наводит на мысль, что существовала какая-то причина, по которой спрашивающий мог подумать, что собеседник не мог заплатить за обед. В искусственном контексте ситуации языкового эксперимента этот вывод может быть не учтен или пропущен, однако в реально происходящих вопросно-ответных диалогах он, несомненно, присутствует. Действие этого вывода, по сути дела, эксплуатируется явным образом в ситуации, когда СТРАТЕГИЧЕСКИЕ вопросы задаются так, как если бы они относились к типу ВОЗМОЖНОСТЬ. Предложение „Как вы попали в Йейльский университет?" в действительности является утверждением, в котором выражено удивление или недоверие со стороны спрашивающего. Слушающий понимает, что вопрос этот не является 271
буквально СПРАВОЧНЫМ, а эффект удивления, возникающий как вывод, полученный в результате семантической обработки вопроса на глубинном уровне, остается при передаче СТРАТЕГИЧЕСКОГО сообщения. IV. ПОИСК ИНФОРМАЦИИ В ПАМЯТИ Большинство проблем, связанных с поиском информации в памяти вычислительного устройства, являются техническими проблемами и относятся к организации самой памяти и репрезентации в ней информации. Исследователи в области искусственного интеллекта признали недавно, что представление знаний является важнейшей задачей не только искусственного интеллекта вообще, но и обработки естественного языка в частности (см. Bobrow & Collins, 1975). Однако обсуждение здесь этих весьма общих вопросов увело бы нас очень далеко от проблем, относящихся непосредственно к В/О- диалогам. Поэтому, чтобы оставаться как можно ближе к В/О- диалогам и связанным с ними проблемам, мы в этом разделе обсудим только те немногие вопросы, которые касаются поиска информации в памяти и которые можно обсудить, не обращаясь к какой-либо конкретной теории представления памяти. А. Выбор ответа Поиском в памяти интеллектуального устройства управляет главным образом процесс понимания. Однако в ходе вопросно-ответного диалога ответ может быть получен не только как результат различных процессов, связанных с пониманием, но также и как результат порождения текста. Рассмотрим следующий текст. Джон поехал на метро в ресторан „Леон". Но по дороге вор обчистил его карманы. Когда Джон зашел в „Леон", он заказал порцию супа с лапшой. Позже, когда принесли счет, он обнаружил, что ему нечем платить. Поэтому Джону пришлось в „Леоне" мыть посуду. В22: Почему Джон мыл в „Леоне" посуду? 022а: Потому что ему нечем было оплатить счет. 022b: Потому что у него не было денег. О22с: Потому что его обокрали в метро. Все эти ответы являются допустимыми и правильными. И все-таки ответ 22с очевидным образом наилучший из них. Его предпочтительность объясняется тем, что он передает больше информации по сравнению с первыми двумя ответами. И осуществляет он передачу информации с помощью выводов, которые могут быть из него извлечены. О важности дедукции уже шла речь при обсуждении процесса понимания, но такие же принципы вывода должны оказаться полезными и при порождении сообщений. 272
Если известно, что Джон мыл в ресторане посуду, то отсюда легко заключить, что Джон не мог оплатить счет. И это будет вывод, сделанный на основании самых общих знаний о ресторанах. Неспособность оплатить в ресторане счет—это классический пример нарушения обычной процедуры еды в ресторане или каком-либо аналогичном месте. И равным образом классическим разрешением этого конфликта будет мытье ресторанной посуды. Поскольку никаких других стандартных нарушений процедур, обычно происходящих в ресторане и заканчивающихся мытьем посуды, нет, легко выводится каузальная посылка, что Джон мыл посуду. Человек, задающий вопрос ,,Почему Джон мыл посуду?", должен знать, что Джон мыл посуду, и таким образом этот человек, по всей вероятности, делает очевидное заключение, что Джон не мог оплатить счет. Основное правило порождения текста гласит, что мы не говорим того, что представляется нам очевидным. По этой причине ответ 22а кажется нам семантически чересчур бедным: ведь в нем не содержится никакой другой информации, отличной от той, которую задающий вопрос мог бы самостоятельно извлечь из самых общих знаний о мире. То же самое критическое замечание применимо и к ответу 22b. Общие знания о мире позволяют сделать вывод, что если некто не может оплатить счет в ресторане, то у него, видимо, нет денег (в нужном количестве). Таким образом, обнаружение наилучшего ответа на данный вопрос означает нечто большее, чем просто обнаружение правильного ответа, в котором сообщается причина события. Оно означает, что ответ содержит информацию, которая не является очевидной для лица, задавшего вопрос. В рассматриваемом случае наилучшим является, безусловно, ответ 22с, поскольку в нем указана причина, невыводимая из общих знаний о мире. Для получения этого ответа нужна информация, содержащаяся в самом рассказе. В построенную нами компьютерную программу, выбирающую из некоторого множества возможных ответов наилучший, включен ряд эвристических процедур для выбора такого ответа. Когда эта программа сталкивается с тремя возможными ответами типа тех, которые были рассмотрены в связи с В22, она выбирает из этих ответов ответ 22с. Описание этой программы дано в работе Lehnert, 1975b. Для вопросов со словом почему такая усложненная процедура выбора ответа особенно характерна. В разобранном выше примере выбор довольно простой, но в большинстве случаев бывает очень трудно решить, какая информация спрашивающему представляется очевидной, а какая—нет. Особенно трудно это сделать в искусственном контексте лабораторного эксперимента. Отвечающему приходится делать допущения относительно того, что хочет узнать спрашивающий. В реальном СПРАВОЧНОМ контексте можно считать, что вопрос задан по той причине, что спрашивающему не хватает какой-то информации и он хочет через ответ восполнить информационный пробел. В естественных контекстах диалога знание того, как выбрать наилучший ответ, включает в себя определение состояния знаний другого лица, с тем чтобы через ответ снабдить это лицо 18-1182 273
новой информацией. Очень часто решение этой задачи достигается за счет принятия дополнительных допущений относительно знаний спрашивающего при условии, что отвечающий может положиться на то, что спрашивающий укажет ему, если эти допущения будут неверными. А: Как мне добраться до Вашингтонских Высот? В: М-м, вы можете сесть на ИНД и доехать до ... А: На ИНД? В: Да, это на 8-й авеню, которая проходит ... А: ИНД—это что, станция метро? В: Да, она находится на углу 8-й авеню и 34-й улицы. А: Где это 34-я улица? Между тем в ситуации лабораторного эксперимента бывает иногда сложно определить, к какому состоянию знаний спрашивающего должен обращаться отвечающий. Всякий раз, когда задается вопрос по данному рассказу, отвечающему известно лишь, что какое-то знание рассказа, которое позволило слушающему задать первым именно данный вопрос, у того имеется. Выяснение того, какие допущения могут быть сделаны в искусственных контекстах, а какие не могут, является весьма непростой задачей. Проблема выбора ответа является одновременно проблемой поиска и проблемой порождения. Механизмы поиска призваны управлять поиском в памяти правильных ответов. А тогда механизмы порождения должны управлять процессом выбора в случае, когда в результате поиска образуется множество выбора (ответов). Правила, которые должны применяться при выборе, согласуются с некоторой теорией эффективной коммуникации людей. До тех пор пока не создана такая теория коммуникации, которая могла бы быть выражена на языке эвристик, порождающая способность всякой естественно-языковой системы будет в обыденных В/О-контекстах чрезвычайно низкой. В. Вопросы о гипотезах Каждая интеллектуальная система, претендующая на автоматическое понимание текста рассказа, должна порождать некоторое его внутреннее представление. На основе этого представления будут далее выполняться все поисковые задания, относящиеся к рассказу. В частности, ответы на вопросы по поводу рассказа должны даваться исходя из репрезентации текста. Есть, однако, вопросы, требующие сообщить в ответе больше информации, нежели та, что содержится в одной только репрезентации. Мы уже видели в третьей главе, как общее знание о мире используется при понимании вопросов и при выдаче отрицательных ответов. Ниже мы обсудим класс вопросов, для ответов на которые необходимо иметь что-то еще, помимо репрезентации текста и знания о мире. 274
Приводимый ниже рассказ явился реальным входом в систему SAM. Три вопроса, которые мы здесь рассмотрим, были заданы системе после того, как та прочла этот рассказ, и ответы на них давала сама система. Описываемый процесс поиска по памяти—это именно тот, который осуществляется в SAM при ответе на почему- вопросы, относящиеся к не-событиям. Более детальное обсуждение представленного здесь процесса обработки информации можно найти в работе Lehnert, 1976. ВХОД В SAM: Джон вошел в ресторан, и администратор дал ему меню. Когда Джон заказал горячие сосиски, официантка сказала, что сосисок нет. Тогда Джон заказал бифштекс по-гамбургски. Но когда принесли бифштекс, он был так пережарен, что Джон ушел из ресторана голодным. Когда люди что-то рассказывают (или пишут), они обычно опускают информацию, легко выводимую из текста. По этой причине значительную часть процесса понимания составляет восстановление опущенной информации через процедуру вывода. Если человек понимает рассказ типа того, который был приведен выше, он в действительности понимает не просто каждое отдельно взятое предложение текста. Для связи событий и действий, о которых идет речь в рассказе, используется знание о мире. Эта связь осуществляется через заполнение текстовых лакун выводимыми состояниями и событиями. Поэтому репрезентация рассказа в памяти должна включать в себя все те выводы, которые объединяют предложения на вводе в связное целое. Следующий список действий содержит ряд выводов, которые должны быть сделаны при понимании приведенного рассказа. Наряду с этими выводами система SAM делает еще некоторые дополнительные выводы относительно местоположений объектов, отношений обладания и других изменений текущих состояний объектов. Джон идет в ресторан. Джон входит в ресторан. Администратор видит Джона. Администратор подходит к Джону. Администратор подводит Джона к столику. Джон садится за столик. Джон берет у администратора меню. Джон смотрит меню. Официантка видит Джона. Официантка подходит к столику Джона. Джон заказывает горячие сосиски. Официантка говорит Джону, что у них сосисок нет. Джон заказывает бифштекс по-гамбургски. Официантка относит заказ повару. Повар готовит бифштекс по-гамбургски. Официантка берет бифштекс у повара. Официантка приносит Джону бифштекс. Официантка подает Джону бифштекс. Джон видит, что бифштекс пережарен. Джон сердится. Джон поднимается из-за столика. Джон покидает ресторан. 275
Заметим, что все эти выводы являются заключениями, которые мог бы вывести каждый человек из общих знаний о том, как происходит посещение ресторана. Для целей настоящей статьи можно считать данный список концептуализации репрезентацией текста приведенного рассказа. Она порождается по мере того, как прочитывается рассказ, и становится частью базы знаний системы, которая впоследствии используется для ответов на вопросы. Рассмотрим теперь три вопроса по данному рассказу. В23: Почему официантка не принесла Джону горячие сосиски? В24: Почему Джон не стал есть бифштекс по-гамбургски? В25: Почему Джон не оплатил счет? Почему-вопросы требуют указания в ответах причины. В данном случае нас интересует причина, по которой официантка не принесла Джону горячих сосисок, причина, по которой он не стал есть бифштекс по-гамбургски, а также причина, по которой он не оплатил счет. Но каким образом в процессе поиска информации в памяти можно найти информацию о несостоявшихся событиях: о том, что Джон не получил сосисок, не оплатил счет и т. п. Репрезентация рассказа—это последовательная цепочка событий, о которых шла речь выше. Проблема здесь состоит именно в том, что мы просим указать причины действий, которые не имели места, между тем как репрезентация не содержит информацию о ,,не-действиях". Одно возможное решение этой проблемы заключается в том, чтобы рассмотреть репрезентацию также и для тех событий, которые ,,противоречат" указанным действиям. Например, когда мы пытаемся ответить на вопрос ,,Почему официантка не подала Джону горячих сосисок?", не исключено, что мы считаем действия „принести Джону горячие сосиски" и „принести Джону бифштекс по- гамбургски" взаимоисключающими. Следовательно, последнее действие заменяет первое, и мы могли бы ответить на вопрос таким образом: „Потому что официантка подала Джону бифштекс по- гамбургски". Однако будет ли этот ответ наилучшим? Действительно ли имеет смысл утверждать, что официантка не подала горячие сосиски потому, что она вместо них принесла бифштекс? Никакой реальной причинной связи между этими двумя событиями или событием и не-событием нет. Но что еще более важно, так это то, что при таком подходе мы часто вообще не можем дать никакого ответа на вопрос. Пусть в процессе поиска „взаимоисключающих" действий нам удается определить, что бифштекс принесли вместо горячих сосисок, но что произойдет, если мы попытаемся подобным образом получить ответ и на второй вопрос: „Почему Джон не стал есть бифштекс по-гамбургски?"? Какому действию в репрезентации рассказа противоречит этот вопрос? Такого, связанного с едой действия, которое бы противоречило поеданию бифштекса, просто не существует. Хотя допустимыми ответами здесь будут „Потому что Джон рассердился" или „Потому что бифштекс был пережарен", вряд ли можно считать эти события „противоречащими" тому, что 276
бифштекс съеден. Аналогично обстоит дело и с последним вопросом ,,Почему Джон не оплатил счет?". Ведь получение пережаренного бифштекса и гнев по этому поводу отнюдь не всегда приводят к неоплате ресторанных счетов. Иногда проникновение в существо процесса достигается путем анализа ситуаций, возникающих в случае, если последний прерывается. Рассмотрим, что случится, если мы зададим вопрос ,,Почему Джон не переплыл озеро?". Вопрос этот попросту бессмыслен. Он мог бы быть осмысленным, если бы только по ходу рассказа возникла гипотеза о том, что Джон купается в озере или плывет через озеро. Вообще о ненаступившем событии имеет смысл спрашивать только тогда, когда в какой-то момент времени существовала возможность (или вероятность) его наступления, если известно при этом, что весь ход событий был иным, чем в действительности. Поэтому ответы на такого типа вопросы требуют рассмотрения гипотез, возникающих в процессе понимания текста. Когда человек читает рассказ, у него появляется огромное количество гипотез о том, что, скорее всего, произойдет дальше или о чем ему далее будет сообщено. Хотя некоторые из них запоминаются (например, то, что Джон в конце концов не дворецкий или другое высокопоставленное лицо), большинство гипотез относится к информации самого поверхностного уровня (так, если Джон заказывает горячие сосиски, вы ожидаете, что он будет их есть). Подобные гипотезы поверхностного уровня обработки текста не следует включать в его представление памяти, когда происходит процесс понимания, поскольку это может привести к переполнению памяти. Совсем не нужно хранить в памяти те гипотезы, которые относятся к поверхностному уровню и выводятся на основании самых обычных знаний о мире: всякая такая гипотеза легко может быть реконструирована, если в этом возникнет необходимость. Когда же задается вопрос о событии, которое не наступило, то поиск, осуществляемый в памяти, не может основываться только на информации, содержащейся в репрезентации текста: должны быть реконструированы гипотезы, которые возникают по мере прочтения рассказа с тем, чтобы дальше их можно было анализировать. Для реконструкции таких гипотез репрезентация текста подвергается исследованию на предмет выявления в ней точек интерференции. А именно, выделяются те места в рассказе, где речь идет о событиях в какой-то степени неожиданных. Точки интерференции — это места, где происходит смена гипотез. До одной из таких точек у нас был один набор гипотез, а в ней этот набор сменяется другим. Поэтому мы идем по тексту до тех мест, которые предшествуют точкам интерференции, и восстанавливаем гипотезы, предполагая, что рассказ кончился именно в данном месте. В сущности, мы строим новый рассказ и производим его обработку. Когда рассказ заканчивается раньше времени, мы, исходя из наших знаний о мире, делаем выводы о том, какие события с наибольшей вероятностью произошли дальше в рассказе. Благодаря этим выводам, которые заканчивают незаконченные истории, удается восстановить гипоте- 277
зы, сделанные в то время, когда читался первоначальный текст рассказа. В нашем модельном рассказе есть две точки интерференции: место, когда официантка говорит Джону, что у них нет горячих сосисок, и момент, когда Джон обнаруживает, что его бифштекс пережарен. Действие, предшествующее первой точке,— это действие, состоящее в том, что ,,Джон заказывает столик". Поэтому мы, пользуясь тем, что мы знаем, каков обычный этикет в ресторане, ,,заканчиваем" рассказ, в котором Джон входит в ресторан, получает от администратора меню и заказывает горячие сосиски. Мы заканчиваем рассказ в том смысле, что порождаем цепочку вымышленных событий, которые, по нашему мнению, произойдут в рассказе дальше. Эта цепочка событий, порождаемая в данном месте рассказа, включает в себя следующие события: официантка приносит Джону горячие сосиски, Джон съедает горячие сосиски, получает счет, оплачивает его и уходит из ресторана. Аналогичным образом порождается и цепочка вымышленных событий с того места в представлении рассказа, когда официантка приносит Джону бифштекс по-гамбургски. Ср.: Джон входит в ресторан; Джон садится за столик; Джон получает меню от администратора; Джон заказывает горячие сосиски [Официантка приносит Джону горячие сосиски; Джон съедает горячие сосиски; Джон получает счет; Джон оплачивает счет; Джон уходит из ресторана]; Официантка говорит ему, что у них нет горячих сосисок; Джон заказывает бифштекс по-гамбургски; Официантка приносит Джону бифштекс по-гамбургски [Джон съедает бифштекс; Джон получает счет; Джон оплачивает счет; Джон уходит из ресторана]; Бифштекс пережарен; Джон сердится; Джон покидает ресторан. При изучении таких цепочек мы обнаруживаем те несовершивши- еся действия, о которых идет речь в наших вопросах. Коль скоро каждое такое действие содержится в цепочке, мы можем ответить на заданный вопрос, идя по ней назад до места ветвления основного пути и далее от точки интерференции или от неожиданного события по основному пути. Так мы получаем ответы на вопросы 23 и 24: В23: Почему официантка не принесла Джону горячие сосиски? 023: Потому что она сказала Джону, что у них сосисок нет. В24: Почему Джон не стал есть бифштекс по-гамбургски? 024: Потому что бифштекс был пережарен. Что же касается последнего из трех вопросов, то действие ,,Джон оплачивает счет" входит в обе цепочки вымышленных событий. Когда такое бывает, то в поиске ответа на вопрос мы проходим назад по последней (недавно построенной) цепочке. Кроме того, следует отметить, что событие ,,оплата счета" имеет большую вероятность, чем события ,,Официант приносит горячие сосиски" или ,,Джон ест бифштекс по-гамбургски". (Объяснение того, как это удается узнать, см. в Lehnert, 1976.) Отсюда следует, что было бы 278
в высшей степени неожиданным, если бы событие „Джон оплачивает счет" не наступило. При ответах на вопросы следует руководствоваться принципом, который звучит приблизительно следующим образом: чем более неожиданно событие, тем больше требуется информации для удовлетворительного объяснения причины его наступления. Поэтому устройство, осуществляющее поиск ответа на поставленный вопрос, ищет не только точки интерференции гипотез, но также связанные с выдвинутыми гипотезами решения, принятые субъектом, и возможные негативные изменения его ментальных и психических состояний. В25: Почему Джон не оплатил счет? 025: Джон рассердился, потому что бифштекс, который ему принесли, был пережарен, и поэтому он покинул ресторан. V. выводы Вопросно-ответные диалоги предполагают семантический анализ на разных уровнях обработки текста. Мы рассмотрели ряд трудностей, которые появляются на трех уровнях—социального контекста, уровнях языковой обработки и поиска информации в памяти. Обсуждаемые здесь проблемы возникли при построении вычислительной системы, способной понимать тексты рассказов и демонстрировать свое понимание, отвечая на вопросы по тексту. Способность отвечать на самые разные вопросы в разнообразных контекстах обычно относят к разряду тривиальных умений человека. Однако когда вы пытаетесь создать интеллектуальную вычислительную машину, моделирующую эту или сопоставимую с ней способность, то сразу начинаете понимать, сколь нетривиальным в действительности является это умение. Одной из целей языковой обработки текста является создание в недалеком будущем компьютера, способного вести свободный диалог с человеком. Движение по направлению к этой цели предполагает решение следующих важнейших задач. 1. Большая часть знаний о мире должна быть организована в памяти таким образом, чтобы в ней при необходимости можно было легко найти всю релевантную информацию. Чтобы компьютер мог понимать естественный язык и порождать тексты на этом языке, он должен иметь некоторые знания о том, что говорится. 2. В компьютере должна быть определенным образом отражена теория языковой коммуникации людей. Прежде чем компьютер сможет принять участие в диалоге, он должен знать, что представляет собой диалог. Первая из этих задач стала основной для всей области искусственного интеллекта вообще. Отсюда большое число исследователей, которые в настоящее время заняты проблемой организации и представления в памяти знаний о мире (см. работы Bobrow and Collins, 1975; Norman and Rumelhart, 1975; Schank and Abelson, 1976). Вторая задача пока не столь актуальна, как первая, 279
поскольку многое еще предстоит сделать прежде, чем она станет первоочередной. Верно также и то, что довольно общую систему (типа общего ,,понимателя рассказов") можно построить без введения в нее полной теории диалога. Построение общей системы, которая понимала бы рассказы и умела отвечать на все вопросы так, как если бы все эти вопросы были СПРАВОЧНЫМИ и требовали ИНФОРМАТИВНЫХ ответов в контексте демонстрации знания, явилось бы весьма впечатляющим достижением в сфере естественноязыковой обработки информации. В рамках такой общей системы ответы на вопрос образуют исключительно важный и полезный полигон для изучения широкой области семантической обработки информации, которая необходимо присутствует при человеческом общении. Анализируя рассказы самого общего содержания без ограничений на области знаний, мы непосредственно подходим к проблеме организации знаний о мире. Рассматривая множество всех вопросов, которые могут быть заданы по поводу рассказа, приходится иметь дело с разного рода СПРАВОЧНЫМИ вопросами на уровнях языковой обработки и поиска информации в памяти. Поскольку такое устройство, понимающее рассказы, имеет довольно общий характер, можно надеяться, что принципы, с успехом примененные при его разработке, могут быть распространены и на другие, более масштабные задачи. ЛИТЕРАТУРА Bobrow and Collins, 1975 = Bobrow, D. G. and Collins, A. M. Representation and Understanding. New York: Academic Press, 1975. Lehnert, 1975a = Lehnert, W. What Makes SAM Run? Script-based techniques for question answering.— In: ,,Proceedings for Theoretical Issues in Natural Language Processing". Cambridge, Mass., 1975. Lehnert, 1975b = Lehnert, W. Question Answering in a Story Understanding System. (Department of Computer Science Research Report # 57.) New Haven: Yale University Press, 1975. Lehnert, 1976 = Lehnert, W. Human and computational question answering.— ,,Cognitive Science", 1, 1976. Norman, Rumelhart, 1975 = Norman, D. A. Rumelhart, D. E., and the LNR Research Group. Exploration in Cognition. San Francisko: W. H. Freeman, 1975. Schank, 1975a = Schank, R. C. Conceptual Information Processing. New York: American Elsevier, 1975. Schank, 1975b = Schank, R. C. The Structure of Episodes in Memory.— In: D. G. Bobrow and A. M. Collins (eds.). Representations and Understanding. New York: Academic Press, 1975. Schank and Abelson = Schank, R. C, and Abelson, R. P. Knowledge Structures. Hillsdale, New Jersey: Erlbaum Associates (в печати). Schank at all., 1975 = Schank, R. C, et al. SAM—A story understander. (Department of Computer Science Research Report #43.) New Haven: Yale University Press, 1975. Shortliffe, 1974 = Shortliff e, E. H. MYCIN: A Rule-Based Computer Program for Advising Physicians Regarding Antimicrobial Therapy Selection. (Stanford Artificial Intelligence Laboratory Memo-AIM251 Stanford University.) Stanford, Calif., 1974. Winograd, 1972 = Winograd, T. Understanding Natural Language. New York: Academic Press, 1972. Woods, Kaplan, and Nash-Webber, 1972 = Woods, W. A., Kaplan, R. M., and Nash-Webber, B. The Lunar sciences natural language information system: final report.—In: „BBN Report" No. 2378. Cambridge, Mass.: Bolt Beranek and Newman, 1972.
M. Минский ОСТРОУМИЕ И ЛОГИКА КОГНИТИВНОГО БЕССОЗНАТЕЛЬНОГО * Краткое содержание« Теория остроумия, предложенная Фрейдом, объясняет, как с помощью острот можно обойти ,,ментальных цензоров", не разрешающих думать о „запретных" вещах. Прекрасно работая в целом ряде случаев, теория Фрейда тем не менее не может служить для объяснения сущности острот-бессмыслиц. В настоящей статье я стараюсь показать, что между различными видами юмора можно обнаружить гораздо большее родство, если принимать во внимание важность знания о знании и те особенности мышления, которые связаны с распознаванием и подавлением бесполезных и непродуктивных мыслительных процессов. Будучи рассмотрены с этой точки зрения, многие шутки, внутренняя природа которых на первый взгляд кажется непостижимой и таинственной, становятся более понятными. ВВЕДЕНИЕ Человек зашел в кондитерскую и попросил дать ему пирожное. Однако он тут же вернул его обратно и попросил взамен рюмку ликера. Он выпил ликер и, не заплатив, направился к выходу. Владелец кондитерской остановил его: ,,Вы не заплатили за ликер".— ,,Но ведь я же отдал за него пирожное".— ,,Но вы не заплатили и за пирожное".— „Так я же его не ел". Из Фрейда (1905) [0] Фрейд, говоря о своем намерении исследовать и описать различные виды острот, приводит только что процитированную нами шутку и задает себе вопрос, действительно ли она является шуткой, «ведь нам неизвестно, каковы именно характеристики истинных острот». Легко заметить, что шутки, подобные ,,случаю в кондитерской", являются логически абсурдными (не будем обсуждать, что именно абсурдно—сама логика или буквальное следование ей). Чуть дальше Фрейд приводит другую шутку: «нож без рукоятки». Ее абсурдность иного рода. Здесь налицо неправильное использование образа — это как бы рама без картины. Фрейд, написав в 1905 г. книгу, посвященную теории остроумия [0], больше уже не возвращался к этой теме. В своей книге он выдвинул предположение, что внутренние „цензоры" формируют прочные, хотя и неосознаваемые нами барьеры, которые препятствуют возникновению „запретных" мыслей. Когда с помощью острот * Marvin Minsky. Jokes and the logic of the cognitive unconscious.— In: „Cognitive Constraints on Communication". (Ed. by L. Vaina and J. Hintikka). Dordrecht, etc.: Reidel, 1984, p. 175—200. © 1980 by Marvin Minsky. 281
удается обойти этих цензоров, человек испытывает удовольствие от внезапного высвобождения психической энергии, которая выплескивается в виде смеха. Теория Фрейда объясняет, почему остроты обычно сжаты, компактны и имеют двойной смысл. Это нужно для того, чтобы обмануть по-детски простодушных цензоров, которые видят только поверхностный, совершенно невинный смысл шуток и не могут распознать скрытые в них запретные желания. К сожалению, рассуждения Фрейда не столько хорошо прилагаются к остротам-бессмыслицам, как к случаям отражения в шутках человеческой агрессивности и сексуальности0. В настоящей статье я постараюсь продемонстрировать, что различные проявления юмора могут оказаться существенно более близки между собой, стоит только обратиться к рассмотрению характерных особенностей рассуждения на уровне здравого смысла. Мои основные тезисы таковы: 1. Логика здравого смысла зачастую оказывается ненадежной. Поскольку исправить ее не в наших силах, то мы должны хотя бы научиться обходить наиболее часто встречающиеся опасные моменты. Большую помощь в этом оказывает нам юмор. 2. Недостаточно просто уметь замечать ошибки в рассуждениях, надо уметь их предвидеть и предупреждать. Наше знание того, как это сделать, и формирует ,,цензоров", которые подавляют непродуктивные ментальные состояния. Вот почему юмор так тесно связан с запретными темами. 3. Продуктивность мышления зависит от умения пользоваться Аналогией и Метафорой. Однако аналогии часто бывают неправильными, а метафоры вводят в заблуждение. Следовательно, в задачу ,,когнитивного бессознательного" входит также подавление или запрещение неприемлемых сравнений. Вот почему юмор так тесно граничит с бессмысленным. 4. Интеллектуальные неудачи всегда связаны с мышлением конкретного человека, а неудачное социальное поведение обязательно затрагивает других людей. Однако Интеллект и Аффект покажутся нам не столь различными, если мы осмелимся предположить, что „когнитивное бессознательное" расценивает ошибочные рассуждения как столь же недостойное, что и описанные Фрейдом скрытые желания. 5. Юмор социален по своему происхождению. С помощью юмора можно обезоруживающим образом указать окружающим на неподобающее поведение или на неправильный способ рассуждения. Подобная двойственность юмора существенно усложняет его рассмотрение. В выдвигаемой нами теории подчеркивается важность знания о знании и особенно важность тех аспектов мышления, которые связаны с распознаванием и подавлением ошибочных и противоречивых, а следовательно, и непродуктивных мыслительных процессов. Рассмотренные с этой точки зрения многие шутки, внутренняя природа которых на первый взгляд кажется непостижимой и таинственной, становятся более понятными1. 282
I. ПРОБЛЕМЫ РАССУЖДЕНИЯ НА УРОВНЕ ЗДРАВОГО СМЫСЛА Если вы скажете ребенку: „Сейчас я говорю неправду", тогда, если ребенок уже способен рассуждать, он может подумать: „Если это ложь, тогда неверно, что он говорит неправду. Значит, он говорит правду. Однако это должно быть ложью, ведь он сам говорит об этом. Но тогда..." И так до бесконечности. Ребенку эта ситуация может не понравиться по нескольким причинам. Во-первых, потому, что здесь подвергается сомнению тот принцип, что суждение всегда или истинно, или ложно, а это угрожает серьезными последствиями всей структуре имеющихся у ребенка знаний, поскольку может повлечь появление других неприемлемых рассуждений, когда не происходит никакого движения вперед и мысль ходит по кругу, вновь и вновь возвращаясь в исходное состояние2. Рассуждения на уровне здравого смысла могут быть ошибочными во многих отношениях: ошибочными могут быть исходные представления, ошибки могут совершаться при переходе от одного суждения к другому, разум может погрязнуть в бессмысленных и бесцельных блужданиях. Но прежде чем обратиться к рассмотрению указанных проблем, давайте посмотрим, что же в действительности происходит, когда мы произносим фразу типа „Мое утверждение ложно". Слушающий вначале нередко теряется, затем сосредоточивается и вдруг начинает смеяться. „Отлично,— говорит он,— скажи мне что-нибудь еще в этом же роде". Проблема Истины. Откуда мы знаем, с чего начать? Выводы, полученные в результате пусть даже самого правильного рассуждения, не могут быть лучше, чем посылки, из которых мы исходили. Для такой науки, как математика, все это не представляет большого интереса (поскольку математику больше интересует не то, откуда берутся посылки, а то, что из них следует). Что же касается нашей реальной жизни, то необходимо отметить, что здесь абсолютно достоверным является весьма ограниченное число суждений. Что должен делать человек, когда тот или иной „факт", который раньше никогда не вызывал у него сомнения, вдруг оказывается ложным? Моя маленькая дочь однажды была крайне поражена, когда увидела декоративную вазу в виде рыбы, но с четырьмя короткими ножками. Немного подумав, она произнесла с оттенком неуверенности: „А вот у некоторых рыб ножек нет". Мы никогда не можем знать что-либо наверняка точно. Что делать человеку, если в ходе рассуждения он приходит к заключению, которое представляется ложным? Усомниться в истинности всех исходных представлений? А если какое-либо представление, использовавшееся нами в течение длительного времени, оказалось ложным, нужно ли отказываться от всех тех выводов, которые были сделаны из него? Если человек однажды солгал, нужно ли подвергать сомнению все когда-либо сказанное им? Для всех этих случаев не существует одного, раз и навсегда установленного правила: каждый должен выработать собственные приемы обращения со знаниями о своем знании [1]. 283
Откуда берутся Правила Умозаключений? Откуда мы знаем, как правильно делать умозаключения? Многие люди считают, что если большинство А являются В, а большинство В являются С, то большинство А являются С. Несмотря на то что этот вывод в общем случае неверен, он имеет значительную эвристическую ценность, особенно для детей, которые еще не столкнулись с большим количеством исключений. Если смотреть с позиций психологии, то я не вижу большой разницы между эвристическим и логическим рассуждением: дедукция является просто ,,одним из" возможных способов доказательства. Действительно, мы соглашаемся с выводом, полученным путем дедукции, только тогда, когда в пользу этого вывода говорят и другие основания. Было время, когда философы считали, что безошибочность „законов мышления" является чем-то априорным, внутренне присущим самой природе мышления. За последние сто лет вера в правильность такого взгляда дважды была подвергнута суровому испытанию. Первый раз — когда Рассел и его последователи убедительно продемонстрировали, что наша логика может быть ошибочной. А затем — когда Фрейд и Пиаже показали, что развитие человеческого мышления представляет собой сложный и запутанный процесс. Рассел заметил, что такой на первый- взгляд невинный вопрос, как ,,Бреет ли брадобрей самого себя, если он бреет только тех, кто не бреется сам?", является на самом деле серьезным препятствием для формализации логики здравого смысла. Рассел и ряд других ученых пытались разработать новые формальные системы, которые, устраняя возможность рефлексивности и самонаправленности, исключали бы возможность появления подобных парадоксов*. Однако предлагаемые альтернативные варианты были слишком сложны для обыденного использования. Вообще-то я не очень верю в то, что нечто формально-логическое могло бы служить хорошей моделью человеческого мышления. (Работа Хьюитта и Корнфельда [2] содержит некоторое компромиссное решение.) Особенно я сомневаюсь в том, чтобы логика, запрещающая рефлексивность и самонаправленность, могла бы являться адекватной для психологии: мышление нельзя считать достаточно развитым, если оно не способно обращаться к анализу самого процесса мышления. Без рефлексивности и самонаправленности задача формирования самосознания была бы намного затруднена, ибо, как я себе представляю, самосознание предполагает по крайней мере некоторую способность думать о том, что оно само делает3. Хотя Рассел и лишил нас надежды на создание абсолютно надежного варианта логики здравого смысла, но мы все же можем задаться целью найти те островки «логической последовательности и * В книге ,,Принципы математики" Рассел и Уайтхед, стремясь избежать парадоксов, возникающих в тех случаях, когда определяемое множество содержит само себя в качестве элемента, ввели следующее требование: «То, что содержит все элементы множества, не может быть элементом того же множества».— Прим. перев. 284
непротиворечивости», оставаясь в границах которых наше обыденное рассуждение будет правильным. Ставя таким образом перед собой задачу создать теорию большей объясняющей силы, мы намеренно суживаем область исследования, отвлекаясь от рассмотрения тех (по-видимому, немногочисленных) видов выражений, которые ведут к парадоксам и противоречиям,— не теряя при этом надежды, что со временем нам удастся объяснить и их. Многие, наверное, слышали рассказ о знаменитом математике, который, испугавшись того, что если он сделает еще один шаг, то его рассуждение может привести к парадоксу, воскликнул: «Тогда я не буду делать этого шага»4. Возможно, кто-то, не поняв истинного смысла этой шутки, не примет ее всерьез. А ведь в этой шутке содержится указание на то, что мы ориентируем наше мышление на выполнение двух взаимосвязанных задач: Мы стремимся найти островки „логической последовательности и непротиворечивости", в границах которых рассуждению, которое основывается на здравом смысле, ничто не угрожает; Мы стремимся, помимо того, выявить и зафиксировать границы таких „островков безопасности". В высокоразвитых обществах принято заботиться о том, чтобы на дорогах были знаки, предупреждающие водителей об опасности, чтобы зимой на реках стояли щиты, предупреждающие о том, что лед тонок, и т. д. Пусть это не покажется странным, но философы и математики выполняют во многом сходную функцию: они находят примеры, подобные парадоксам брадобрея, черепахи или лжеца, которые говорят нам о том, где нужно остановиться ... и рассмеяться. Я склонен считать, что, когда подобные примеры инкорпорируются в мышление, они образуют интеллектуальные аналоги фрейдовским эмоциональным цензорам. Принятие этой точки зрения помогает объяснить, почему чисто логический нонсенс имеет такую же юмористическую окраску, как и двусмысленные шутки. Кстати сказать, эта проблема интересовала и самого Фрейда. ,,Случай в кондитерской" напоминает нам — пусть в весьма неопределенной форме,— что следует избегать логического абсурда для того, чтобы не причинять вреда своему мышлению. Отсюда следует, что поскольку у нас нет известного способа научиться обходить все непоследовательности и противоречия здравого смысла, то каждый из нас должен суметь составить свой личный набор ,,когнитивных цензоров", чтобы потом всегда можно было вовремя распознать и избежать тех логических ошибок, с разновидностями которых нам уже приходилось встречаться. Эвристический Контроль за Логикой. Откуда мы знаем, какой сделать следующий шаг? Однажды я давал консультацию ученику средней школы, который отстал по геометрии. Я объяснил, что такое аксиомы, и рассказал о принципах построения доказательства теорем. «Раньше мне было непонятно, а теперь я все понял,— сказал 285
мальчик.—Просто я болел и пропустил тот день, когда учитель объяснял, как надо доказывать теоремы». Недостаточно просто знать принципы построения рассуждений, надо знать, как их применять. Каждому из нас известны миллионы фактов и, возможно, миллионы правил вывода. Но что из них когда и к чему применять? Основная проблема здесь—проблема направленности. Нельзя допустить, чтобы человек бессмысленно делал бесчисленное количество выводов, безупречных с логической точки зрения, но не направленных ни к какой конечной цели. Итак, мышлению нужен какой-то „план". Кроме того, нужно исключить движение по кругу, то есть постоянное возвращение в одно и то же состояние. И наконец, во избежание полного хаоса в мышлении мы нуждаемся в структуре, которая бы осуществляла общее руководство и фиксировала, что делает рассудок и почему. Недавно возникшая наука, носящая название „искусственный интеллект", имеет дело именно с вопросами продуктивности и эффективности мышления—проблемами, редко затрагиваемыми в логике и философии. Эти науки заняты не выяснением того, откуда берутся доказательства, а проверкой того, какие доказательства правильны и какие аргументы действенны. В работах по искусственному интеллекту уже немало было сказано о том, как может мышление избежать путаницы и бесцельного блуждания путем планирования и постановки целей технических приемов, обеспечивающих продвижение вперед. Построенные с учетом этих методов некоторые современные программы для вычислительных машин могут успешно справляться с рядом очень сложных ситуаций. Однако поскольку мы хотим построить машины, способные с целью формулировки новых задач обращаться к самим себе, то проблема бесцельного блуждания определенно должна возникнуть вновь. Поиск „более высокой цели" всегда связан с разрешением следующего парадокса: человек может решить, какая цель достойна, только тогда, когда он уже знает, какая цель достойна. Каким образом человек может определить, что на вопрос дан правильный ответ, если он не знает, как правильно ответить на этот вопрос? Родители избегают подобных проблем и ориентируют детей на то, что не стоит обращать на них внимание. Мы приучаемся подавлять подобные рассуждения и даже не думать о них. Мы уходим от ответа на наиболее важные вопросы, по привычке воспринимая их как бессмысленные; ср. шутку: „Жизнь похожа на мост".— „Чем именно?"—„Откуда я знаю?" Подобные вопросы лежат за пределами разумного, и, скорее всего, Эволюция, а не Разум определит, кто же ответит на них. П. ЦЕНЗОРЫ Система табу регулирует социальную деятельность человека, запрещая определенные формы поведения. Это же относится и к мыслительной деятельности. Лучший способ научить ребенка не 286
совершать плохих поступков — научить его даже не думать об этом. Но не будет ли это похоже на попытки ,,не думать об обезьяне"? Сравним два возможных пути: (i) подавить мысль, которая уже возникла в сознании, и (ii) предупредить возникновение этой мысли: (i) Перестань думать об этом! (ii) Никогда не думай об этом! Создание цензора (0-типа не является сложным: надо подождать, пока не будет осуществлено какое-то ,,плохое" действие или поступок, а потом запретить его. Но где гарантия, что оно не повторится? Приступить к формированию цензора (ii)-типа, похоже, более сложно, ведь этот цензор должен быть способен распознавать мыслительные процессы, предшествующие возникновению подвергнутых запрету мыслей. Дальнейшая работа цензора представляется более понятной: поскольку мыслительные процессы, предшествующие появлению запрещенной мысли, обычно связаны с некоторым набором возможных действий, то запрещение одного из них еще не означает автоматического пресечения других. Давайте подробнее остановимся на цензорах второго типа. Итак, наши цензоры должны уметь распознавать ментальные процессы и состояния, предшествующие появлению самих подлежащих запрету действий. Для этого нужна кратковременная память (чтобы помнить, что сейчас произошло) и долговременная память (для хранения результатов обучения). Объем последней может значительно увеличиваться, поскольку не исключено, что запретное действие может быть связано с различными Мыслями- Предшественницами. Ясно, что опытный цензор (ii)-типа способен на основе ситуации распознать находящуюся в его компетенции шутку, не дожидаясь ее конца или доведения до абсурда, тогда как цензор (О-типа заставляет выслушать всю шутку полностью. Только после этого человек может заявить, что он эту шутку уже слышал. Чтобы наша теория была более понятной, давайте рассмотрим ,,двухуровневую" модель мозга. Сенсорные и двигательные системы, контролируемые ,,А-мозгом", связаны с окружающим миром. „В- мозг" связан с А таким образом, что В может наблюдать ,,А- состояния" и регулировать деятельность А. В может ,,видеть", что происходит внутри А, и каким-то образом влиять на это. Что касается А, то оно может ,,видеть" и влиять на то, что происходит в окружающем мире. В не должно—и, возможно, не способно— знать, что означают имеющие отношение к внешнему миру ,,А- события"; в задачу В входит спецификация метапсихологических характеристик А, выражающаяся, например, в фиксации того, что ,,А-мозг" «блуждает без цели, ходит по кругу или окончательно запутался»5. Роль В-цензора состоит в пресечении нежелательной активности А-мозга. (Было бы желательно, чтобы В на основе прошлого опыта мог вспомнить, как лучше для А действовать в той или иной конкретной ситуации, однако рассмотрение этого вопроса выходит за 287
рамки настоящей статьи.) Суть дела состоит в том, что упреждающие цензоры способны выполнять свою работу до того, как действительно возникнут проблемы, которые они призваны устранять. Возможно также, что они делают свое дело так быстро и ненавязчиво, что остаются незаметными. Это в какой-то мере отвечает на вопрос, почему цензоры принадлежат бессознательному. Теория цензоров помогает объяснить, почему старая шутка уже не кажется такой смешной: это происходит в силу того, что был создан соответствующий новый цензор или расширен старый. Фрейд считал ,,новизну" важным компонентом юмора, но он, однако, никогда не обращался к вопросу о том, почему ранее слышанные остроты уже не кажутся особо смешными. Я полагаю, что просто в силу очевидности Фрейд посчитал ненужным оговорить, что цензоры постоянно совершенствуются и расширяются. Какой по объему должна быть цензорская память, чтобы она могла защитить нас от наивных ошибок в рассуждениях? Для формальной логики эта память, вероятно, не будет слишком большой, ведь с новыми парадоксами мы сталкиваемся крайне редко. Но, для того чтобы избежать бессмыслицы в целом, нам нужны миллионы цензоров. Не исключено, что на долю этого „отрицательного мета-знания" (знания о тех моделях рассуждения и вывода, которые были признаны дефектными или даже вредными) приходится большая часть из того, что мы вообще знаем. Рассмотрим такие виды человеческой активности, как игра (play) и деятельность (practice). Не отличаясь большой глубиной, бихевиористская психология при анализе усвоения человеком нужных моделей поведения не рассматривала игры вообще, а деятельность трактовала как доведенные до автоматизма реакции на те или иные стимулы. Однако я убежден, что деятельность зачастую далека от повторения и улучшения одной и той же модели: она часто носит поисковый характер и бывает направлена на тестирование тончайших вариаций и отклонений в нашем поведении и выявление того, какие из них следует закрепить, а какие подавить. Сходным образом игры (которые нередко совершенно напрасно рассматриваются как „просто игры") также нередко используют широкомасштабную вариативность возможных форм поведения. Можно назвать и другие виды повседневной человеческой активности, которые помогают нам научиться избегать ошибок и небезопасных заблуждений. Я знаю ребенка, чье чувство юмора тяготеет к шуткам типа „Что было бы, если бы ложка была резиновой?" При этом ребенок прекрасно понимает, что резиновая ложка—это полнейшая нелепость, потому что такой ложкой ничего нельзя донести до рта. Закрепляет ли он тем самым такое свойство фрейма „ложки", как „быть негнущейся", или же блокирует с помощью цензора формирование такого фрейма ложки, у которого указанное свойство отсутствует? Детские шутки также нуждаются в более внимательном изучении. 288
III. ЗНАЧЕНИЕ И МЕТАФОРА Два крестьянина решили поохотиться на птиц. Взяв ружья и собак, рано утром они отправились в путь. Дело уже шло к вечеру, но удачи все не было. ,,Послушай,— сказал один из них,—должно быть, мы делаем что-то неправильно". ,,Возможно,— согласился другой.— Собак, наверное, надо повыше подбрасывать". Когда вам надо закрутить шуруп и вы ищете для этой цели отвертку, вам нужна именно отвертка, то есть предмет, который предназначен для выполнения определенной функции. В случае необходимости вы могли бы ,,увидеть" в этой отвертке нож с затупленным концом и даже молоток. Когда мы распространяем на предметы свои «ожидания», мы «путаем вещи [принимая одну вещь за другую]». Как отмечал Кожибский [3], «какой бы ни была вещь, она не является таковой»6,7. Фреймы. В работе [4] я высказал предположение, что разум обычно интерпретирует данные восприятия в терминах ранее приобретенных и предназначенных для описания структур — фреймов. Фрейм—это один из способов представления стереотипной ситуации, например пребывание в какой-нибудь комнате, посещение вечеринок и т. п. С каждым фреймом связана информация разных видов: одна, относящаяся к использованию данного фрейма, другая, предупреждающая о том, что может произойти дальше, третья, предписывающая, что следует предпринять, если эти ожидания не подтвердятся, и т. д. Теория фреймов была разработана с целью объяснить скорость человеческого восприятия и мышления, а также фактическое отсутствие поддающихся наблюдению ментальных явлений, сопровождающих эти процессы. Сейчас я хочу остановиться на этой теории лишь в той мере, в какой это необходимо для объяснения ряда особенностей процесса мышления и некоторых его ошибок и сбоев. После этого мы сможем вернуться к принадлежащим к сфере бессознательного цензорам и к коррекции ошибок. Каждый фрейм в числе прочих элементов содержит множество терминалов, к которым присоединяются другие фреймы. Так, фрейм стула содержит информацию о том, что стул (определенного вида) имеет сиденье, спинку и четыре ножки. Однако названные части стула подлежат описанию не в самом фрейме стула, а во фреймах, присоединенных к его терминалам. У каждого фрейма есть также набор характеристик, обладающих следующим свойством: наличие достаточного количества этих характеристик может привести к активации фрейма в целом. Так, например, если вы видите некоторые из частей стула, то они могут активировать один из имеющихся у вас фреймов, который в свою очередь активирует присоединенные к терминалам субфреймы. Эти субфреймы и проводят ,,поиск" тех частей стула, которые вы не смогли идентифицировать сразу в силу того, что они необычны, частично скрыты от взгляда и т. д. И наконец, даже если некоторые элементы, предусмотренные фреймом, будут совершенно недоступны наблюдению (человек, например, редко видит одновременно все ножки стула и 19-1182 289
никогда—все стороны ящика), эти недостающие элементы будут восстановлены ,,по умолчанию". Подобная операция не является сложной, поскольку в обычном состоянии основная часть терминалов большинства фреймов заполнена субфреймами, которые можно назвать приписываемыми по умолчанию (default assignment). Когда человек читает про какой-то ботинок или стул, то соответствующие фреймы помогают ,,по умолчанию" воссоздать определенный образ ботинка или стула. ,,Умолчание" играет важную роль и в ряде других случаев. Когда вы, например, смотрите на сидящего человека, то даже если стул, на котором он сидит, полностью скрыт от вашего взгляда, вы все равно ,,видите" этот стул. Если специально не привлечь ваше внимание к этому факту, вы никогда и не заметите фактическое отсутствие стула в поле зрения. Данное явление объясняется тем, что фрейм ,,сидеть" требует заполнения терминала субфреймом ,,на чем-то", и все это присоединяется к некоторому „типичному" фрейму стула ,,по принципу умолчания"8. Надо сказать, что выбор фрейма стула может варьировать в зависимости от наблюдаемой ситуации. Характеристики, восстанавливаемые ,,по умолчанию", слабы и легко могут быть заменены другими. Так, например, если около сидящего человека стоят еще несколько стульев, мы вправе предположить, что стул, на котором сидит человек, похож на остальные. Если мы видим человека в парке, то „приписываемым по умолчанию" может стать фрейм парковой скамейки. Но стоит нам заметить ручку кресла, как слабо закрепленный фрейм скамейки будет заменен другим, более подходящим,—и в результате мы ,,увидим" кресло. Согласно теории, изложенной в [4], этот процесс происходит очень быстро, ибо ряд терминалов соотносимых фреймов уже заранее связан между собой, что существенно облегчает изменение неудачной интерпретации и коррекцию „обманутого ожидания". Переход от одного фрейма к другому происходит быстро, естественно и в силу этого недоступен для интроспекции. Вот почему мы так легко опознаем стул как „стул", хотя стулья могут очень сильно отличаться друг от друга. Я вовсе не хочу сказать, что это происходит как бы по мановению волшебной палочки: формирование системы взаимосвязанных фреймов осуществляется в течение всей жизни человека и определяется приобретением им соответствующего опыта. В работе [5] я показал, что новые фреймы обычно возникают на основе пересмотра старых с сохранением общих для них терминалов. В работе [6] содержится более детальное описание, но здесь от читателя требуются дополнительные усилия [т. е. он должен суметь сам вычленить нужную информацию], поскольку там принята другая (не фреймовая) терминология. Фреймы и системы фреймов используются как на концептуальном, так и на перцептивном уровнях. Кроме того, существует еще один вид систем фреймов—так называемые семейства взаимосвязанных фреймов, трансформации внутри которых происходят не так легко и, следовательно, более заметны для наблюдения. Рассмотрим, 290
например, интересовавший Витгенштейна вопрос об определении значения слова „игра" [7]. Поскольку не существует какого-либо свойства, одинаково общего всем играм, то определить значение этого слова обычным образом не удается. Действительно, отнюдь не для каждой игры нужен мяч, не обязательно нужны две соревнующиеся команды, иногда даже вовсе не предполагается чья-то „победа". Мне кажется, что здесь может подойти следующее объяснение. Такие слова, как „игра", требуют некоторой диффузной „системы" фреймов-прототипов, причем переход от одних фреймов к другим осуществляется легко, а к третьим—с некоторым трудом. Аналогия между футболом и шахматами все-таки более естественна, чем между этими играми и пасьянсом, и т. д. Так и переход от одного типа стула к другому может пройти незамеченным, а вот замена парковой скамейки на кресло является достаточно нестандартной и поэтому обращает на себя внимание. Я хочу выдвинуть следующее предположение: сама логика здравого смысла во многом основывается на умении переходить от одного фрейма к другому, который имеет с предыдущим общие терминалы. Например, если ситуация соответствует фрейму типа А предполагает В и В предполагает С, то простое „смещение" от одного фрейма к другому дает возможность переинтерпретировать ситуацию как А предполагает С. Иллюстрацией возможности подобного рода может служить фрейдовская шутка о человеке в кондитерской. В этом анекдоте совершенно явно нарушена логика, несмотря на то что каждая последующая пара предложений представляет собой „надежный-и-правильный" шаг в рассуждении. Я полагаю, что, когда мы „понимаем" эту шутку, она репрезентируется в нашем мозгу в виде последовательности пар фреймов с перекрывающимися множествами объектов, приписываемых их терминалам, и где-то на этом пути происходит их неверная подмена. Происходит ли это тогда, когда человек начинает расплачиваться за ликер не деньгами, а пирожными? Или же здесь просто нарушено различие между тем, чем мы владеем изначально, и тем, что становится нашим только в результате покупки? Каждый читатель должен найти свой собственный ответ на этот вопрос, должен создать свою собственную теорию, с тем чтобы избежать подобных ошибок в будущем. Одним это удается лучше, другим—хуже. Метафора. У каждого достаточно развитого человека имеются также более крупные системы фреймов, члены которых на первый взгляд кажутся совершенно различными—например, вода и электричество, поэзия и музыка. Однако такие аналогии—наряду с умением их применять—являются одним из самых могущественных инструментов мышления. Эти аналогии порою дают нам возможность увидеть какой-либо предмет или идею как бы „в свете" другого предмета или идеи, что позволяет применить знания и опыт, приобретенные в одной области, для решения проблем в другой области. Именно таким образом осуществляется распространение знаний от одной научной парадигмы к другой. Так, мы все более и 291
более привыкаем рассматривать газы и жидкости как совокупность частиц, частицы—как волны, а волны—как поверхности расширяющихся сфер. Как обнаруживаются эти важные связи? В простых случаях все достаточно ясно: некоторые фреймы легко идентифицируются как сходные в силу того, что их терминалы присоединяют объекты одних и тех же видов. Эти фреймы могут быть обнаружены и объединены с помощью простого алгоритма, например алгоритма поиска оптимального соответствия. В более тонких случаях, при ,,озарениях, которые случаются раз в жизни", силы аналогии кроются в глубине действующих процедурных структур. Здесь нет необходимости в общей теории, поскольку—подобно полезным эволюционным мутациям—такие озарения посещают отдельных конкретных людей и только потом сформировавшаяся идея получает распространение через культуру. В любом случае, даже отвлекаясь от рассмотрения природы этих редких, величайших проникновений в суть вещей, нельзя не согласиться, что каждый индивид должен располагать своими собственными методами установления новых межфреймовых связей. Я хочу провести сопоставительный анализ частных и общих методов и показать, что они основываются на качественно различных приемах. Так, с ошибками, возникающими при применении ,,частных" методов, можно справиться аддитивным путем, а с ошибками, полученными при применении ,,общих" методов,— с помощью операции, напоминающей вычитание. Последнее из отмеченных обстоятельств несколько неожиданно снова возвращает нас к цензорам. Частные аналогии. Процесс мышления сопровождается сменой фреймов. Однако довольно часто вдруг выясняется, что какой-то из активированных фреймов оказался неподходящим; ср: „Это не дверь, это большое окно". В работе [8] Уинстон выдвигает предположение, что когда такая ошибка замечена, проанализирована и исправлена, то к ошибочному фрейму может быть присоединен „указатель" на другой фрейм, являющийся правильным в данной конкретной ситуации. Указатель, безусловно, должен включать описание приведших к ошибке обстоятельств. Семейство фреймов, связанных подобным образом, называется дифференцирующей сетью (difference network)9. Трудности с определением значения (например, слова „игра") легко преодолеть, если предположить, что некоторые слова указывают не на один фрейм, а на сеть фреймов, связанных этого типа отношениями. Отмеченная связь между фреймами основывается на обобщении вида ,,А похоже на В, за исключением признаков D". Эта связь является составным компонентом аналогии. Конечно, подобно любому обобщению, она вскоре может оказаться неадекватной и будет нуждаться в исправлении. Рассматривая этот вопрос, Уинстон отмечает, что установленные на основе опыта частные аналогии запоминаются в результате установления позитивных активных связей между фреймами. 292
Методы общей аналогии. Что, если человек столкнулся с ситуацией, которая не активирует ни одного из имеющихся фреймов? Скорее всего, в этом случае имеет смысл прибегнуть к какому-то ,,общему" методу, состоящему, например, в сопоставлении данной ситуации с некоторым широким набором фреймов и выборе ,,наиболее подходящего" из них. Этот метод, конечно, более эффективен, чем просто случайный перебор, но где гарантия, что мы не получим результат, который в конечном итоге принесет больше вреда, чем пользы? Для предупреждения такого поворота событий должен быть создан соответствующий цензор. По моему убеждению, существует следующий принцип, оставшийся не замеченным для специалистов, занимающихся теорией: позитивные общие принципы всегда должны дополняться цензорами, действующими на основе отрицания и осмеяния некоторого положения дел. Действительно, было бы крайне невыгодно менять общий механизм для корректировки отдельной ошибки. Подобные модификации, имеющие единоразовую значимость, уменьшили бы общую эффективность механизма отбора наиболее подходящего фрейма. Поэтому когда действие общего механизма дает плохой результат, необходимо создать в памяти механизмы подавления процессов, приводящих к подобным результатам. Это и означает создание цензора. Если ребенок захочет немедленно заполучить игрушку своего брата или сестры, то сначала он попытается эту игрушку отнять. Если родители остановят его и скажут, что этого делать нельзя, то он попытается найти другой способ. Но ребенка ни в коем случае нельзя учить вообще не брать тех вещей, которые ему нравятся, ибо это в конечном счете может развить в нем пассивность и беспомощность. Некоторые виды юмора (особенно это относится к игре слов) основываются на изменении семантического содержания слов. (Помимо значений, отмечаемых в словарях, большинство слов имеет также множество других значений, которые в словарях не фиксируются.) Так, слово lift 'поднятие, подъем' приобретает различные смысловые оттенки, в зависимости от того, весит рассматриваемый объект один грамм или килограмм7. Для понимания действительного значения этого слова необходима сеть, которая лежала бы в основе сдвигов между микросмыслами, подобными только что описанным. Сдвиги в значении слова действительно могут быть смешными и даже поучительными, однако рискованно и в некотором смысле опасно цепляться за те случайные и бессмысленные сдвиги, которые зависят от поверхностных звуковых сходств между словами. Рассмотрим в качестве примера такой случай: шизофреник видит на улице пенни и произносит: ,,Медь — это проводник", а затем бежит за поездом, чтобы поговорить с проводником. Весьма вероятно, что в основе подобных нарушений лежит ослабление контроля за замещением фреймов, и это или отрицательно влияет на механизм подавления ненужных аналогий, или чрезмерно активизирует деятельность механизма поиска общих аналогий. Как мне кажется, самым общим элементом для всех видов юмора 293
является неожиданная смена фреймов: сначала сцена описывается с одной точки зрения, а затем неожиданно (для этого часто достаточно одного-единственного слова) предстает совершенно в ином ракурсе. Некоторые из таких сдвигов, бесспорно, дают возможность глубже проникнуть в суть вещей, в то время как другие не более чем бессмысленные случайности. Следующие разделы будут посвящены анализу того, что могло бы составить содержание поворотных моментов в личной эволюции каждого индивида. IV. КОГНИТИВНЫЕ ТРАВМЫ „Истинно, когда присоединяется к собственной цитате" истинно, когда присоединяется к собственной цитате. (У. ван О. Куайн) При обсуждении вопросов психологии принято наделять Интеллект такими характеристиками, как сознательность, эмоциональная нейтральность, а также неторопливость и последовательность развертывания мыслительных операций. Что же касается эмоций, то здесь—приоритет за психоаналитическим взглядом, согласно которому в основе Аффекта лежат травмы и скрытые страхи, с детства вытесненные в подсознательное. Лично я глубоко сомневаюсь в правомерности столь резкого противопоставления Аффекта и Интеллекта. Конечно, я вовсе не собираюсь утверждать, будто не существует никаких различий в способах протекания интеллектуальных и эмоциональных процессов. Я просто хочу сказать, что такое жесткое разграничение, сколь бы ни было оно полезным в повседневной жизни, для психологической науки приносит больше вреда, чем пользы [6]. Так или иначе, но разграничение между Аффектом и Интеллектом во многом утратило бы свою силу, если бы и за Разумом было признано право быть связанным с таинственным и могущественным ,,когнитивным бессознательным". Именно эту точку зрения я и собираюсь отстаивать. Согласно теории Фрейда, Я (Эго) ребенка формируется в значительной степени под влиянием страха потери или наказания. Ребенок боится неопределенности и опасностей, его страшит не только возможность потерять родителя или человека, к которому он привязан, но и возможность просто утратить их расположение. Цензоры создаются для подавления и изгнания из области сознательного тех желаний, которые приходят в определенный конфликт с реальностью. Имеет ли место нечто подобное в интеллектуальной сфере? С одной стороны, есть искушение ответить на этот вопрос отрицательно, имея в виду отсутствие необходимой фигуры — человека, обладающего непререкаемым авторитетом, которого любят и боятся. Однако в то время, как у Фрейда запреты исходят извне, на самом деле ребенку для выявления своей когнитивной неудачи вовсе не 294
нужен человек, наделенный авторитетом. Ребенку не нужен родитель, который побранил бы его за то, что столкновение с парадоксом бросило его мысль в пугающую круговерть. Внезапная потеря ментального контроля сама непременно вызовет беспокойство у ребенка. Мне могут возразить, что если мы на всю жизнь сохраняем следы печального когнитивного опыта, то почему же тогда они не проявляются (подобно Аффектам) в ночных кошмарах, навязчивых мыслях, фобиях и т. д. Возможно, они и проявляются, но это не находит никакого отражения в теориях, принятых в современной психиатрии. Тем не менее каждому учителю хорошо знакомы стойкие проявления когнитивных фобий у ребенка: ,,Я не хочу это учить, я все равно не выучу". Давайте посмотрим, откуда могут происходить эти страхи. Для этого сначала обратимся к парадоксу, связанному с употреблением слова почти. Каждый ребенок может однажды задуматься над следующим вопросом: Так-так... Десять—это почти одиннадцать. Одиннадцать — почти двенадцать, и так далее. Девяносто девять — почти сто. Тогда получается, что десять—это почти сто. Взрослый человек просто отмахнется от подобной нелепицы. Но ведь каждый из нас, наверное, когда-то размышлял над подобными вещами: «Здесь что-то явно не так. Где именно: в посылках или в логике моего рассуждения? А какая здесь посылка? Очевидно, ,,если А — почти В и В—почти С, то А должно быть почти С". Здесь все правильно. Тогда неправильна логика. Но ведь я просто использую правило вывода: ,,Если А влечет В, и если В влечет С, тогда А влечет С". Разве это может быть неправильным? Никогда!» Конечно, не у каждого человека воспоминания о подобных случаях ассоциируются с чем-то пугающим. Скорее наоборот, ad hominem* большинство моих читателей будет настаивать, что им нравятся подобные ,,выверты" и они не видят в них ничего травмирующего. Здесь надо отметить, что эти читатели просто относятся к числу тех, кто нашел способ переформулировать (в терминологии Фрейда, сублимировать) подобные проблемы, переведя их в русло конструктивного мышления о мышлении. Так или иначе, нам все равно приходится иметь дело с этими проблемами, и я вижу только один способ их разрешения, состоящий в создании индивидуальной для каждого человека весьма сложной, хотя, возможно, и не очень упорядоченной структуры, которая информировала бы нас о том, когда можно, а когда нельзя доверять используемой модели вывода. Так, например, со временем мы понимаем, что нельзя многократно использовать „почти -дедукцию" в одном и том же рассуждении. С дальнейшим накоплением опыта мы приходим к пониманию того, что этот принцип распространяется не только на * Ad hominem (лат.)—применительно к человеку.—Прим. перев. 295
отмеченный вид дедукции: не исключена возможность, что к любой дедукции нельзя прибегать слишком большое количество раз. А сколько раз можно? Боюсь, что на этот вопрос однозначного ответа не существует. Каждый из нас должен самостоятельно накопить большое количество данных относительно ограничений, накладываемых на каждый вид рассуждений, и сделать из этих данных соответствующие практические выводы. Вероятно, имеет смысл составить перечень когнитивных затруднений, которые в детстве приводили нас в недоумение или ставили в тупик. Каждый читатель, наверное, может вспомнить, как он тщетно пытался найти границу, разделяющую два океана, или же ответить на вопрос: „Что было сначала—яйцо или курица?" Любой ребенок рано или поздно начинает задумываться о своем собственном происхождении, а также о происхождении самого первого человека. Только самый нелюбознательный ребенок никогда не открывает для себя парадокса типа апорий Зенона (Ахиллес и черепаха и др.). Помню, что я был немало удивлен, когда обнаружил, что на некоторые вопросы взрослые даже не знают, что и ответить. Мистический опыт. Сложности, но уже иного рода, возникают, когда человек начинает задумываться над объяснением своих же собственных действий и принятых решений. „Почему я должен делать это?"—спрашивает человек самого себя и тут же находит какое-то объяснение. Но что-то толкает его продолжить: ,,Почему я должен хотеть это?"—и т.д. Нередко случается—иногда это называют мистическим знанием,— что у человека появляется ощущение, будто на какой-то неразрешимый вопрос (например, о смысле жизни) был получен исчерпывающий ответ. Обычно человек не может вспомнить, в чем именно состоял ответ, но главное, что все сомнения оказались полностью и окончательно рассеяны! Осмелюсь утверждать, что описанный феномен возникает в результате деятельности особых ментальных механизмов (возможно, включающихся в работу в самую последнюю очередь), которые в сложных, а также стрессовых ситуациях обладают способностью полностью блокировать интеллектуальные процессы. При этом создается иллюзия, будто проблема была окончательно решена. Чрезвычайно нужный, этот механизм одновременно таит в себе определенную опасность, поскольку дискредитирует критерии правильного доказательства. Являясь в ряде случаев просто необходимым, в других случаях он может причинить вред: например, когда здравый рассудок должен сопоставить содержание веры с неопровержимыми данными опыта. Чрезмерная активность этого механизма оказалась бы для нашего мышления губительной10. 296
V. ЮМОР и эволюция Что такое гранфаллон? Хочешь ты узнать, Надо с шарика тогда пленку ободрать. (Курт Воннегут. Колыбель для кошки*). В издании своей книги 1912 г. Фрейд, все еще занятый поисками ответа на вопрос, зачем нужен нонсенс, приводит следующую шутку: Человек, сидящий за обеденным столом, неожиданно для всех вдруг опускает руку в майонез, а потом проводит ею по волосам. В ответ на изумленный взгляд соседа он говорит, извиняясь: «Ах, простите, я думал, что это шпинат»11. Мы уже показали, что приобретение ребенком знаний о логических ошибках является определяющим для развития мышления. Однако человеческое мышление развивается отнюдь не в изоляции от внешнего мира: на большинство наших идей — в том числе и идей об идеях — неизбежно оказывает влияние целый ряд общественных институтов и установлений (семья, культура и т. д.). С этим связаны дополнительные проблемы, касающиеся коммуникации. Так, если хочешь понравиться человеку, то довольно рискованно указывать ему на совершенные им ошибки. Однако это может быть сделано некоторым ,,примирительным" образом—и не без участия юмора. С другой стороны, если приобретение знаний об ошибках требует особого вида памяти, то эта память должна каким-то образом проявляться при коммуникации. В настоящем разделе я ставлю задачу показать, что осуществление этого напрямую связано с юмором, а точнее — со смехом. Но сначала давайте немного отвлечемся, чтобы обсудить важную методологическую проблему: почему так трудно объяснить, что в шутках смешного? И почему трудно сказать, что такое шутка? Мы уже упоминали о связанной с именем Витгенштейна проблеме определения значения слова „игра". Сложность этой проблемы заключается в том, что не существует какого-либо свойства, одинаково общего для всех игр. Со сходной трудностью мы сталкиваемся, пытаясь определить, что такое юмор. Но мы не прекращаем своих попыток. Возможно, кому-то эта трудность не покажется содержательной: мол, если постараться, то можно найти структуру, лежащую в основе всего смешного,— некоторую базисную „грамматику юмора" или ,,глубинную комическую структуру". Однако, мне кажется, дело обстоит несколько иначе, ведь чем дольше занимаемся мы поисками этой общей структуры, тем более очевидным становится досадное отсутствие единства во всех многообразных проявлениях юмора. Я считаю, что это есть следствие обычной биологической эволюции человека. В отношении предметов и механизмов, созданных в соответствии с некоторым планом, вполне закономерен вопрос об их предназначе- * К. Воннегут. Колыбель для кошки. (Пер. с англ. Р. Райт-Ковалевой.— М.: Мол. гвардия, 1970, с. 70.) — Прим. перев. 297
нии или цели использования. Например, для чего нужна эта балка? Ответ прост: она служит опорой для крыши и распором для стен. Однако когда мы рассматриваем структуры, созданные в процессе эволюции, то обнаруживаем, что только в единичных случаях эволюционное изменение служит какой-то одной цели и довольно редко служит определенной цели вообще. Поскольку в основе человеческого поведения лежит множество независимых механизмов, то нельзя ожидать, чтобы ограниченная определенными рамками теория полностью ,,объяснила" любой взятый в отдельности компонент поведения. Что действительно может сделать теория— это описать некоторый фрагмент сети взаимодействующих подсистем. Юмор, подобно играм, стоит на службе многих потребностей и затрагивает различные механизмы. У юмора нет четких естественных границ, поскольку лежащие в его основе явления сами перекрываются и взаимодействуют друг с другом. Когда мы употребляем слово „юмор", у нас неизбежно возникает иллюзия, что оно обозначает нечто более четкое и определенное, чем весь этот комплекс смеха, логически неправильных рассуждений, табу, запретов и находящихся в ведении бессознательного цензоров. Однако мне кажется, что эта ясность слов сама по себе не более чем иллюзия. Как я отметил в прим. 7, функционирование языка основано на упрощениях, которые являются здесь необходимыми и расчленяют глобальную связь всех явлений окружающего мира (не говоря уже о человеческой психике). Для чего нужен смех. Давайте посмотрим, что происходит, когда человек начинает воспринимать когнитивную ситуацию как смешную или абсурдную: его дальнейшие рассуждения просто тонут в потоке активности—в резких движениях грудной клетки, живота, головы, лица и конечностей, все это сопровождается громким кашлем и хрипом,— человек буквально задыхается. Я думаю, что это поразило бы какого-нибудь пришельца с другой планеты не меньше, чем вид эпилептического припадка. Взрослые люди могут, конечно, научиться подавлять отмеченные реакции, но это уже совершенно другой вопрос. Смех прерывает рассуждение. Возникший смех действует отвлекающе и удерживает мысль от дальнейшего продвижения по ложному или запретному пути. Прерывание рассуждения необходимо для того, чтобы человек не вздумал рассматривать эту мысль серьезно, то есть действовать в соответствии с ней или же анализировать ее логические следствия. Смех выполняет и другую, вспомогательную, функцию. Смех фокусирует внимание. Обрывая рассуждение, смех цепко схватывает мысль и выводит абсурдность в четкий фокус. При этом обнаруженное несоответствие, вероятно, помещается в какую-то „кратковременную память" и подлежит усвоению некоторой ,,цен- зор-обучающейся" системой. 298
Итак, ,,юмор" может опосредовать процесс обучения цензоров, подобно тому как „удовольствие", согласно распространенной точке зрения, опосредует процесс обучения человека . Генезис юмора. К какому периоду можно отнести возникновение юмора? Мы полагаем, что это произошло тогда, когда наше пробуждающееся мышление находилось в стадии растущей способности к рефлексии, когда человек учился думать не только о конкретных проблемах окружающего мира, но и о том, как лучше использовать ресурсы разума для решения этих проблем, т. е. обучался планировать. Для того чтобы научиться планировать свою деятельность, человек должен был научиться видеть те границы, в пределах которых мышление не дает сбоев. Эта способность не могла возникнуть внезапно. Обязательно должны были существовать промежуточные ступени—такие, как возникновение многоуровневых схем, подобных описанной выше, где В-мозг осуществляет контроль за А-мозгом. Потом постепенно развилась способность к символическому представлению планов в абстрагированной и обобщенной формах. С возникновением этих представлений впервые стало возможным прямое обращение к собственной ментальной деятельности. А это позволило проделывать такие трюки, как соединение утверждения со своим собственным цитатным употреблением, а также конструирование суждений, которые (неизвестно, хорошо это или плохо) содержат указание на свое собственное истинностное значение. Примером подобного рода может служить приведенная выше шутка Куайна, в которой повторяется выражение „истинно, когда присоединяется к собственной цитате"13. Приобретя способность следовать сложным линиям рассуждений, мы вместе с тем оказались вынуждены обходить многочисленные ошибки, вызываемые ложными ассоциациями, тончайшими смысловыми изменениями, а также движением мысли по кругу. К описываемому периоду относится, возможно, и появление Языка как орудия использования четких и гибких символических образов. А поскольку уменьшение многозначности и степени абстрагированности символьных операций отрицательно сказалось бы на возможностях человеческого мышления, то неизбежно должна была возникнуть та самая цензорная память. Конечно, то, что мы сейчас описали, является лишь приблизительной картиной того, что происходило на самом деле. А сейчас давайте вернемся к нашим рассуждениям о смехе. Мимический компонент смеха свидетельствует о том, что смех развивался в тесной связи с социальной коммуникацией. Смех в определенной степени сближается с „примирительным" выражением лица, однако обнажающиеся в улыбке зубы наводят на мысль о соединении здесь элементов защиты и агрессии14. Довольно странный звуковой компонент смеха, скорее всего, тоже возник для выполнения социальной функции, связанной с одновременным проявлением примирения и агрессии. Возможно, смех возник отчасти для того, чтобы служить для другого человека 299
сигналом, что ему надо прекратить свою деятельность ввиду того, что она опасна, бессмысленна, нелепа или в какой-то мере запретна. Со временем эта функция становится внутренней. Если человек может чувствовать и слышать, как он смеется, гримасничает и трясется от смеха, то почему бы ему не использовать эти побочные эффекты для того, чтобы заставить свое собственное Я не совершать чего-либо смешного или запретного? Возможно даже, что люди сначала научились смеяться над своими ошибками, а уже потом научились молча осуществлять цензуру своей деятельности. Я не настаиваю, что дело обстояло именно так, как описано мною, но хочу подчеркнуть, что нечто похожее обязательно должно было произойти, —я имею в виду срастание нескольких раздельно до того существовавших комплексов, каждый из которых сохранил всю сумму прежних связей с другими системами и целеустановками. В результате их переработки и возникли представляющие для нас теперь загадку комбинации примирения, агрессии, сексуальности и нонсенса, которые все вместе и образуют юмор. Если и другие ментальные структуры имели столь же сложное поведенческое происхождение, то мышление современного человека можно сравнить с гигантской сетью, где линии различных биологических целеустановок в целом ряде узловых точек пересекают различные многоцелевые механизмы. Если мое предположение верно, то задачей психологической теории должно стать описание различных участков этой сети—по нескольку линий и узлов пересечений для каждой теории. Любопытное совпадение: наши теории о том, как работает мышление, возможно, тоже должны иметь характер сети—хотя и по другой причине. Ибо (как мне кажется) единственный способ для человека понять что-либо очень сложное—это стремиться к локальному пониманию в каждой временной точке,— подобно тому как паук, ткущий паутину, из каждой точки видит только несколько нитей и узлов пересечения. Вот так по крупицам мы и выстраиваем в голове сетевидные теории, составленные из локально понятых фрагментов. Достоверность «сетевидной» теории определяется степенью соответствия модели и механизма мышления . Впрочем, может быть, вообще бесполезно требовать точного ответа на вопрос, что такое юмор. Здесь нам как раз могут оказаться полезными взгляды Кожибского: слово «юмор» вовсе не указывает на какую-то реальную вещь. Скорее, оно указывает на имеющуюся у каждого человека мыслительную «сетевидную» модель, слегка отличающуюся от аналогичных моделей у других людей. Каждый из нас понимает и использует это слово немного по-разному — подобно тому, как каждый из нас смеется над различными шутками. Этим я вовсе не собираюсь сказать, что проблемы как таковой не существует или что она как-то особенно трудна для понимания. Я просто хочу выдвинуть предположение, что юмор, возможно, не столько Вещественная Часть мышления, сколько Вещественная Теория, инкорпорированная в мышление. Это не делает юмор менее заслуживающим изучения, но мы должны четко зоо
представлять, что надо изучать. Если позволить себе запутаться между теориями о теориях и теориями о вещах, то, боюсь, что распутать этот клубок будет уже невозможно16. Временные константы. Согласно взглядам, изложенным в настоящей статье, старые шутки не должны казаться нам очень смешными, ведь цензорам уже известно о них. Почему же некоторые виды шуток постоянно вызывают у нас смех? Так, мы быстро перестаем реагировать на знакомые шутки-бессмыслицы, а вот двусмысленные остроты долго не оставляют нас равнодушными. Противоречит ли это нашей теории? Не обязательно. Это может просто означать, что некоторые цензоры обучаются и изменяются значительно медленнее, чем остальные. Оправданно ли наше предположение? Представляется, что независимо от степени научности большинство современных психологических теорий содержит допущение, что материальная основа всех видов памяти одинакова и все они образуют единое гигантское хранилище информации (моя точка зрения иная [6]). Однако совершенно очевидно, что некоторые виды памяти должны быть менее подвержены изменениям, чем другие. Рассмотрим такой пример: родившийся ребенок будет требовать от матери много времени и внимания на протяжении долгих лет. Почему же тогда мать ребенка не задается вопросами: «Зачем я делаю все это?» или ,.Сделает ли для меня что-нибудь этот ребенок, что бы оправдало такую жертву с моей стороны?" Если бы эти вопросы были заданы, на них в принципе можно было бы ответить: ,,Дети нужны для того, чтобы продолжить человеческий род", или „Ты будешь любить ребенка", или „Твои старания будут когда-нибудь вознаграждены", но все это вряд ли убедит человека с рациональным складом ума. Рождение и воспитание ребенка—будем смотреть правде в глаза—не является особо разумным предприятием. Согласно устоявшемуся мнению, любовь далека от рациональности, а все «инстинктивные» привязанности возникают как-то сами собой и каким-то образом защищены от случайных изменений. Бесспорно, все это так, но было бы желательно знать больше обо всех этих ,,как-то" и ,,каким-то образом". Приведенный выше диалог обычно не заходит так далеко, возможно, потому, что мы защищены от подобных вопросов надежной стеной собственного удовольствия и общественного принуждения, окружающих воспитание ребенка. Но сама поставленная нами проблема реальна, так как, например, встречаются случаи (обычно тщательно скрываемые), когда крушение жизненных планов молодой матери разрушает ее привязанность к ребенку. Самым простым и правильным решением было бы связать привязанность с такой разновидностью памяти, которая, будучи однажды задействована, остается неизменной на протяжении ряда лет. Длительными временными интервалами характеризуются и другие виды привязанностей. Некоторые люди постоянно выбирают себе партнеров со сходной внешностью, как будто не могут 301
отказаться от некоторого стереотипа. Другие в течение длительного времени могут находиться под влиянием отрицательных эмоций, причем рассудок оказывается полностью бессильным. Пример этого— переживание горя, период траура или печали. Год или больше требуется для того, чтобы примириться с невозвратимой потерей или утратой. Все эти явления могут быть побочным результатом адаптационной перестройки механизмов, чья малая способность к изменению была или до сих пор остается значимой в нашей социобиологической эволюции17. Вероятно, таким же образом можно объяснить и продолжительную, похожую на траур депрессию, связанную с изнасилованием. Можно предположить, что внезапная контаминация насилия и сексуальности каким-то образом разрушает весь механизм привязанностей человека, а продолжительные временные константы, связанные с этим механизмом, не способствуют быстрому восстановлению нарушенных социальных взаимосвязей. Бесполезно уговаривать потерпевшее лицо взглянуть на случившееся с «рациональной» точки зрения—это ничуть не ускорит возвращение в нормальное состояние, и человек еще долго и тяжело будет ощущать функциональное расстройство механизма привязанностей. Приведенные факты говорят в пользу того, что удивительный сам по себе феномен продолжительности воздействия двусмысленных шуток и острот может быть связан с тем, что соответствующие цензоры, в чем-то напоминая отсталых детей, относятся к чрезвычайно медленно обучающимся сторонам нашей психики и мышления. Возможно, они и есть отсталые дети—статичные следы ранних этапов развития нашего Я. Эти цензоры изменяются крайне медленно, и наша постоянная радость по поводу определенных сюжетов может быть побочным эффектом этого обстоятельства. Итак, мы можем сделать следующий вывод. Шутки на самом деле вовсе не являются такой уж смешной вещью,— они отражают стремление человека к разумности, достижение которой связано с подавлением абсурда. ПРИМЕЧАНИЯ 0 Анализируя остроты-бессмыслицы, Фрейд оказался в довольно затруднительном положении. Фрейд высказал мнение, что эти шутки «приятны говорящему тем, что дают возможность подразнить и одурачить собеседника, подогрев в нем сначала ожидание остроты, а потом разочаровав его». При этом собеседнику остается только «утешать себя тем, что впоследствии он сможет воспользоваться этим же приемом по отношению к другим людям». Наслаждение от бессмыслицы, продолжает Фрейд, может также служить показателем стремления вернуться в детство свободной, беззаботной мысли. Ребенок «соединяет слова, не связывая этого соединения со смыслом слов, чтобы достигнуть эффекта удовольствия, получаемого от их ритма или рифмы. Это удовольствие ему постепенно воспрещается, и, наконец, ему остается дозволенной лишь имеющая смысл связь слов. В более позднем возрасте эти стремления невольно ищут выхода из заученных ограничений в употреблении слов путем искажения слов определенными надстройками» [О, с. 168—169]*. Указав, что алкогольное опьянение само по себе обычно вызывает веселье, Фрейд афористич- * Ссылки даются по русскому изданию 1925 г.—Прим. перев. 302
но замечает: «Чрезвычайно поучительно видеть, как с подъемом настроения уменьшаются претензии на остроумие». И далее: «Под влиянием алкоголя взрослый человек опять превращается в ребенка, которому доставляет удовольствие свободное распоряжение течением своих мыслей, без необходимости соблюдать логическую связь» [О, с. 171]. Позже Фрейд изменил свой взгляд на характер детской психики. Он стал отмечать страхи, разочарования и давление формирующегося образа Я, который возникает как отражение существенных характеристик людей, служащих для ребенка олицетворением власти или объектом привязанности. Выдвигая в настоящей статье концепцию развития логических способностей у ребенка, я предлагаю соотносительный с образом Я внутренний образ Рациональности, который, впрочем, гораздо меньше нуждается во внешней человеческой модели, ибо ментальные сбои автоматически вызывают принятие соответствующих санкций. Я не был совсем точен, когда сказал, что Фрейд никогда больше не возвращался к интересующей нас проблеме. В 1927 г. он опубликовал небольшую статью [9], в которой, по-прежнему придерживаясь взгляда на шутки и остроты как на источник удовольствия, он (в противовес этому) трактует юмор как средство избегнуть страданий. Сверх-Я (Супер-Эго), выполняя функцию родителя, успокаивает детское Я, внушая ему мысль, что, каким бы страшным и опасным ни казался мир, это на самом деле не более чем игра. Однако Фрейд был обеспокоен тем, что эта роль не вполне соответствует характеру Сверх-Я. Возможно, мысли, высказанные мной в настоящей статье, внесут в этот вопрос некоторую ясность. Так или иначе, эта проблема пересекает область «психологии взрослых», которую я не хочу рассматривать здесь по причине, указанной в прим. 16. 1 Нелинейность и неоднородность разума. Некоторые идеи, развиваемые в настоящей статье, впервые были высказаны в нашей совместной работе с Сеймуром Пейпертом. Здесь в первую очередь я имею в виду идею о том, что мыслительная деятельность осуществляется в результате взаимодействия между различными подсистемами. Настоящая статья связана также с моими работами [4], [5], [6] и [12], но признаюсь, что пока я еще не выработал единой точки зрения на изучаемую проблему. Моя основная цель состоит в том, чтобы опровергнуть распространенный взгляд на разум как на нечто однородное, которое или думает о чем-то, или не думает. Я склонен считать, что человеческий разум состоит из множества более мелких „разумов", которые в свою очередь состоят из еще более мелких единиц. Было бы бессмысленно обсуждать, что и как они „думают" по отдельности, ибо деятельность каждого отдельного „разума" становится значимой только в связи с активностью всех остальных. Своими феноменологическими наблюдениями мы в конечном итоге обязаны именно такому устройству мышления. Один (из многих) доводов в пользу принятия «децентрализованной» психологической теории состоит в том, что эта теория разрешает существование такого механизма, занимающегося знанием о знании, который значительно превосходит по своим характеристикам контролирующие структуры, ставшие ныне традиционными в работах по искусственному интеллекту и когнитивной психологии. Вполне понятно, что на ранней стадии разработки „информационно-процессуального подхода" все внимание было сосредоточено на поразительной силе только что изобретенного однопроцессорного серийного компьютера. Однако понятие „мета-знание" приложимо к этим машинам с трудом, не говоря уже о более серьезных идеях самообучения; см. [10] и [11]. 2 Частичные ментальные состояния. Я, конечно же, не имею в виду, что мозг, взятый как единое целое, когда-нибудь может вернуться в одно из своих прежних состояний. Вряд ли вообще можно сказать что-то вразумительное о ментальных состояниях, если рассматривать Разум как единое целостное образование. Однако, если предположить, что Разум состоит из множества относительно автономных подсистем, тогда можно говорить о повторяющихся „частичных ментальных состояниях" как об определенном наборе состояний этих автономных подсистем. Более подробно это рассматривается в работе [6]. Понятие частичного ментального состояния позволяет нам говорить о нескольких частичных состояниях одновременно, причем эти состояния являются сравнимыми благодаря тому, что индивидуальная автономная подсистема не может находиться в каждый момент времени более чем в одном состоянии. Даже возможные конфликтные состояния между подсистемами, 303
если эти конфликты могут быть разрешены в рамках всей системы в целом, не могут являться помехой для нашей теории. В работе [6] я провожу мысль, что локальные механизмы для разрешения подобных конфликтов могут соединять различные фрагменты знания и предварять то, что потом предстает перед нами в виде рассуждений. 3 Сознание. Как мне представляется, феномен ,,сознания" может возникнуть как результат действия механизма ,,рефлексии", направленного на объяснение собственной деятельности. Я не думаю, чтобы эта работа осуществлялась в соответствии с каким-то прямым и всесильным методом. Скорее всего, все происходит самым обычным образом—путем формирования и уточнения моделей, которые могут даже не иметь законченного характера. Собственно говоря, обсуждение подобного рода проблемы не является корректным в силу наличия у выражения „рефлексия" или ,,самонаправленность" множества различных значений. Можно ли называть систему самонаправленной только потому, что она оперирует данными, представляющими собой описание ее собственного функционирования? Систему можно считать самонаправленной тогда, когда она действительно стремится описать саму себя. Самонаправленность при планировании (когда человек говорит: „Я сделаю X") отлична от простого намерения сделать X тем, что обычно порождает дополнительные решения типа ,,Я останусь тверд и не позволю Y заставить меня изменить свой план". Можно ли назвать систему самонаправленной, если (на взгляд стороннего наблюдателя) ее внутренняя структура по чистой случайности оказывается похожей на описание самой себя? В любом случае совершенно очевидно, что наши психологические модели человека, отнюдь не являясь образцом технического совершенства, оказываются тем не менее полезными для решения множества социальных, эвристических и повседневных задач. В работе [12] я показал, что технически даже совершенно неправильные модели могут в ряде случаев оказывать нам помощь; особенно это относится к объяснению иллюзии свободы воли. Вообще-то говоря, я не вижу оснований считать, что „сознательная" часть нашего разума имеет прямой доступ к „задачам высшего уровня", или просто полагать, что этот „высший уровень" вообще существует, то есть полагать, что Разум имеет четкую иерархию. Даже если бы это было так, то в процессе эволюции, вероятно, был бы найден способ блокировать способность остальной части разума к чересчур детальному анализу деятельности „высшей" его структуры (хотя бы для того, чтобы уберечь ее от возможного разрушения10). Я придерживаюсь мнения, что если этот „высший уровень" и существует, то он состоит из подсистем, доступ к которым, по сути дела, ничего бы не раскрыл (по причинам, отмеченным в прим. 12). В работе [5] я рассматриваю некоторые механизмы, которые могли бы занимать «центральное" место в мышлении на том основании, что они используются в исключительных случаях. Подобные механизмы могли бы играть определенную роль в разрабатываемых нами моделях самих себя. Однако сами эти модели могут быть не слишком реалистичными. 4 He-непрерывная логика. Я коротко обсуждал эти логические вопросы в работе [4]. Весьма живое обсуждение подобных проблем содержится в диссертации Дойла [11]. Здесь закономерно возникает вопрос: являются ли безопасные для мышления области отделенными друг от друга „островами" или же безопасной можно считать всю логику в целом, если научиться обходить расставленные ловушки? 5 Путаница. Когда человек говорит: „Я запутался", это значит, что рубеж простой путаницы или неразберихи уже давно перейден. Очевидно, что человек должен был сделать немало для того, чтобы таким образом идентифицировать свое мета-психологическое состояние. 6 Знакомое. Шенк [13] отмечает, что человек думает о том, что нечто выглядит знакомым только тогда, когда он не может до конца опознать или идентифицировать это „нечто". В противном случае человек просто не задумывается над подобными вопросами. Процесс поисков сходства фиксируется только тогда, .когда сходство не является полным. 7 Неоднозначность. Почти все детские шутки представляют собой выражения или описывают ситуации, которые имеют два или более значений. Что касается эмоционально нейтральной неоднозначности слов и выражений, а также нашей способности в каждом конкретном случае выбрать нужное значение, то все это 304
достаточно очевидно. К сожалению, не очень часто понимают, что мысли сами по себе тоже могут быть неоднозначными,— ведь одно и то же (частичное) ментальное состояние может предшествовать многим другим ментальным состояниям, в зависимости от конкретной мыслительной ситуации [5]. 8 Уточнения. Конечно, нарисованная здесь картина во многом упрощена. ,, Умолчания" не просто удобны, они, возможно, являются самым могущественным из имеющихся в нашем распоряжении средств, с помощью которых можно делать обобщения. Действительно, они вычленяют все типичное для некоторого класса явлений путем обращения к памяти о типичном представителе этого класса. И даже если созданные на основе ,,принципа умолчания" предположения оказываются неверными, это обычно не приносит никакого вреда, поскольку эти предположения легко заменяются обнаруженной ,,реальностью". Однако этот гипотетический механизм воссоздания по умолчанию таит в самом себе немало потенциальных ошибок. (Нужна, в частности, осторожность относительно выводов о наличии „плоскости" для сидения по самым различным соображениям личной безопасности.) Если наблюдателю ничто не мешает видеть стул или кресло, на котором сидит человек, но он тем не менее их не видит, то налицо абсурдная с точки зрения здравого смысла ситуация. Я считаю, что этнический юмор, представляющий, бесспорно, большую социоби- ологическую ошибку, тоже связан с механизмом фреймов. Почему в таком ходу шутки, в которых высмеиваются представители других национальностей? Распространенное объяснение этого явления гласит, что шутки подобного рода есть не что иное, как способ проявления агрессивности. Все это, без сомнения, верно, однако можно предложить и более содержательное объяснение. В работе [4] я показал, что слушающему трудно понять рассказ о каком-то человеке, если у него отсутствует нужный фрейм человека, то есть определенный стереотип. Вместе с тем если слушающему не нужно выбирать фрейм, то вся коммуникативная ситуация для него существенно упрощается. Итак, слепой фанатизм может возникнуть непроизвольно — как побочный эффект отмеченного обстоятельства. Например, когда рассказывают шутку о человеческой глупости, то с точки зрения психики удобно свести услышанное к некоторому стереотипу — желательно чужому, иностранному,— с тем, чтобы избежать конфликта с окружающим миром. И конечно, подобно снежному кому, этот стереотип может начать обрастать все новыми и новыми небылицами. Постепенно у людей стираются следы „юмористического" происхождения подобных структур. Бороться с предубеждениями очень трудно, если не понимать важности (и значения) стереотипов в повседневном мышлении. 9 Многие из идей о важности „идентифицирующих различий" были изложены уже в работах [14] и [15], но только в работе [8] впервые была четко сформулирована идея о дифференцирующей сети. В более новой работе [16] Уинстон рассматривает использование фреймов для проведения более сложных аналогий. Серьезное исследование ошибок и сбоев впервые, по-видимому, было предпринято Пейпертом при исследовании обучения ребенка [17], а затем в докторских диссертациях Сассмена [18] и Голдштейна [19]. 10 В защиту сказанного. Льюис Томас в работе [30] отмечает, что философы и лингвисты «вынуждены использовать в качестве единственного инструмента исследования как раз тот самый аппарат, который они собираются исследовать». Он рассказывает о том, что он испытывал, когда слушал доказательство теоремы Геделя: «Только я начал вникать, как внезапно ощутил нечто вроде вспышки, а потом все смешалось в моей голове». Далее он высказывает предположение (надеемся, читатель поймет, где автор говорит всерьез, а где — в шутку), что «в мозгу существует свалка — защитное средство, устраняющее необходимость чинить или на скорую руку перепаивать тончайшие структуры языка и мышления. Эта свалка не дает мозгу вмешиваться не в свое дело, а также защищает мозг от той информации, которая для него неприятна или не нужна». Вероятно, в сказанном есть значительная доля правды. 11 Возможно, читатель уже слышал эту шутку, но не о майонезе, а о брокколи*. Второй вариант смешнее, поскольку содержит перенос вполне допустимой ошибки в совершенно невероятную ситуацию. В версии Фрейда ошибка достаточно глупа: * Брокколи — однолетнее овощное растение.— Прим. перев. 305
человек может спутать шпинат с брокколи, но маловероятно, чтобы он спутал его с майонезом. Я подозреваю, что Фрейд искусственно довел ситуацию до абсурда—с тем, чтобы потом прокомментировать ее. Действительно, на с. 187 он выражает свое особое неодобрение по поводу этой шутки —было бы очень забавно, если бы он сам нарушил правильность замещения фреймов, чтобы добиться нужного ему эффекта. Я бы не стал акцентировать на этом внимание, если бы этот прием не был бы достаточно распространенным в работах по психиатрии, в том числе и у самого Фрейда (как это явствует из анализа его произведений). 12 Удовольствие. Как отмечал Фрейд, необходимо объяснить, почему юмор доставляет нам удовольствие несмотря на то, что зачастую затрагивает далеко не самые приятные темы, а наоборот—грустные, запретные или даже вызывающие отвращение. И действительно, в большинстве хороших шуток на самом деле нет ничего смешного, кроме разве что умения, с каким скрыт истинный смысл. Сейчас у нас нет недостатка в теориях, объясняющих, как могло произойти полное видоизменение признака смешного: к нашим услугам теория цензорской энергии, теория под названием ,,Я рад, что это произошло не со мной", теория минимизации значимости реальности и др. И все же вопрос остается в значительной степени непроясненным, поскольку, молчаливо принимая, что суть дела проста, никто не сделал попытки разработать более или менее глубокой теории удовольствия как такового. В силу этого все эти очевидные на уровне здравого смысла мини-теории в конечном итоге оказываются построенными на песке. Что такое приятное и почему мы так любим его? Это отнюдь не тавтология. Ясно, что приятное связано с целым комплексом вопросов, затрагивающих обучение и цели, действия или деятельность, которые человек хочет продолжить и/или повторить, ожидание этой деятельности и ее повторение. Очень сильно затрудняет решение проблемы то, что мы „чувствуем" приятное как бы через призму искусно созданного механизма, в котором воплощено свойственное нам стремление четко вычленять и классифицировать предметы и явления,— гораздо четче, чем они вычленяются на самом деле. Мы отдаем дань этой иллюзии даже тогда, когда говорим такие простые на первый взгляд вещи, как „Я чувствую ххх". Этот пример полностью иллюстрирует наше представление о психической (и ментальной) сфере как о едином целом, в нем отражена иллюзия связности, которая не позволяет увидеть, что в один и тот же момент различные подсистемы психики и мышления могут выполнять весьма различные функции. Например, на одну подсистему может быть возложена функция следить за правильностью работы другой. Если верно высказанное мной предположение относительно того, что феномен приятного на самом деле включает в себя множество различных действий и явлений, нам все равно необходимо объяснить, почему феноменологически они имеют столь много общего. Вот мое первое предположение. Изначально общей для всех этих явлений была следующая мета-психологическая характеристика: все они были наиболее чувствительными на воздействия со стороны других подсистем психики и мышления. Благодаря этому в рассматриваемой системе могла образоваться экологическая ниша, необходимая для возникновения особого мозгового центра, который отличается тем, что, будучи активизирован одной из подсистем, стремится подавить все остальные. (Человек не так охотно откликается на приятное предложение, если он уже вовлечен в доставляющую ему удовольствие деятельность.) Возникновение такого центра повлекло за собой формирование в нашем развивающемся мышлении представления о сходстве ассоциируемых с этим центром механизмов. Мое второе предположение таково: подобная централизация могла бы развить способность каждой подсистемы в нужный момент сигнализировать, что ею было что-то сделано для удовлетворения нужд другой подсистемы, даже если характер, цель и суть этого воздействия оставались бы для нее непонятными. Заметьте, как использование слов „удовлетворение", „удовлетворять" сразу наводит на мысль об известной общности всех рассматриваемых явлений. Боюсь, что именно употребление слов и вводит нас в заблуждение, когда мы начинаем думать, будто вопрос „Почему мы любим приятное?" является простой тавтологией и не заслуживает внимательного изучения. Сеймур Пейперт высказал еще одно, более социобиологическое по характеру предположение о том, как эволюция могла объединить все эти явления и обеспечить 306
их одним общим выходом. Для матери легче определить, удовлетворила ли она сейчас нужды своего ребенка, если ей не надо запоминать различные реакции, которые говорили бы об удовлетворении каждой конкретной потребности. Сходный механизм помогает человеку определить, убедил ли он своего собеседника, и т. д. Во всех этих случаях некоторый набор различных внутренних процессов находит выход в одном- единственном ,,завершающем акте", если воспользоваться терминологией Тинбергена. 13 Моя дочь Джулия, немного подумав над этой шуткой, сказала: «В точном смысле слова это не парадокс. Просто здесь можно повторять про истинность до бесконечности». 14 Замещение. Лоренз [21] и Тинберген [22] говорят об особом, на первый взгляд бессмысленном поведении животных, когда они не знают—нападать или спасаться бегством. Есть ли более подходящее время для переговоров? Мы a priori можем быть уверены в существовании неоднозначности в самых истоках и зачатках социальных знаковых систем. 15 Я не считаю, что все это звучит как-то пессимистично. Для понимания чего-либо вовсе не обязательно, чтобы в сознании человека одновременно присутствовало все, что он знает о данном предмете. Человеку в каждый конкретный момент необходимы лишь фрагменты знания, которые к тому же могут характеризоваться различной степенью детализации. В диссертации Куйперса [23] содержится теория того, как знание человеком своего города может быть представлено в формализованной форме. Это представление можно взять в качестве образца при описании взаимодействия мышления со своим собственным знанием. 16 Теории. Существует, как мне кажется, настоятельная необходимость в создании теорий о психологии взрослых, где наряду с фактами индивидуальной и органической эволюции учитывались бы и факты культурной эволюции. Давайте посмотрим: смех, улыбки, хорошее настроение возникают не только после тонких шуток, связанных с замещением фреймов, но и довольно часто после достаточно бестолкового нонсенса. Поскольку шутки могут быть направлены как на развитие аналогий, так и на их подавление, то мое разграничение между позитивным и негативным, похоже, отпадает. Если и содержится что-то общее во всех разновидностях юмора, так это, пожалуй, только неожиданные замещения фреймов, но количество способов, в соответствии с которыми происходят эти замещения, не поддается никаким подсчетам. Означает ли это, что наша теория отвергается? Не думаю. Однако для доказательства этого необходимо рассмотреть ,,развитие взрослых". Хочется отметить, что „взрослые" контрпримеры совсем не обязательно противоречат ,,детской теории". Большинство психологов недостаточно принимает во внимание тот факт, что интеллект взрослого человека способен к самостоятельной реконструкции, то есть к перераспределению и новому использованию ранее приобретенных компонентов. И так этап за этапом сложные процессы развития (проходящие под воздействием внутренних и внешних—культурных — факторов, модифицирующих уже имеющиеся состояния) накладываются друг на друга. Этот процесс представлял бы собой более запутанную картину, если бы он был полностью спонтанным, то есть целиком зависел только от внутренних факторов. Однако многие факторы являются социально закрепленными: так, например, каждый член общества ,,знает", какие запросы и какая манера поведения являются „приемлемыми" и „допустимыми" для четырех- или девятилетних детей, для студентов колледжа или преподавателей философии. Ведущие ученые—представители психологии развития—стремились выявить различные принципы и формы этого влияния, и все же проблема не получила достаточно глубокого освещения. Мы по-прежнему знаем очень мало — слишком мало для того, чтобы с уверенностью сказать, что то или иное поведение человека подтверждает или опровергает определенную психогенетическую гипотезу. Я считаю, что в настоящее время самым верным шагом на пути к проверке правильности выдвигаемых гипотез о мышлении будут эксперименты, но не на людях, а на компьютерах, с тем чтобы посмотреть, может ли предлагаемый фрагмент теории войти составной частью в систему, которая представляет собой аналог мыслительной деятельности. Конечно, это ни в коей мере нельзя будет считать полным доказательством правильности рассматриваемой теории, но вряд ли вообще стоит принимать 20* 307
теорию всерьез, если она не удовлетворяет отмеченному условию, то есть не способна быть полезной при реконструировании реальных мыслительных процессов. Короче говоря, вряд ли мы обнаружим большую часть того, что есть, пока мы не обнаружим как можно больше из того, что может быть. 17 Привязанность. Конечно, социобиологический механизм привязанности матери к ребенку значительно сложнее, чем это представлено у меня. Встречаются и генетически заложенные отклонения. Вместе с тем нельзя не признать, что существует много социобиологических ,,островов стабильности"—как потенциально, так и реально. Гипотеза „пакета возможностей обучения". Сейчас я приведу другой пример того, что индивидуальное и социальное развитие находится под влиянием генетического контроля за графиком обучения. Хорошо известно, что люди, приступающие к изучению иностранного языка не в детском возрасте, очень редко добиваются абсолютно правильного произношения, редко говорят ,,без акцента". (Когда их просят „произнести не так, а вот так", они чаще всего не чувствуют никакой разницы между этими вариантами.) Мне кажется, что этот факт отражает происходящие в психической и мыслительной сфере постпубертатные изменения и может служить ярким примером, подтверждающим важность генетического контроля за когнитивным развитием. Говоря более конкретно, мое предположение сводится к тому, что (i) обучением произношению ведает некоторая специальная структура мозга, (ii) способность которой воспринимать новые различительные признаки резко уменьшается под влиянием генетического механизма, связанного с пубертатными изменениями. Выбор этого временного периода определяется тем, что именно тогда нацеленность человека на обучение себя трансформируется и переходит на обучение других. „Эволюционная цель" этого процесса—перекрыть путь родителю* к изучению языка ребенка и заставить ребенка изучать язык взрослых. Главная цель молодого родителя—не обучение ребенка языку, а общение с ним. Если бы родитель перенял идиосинкразическую фонологию ребенка, это могло бы привести к глобальным последствиям. Родитель, конечно, овладел бы языком ребенка, а вот у ребенка резко сократились бы возможности и уменьшилась необходимость в изучении языка взрослых. Таким образом, через несколько поколений развитию любого социального языка был бы положен конец. Анализируя врожденные и приобретенные черты развития, мы неизбежно должны столкнуться с проблемой расшифровки структур, освоение которых не является генетически заданным, например деталей когнитивной и языковой структур. Моя идея заключается в том, что сначала надо посмотреть, как генетически заложенное влияет на „пакет возможностей обучения" управляющих структур, опосредующих процесс освоения знаний. Вышеприведенная гипотеза, как мне кажется, иллюстрирует один из способов, каким „генетика мозга" позволяет обойтись без конструирования чрезмерно сложных прямых ограничений на еще не приобретенные когнитивные структуры. ЛИТЕРАТУРА [0] Freud, Sigmund. Jokes and Their Relations to the Unconscious, 1905. (Transi, by Strachey).— „Standard Edition", vol. 8 (Hogarth Press), 1957. [Фрейд 3. Остроумие и его отношение к бессознательному. М.: Современные проблемы, 1925.] [1] Doyle, Jon. Truth Maintenance Systems for Problem Solving. (M.I.T., Artificial Intelligence Laboratory, AI/TR-419), January 1978. [2] Kornfeld, William A. Using Parallel Processes for Problem Solving. (M.I.T. Artificial Intelligence Laboratory, AI Memo 561). Cambridge, Mass., December 1979. [3] Korzybski, Alfred. Science and Sanity. Lancaster, Pa.: Science Press, 1941. * Здесь и далее автор пользуется, по-видимому, терминологией современного американского психолога и психиатра Э. Берна, согласно теории которого психика человека структурирована по трем уровням: Ребенок, Взрослый и Родитель.— Прим. перев. 308
[4a] Minsk y, Marvin. A Framework for Representing Knowledge. (M.I.T., Artificial Intelligence Laboratory, AI Memo 306). Cambridge, Mass., June 1974. [Минский M. Фреймы для представления знаний. М.: Энергия, 1979.] [4b] Minskу, Marvin. A framework for representing knowledge (Condensed version).— In: ,,The Psychology of Computer Vision". (Ed. by P. H. Winston). New York: McGraw-Hill, 1975. [5] Minsky, Marvin. Plain talk about neurodevelopmental epistemology.— In: ,,Proceedings of the Fifth International Joint Conference on Artificial Intelligence". Cambridge, Mass., August 1977. Condensed version in: „Artificial Intelligence". (Ed. by Winston and Brown), vol. 1, MIT Press, 1979. [6] Minsky, Marvin. K-lines: A theory of memory.— „Cognitive Science", 4, 1980, p. 117—133. [7] Wittgenstein, L. Philosophical Investigations. Oxford: Blackwell, 1953. [Витгенштейн Л. Философские исследования. M.: Прогресс, 1988.] [8] Winston, P. H. Learning structural descriptions by examples.In: „Psychology of Computer Vision". (Ed. by P. H. Winston.) New York: McGraw-Hill, 1975. [9] Freud, Sigmund. Humour. 1927. (Transi, by Strachey.)—„Standard Edition", vol. 21: Hogarth Press, 1957, p. 161 — 166. [10] Davis, Randall. Meta-rules: Reasoning about control. In: „Artificial Intelligence". [11] Doyle, Jon. A Model for deliberation, action and introspection. (Ph. D. Thesis. M.I.T., Artificial Intelligence Laboratory.) Cambridge, Mass., August 1980. [12] Minsky, Marvin. Matter, mind and models.— In: „Proceedings of IFIP Congress 1965", May, 1965, p. 45—49. Reprinted in: „Semantic Information Processing", MIT Press, 1968. [13] Schank, Roger. Language and memory.— „Cognitive Science", 4, 1980, p. 243—284. [14] Newell, A., Shaw, J. C, and Simon, H. A. Preliminary description of general problem solving program (GPS-1).— „CIP Working Paper", No. 7, December 1957. [15] Minsky, Marvin. Heuristic Aspects of the Artificial Intelligence Problem. (Lincoln Laboratory, M.I.T., Lexington, Mass. Group Report No. 34—55. ASTIA Doc. No. AS236885), December 1956. [16] Winston, Patrick H. Learning to Understanding Analogies. (M.I.T., Artificial Intelligence Laboratory, AI Memo 520.) Cambridge, Mass., June 1979. [17] Papert, Seymour. Mindstorms: Children, Computers and Powerful Ideas. New York: Basic Books, 1980. [18] Sussman, Gerald J. A Computational Model of Skill Acquisition. (Ph. D. Thesis. M.I.T., Artificial Intelligence Laboratory, IA/TR-297.) Cambridge, Mass., August 1973. [19] Goldstein, Ira P. Understanding Simple Picture Programs. (Ph. D. Thesis, M.I.T. Artificial Intelligence Laboratory, IA/TR-294.) Cambridge, Mass., April 1974. [20] Thomas, Lewis. The Scrambler in the Mind.— In: „The Medusa and the Snail". New York: Bantam Books, 1980. [21] Lorenz, Konrad. King Solomon's Ring. New York: Thomas J. Growell, 1961. [22] Tinbergen, Niko. The Study of Instinct. London: Oxford UP, 1951. [23] Kuipers, Benjamin. Representing Knowledge of Large-Scale Space. (Ph. D. Thesis. M.I.T., Artificial Intelligence Laboratory, IA/TR-418.) Cambridge, Mass., July 1978.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ А Активация — фреймов 73 аналогия — общая 293 — частная 292 В Вопросы 260 — инструментальные 270 — каузально-антецедентные 270 — процедурные 270 — стратегические 261 — и их классификация 269—271 восприятие — речи 98—104 высказывание 95—118 и др. Д Диалог 258—280 дискурс 153—154, 158, 159, 177, 201, 237—238 3 Знание 6—7, 90, 177 — внутреннее 177 — лингвистическое 7, 94, 105 — нелингвистическое 94 — общее 173, 189 — о знании 281, 283 — о мире 6, 268, 274, 279 — о фреймах 89 — семантическое 165 — специфическое 16 — эпизодическое 165, 173 — и его активация 166 — и его использование 166 — и его представление 9, 161, 166, 272, 279 значение — конвенциональное 66—67 — контекстуальное 96—97, 100 — концептуальное 165 — лингвистическое 66 — предложения 234 — референциальное 165 — слова 293 — текста 164, 236 И Иерархии — неупорядоченные 114 — синтаксические 114 — упорядоченные 108, 114, 122 императивы — случайные 84 — постоянные 84 интерпретация — высказывания 79 — диалога 258 — дискурса 238 — контекстуальная 11О, 116, 121 — концептуальная 95, 99, 101, 103, 114 — лексическая 173 — прагматическая 94 — речевого сигнала 94 — референциальная 11О 310
— семантическая 95, 103, 114, 120, 121, 166 — синтаксическая 94, 121, 173 — ситуации 76 — текста 67—68, 173 — фонетическая 101, 121 — фреймовая 76 интерференция 19, 277—278 информация — когнитивная 166 — контекстуальная 98, 100, 161, 163 — предшествующая 104 — пресуппозиционная 158 — семантическая 120, 167, 263 — синтаксическая 120 — и ее поиск 279 искусственный интеллект 95, 155, 286—287 истинность 52, 63, 68—70, 73—76, 80, 90, 116, 243, 254, 256 — дискурса 238 — пресуппозиций 84, 87 истинностная оценка 86 К Категоризация 16—17, 19, 29, 31, 48 категории — когнитивные 47 — мышления 46 — релевантности 70 — языковые 47, 72, 106 классификаторы 12—13, 24, 28—29, 46, 50 классификация — категориальная 31 — мира 46 классификационная система 19 когерентность — глобальная 156 — локальная 156 когнитивная — информация 158 — модель 31, 173—176 — наука 6, 156, 183 — среда 229 когнитивное моделирование 156 когнитивные — механизмы 29 — процессы 125 — точки референции 36 — характеристики 34 компонентный анализ 114 контекст 63, 76—78, 95, 113, 172, 179, 215, 219—220, 222—227, 266, 271, 273 — высказывания 236 — искусственный 274 — лингвистический 66 — понимания 206 — предложения 74 — социальный 6, 159, 260, 265, 270, 279 — социокультурный 159 — употребления 66 — экстралингвистический 66 кореференция 114, 179 Л Лексические поля 57 логика — здравого смысла 282, 291 — когнитивного бессознательного 281 — и контроль над ней 285 M Метафора 29—30, 47—49, 282, 289, 291 метонимия 27, 47—49 — категориальная 34 модальность 182 модели 163 — базисные 23—24, 32, 37—39, 45— 46, 182 — дискурса 177, 237 — идеализированные 44—45 — идеальные 16 — Кинча—Дейка 192 — когнитивные 5, 46, 159, 163, 173 — когнитивной обработки 163, 169 — ментальные 114, 238, 240 — метафорические 32 — метонимические 32—34, 36—37, 39 — мира 254 — понимания текста 156, 158 — пропозициональные 31—32 — ситуации 178, 181, 185—188 — стереотипов 39 311
— стратегической обработки текста 153, 158, 163, 168 — схематические 31 — частные 36 — языковые 65 мотивация 28, 50, 169 H Намерения 6, 169 — говорящего 97, 232 О Обработка 10, 99, 121, 123—125, 228 — информации 119—133, 218, 225, 275 — когнитивная 156—162, 166, 219 — линейно-упорядоченная 121 — 122, 127—129, 133 — оперативная 104 — параллельная 122, 126, 131 — последовательная 122, 129 — сверху вниз 141, 169 — снизу вверх 141 — связного текста 160, 192 — языка 6, 124 — языковая 93, 265 ограничения 161 — интерактивные 160 — на запоминание 174 — на обработку информации 174—175 — памяти 175 отрицание 75—76, 78, 87 — внутрифреймовое 76—79 — контекстуально-свободное 76 — контекстуально-связанное 76 — межфреймовое 79, 88 — фрейма 79—80 П Память 6, 122 и сл., 130—131, 175, 181, 183, 190, 195, 204, 272, 277, 301 — буферная 192 — долговременная 131, 165, 168, 189 — кратковременная 130, 165, 168, 191 — 192, 200 — оперативная 131 — промежуточная 130—131 — семантическая 166—167 — текстовая 198 — экспертная 199, 203 — эпизодическая 164—165, 190 перспектива 72, 180 понимание 74, 93, 176—177, 180, 204, 241, 263 — высказывания 101, 130—131, 235 — идеологическое 162 — контекстуальное 98—99, 114, 119 — линейно-упорядоченное 93 — полное 94 — речи 98 — связного текста 9 — семантическое 98, 105, 119 — синтаксическое 98, 119 — социальное 162 — текста 71, 90, 194, 198 — фонетическое 119 — частичное 98 — языка 94, 98, 100—103, 109, 118, 133, 136, 142 — и его уровни 95—96, 98, 133 — и непонимание 96—97 понятия 41 представление, см. репрезентация пресуппозиции 53, 81, 84—86, 89, 113, 141 — высказывания 83 — семантические 81—82 принцип — релевантности 232 — семантический 88 пропозиция 164, 166—167 — локальная 171 — макро 169, 187, 203 препозиционные схемы 167 прототипы 34 процедура 240—241, 244—245 — верификации 240—241 психология — значения 234 — и искусственный интеллект 155 Р Релевантность 212—218, 223—225, 227, 230—231 — степени р. 217 312
— условия p. 212—213 репрезентация (представление) 107, 119 и сл., 141 и др. — контекстуальная 114—118, 132 — пропозициональная 235 — семантическая 132 — синтаксическая 106 и сл., 132 — структурная 104—118, 124, 131 — текста 176, 179, 185, 274, 277 — фонетическая 132 — и уровни 130 референция 114—116, 132, 178 — принципы р. 117 решение задач 178, 182 С Связность — глобальная 162, 164, 166, 171, 177, 179 — локальная 162, 164, 166, 171, 177, 179 семантика — интенсиональная 165 — истинности 52, 53, 62, 63, 73, 86 — лексическая 53, 56 — логическая 74 — логического следования 88 — понимания 52—53, 62—64, 68, 74, 83 — процедурная 234, 238—239, 256 — ситуационная 74 — текста 53 — теоретико-модельная 114—116, 239—240, 249 — формальная 50, 53, 74 — фреймов 60—62, 65, 68, 73, 76, 89 — экстенсиональная 165 — эмпирическая 58 семантические — поля 58 — теории 88 семантический анализ 113 сенсорный регистр 188 синтаксический анализ 120 стереотипы — социальные 34, 40 стратегии 9, 164 — вывода 168 — дискурса 172 — использования знаний 166 — конверсационные 171 — локальной связности 167 — макро 168 — перцептивные 127 — повторения аргументов 168 — понимания 153, 164, 171, 200, 204 — риторические 171 — семантической интерпретации — стилистические 170 — схематические 169 структура 94 — базисная 32 — внутренняя 95 — знания 31, 65, 193, 200 — композиционная 111, 116 — макро 167, 198 — понятийная 60 — репрезентативности 41 — радиальная 42—43 — семантическая 94, 101, 11О — синтаксическая 94—95, 99, 100—101 — ситуационная 114 — супер 169 — теоретико-множественная 115, 118 — цепочечная 24 сфера действия 133—139 Т Текст 53, 153, 156, 158, 164, 236 — и его семантический план 53 — и его тема 166 текстовая база 164—165, 181, 183 теория — интерпретативная 234 — категоризации 28 — когнитивных моделей 36 — компетенции 127 — лексического поля 58, 59, 61, 62 — макроструктур 188 — ментальных моделей 236, 255 — организации памяти 155 — остроумия 281 — понимания 204, 237 — понятийных структур 39 — прагматики 88 — прототипов 41, 50 — процедурной семантики 254 313
— семантическая 52 — синтаксических структур 106 — цензоров 288 У Умозаключение 70, 173, 249, 252, 275— 276, 284 — от референта 34 умолчание 290 уровни — описания 180 — репрезентации текста 180 Ф Фокус 11, 139, 267—270, 298 — высказывания 267 фреймы 8, 52—54, 58, 62, 64, 68, 70, 74—75, 79, 89, 185, 289 — абстрактные 67 — врожденные 65 — интерпретации 53, 61, 77 — исторические 89 — коммуникативного взаимодействия 173 — пропозициональные 186 — технические 74 Ц Цензоры 286, 293 Э Эффекты — контекстуальные 212—216, 218, 226 — ментальные 219 — неклассические 45—46 — прототипические 33, 36, 39, 46 Ю Юмор 281—282, 293, 297, 298 — и его генезис 299 — и эволюция 297
СОДЕРЖАНИЕ В. В. Петров и В. И. Герасимов. На пути к когнитивной модели языка (вступительная статья) 5 Дж. Лакофф. Мышление в зеркале классификаторов. Перев. с англ. Р. И.Розиной 12 Ч. Филлмор. Фреймы и семантика понимания. Перев. с англ. Л. Н. Баранова 52 М. Бирвиш. Насколько линейно упорядоченной является языковая обработка. Перев. с англ. И. Г. Сабуровой 93 Т. А. ван Дейк и В. Кинч. Стратегии понимания связного текста. Перев. с англ. В. Б. Смиренского 153 Д. Шпербер, Д. Уилсон. Релевантность. Перевод с английского В. И. Герасимова 212 Ф. Джонсон-Лэрд. Процедурная семантика и психология значения. Перев. с англ. И. М. Кобозевой 234 У. Ленерт. Проблемы вопросно-ответного диалога. Перев. с англ. Г. Е. Крейдлина 258 М. Минский. Остроумие и логика когнитивного бессознательного. Перев. с англ. М. А. Дмитровской 281 Предметный указатель. Составила С. Н. Сухомлинова 310
Новое в зарубежной лингвистике. Вып. XXIII. Когнитивные Н74 аспекты языка: Пер. с англ./Сост., ред., вступ. ст. В. В. Петрова и В. И. Герасимова.—М.: Прогресс, 1988.—320 с. В настоящем сборнике представлены работы, относящиеся к динамически развивающейся области исследований, проводимых на стыке языкознания, философии, логики, психологии и разработок систем искусственного интеллекта. Эти исследования объединяются глубоким интересом к изучению когнитивных аспектов языка, в частности таких проблем, как состав и организация базы знаний, используемых в процессах языкового функционирования, роль памяти в производстве и понимании языковых сообщений, моделирование процессов речевого общения на ЭВМ и т. п. В сборник включены статьи ведущих специалистов в этой области, изданные в 1982—1986 гг.: Ч. Филлмора, Т. А. ван Дейка и В. Кинча, Ф. Джонсона-Лэрда, М. Минского, М. Бирвиша, Дж. Лакоффа и др. 4602000000—630 H 25—88 006(01)-88 ББК 81
НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ Вып. XXIII Редактор М. А. Оборина Художественный редактор С. В. Красовский Технический редактор Л. Ф. Шкилевич Корректор Я. И. Шарганова Сдано в набор 01.09.87. Подписано в печать 31.08.88. Формат 60x84 1/16. Бумага офсетная № 1. Гарнитура "тайме". Печать офсетная. Условн. печ. л. 18,60. Уч.-изд. л. 24,54. Тираж 5650 экз. Заказ №1182. Цена 2 р. 90 к. Изд. № 42931. Ордена Трудового Красного Знамени издательство "Прогресс4" Государственного комитета СССР по делам издательств, полиграфии и книжной торговли. 119847, ГСП, Москва, Г-21, Зубовский бульвар, 17. Отпечатано с готовых диапозитивов на Можайском полиграфкомбинате Союзполиграф- прома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. Можайск, 143200, ул. Мира, 93.
ОПЕЧАТКИ Стр. Строка Напечатано Следует читать 89 23 сверху 98 98 98 98 98 137 13 сверху 14 сверху 15 сверху 19 сверху 16 снизу 16 снизу pretend 'занимается тем, ' что позволяет нам pretend по своему предназначению позволяет нам (2") F2 (s) = <Р, S> (2") F'2 (s) = <P, S> (3") F3 (s) = <P,S,LF> (3") F'3 {s) = <P,S,LF> (4") F4 (s, c) = <P,S,LF,C> F3 и F4 F* FA V")F'3(s,c) = <P,S,LF,C> F'3 и F^ F3 F'A F3 F'A