/
Текст
НОВОЕ В ЛИНГВИСТИКЕ Выпуск IV составил В. А. ЗВЕГИНЦЕВ ИЗДАТЕЛЬСТВО «Π Ρ О Г Ρ Ε С С» Москва 1 9 6 5
перевод с английского и французского под редакцией в. а. звегинцеβa (ii и iii разделы) и Д. Ю. ПАНОВА (I РАЗДЕЛ) ВСТУПИТЕЛЬНЫЕ СТАТЬИ В. А. ЗВЕГИНЦЕВА Настоящий выпуск сборника «Новое в лингвистике» состоит из трех разделов. Первый включает материалы симпозиума «Структура языка и его математические аспекты», проведенного Американским математическим обществом. Во втором разделе даются работы, опубликованные к IX международному конгрессу лингвистов, излагающие историю лингвистических направлений. Третий раздел содержит доклады пленарных заседаний IX международного конгресса лингвистов. Редакция учебников и филологии
I МАТЕМАТИЧЕСКИЕ АСПЕКТЫ СТРУКТУРЫ ЯЗЫКА
ПРИМЕНЕНИЕ В ЛИНГВИСТИКЕ ЛОГИКО-МАТЕМАТИЧЕСКИХ МЕТОДОВ 1. Не подлежит сомнению, что использование в языкознании математических и логических методов в значительной степени было стимулировано задачами прикладной лингвистики. Если и делались попытки приложения этих методов к решению проблем, непосредственно относящихся к области теоретического языкознания, например для разграничения явлений языка и речи 1, то в перспективе (хотя, может быть, и не всегда ясной и близкой) имелись в виду все же потребности прикладной лингвистики. Успех использования этих методов в совершенно новой области с общей точки зрения во многом обусловливается ответом на вопрос о том, в какой мере допустимо отождествление логически правильного языка с естественным языком, или, в другой формулировке, возможно ли сведение второго к первому2. Ответ на этот вопрос обычно дается в практической форме — посредством построения статистических, теоретико-информационных, теоретико- множественных, теоретико-вероятностных и других моделей языка, не всегда, впрочем, ориентирующихся на конкретные задачи. При построении подобного рода моделей их авторы нередко исходят из того допущения (очевидного с их точки зрения), что любое приложение формальнологического или математического аппарата к лингвистическому описанию и исследованию автоматически способствует их совершенствованию. По этому поводу хорошо 1 См. G. Herdan, Language as Choice and Chance, Gronigen, 1956. 2 Ср. замечание Г. Карри: «To, что существует тесная связь между математикой и логикой, с одной стороны, и языком —с другой, стало очевидным уже довольно давно, а сейчас этот факт оказался в центре внимания в более строгом смысле...» (см. ниже, стр. 98). 7
сказал Уоррен Плат в своем обзоре работ по математической лингвистике: «Если рассматривать языковые модели как абстрактные системы дискретных элементов, то к ним можно применять различные математические понятия и методы, начиная от элементарной идеи числа и кончая сложными логическими, статистическими и теоретико- множественными операциями. Однако представление о том, что всякое привлечение чисел и математических операций для описания таких систем элементов делает утверждения более «точными» или более «научными», является абсолютно ошибочным. Нужно прежде всего показать, что новая система, полученная таким образом, является более удовлетворительной моделью, чем исходная система, — либо в том отношении, что она дает возможность формулировать более простые и более общие теоретические утверждения о некоторых аспектах моделируемой области, либо потому, что операции над моделью проливают свет на результаты соответствующих операций в моделируемой области. Одна из самых больших опасностей, связанных с построением математических моделей языка, в особенности количественных, состоит в том, что неразборчивое использование математического аппарата неизбежно приводит к бессмысленным и дезориентирующим результатам. Поэтому необходимо ясно понимать, что предпосылкой обогащения лингвистики с помощью математики является не только знание соответствующих областей математики, но и, кроме того, глубокое понимание сущности лингвистических проблем, на разрешение которых должны быть направлены математические методы» 3. С тем чтобы по возможности избежать указанной Уорреном Платом опасности, необходимо располагать не только чисто эмпирическими попытками ответа на сформулированный выше вопрос, но и стремиться к его общетеоретическому осмыслению. По сути дела вопрос о сводимости естественного языка к той или иной логико-математической его модели или интерпретации есть основной вопрос теории прикладной лингвистики, необходимость создания которой ощущается все более настоятельно. Для решения данного вопроса в первую очередь должна быть рассмотрена природа тех явлений, которые составляют предмет изучения, с одной стороны, логики и математики, 3 См. статью Плата в настоящем сборнике, стр. 202. 8
а с другой — естественного языка, а затем также возможности тех методов, которые использует каждая из этих наук. Уже из сопоставительного изучения этих моментов окажется возможным сделать некоторые общие выводы. Последние могут быть не бесполезными для всех тех, кому по необходимости приходится проводить свои исследования на пересечении указанных наук. До известной степени эту цель преследовал и симпозиум «Структура языка и его математические аспекты», проведенный Американским математическим обществом. Избранные работы этого симпозиума и составляют нижеследующий раздел. Но все они, как это явствует и из самого названия симпозиума, затрагивают только отдельные и в ряде случаев весьма частные аспекты интересующей нас проблемы. Хотя в своей совокупности они и создают достаточно аргументированные предпосылки для ответа на поставленный нами вопрос, однако в них все же отсутствует четкое и недвусмысленное формулирование необходимых выводов. Во многом участники симпозиума продолжают линию эмпирических попыток разрешения данного вопроса, отнюдь не навязчиво предлагая свои опыты вниманию лингвистов в надежде, что последние уже сами разберутся в том, насколько предоставленные в их распоряжение гипотезы и решения окажутся пригодными для целей лингвистики. 2. Как кажется, мы уже располагаем недвусмысленным ответом на наш вопрос. Так, Н. Д. Андреев и Л. Р. Зиндер пишут: «Математическое представление (модель) языков отнюдь не тождественно самому языку» 4. Эту мысль развивает и автор книги «Модели языка» И. И. Ревзин, который указывает, что результатом моделирования может явиться лишь «более или менее близкая аппроксимация данных конкретной действительности» 5. Однако сказать так, значит еще ничего не сказать, поскольку остается 4 Н. Д. Андреев, Л. Р. Зиндер, Основные проблемы прикладной лингвистики, «Вопросы языкознания», 1959, № 4, стр. 18 5 И. И. Ρевзин, Модели языка, Москва, 1962, стр. 8. Кстати говоря, выражение «близкая аппроксимация» — прямая тавтология: близкая приближенность. 9
нераскрытым, почему это так, и следует ли все же обращаться к методу математического и логического моделирования, а если да, то в каких пределах и для какой цели. Прежде чем приступить к решению этих вопросов, необходимо сначала установить, к каким наукам — индуктивным или дедуктивным — относятся лингвистика, логика и математика. Что касается последних двух наук, то их положение ясно — они, бесспорно, относятся к дедуктивным наукам, которые опираются в своей исследовательской методике на умозаключение. Лингвистику же традиционно определяют как эмпирическую науку, поскольку полагают, что ее главной научной целью является описание фактов. Это значит, видимо, что лингвистика должна быть отнесена к области индуктивных наук. Это значит также, что, стремясь использовать в лингвистике формальный аппарат логики и математики, пытаются применить в индуктивной науке дедуктивные методы исследования. Впрочем, в последние годы индуктивная природа науки о языке косвенно или прямо стала подвергаться сомнению. В наиболее резкой форме это сделал Л. Ельмслев. Правда, используемая им терминология весьма сбивчива и, в частности, характеризуется своеобразным и очень личным пониманием терминов дедукция и индукция (фактически он истолковывает их в обратном смысле). Однако основы его лингвистической теории не оставляют никаких сомнений относительно ее методологической сущности. Так, он считает допустимым использование любых исходных операционных определений, что характерно для дедуктивных наук. И сам он в следующих выражениях характеризует свою теорию: «1. Теория в нашем смысле сама по себе независима от опыта. Сама по себе она ничего не говорит ни о возможности ее применения, ни об отношении к опытным данным. Она не включает постулата о существовании. Она представляет собой то, что было названо чисто дедуктивной системой, в том смысле, что она одна может быть использована для исчисления возможностей, вытекающих из ее предпосылок. 2. С другой стороны, теория включает ряд предпосылок, о которых из предшествующего опыта известно, что они удовлетворяют условиям применения к некоторым опытным данным. Эти предпосылки наиболее общи и могут поэтому удовлетворять 10
условиям применения к большому числу экспериментальных данных»6. Как явствует из этого высказывания, Л. Ельмслен стремится провести идею о двойственной методической природе объектов лингвистического исследования с преимущественным акцентом на их дедуктивные признаки. Ему следует приписать и тот довольно двусмысленный способ («с одной стороны.., но с другой стороны...»), который вообще стал характерным для рассмотрения данного вопроса (и который дает возможность повернуть в любую из сторон). Идея методической двойственности лингвистики получила в последнее время широкое распространение и даже послужила теоретической основой для формулирования принципов самого последнего по времени своего возникновения направления в науке о языке — лингвистики универсалий (универсалиализма). В «Меморандуме относительно лингвистических универсалий» говорится по этому поводу: «Изучение лингвистических универсалий ведет к целой серии эмпирических обобщений относительно языкового поведения — как еще требующих эксперимента, так и уже установленных. Эти обобщения представляют собой потенциальный материал для построения дедуктивной структуры научных законов. Впрочем, некоторые и, может быть, большинство из них пока располагают всего лишь статусом эмпирических обобщений, которые при современном состоянии наших знаний не представляется возможным соотнести с обобщениями или дедуктивно вывести из законов более общей значимости»7. С не меньшей определенностью выражается и Дж. Гринберг в своем предисловии к сборнику, посвященному лингвистическим универсалиям. Полемизируя с известными словами Л. Блумфилда о том, что «единственно правомерными обобщениями относительно языка являются индуктивные обобщения», он пишет: «Все же, по-видимому, считается общепринятым, что научный метод должен быть не только индуктивным, но и дедуктивным. Формулирование обобщений, полученных индуктивным исследованием, приводит к теоретическим гипотезам, на основе 6 Л. Εльмслев, Пролегомены к теории языка, Сб. «Новое- в лингвистике», вып. I, М., 1960, стр. 274—275. 7 «Memorandum Concerning Language Universals», в «Universals of Language», ed. by J. Greenberg, Cambridge, Mass., 1963, pp. 262 — 263. 11
которых путем дедукции в свою очередь могут быть выведены дальнейшие обобщения. Эти последние затем должны быть подвергнуты эмпирической проверке»8. То обстоятельство, что история языкознания состоит не только из накопления фактов языка и их классификации, но и из смены точек зрения на сам язык, что неизбежно предполагает различие подходов к языковым фактам и даже различное их теоретическое истолкование, заставило и некоторых советских лингвистов также прийти к выводам о методической двойственности их науки. С. К. Шаумян предпочитает, правда, говорить при этом о методе гипотетико-дедуктивном, и следующим образом излагает его особенности: «Гипотетико-дедуктивный метод представляет собой циклическую процедуру, которая начинается с фактов и кончается фактами. В этой процедуре различаются четыре фазы: 1) фиксирование фактов, требующих объяснения; 2) выдвижение гипотез для объяснения данных фактов; 3) выведение из гипотез предсказаний о фактах, лежащих за пределами круга фактов, для объяснения которых были выдвинуты гипотезы; 4) проверка фактов, которые предсказываются гипотезами, и определение вероятности гипотез. Гипотетико-дедуктивный метод принципиально отличается от индуктивного метода, применяемого в таких областях знания, как, например, описательная ботаника или зоология»9. Метод С. К. Шаумяна полностью повторяет метод лингвистики универсалий и Дж. Гринберга. Единственное различие состоит в наименовании. Если, например, Дж. Гринберг говорит о сочетании индуктивного и дедуктивного метода, то С. К. Шаумян именует свой метод гипотетико-дедуктивным — обозначение явно непоследовательное для метода, который «начинается с фактов и кончается фактами». Вопросом о том, куда следует отнести языкознание, задается и И. И. Ревзин. «По самой своей природе,— от- 8 «Universals of Language», p. IX. 9 С. К. Шаумян, Проблемы теоретической фонологии, М., 1962, сгр. 18—19. Относительно гипотетико-дедуктивного метода см. также статью В. С. Швырева, Некоторые вопросы логико- методологического анализа отношения теоретического и эмпирического уровней научного знания, в сборнике «Проблемы логики научного познания», М., «Наука», 1964, стр. 66—75 (3-й раздел статьи). 12
вечает он на этот вопрос,— языковедение должно прежде всего пользоваться индуктивными методами, оно описывает конкретные речевые акты конкретных языков... С другой стороны, наличие бесконечного множества речевых актов, изучаемых лингвистом, едва ли дает возможность сформулировать основные понятия науки о языке обобщением по индукции. Отсюда следует, что лингвисты нуждаются не только в индуктивных, но и в дедуктивных методах исследовав ния, чтобы получить систему общих знаний, помогающих осмыслить те данные, которые добываются при анализе конкретных языков... В своей дедуктивной части языковедение, по-видимому, может быть построено так, как строится логика или математика, а именно: выделяется некоторое минимальное количество первичных, неопределяемых терминов, а все остальные термины определяются через первичные. При этом должны быть четко сформулированы некоторые первичные утверждения о связи этих терминов между собой (аксиомы), и все остальные утверждения должны доказываться, то есть сводиться к некоторым другим утверждениям»10. Здесь метод дедукции, воплощающийся в логике и математике, выступает всего лишь как средство упорядочения «множества речевых актов», для целей создания «системы общих понятий». В прямом противоречии с этой задачей стоит, однако, изложение самого дедуктивного метода, рекомендуемого для использования в языкознании. Он полностью отмысливается и от актов и от фактов и за исходный момент построения системы общих лингвистических понятий принимает набор неопределяемых и, по-видимому, абсолютно условных первичных терминов, через посредство которых определяются все последующие термины. Это противоречие не случайно, оно кроется в самой природе рассматриваемых нами наук. Казалось бы, вывод о том, что при изучении лингвистических объектов допустимо сочетание индуктивного и дедуктивного методов, открывает двери для использования в лингвистике логических и математических методов, а конкретной реализацией этого вывода является создание многочисленных 10 И. И. Ρевзин, Модели языка, М., 1962, стр. 7—8. 13
формально-логических и математических моделей языка. Но, как будет показано в дальнейшем, такой упрощенный подход не может дать удовлетворительных результатов. Можно согласиться с тем, что в лингвистическом исследовании допустимо и даже необходимо сочетать дедуктивную и индуктивную методику. В конце концов, как писал В. Брёндаль, «индукция есть не что иное, как замаскированная дедукция, и за чистыми связями, установленными между наблюдаемыми явлениями, совершенно неизбежно предполагается реальность, специфический объект данной науки»11. Но это еще не значит, что в лингвистику следует безоговорочно и механически переносить формальный аппарат логики и математики без всякого учета «специфического объекта данной науки». Как справедливо замечает тот же И. И. Ревзин, «доказательства, полученные дедуктивным путем, сколь бы безукоризненными они ни были с логической точки зрения, еще ничего не говорят о свойствах реального языка, описываемого моделью»12. И для определения действенности моделей он рекомендует обратиться к практике, каковую представляет машинный перевод и «другие практические приложения, языкознания». А практика прикладной лингвистики свидетельствует, что на использование математических и логических методов при изучении явлений языка накладываются очень строгие ограничения. 3. Логика дает пример наиболее последовательного использования дедуктивного метода. Математика во многом следует в этом отношении за логикой, и поэтому они могут рассматриваться совместно. Разумеется, и логика, и математика в отношении своих методов и интерпретации целей не представляют гомогенных систем. Так, например, применительно к логике мы можем говорить о логике диалектической, формальной, математической и в более узком смысле — о предметной, семантической, феноменологической, трансцедентальной, или конструктивной, комбинаторной, многозначной, мо- 11 В. Брёндаль, Структуральная лингвистика. Цит. по книге В. А. Звегинцева «История языкознания XIX и XX вв. в очерках и извлечениях», ч. II, М., Учпедгиз, 1960, стр. 41—42. 12 И. И. Ревзин, Модели языка, М., 1962, стр. 10. 14
дальной и пр. По необходимости, однако, придется отмыслиться от всех подобных подразделений и говорить только о самых общих чертах, свойственных логике и математике в целом, и главным образом о тех, которые с наибольшей отчетливостью демонстрируют дедуктивный характер методов этих наук. Став на эту позицию, мы, следовательно, не будем обращаться к индуктивной логике. Отметим только, что выводы в индуктивной логике не определяются предпосылками — тем самым они не являются тавтологическими. Выводы в индуктивной логике находятся в прямой зависимости от фактов, а эти последние определяются объемом наших знаний — таким образом, они устанавливаются на вероятностной основе. Вероятность является основным методическим орудием индуктивной логики. Дедуктивную логику наиболее полным образом представляют формальная и математическая логики, имеющие много общего. Дедуктивная логика — наука, изучающая человеческое мышление или мыслительные акты со стороны их структуры или формы, отвлекаясь от их конкретного содержания. Таким образом, дедуктивная логика стремится сформулировать законы и принципы, соблюдение которых является обязательным условием для достижения истинных результатов в процессе получения выводного знания. Основным методическим орудием дедуктивной логики является импликация. Выводное знание она получает без непосредственного обращения к опыту или к практике, лишь посредством применения законов логики. В процессе дедукции предпосылка обусловливает вывод: если предпосылка истинна, то и вывод должен быть истинным. Таким образом, вывод заключается уже в предпосылке, и цель дедукции — сделать очевидным то, что в скрытом состоянии заключено уже в предпосылке. Отсюда следует, что всякий полученный посредством дедукции вывод тавтологичен, то есть логически является пустым, хотя с иных точек зрения, например в случаях применения формально-логического аппарата для целей других наук, может быть новым, неожиданным и оригинальным. Аналогичное положение имеет место в математике — обоснованность доводов в ней полностью покоится на дедукции. При этом в математике, как правило, приемлема любая исходная точка зрения, любой подход к решению 15
проблемы — лишь бы они удовлетворяли условиям математической дедукции. Математика располагает богатым набором такого рода «исходных точек зрения» и «подходов», которые исследователь альтернативно может использовать для решения своей задачи. Математическая проблематика часто переводима в разные эквивалентные формы, а каждая из них предполагает использование различных областей математической теории с целью решения проблемы. Таким образом, математик обладает фактически неограниченной свободой выбора предпосылок — он выбирает те из них, которые, с его точки зрения, таят в себе самые обещающие возможности для наиболее простого, небанального, изящного решения задачи. Его талант и опыт проявляются именно в удачном выборе предпосылок, тех «допустим, что...» или «если..., то», которыми пестрят математические работы. Так же как и в логике, математические предпосылки — аксиомы или постулаты — обусловливают определения еще не определенных единиц. Свобода выбора предпосылок в математике находится в прямой зависимости от тех нематериальных единиц или объектов, которыми она оперирует,— ее внимание направлено на отношения между ними. Математические объекты выступают в качестве символов, выражающих структуру чистых отношений. Математическую систему можно, таким образом, рассматривать как набор формальных отношений, существующих лишь в силу констатации этих отношений. Разумеется, в частности в прикладных целях, констатации отношений могут быть направлены на воплощение в них корреспонденции с внешней реальностью, что не окажет никакого воздействия на сами эти констатации, скорее, наоборот. Математики исследуют не «истинность» своих аксиом, хотя и требуют между ними взаимной согласованности. Исследование внутри математической системы есть исследование и установление связей, которые позволяют доказать, что факт теории А предполагает факт теории Б. Следовательно, основной вопрос в математике не «что такое А и Б», а «предполагает ли А (или обусловливает ли) Б?» Совершенно иное положение в лингвистике — она в основном ориентируется на первый из этих вопросов, и это не дает ей возможности оторваться от реальности; она, следовательно, оперирует не абстрактными, а конкретными единицами, хотя и стремится в ряде случаев к 16
созданию абстрагированных объектов вроде понятия фонемы или морфемы. Такое положение характерно не только для традиционной лингвистики, но в равной степени свойственно и новейшим ее направлениям, объединившимся под знаменем структурализма. Выше уже приводился ряд высказываний, авторы которых, пытаясь использовать в науке о языке не только индуктивные, но и дедуктивные методы (или математические и логические методы), не смогли все же обойти необходимость обращения к реальному лингвистическому факту. В дополнение к ним можно привести еще одно, которое вносит полную ясность в рассматриваемый вопрос. «Лингвистический анализ,— пишет в указанной связи П. Гарвин,— в основном индуктивный процесс в том смысле, что он стремится установить список элементов или набор констатации, исходя из лингвистических стимулов информантов или же из изучения текста. Он основывается на предположении, что в обоих этих источниках сведений окажется возможным распознать регулярно встречающиеся элементы различных типов и порядков сложности. Классификация этих типов и констатация их условий дистрибуции, полученные в результате анализа, образуют индуктивное описание языка»13. В лингвистике, конечно, также можно использовать метод предпосылок, исходя из которых затем определяются частные объекты, факты или единицы языка. Но здесь мы сталкиваемся с двумя особенностями, которые вносят существенные коррективы в использование этого метода. В отличие от логики и математики в этом случае будет искаться «истинность» полученных таким способом определений, то есть их соответствие данным опыта. Таким образом, устанавливается взаимозависимость предпосылки и выводного знания: предпосылка определяет вывод (определение частного лингвистического объекта в терминах предпосылки), но если вывод не соответствует данным опыта, то возникает необходимость коррективы самой предпосылки. Но такого рода коррективы предпосылки не имеют ничего общего с той переводимостью в эквивалентные формы, которая, как указывалось выше, допустима в математике, так как они обусловливаются не 13 P. Garvin, A Study of Inductive Method in Syntax, «Word», vol. 18, 1962, p. 107. 2 —2238 17
формальными соображениями, а данными опыта. Все сказанное дает основание заключить, что само понятие предпосылки и свобода ее выбора обладают в лингвистическом анализе специфичностью, с которой нельзя не считаться при использовании в языкознании дедуктивного метода. Лингвисты не могут пользоваться с такой свободой методом «если» или «допустим», как математики. Свобода предпосылок у них очень строго ограничена. История науки о языке знает немало смен «точек зрения» или, иными словами, исходных предпосылок, которые были подсказаны открытием новых фактов, распространением на лингвистику общенаучных идей или даже формированием оригинальных теорий. Но для лингвиста во всех подобных случаях смена «если», или исходной предпосылки, есть смена всей научной концепции. Поэтому лингвист говорит не «если», а постулирует свое понимание предпосылки, то есть фактически понимание предмета своего исследования, и, исходя из этого понимания, дает определение частных единиц языка, проверяя эти определения данными опыта. Последнее же обстоятельство, в силу взаимозависимости предпосылки и вывода в лингвистике, служит средством проверки и правомерности самой предпосылки, стоящей в начале дедуктивного по форме лингвистического анализа. Так, если обращаться к конкретным примерам, в прошлом язык истолковывался как выражение духовной сущности народа (у Гумбольдта), как естественный организм (у Шлейхера), как индивидуальная психофизиологическая деятельность (у младограмматиков) и т. д. Исследовательская практика, основывающаяся на этих концепциях, показала их недостаточность. Ныне исходной предпосылкой лингвистического анализа является постулат, что язык есть система знаков. Он подлежит такой же проверке опытом и практикой, как и любая другая концепция в науке о языке. Уже эти предварительные и самые общие соображения показывают, что дедуктивные методы вовсе не противопоказаны лингвистике, но применение их требует соблюдения специфических условий. Именно эти специфические условия накладывают определенные ограничения на механическое перенесение методов логики и математики в область лингвистики. Однако, если мы ограничимся такой общей констатацией, многое останется все еще неясным. Именно поэтому следует углубить разбираемый нами 18
вопрос и для подкрепления потенциальных выводов обратиться к практике прикладной лингвистики, где с наибольшей отчетливостью проявляется правомерность предпосылок и соответствие опытным данным сделанных на их основе выводов. 4. Отношения между языком и логикой носят весьма своеобразный характер. Представители эмпирических наук, к которым относится и лингвистика, изучают тот или иной предмет или явление с целью описать или объяснить его. Полученные ими результаты они формулируют на языке, который именуется языком-объектом. Логик орудует доказательствами, умозаключениями, суждениями и пр., но они доступны ему только в языковой форме. Таким образом, получается, что логик на одну ступень находится дальше от реального мира, чем представители эмпирических наук. Его анализ направляется не непосредственно на реальный объект, изучаемый эмпирическими науками, а на их язык14. Иными словами, он исследует язык и формулирует полученные результаты на языке, который именуется метаязыком. С логической точки зрения основной единицей языка является не знак и не обозначаемый им объект, а предложение, так как только в нем может развернуться логический процесс. Именно поэтому только предложение может быть истинным или ложным. А слова сами по себе не могут обладать этими качествами. Но прежде чем мы сможем установить, является ли предложение истинным или нет, мы должны констатировать, что оно имеет значение. Понятия истинности и значения относятся к области семантики, изучающей отношения между языком и обозначаемыми им объектами. Через посредство этих отношений и определяется истинность или ложность предложения: если предложение описывает объекты правильно, оно истинно, а если неправильно — нет. Но языковые выражения могут вступать в отношения иные, чем те, которые 14 «Логический анализ научного знания,— пишут в этой связи П. В. Таванец и В. С. Швырев,— есть прежде всего и непосредственно анализ языка, в котором выражается это знание». См. статью «Логика научного познания» в сборнике «Проблемы логики научного познания», М., «Наука», 1964, стр. 161. 2* 19
существуют между обозначаемыми ими объектами. Кроме того, предложения могут вступать в отношения с другими предложениями. Задача логика заключается в том, чтобы выяснить природу отношений между языковыми выражениями и предложениями и установить правила для определения того, выдерживается предписанная в данном случае процедура или нет. При решении этого последнего вопроса логик не обращается к объектам, описываемым предложением. Он интересуется лингвистической формой, а не ее содержанием, что, разумеется, не препятствует интерпретации ее содержания, в результате чего возникает формализованный язык. Формализованный язык может быть представлен в виде абстрактной системы, например исчисления предикатов. Итак, логик может в зависимости от задач исследования работать на двух уровнях — синтаксическом (логический синтаксис) и семантическом (логическая семантика). Рассмотрим сначала приложение первого из этих уровней к естественному языку. Если логик, занятый изучением языковых форм и существующих между ними отношений, может оставаться в пределах синтаксического уровня, оперируя несодержательными терминами, то лингвист этого сделать не может. Все уровни естественного языка (за исключением, может быть, фонематического) содержательны и поэтому вне семантики немыслимы. И более того, естественный язык не существует вне прагматики, которая не может быть легко отслоена от него в силу той простой причины, что в речевом акте она постоянно трансполируется в семантику. Поэтому естественный язык — всегда интерпретация и притом двуступенчатая, поскольку связана и с семантикой и с прагматикой15. И эта интерпретация не поддается пока никакой формализации. Перейдем теперь ко второму уровню, когда исчислению посредством семантических правил приписывается интерпретация. И в этом случае мы получим образование, никак не сопоставимое с естественным языком. Правда, 15 Ср. замечания Нилса Бора о математическом языке, где «необходимая для объективного описания однозначность определений достигается при употреблении математических символов именно благодаря тому, что таким способом избегаются ссылки на сознательный субъект, которыми пронизан повседневный язык». (Нилс Бор, Атомная физика и человеческое познание, М., ИЛ, 1961, стр. 96.) 20
здесь мы имеем дело с содержательными терминами, но в логическом и естественном языке они строят свое отношение к «истинности» на совершенно иных основаниях. Как пишет А. Тарский, «истинное», «во всяком случае, в его классической трактовке» является таковым в той мере, в какой оно «совпадает с действительностью»16. Но этот критерий истинности фактически применим лишь к естественным языкам, всегда ориентированным на действительность. По-иному обстоит дело в логической семантике. Семантический анализ опирается лишь на логическую интерпретацию системы и предполагает установление определенных правил, формулирующих условия истинности, ι Он предписывает следование этим правилам, не отвечая на вопрос о том, в какой мере здесь имеет место «совпадение с действительностью». Кроме того, сама ориентированность на действительность осуществляется в естественном языке не непосредственно, а через человека, что опять-таки делает необходимым обращение к третьему уровню,— прагматическому. «...Переход на семантический уровень,— констатируют П. В. Таванец и В. С. Швырев,— не есть само по себе возвращение к живому языку в его конкретности, как может показаться на первый взгляд благодаря тому, что смысловая функция языка есть как будто существо языка как «непосредственной действительности мысли». На самом деле исходная схема семантики «язык — действительность» не дает еще конкретного образа языка как непосредственной действительности мысли по той простой причине, что язык связан с действительностью не сам по себе неким мистическим способом, а через человека, через его действия, его поведение. Поэтому, собственно говоря, конкретное представление о языке как носителе мысли может быть достигнуто лишь на уровне его прагматического анализа по схеме «язык — действия человека с языком и на основе языка — действител ьность»17. Но и это еще не все. Касаясь данного вопроса, В. Μ. Глушков пишет: «Живой человеческий язык может рассматриваться как формальный язык лишь после того, как будет сформулирована строгая система правил, позволяю- 16 Α. Tarski, Grundlegung der Wissenschaftlichen Semantik (Actes du Congrès International de Philosophie Scientifique, 1936). 17 См. статью «Логика научного познания» в сборнике «Проблемы логики научного познания», М., «Наука», 1964, стр. 16. 21
щая отличить выражения, допускаемые в языке, от всех прочих выражений, то есть осмысленные предложения от бессмысленных»18. Разъясняя трудности, возникающие при формализации естественного языка, он далее указывает, что «...никакой фиксированный формализованный язык не может быть адекватен живому человеческому языку, поскольку последний в отличие от первого непрерывно развивается и совершенствуется. Поэтому всякая формализация любого живого человеческого языка представляет собой лишь более или менее удачный его мгновенный слепок, утрачивающий сходство с оригиналом по мере развития последнего»19. Если бы все сводилось только к этому, то это было бы еще полбеды. В прикладной лингвистике отмысливаются от моментов развития языка, стремятся рассматривать его как совершенно стабильную систему и все же никак не удается добиться формализации естественного языка. Происходит это по весьма простой причине. Формальная система и естественный язык основывают свою действенность на полярно противоположных качествах. Всякая формальная система всегда тождественна самой себе. Именно это ее качество делает возможным выполнение ею своих функций во всех конкретных случаях ее приложения. А естественный язык — в плане своего содержания, своей семантики или, как в этих случаях принято говорить, в своем информативном плане — никогда не тождествен самому себе. Именно эта его способность дает возможность функционировать ему во всех конкретных случаях его применения. Оставаясь тем же самым языком, он в разных ситуациях всегда иной. При этом он не обладает ни эксплицитными, ни формативными правилами, ни правилами истинности, ни трансформационными правилами для определения того, какое из потенциальных значений или оттенков значений получит данное слово в той или иной ситуации. Более того, почти любое слово естественного языка может получить значение, которое не зафиксировано никаким языком,— оно может, возникнув, закрепиться в языке, но с таким же успехом, подобно беглому огоньку, вспыхнув, затеряться в лингвистическом космосе и погаснуть. 18 В. Μ. Глушков, Мышление и кибернетика, «Вопросы философии», 1963, № 1, стр. 37—38 19 Там же, стр. 38. 22
И при всех этих своих качествах естественный язык оказывается изумительно совершенным орудием, которое позволяет добиться полного взаимопонимания относительно самых сложных понятий и в любых ситуациях. Почему это происходит? Видимо, ответ на этот вопрос частично следует искать в одной из мыслей основоположника семиотики Ч. Пирса, которую он настойчиво повторяет во многих своих работах. Она сводится к следующему. В современной лингвистике язык принято определять как систему знаков. Это исходная предпосылка для всего лингвистического анализа. Если это так, то язык не просто система знаков, а система взаимно интерпретирующих друг друга знаков, существующих в нем постольку, поскольку они интерпретированы в других знаках. Ч. Пирс формулирует это следующим образом: «Ни один знак не может функционировать в качестве знака, если он не интерпретирован в другом знаке. Следовательно, для знака абсолютно существенно, чтобы он воздействовал на другой знак»20. И в другом месте: «Все назначение знака состоит в том, что он будет интерпретирован в другом знаке»21. И, наконец, пожалуй, наиболее важное: «Знак не есть знак, если только он не переводит себя в другой знак, в котором он получает более полное развитие»22. Следовательно, естественный язык есть система знаков, которые посредством взаимной интерпретации получают возможность отвечать на все потребности человека в смысловом выражении. Но здесь необходима одна существенная оговорка. Ведь все потребности этого рода обусловливаются отношением человека к явлениям внешнего мира и общественной средой, в которой протекает его жизнь. В силу этого обстоятельства трансформационная семантика, если бы ее удалось создать, не может опираться лишь на правила взаимной интерпретации знаков, то есть носить закрытый и конечный характер. Она оказывается производной от очень большого количества величин, которые всячески противятся формализации. 20 Ch. Peirce, Collected Papers, Cambridge, Mass., vol. 8, p. 225. 21 Там же, vol. 8, p. 191. 22 Там же, vol. 5, p. 594. 23
В связи со сказанным важно рассмотреть особенности процедуры решения задач и само понятие решаемости в логике и математике, с одной стороны, и в лингвистике — с другой. Прежде чем приступить к решению проблемы в математике, эта проблема должна быть формулирована в точных терминах. Само это формулирование является предпосылкой успешного решения проблемы. При этом, как уже указывалось, математик может свободно трансформировать данное формулирование проблемы в эквивалентный вариант — она располагает для этого и соответствующими средствами. Уже на этой первой стадии исследовательской методики лингвистика существенно отличается от математики. При формулировании своих проблем лингвист располагает некоторым количеством наблюденных эмпирических данных, которым он не всегда может дать точную формулировку, но которые тем не менее он волей-неволей должен положить в основу своего исследования — уже в процессе самого этого исследования уточняются формулировки, нередко являющиеся целью самого исследования. Чтобы не идти далеко за примерами, можно сослаться на лингвистическое значение, которое лежит в основе исследований в области автоматической переработки речевой информации, но вместе с тем определяется весьма туманно и разноречиво. Именно это обстоятельство и заставляет исследователей данной области постоянно менять свою стратегию. Но вот исследование начато и достигнуто какое-то решение. Что это значит применительно к логике и математике и применительно к лингвистике? Логика, как указывалось выше, дает возможность эксплицитно представить заключения, имплицитно присутствующие в предпосылке. Однако логика не располагает правилами, использование которых может гарантировать, что при этом будет добыто желаемое решение, так как она есть не средство достижения новых выводов, а всего лишь методика определения их правильности. Она — не волшебный ключ ко всем тайнам. Совершенно очевидно, что если бы логика обладала подобными правилами, то тогда бы не было и нерешенных проблем. Достаточно было бы приложить определенный набор логических правил, и мы бы автоматически получали готовый ответ на любой мучающий нас вопрос. В свете сказанного специфическое значение приобретает и понятие решаемости проблемы или задачи. 24
В логике и в математике всякий конечный результат признается истинным, если в процессе доказательства не было нарушено никакое формальное правило. Так как при этом возможны разные пути доказательства, допустимо существование различных решений. Но все они могут быть подвержены проверке с точки зрения требования логики или математики. По-иному обстоит дело в лингвистике. Она не располагает аппаратом, с помощью которого можно проверить или доказать правильность полученных выводов. Соответственно с этим определяется и истинность достигнутых решений — она устанавливается не формальными правилами, а своим соответствием данным опыта. При этих условиях теоретически следовало бы ожидать единого конечного решения. Однако практически, как свидетельствуют об этом разноречивые лингвистические определения даже основных категорий языка, это не имеет места. В данном случае всегда присутствует известный субъективизм оценок, который в немалой степени определяется объемом фактов, находящихся в распоряжении исследователя. Отсюда следует, что истинность решения в лингвистике всегда дается в некотором приближении и имеет не детерминативный, а вероятностный характер. В этих условиях очень важно подвергнуть проверке на основе объективных критериев правильность лингвистических определений и истолкований. Возможность такой проверки дает широкая область прикладной лингвистики, где естественному языку противостоит машина, представляющая интересы логики и математики. 5. Для решения практических задач прикладной лингвистики используется цифровая вычислительная машина. Она способна воспринимать, хранить, передавать, перегруппировывать и выдавать информацию. Она интерпретирует и выполняет набор команд (программу команд), а также модифицирует их в процессе выполнения задания. Она в состоянии решать весьма сложные проблемы, но при этом весь процесс перехода от задания к решению должен быть исчерпывающе и непротиворечиво описан в терминах последовательности основных элементарных операций. Информация вводится в машину с помощью двузначного 25
(бинарного) кода или языка. Машина оперирует закодированными таким образом словами, соответствующими основным логическим связям или функциям исчисления высказываний или предикатов. Машина может решать сложные математические задачи именно в силу того, что сложные математические операции оказывается возможным свести к последовательности арифметических операций, а эти последние в свою очередь к логическим операциям. Следовательно, цифровую вычислительную машину можно рассматривать так же, как логическую машину. Таким образом, какой бы сложности ни была задача, машина решает ее с помощью последовательности элементарных операций, программа которых должна быть формулирована абсолютно недвусмысленно (непротиворечиво), точно, детально и исчерпывающе полно. Другими словами, она не должна выходить за те пределы, которые устанавливаются логическим исчислением высказываний; и когда мы задаемся вопросом о том, может ли машина совладать с обработкой информации, заключенной в естественных языках, нам прежде всего нужно выяснить, в какой степени логическое исчисление высказываний является адекватной моделью для естественного языка. Учитывая специфику цифровой вычислительной машины, описанную выше, первое, что необходимо сделать, чтобы машина «поняла» задание и начала обработку речевой информации в соответствии с этим заданием, это переформулировать информацию, содержащуюся в естественном языке, на логический язык. Речь идет о переводе естественного языка на язык логического исчисления высказываний. При этом, как показал Бар-Хиллел 23, приходится сталкиваться с такими трудностями, которые рисуют перспективы автоматической обработки информации в весьма мрачном свете, если не будет изменено все направление поисков решения данной проблемы. По меньшей мере придется считаться с перечисленными ниже препятствиями, для преодоления которых мы пока не располагаем необходимыми средствами. А. Логическое исчисление высказываний слишком бедно для того, чтобы можно было бы, даже с далеким при- 23 Y. Bar-Hillel, A Demonstration of the Non-feasibility of Fully Automatic High Quality Translation, «Advances in Computers», ed. by F. Alt., vol. I, N. Y., 1960, pp. 158—163. 26
ближением, произвести переформулировку естественного языка, невероятно сложного по своей семантической структуре, обладающего огромным объемом избыточных элементов и — самое главное — часто отличающегося такой неясностью и неопределенностью в выражении «смысла», что никакая двузначная логика не способна справиться с созданием искусственного двойника естественного языка24. Правда, логика, как указывалось, имеет дело лишь с лингвистической формой. Но поскольку дело идет об автоматической обработке информации, необходимо уметь различать и семантическую информацию, и если этого невозможно достичь с помощью имеющихся в нашем распоряжении логических средств, то откуда мы можем почерпнуть уверенность, что наш перевод естественного языка на логический правилен? Б. Машина не может учитывать того, что Бар-Хиллел называет «общими предварительными данными информации» (general background of information), которые фактически остаются за пределами естественного языка и поэтому не подлежат переводу на логический язык. Лингвисты в этих случаях говорят о внеязыковом контексте (frame of reference), который неприметным для нас, но очень решительным образом корректирует или даже подвергает полному переосмыслению все наши слова. Ведь даже такая простая фраза, как «Я вернусь засветло», для точного ее понимания и определения содержащегося в ней временного указания как минимум требует предварительного знания того, где она была произнесена и в какое время дня и года. Только подобного рода предварительная информация часто является единственным средством для уяснения тех внутрифазовых отношений, с которыми не в состоянии справиться ни исчисление высказываний, ни исчисление предикатов. Так, привлекая для примера два промелькнувших в газетах предложения: Аспирант университета из города Курска. Заслуженный рационализатор Сибири, мы видим, что каждое из них может быть истолковано двояким образом. Если придерживаться лишь формально- 24 В статье Ч. Хоккетта «Грамматика для слушающего», включенной в настоящий раздел, приводится много примеров такого рода сложностей в «естественном» понимании предложения, которые разрешаются последующими и далеко уходящими шагами анализа. 27
грамматических признаков, то первое предложение с одинаковым успехом можно понять и как «Аспирант из университета, расположенного в городе Курске» и как «Аспирант университета, проживающий в городе Курске (или происходящий из города Курска)». А второе предложение может быть трактовано и как «Заслуженный рационализатор, полем деятельности которого является Сибирь» и как «Заслуженный рационализатор, являющийся жителем Сибири». И только предварительные и никак не выраженные в предложениях знания (предварительная информация), констатирующие, что в городе Курске нет университета и что заслуженный рационализатор есть почетное звание, присваиваемое в Советском Союзе отдельными административными округами, дают возможность правильного понимания этих предложений. Если внимательно приглядеться, то почти за каждой фразой разговорного языка стоит весьма основательная и разветвленная предварительная информация, само собой разумеющаяся для человека, но лежащая за пределами «разумения» машины, которая не знает ни рода, ни племени. В. Машина не может делать внутритекстовые смысловые заключения, распространяющиеся на несколько предложений (а иногда даже намеренно на целый рассказ, чтобы до конца не раскрыть его персонажа или сюжетного хода). На это обстоятельство обратил внимание голландский лингвист А. Рейхлинг25, иллюстрируя свою мысль следующим примером. Допустим, что мы читаем некое повествование, которое начинается предложением: «Я играю с моим братом». Если мы на этом остановимся, то в нашем распоряжении не будет никаких данных для выяснения того, как же следует понимать эту фразу, о какой игре здесь идет речь. Ведь можно играть на деньги (в карты и пр.), на музыкальном инструменте, в театре или в кино, в игрушки, в футбол, играть для забавы, играть человеком и его судьбой и т. д. Но вот мы читаем дальше: «Я сказал это, когда Вильгельм однажды встретился мне 25 На коллоквиуме «Stichting Studiecentrum voor Administrative Automatisering», организованном в 1961 г. Имеется и немецкий перевод доклада: A. Reichling, Möglichkeiten und Grenzen der mechanischen Obersetzung, aus der Sicht des Linguisten, «Beiträge zur Sprachkunde und Informationsverarbeitung», Heft I., Wien, 1963. 28
в баре». Теперь уже с большей вероятностью мы можем заключить, что, по-видимому, речь идет об игре на деньги. Но все же существуют и другие возможности. Далее следует: «Мой брат подошел к столу, и кости были брошены». Теперь ясно, о какой игре идет речь, хотя нигде в тексте точного указания на действительный смысл слова «игра» не был дан. Мы догадались о нем по совокупности тех внешних примет, которые даны в тексте в разных предложениях. Эти приметы следуют здесь одна за другой, но в письменном повествовании они могут значительно отстоять друг от друга. Человек может выбрать их из широкого языкового контекста, сопоставить их и затем уже сделать соответствующее умозаключение. Машина же лишена этой возможности. Но, может быть, это не так важно? Действительно, при машинном переводе данных предложений на немецкий или французский языки особых трудностей не возникает (но трудности могут, конечно, возникнуть при переводе других предложений). При переводе на немецкий мы можем употребить буквализм: Ich spiele mit meinem Bruder. Точно так же и во французском мы можем начать: Je joue avec... При переводе же на английский возникают сложности грамматического порядка, потому что в приведенном тексте нет никаких указаний на то, какую форму должна выбрать машина: 1. I am playing with my brother, 2. I play with my brother, или 3. I'll play with my brother. И уж совсем плохо будет обстоять дело при переводе на испанский язык, так как машине придется выбирать по меньшей мере между тремя глаголами: jugar, tocar или trabajar. Тут логический язык беспомощен. Г. Машина фактически имеет дело с речью (или, точнее, с речевыми отрезками) — в ее письменной и устной форме. Каждая из этих форм речи имеет свою систему прагматических элементов, способных к тому же переходить в семантические (а правила такого перехода и не изучены и во многом произвольны). Так, например, устная речь обладает такой супрасегментной надстройкой, как интонация. Интонацию ныне представляется возможным классифицировать по функциональным типам, выделяя вопросительную, повествовательную и пр. интонации. Однако совершенно ясно, что интонация не существует в отрыве от предложений. Она, конечно, взаимодействует со 29
смыслом, заключенным в них. В подтверждение этого достаточно сослаться на риторический вопрос, который является вопросом только по своей внешней структуре, но не по значению — он не требует ответа со стороны слушающих. Таковы новые трудности, с которыми логический язык не имеет возможности справиться. Д. Но если даже удастся справиться с перечисленными языковыми трудностями, существуют еще препятствия собственно логического порядка — речь в данном случае идет о так называемых «правилах вывода решения» (decision rules). Ведь если мы хотим быть уверенными, что машина будет действовать логически безукоризненно, мы должны снабдить ее набором правил, следуя которым она и сможет последовательно пройти путь от исходной информации к необходимым выводам. Применительно к логическим исчислениям высказываний мы располагаем такими правилами, но для более сложных логик таких правил нет, и, более того, есть основания полагать, что такие правила нельзя найти. Если же ориентироваться на правила, которые в нашем распоряжении уже имеются, то использование их сделает процесс разрешения настолько сложным (даже при применении усовершенствованных вычислительных машин), что игра не будет стоить свеч. В таком виде рисуется проблема применения логических и математических методов в науке о языке на основании данных прикладной лингвистики. Каковы же выводы? Выводы уже формулировались выше — лингвистический анализ допускает сочетание индуктивных методов с дедуктивными, но когда мы говорим об использовании в лингвистике дедуктивных методов, не следует все сводить к слепому подчинению лингвистического исследования логико-математическим методам. Естественный язык восстает против такого насилия. И практика прикладной лингвистики подтверждает эти выводы, устанавливая, что между формализованным логическим языком и естественным языком существуют такие различия, что достаточно полный (в информативном плане), перевод второго в первый невозможен. Значит ли это, что в лингвистике, и в частности в прикладной, следует отказаться от использования логико-математических методов? Конечно, нет. Но только не следует полагаться целиком на них, а сочетать их с другими. И чтобы не быть голословными, обратимся к свидетельству математиков и логиков, ко· 30
торым на практике приходится применять свои знания к исследованию естественного языка. Вот что говорит математик: «Помощь математики в изучении естественного языка еще далека от очевидности... Прежде чем мы можем думать об использовании математики для исчисления, необходимо определить границы и функции лингвистических единиц... Это — внематемати- ческая задача, она является частью индуктивных методов в лингвистике. Выяснилось, что математика не заменяет эмпирической методологии, хотя некоторые лингвисты и стремятся к этому. Наоборот, только после того, как единицы и отношения естественного языка будут установлены индуктивным методом и соответствующим образом подтверждены (верифицированы), будут созданы необходимые условия для реалистического применения математики к естественному языку. При этом математики либо обнаружат, что они имеют дело с новой манифестацией того, что по своей сущности уже знакомо им, либо получат стимул для математического мышления нового порядка»26. А вот что говорит логик: «Перспективы автоматической обработки речевой информации очень хороши, но роль логики в этой области ограничена. Впрочем, как орудие лингвистического анализа, не как набор правил для выведения заключений, она дает реальные обещания»27. И далее он устанавливает, какая исследовательская стратегия при этом более предпочтительна: «Проблемы нужно решать не посредством непреклонного следования набору правил, установленных логиком, а скорее с помощью эвристической техники... Для автоматической обработки речевой информации предпочтителен эмпирический, индуктивный подход, при котором ищутся грубые правила для решения информационных проблем. Не следует пытаться переводить обычный язык на логический с целью дальнейшей его обработки, но скорее искать правила эвристического типа, которые позволят совладать с естественным языком. Необходимо прекратить поиски 20 P. Garvin and W. Karush, Linguistics, Data Processing and Mathematics, «Natural language and the computer», N. Y., 1963, pp. 368—369. См. также в той же книге статью W. Karush, The use of mathematics in the behavioral sciences, pp. 64—83. 27 M. Maron, A Logician's View of Language—data Processing, указанная книга, стр. 144. 31
абсолютной достоверности и обратиться к приближенным методам, которые с накоплением опыта будут уточнены и усовершенствованы. Мы предпочитаем рассматривать аппроксимации таким же образом, каким рассматривают теорию в науке, где видоизменения и усовершенствования производятся на основе данных, полученных в результате эксперимента» 28. Таковы общие выводы. Они говорят о том, что в совместной работе с логиками и математиками лингвистам принадлежит ведущая роль. В обязанность лингвистов входит подготовка языкового материала таким образом, чтобы сделать его доступным обработке логико-математическими методами. Именно в этом наgравлении следует искать реалистического сочетания в лингвистике индуктивных методов с дедуктивными. А когда при решении задач прикладной лингвистики речь идет об эвристических гипотезах, то они в первую очередь должны исходить от лингвиста, так как он ближе к языку и по своей должности обязан лучше знать и понимать его. 6. С учетом изложенных соображений следует подходить к включенным в данный раздел статьям. Как уже указывалось, они взяты из сборника материалов симпозиума по прикладной математике «Структура языка и его математические аспекты» (симпозиум проходил в Нью- Йорке в апреле 1960 г., материалы симпозиума были опубликованы в 1961 г.). В симпозиуме принимали участие математики, логики и лингвисты, то есть как раз представители тех наук, о совместной работе которых говорилось выше. Тема симпозиума, формулированная довольно свободно, давала его участникам возможность говорить как об очень частных и специальных вопросах, так и о достаточно общих, не связывая себя ни единым пониманием задач рассматриваемых вопросов, ни оценкой их удельного веса во всей проблеме в целом. Пожалуй, единственным объединяющим участников симпозиума теоретическим началом был тезис, приведенный Р. Якобсоном в «Предисловии» к материалам, в соответствии с которым лингвистику сле- 28 Там же, стр. 143—144. 32
дует рассматривать в качестве моста между математическими и гуманитарными дисциплинами. В остальном каждый автор сообщения выступал сообразно со своими индивидуальными интересами и в соответствии с направлением его исследовательской работы. В связи с определенным лимитом листажа настоящего сборника не представилось возможным использовать все включенные в материалы симпозиума статьи. Пришлось произвести некоторый отбор работ, однако с таким расчетом, чтобы он давал советскому читателю возможность составить достаточно полное представление об общих тенденциях в изучении той проблемы, которая стоит в названии симпозиума. В своем информационном качестве все статьи настоящего раздела представляют бесспорный интерес и для теории языкознания и для исследовательской практики прикладной лингвистики. В. Звегинцев
H. Хомский О ПОНЯТИИ „ПРАВИЛО ГРАММАТИКИ"* 1. Общие требования к грамматической теории. Традиционная задача грамматики состоит в том, чтобы выделить класс правильно построенных предложений и дать каждому из них то, что мы могли бы назвать «структурным описанием», то есть перечень единиц, из которых предложение образовано, способ их соединения, формальные соотношения этого предложения с другими предложениями и т. д. Если мы хотим пойти дальше традиционной грамматики, то необходимо дать точную формулировку понятия «структурное описание предложения» и точное объяснение того, каким образом структурные описания предложений строятся посредством «грамматических правил». Правила, содержащиеся в традиционной грамматике, чрезвычайно разнохарактерны, и не существует сколько-нибудь ясных указаний на то, какова должна быть в точности природа структурного описания. Современная лингвистика уделяет немало внимания уяснению этого вопроса, но она не рассматривает с достаточной серьезностью понятия «грамматическое правило». Невнимание к процессу, посредством которого структурные описания порождаются и приписываются предложениям, оставляет серьезный пробел в лингвистической теории и дает основания для серьезных сомнений относительно частных решений, касающихся выбора элементов грамматики в фактически проведенных описательных исследованиях. Ведь ясно, что такой выбор не может быть независимым от сложности той системы правил, посредством которой * См. Noam Homsky, On the Notion «Rule of Grammar», в «Structure of Language and Its Mathematical Aspects» (Proceedings of Symposia in Applied Mathematics, vol. XII), 1961, pp. 6—24. Источники финансирования те же, что и в работе Ингве — см. стр. 126, сн.*.— Прим. ргд. 34
строится структурное описание каждого предложения. Во всяком случае, нам кажется, что по-настоящему проникающая в суть дела лингвистическая теория должна начинаться с определения типов допускаемых грамматических правил и точного указания их форм и способа, посредством которого они налагают структурное описание на каждое из бесконечного множества грамматических предложений. Под «грамматикой языка L» я буду понимать некоторую систему (то есть совокупность правил), которая по крайней мере обеспечивает полное определение бесконечного множества грамматических предложений языка L и их структурных описаний. В дополнение к точному определению понятия «структурное описание» теория грамматики должна удовлетворять требованиям следующего рода. Она должна предоставлять в наше распоряжение: (1) а) класс возможных грамматик G1 G2,..., б) класс возможных предложений s1 s2,..., в) функцию f, при которой f(i, j) есть множество структурных описаний предложения si , предусматриваемых грамматикой Gj, г) функцию m(i), которая дает некоторое число, соответствующее грамматике Gi, д) функцию g, при которой g(i, n) является описанием конечного автомата, который, получив предложения (б) на входе, дает на выходе структурные описания, предусматриваемые грамматикой Gi- для этих предложений (то есть все возможно разные элементы множества f(i,j)); n является здесь параметром, определяющим козможности автомата. По поводу этих пунктов можно сделать следующие замечания: а) есть требование о том, чтобы общая теория языка обязательно давала схему и обозначения для грамматического описания, точную формулировку понятия «грамматическое правило»; б) может встретиться при разработке фиксированного фонетического алфавита, например теории различительных признаков Якобсона как части лингвистической теории; в) просто констатирует, что вполне можно определить, не прибегая к интуиции, что утверждает грамматика об отдельных предложениях. f(i, j) должно содержать больше одного структурного описания в том случае, если предло- з* 35
жение si неоднозначно,— то есть это одно из многих разумных эмпирических условий для грамматики некоторого языка; г) сводится к требованию оценки преимущества грамматик. Иначе говоря, m может быть мерой сложности, с помощью которой производится выбор между альтернативно предлагаемыми грамматиками, совместимыми с заданными условиями1. Совершенно очевидно, что если вообще возможно существенным образом удовлетворить условия (в) и (г), то ограничения, налагаемые на описательный аппарат условиями (а) и (б), должны быть чрезвычайно узкими и жесткими. Иначе говоря, только достаточно жестко ограниченная и специальная совокупность утверждений относительно природы лингвистических универсалий даст возможность оправдать с общей точки зрения предпочтительный выбор тех или иных грамматик; д) является требованием другого рода. Грамматика в описанном выше смысле является по существу теорией предложений для данного языка; она определяет множество предложений для данного языка (или порождает его, если употреблять специальный термин, который стал привычным в этой связи)2 и дает каждому порождаемому предложению соответствующее структурное описание. Однако грамматика не является моделью говорящего или слушающего. Она не синтезирует конкретных предложений, как это делает говорящий, и не узнает структуру конкретных предложений, как это делает слушающий. Она занимает нейтральное положение между слушающим и говорящим. Требование (1д) приближает нас на один шаг к теории реального использования языка. Мы можем попытаться так построить функцию g, чтобы g(i, n) явилось разумной моделью для образования (или распознавания) предложений говорящим (или слушающим), который освоил грамматику Gi и имеет объем памяти, оп- 1 Вопрос об оценке грамматик обсуждается также в моей книге "Syntactic Structures",The Hague, 1957, chapter 6 (русский перевод: «Новое в лингвистике», вып. II, ИЛ, М., 1962, стр. 412—528), и в «A Transformational Approach to Syntax» (Proceedings of the 1958 University of Texas Symposium on Syntax, § 10); см. также Morris Halle, On the Role of Simplicity in Linguistic Descriptions (статью Халле см. в настоящем сборнике, стр. 117—125). 2 См., например, Post, Recursively Enumerable Sets of Positive Integers and Their Decision Problems, «Bull. Amer. Math. Soc.»„ vol. 50, 1944, pp. 284 — 316. 36
ределяемый числом п. Заметим, что хотя грамматика Gi, освоенная человеком, использующим данный язык, является конечной, нельзя надеяться (а в случае естественных языков это заведомо неверно), что можно построить конечный автомат, который был бы способен принимать (или порождать) все предложения, порождаемые Gi, и только их, или который был бы в состоянии «понимать» именно эти предложения (то есть выдавать структурные описания для предложений в соответствии с Сi, если на его вход поступают именно эти предложения, а не какие-либо другие). Это не более странно, чем, например, случай с человеком, который прекрасно выучил правила умножения (возможно, не умея их формулировать), но оказывается не в состоянии вычислить в уме произведение 3872x18694, хотя правила, которые он вполне усвоил, дают однозначный ответ. Нам нужно только, чтобы существовал разумный метод g(i, п), с помощью которого при возрастании η можно было бы понимать, в соответствующем смысле, все большее количество предложений, порождаемых Gi (именно такая процедура может послужить моделью для действий человека, который, выучив арифметику, может выполнять все больше и больше вычислений, если его память и предоставляемое для работы время возрастают). Было бы абсурдным требовать от грамматик G1 и G2.., упомянутых в пункте (1а), чтобы они порождали множество цепочек или множество структурных описаний, которые можно было бы обработать строго конечными автоматами, совершенно так же, как было бы абсурдным требовать (для целей математических или психологических исследований) таких формулировок арифметических правил, которые бы вполне отражали возможности человека по выполнению точных вычислений в уме. Такое требование ни теоретически, ни практически не было бы достаточно мотивировано. Среди правил грамматики существуют и такие, которые играют роль в порождении бесконечного множества цепочек; каждая из этих цепочек является, по существу, орфографическим представлением некоторого грамматического предложения. Мы будем называть такие правила «синтаксическими правилами» (syntactic rules); окончательный результат применения только таких правил мы назовем «терминальной цепочкой» (terminal string). Другие правила, называемые «морфофонематическими» (morpho- 37
phonemic), превращают терминальную цепочку в фонетическое описание высказывания, то есть в одно из предложений si пункта (1б). Морфофонематические аспекты грамматики здесь больше рассматриваться не будут3. Частью структурного описания терминальной цепочки t будет разложение t на составляющие, обобщаемые в определенные типы. Мы назовем эту часть структурной характеристики «показателем НС-структуры»4 (Phrase-marker) терминальной цепочки t или, сокращенно, «НС-показателем» (P-marker). НС-показатель может быть изображен в виде дерева с отметками, на котором символ S (заменяющий слово sentence — «предложение») стоит у основания, символы t — в конечных узлах дерева, а отметки, указывающие типы составляющих (а именно: NP (Noun- Phrase), VP (Verb-Phrase), N (Noun) и т. д.), размещаются на остальных узлах. При изучении синтаксической теории мы считаем эмпирически заданными НС-показатели многих предложений на многих языках. При этом необходимо знать, каким образом можно построить лингвистическую теорию указанного выше типа, так чтобы грамматики, выбранные при помощи метода оценки га, обеспечивали бы такие НС-показатели, которые соответствовали бы данным эмпирическим условиям адекватности. 2. Грамматики непосредственно составляющих. В основе грамматики лежит некоторый словарь символов, используемых для' представления высказываний и их частей и содержащий, в частности, «априорный»5 фонетический алфавит, предоставляемый нам лингвистической теорией в соответствии с указанным выше условием (16). Предположим, что грамматика содержит, дополнительно, специальный «начальный» (initial) символ S и специальный «граничный» (boundary) символ #. Обычным простым предположением относительно типов грамматик (см. выше (1 а)) было бы такое: каждое правило является командой вида «написать φ вместо ψ» (символи- 3 См. Morris Hallе, Sound Pattern of Russian, The Hague, 1959 — для детального изучения структуры этих компонентов грамматики. 4 Сокращение— от «показатель структуры непосредственно составляющих».— Прим. ред. 5 С точки зрения обычной грамматики. 38
чески φ—ψ), где φ и ψ —цепочки символов. Если дана такая грамматика, то мы скажем, что σ' следует из σ, если σ= ...φ... и σ'=...ψ... (то есть, если σ' получается в результате подстановки ψ вместо φ для некоторого случая появления φ в составе σ), где φ->ψ является правилом этой грамматики. Мы говорим, что последовательность цепочек σ1..., σп является φ-деривацией, если φ = σ, и для каждого i цепочка σί+1 следует из σj. Мы назовем φ-деривацию терминированной (terminated), если ее последняя цепочка не содержит ни одной подцепочки χ, такой, что χ--> ω является правилом. В частности, мы будем интересоваться терминированными #S#-деривациями, то есть терминированными деривациями, которые начинаются с цепочки #S# 6. Предположим, что каждое синтаксическое правило φ—ψ удовлетворяет дополнительному условию, состоящему в том, что существует одиночный символ А и ненулевая цепочка ω, такие, что и Ψ = Χ1ωΧ2 Это правило предполагает, следовательно, что А можно заменить на ω (то есть что ω относится к типу А) в контексте χ1—χ2 (где χ1 или χ2 может, конечно, быть нулем). Совокупность правил, сопровождаемых таким условием7, я назову грамматикой непосредственно составляющих (constituent structure grammar). Если в каждом правиле φ—>ψ символ φ является одиночным символом, то грамматика (и каждое ее правило) будут называться контекстно-свободными (context-free), в остальных случаях — контекстно-связанными (context- restricted)8. 6 Для более подробного ознакомления с такими системами и изучения некоторых из их свойств см. мою работу: "On Certain Formal Properties of Grammars" ("Information and Control", vol. 2, 1959). 7 Фактически здесь нужно было бы добавить еще некоторые условия, обеспечивающие единственность соответствующего НС-показателя. Но они никак не повлияли бы на наше рассуждение. Нет необходимости требовать, чтобы морфофонематические правила удовлетворяли таким условиям, поскольку структурное описание на этом уровне не предусматривает деления на дальнейшие группы. 8 Анализ по непосредственно составляющим в том виде, какой он получил в лингвистике (в частности, в той форме, которую 39
В случае грамматики непосредственно составляющих нетрудно построить функцию f, согласно требованию, предъявляемому пунктом (1в). Эта грамматика определит НС-показатели терминальных цепочек. Нетрудно также дать достаточно разумное определение m условия (1г)9. Далее в этой главе мы будем рассматривать только контекстно-свободные грамматики непосредственно составляющих. Мы будем говорить, что φ доминирует над ψ (символически φ=ψ), если существует деривация σ1,..., σn, при которой σ1 = φ и σп= ψ (то есть если ψ является некоторым шагом при построении φ-деривации). В терминах «самоподчинения» (self-dominance) каждый нетерминальный символ А можно отнести к одному или более из следующих четырех важных типов: придал этой теории Зеллиг Харрис в своей работе "Methods in Structural Linguistics", Chicago, 1951, chap. 16), предполагает тип грамматики, близкий к тому, что здесь названо «контекстно-свободной грамматикой непосредственно составляющих». Другой подход, основанный на довольно близких идеях, восходит к теории семантических категорий Лесневского (Lesniewski) и был видоизменен применительно к лингвистическим целям Бар-Хиллелом (BarHillel, A Quasi-arithmetical Notation for Syntactic Description, "Language", vol. 29, 1953) и Лэмбеком (Lambek, The Mathematics of Sentence Structure, "Amer. Math. Monthly", vol. 65, 1958, а также "On the Calculus of Syntactic Types" в "Structure of Language and Its Mathematical Aspects", Amer. Math. Soc, 1961). Эквивалентность контекстно-свободной грамматики непосредственно составляющих, категорийной грамматики в смысле Бар-Хиллела и категорийной грамматики в более узком смысле Айдукевича (Ajdukiewicz, Die Syntaktische Konnexität, "Studia Philosophica", vol. 1, 1935) доказана в работе "On Categorial and Phrase Structure Grammars" Бар-Хиллела, Гайфмана (Gaifman) и Шамира· (Shamir), которая должна выйти в свет в «Бюллетене Исследовательского Совета Израиля» ("Bull. Res. Council Israel"); в этой работе две теории, определяющие тип грамматики, называются «эквивалентными» при условии, что любой язык, который может быть представлен грамматикой, допускаемой одной теорией, может быть также представлен грамматикой, допускаемой другой теорией. Контекстно- связанные грамматики непосредственно составляющих имеют большие порождающие возможности (см. "On Certain Formal Properties of Grammars", Theorem 4, p. 147), а контекстно-связанные правила в грамматическом описании практически неизбежны, какие бы теоретические возможности их исключения ни возникали. 9 См. мою работу "Logical Structure of Linguistic Theory", 1955, chap. 3 (в библиотеке Массачусетского Технологического Института имеется микрофильм). 40
(2) (I) А является нерекурсивным (non-recursive), если ни для каких ненулевых φ и ψ нельзя написать А=$уАу[\ (II) А является леворекурсивным (left-recursive), если имеется ненулевое φ, такое, что А =» Aφ; (III) А является праворекурсивным (right-recursive), если имеется ненулевое φ, такое, что A =>φA; (IV) А является самовставляющимся (self-embedding), если существуют ненулевые φ и ψ, такие, что Α =>φAψ. Если грамматика содержит леворекурсивные символы, она будет порождать НС-показатели, которые неограниченно ветвятся влево, как на рис. (2i); если она содержит праворекурсивные символы, то она будет порождать (i) А / \ (ii) А X в в/ ч (2) (iii) А такие конфигурации, как (2ii); если она содержит самовставляющиеся символы, она будет порождать конфигурации типа (2iii) и в отдельных любопытных случаях содержать в получающихся терминальных цепочках вставные структуры любой глубины. Вставные структуры обычны в естественных языках10. Следовательно, если 10 Примеры для английского языка, которые легко могут быть умножены, см. в моей книге "Syntactic Structures", chap. 3. Как леворекурсивные, так и праворекурсивные символы были найдены в НС-показателях всех языков, изученных до сих пор с этой точки 41
эти языки вообще допускают грамматики непосредственно составляющих, то эти грамматики должны содержать много самовставляющихся символов. Предположим, что Q есть НС-показатель. Тогда мы скажем, что В = (a1,..., ak) является ветвью Q, для которой каждое ai есть узел, если a1 есть корень и ai связано с ai +1 для каждого i<k. Каждый узел отмечен некоторым символом. Будем считать, что ai·= aj, если один и тот же символ отмечает ai- и aj. Предположим, что B1, В2 и В3 являются тремя различными ветвями Q, причем (3) (I) B1 = (a1,..., аj+к), (II) В2 = (a1,..., aj, b1..., br), (III) В3= (a1,..., aj, c1,..., cs) (j, k, r, s>l), (IV) aj+k= aj = aj+i. (1<i<k), (V) br находятся в Q слева от aj+k, а cs — справа от aj+k зрения. В некоторых из них (например, в английском) праворекурсивные структуры являются гораздо более частыми, в других — наоборот (например, в японском. Ср. Bloch, "Studies in Colloquial Japanese", II: Syntax, "Language", vol. 22, 1946, перепечатано в "Reading in Linguistics", ed. Joos. Предложение 24 анализируемого текста на стр. 182 этого последнего издания содержит, например, вставленную фразу такой структуры: /"4 Pt /Стч N NP N* Cm NN R PP К XS У / \ N Pt N Pt Этим примером я обязан Карлу В. Титеру). Хотя еще не был найден язык, в котором не встречался бы каждый из типов (I)— (IV), следует подчеркнуть, что изучение вопросов такого рода только начинается. 42
(в очевидном смысле, который, чтобы быть точным, требует отметки не только узлов, но и строк в Q). В этом случае мы будем говорить, что aj является самовставляющимся узлом (self-embedding node) в В1. Теперь мы определим степень Q как наибольшее целое п, такое, благодаря которому существует ветвь В = (a1,..., ak) и последовательность целых чисел (b1,..., bn), l<bi<bi+1< k такую, что каждый узел abi является самовставляющимся в В, а для каждой пары i и j справедливо abi _-_ abj. Другими словами, степень НС-показателя есть максимальное число самовставлений одной и той же составляющей или, иначе, максимальная глубина самовставления в этом НС-показателе. Так, например, для (2iii) степень была бы равна 2. Используя эти понятия, мы можем вернуться к (1д), то есть к вопросу о том, как грамматика непосредственно составляющих соотносится по своей производящей способности с конечным автоматом11, то есть устройством, которое обладает, как мы считаем, производящей способностью говорящего или слушающего, а кроме того, фиксированными вспомогательными средствами (хотя и не в каждом случае), и которое каким-либо образом выдает или воспринимает предложения. Нетрудно доказать, что: (4) Множество предложений не может быть представлено с помощью конечного автомата (то есть не является регулярным событием)11 именно в том случае, если все 11 Или конечному марковскому источнику в смысле Шеннона (ср. Shannon, Mathematical Theory of Communication, Urbana, 1949). Конечный автомат есть устройство с конечным числом состояний S0, ..., Sq и конечным словарем а0, ..., ат. Его поведение может быть описано с помощью конечного множества правил (i, j, k), причем каждая такая тройка букв указывает, что, будучи в состоянии Si, данное устройство может перейти в состояние Sk, выдавая при этом переходной символ aj (соответственно при чтении вводя в него символ aj). Обозначая начальное состояние через S0, мы можем определить порождаемую автоматом цепочку как последовательность переходных символов, выданную устройством (соответственно, последовательность символов, воспринятую на входе), когда оно, последовательно переключаясь, переходит от состояния S0 к первому возвращению в S0. Мы можем считать а0 элементом идентичности выходного (входного) алфавита. Множество предложений, выданных (воспринятых) таким устройством, есть то, что Клини назвал «регулярным событием» (ср. Kleene, Representation of Events in Nerve Nets and Finite Automata, Automata Studies, Princeton, 1956; об изучении таких устройств с точки зрения, близкой к принятой здесь, см. также Chomsky and Miller, Finite State Langua- 43
его грамматики непосредственно составляющих содержат самовставляющиеся символы 12. Мы можем также обнаружить тесно связанный с этим, но гораздо более интересный результат, который (в слегка упрощенном13 виде) состоит в следующем: (5) Существует механическая процедура g, с помощью которой для каждой грамматики Gi непосредственно составляющих можно построить функцию g(i, п), ges, "Inf. and Control", vol. 1, 1958; Rabin and Scott,. Finite Automata and Their Decision Problems, "IBM J. Res. Develop.", vol. 3, 1959). Как рассматривать такое устройство — в качестве производящего или воспринимающего предложения — вопрос, не столь существенный; это всего лишь вопрос о том, как читать обозначения, объясняющие это устройство. Предположение о том, что предложения производятся или воспринимаются устройством такого рода, почти ничего не говорит нам о способе его работы. Например, конечный автомат как воспринимающее устройство может запоминать длинную (хотя и ограниченную) последовательность символов, которую он затем обрабатывает справа налево, от центра к краям, или еще как-нибудь; он может обрабатывать цепочку в том порядке, в каком он получает ее символы,— слева направо; он может делать и то и другое некоторым более сложным путем. Если предложение узнает человек, то запоминание больших его частей должно во многих случаях предшествовать окончательной обработке; нетрудно найти примеры предложений, первые части которых нельзя понять, пока не будут получены последующие части. Вообще я считаю необходимым предостеречь от такого взгляда, что модель конечного автомата (марковский источник) каким-то образом предполагает обработку подлинных предложений слева направо (по мере их поступления) как при их производстве, так и при восприятии их. Не удивительно, конечно, что абстрактная система неструктурного типа, подобного описанному выше, является столь несовершенной (и сопровождаемой таким количеством альтернатив частного характера) моделью фактического поведения. 12 Простое доказательство этого см. у Xомского в работе Chomsky, A Note on Phrase Structure Grammars, «Inf. and Control», vol. 2, 1959. Более раннее доказательство, вытекающее из приведенного ниже результата (5), представлено в работе «On Certain Formal Properties of Grammars», где дано доказательство (5). 13 Упрощение состоит в том (это показано в цитированной работе Xомского), что результат (5) имеет место только для определенного класса К грамматик непосредственно составляющих. Этот класс грамматик должен быть ограничен (для простоты доказательства (5)) требованием, состоящим в том, чтобы словарь грамматик (то есть правила, которые дают терминальные символы) был полностью отделен от грамматических правил и чтобы эти грамматики допускали только двоичные разветвления составляющих (с некоторыми другими ограничениями). Таким образом, класс К ограничивается грамматиками того типа, которые лингвистами обычно рассматри- 44
дающую описание конечного автомата, который, получая на входе цепочку s, выдает на выходе все НС-показатели степени, меньшей п, приписываемые грамматикой Gi цепочке s. Попросту говоря, (5) предусматривает такую программу для универсальной вычислительной машины, что после ввода в запоминающее устройство машины с фиксированным объемом памяти правил грамматики непосредственно составляющих машина будет «понимать» любое предложение, порождаемое G, которое не будет содержать слишком много вставных образований непосредственно составляющих одного типа. Далее, устройство (5) оптимально. Другими словами, из (4) следует, что конструкция g не может быть улучшена по существу. Если бы грамматика G порождала НС-показатели любой степени, то, вообще говоря, конечного устройства, которое бы воспринимало (производило) именно предложения данного языка, предусматриваемые грамматикой G, не могло бы существовать. Поэтому метод g дает наилучший возможный способ удовлетворить условия (1д) в случае лингвистической теории, которая лимитирует грамматики контекстно-свободными грамматиками непосредственно составляющих g(i, n) не приносит плодов только тогда, когда успех в принципе недостижим. Мы можем думать об автомате g(i, n) как о модели14 говорящего или слушающего (безразлично), который знает ваются как типичный результат анализа по непосредственно составляющим. Однако в данной работе показано, что класс К достаточно широк для того, чтобы содержать грамматику языка, для которого вообще существует контекстно-свободная грамматика непосредственно составляющих. Далее, нетрудно так расширить класс К (к которому применима формулировка (5)), что в него могут быть включены и грамматики с правилами многих других типов, и, вероятно, даже так, что в него можно будет включить и все контекстно- свободные грамматики. Результат (5) в том виде, как он дан здесь, представляет собой тривиальную модификацию того, что фактически доказано в цитированной работе Xомского (он содержит также незначительную модификацию понятия конечного автомата, который имеет цель получить специальный род выхода). К приведенной конструкции нужно добавить лишь небольшое число правил, чтобы позволить g(i, η) выдавать НС-показатели предложений, которые он «понимает». 14 См. сн. 11. Следует еще раз подчеркнуть, что g(i, η) в том виде, как это определено здесь, никоим образом не является реальной моделью говорящего или слушающего, который владеет грамматикой Gi; это в лучшем случае первый шаг к такой модели. 45
и использует грамматику Gi, но имеет конечную память, определяющую допустимую степень η самовставления (self-embedding). Конечно, если ограничение памяти сопровождается увеличением времени или вспомогательных средств, то граница η возрастает. Мы могли бы предсказать, что такой говорящий или слушающий не в состоянии «обработать» предложение в том случае, если оно содержит слишком много самовставлений; но он должен быть в состоянии понимать или составлять предложения с леворекурсивными или праворекурсивными НС-показателями большой сложности или даже с различными вставными составляющими. Это единственное предсказание, которое следует из допущения о конечности памяти, и оно, по-видимому, в достаточной степени подтверждается фактами15. Поскольку в обсуждаемых вопросах было много путаницы, я хочу вновь подчеркнуть некоторые основные 15 Ингве высказал предположение («A Model and a Hypothesis for Language Structure», в печати), что грамматика может содержать средства, состоящие в переформулировании (reformulation) предложения, в результате чего частично преодолевается ограниченность памяти. Это важное наблюдение. По-видимому, многие своеобразные грамматические трансформации описываемого ниже типа являются чисто «стилистическими» в том смысле, что они не меняют существенно содержания, а ведут лишь к превращению некоторой цепочки в другую, ей эквивалентную, но с меньшим количеством самовставлений. Таковой является трансформация, благодаря которой that he left was unfortunate (которое содержит вставленное предложение he left) превращается в предложение It was unfortunate that he left, являющееся правоветвящимся, а не самовставляющимся. Cyществуег и другая трансформация, которая превращает the cover that the book that John has has в предложение John's book's cover — скорее левоветвящееся, чем самовставляющееся. Для полноты картины мы должны отметить, однако, некоторые трансформации, способствующие в общем увеличению сложности предложения, которое они переформулируют. Таковы, например, трансформации, благодаря которым I saw the old man превращается в It was the old man whom I saw или I gave the book to the old man— в It was to the old man that I gave the book и т. д. Следует также отметить, что концепция структурной сложности, предлагаемая Ингве, отличается от данной выше. В его формулировке левоветвимссть (left-branching) и самовставление (self-embedding) одинаково принадлежат к тому, что он называет «глубиной» (depth) (т. е. к структурной сложности). Таким образом, при его понимании «глубины» получается, что существуют НС-показатели сколь угодно большой глубины, которые могут быть восприняты (соответственно, произведены) строго конечным автоматом, таким, как g (i, n), пункта (5) (при фиксированном п). 46
положения. Из той предпосылки, что память конечна, а предложение слушается или говорится «слева направо» (то есть во времени), как и из той, что правила порождающей грамматики (которую следует резко отличать от модели говорящего или слушающего) могут быть частично упорядочены, нельзя ничего заключить относительно левого и правого ветвления НС-показателей. Все эти условия полностью совместимы с левым или правым ветвлением, продолжающимся как угодно далеко. Только само- вставление несовместимо с конечностью памяти. Предположим, однако, что мы приняли дополнительную гипотезу о том, что (А) говорящий производит НС- показатель предложения только «от головы к хвосту» (то есть что он неизменно выбирает грамматические конструкции раньше, чем слова, которые хочет употребить, и т. д.). Тогда окажется, что левые ветвления сверх некоторого предела допустить нельзя16. При совершенно аналогичном рассуждении из дополнительной гипотезы о том, что (В) слушающий производит НС-показатель (то есть строит структурное описание услышанного предложения) строго «от хвоста к голове», будет следовать, что нельзя допустить сверх некоторого предела правые ветвления, хотя левое ветвление в этом случае не представляет затруднений. Из этих двух дополнительных гипотез (А) представляется мне неоправданной ни теоретически, ни эмпирически, в то время как (В) не производит впечатления неправдоподобной 17. На основании гипотезы (В) мы могли бы предсказать, что слушающий будет стремиться группировать левовет- 16 Именно предположение (А), а не то, которое было сформулировано в предыдущем параграфе, лежит в основе модели, предложенной Ингве (см. наст, сборник, стр. 126—138). 17 Это, тем не менее, далеко не так очевидно, как кажется на первый взгляд. Существуют, как я думаю, более многообещающие подходы к теории слушающего. Ср., в частности, работы: Halle· and Stevens, Analysis by Synthesis, публикуемую в «Information and Control»; Halle, Review of Sbornik po masinnomu perevodu, «Language», vol. 36, 1960; MacKay, Mindlike Behavior in Artefacts, «British J. Philos. Sei.», vol. 2, 1951; Bruner, Neural Mechanisms in Perception» в «The Brain and Human Behavior», Solomon, Cobb and Penfield editors, p. 122f, и, в более общем плане, многочисленные исследования эффекта последовательности и ожи- даемости при восприятии, которые имеют прямое отношение к этим высказываниям. Попытка дать разумную оценку говорящему была, я думаю, затруднена преобладающим и совершенно ошибочным взглядом, 47
вящиеся элементы сложного предложения (например: many more than half of the rather obviously much too easily solved problems «много больше половины довольно очевидно слишком легко решаемых задач») вполне охотно как цельные элементы, тогда как правоветвящиеся элементы (например: the book that was on the table that was near the door that was newlypainted «книга, которая была на столе, который был около двери, которая была свеже- выкрашена» и т. д.) он при первом слушании будет рассматривать как последовательные и не связанные, а не как единые отрезки речи18. Какие бы факты ни обнаружились при надлежащем эмпирическом изучении этого вопроса, важно помнить, что ни (А), ни (В) не подтверждаются тем фактом, что говорящие (или слушающие) не в состоянии без вспомогательных устройств производить (или понимать) предложения с чересчур большим числом самовставлений. Этот факт, и только он один, следует из предположения о конечности памяти (в чем, конечно, никто и никогда не сомневался). Автомат g (i, п), существующий в силу (5), по сути дела производит анализ систематическим образом с помощью НС-показателя, избегая ограничений как в отношении левого, так и правого ветвления, но сохраняя ограничение памяти. Подобно этому, и другие доказательства, которые можно было бы привлечь для подтверждения первой или второй из гипотез (А) и (В), следует принимать во внимание с осторожностью. Так, неоднократно отмечалось, что существует тенденция избежать нарушения непрерывности, если вторгающийся элемент длинен или будто порождающая грамматика содержит в себе модель говорящего или каким-то очевидным образом связана с ней. Мне кажется весьма вероятным, что попытки построить модель для говорящего или слушающего, в данный момент явно преждевременны, поскольку мы едва ли можем претендовать на обладание адекватной характеристикой тех форм грамматики, которые предоставляют средства, используемые каким-либо образом при произнесении или понимании речи. 18 Это не кажется невероятным. Так, в правоветвящейся структуре (например, в The house that Jack built «Дом, который построил Джек» и в других подобных примерах) читающий стремился бы, я думаю, сделать интонационную паузу перед «that» в каждом предложении (в противоположность анализу по непосредственно составляющим) — обстоятельство, которое может навести на мысль, что эти правоветвящиеся структуры действительно труднее распознать. 48
сложен19. Такие предложения, как a) I called the man who read the book that was on the table that was near the door up «Я позвал человека, который читал книгу, которая была на столе, который стоял поблизости от двери» (с разъединенным глаголом call up) чрезвычайно неуклюжи и обычно заменяются на б) I called up the man... Если, принимая указанную выше гипотезу (А), мы измерим «глубину» способом, предложенным Ингве, то глубина б) будет или той же самой, что и для а)20, или меньше, чем для а), на единицу21. В обоих случаях, однако, едва ли глубина в указанном смысле способствует тому, что предложение а) становится неуклюжим, так как глубина а) при любом вычислении будет меньшей, чем глубина таких вполне нормальных предложений, как quite a large majority of the students here are hardworking «огромное большинство студентов здесь усиленно работают» и т. п. Внимательный разбор таких случаев, по-видимому, ведет к заключению, что тенденция избегать нарушения непрерывности не зависит от каких-либо простых соображений относительно левых ветвлений, самовставления или правых ветвлений. 3. Трансформационные грамматики. До сих пор наши рассуждения основывались на предположении, что грамматика непосредственно составляющих может породить множество правильных НС-показателей, построенных естественным и формально хорошо мотивированным способом. Однако имеются серьезные основания считать, что 19 Ср., например, мою работу «Syntactic Structures» (русск. перевод см. в сб. «Новое в лингвистике», вып. II, М., 1962, стр. 412—527). Вопрос представляется нетривиальным. Такие предложения, как I called the man you saw up, кажутся мне менее естественными, чем I called almost all of the men from Boston up, и, вообще, вставление короткого предложения (а следовательно, и самовставление) кажется менее естественным, чем вставление довольно длинной конструкции. Никоим образом не очевидно, что грамматические или интонационные исследования будут достаточны в таких случаях для определения меры относительной естественности. 20 Если анализ конструкции «артикль—существительное — относительное придаточное предложение» будет: (артикль — (существительное — относительное придаточное предложение)). 21 Если принятый анализ будет: (артикль — существительное — относительное придаточное предложение) или ((артикль — существительное) — относительное придаточное предложение). 4 -2238 49
это не так. Анализ по непосредственно составляющим как накладывающий на предложения слишком много структурных требований 22, критиковался резко и, я думаю, правильно. Рассмотрим, например, такое предложение: (6) Why has John always been such an easy fellow to please? «Почему Джон был всегда таким приятным парнем, которому легко угодить?» Все высказывание в целом является предложением, а последние несколько слов образуют именную группу (Noun-Fhrase); слова могут быть распределены по категориям. Но для дальнейшего деления на структурные группы оснований недостаточно. То же самое можно сказать о предложении I-brought-it-in-yesterday-from the garage- after dinner и о многих других. Во всех таких случаях анализ по непосредственно составляющим не отвечает сути дела, и грамматика непосредственно составляющих оказывается совершенно неэффективной. Примером крайних затруднений такого рода является случай правильного согласования, например, в предложении The man was old, tired, tall..., but friendly «Человек был стар, утомлен, высок..., но дружествен». Единственно правильный НС-показатель не приписал бы никакой внутренней структуры в пределах последовательности согласованных прилагательных. Однако грамматика непосредственно составляющих может обеспечить такую возможность только с помощью бесконечного числа правил; это значит, что неизбежно потребуется вводить новые структуры, притом совершенно произвольным образом. Примеры такого рода важны как напоминание о том, что для достижения адекватности лингвистическая теория должна предоставлять грамматики для любого желаемого бесконечного множества НС-показателей, а не только для любого, интересующего нас бесконечного множества предложений (естественный язык). Этому требованию теория непосредственно составляющих не в состоянии удовлетворить. Итак, намеченная выше теория грамматики не может быть принята в основном по той причине, что она непригодна для практического построения простых и эффективных грамматик. Попытка доказать это выходит далеко за пределы настоящей работы. Я не думаю, тем не менее, 22 См., например, Sledd, A Short Introduction to English Grammar, Chicago, 1959. 50
что тот, кто предпринял бы серьезную попытку приложить данную теорию в ее деталях к естественному языку, усомнился бы в этом. Большая часть затруднений23, которые встают на пути у грамматики непосредственно составляющих, по-видимому, может быть преодолена, если мы пересмотрим схему для грамматического описания (то есть (1а), см. выше) следующим образом. Мы ограничим рассмотренные выше правила подстановки φ—>ψ последовательностью правил, используемых для порождения конечного числа дериваций терминальных цепочек, с каждой из которых мы связываем, как и раньше, дерево с отметками, представляющее структуру составляющих. Таким способом мы порождаем только те терминальные цепочки, которые лежат в основе простейших предложений. Эти цепочки, тем не менее, включают в себя все или большую часть избирательных ограничений, налагаемых на выбор элементов. Теперь мы добавим к грамматике совокупность операций того типа, который был назван Хэррисом24 «грамматическими трансформация- 23 Указания на некоторые из них даны в моей работе «Logical Structure of Linguistic Theory», chap. 7 и 8, «Syntactic Structures», chap. 6 (перевод на русск. последней см. в сб. «Новое в лингвистике», вып. II, стр. 412—528). 24 В своих работах («Discourse Analysis» в журн. «Language», vol. 26, 1952 и «Discourse Analysis: a Sample Text», там же) Хэррис освещает важное обстоятельство, заключающееся в том, что большие области традиционной грамматики, которые оказались совершенно вне поля зрения современной лингвистики, могут быть единообразно исследованы при помощи введенного им понятия грамматической трансформации. В своей работе «Co-occurrence and Transformation in Linguistic Structure» в «Language», vol. 33, 1957 (русск. перевод см. в сб. «Новое в лингвистике», вып. II, стр. 528—636) он развивает понятие грамматической трансформации (с приложениями к английскому языку), трактуя его как отношения, сохраняющиеся между двумя последовательностями классов морфем. Эти классы могут быть частично спаяны друг с другом таким образом, что в спаянных классах может иметь место одинаковый набор морфем. Уорс приложил это понятие к изучению флексий в русском языке в своей работе «Transform Analysis of Russian Instrumental Constructions», «Word», vol. 14, 1950 (русск. перевод см. в сб. «Навое в лингвистике», вып. II, стр. 637—683). Излагаемые мною соображения будут иметь лишь небольшое формальное сходство с данной концепцией, хотя они и были подсказаны наблюдениями Хэрриса. Хэррис основывается па теории грамматических трансформаций, данной в работах, ссылки на которые приведены в сносках 2 и 9 и в моей работе «Three Models for the Description of Language», «I. R. E. Transactions on Information Theory», vol. IT—2, 1P56. По поводу исследования больших разделов английской грамматики, по суще- 4* 51
ми». Каждая из них является отображением НС-показателей на НС-показатели. Рекурсивное свойство грамматики теперь целиком приписывается этим трансформациям. Я кратко расскажу сейчас, каким образом схему для грамматического описания можно расширить так, чтобы получить операции требуемого типа, и каким образом эти операции накладывают НС-показатели на терминальные цепочки, образованные путем их применения к уже порожденным НС-показателям (то есть каким образом следует пересмотреть функцию f в условиях 1в (см. выше), в соответствии с описываемым здесь расширением типа грамматик25). Основания для добавления трансформационных правил к грамматике совершенно ясны. Существуют определенные предложения (в сущности, простые утвердительные предложения в активном залоге, без каких-либо сложных именных или глагольных групп или, более точно, терминальные цепочки, лежащие в основе этих предложений), которые могут порождаться грамматикой ству, в том же направлении, которое, однако, выходит за пределы изложенного в указанных работах, см. R. В. Lees, A Grammar of English Nominalizations, Baltimore, 1960 (приложение к «International Journal of American Linguistics»). Эта книга содержит также некоторый материал по турецкому и немецкому языкам. Кроме того, материалы по немецкому языку даются в работе J. R. Applegate, Structure of the German Noun Phrase (готовится к печати). Дескриптивные исследования по английскому языку существенным образом расширены следующими работами: Lees, Adjectival Constructions in English (печатается в «Language»); Lees and Klima, «Rules for English Pronominalization» (печатается) и Klima, Negation in English (печатается). Klima дает материал по русскому языку в своем обзоре работы Галкиной-Федорук «Безличные предложения в современном русском языке» («Int. Journ. of Slavic Ling, and Poetics», vol. 5, 1961). В сущности, с тех же самых теоретических позиций подходит к исследованию языка американских индейцев и Мэтьюс (см. G. H. Matthews, A grammar of Hidatsa (в печати); ср. также его работу «Ergative Relation in Hidatsa», Quart. Prog. Rep. of Re?. Lab. of Electronics, January, 1960), а также грамматики нескольких языков Филиппинских островов, подготавливаемые к печати Стоквеллом (R. Stockwell) и несколькими его студентами. 25 Действительно, само понятие «структурное описание предложения S» следует расширить так, чтобы оно включало наряду с ПС-показателями для S и цепочками, лежащими в основе трансформаций S, также некоторый объект, который мы назвали бы Т-показателем, представляющим трансформационную историю 5. Однако здесь я не намерен углубляться в этот вопрос. 52
непосредственно составляющих совершенно естественным образом. Но имеются и другие предложения (например, с пассивными или вопросительными конструкциями, предложения с прерывными группами или сложными группами, включающими трансформы предложений, и т. д.), которые не могут быть порождены экономным и естественным путем с помощью грамматики непосредственно составляющих, но которые соотносятся систематическим образом с предложениями более простой структуры. Трансформации, создаваемые для выражения такого соотношения, могут реально упростить грамматику, в тех случаях когда ими будут пользоваться для порождения более сложных предложений и их структурных описаний из уже полученных более простых предложений. Задача состоит в том, чтобы создать общее и абстрактное понятие грамматической трансформации, воплощающее в себе, а также облегчающее выражение именно тех формальных отношений между предложениями, которые имеют значащую функцию в языке26. Прежде всего ясно, что применение трансформации к цепочке требует знания структуры составляющих этой цепочки. Так, вопросительная трансформация (question transformation) сводится к постановке в начальную позицию (препозицию) некоторого элемента основной глагольной группы утвердительного предложения. Будучи применена к (7), она дает (8), но не (9): (7) The man who was here was old. «Человек, который был здесь, был старым». (8) Was the man who was here old? «Был человек, который был здесь, старым?» (9) Was the man who here was old? «Был человек, который здесь был, старым?» 26 Так же как и в случае с НС-показателями (см. выше), для построения серьезной концепции мы должны заранее знать некоторые эмпирические условия, которым понятие «грамматической трансформации» должно удовлетворять. Так, мы уславливаемся, что разумное понятие грамматической трансформации должно приводить к заключению, что John saw Bill и Bill was seen by John соотносятся совершенно иначе, чем John saw Bill и Bill saw John, и т. д. Я не думаю, что существует какая-либо разумная альтернатива к этому подходу в теории трансформаций или в любой другой лингвистической теории; да и ни в каком другом смысле этот подход не вызывает никаких возражений. 53
Следовательно, мы должны знать, что второе, а не первoe was следует внести в начало предложения, а это требует, чтобы мы располагали знанием структуры составляющих. Аналогичным образом, мы хотим, чтобы трансформация пассивного залога (passive transformation) применялась к предложению The man saw the boy «Человек заметил мальчика» и давала The boy was seen by the man «Мальчик был замечен человеком», а не к предложению The man saw the boy leave «Человек заметил, что мальчик ушел», образуя, скажем, The boy leave was seen by the man «Мальчик уйти был замечен человеком»*. Следовательно, мы должны знать, какие подцепочки каждого предложения являются именными группами, а какие вспомогательными и глагольными. Трансформация не может быть просто операцией, определяемой для терминальных цепочек или последовательностей классов морфем без каких-либо дальнейших структур. Столь же бесполезно для трансформационного анализа было бы рассматривать трансформации как более высокий уровень правил подстановки (rewriting rules), которые применяются при невыработанных обозначениях групп. В случае пассивного залога, мы, как правило, имеем (10) NP1 Auxiliary Verb NP2— NP2 Auxiliary be Verb en by NP1 или что-нибудь в этом роде. Такое правило принадлежало бы к типу, рассматривавшемуся в § 2, но не удовлетворяло бы дополнительному условию, накладываемому на правила анализа по непосредственно составляющим (а именно, условию, гласящему, что подставляется только единичный символ — ср. § 2) и представляющему конструкцию НС-показателя в том виде, как было предложено выше27. * Невозможный английский оборот соответственно дан по-русски.— Прим. ред. 27 Это значит, что грамматика превратилась бы просто в систему правил φ —> ψ, где φ и ψ являются цепочками символов. Другими словами, она стала бы системой хорошо изученного типа, именуемой обычно «полу-Туевой системой» («semi-Thue system») (ср., например, Davis, Computability and Unsolvability, New York, 1958, chap. 6). Лингвистическая теория при этой совершенно не структурной формулировке сократилась бы, в сущности, до утверждения, что грамматика есть произвольная машина Тьюринга. Это наиболее общая (и следовательно, наименее интересная) возможная формулировка грамматической теории. Очевидное увеличение гибкости, 54
Трансформации, сформулированные таким образом, не дали бы возможности упростить грамматику, в которой появляются избирательные ограничения на выбор элементов. Так, в числе предложений активного залога мы обнаруживаем: (11) (a) The fact that the case was dismissed doesn't surprise me. «Тот факт, что дело было прекращено, не удивляет меня»; (б) Congress enacted a new law. «Конгресс утвердил новый закон»; (в) The men consider John a dictator 28. «Люди считают Джона диктатором»; (г) John felt remorse. «Джон чувствовал угрызения совести», и т. д., но не отрезки, полученные путем взаимозамены субъекта и объекта в таких предложениях. В соответствующих предложениях пассивного залога избирательные отношения вполне очевидно сохраняются, получая другое оформление. Если бы трансформацию пассивного залога пришлось применить в качестве «правила подстановки» на стадии деривации, предшествующей применению контекстно-связанных правил подстановки, дающих избирательные ограничения на выбор подлежащего, глагола, дополнения (как, например, в том случае, если бы (10) было взято в качестве формулировки этого правила), то тогда потребовалось бы дать совершенно независимую систему контекстно-связанных правил, чтобы определить соответствующий выбор подлежащего, глагола и действую- возникающее в результате отбрасывания всех ограничений на форму грамматики, совершенно иллюзорно, поскольку это лишь сдвигает проблему выявления формальных черт, которые отличают естественный язык от произвольных эффективно различаемых (рекурсивно перечисляемых) систем, с характеристики условия (1а), описанного выше (куда по-настоящему должна быть отнесена эта проблема), к характеристике условий (1в,г). Пересмотр трансформационной теории, критикуемой здесь, в сущности, в неявной форме подсказан Хаузхолдером (Householder) (если я правильно его понимаю). См. егс работу «On Linguistic Primes»,«Word», vol. 15, 1959, p. 233 и реценз. на книгу Хоккетта «A Course in Modern Linguistics» в «Language», vol. 35, 1959, pp. 506—507, 517. 28 Точнее, мы должны были бы здесь иметь терминальную цепочку «the men—consider a dictator—John», которая сама, конечно, является трансформом более простых цепочек. 55
щего лица (agent) в пассиве. Одно из достоинств трансформационной грамматики состоит в том, что она дает возможность избежать этого бессмысленного дублирования избирательных правил. Но это преимущество утрачивается, если применить трансформацию раньше, чем произведен выбор конкретных элементов29. То же самое справедливо и в отношении большинства трансформационных правил. Таким образом, на мой взгляд, вполне очевидно, что трансформационное правило должно применяться к полному НС-показателю. Поскольку трансформационные правила должны затем вновь применяться к трансформам, то из этого следует, что результатом применения трансформации должен быть снова НС-показатель, а именно деривационный НС-показатель терминальной цепочки, получившейся из трансформации. Грамматическая трансформация, таким образом, есть отображение (mapping) НС-показателей на НС-показатели. Мы можем формулировать понятие «грамматической трансформации» следующим образом. Предположим, что Q есть НС-показатель терминальной цепочки t и что t можно разделить на последовательные отрезки t1, ..., tn таким образом, что каждое ti будет соотноситься в Q с узлом, обозначенным Аi. Мы говорим в этом случае,что (12) t анализируема как (t1, ..., tn; A1, ..., Ап) относительно Q. В простейшем случае трансформация Τ будет частично определяться последовательностью символов (А1, ..., Ап), которая ограничивает ее область следующим правилом: (13) цепочка t с НС-показателем Q является областью T, если t можно анализировать как (t1, ..., tn; А1,···, Ап) относительно Q. В этом случае мы будем называть (t1,..., tn) собственно анализом (proper analysis) t относительно Q, T, а (A1, ..., Ап) — структурным индексом (structure index) T. Чтобы завершить определение трансформации Γ, покажем, какое влияние оказывает эта Τ на члены собственно 29 В каждом частном случае можно использовать то или иное правило или прием «на данный случай» (ad hoc), чтобы справиться с задачей. Но какой-либо альтернативы общего характера к трансформационному подходу в этом вопросе пока еще не предложено. 56
анализа цепочки, к которой она применяется. Так, Τ может приводить к сокращению или перестановке определенных членов, к подстановке одного вместо другого, к добавлению постоянной цепочки в фиксированном месте и т. п. Предположим, что мы связываем с трансформацией Τ некоторую основную элементарную трансформацию Те1, которая является формальной операцией некоторого рода над п-членами, где структурный индекс для Τ имеет длину л. Пусть <14) Tel(i; t1 ..., tn)=σi где (ti, ..., tn) есть собственно анализ t относительно Q, Τ и где Те1 лежит в основе Т. Тогда цепочка, получающаяся в результате применения трансформации Τ к цепочке t с НС-показателем Q, есть (15) T(t, Q)=σ1, ..., σn. Вполне очевидно, что мы не хотим квалифицировать некоторое произвольное отображение только что описанного типа как грамматическую трансформацию. Так, нам бы не хотелось допускать в грамматике трансформацию, которая связывает такие пары, как: (16) (I) John saw the boy — I'll leave tomorrow. «Джон видел мальчика — Я уеду завтра»; (II) John saw the man — why don't you try again. «Джон видел мужчину — почему ты не попробуешь снова»; (III) John saw the girl—China is industrializing rapidly. «Джон видел девочку — Китай индустриализуется быстро», и т. д.30, а только такие правила, которые выражают истин- 30 Точнее, теорию трансформаций следует определить так, чтобы отношение этого рода можно было выразить только с помощью некоторой последовательности трансформаций. Заметим, что программа, подобная (1) (см. выше), становится непригодной, если строго не ограничить выбор возможных трансформаций. Чем шире класс допускаемых трансформаций, тем труднее становится удовлетворить требованию (1г) по существу. (Ср. замечание на стр. 35—36 относительно условий (1в, г), а также прим. 26.) Более адекватную и точную формулировку для (17) (см. далее) можно найти в моей работе «Three Models for the Description of Language», p. 122, (44)-(46). 57
ные структурные отношения между формами предложения, например между активными и пассивными, утвердительными и вопросительными предложениями и т. п. Мы можем избежать этого с помощью дополнительного и вполне естественного требования к элементарным трансформациям, которое можно сформулировать приблизительно так: (17) Если Те1 есть элементарная трансформация, то для всех целых i, n и цепочек х1, ..., хп; у1 ..., уп должно быть справедливо, что Tel (i; х1, ..., хп) образуется из Tel (i; y1, ..., уп) путем замены в ней yi- на хi для каждого i < п. Другими словами, действие элементарной трансформации не зависит от конкретного выбора цепочек, к которым она применяется. Это требование исключает возможность применения трансформаций к цепочкам, состоящим из действительно встречающихся слов (или морфем). Таким образом, никакая элементарная трансформация, удовлетворяющая условию (17), не может привести к замене (18а,б) на (19а,б), соответственно: (18) (a) John will try «Джон будет пробовать», (б) John tried «Джон пробовал», (19) (a) will John try «будет ли Джон пробовать», (б) did John try «пробовал ли Джон», хотя ясно, что такая замена является результатом простой вопросительной трансформации (question-transformation). Элементарная трансформация, в которой мы нуждаемся в данном случае, это та трансформация, которая превращает x1—x2—x3 в x2—x1—x3, то есть это трансформация Те1, определяемая для произвольных цепочек x1, x2, x3 следующим образом: (20) Те1(1; х1, х2, х3) = х2; Tel(2; x1, х2, х3)=х1; Те1(3; х1, х2, х3) = х3. Но если она должна дать (19б), то необходимо применить ее не к (18б), а, пожалуй, к некоторой гипотетической форме: (21) John past try «Джон в прошедшем времени пробовать», параллельной структуре(18а), которая лежите основе(18б). 58
Вообще, мы не можем требовать, чтобы терминальные цепочки соотносились каким-либо очень простым образом с реальными предложениями. Обязательные отображения (трансформационные и морфофонемные), которые определяют реальную форму (physical shape), могут преобразовывать, добавлять или сокращать элементы, и т. д.31 Для того чтобы описанное только что понятие трансформации соответствовало эмпирическим фактам, его следует обобщить в нескольких направлениях. Прежде всего, мы должны допустить трансформации, которые применяются к парам НС-показателей. Так, терминальная цепочка, лежащая в основе предложения (22), конструируется с помощью трансформаций из образованных ранее цепочек, лежащих в основе (23а, б) (с соответствующими им НС-показателями): (22) his owning property surprised me «его владение собственностью удивило меня», (23) (a) it surprised me «это удивило меня», (б) he owns property «он владеет собственностью». Мы можем обеспечить такую возможность, позволив всем цепочкам (24) #S##S#...#S# возглавлять деривации в грамматике непосредственно- составляющих, вместо цепочек #S#, как показано выше (или с помощью нескольких других эквивалентных и столь же простых способов). Тогда мы должны будем ввести 31 Отношение между порядком элементов в представляющей, цепочке и действительной речевой последовательностью сохраняется только на уровне слов. Мы не можем надеяться удовлетворить это условие на уровне морфем, фонем или на каком-либо из. более абстрактных синтаксических уровней. Важно отметить, что в данном, описанном здесь случае выявляется несколько совершенно независимых обоснований для появления одних и тех же абстрактных первоначальных цепочек. Отметим также, что результатом вопросительной трансформации является конверсия (18а) в (19а) и (21) в «Past John try», которое превращается в (19б) с помощью обязательной трансформации весьма общего характера, вводящей «do» в качестве носителя без- аффиксного (unaffixed) аффикса. 59
такие индексы структур, как (25) (#, NP, V, NP, #, #, NP, V, NP, #), обеспечивая таким образом возможность для (22) и подобных случаев (в связи с этим возникает необходимость в простой модификации случая (13), которую я не буду здесь описывать). Мы должны также расширить представление о способе, с помощью которого определяется область трансформации и собственно анализа трансформированной цепочки. Во- первых, нет необходимости требовать, чтобы элементы структурного индекса были простыми одиночными (single) символами. Во-вторых, мы можем допустить, что определение трансформации было дано с помощью конечного множества структурных индексов. Обобщая, можно определить область трансформации просто с помощью структурного условия с предикатом «анализируемо» в основе (ср. выше (12)). В терминах этого понятия мы можем определить тождество терминальных цепочек, а также допустить, что элементы структурного индекса остаются неопределяемыми. С помощью этих допущений, которые я не стану здесь описывать, можно получить эксплицитную и точную основу для тех неформальных описаний трансформаций, которые появились ранее в лингвистической литературе32. Грамматическая трансформация определяется, таким образом, на основе структурного условия, записанного с помощью предиката «анализируемо», и элементарной трансформации33. Выше отмечалось, однако, что трансформа- 32 В частности, трансформационные аспекты синтаксиса, описанные в работах, цитированных в сносках 2, 9 и 24. 33 То, что мы определяем таким образом, является не просто «грамматической трансформацией» в более широком плане (то есть некоторым классом пар НС-показателей), а «трансформационным правилом». Это означает, что подобные различные определения могут вести к одной и той же трансформации в более широком ллане в некотором конкретном языке. Вообще говоря, нас интересует не столько расширение понятий «грамматика» (то есть последовательность элементов σ1, σ2, ... класса, данного в (16)), «трансформация» и т. д., сколько конкретные приемы, с помощью которых они определяются. Изучение грамматических трансформаций в более широком плане будет интересным, только если окажется возможным распространить на трансформационные грамматики такие же исследования, какие проводятся для грамматик непосредственно составляющих в работах, цитированных в сн. 12. 60
ция должна выдавать не просто цепочки, а производить НС-показатели. Итак, остается показать, каким образом структура непосредственно составляющих приписывается терминальной цепочке, образованной путем трансформации. По-видимому, лучше всего сделать это с помощью системы правил, которые составляют часть общей лингвистической теории, а не с помощью дополнительного усложнения определения каждой индивидуальной трансформации. Точная формулировка этих правил потребовала бы анализа основных понятий, выходящего далеко за пределы неформального описания, намеченного выше, или же, во всяком случае, более точных его вариантов, чем те, которые имели место до сих пор. Но все-таки некоторые черты общего решения этой проблемы достаточно очевидны. Прежде всего, мы можем приписать каждую трансформацию одному из небольшого числа классов, зависящих от элементарной трансформации, которая лежит в их основе. Для каждого такого класса мы можем сформулировать общее правило, приписывающее трансформ производному НС-показателю, форма которого, будучи зафиксированной, зависит от НС-показателей основных терминальных цепочек. На нескольких примерах проиллюстрируем те принципы, которые представляются нам необходимыми. Обобщенные (generalized) трансформации, производящие цепочку из пары первоначальных цепочек (например, (22)—(23), см. выше), являются, по-видимому, основными рекурсивными приемами в грамматике. Это означает, что существует, по всей вероятности, ограничение на число единичных (singulary) трансформаций, которые могут применяться последовательно. Большинство обобщенных трансформаций базируется на элементарных трансформациях, которые подставляют трансформированный вариант второго члена пары первоначальных терминальных цепочек34 на место некоторого члена собственно анализа первого члена этой пары36. В таких условиях, по-видимому, 34 В терминологии, предложенной Лизом (Lees, A Grammar of English Nominalizations), это—«цепочка-компонент» (constituent string). По ряду причин удобно различать в операции, такой, как (22)—(23), две трансформации, из которых одна конвертирует (23б) в «his owning property», что замещается с помощью второй трансформации на «it» в (23а). Именно вторую из этих трансформаций мы здесь и рассматриваем. 36 В терминологии Лиза — «матричная цепочка» (matrix string). 61
достаточно одного общего принципа, чтобы определить полученную структуру составляющих данного трансформа. Предположим, что трансформация замещает символ а в σ1 (матричное предложение) с помощью σ2 (составляющее предложение — constituent sentence). НС-показатель результата является тогда просто НС-показателем для σ1 с a, замещенным НС-показателем для σ236. Представляется, что все другие обобщенные трансформации являются «присоединительными трансформациями» (attachment transformations), которые берут некоторый элемент собственно анализа α и вместе с элементом структурного индекса β, весьма приблизительно подчиняющим его (а также со всеми промежуточными частями НС-показателя, которые подчиняются β и которые подчиняют а), присоединяют его (а возможно, и вместе с постоянной цепочкой) к некоторому другому элементу собственно анализа. Таким путем мы образуем, например, предложение John is old and sad «Джон стар и печален» с НС-показателем (26) из John is old «Джон стар» и John is sad «Джон печален» с помощью трансформации со структурным индексом (NP, is, А, ##, NP, is, А)37. NP (26) s4 . VP / Ч is' Pred А 1 1 old ar ч id sa Многие единичные трансформации являются перестановками членов собственно анализа. Например, одна из 36 Ту же идею можно, очевидно, распространить на единичные подстановочные трансформации (substitution transformations). 37 Кроме того, структурное условие, связываемое с трансформацией, покажет, что первый член собственно анализа должен быть идентичен четвертому. Ясно, что это особый случай гораздо более общей конъюнктивной трансформации (conjunction transformation), или семьи трансформаций. Я упростил описание в нескольких отношениях. Опять-таки можно сразу же расширить это толкование таким образом, что сюда войдут единичные присоединительные трансформации. 62
трансформаций превращает (27а) в (27b): (27) (а) ч V Prt Determ Ν ι ι /\ ч turn out Prdt Art lights /4 I some of the (b) ^^ V|P>\^ Verb NP Prt 1 / \ \ V Determ N out turn Prdt Art lights some of the Общий принцип деривационной структуры составляющих в этом случае заключается просто в том, что в НС-показателе первоначальной цепочки производится минимальное изменение с тем расчетом, чтобы результирующий НС-показатель можно было снова представить в виде дерева. Трансформация, дающая turn some of the lights out «выключи некоторые из ламп», базируется на элементарной трансформации, переставляющей второй и третий члены трехчленного собственно анализа; она имеет структурный индекс (V, Prt, NP). Пример (27) иллюстрирует характерный результат перестановок, а именно: в результате перестановок сокращается количество структур, связанных с терминальной цепочкой, в которой они применяются. Так, если (27а) представляет собой разновидность чисто двоичной структуры, рассматриваемой в качестве парадигматической большинством лингвистических теорий, то в (27b) содержится на одну двоичную структуру меньше и одно новое троичное деление; а наречие (Prt) здесь уже более не подчиняется глаголу (Verb). Хотя двоичные деления характерны для простых структурных описаний, порождаемых грамматикой непосредственно составляющих, они отнюдь не так часто вс реча- ются в НС-показателях, связанных с реальными предложениями. Трансформационный подход к синтаксическому 63
описанию позволяет нам, таким образом, отразить элемент истины, содержащийся в известных теориях анализа по непосредственно составляющим с их тенденцией к двоичному разделению (binary splitting), но освобождает нас от произвольного приписывания лишних структур, требуемых этими теориями. Далее, путем последовательного применения присоединительной и перестановочной трансформаций (так, как было показано выше) можно порождать классы НС-показателей, которые в принципе не в состоянии порождать грамматики непосредственно составляющих (особенно те, которые связаны с сочинительными конструкциями — coordinate constructions). Таким путем можно преодолеть внутреннюю неполноценность грамматик непосредственно составляющих, о которой говорилось в начале настоящего раздела. Наконец, определенные единичные трансформации просто добавляют постоянные цепочки в указанном месте собственно анализа, а другие просто сокращают определенные члены собственно анализа. С первыми обращаются совершенно так же, как с присоединительными трансформациями. Во втором же случае мы сокращаем узлы, которые не доминируют ни над какой терминальной цепочкой, и оставляем прочие НС-показатели без изменения. Можно ограничить применение сокращающих трансформаций (deletion transformations) и, по-видимому, весьма существенно. В частности, представляется возможным лимитировать как число сокращений, которые применяются при деривации цепочки, так и длину цепочки, которая подвергается этой операции. Ограничения на применимость сокращающих трансформаций играют основную роль в определении того, какого типа язык (бесконечный ряд цепочек) может в принципе порождаться трансформационными грамматиками. Трансформационная грамматика состоит, таким образом, из конечной последовательности контекстно-связанных правил подстановки φ->ψ и конечного числа трансформаций только что описанного типа, которые сопровождаются наложением ограничений на порядок применения этих трансформаций. На каждой стадии анализа НС-показатель, представляемый в виде дерева с отметками, ассоциируется с терминальной цепочкой, полученной к этому времени. Итак, мы наметили контуры теории, которая отвечает требованиям (1а, в). Имеются довольно веские осно- 64
вания предполагать, что реальные условия такого рода, как упомянутые в конце § 1, будут удовлетворены в самых различных языках38, в связи с чем поиски относительно простого метода преобразования (1г) окрыляются надеждой на успех. Однако вопрос, связанный с требованием (1 д), как, собственно, почти все вопросы относительно порождающей способности трансформационных грамматик и реалистических моделей для говорящего и слушающего, использующих такую грамматику, остается полностью открытым и, в сущности, вряд ли может быть поставлен на повестку дня без дальнейшего выяснения связанных с ним теоретических положений. 38 См. работу, цитированную в сн. 24.
X. Путнам НЕКОТОРЫЕ СПОРНЫЕ ВОПРОСЫ ТЕОРИИ ГРАММАТИКИ* Введение. Хотя этот симпозиум посвящен проблемам относящимся к области математической лингвистики, (своеобразная область науки, в существовании которой сомневаются ее ведущие специалисты), я в своем докладе не стану предпринимать попыток к доказательству каких- либо теорем или установлению каких-либо результатов. Будучи философом, я предпочитаю дать обзор работы, проделанной другими в данной области, и остановлюсь на некоторых вопросах, поднятых лингвистами в связи с исследованиями, произведенными в этом направлении. Наряду с трудными техническими проблемами (каждый согласен, что они существуют) возникают также различные концептуальные трудности; взять хотя бы тот факт, что книга Хомского «Синтаксические структуры», которую некоторые ученые считают основной работой в этой области, была охарактеризована таким авторитетом, как Роман Якобсон, как argumentum a contrario 1, показывающим невозможность всего предприятия. Сначала я хочу дать, так сказать, перечень понятий, используемых в работе Хомского. Я думаю, что этот перечень будет приемлем и для самого Хомского, хотя это, конечно, несущественно. Интерпретации научной теории, вполне приемлемые для того или другого ученого, нередко оказываются самыми неподходящими, и поэтому нас будет * Hilary Putnam, Some Issues in the Theory of Grammar, «Structure of Language and Its Mathematical Aspects» (Proceedings of Symposia in Applied Mathematics, vol. XII), 1961, pp. 25—42. 1 Cm. «Boas' View of Grammatical Meaning», в журн. «American Anthropologist», vol. 61, 1959, pp. 139—145. 66
интересовать установление такого перечня понятий теории грамматики, который, на наш взгляд, будет правильным, а не такого, который будет одобрен каким-либо одним лингвистом. В частности, я предлагаю соединить теорию грамматики с программой исследований в лингвистике, данной Паулем Циффом в его готовящейся к выпуску книге «Семантический анализ» (Р. Ζiff, Semantic Analysis). Цифф касается не только и не столько вопросов грамматики, сколько вопросов значения. Если сейчас большинство лингвистов не вникает еще в вопросы семантики даже поверхностно или неглубоко, то для меня почти очевидно, что в очень недалеком будущем они займутся этими вопросами в более широком масштабе, и тогда программы исследований грамматики будут оцениваться, по крайней мере в какой-то степени, по тому, насколько они согласуются с приемлемыми программами лингвистического исследования в целом. Это означает, в конечном счете, что будет проведено исследование не только грамматического, но и семантического аспектов естественных языков. 1. О понимании неправильных высказываний. Основным понятием, которым оперирует Цифф, является понятие неправильного предложения (или, как он предпочитает говорить, «неправильного высказывания» — «deviant utterance»). Под этим он понимает любое предложение, которое отклоняется каким-либо образом от какой бы то ни было лингвистической закономерности. Эту закономерность можно понимать или как индуктивно проверяемое обобщение наблюдаемого поведения информантов, или как стандарт, вводимый лингвистом для достижения систематической простоты, то есть как своего рода идеализацию. Я предполагаю, что идеализация — это в некоторой степени неизбежное явление в лингвистике, но считаю также, что вопрос о том, в какой мере идеализация законна, остается пока открытым. Этот вопрос следует решать в каждом частном случае, и тогда мы сможем узнать, насколько велика идеализация того или другого лингвиста в данное контексте. Закономерности, от которых отклоняется предложение, могут быть либо грамматическими, либо семантическими. Предложение She goed home, вероятно, мы все будем 5* 67
рассматривать как неправильное и, очевидно, не колеблясь классифицировать его как неправильное на уровне грамматики. Предложение же The star by which seafarers normally steer is graceful, хотя является также неправильным, но на более высоком уровне. Отклонение от нормы представлено здесь в использовании слова graceful «грациозный», обычно употребляемого по отношению к форме и движению, тогда как звезда не имеет формы или движения, о которых можно было бы сказать «грациозное». Такая неправильность является, очевидно, неправильностью на уровне семантики. Сразу же необходимо отметить следующие два момента. Во-первых, некоторые лингвисты считают, что они могут обойтись без понятия лингвистической неправильности; это ошибка. Если вообще признавать лингвистическую закономерность, тогда нужно признать и уже имеющее место или возможное отклонение от этой закономерности. Далее, грамматика языка — это не что иное, как констатация определенных предполагаемых лингвистических закономерностей. Поэтому пишущий грамматику любого естественного языка автоматически классифицирует предложения на такие, которые соответствуют нормам грамматики, и такие, которые отклоняются от нормы. Во-вторых, некоторые лингвисты утверждают, что любое предложение, которое при любых, самых искусственных обстоятельствах могло бы быть «принято» информантом, является правильным. Может быть, это и удачное теоретическое положение, но я буду его оспаривать, а кроме того, нужно заметить, что ни один лингвист практически не придерживается этого теоретического положения, даже если оно и правильно. Я совершенно уверен, что те самые лингвисты, которые утверждают, что любое предложение, если оно разумно использовано информантом, является правильным, при написании грамматики какого бы то ни было языка исключат, по крайней мере путем импликации, многие из тех предложений, которые мог бы использовать информант. Джозеф Эплгейт рассказал мне однажды, какой забавный разговор произошел у него с одним из лингвистов. Этот последний до некоторой степени опрометчиво утверждал, что человек, говорящий на английском языке, ни при каких обстоятельствах не поймет предложения, в котором слово «чихал» использовалось бы в качестве переходного глагола. Буквально через не- 68
сколько минут, в той же беседе, Эплгейт получил возможность посмеяться над лингвистом, употребив несколько «экзотическое» предложение Pepper does not sneeze me, «Перец не чихает меня», которое тот понял. Интереснее всего то, и в этом вся суть, что каким бы неправильным ни было предложение, совершенно неразумно утверждать, что нет таких обстоятельств, при которых говорящий не мог бы высказать его, а слушающий не мог бы его понять. Но из этого примера в то же время не видно, что предложение Pepper does not sneeze me «Перец не чихает меня» является правильным. Я покажу это ниже. Сейчас я лишь отмечу следующее: если даже лингвист, обосновывая лингвистическую теорию, и утверждает, что, например, предложение Pepper does not sneeze me является правильным, то при составлении грамматики английского языка он, вероятно, в противоречие своей собственной лингвистической философии, исключит это же самое предложение из числа правильных. Он мог бы не делать этого явно, назвав его грамматически неправильным; в сущности он вообще мог бы не употреблять термин «грамматически неправильный». Не в этом дело. Если он дает правила порождения грамматических предложений английского языка и эти правила таковы, что они не могут породить только что упомянутое предложение, то мы, очевидно, можем сказать, что он исключает только что упомянутое предложение путем импликации. Ясно, что единственным путем, который предоставил бы возможность избежать исключения предложений типа Pepper does not sneeze me «Перец не чихает меня» как неправильных, был бы путь создания такой грамматики английского языка, в которой бы разрешалось использовать каждый глагол в качестве переходного. Но даже и это не помогло бы! По-видимому, до тех пор, пока грамматика не будет грамматикой, состоящей из одного предложения, гласящего: «Любая конечная последовательность английских слов является предложением»,— должны существовать некоторые конечные последовательности английских слов, которые, по крайней мере путем импликации, будут исключаться как неправильные. Ясно, что можно найти ситуации, при которых информанты будут порождать какие-то из этих предложений, а слушающие будут понимать некоторые из них. Короче говоря, если кто-нибудь задает вопрос: «Почему бы не принять разумную программу для лингвистической теории, то 69
есть почему бы не написать грамматику, скажем, английского языка, предписывающую те и только те предложения, которые могли бы со смыслом употреблять говорящие по-английски или понимать слушающие английскую речь?», то ответ будет двояким. Во-первых, грамматика в этом смысле не напоминала бы ни одну из когда-либо написанных тем или иным лингвистом грамматик (включая и тех лингвистов, которые утверждают, что их программой является очерченная здесь программа), и, во-вторых, эта программа была бы или тривиальной, или невозможной для выполнения. Она была бы тривиальной, если бы мы приняли ту точку зрения, что любая конечная последовательность английских слов, не превышающая определенной длины, могла бы использоваться при определенных обстоятельствах. В этом случае мы получаем упомянутую выше грамматику из одного предложения. Действительно, с этой точки зрения можно сразу написать одну грамматику из одного предложения для всех естественных языков. Однако, если сделать более узким понятие предложения, которое может употреблять говорящий по-английски или понимать слушающий английскую речь, то, я думаю, мы столкнемся с двумя обстоятельствами: во-первых, появится некоторый произвол (то есть один лингвист будет считать Pepper does not sneeze me «Перец не чихает меня» предложением, которое мог бы употребить говорящий по- английски, а другой будет отрицать это), а во-вторых, даже с помощью произвола никому не удастся выполнить подобную задачу. Этот вывод не является таким дерзким, как может показаться на первый взгляд. Ведь моментально можно сообразить, что в программе, которую мы только что подвергли критике, лингвистическая теория лишена какой бы то ни было идеализации. Однако ни одной науке, ни гуманитарной, ни естественной, никогда не удавалось сделать ни единого шага вперед без самого свободного использования идеализации. Даже лингвисты, а их, к счастью, немного, питающие преувеличенное доверие к возможностям таких статистических методов, как мультифакторный анализ, забывают, что этот мультифакторный анализ является одной из самых остроумных идеализации, когда-либо введенных в эмпирические науки. Поэтому будем считать, что наша цель состоит в установлении некоторой системы лингвистических правиль- 70
ностей, характеризующих отдельные аспекты определенного естественного языка, и что мы хотели бы идеализировать и до некоторой степени «сверхупрощать». Другими словами, нас будет беспокоить критика по поводу того, что кто-то дал лучшее, чем мы, описание рассматриваемого, нами языка, но мы не будем обеспокоены тем, что наше описание не является идеальным в том недостижимом смысле, который предполагает точное соответствие поведению каждого слушающего и говорящего, если оно точно описано. Существует еще два вопроса, ожидающие нашего решения. Они таковы: что можно сказать о правильных и о неправильных предложениях? Первая проблема — это проблема, показывающая, как создаются правильные предложения, каково их строение, как их значения определяются их строением и т. д. Это та проблема, которая на грамматическом уровне занимает Хомского в его книге «Синтаксические структуры», а на семантическом уровне— Циффа в его «Семантическом анализе». Здесь я хочу пренебречь этой важной и кажущейся непреодолимой проблемой и сконцентрирую свое внимание на втором вопросе, а именно на вопросе о том, что можно сказать о предложениях, представляющих собой отклонение от нормы. С одной стороны, мы, конечно, могли бы не говорить о них ничего. Мы могли бы встать на ту точку зрения, согласно которой назвать предложение отклоняющимся от нормы — это значит сказать: «Не стоит говорить о нем. Лингвистическая теория не рассматривает такие предложения». Но если бы мы приняли такую точку зрения, то все мои симпатии оказались бы на стороне тех лингвистов, которые не любят такие понятия, как «неправильный», «грамматически неправильный» и т. д. Закрывать глаза на те самые эмпирические факты, которые надо объяснить,— это не в стиле хорошей научной практики. Как раз это, по-видимому, и имеют в виду люди, выдвигающие нереальный тезис о том, будто правильным следует считать каждое когда-либо услышанное предложение. И действительно, как неоднократно подчеркивает Цифф, поскольку большая часть обычной речи и особенно речь, имеющая самое большое концептуальное значение — речь пионеров в каждой области знания: в науке, политике, этике, философии,— состоит из неправильных предложений, отрицать проблему использования и понимания 71
неправильных предложений — это значит снимать одну из самых интересных проблем лингвистики. Поэтому Цифф предлагает не просто дать описание правильных предложений языка, но пойти дальше и, приняв это описание за основу, попытаться объяснить различные виды неправильностей в терминах значения, функции, структуры и т. д. В «Семантическом анализе» Циффа эта программа только постулируется, главное внимание уделяется в ней правильным предложениям. С момента завершения «Семантического анализа» Цифф начинает работать над теорией, объясняющей, как надо понимать неправильные высказывания. Мы не будем здесь касаться деталей этой теории, но я хочу привести два самых простых примера для того, чтобы проиллюстрировать тот путь, каким мы приходим к пониманию неправильных предложений, и показать ту роль, какую здесь играет само понятие неправильного предложения. Первый пример взят у Дилана Томаса: A grief ago I saw him there «Печаль тому назад я видел там его». Ясно, что «grief» употребляется здесь фигурально. Но что это значит, когда говорят, что слово употребляется фигурально? Самым вероятным может быть следующее объяснение: слушающий, услыхав предложение A grief ago I saw him there, немедленно обнаруживает, что предложение, которое он только что услышал, является неправильным. И тогда он пытается подобрать сходное предложение, которое является правильным и из которого в том или ином смысле можно вывести данное предложение. Одним из таких предложений могло бы быть: A moment ago I saw him there «Мгновение назад я видел его там», или еще другое: A year ago I saw him there «Год назад я видел его там», или: An age ago I saw him there «Давным-давно я видел его там» и т. д. Заметьте, что подстановка одного-единственного слова вместо слова «grief» способна превратить все предложение A grief ago I saw him there в правильное. И кроме того, следует обратить внимание на то, что все слова, которые мы подставляли в определенном порядке, чтобы сделать предложение правильным, имеют общее семантическое свойство: они являются единицей измерения времени. Это согласуется с естественным объяснением рассматриваемой строки, а именно: grief «печаль» используется так, как будто оно является мерой времени. Рассмотрим, что мы здесь сделали. Хотя мы называем предложе- 72
ние A grief ago I saw him there неправильным, это не значит, что данное предложение является в каком-то смысле плохим или что его не должен был употреблять Дилан Томас. Термин «неправильное», очевидно, является техническим термином, который выполняет функцию объяснения, а не оценки. Назвать предложение неправильным не значит также сказать, что оно является причудой, грамматическим вывертом (freak), то есть чем-то таким, что превосходит любую возможность лингвистического объяснения. Напротив, назвать его неправильным — это значит уже в значительной степени объяснить его. Но тогда возразить может читатель: «Если вы намерены признать это предложение «хорошим» предложением, если вы намерены объяснить его, почему вообще называть его неправильным? Почему бы не изменить вашу грамматику так, чтобы слово «grief» могло встречаться в любой позиции, в которой может встретиться мера времени?» Однако это только что внесенное предложение снова заводит нас в тупик, отрицая всяческие идеализации. Более разумно поступить следующим образом. Сначала мы довольно строго, даже, пожалуй, чересчур строго исключим как неправильные все употребления слова grief, кроме некоторых привилегированных. Затем мы выработаем такое определение слова grief, которое покроет остающиеся правильные его употребления. Заметим, что это возможно в случае, если мы будем достаточно строги при выборе того, что мы именуем правильными употреблениями. Один из многочисленных недостатков самой снисходительной точки зрения, в соответствии с которой все возможные употребления должны быть равноправными, состоит в том, что при ней сформулировать или проверить обычные словарные определения оказывается невозможным. Формулировка адекватного словарного определения слова grief невозможна, если предполагается, что определение будет учитывать все употребления слова grief и все его употребления считать одинаково хорошими. Попробуйте определить слово grief так, чтобы оно годилось для употребления в словаре и могло бы употребляться как для выражения настроения или чувства, так и для передачи «меры времени». С другой стороны, если мы будем придерживаться обычных словарных определений и вместе с тем считать все употребления равноправными, просто сказав, что определение может 73
не согласовываться с теми употреблениями того слова, определение которых не положено в основу определения, то становится совершенно непонятно, в чем заключается функция определения или на каком основании можно сказать, что одно определение является правильным, а другое — неправильным. Все эти вопросы рассматриваются довольно подробно в упомянутой мною книге Циффа, и я не буду к ним больше возвращаться. Далее, следует отметить, что программа, которая сначала объясняет закономерности, представленные определенным множеством правильных употреблений, а затем пытается объяснить огромное множество неправильных употреблений, рассматривая их в некотором смысле как производные от правильных употреблений, согласуется с довольно старым интуитивным различием буквальных и фигуральных употреблений слова. Наконец, заметим — и это наиболее важный момент,— что рекомендация не проводить различия между употреблением «grief» в предложении A grief ago I saw him there и в предложении She was in a state of grief «Она была в печали»,— хотя она и звучит более мягко и беспристрастно, чем у Циффа,— фактически не дает ни малейшего намека на процедуру, направленную на объяснение обсуждаемой строки Дилана Томаса.С другой стороны, дискриминационный метод, состоящий в том, что мы исходим из положения, согласно которому предложение является неправильным, фактически дает нам возможность не отбросить предложение, а понять его. В самом деле, у нас есть метод (он, конечно, является пригодным только для очень простого класса неправильных предложений), с помощью которого мы можем найти правильное предложение, а из него, заменив одно слово на другое, можем вывести данное неправильное предложение и затем найти значение, связанное со всем классом подходящих для данного случая однословных замен. Это тот метод, который мы использовали выше, и, конечно, рассмотренное нами частное предложение является вполне подходящим для иллюстрации этого иетода. Отнесение предложения к классу как неправильных часто может быть первым шагом к его анализу путем отыскания того, от чего оно отступает, как отступает и почему. Если следовать Фодору 2, мы могли бы пойти еще дальше 2 В «Some Uses of «Use»» (докторская диссертация), 1960. 74
и ввести, например, понятие стандартных отклонений от стандартности, единообразных механизмов для порождения и понимания целых классов неправильных предложений, например иронии. В связи с этим мне хотелось бы возвратиться к аргументу Якобсона, направленному против работы Хомского. Якобсон заявляет, что некоторые предложения, исключаемые Хомским при описании английского языка, например Ideas are green «Идеи зеленые», являются совершенно правильными, ни в чем не отклоняющимися от норм грамматики. Его точка зрения такова, что предложение Ideas are green является просто ложным предложением. И нельзя называть предложение грамматически неправильным или даже неверным на семантическом уровне, если единственный его недостаток состоит в том, что оно является ложным. Но я думаю, что точка зрения, согласно которой такие предложения, как Ideas are green или Virtue swims «Добродетель плавает», являются только «ложными», в корне неверна. Я не собираюсь обсуждать этот вопрос более детально просто потому, что он уже обсуждался на протяжении ряда лет многими философами, но позвольте мне обратиться к результатам философской дискуссии. Прежде всего философы нашли целесообразным провести различие между типом предложения или предложением, с одной стороны, и между различными действиями, которые можно было бы выполнить с предложениями этого типа, например высказыванием утверждения, с другой стороны. Как только начинает проводиться это различие, сразу же возникают недоразумения с понятием ложное предложение. Если бы предложение обладало таким свойством, что каждый образец данного типа можно было бы использовать для высказывания одного и только одного утверждения и если бы это утверждение находилось в одной оценочной плоскости, то есть всегда было истинным или всегда ложным, тогда выражение «Это предложение ложно» (This sentence is false) могло бы пониматься как сокращение для выражения «Утверждение, которое было бы сделано, если бы использовался образец предложения этого типа для того, чтобы сделать утверждение, было бы ложным» (The statement that one would be making, if one employed a token of this type in order to make a statement, would be false). Но дело в том, что в английском языке очень мало, 75
а может быть, и совсем нет предложений, которые можно использовать, чтобы сделать одно и только одно утверждение. В частности, я думаю, что предложение Ideas are green явно не является таким предложением. Если произнести предложение Ideas are green, то его воспримут, возможно, не как высказывание утверждения, а как нечто другое, например как шутку, прерывающую беседу, и т. д. Проверьте и увидите! Лингвисты и философы не склонны проводить такие простые эксперименты, как этот. Но я предлагаю его совершенно серьезно. Попытайтесь использовать предложение Ideas are green для высказывания утверждения и посмотрите, какая реакция будет у ваших слушателей. По вашему мнению, вы можете достичь цели, используя предложение Ideas are green для высказывания утверждения, но я сомневаюсь, что люди, слушающие вас, воспримут это как утверждение. Скорее хихиканье, а не расхождение в мнениях будет реакцией, с которой вы столкнетесь. И надо сказать, что хихиканье является естественной реакцией, когда считают, что кто-то, произнося предложение в утвердительном тоне, не высказал утверждения и даже не собирался его высказывать. Но, предположим, мы согласились, что при каких-то неестественных обстоятельствах предложение Ideas are green могло бы быть использовано для высказывания утверждения. Якобсон говорит, что такое утверждение было бы ложным, но откуда он это знает? По-видимому, он думает, что имеется только одно утверждение, которое можно было бы высказать внушающим доверие образом, используя предложение Ideas are green, и что это утверждение является явно ложным. Но я думаю, и многие философы со мной согласятся, что: а) не существует утверждения, которое можно было бы высказать внушающим доверие образом с помощью предложения Ideas are green, б) имеется ряд утверждений, которые можно высказать не внушающим доверие образом, используя предложение Ideas are green, и из этих утверждений некоторые, вероятно, истинны, а некоторые ложны. Заметим, что бесполезно заявлять авторитетным тоном, что когда говорят предложение Ideas are green ложно, то допускают, конечно, что предложение Ideas are green 76
используется для высказывания особого утверждения, а именно утверждения, что идеи — зеленые. Сказать, не давая контекстуального ключа в руки слушателей: «Когда я говорю «идеи — зеленые», я действительно хочу сказать, что идеи зеленые»,— означает ничего не сказать. Если же кто-то скажет: «Давайте рассмотрим контекст философской дискуссии. Допустим, что если бы в качестве абстрактной истины утверждалось Ideas are green, то ведь это было бы ложное утверждение, не так ли?», то, с моей точки зрения, здесь не будет высказано вообще никакого утверждения, которое бы я понял. Но я не хочу ограничиваться рассмотрением только что упомянутого различия между утверждением и предложением. Предположим на какой-то момент, что Якобсон прав; предположим, что существует, если рассматривать вопрос отвлеченно, такое утверждение, как утверждение о том, что идеи зеленые, и что это утверждение является явно ложным. Вытекает ли из этого, что, когда мы отвергаем предложение Ideas are green как неправильное, мы отрицаем его только потому, что оно «ложное»? Вовсе нет! Предположим, что мой галстук не зеленый, и рассмотрим два предложения: Ideas are green «Идеи зеленые» и My necktie is green «Мой галстук зеленый». Оба они «ложны», но совершенно ясно, что эти два предложения должны быть «ложными» по-разному. Традиционные философы различали два вида «ложности»: ложность a priori и ложность a posteriori. В соответствии с этим утверждение «Мой галстук зеленый» является ложным в зависимости от обстоятельств (a posteriori), а утверждение «Идеи зеленые» должно быть, если оно вообще может иметь значение истинности, ложным a priori. Это различие является вполне достаточным для того, чтобы назвать предложение «Идеи зеленые» неправильным предложением, поскольку, проводя различие между ложностью a priori и ложностью в зависимости от обстоятельств, мы можем спросить: «Что характерно для существительных N, таких, с которыми предложение «N — зеленые» (N's are green) не является a priori ложным или бессмысленным?» Характерным для таких существительных было бы, по-видимому, то, что они представляли бы собой так называемые конкретные существительные. Это можно сформулировать иначе, сказав, что сочетание «are green» требует конкретного подлежащего и что предложение «Ideas are green» 77
отклоняется от лингвистической правильности ввиду употребления с сочетанием «are green» такого подлежащего, которого это сочетание «не приемлет». Таким образом, предложения Ideas are green «Идеи зеленые». Virtue swims «Добродетель плавает», Golf plays John «Гольф играет в Джона» и т.д. отклоняются от установившихся лингвистических закономерностей, по крайней мере на уровне семантики. И это не зависит от того, рассматривают ли их как «ложные» или нет. Их рассмотрение в качестве неправильных может вызвать постановку методологических проблем, но эти проблемы (обоснования описания языка) возникают даже на уровне грамматики. 2. Пограничная черта между грамматикой и семантикой. Единственный вопрос, который мы пока обсудили,— это вопрос о том, каким является предложение: неправильным или правильным. Показав, что предложение является неправильным, мы не затрагивали вопроса о том, следует ли считать эту неправильность грамматической или неграмматической. Откладывать этот вопрос нельзя, так как задача грамматики заключается не в том, чтобы исключать все неправильные предложения — например, грамматика не должна исключать предложение The star by which seafarers normally steer is graceful «Звезда, по которой мореплаватели обычно ведут корабль, грациозна»,— а только те, неправильность которых является в некотором смысле грамматической неправильностью. Но как установить, с какого рода неправильностью в данном случае мы имеем дело, с грамматической или семантической? Точка зрения, которую, как я слышал, выдвигают лингвисты, состоит в следующем: существует два резко отличных друг от друга вида неправильности — грамматическая неправильность и семантическая неправильность, причем грамматически неправильных предложений не очень много. Иначе говоря, большинство предложений, называемых нами неправильными, являются неправильными, но по причинам, которые должны быть названы семантическими, а не грамматическими. Несколько примеров могут пояснить характер этого спора. Упомянутые лингвисты отвергли бы, например, 78
категорию «одушевленное существительное» как «допустимую» грамматическую категорию, хотя, конечно, они признали бы ее вполне возможной семантической категорией. Предположим, указывая на стол, француз говорит: She is red «Она красная», или, расширив предложение с помощью возможного контекста, он, предположим, скажет: George gave me a table and I saw at once that she was red and had four legs «Джордж дал мне стол, и я сразу же увидел, что она была красная и имела четыре ножки». Хомский сказал бы, что это предложение грамматически неправильное, потому что местоимение she «она» не согласуется с неодушевленным существительным table «стол». Лингвисты же, упоминавшиеся выше, считали бы это предложение грамматически правильным просто потому, что у них нет оснований назвать его грамматически неправильным. Интересно, как бы они оперировали с такими языками, как немецкий и французский, где вопросы рода долгое время рассматривались как вопросы грамматики. Продолжали ли бы они оставаться на своей точке зрения или подошли бы к английскому языку с одних позиций, а к французскому — с других, и если так, то на какой основе? Их точка зрения, как я ее понимаю, состоит в том, что только произвольные свойства, то есть свойства, которые не имеют никакого отношения к значению, называются грамматическими. Однако я согласен с Якобсоном и Боа- сом, что в языке нет каких-либо произвольных свойств в указанном смысле. Например, если считать произвольным, что мы говорим She is here, а не Is she here, то, очевидно, следует заметить, что хотя это и может быть произвольным в некотором абсолютном смысле, в контексте английского языка оно не является произвольным; мы употребляем первое из предложений, когда хотим высказать утверждение, а второе — когда хотим задать вопрос. Заметим, что если мы согласимся с тем, что категории «абстрактный» и «конкретный» не должны быть приняты грамматикой, то на тех же основаниях мы не должны вводить в грамматику «мужской род» и «женский род», с одной стороны, и «изъявительное наклонение», а также «вопросительное предложение» — с другой. Конечно, существует абсолютный смысл, который трудно выразить словами, хотя мы его в какой-то мере и ощущаем. Он-то и вынуждает заявить, что порядок слов 79
в английском языке является произвольным, то есть сказать, что соглашение, определяющее, какой порядок слов является повествовательным, а какой — вопросительным, можно было бы изменить, по-видимому, без ослабления функциональной эффективности языка. Беда в том, что в этом абсолютном смысле, если в нем вообще может быть какой-либо смысл, семантические свойства так же произвольны, как синтаксические. В конце концов, любое слово могло бы означать нечто отличное от того, что оно действительно значит. Не желая затягивать этот спор, скажем только, что введение какой-либо категории в нашу грамматику дает нам главным образом возможность констатировать большее число закономерностей. Если эти закономерности характерны лишь для небольшого класса предложений, то мы будем неправы, назвав их грамматическими закономерностями; если они встречаются во многих предложениях или имеют отношение к использованию важных классов морфем, например местоимений или артиклей, тогда, по-видимому, более удобно назвать их грамматическими регулярно- стями. С этой точки зрения вопрос о том, где именно должна быть проведена пограничная черта между семантикой и грамматикой, является вопросом удобства, а отнюдь не вопросом теоретическим. 3. Независимость значения. Спорный вопрос, который мы едва ли сможем обойти, хотя бы только потому, что он послужил причиной весьма острой полемики, заключается в разногласии между теми, кто утверждает, и теми, кто отрицает, что грамматику можно построить «независимо от значения». Среди американских лингвистов, насколько я знаю, Зеллиг Хэррис был первым, кто сформулировал этот лозунг. С другой стороны, Якобсон в упомянутой выше статье утверждает, что монография Хомского является «великолепным» argumentum a contrario как раз по этому вопросу, и с оптимизмом высказывается об ожидающей своего разрешения «иерархии грамматических значений». Для того чтобы предварительно ознакомиться с этим горячо дебатируемым вопросом, разрешите мне рассмотреть до некоторой степени параллельный, хотя на первый взгляд и не относящийся к делу вопрос: «Можно ли опре- 80
делить профессию человека, не видя его за работой?» Очевидно, ответ будет гласить «да», ибо можно, например, задать вопрос: «Чем вы зарабатываете на жизнь?» Но даже если исключить возможность вопросов такого характера, то ответом не обязательно будет «нет». Как известно, Шерлок Холмс мог получить огромное количество сведений о человеке вообще, а не только о его профессии из самых, казалось бы, не относящихся к делу источников. А потому наиболее подходящим ответом на поставленный выше вопрос будет, грубо говоря: «Это зависит от того, насколько хороши ваши детективные способности». Возвратимся к языку. Несомненно, что вопрос «Можно ли открыть фонемы (морфемы, классы форм и т. д.) языка, не изучая язык (не изучая значения ни одной формы, не изучая того, что любые две формы синонимичны)?» параллелен вопросу о профессии, и кажется очевидным (по крайней мере для меня), что немедленный ответ будет таким же, как и выше: «Это зависит от того, насколько хороши ваши детективные способности». Итак, некоторые лингвисты придерживаются, по- видимому, той точки зрения (по крайней мере, когда они обсуждают этот вопрос), что нельзя обнаружить фонемы языка без изучения значений форм в этом языке (или по крайней мере без установления того, что определенные пары являются парами несинонимичных выражений). Однако я уверен, что те же самые лингвисты не удивились бы (при условии, если бы утверждение не было связано с этой «полемикой), узнав, что какой-то лингвист вывел фонемы языка X из того варианта языка, па котором говорит по-английски человек, знающий этот язык X с самого рождения (a fortiori, без изучения языка X). Конечно, это можно было бы рассматривать как забавный, но не невозможный в принципе tour de force. И если кто- нибудь смог бы сделать это как tour de force, то почему бы он не смог сделать это еще раз и даже научить этому искусству своих аспирантов? (Ср. результаты, достигнутые в этой области Пайком, который добился быстрого понимания отдельных частей фраз чужого языка. Его результат рассматривался бы как единичный tour de force, если бы он не повторил этот «трюк» много раз и не научил ему некоторых своих студентов.) Наконец, почему бы даже не «механизировать» такой трюк, сведя его, скажем, к некоторого 6 —2238 81
рода стандартизированному испытанию, какое можно было бы провести соответственно подготовленным сотрудником или машиной? Наконец, если нет ничего невероятного в том, что кто-то может вывести фонемы некоторого языка из того, как говорящий на этом языке будет говорить на другом языке, то возникает мысль, почему бы вместо этого другого языка не взять просто список бессмысленных слогов. Я не говорю, что какой-либо из этих методов является практически достижимым в настоящее время или будет когда-либо практически достижимым, я лишь утверждаю, что здесь не затрагивается никакого принципиального вопроса. Каждый лингвист верит, что фонемный состав имеет «обязательный» характер и что фонемный состав родного языка любого человека влияет в подавляющем большинстве случаев на манеру его разговора на другом языке, даже если он повторяет или составляет бессмысленные слоги и т. п. Но тогда почему же на деле невозможно обнаружить фонемы чужого языка иначе, как только одним-единственным способом? Если рассматривать вопрос в этом свете, то методы Хэрриса не покажутся нам такими странными. Хэррис обнаруживает фонемы языка приблизительно следующим путем: лингвист произносит вслух некоторую последовательность выражений, например: «cat, cat, cad, cab, cab, cad», а информант описывает, что он слышит. Если информант говорит: «Вы сказали два раза А, затем В, затем два раза С, затем В» (где А, В, С обозначают cat, cad, cab в данном примере в том виде, как они произнесены информантом), то можно сделать вывод, конечно ориентировочно, что b, d, t являются аллофонами различных фонем в чужом языке. С другой стороны, если информант говорит: «Вы сказали три раза А, а затем два раза В, а затем опять А» (где А есть cad или cat или нечто среднее, а В есть cab), то можно быть вполне уверенным, что b, d являются аллофонами различных фонем, a d, t — аллофонами одной и той же фонемы в чужом языке. (Хэррис. обычно использует в этом тесте выражения из чужого языка, но тест, по- видимому, может «работать» и с бессмысленными слогами, то есть реализовать возможность, рассмотренную выше.) Переходя к границам морфемы, Хэррис снова пользуется «структурными» методами, вместо того чтобы поло- 82
житься на такие понятия, как «наименьшая значащая единица». Я не буду детально описывать эти методы, но они зависят, грубо говоря, от подсчета «исключений», то есть звуков, которые не могут встречаться непосредственно после определенных начальных сегментов предложения; так, например, все звуки, кроме t, исключаются после начального сегмента Isn't that a daguerreo- «Это не дагерро-». Эти исключения являются исключениями, «идущими слева направо». Сходным образом можно подсчитать исключения, «идущие справа налево», то есть звуки, которые не могут встречаться непосредственно перед определенными конечными сегментами предложений (например, "h" исключается непосредственно перед "-ing"). Затем, как обнаружил Хэррис, границы морфем можно отождествить с локальными минимумами числа исключений, которые являются минимумами при подсчете и слева направо и справа налево. Этот тест не только не «зависит от значения», но и представляется более успешным, насколько я знаю, чем любой тест, который «зависит от значения». Но почему все это должно вызывать разногласия среди лингвистов? Я имею в виду не методы Хэрриса (в частности, методы любого исследователя, естественно, вызывают разногласия в любой науке), может быть, эти его частные методы не годятся для работы. Меня интересует, почему выдвигаются такие возражения, что методы подобного рода в принципе не могут быть пригодны? Почему не может существовать лингвистического двойника Шерлока Холмса? Я предполагаю, что оппонентов Хэрриса беспокоит следующее: понятия «фонема» и «морфема» были традиционно опоеделены в терминах семантических понятий; значит, любой метод обнаружения того, что представляют собой фонемы/морфемы языка, должен использовать семантическую информацию. Но это заключение не логическое! (Мы уже видели, что из определения «профессии» как способа добывания средств к существованию нельзя сделать вывод, что невозможно узнать профессию человека, пока не увидишь его непосредственно за работой.) Несомненно, язык изучается в условиях, когда его различные части выполняют свои различные семантические функции; но, после того как мы научились сегментировать язык на части, мы можем «отбросить» такую сегмента- 6* 83
цию в других, очевидно не соотносящихся с данными, контекстах точно так же, как мы можем пренебречь чем-нибудь другим, о чем мы знаем, что оно не относится к делу. Конечно, мне бы не хотелось создавать впечатления, будто я верю, что Хэррис нашел безотказный (в принципе) метод обнаружения фонем или морфем естественного языка. Как Хэррис, так и его оппоненты, кажется, думают, что лингвистика может дать единообразные процедуры открытия. Я согласен с Хомским, что независимо от того, используется или нет «семантическая информация» о языке, стремление найти единую процедуру, открывающую точное описание, является настолько же утопичным в лингвистике, как и в любой другой естественной науке. И это — еще одно существенное соображение, говорящее о том, что псевдовопрос «о независимости от значения» не так уж интересен. Он слишком сильно связан с неправильным представлением о том, будто задачей лингвистической теории является полное устранение теоретика, а не снабжение его полезными орудиями (тестами, методами и т. д.). 4. Автономность грамматики. Этот вопрос тесно связан с вопросом, рассмотренным в предыдущем параграфе. Он заключается в следующем: можно ли определить основные понятия грамматики, такие, как «морфема» и «фонема», в несемантических терминах? Хотя этот вопрос и очень тесно связан с вопросом, рассмотренным в предыдущем параграфе, важно понять, что все же это два разных вопроса. В предыдущем параграфе мы обсуждали возможные процедуры открытия в лингвистике, которые не требуют какой-либо семантической информации в качестве входных данных. В настоящем разделе мы рассмотрим способ, с помощью которого должны определяться основные понятия в лингвистике. К сожалению, немалую путаницу внесло в лингвистику неразличение указанных вопросов. Хомский, как кажется, склонен придерживаться той точки зрения, что основные понятия структурной лингвистики можно определить, не прибегая к использованию каких-либо семантических понятий, и, по-видимому, он имеет в виду именно это, когда говорит об автономности грамматики. С другой стороны, нужно признать, что, даже 84
если Хомский неправ, его работу не следует понимать как argumentum a contrario против тезиса об автономности грамматики просто потому, что фактически Хомский вообще не определяет основных понятий структурной лингвистики. Он считает их первоначальными или неопределяемыми понятиями во всей своей работе. И как раз благодаря этому обстоятельству атака Якобсона на концепцию Хомского кажется нам довольно странной. Критика Якобсона вызвана в своей основной части тем, что Хомский исключает некоторые предложения как грамматически неправильные просто потому, что они ложны или в какой- то степени бессмысленны с точки зрения их значения. Но это как раз говорит не о том, что Хомский отводит значению слишком малую роль, а скорее о том, что он уделяет значению слишком много внимания. Тогда, если хотите, обвинение должно заключаться в том, что работа Хомского является argumentum a contrario против возможности основывать грамматику на некоторых основных семантических понятиях, таких, как ложь и истина. И уж, конечно, работа Хомского не является argumentum a contrario против того тезиса, что в лингвистике существуют несемантические процедуры открытия. Хомский вообще воздерживается от рассуждений о процедурах открытия, за исключением только тех случаев, когда он выражает пессимизм (который я разделяю) по поводу возможности отыскания полезных единообразных процедур открытия, независимо от того, используется или нет семантическая информация. Как было уже отмечено, Хомский вообще не определяет такие фундаментальные понятия, как «фонема», «морфема», «существительное», «глагол» и т. д.; он строит свою грамматику по гипотетико-дедуктивной системе, в которой некоторые термины принимаются за «первоначальные». Но оставив в стороне работу Хомского, мы все же должны будем решить следующий вопрос: как определить, если это вообще возможно, такие понятия, как «фонема» и «морфема». Однако, прежде чем сказать что-либо по этому вопросу, рассмотрим сначала, как можно различать семантические и синтаксические понятия в естественном языке. Я думаю, что основным синтаксическим понятием мы могли бы считать понятие «структурного тождества». Мы бы сказали, что две последовательности звуков в естественном языке структурно тождественны, если говорящий на этом языке 85
считает их одним и тем же выражением; в противном случае они структурно нетождественны. Конечно, здесь возникает целый ряд проблем: не вполне ясен смысл утверждения о том, что говорящий на естественном языке считает две последовательности звуков одним и тем же выражением, если не даны контексты, которые мы можем исследовать с помощью двуязычного информанта, желающего сделать вполне ясные металингвистические утверждения по крайней мере очень простого вида («Вы сказали то же самое слово дважды!»), и с лингвистом, желающим довериться этим ясным металингвистическим утверждениям. Если же мы пожелаем узнать, что означает выражение «информант считает две последовательности звуков одним и тем же...», где информант говорит только на одном языке χ и характеристика должна полностью основываться на поведении информанта, а не на высказывании каких- либо металингвистических утверждений об х, то едва ли мы сможем сказать многое. Больше того, если бы даже нам удалось придумать ряд вещей, которые мы могли бы назвать «симптомами» такого положения, когда две последовательности звуков принимаются за одно и то же выражение, все же было бы ошибкой думать, что можно достигнуть ясного определения этого положения с помощью таких симптомов. Я не собираюсь углубляться в данную проблему, поскольку это может привести нас к известному спору за и против операционализма. Вместо этого я просто замечу, что здесь нам следует вспомнить о том, что, в конце концов, лингвистика является общественной наукой, и ее основные понятия отражают некоторые особенности человека в той же мере, как и основные понятия любой другой общественной науки. Другая, менее серьезная проблема, с которой нам придется столкнуться, заключается в следующем: что, если кто-нибудь скажет, что отношение структурного тождества, как оно определено выше, является семантическим понятием и потому синтаксис как изучение свойств последовательностей звуков, которые инвариантны в этом отношении, является ветвью семантики? Эта проблема несерьезна, ибо она, очевидно, чисто словесна. Конечно, можно «доказать», что синтаксис не является автономным, определяя термины «синтаксис» и «семантика» и, таким образом, синтаксис, no определению, станет частью семантики. Но при этом мы не достигнем ничего существен- 86
ного. Я предложил бы, руководствуясь обычной практикой в формальных языках, принять в качестве основных понятий семантики понятия истины и синонимии; моя точка зрения заключается в том, что отношение структурного тождества выражений является более основательным, чем понятия семантики в двух значениях. Понятия последней предполагают первое понятие, а понятие структурного тождества, я думаю, не определяемо в соответствующих терминах семантических понятий. Допуская, что понятие структурного тождества и нетождества является приемлемыми понятиями, мы делаем шаг по пути к определению понятия фонемы. Теперь можно определить и понятие контрастирующей пары. Две структурно нетождественные последовательности звуков А и А1 являются контрастирующей парой, если А тождественно А1, за исключением того, что А1 содержит один звук Р1 в том месте, где А имеет один раз встречающийся звук Р. В этом случае мы будем также говорить, что Ρ и Р1 являются доказуемо неэквивалентными звуками. Если бы обратное отношение, при котором звуки не являются доказуемо неэквивалентными, оказалось бы только отношением эквивалентности этих звуков и ничем другим, то мы получили бы полное определение понятия фонемы. Фонемы были бы как раз классами эквивалентных последовательностей звуков, эквивалентно порождаемыми этим отношением эквивалентности. К несчастью, хотя понятие фонемы, очевидно, основывается на отношении, в котором звуки не являются доказуемо неэквивалентными, это отношение будет отношением эквивалентности между двумя звуками тогда и только тогда, когда они являются аллофонами одной и той же фонемы. Именно это и делает понятие фонемы таким трудным. На практике пытаются отыскать самое большое отношение, которое является отношением эквивалентности и дополнение которого включает отношение упомянутой выше доказуемой неэквивалентности. Но такого отношения вообще не существует, и поэтому возникает некоторая степень произвола в классификации звуков языка по отдельным фонемам. Однако это не доказывает, что понятие фонемы является в основе своей семантическим. Это свидетельствует лишь о том, что оно в какой-то степени недостаточно или, точнее, что оно должно быть соотнесено не просто с языком, а с особым описанием языка. 87
Резюмируем: классификация звуков в плане фонем является до некоторой степени искусственной классификацией. Она опирается на предумышленное игнорирование того факта, что дополнение доказуемого отношения неэквивалентности не является отношением эквивалентности. Но эта классификация, какой бы искусственной она ни была, в соответствии с нашими разъяснениями является чисто структурной. Фонемика, таким образом, является автономной, в смысле Хомского. Однако когда мы подходим к понятию морфемы, то здесь что-либо сказать гораздо труднее. Что касается меня, то я бы сказал, что я еще никогда не встречал удовлетворительного определения этого понятия ни в семантических, ни в несемантических терминах. Я не согласен также со взглядами Хомского, который считает это понятие первоначальным. Затруднение с построением лингвистической теории как гипотетико- дедуктивной системы заключается в том, что это построение оказывается не особенно убедительным. Гипотетико- дедуктивная система вполне приемлема для построения физической теории, в которой ненаблюдаемые сущности выводятся из наблюдаемых сущностей. Но я не думаю, что Хомский хочет сказать, что морфемы — это выводимые сущности. Если же он имеет в виду именно это, тогда я должен сказать, что мне совершенно не ясна ни постулируемая природа этих выводимых сущностей, ни природа предполагаемого вывода об их существовании. Иногда, читая работы Хомского, можно подумать, что автор, с одной стороны, как будто разделяет ту точку зрения, что гипотетико-дедуктивная система является приемлемой для построения физической теории, а с другой стороны, придерживается того мнения, что первоначальные понятия в такой системе не обязательно считать связанными с чем-либо. С этой точки зрения научные теории являются, так сказать, вычислительными устройствами. Я не знаю, справедлив ли я по отношению к Хомскому, приписывая ему эту точку зрения. Но я знаю, что для физики это неприемлемая философия науки, и очень сомневаюсь в том, что эта философия науки может быть приемлемой для любой из общественных наук, включая лингвистику. Другой возможный выход из положения заключался бы в следующем: мы могли бы сказать, что морфемы языка, 88
относящиеся к некоторой частной грамматике, являются самыми короткими последовательностями звуков, которые соотносятся с категориями непосредственно составляющих в этой грамматике. Помимо привнесения большого числа новых, еще не определенных терминов (например, категории непосредственно составляющих), новое утверждение имеет еще и тот недостаток, что понятие морфемы относится в нем к грамматике. Это противоречит очень глубоко укоренившемуся интуитивному чувству, свидетельствующему о том, что в языке имеются «естественные строительные блоки», как бы ни было трудно уточнить это понятие, и что ими являются морфемы. Можно было бы внести и еще одно предложение, которое вытекает не столько из работы Хомского, сколько из дискуссии с Хомским. Понятие морфемы только что предложенным способом можно было бы сначала отнести к грамматике, а затем сказать, что «реальные» морфемы в языке должны быть отождествлены с морфемами, согласующимися с простейшей грамматикой этого языка. Последнее предложение имеет, однако, два качества, вызывающих возражения. Во-первых, совершенно не ясно, существует ли такая вещь, как вполне определенная простейшая грамматика естественного языка, и, во-вторых, если такая грамматика существует, то тогда могут существовать не одна, а две простейшие грамматики А и В, которые не могут делить язык на строительные блоки одним и тем же способом. Если этот последний случай — возможность двух неизоморфных простейших описаний естественного языка — в действительности невозможен, то причина этого в том, что естественный язык реально имеет систему основных строительных блоков в таком смысле, который не имеет никакого отношения к описаниям этого языка. Но тогда мы должны попытаться выяснить этот смысл, а не ходить вокруг да около, говоря о всевозможных теориях и используя всеохватывающий термин «простота». Я не предлагаю отбросить понятие «морфемы»; я думаю, что неясная характеристика морфем как мельчайших единиц, которые принадлежат к категориям непосредственно составляющих, является достаточной для того, чтобы пока работать с ней. С другой стороны, дальнейшие попытки найти основу для определения этого понятия, безусловно, необходимы. Грубо говоря, я чувствую, что 89
в языке существует еще немало непонятных вещей и, прежде чем мы будем в состоянии определить точно, какой смысл имеют в языке естественные строительные блоки, мы должны будем гораздо глубже проникнуть в структуру языка как целого. 5. Грамматические предложения языка являются рекурсивным множеством. В этом параграфе мне хотелось бы продемонстрировать некоторые обстоятельства, подтверждающие ту точку зрения, что грамматические предложения естественного языка при небольшой идеализации образуют рекурсивное множество. Мне кажется, нужно указать не следующие факты. 1) Независимость языка. Под независимостью языка я понимаю тот факт, что говорящие могут, по-видимому, классифицировать предложения на приемлемые и неприемлемые, или неправильные и правильные и т. д., независимо от экстралингвистических соображений. Конечно, имеются и исключения из этого правила, но на меня большее впечатление производит огромное количество подтверждений этого правила. Я представляю себе, например, что если бы мне был дан список предложений и меня попросили бы сказать, какие из них, на мой взгляд, являются грамматически правильными, а какие — грамматически неправильными, то я бы в каждом таком случае и без какой бы то ни было информации о предполагаемом контексте использования классифицировал предложение Mary goed home как грамматически неправильное предложение, a Mary went home как грамматически правильное предложение. Этот акт классификации предложений на грамматически правильные и грамматически неправильные кажется мне актом, который я могу совершить, не имея никаких входных данных, за исключением самих предложений. Короче говоря, мне кажется, что, выполняя такую работу по классификации, я неявно опираюсь на нечто сходное с какой-то эффективной процедурой. В этой связи я, конечно, опираюсь на некоторые очень общие гипотезы относительно характера человеческого мозга. Говоря точнее, я считаю, что имеется немало соображений, которые наводят на мысль, что машина Тьюринга плюс случайные элементы составляют приемлемую модель человеческого мозга. Тогда, хотя мысль о том, что 90
случайные элементы являются частью человеческого мозга, важна в общественных науках во многих отношениях, наш случай из тех, где случайные элементы не могут играть никакой роли, по крайней мере для целей идеализации. Даже если в действительности мое поведение при классификации данного списка предложений на грамматически правильные и грамматически неправильные было бы до некоторой степени случайным, так что один раз из ста я мог бы классифицировать предложение Mary goed home как грамматически правильное, вместо того чтобы отнести его в разряд грамматически неправильных предложений, то именно это обстоятельство мы опустили бы в нашей идеализации. Другими словами, будем считать, что если классификатор относит предложение в разряд грамматически правильных предложений в одном случае, то он будет классифицировать его как грамматически правильное и в любом другом случае. Приняв эту идеализацию, мы рассматриваем классифицирующего (если мы приняли механическую точку зрения на мозг, которую я описал) просто как машину Тьюринга. Однако если даже рассматривать классифицирующего как машину Тьюринга, то отсюда еще не следует, что множество грамматических предложений является рекурсивным. Это будет иметь место только тогда, когда классифицирующий предстанет перед нами в виде машины Тьюринга без выходных данных, или, более строго, без каких бы то ни было входных данных, за исключением того индивидуального предложения, которое он классифицирует. Индивидуальное предложение, которое он классифицирует, можно рассматривать как единственные относящиеся к делу входные данные. В связи с этим если предложение признано грамматически правильным, то оно будет признано таковым в любом другом случае независимо от других предложений, которые были уже представлены до этого. Такова, если и не абсолютно точная, то, во всяком случае, разумная идеализация. Именно это я понимаю под независимостью языка. 2) Второй аргумент, подтверждающий ту точку зрения, что классификация предложений на грамматически правильные и грамматически неправильные является чем-то механическим (а отсюда вытекает, что множество грамматически правильных предложений является рекурсивным, если мы примем тезис Черча), состоит в том, что 91
можно классифицировать и бессмысленные предложения. Как указал Хомский, можно с полным основанием просить классифицирующего просмотреть список бессмысленных предложений и сказать, какие из них грамматически правильны, а какие грамматически неправильны. Здесь мы снова имеем случаи, когда релевантные входные данные суть просто предложения, которые классифицируются, и когда те черты классифицируемого предложения, которые являются релевантными, оказываются почти наверняка чисто структурными. Якобсон указал, что так называемые грамматически бессмысленные предложения часто могут быть проанализированы, но мне кажется, что в данном случае мы можем этим пренебречь. Если даже верно, что вскоре после того, как произнесено предложение Colorless green ideas sleep furiously, мне удастся проанализировать его тем способом, который предлагается в статье Якобсона, я не смогу сказать сразу, является ли оно грамматически правильным. 3) Третий аргумент, подтверждающий ту точку зрения, что классификация предложений на грамматически правильные и грамматически неправильные является автоматической, заключается в возможности обучения грамматике и в относительной независимости уровня грамотности от интеллектуального развития. Обычно даже человек очень низкого интеллектуального уровня обучается и тому, как говорить грамматически правильно на своем особом диалекте, и тому, как узнавать отклонения от грамматической правильности. Конечно, в связи с этим вопросом важно не путать грамматику какого-либо диалекта с «грамматикой» в школьном смысле, то есть с грамматикой привилегированного диалекта. Я заметил, что люди, относящиеся к низкооплачиваемым группам населения, часто говорят «неграмотно». Это значит, что они говорят на своем собственном диалекте совершенно правильно грамматически, но говорить на своем диалекте — это и называется обычно «говорить неграмотно». Я думаю, что слабоумный, родители которого говорят на привилегированном диалекте, может иметь серьезные пробелы в словаре, но его речь редко страдает грамматическими дефектами. Он также учится говорить на привилегированном диалекте и чувствовать неправильность предложений, которые отклоняются от грамматических норм этого диа- 92
лекта, даже если он не обладает сложным умением производить грамматический анализ, который требуется для того, чтобы сказать, что здесь неправильно. Но способность этого вида, усваиваемая практически каждым, а также используемая почти каждым, независимо от его интеллектуального уровня, является по своему характеру, почти несомненно, квазимеханической. Я согласен с тем, что ни одно из соображений, на которые мы ссылались выше, не является само по себе решающим; но мне кажется, что все взятые вместе факты — независимость языка, возможность классификации бессмысленных предложений и относительная универсальность грамматической интуиции в пределах группы говорящих на данном диалекте — подтверждают законность представления классифицирующего в качестве машины Тьюринга, обрабатывающей каждое новое предложение, которым ее снабжают, по некоторой механической программе. Однако принятие этой идеализации как раз и означает принятие такой модели грамматики, при которой рассматриваемые грамматические предложения образуют рекурсивное множество. Принятие этой идеализации узаконивает поиски рекурсивных теоретико-функциональных структур, которые могли бы служить в качестве моделей для грамматики. В книге Хомского «Синтаксические структуры» исследуется ряд таких моделей, и они признаются слишком узкими. В частности, широко используемая грамматика непосредственно составляющих признается Хомским слишком ограничивающей, поскольку она отвергает некоторые очень удобные типы правил. Так, например, следующее простое правило, которое, как кажется, должно было бы быть законным видом лингвистического правила, не является правилом грамматики непосредственно составляющих. Если S1 и S2 грамматически правильные предложения, а S1 отличается от S2 только тем, что χ находится в S1 там, где y находится в S2, и если x и y являются составляющими одного и того же типа в S1 и S2 соответственно, то S3, представляющее собой результат замены χ через «x и y» в S1, в свою очередь есть грамматически правильное предложение. Проводя аналогию с формальными языками, мы можем сказать, что грамматики непосредственно составляющих 93
используют правила, которые соответствуют схемам аксиом, скажем, в исчислении высказываний. С другой стороны, трансформационное правило, аналогичное известному правилу, гласящему, что: «Любая формула вида (x) Ad A' является аксиомой при условии, что А' отличается от А только тем, что А' содержит свободное y там, где А содержит свободное x», уже выходит за пределы грамматики непосредственно составляющих. В связи с этим в структурной грамматике Хомский предлагает использовать правила, которые опираются также и на последнее упомянутое правило, а не только на схемы аксиом. Я считаю весьма убедительными примеры Хомского из области трансформаций английского языка. (Я имею в виду его примеры допустимых видов лингвистических правил. Могут возникнуть эмпирические возражения против того, чтобы считать некоторые из них утверждениями об английском языке.) Однако общая характеристика Хомским трансформационной грамматики является слишком широкой. Легко показать, что любое рекурсивно перечислимое множество предложений могло бы быть порождено трансформационной грамматикой в смысле Хомского. Поскольку, однако, все мотивы для поисков трансформационных грамматик должны учитывать характер естественных языков, а основным постулатом (если это вообще можно назвать постулатом), на котором основываются трансформационные грамматики, является постулат о том, что множество предложений в естественном языке является рекурсивным множеством, то трансформационные грамматики должны характеризоваться таким образом, чтобы это свойство «органически» входило в их характеристику. Короче говоря, я думаю, что Хомский поднял важную проблему, а именно проблему выделения такого класса трансформационных грамматик, который был бы достаточно широким, чтобы включить все грамматики, какие мы захотим написать когда-либо в качестве грамматик естественных языков, но не настолько широк, чтобы включить любую грамматику для нерекурсивного языка (то есть для языка, где множество грамматических предложений не является рекурсивным). Однако эта проблема представляется исключительно трудной. В заключение я сделаю несколько замечаний о направлении, в котором можно было бы искать ее решения. 94
6. Проблема описания трансформационных грамматик. Как можно заметить, результаты трансформаций, рассматриваемых Хомским в его работе «Синтаксические структуры», в большинстве случаев оказываются длиннее исходных данных. 1) Не исключена возможность, что, не изменяя результирующего множества «терминальных цепочек» (грамматически правильных предложений, производимых грамматикой), можно будет переписать грамматику так, чтобы использовать только правила с этим свойством (назовем их «ограниченно свободными» правилами — «cut-free» rules). Тогда (и это нетрудно показать) множество терминальных цепочек было бы всегда рекурсивным. Однако приведенное выше предложение (1) кажется неудачным, поскольку использование только ограниченно- свободных правил, даже если бы это можно было осуществить (а пока не ясно, можно ли это сделать), влечет за собой усложнение формулировок грамматики, а основной довод для допущения «трансформаций» прежде всего заключался в упрощении результатов. 2) Можно было бы наложить два ограничения на все грамматики для естественных языков: а) не более чем ni-слов может быть вычеркнуто трансформацией зачеркивания и б) не более чем n2-тpaнcфopмaций зачеркивания может встречаться в деривации терминальной цепочки, где n1 и n2 — постоянные, зависящие от языка. Второе ограничение, однако, представляется взятым ad hoc и непривлекательным. (Первое ограничение можно обычно получить естественным путем, например ограничивая вычеркивания случаями вида «предлог + местоимение».) Мне кажется, что было бы вполне естественным и важным найти доказательство теоремы вида: Всякий раз, когда можно вывести σ в L (где σ является переменной на множестве терминальных цепочек, a L — каким-либо языком), можно найти деривацию (той же самой цепочки σ), которая не использует более чем п2 вычеркиваний (где n2 может зависеть от L); этот случай существенно отличается от того случая, когда мы накладываем ограничение на число вычеркиваний при определении деривации. Разумеется, нет надежды доказать теорему этого вида для всех языков L·, которые обладают трансформационной грамматикой, пока в нашем распоряжении не будет удов- 95
летворительного определения «трансформационной грамматики». Итак, мы стоим перед важным (и, вероятно, очень трудным) вопросом — дать такое определение «трансформационной грамматики», чтобы оно было: (I) достаточно широко применимым для всех лингвистических целей, (II) свободно от «искусственных» условий, подобных условию, ограничивающему количество вычеркиваний в деривации, и (III) таким, при котором теорема «ограниченной элиминации» будет приближением ко всем языкам L с трансформационной грамматикой. К сожалению, я не вижу путей для решения этой проблемы.
Г. Kappa НЕКОТОРЫЕ ЛОГИЧЕСКИЕ АСПЕКТЫ ГРАММАТИЧЕСКОЙ СТРУКТУРЫ*,1,2 1. Введение. Общеизвестно, что человеческий прогресс гораздо медленнее развивается в тех областях науки, которые не принадлежат только к одной из самых главных и самых распространенных ее отраслей. Сталкиваясь с такой наукой, мы часто оказываемся в положении слепых, как в известном рассказе о шести слепых и слоне. Один из слепых, который завладел ногой слона, заявил, что слон похож на столб; второй, у которого в руках оказался хвост животного, сказал, что слон похож на веревку; третий, прислонившись к боку слона, утверждал, что слон похож на стену; трое же остальных, которые притрагивались к уху, хоботу и клыку слона, с одинаковой категоричностью отстаивали мнение о том, что он похож соответственно на парус, шланг и копье. Рассматриваемая нами область — общая грамматика — имеет почти такой же характер. К ней можно подойти и с * Haskell В. Curry, Some Logical Aspects of Grammatical Structure, «Structure of Language and Its Mathematical Aspects» (Proceedings of Symposia in Applied Mathematics, vol. XII)K1961, pp. 56—68. 1 За основу данного доклада взята лекция, прочитанная 23 ноября 1948 г. группе компаративистов колледжа штата Пенсильвания под заглавием «Логическая структура грамматики». Группа Чикагского университета размножила ее на мимеографе и разослала ряду лиц. С небольшими изменениями лекция была переиздана в университете штата Пенсильвания 27 июля 1959 г. После просмотра рукописи был добавлен новый раздел (§ 7), но сохранен элементарный характер первых шести параграфов (т. е. первые шесть параграфов были оставлены без изменений). 2 Некоторая помощь в подготовке этой рукописи была оказана Национальным научным фондом. 7—2238 97
точки зрения лингвистики, и с точки зрения логики, и с точки зрения психологии; и каждый раз мы будем узнавать что-то новое, чего нельзя увидеть, если мы подойдем к ней с точки зрения другой, соседней науки. Более того, логический аспект будет выглядеть несколько иначе с точки зрения математики, чем с точки зрения философии. Но даже и в лингвистический аспект может быть внесена специфика тех конкретных языков, которыми мы занимаемся; и именно поэтому возникает подозрение, что преимущественное внимание к индоевропейским языкам привело к искаженным представлениям в некоторых вопросах. При таких обстоятельствах прогресс, вероятно, лучше всего достигается на основе смелого сотрудничества. Поэтому к данному вопросу мы должны подойти по возможности с самых различных точек зрения, не боясь на первых порах ошибок, которые неизбежны из-за отсутствия всесторонней осведомленности. Каждый должен сообщать о своих наблюдениях таким образом, чтобы это было понятно другим, не особенно заботясь о том, разобрались ли они уже сами в этих вещах или нет. Имея это в виду, я и попытаюсь объяснить некоторые свои впечатления о грамматическом «слоне», подобно одному из тех слепых, о которых говорилось выше. Я не претендую на революционный характер этих впечатлений, но даже в этом случае, я думаю, они все равно могли бы представить известный интерес. В связи с этим я изложил в § 7 некоторые детали логического обоснования. 2. Язык и математическая логика. Позиции, с которых мы начнем обсуждение, представляют собой частный аспект математической логики. Поэтому полезно начать с обсуждения логических аспектов языка вообще. То, что существует тесная связь между математикой и логикой, с одной стороны, и языком — с другой, стало очевидным уже довольно давно, а сейчас этот факт оказался в центре внимания в более строгом смысле благодаря существованию настоящего симпозиума. Подход с позиций математической логики имеет следующие преимущества. Прежде всего, сама математика является языком—конечно, не в том смысле, в каком являются языками английский, немецкий, китайский, эскимосский, но тем не менее языком 98
со своей собственной грамматикой и словарем 3. Более того, она является таким языком, который был специально разработан для целей, для достижения которых необходима строгая логика. Поэтому естественно предположить, что ее грамматика должна была бы более точно отражать требования логики, чем грамматика естественных языков. Во-вторых, большинство современных работ по логике явным образом связано с искусственными языками идеализированного и упрощенного типа, и поэтому разумно полагать, что решение проблемы о логических аспектах грамматики в этих случаях явится полезной предварительной ступенью для решения более сложных проблем, связанных с естественными языками. Конечно, логическая точка зрения имеет свои ограничения; среди них не последнее место принадлежит тому обстоятельству, что во всех естественных языках логика является только одним из факторов, подлежащих рассмотрению. Тем не менее и в пределах этих ограничений логический подход может оказаться интересным и продуктивным. Для логики термин «язык» приобрел смысл, отличный от того, к которому привыкли лингвисты. В самом общем смысле язык для логика является системой объектов, называемых символами, которые могут быть сгруппированы в комбинации, называемые выражениями. Здесь термины «символ» и «выражение» не определяются, но они устанавливаются в соответствии со специальными условиями для каждого конкретного языка. Однако под символами понимаются объекты, не слишком отличающиеся от фонем или печатных букв, количество которых можно увеличивать неограниченно. Выражения же вообще являются конечными линейными рядами (или «цепочками») таких символов; в этом случае я буду называть такой язык линейным языком. Если язык используется или может быть использован для целей коммуникации, то он будет называться коммуникативным языком, а язык в лингвистическом смысле будет называться естественным языком. 3 В 1937 г., то есть лишь через несколько лет после опубликования своей книги [2] (объяснение цифр в скобках см. в библиографии в конце статьи), Блумфилд представил лингвистическому обществу Америки рукопись в триста страниц, озаглавленную «Язык науки». Я был одним из тех, кто имел счастливую возможность просмотреть и оценить этот труд. Рукопись содержала много интересных наблюдений о природе математики. К сожалению, Блумфилд, очевидна, не смог ее закончить. 7* 99
3. Простой язык. Прежде чем приступить к общему обсуждению, будет полезно рассмотреть простой искусственный язык, который мы назовем языком А. Он будет иметь три символа, а именно: a, b, c;4 язык этот будет линейным языком, так что его выражения будут конечными рядами символов, такого, например, вида, как ababcbbca. Теперь мы определим класс выражений, называемых «самами» («sarns»), как наименьший класс, такой, в котором: 1) символ а принадлежит классу, и 2) если b добавить после любого члена класса, то новое выражение будет принадлежать классу. Тогда «самы» будут охватывать все выражения бесконечного списка а ab abb abbb abbbb и только их. Определим теперь класс «тетлов» («tettles») как выражения, образованные двумя «самами» с разделяющим их символом с. Наконец, определим класс «тантетов» («tantets») как наименьший класс «тетлов», таких, что: 1) aca принадлежит классу; и 2) если А и В являются «самами», такими, что АсВ принадлежит классу, тогда AbcBb также принадлежит классу. Нетрудно заметить, что «тантеты» являются теми «тетлами», компоненты которых похожи на «самы», т. е. «тантет» является «тетлом» формы АсА, где А есть «сам». Все эти определения были даны без приписывания какого-либо значения любому из выражений языка А. Все, что мы сделали, относится только к способу формирования выражений из символов. Такого рода рассмотрения большинством современных логиков называются «син- 4 Мы будем рассматривать буквы «а», «6», «с» не как сами буквы языка А, а как буквы, используемые в настоящем контексте в качестве названий для букв языка А. По этим соображениям опущены кавычки при указанных буквах. 100
таксическими». Теперь пора объяснить смысл, который можно приписать языку А. Это будет сделано в три этапа. Прежде всего заметим, что «тетлы» языка А являются его предложениями. Это простое объяснение подсказывает нам, чем является грамматика языка А. «Самы», очевидно, являются чем-то таким, что аналогично существительным; с есть двуместный (two-place) глагол, который образует предложение, когда его заключают между двумя существительными, такой, например, как «ударяет», «тащит», «любит», «является» в английском языке; b — суффикс, с помощью которого образуются существительные от существительных. Далее, «тантеты» языка А являются его истинными предложениями. В этом случае с выражает отношение равенства, которое в обычной математике мы обозначаем знаком «=». Наконец, укажем, что «самы» обозначают числа: а обозначает число 0, ab — число 1, abb — число 2 и т. д. Сами названия «сам», «тетл», «тантет» представляют собой англизированные искажения венгерских слов «szâm», «tétel», «tantét», которые соответственно означают «число», «предложение» и «теорема». Итак, мы имеем теперь полное объяснение смысла языка А. Следует заметить, что b, используемое в качестве суффикса, указывает на операцию образования следующего за а числа в арифметике. 4. Семиотика. Возникла и существует целая школа философов и математиков, которые придают большое значение квазилингвистическому анализу (его образец был только что нами проиллюстрирован). Некоторые из них называют семиотикой5 изучение символических систем и подразделяют предмет на три части: 1) синтактика, то есть изучение тех аспектов рассмотрения, которые зависят только от структуры выражений, представленных цепочками символов; 2) семантика, то есть изучение тех аспектов рассмотрения, которые требуют обращения к коммуникативным функциям; и 3) прагматика, которая включает отношения между языком и его потребителями 5 См. Morris, [16], а также в некоторой степени — [17]; Carnap, [3]. 101
(психологические и физиологические факторы и т. д.). Таким образом, обсуждение языка А, при котором говорилось о «самах», «тетлах» и «тантетах», было чисто синтаксическим, без примеси какого бы то ни было семантического или прагматического элемента. Однако, когда мы интерпретировали эти термины, мы занимались семантикой. Прагматика, хотя она и является в некотором смысле базисом, на основе которого создаются путем абстракции все остальные аспекты, нас здесь интересовать не может. Семиотические значения слов «синтактика» и «семантика» нельзя смешивать со значениями, которые они имеют в лингвистике. Термин «синтактика» является, возможно, неудачным, но он уже вошел в обиход. Как показывает пример языка А, мы можем считать, что семантика в свою очередь имеет три ступени. Первая ступень касается образования предложений; назовем ее грамматикой. Сама терминология подсказывает, что мы имеем дело с теоретической наукой, частью семиотики, которая является родственной обычной грамматике. Вторая ступень имеет отношение к истинности; назовем ее алетевтикой (aletheutics). Третью ступень можно назвать ономатикой6. Теперь следует сделать несколько замечаний, которые имеют отношение к данному обсуждению. Во-первых, употребление термина «семантика» может показаться несколько странным. Существуют определенные расхождения в употреблении этого термина. Некоторые авторы, по-видимому, используют его в значении «ономатика». Таково было, пожалуй, намерение Карнапа в его книге «Введение в семантику»7. Он различал правила образования (в нашем понимании —грамматика), правила истинности (в нашем понимании — алетевтика) и правила обозначения (в нашем понимании —ономатика). Однако строго ономатические аспекты рассмотрения играли лишь второстепенную роль и могли быть совсем опущены; практически все теоремы, доказанные в этой книге, можно рассматривать как чисто алетевтические. Подобным же образом работа Тарского, по-видимому, отождествляет семантику с ономатикой; понятие истинности определяется при помощи понятия удовлетворения 6 Эти термины были впервые предложены в [7] и [8]. См. также дискуссию в [9], стр. 35—37. 7 См. сноску 5. 102
(satisfaction), которое является ономатическим. Широко распространено также мнение, что понятие истинности — это понятие семантическое, в то время как понятие предложения не является таковым. Но когда я спросил однажды одного из друзей, который решительно отстаивал это положение, что бы он сказал о том, чем же является предложение, то он ответил, что в конечном счете это решает говорящий на данном языке, как на своем родном. Если это так, то тут привлекается коммуникативный (а возможно, и прагматический) элемент, и данное понятие в соответствии с принятым здесь определением является семантическим. С нашей точки зрения, любое отношение к использованию языка в целях коммуникации является семантическим. Язык А также свидетельствует, что, хотя некоторое понятие и является семантическим, может существовать и синтаксическое понятие, ему эквивалентное. Так, например, предложения языка А являются «тетлами», а истинные предложения — «тантетами»; но понятия «тет- ла» и «тантета» — понятия чисто синтаксические. В математике и особенно в математической логике мы имеем тривиальные примеры той же самой ситуации. Многие полагают, что в естественных языках наблюдается нечто подобное и в грамматике. И хотя еще точно не установлено, так ли это, тем не менее вполне допустимо для целей исследования пытаться найти такого рода теории. Однако мы должны иметь в виду, что с тех пор, как стали известны логические системы, которые допускают свои собственные правила синтаксиса, но не правила истинности, может оказаться, что синтаксическая теория грамматики невозможна или по крайней мере практически недосягаема. Мы займемся здесь грамматикой в семиотическом смысле или, если угодно, в лингвистическом. Ее можно определить как тот аспект рассмотрения, который определяет, что собой представляют предложения в языке. Однако для многих не ясно, и я не знаю, как выяснить, что же такое предложение. Так, Хомский заявляет, что Sincerity admires John «Искренность восхищается Джоном» не является предложением в английском языке. Как говорящий по-английски я с этим не согласен. Для меня — это грамматически вполне правильное предложение, хотя оно и бессмысленно. Однако бессмысленность — по край- 103
ней мере так подсказывает мне языковая интуиция — является не грамматическим, а алетевтическим понятием. Отсюда ясно, что граница между грамматикой и алетевтикой не так отчетлива, как может показаться. Линия границы окажется, конечно, не четкой, если мы будем опираться в своем анализе на дистрибуцию, поскольку истинные предложения встречаются в речи нормальных людей значительно чаще, чем ложные. Я не знаю, как преодолеть эту трудность. Может быть, не лишне рассмотреть еще и другие ступени семантики, промежуточные между грамматикой и алетевтикой, или какие-то их подразделы, соответствующие различным уровням граммати- кальности. Как бы то ни было, я пока могу только предположить, что категория предложения достаточно хорошо известна и может служить основой настоящего исследования. После предварительных соображений обратимся к нашей основной теме, а именно к изысканию концепций и принципов для всеобщей грамматики (в семиотическом смысле). 5. Фразы и их основные классы. Прежде всего, очевидно, что (для линейного языка) выражения не образуют естественного класса комбинаций символов. Так, в английском предложении I see both red and blue flowers «Я вижу и красные и синие цветы» встречаются следующие выражения: see both red, ed and bl. С другой стороны, слова both и and вместе составляют семантическую единицу, а потому должны образовывать и грамматическую единицу. Позвольте нам пользоваться термином фраза для комбинации символов, которая образует грамматическую единицу, то есть единицу в правилах определения того, что представляет собой предложение. Этот термин мы должны рассматривать, подобно «символу», «предложению», «выражению», как иным образом не определяемый. Фраза, как мы видели, может состоять из отдельных частей. Каковы же основные классификации фраз? В языке А встречаются следующие классы фраз: 104
1) «Самы». С точки зрения грамматики они являются, в сущности, существительными. 2) Предложения, то есть «тетлы». 3) Фразы, которые связывают фразы для формирования новых фраз. Таковым является, например, суффикс b, который, будучи присоединен к существительному, образует другое существительное, или инфикс c, который, будучи помещен между двумя существительными, формирует предложение. Такие фразы были названы польским философом Котарбиньским «функторами»; этим термином будем пользоваться и мы8. Нетрудно понять, что это фундаментальные категории для всякого мыслимого математического языка. Может быть, необходимо рассмотреть две или более различных категории существительных (таких, как индивидуальные существительные, существительные-классы., существительные-отношения и т. д.) 9; но номинальный характер каждого из этих видов ясен. Существительные, предложения и функторы являются, таким образом, основными грамматическими категориями. Первые две в отличие от функторов мы назовем замкнутыми фразами. 6. Функторы. Рассмотрим теперь функторы более подробно. Каждый функтор объединяет одну или более фраз, называемых аргументами, для образования новой фразы, называемой его значимостью. Очевидно, функторы можно классифицировать по числу и виду аргументов и по природе значимости. Так, в языке А суффикс b является функтором с одним номинальным аргументом и номинальной значимостью; инфикс с представляет собой функтор с двумя номинальными аргументами и сентенциальной 8 Термин «суффикс» используется здесь для обозначения функтора, который следует за аргументом или аргументами, «префикс»— для функтора, который предшествует его аргументам, и «инфикс»— для функтора от двух* аргументов, который расположен между ними. 9 Различение, проводимое иногда между отдельными существительными и существительными фразы, не принимается здесь во внимание. С нашей точки зрения, они представляют собой различные виды существительных. Так, из исследования Хилла (см. [12], стр. 175) можно сделать вывод, что он насчитывает семь или более различных видов существительных в английском языке. Хэррис в [11] (гл. 16) настаивает на четырех или более видах. 105
значимостью. Но перед тем, как следовать далее, необходимо ввести еще некоторые обозначения. Функтор, по определению, является средством объединения фраз для образования других фраз. Полное описание функтора должно показать, из чего состоит его значимость. Другими словами, мы не можем представить функтор без пропусков или других приемов обозначения10, указывающих, где должны быть вставлены аргументы. В некоторых естественных языках эту функцию выполняют определенные падежные окончания и порядок слов. Мы будем использовать тире с индексами; первый аргумент должен заменять тире с индексом 1, второй — тире с индексом 2 и т. п. Так, два упомянутых выше функтора для языка А будут соответственно —φ и —ic—2· (Они не являются единственными функторами в языке А; мы имеем,, например, также функтор —ibb.) Необходимо подчеркнуть, что понятие функтора не ограничено словами или аффиксами, которые ставятся перед или после своих аргументов, а в случае двух аргументов — между ними. Они при соответствующем указании положения аргументов являются действительно функторами, но не самыми общими. Мы только что рассматривали пример (а именно, both —1and — 2) функтора, состоящего из разъединенных частей. Возможны и еще более общие формы. То, что Хэррис и Хомский называют трансформациями, также является функтором. Функтор есть любого рода лингвистический прием, который оперирует с одной или более фразами (аргументами), чтобы сформировать другую фразу. Функтор может так изменить свои аргументы, что даже обозначения, вводящие пропуски, будут неадекватными для его описания. Введем обозначения для описания видов или «категорий» функторов. Пусть Χ, Υ, Z, U будут грамматическими категориями. Тогда мы будем иметь FXr, F2XYZf FsXYZU, , то есть, соответственно, категории функторов с одним аргументом в X и значимостью в У; категории с двумя 10 Если функтор описан как префикс, инфикс или суффикс, а эту возможность не следует упускать из виду, то приемы обозначения могут стать необязательными. 106
аргументами в X и Y и значимостью в Z; категории с тремя аргументами, а именно в Χ, Υ, Ζ и значимостью в U и т. д. Если N представляет категорию существительных, a S —категорию предложений, тогда два первоначальных функтора для языка А вместе с указанием категорий, к которым они относятся, могут быть записаны в виде: — !b, FNN\ —ic—2, F2NNS\ в то же время both—iand—2 в упомянутом выше предложении I see both red and blue flowers принадлежит категории F2(FNN)(FNN)(FNN)l\ Для того чтобы получить полную общность, мы должны допустить функторы с другими функторами в качестве аргументов. Что же касается значимости, то мы замечаем, что FX(FFZ), F2XY(F3UVWT) являются соответственно теми же категориями, что и F2XYZ, F5XYUVWT и т. д. Классифицируя функторы, мы можем, таким образом: а) либо ограничиться рассмотрением функторов с одним аргументом, но допустить, что значимость может быть функтором, либо б) допустить функторы с любым числом аргументов, но потребовать, чтобы значимость была замыкающей,— и в этом случае мы будем говорить о значимости как о «замыкании». Первому из Этих путей обычно следуют в лингвистике, и его используют также в некоторых работах по логике; второй путь — в духе математики и обычной символической логики. Для целей классификации последний метод более удобен. Следует заметить, что в определенных случаях один из этих двух методов может оказаться неестественным. Так, анализ both—iand—2 F2(FNN)(FNN)(FNN) более естествен, нежели both—та F(FNN){F(FNN)(FNN)) 11 В этом предложении фраза «both red and blue», а также отдельные слова «red» и «blue» понимаются как прилагательные (то есть принадлежат к категории F NN). 107
или both— iand—2—3; F3{FNN)(FNN)NN. Следующая таблица дает несколько примеров фраз, относящихся к различным категориям в вышеуказанной схеме12. Первый столбец указывает категорию, во втором содержатся примеры из обычного английского языка, в третьем даны примеры технического языка математики. Следует заметить, что функторы разделяются на два основных класса: первичные и вторичные; первичными функторами будут являться те, все аргументы которых —фразы, вторичными — те, у которых по крайней мере один аргумент является функтором. Замкнутые фразы N Примеры фраз Собственные имена ществительные Нарицательные имена существительные (без четкого разграничения) Местоимения Предложения в обычном смысле Междометия Существительные в звательном падеже су- 0, 1, 2,..., е х = у\ 1 <2; 2 = 3 Первичные функторы FNN F2NNN FNS F2NNS F.NNNS FSN FSS F.SSS Атрибутивные прилагательные Существительные в родительном падеже Суффиксы прилагательного Окончание родительного падежа Непереходные глаголы Переходные глаголы, связка Глаголы с двумя дополнениями Что —J, Трансформации отглагольного существительного Отрицание Сочинительные союзы | —г | (абсолютное значение); (—,)2 (возведение в квадрат) - >0_ Г» — 2' 1 > 2 —! находится между —9 и —о —ι &—2 12 Дальнейшие примеры см. в [9], pp. 264—265, 274—275. 108
Вторичные функторы F (FNN) (FNN) Наречие, определяющее Повторение операции прилагательное Операция определения Квадрат функции F(FWyV)(F(F;VyV)X Суффикс «-1у» санкция от функций X(FNN)) F(FNS)N Трансформации отгла- Наименьшее число, гольного существи- удовлетворяющее тельного некоторому условию F (FNS) (FNS) Наречия, определяющие Дополнение к некото- переходные глаголы рому условию FN(F(FNS)(FNS)) Суффиксы, образующие такие наречия от существительных 7. Заключительные замечания. Идея о выражении категорий при помощи функтора возникла в связи с тем, что было необходимо удовлетворить потребности определенного типа логики. Вероятно, нам легче будет осознать это понятие, а также некоторые из его ограничений, если кратко описать его применение. В типе логики, называемом комбинаторной логикой 13, формальный метаязык, то есть та часть языка, которая служит для называния формальных объектов и для выражения утверждений, получаемых внутри системы, состоит исключительно из следующих элементов: 1) конечное число основных существительных; 2) функтор от двух аргументов, называемый аппликацией, образующий существительное из двух существительных, и 3) функтор, образующий предложение от одного номинального аргумента. Однако при помощи этой системы могут быть представлены очень сложные типы логических систем. С целью объяснить парадоксы, которые были известны логикам в течение почти полувека, уже довольно давно пришли к осознанию необходимости формализовать различия семантической категории внутри системы. Для этого требуются: (а) существительные, представляющие основные категории; (б) механизмы для образования производных категорий; 13 Дальнейшую информацию, относящуюся к этой системе, см. в [9], особенно гл. 1 и 8. Краткое изложение, помимо докладов, цитированных по [9] (стр. 1), см. в вводной части [6]. 109
(в) аксиомы, приписывающие категориям первоначальные понятия, представленные существительными; (г) средства для доказательства (внутри системы) о том, что понятия, созданные из первоначальных на основе операций, принадлежат к соответствующим категориям. Так как (XY), то есть аппликация X и Y, интерпретируется как значимость X (или функция) аргумента У, то соответствующее средство формализации (б) и (г) должно постулировать понятие F, называемое первоначальной функциональностью, для того чтобы затем сказать следующее: когда X есть Faß и Y есть а, то (XY) есть β. На этой основе, я думаю, можно рассматривать унифи- цированно все приемы, которыми пользуются разные ученые логики во избежание парадоксов14. Сходные идеи, касающиеся семантических категорий, высказывались и прежде. Лесневский придавал, по- видимому, особое значение той мысли, что ликвидация парадоксов требует изучения семантических категорий. От X. Хижа я узнал, что эта идея восходит к одной из ранних работ Гуссерля. Для ознакомления с содержанием этой работы и современным развитием ее идей наиболее доступными источниками являются работы Айдукевича [1] и Сушко [19]15. Итак, о логическом происхождении F было сказано достаточно. Применение указанных идей в лингвистике возникло как бы в качестве некоторого дополнительного вывода. Естественно ожидать, что лингвистическое применение потребует некоторых модификаций этих идей. Но я думаю, что как раз это и будет способствовать улучшению современной техники лингвистического анализа. Закончу некоторыми замечаниями на этот счет. Прежде всего комбинаторная логика была сформулирована как система, в которой формальные объекты понимались несколько иначе, чем это имеет место в случае со стандартными формализациями логики. Стандартные операции в то время сводились к требованию, чтобы формаль- 14 Так, теория типов, «определенные» понятия Цермело, Френкеля и их последователей, «стратификация» Куайна — все являются специализациями этой идеи в том смысле, что их, по крайней мере в принципе, можно рассматривать как примыкающие к комбинаторной теории функциональности специальные допущения, приведенные в данном тексте под пунктами (а) и (в). 15 Историю этих идей см. в [9], стр. 273. 110
ные объекты были выражениями некоторого «объектного языка». Это значит, что они должны были быть цепочками, образованными из символов такого объектного языка при помощи операции сцепления. В комбинаторной логике эти формальные объекты, называемые обами (obs), были полностью неопределяемыми; просто постулировалось, что: 1) имеется бинарная операция аппликации над ними; 2) «обы» должны составляться из первоначальных объектов, называемых атомами (atoms), при помощи этой операции, причем конструкция «оба» является единственной. Это значит, что «обы» рассматривались не как цепочки атомов, а как структуры, похожие на генеалогическое дерево. Теперь, конечно, известны различные пути сопоставления такого дерева с цепочкой. Любой метод, позволяющий устанавливать взаимно-однозначное соответствие между «обами» и специальным классом выражений, именуемых вефами (wefs) (то есть хорошо образованными выражениями —well formed expressions), называется представлением системы. Для того чтобы линейный язык стал представлением в этом смысле, нужно, чтобы каждый «веф» указывал только одну-единственную конструкцию (то есть единственное дерево): в этом случае язык будет называться монотектоническим 16. Аналогичным образом мы можем представить себе и язык, то есть мы можем думать о нем не как о системе выражений, а как о системе фраз (в смысле, определенном в § 5), которые образованы функторами из первоначальных или атомарных фраз. Мы даже можем несколько расширить это представление, рассматривая сами функторы в качестве фраз и воспринимая фразу как конструкцию, возникшую при применении единственной операции аппликации функтора к его первому аргументу. Таким образом, мы можем воспринимать грамматическую структуру языка как нечто независимое от способа, каким он представляется при помощи выражений; и эта грамматическая структура может изучаться посредством функторов F (а возможно, и других аналогичных понятий). Конечно, это требует дополнительного изучения тех путей, которым следуют, чтобы представить фразы с помощью выражений. 16 В [7] я назвал это свойство тектоническим свойством. Но теперь я думаю, что термин «монотектонический» гораздо лучше, ибо его можно сопоставить с термином «политектонический», выражающим противоположное свойство. 111
Так, мы получаем два уровня грамматики: первый, где мы имеем изучение грамматической структуры самой по себе, и второй, который так относится к первому, как морфофонемика к морфологии. Для того чтобы получить термины, которыми можно пользоваться незамедлительно, я назову эти два уровня соответственно тектограмматикой и фенограмматикой; не сомневаюсь, что со временем будут предложены более удачные термины. Одним или двумя примерами проиллюстрирую только что сказанное. Оператор аппликации в комбинаторной логике может быть представлен функтором '—1—2', включающим скобки, или префиксом '*—1—2' без скобок. Можно доказать, что оба эти представления будут монотектоническими. Таким образом, для представления комбинаторной логики мы могли бы иметь два языка, которые обладали бы одной и той же грамматической структурой, но отличались бы по своим фенограмматикам. Другой пример —теория «самов», в которой суффикс '—1 b' может быть заменен префиксом 's— 1'. Хэррис и Хомский предложили разделить грамматику на три ступени: грамматика «непосредственно составляющих» («phrase structure» grammar), трансформационная грамматика и морфофонемика. Но если грамматика «непосредственно составляющих» прибегает к построению фраз путем связывания примыкающих фраз, то тогда она имеет фенограмматический вид. С точки зрения тектограмма- тики, я не вижу причин располагать грамматику «непосредственно составляющих» и трансформационную грамматику на отдельных уровнях, а также предполагать, что операции грамматики непосредственно составляющих обязательно либо предшествуют, либо следуют за трансформационными операциями. В том же духе Ламбек 17 предложил недавно исчисление грамматической структуры, базирующееся на двух видах понятия функциональности, изображаемых косыми линиями. Так, NjS могло бы означать функтор, образующий существительное из сентенциального аргумента на его правой стороне, в то время как N\S означало бы функтор, образующий предложения из номинального аргумента слева. Это скорее классификация выражений в связывающей грамматике, чем классификация функторов в смысле См. Ламбек, [15], а также его доклад на этом симпозиуме. 112
§ 6. Если мы будем употреблять "f' как сокращение для выражения, то «'f' есть N/S» Ламбека будет означать то же самое, что и мое «"f—1' есть FSN», а его «'f' есть N\S» будет означать то же самое, что и мое «"—1f' есть FNS». Таким образом, концепция Ламбека имеет примесь фенограмматики. Кроме того, она, по-видимому, полностью порывает с функторами, которые не являются ни префиксами, ни суффиксами. Можно ожидать, что грамматическая структура будет меньше варьировать от языка к языку, чем фенограмма- тика. Различные языки используют совершенно различные приемы для обозначения грамматического построения фраз. В некоторых языках важен порядок слов, как это имеет место в английском языке; но, например, в латинском языке три слова во фразе Puer puellam amat «Мальчик девочку любит» могут быть сгруппированы любым из шести возможных способов без изменения структуры. Такие языки обычно имеют функторы, состоящие из отдельных частей или из частей, значительно отдаленных от аргументов. Наконец, я упомяну два явления, которые встречаются в естественных языках, но редки в искусственных языках логики и математики. Можно ожидать, что они послужат причиной некоторой модификации понятий грамматики. Первое из них представляет собой явление эллипсиса. В естественных языках наблюдается тенденция опускать все то, что не является необходимым для общения в данном контексте. Так, почти любое отдельно взятое слово в английском языке само по себе способно образовать предложение; и можно представить себе вопрос, осмысленным ответом на который мог бы быть отдельно взятый суффикс. Большинство языков имеет местоимения и, как недавно указал Хэррис18, может обладать также проморфемами других типов, в частности «словами-заместителями глаголов» (proverbs). Это необходимо учитывать при обсуждении вопроса о грамматических структурах. Второе явление заключается в том, что одна и та же фраза может быть сконструирована по-разному. При этом 18 См. Harris, [10]. 8—2238 113
я не принимаю во внимание омонимию, которая представляет собой (по форме) подобие того, что многие из нас стали бы рассматривать как различные фразы. Я имею в виду тот факт, что даже фразы, которые мы хотели бы рассматривать как семантически тождественные, можно все же анализировать различными путями. Так, предложение he clams were eaten by the children «Моллюски были съедены детьми» рассматривается Хомским как необходимо полученное из предложения The children ate the clams «Дети съели моллюсков» при помощи трансформации для пассивного залога, которая представляет собой функтор FSS. Но существует и альтернативное объяснение, поскольку данное предложение можно рассматривать еще и как образованное при помощи функтора FNS —iwere eaten by the children «—ι были съедены детьми» путем применения его к существительному «моллюски», взятому в качестве аргумента. В случае предложения The clams were eaten by the seashore «Моллюски были съедены берегом моря» это будет единственное возможное объяснение. Верно, что by во втором предложении просто омоним для by в первом (и в немецком языке оно выражалось бы другим словом). Но я не могу согласиться с утверждением, что второй анализ правилен во втором случае, но не в первом. Искусственные языки математики и логики, вообще говоря, обладают тем свойством, что каждая фраза имеет единственную конструкцию, то есть это языки монотектонические. Но было бы ошибкой допустить a priori, что и естественные языки обладают тем же свойством. Они могут быть (и я полагаю, что большинство из них действительно является) политектоническими, и эквивалентность различных конструкций одного и того же предложения является одним из тех признаков, который следует принимать 114
во внимание в грамматике, удовлетворяющей всем требованиям. Эти обстоятельства, как и сверхупрощение N и S, взятых лишь в качестве единственных основных категорий, могут, я думаю, быть приняты во внимание. Они не влияют на основное положение о том, что можно с успехом изучать грамматическую структуру как таковую. ЛИТЕРАТУРА Сокращенные обозначения цитируемых работ с указанием или без указания автора состоят из чисел в квадратных скобках (см. нижеследующий список). (Когда нет никакой ссылки на автора, то это обычно Карри или Карри и Фейс.) Названия журналов сокращены в соответствии с принятыми сокращениями в «Mathematical Reviews». 1) Kazimierz Ajdukiewicz [I] — Die syntaktische Konnexität, «Studia Philos.», vol. 1, 1935, pp. 1—27. 2) Leonard Bloomfield [2] — Language, New York, 1933. 3) Rudolf Carnap [3] — Introduction to Semantics, Cambridge, Mass., 1942. 4) Noam Chomsky [4] — Logical Structure in Language, «American Documentation», vol. 8, 1957, pp. 284—291. [5] —Syntactic Structure,'s Gravenhague, 1957. 5) Haskell B. Curry [6] — The Deduction Theorem in the Combinatory Theory of Restricted Generality, Logique et Analyse, 3-е Année, 1960, pp. 15—39. [7] — Languages and Formal Systems (Proceedings of the Tenth International Congress of Philosophy), 1949, pp. 770—772. [8] — Mathematics, Syntactics and Logic, Mind, vol. 62, 1953, pp. 172—183. 6) Haskell B. Curry and Robert F e y s [9] — Combinatory Logic, Amsterdam, 1958. 7) Zellig Harris [10] — Co-occurence and Transformation in Linguistic Structure, «Language», vol. 33, 1957, pp. 283—340. [II] —Methods in Structural Linguistics, Chicago, 111., 1951. 8) Archibald A. Hill [12] — Introduction to Linguistic Structure, New York, 1958. 9) Charles F. Hockett [13] —A Course of Modern Linguistics, N. Y., 1958. 8* 115
10) Otto Jespersen [14] — Philosophy of Grammar, London, 1924. 11) Joachim Lambek [15] — The Mathematics of Sentence Structure, «Amer. Mathem. Monthly», vol. 65, 1958, pp. 154—170. 12) Charles Morris [16] — Foundations of the Theory of Signs, Chicago, 1938. [17] —Signs, Language and Behavior, N. Y., 1946. 13) Josef Schächter [18] — Prolegomena zu einer kritischen Grammatik, Vienna, 1935 (ср. обозрение этой работы— Weinberg, «Phil. Rev.», vol. 46, 1937, pp. 334—335). 14) Roman S u s ζ к о [19] —Syntactic Structure and Semantical Reference I, «Studia Logica», vol. 8, 1958, pp. 213—244.
M. Халле О РОЛИ ПРОСТОТЫ В ЛИНГВИСТИЧЕСКИХ ОПИСАНИЯХ*1 Почти с самого возникновения абстрактного подхода к изучению языка предлагались какие-то схемы классификации звуков речи. Это и не удивительно, поскольку вполне очевидно, что звуки речи образуют различные пересекающиеся классы. Так, например, все конечные звуки в словах ram, ran, rang обладают свойством назальности, то есть они возникают в тот момент, когда опущено мягкое нёбо, и воздух может проходить через нос. Аналогичным образом звук [m], так же как звуки [р] и [b], образуется в тот момент, когда губы сомкнуты или, как сказали бы фонетисты, этот звук имеет губно-губную артикуляцию. Таким образом, отдельные звуки речи можно охарактеризовать как комплексы назальности, определенного места артикуляции и некоторых других свойств. Из всех подобных свойств складываются различные системы классификации. Такие системы, конечно, отличаются одна от другой, и вплоть до настоящего времени фонетисты не пришли к какой-либо единой системе, которую можно было бы применить к любому описанию языка. В дальнейшем я буду пользоваться термином «различительные признаки» (distinctive features), который ввел в обиход Роман Якобсон. * Morris Halle, On the Role of Simplicity in Linguistic Descriptions, в «Structure of Language and Its Mathematical Aspects» (Proceedings of Symposia in Applied Mathematics, vol. XII), 1961, pp. 89—94. 1 Эта работа финансировалась частично военными организациями США (Управлением войск связи, Научно-исследовательским управлением ВМС, Управлением научных исследований ВВС) и частично Национальным научным фондом. 117
Система различительных признаков отличается от всех других тем, что она состоит из бинарных свойств. Если мы будем строить свою классификацию на основе различительных признаков, то о звуках речи мы должны будем говорить только в терминах двузначных характеристик, то есть таких свойств, которыми данный звук может или не может обладать. Способ характеристики отдельных звуков речи в терминах различительных признаков показан на рис. 1. В этой системе звук [s] характеризуется как негласный, согласный, ненизкий, некомпактный, резкий, неносовой, непрерывный, глухой;звук [m] описывается как негласный, согласный, низкий, некомпактный, нерезкий, носовой, прерывный, звонкий. Следовательно, знаки алфавита s и m, которыми мы условно обозначаем эти звуки, являются не чем иным, как сокращениями, заменяющими комплексы только что упомянутых признаков. Ниже мы будем рассматривать звуки именно как такие комплексы, а не как неделимые сущности. Будет показано, что подобный подход открывает путь для дальнейших исследований в этой области. Заметим, что с помощью указанных признаков очень удобно описывать различные классы звуков речи. Так, например, все звуки, представленные на рис. 1, относятся к классу согласных и в качестве таковых обладают признаками «негласный» и «согласный». Можно заметить также, что единственными согласными, которым свойственны признаки «ненизкий» и «резкий», являются звуки [s ζ с 3 s ζ], а звуки [ρ b f ν m] обладают общими признаками «резкий, некомпактный». С другой стороны, [m] и [s] не имеют таких признаков, которые бы отличали их и только их от других согласных. Если бы мы захотели охарактеризовать с помощью различительных признаков класс, содержащий только звуки [m] и [s], нам пришлось бы составить длинный, громоздкий список признаков. Мы будем говорить, что множество звуков речи образует естественный класс в том случае, если для описания этого класса требуется меньшее количество признаков, чем для характеристики любого отдельного звука в классе. Следовательно, первые три множества звуков образуют естественные классы, а множество, содержащее [m] и [s], класса не образует. 118
pbmfvkgtdö on s z с 3 S z согласный -f + -j- низкий + + + компактный резкий носовой + непрерывный звонкий — + + + + + + + + 1 1 1 1 1 1 1 1 — + + — + н + + —+—+—+ + — — — + — ++++++++ + + + + + + + + + + - + + - + + + + + -1 h _ + _ + Рис. 1. Различительные признаки согласных в английском языке. Якобсон показал, что при описании самых различных лингвистических фактов мы обычно встречаемся с множеством звуков, которые образуют естественные классы в системе различительных признаков, и что классы звуков, требующие для своей характеристики длинных, громоздких списков различительных признаков, встречаются редко. В качестве примера рассмотрим образование множественного числа имен существительных в английском языке. Каждый говорящий по-английски знает из практики, что только в тех случаях, когда существительное оканчивается на [s z s z с jl, при образовании множественного числа к нему добавляется слог [iz]. Но, как мы уже видели, именно этот класс согласных исчерпывающе характеризуется признаками «ненизкий, резкий». Такое совпадение является важным, поскольку различительные признаки не составлялись специально для того, чтобы дать удобное описание правил образования множественного числа английских существительных. Сделанные выше замечания наводят на мысль о целесообразности использования особого понятия экономии описания. Хотелось бы, чтобы в той части лингвистического описания, которая имеет отношение к звуковому аспекту языка, экономия измерялась количеством используемых при описании различительных признаков. Чем меньше упомянуто в описании признаков, тем больше его экономия. Не трудно заметить, что в простых случаях, как мы того и ожидали, можно найти подтверждения этому критерию. Если налицо две формулировки, из которых 119
одна применима ко всем согласным, а другая — только к резким, то мы, не колеблясь, должны сказать, что первая является более общей и более экономичной. Но это касается и количества различительных признаков, поскольку, говоря о классе всех согласных, достаточно упомянуть только признаки негласный и согласный, в то время как для обозначения класса резких согласных мы должны характеризовать его еще и как резкий, то есть к общим признакам, характеризующим класс всех согласных, добавить еще один признак. Аналогичным образом правило, применяемое без ограничений, мы считаем более общим, а следовательно, и более простым, чем правило, которое применяется лишь в определенных контекстах. Последнее также потребовало бы упоминания большего количества признаков, чем правило, применяемое без ограничений, поскольку здесь нужно было бы назвать по крайней мере еще один различительный признак, чтобы отличить один контекст от другого. Предложенный критерий имеет, однако, и другие интересные следствия. Для обнаружения их вернемся к образованию множественного числа английских имен существительных. При образовании множественного числа можно констатировать следующее: (а) [4-z] добавляется, если основа оканчивается на звук, который является негласным, согласным, ненизким и резким; (б) [s<] добавляется, если основа оканчивается на звук, который является негласным, согласным, глухим и нерезким; или: негласным, согласным, глухим, резким и низким; (в) [ζ] добавляется, если основа оканчивается на звук, который является гласным; или: негласным, согласным, звонким и нерезким; или: негласным, согласным, звонким, резким и низким. Следует заметить, что приведенные выше три формулировки не упорядочены по отношению друг к другу, и именно это обстоятельство делает их такими громоздкими. Мы можем их значительно упростить, если сформулируем их в следующем виде: Для образования множественного числа: (А) добавляется [tz], если основа оканчивается на звук, который является негласным, согласным, ненизким, резким; 120
(Б) добавляется [s], если основа оканчивается на звук, который является негласным, согласным и глухим; (В) добавляется [z]. Относительная длина этих двух групп формулировок графически отражает их относительную простоту. Поэтому упорядочение в данном случае является обязательным, если мы желаем, чтобы наш критерий простоты был удовлетворительным. Предложение о необходимости упорядочения применения правил не является новым. Любое описание, которое использует фразы типа «во всех других случаях», для того чтобы избежать необходимости подробной расшифровки того, чем могли бы быть эти «другие случаи», устанавливает порядок среди дескриптивных формулировок. Новым здесь является только то, что причина установления порядка указывается совершенно точно, то есть непосредственно вытекает из предложенного критерия простоты. Заметим, однако, что упорядочение, установленное на такой основе, не является универсальным, поскольку в некоторых случаях упрощения описания может и не быть. Теперь рассмотрим гипотетический диалект английского языка 2, который отличается от стандартного языка в двух отношениях. Там, где стандартный язык в положении, кроме начального, имеет непрерывный (фрикативный) согласный, наш диалект содержит прерывный (взрывной). Там, где стандартный язык имеет несколько идентичных прерывных согласных в слове, в диалекте они все, за исключением первого, заменяются гортанным взрывным. [р'л9 [Ь' е* [t'o'j id'af1 2 Диалект, имеющий почти точно такие же признаки, был описан моим коллегой по Массачусетскому технологическому институту доктором Дж. Р. Эпплгейтом. Для того чтобы яснее проиллюстрировать мою точку зрения, я несколько изменил фактическую сторону. Однако это ни в коей мере не влияет на правдоподобие приведенного примера. Примеры: I cuff (cup) [к'л ρ] gave (gäbe) [g'eb] sauce (sought) [s'ot] lies (lied) [l'ajd] II puff [р'лр] brave [br'eb] toss [t'ot] dies [d'ajd] III pup babe taught died 121
Следует заметить, что в диалекте допускаются слова с несколькими идентичными взрывными согласными — это видно из примеров второго столбца. Но в каждом из этих примеров второй взрывной соответствует фрикативному стандартного языка. Фонетические особенности этого диалекта регулируются следующими двумя упорядоченными правилами, не функционирующими в стандартном языке: 1. Если в слове имеется несколько идентичных негласных, согласных прерывных (взрывных), то все они, кроме первого, становятся негласными, несогласными прерывными (то есть в терминах различительных признаков, гортанными взрывными). См. примеры в столбце III. 2. В положении, кроме начального, негласные, согласные непрерывные становятся прерывными. Я думаю, что эти формулировки, предложенные Эппл- гейтом, относятся скорее к фонологической системе диалекта, чем к описанию фонологической системы стандартного языка. Как мне кажется, более правильным было бы в данном случае сказать, что диалект отличается от стандартного языка только двумя относительно маловажными дополнительными правилами нижнего уровня, чем утверждать (что мы должны были бы сделать, если бы отбросили предложенное решение), что диалект отклоняется от стандартного языка в гораздо большей степени и в связи с этим обладает или иным фонемным составом по сравнению со стандартным языком, или совершенно отличной от последнего дистрибуцией фонем. Нужно подчеркнуть, что в формулировках, предложенных Эпплгейтом, упорядочение правил имеет решающее значение. Если, например, правило 1 будет действовать после правила 2, то прерывные, согласно правилу 2, окажутся превращенными в гортанные взрывные, согласно правилу 1, и тогда невозможно будет объяснить примеры второго столбца. Без упорядочения правил мы должны будем принять неинтуитивные альтернативы, упомянутые выше. Если рассматривать процесс синтезирования высказывания как своего рода исчисление, конечные результаты которого передаются в качестве команд органам речи, а последние в свою очередь производят акустический сигнал, возбуждающий наши органы слуха, то описанные правила будут просто шагами в исчислении. Мы обнаружили, что при упорядочении этих шагов особым образом наше 122
исчисление становится менее трудоемким. Теперь мы могли бы задать вопрос, не отражает ли порядок правил хронологической последовательности появления их в языке. Прошел ли, например, только что подвергнутый обсуждению диалект английского языка сначала стадию, на которой он был идентичен стандартному языку, а затем стадию, на которой он отличался от стандартного языка только наличием гортанных взрывных, согласно правилу 1, но отсутствием прерывных, образованных по правилу 2? Если порядок правил можно рассматривать в этом свете, тогда предложенный критерий простоты описания становится важным средством для понимания истории языков, так как он дает нам возможность реконструировать различные стадии развития языка даже при отсутствии внешних доказательств, таких, например, какие представляют записи речи или заимствования из других языков. Этот взгляд на фонологические правила языка отнюдь не является новым. Мне бы хотелось доказать, что реконструкция истории европейских языков, которая явилась, по-видимому, наиболее важным достижением лингвистики девятнадцатого столетия, оказалась возможной только благодаря использованию предложенного критерия экономии для установления порядка в дескриптивных формулировках; было принято допущение, что установленный порядок отражает их относительную хронологическую последовательность. Наиболее наглядно это можно, пожалуй, проиллюстрировать на примере законов Гримма и Вернера, которые с полным основанием относятся к числу самых серьезных достижений в исследованиях по индоевропеистике. Эти законы описывают стадии эволюции германских языков, происшедших из индоевропейского праязыка,— стадии, которые, как это следует заметить, не подтверждены никакими внеязыковыми доказательствами. Предполагается, что индоевропейский праязык должен был обладать единственным фрикативным согласным [s], который был глухим, и довольно сложной системой взрывных, из которых для наших целей необходимо рассмотреть только два — глухой и звонкий. Законы Гримма и Вернера описывают то, что произошло с этими согласными в процессе эволюции германских языков. Интересующая нас часть закона Гримма состоит из двух правил, формулируемых следующим образом: 123
Γ.-l. В определенных контекстах, удовлетворяющих некоторому условию С1, природа которого не интересует нас в данном случае, негласные, согласные, глухие прерывные (взрывные) становятся непрерывными (фрикативными). (Именно в соответствии с этим законом можно сказать, что англ. five сходно с греч. pente, русск. pjat' «пять» и скр. рапса). Γ.-2. Негласные, согласные, звонкие прерывные (взрывные) становятся глухими. (Γ.-2 устанавливает соответствие между англ. ten и греч. deka, русск. desjat' «десять» и скр. daça). Существующие учебники подтверждают, что эти два правила вошли в язык именно в указанном порядке, потому что (и это особенно важно, поскольку нет иных доказательств), если бы Γ.-2 действовал раньше Γ.-l, то глухие непрерывные, образованные по правилу Γ.-2, стали бы прерывными, согласно правилу Γ.-l. Такая аргументация, как мы видим, соответствует изложенным выше соображениям (см. пример, взятый из английского диалекта). Единственный новый фактор здесь состоит в том, что порядку правил, который не имел хронологического значения в английском примере, здесь придано хронологическое значение. В более позднее время германский язык подвергся влиянию закона Вернера, который можно сформулировать следующим образом: В. В контекстах, удовлетворяющих некоторому условию С2, негласные, согласные, глухие непрерывные (фрикативные) становятся звонкими. Если, как думает большинство из нас, закон Вернера стал действовать в языке гораздо позже, чем закон Гримма (Γ.-l), то мы должны допустить, что на этой стадии язык обладал глухими непрерывными двоякого происхождения: звуком [s], который пришел неизменным из индоевропейского праязыка, и глухим фрикативным, полученным в результате действия закона Гримма (правило Γ.-1). Тот факт, что закон Вернера применяется без различия к глухим фрикативным, полученным из этих двух источников, всегда приводился в качестве решающего аргумента для доказательства того, что закон Вернера действовал позже закона Гримма. Однако этот аргумент будет иметь вес только в том случае, если мы изберем такой критерий экономики описания, который будет совпадать с установ- 124
ленным выше. Приведенные факты можно исчерпывающе объяснить (как и в случае с именами существительными множественного числа в английском языке) следующими тремя неупорядоченными правилами. В контекстах, удовлетворяющих условиям Ci и С2> негласные, согласные, глухие прерывные становятся звонкими и непрерывными. В контексте С2 звук [s], то есть полный перечень его признаков, требующий упоминания целого ряда характеристик, становится звонким. С помощью предложенного критерия простоты мы должны отвергнуть неупорядоченные правила, так как они требуют большего количества признаков по сравнению с упорядоченными альтернативами Γ.-l и В. Поскольку не имеется внеязыковых доказательств того, что язык изменялся согласно законам Гримма и Вернера, то принятие этих законов как исторического факта полностью базируется на соображениях простоты. Но соображения простоты,— безусловно, соображения очень веские, ибо, как заметил профессор Куайн, мы конструируем картину нашего мира на основе того, «что существует плюс простота законов, посредством которых мы описываем и экстраполируем то, что существует».
В. Ингве ГИПОТЕЗА ГЛУБИНЫ*1 Общеизвестно, что наблюдается поразительное различие и столь же поразительное сходство между естественным языком, таким, как английский, и языками или системами обозначений в математике. На одном полюсе мы имеем богатства сложнейших систем естественных языков, особенно на уровне структуры предложения, на другом — простоту и изящество математических обозначений. Некоторые из синтаксических особенностей английского языка имеют четкую функцию указателя роли и соподчинения, но до сих пор еще не ясно, почему существует такое разнообразие средств указания на роль и соподчиненность, если можно воспользоваться одним-единственным средством, которое избрал Лукасевич или которое принято в польской префиксальной системе нотации. Далее, можно привести длинный список других сложностей английского синтаксиса, функции которых совершенно непонятны. Многие типы прерывных составляющих могут служить примерами этих синтаксических приемов без какой-либо определенной функции. Для объяснения многих из не раскрытых ранее особенностей английского синтаксиса2 мы воспользуемся так * Victor H. Yngve, The Depth Hipothesis, см. «Structure of Language and Its Mathematical Aspects» (Proceedings of Symposia in Applied Mathematics, vol. XII), American Mathematical Society, 1961.— Прим. ред. 1 Эта работа частично финансировалась Национальным научным фондом (National Science Foundation), а частично Управлением войск связи (Signal Corps U. S. Army), Управлением научных исследований ВВС (Office of Scientific Research, Air Research and Development Command) и Научно-исследовательским управлением BMC (Office of Naval Research). 2 Более подробное и полное изложение публикуется в «Ученых записках Американского философского общества» («Proceedings of the American Philosophical Society»). 126
называемой «гипотезой глубины». Психологи измерили то, что они называют объемом непосредственной памяти. Мы способны запомнить с одного взгляда и правильно воспроизвести приблизительно семь взятых наугад десятичных цифр, около семи не связанных между собой слов, около семи наименований. Это уже давно известно, а специально изучено в Гарвардском университете Джорджем Миллером3. По-видимому, нам приходится считаться с этим ограничением, когда мы говорим. Мы можем вспомнить сразу лишь около семи грамматических или синтаксических ограничений. Гипотеза глубины гласит, что, приняв во внимание ограничение памяти, можно понять многие сложные черты английского синтаксиса. Синтаксис английского языка располагает разнообразными средствами для того, чтобы автоматически удерживать высказывание в пределах, определяемых ограничением, а также многими средствами, позволяющими успешно обойти это ограничение таким образом, чтобы компенсировать потерю экспрессивной силы из-за указанной ограниченности объема непосредственной памяти. Гипотеза глубины предсказывает, что все языки имеют усложненные синтаксические особенности, служащие той же цели. Это утверждение требует проверки. Ограничение объема непосредственной памяти не должно, по-видимому, оказывать какого-либо влияния на структуру математических обозначений, поскольку они являются обозначениями письменными. Чтобы понять, каким образом ограничение объема памяти влияет на синтаксическую структуру языка, нужно обратиться к простой модели построения предложения. Эту модель можно легко запрограммировать для вычислительной машины. Она и в самом деле была предназначена для использования в системе механического перевода. Важные в лингвистическом отношении особенности этой модели можно понять, лишь приняв во внимание два допущения. Первое допущение: для описания синтаксиса языка необходимо применить анализ по непосредственно составляющим. Но поскольку такое описание является статическим, нужно ввести еще и аспект времени (то есть порядок следования операций для данной модели) — и это 3 George А. Miller, Human Memory and the Storage of Information, «I. R. E. Transactions on Information Theory», vol. IT—2, № 3, 1956, pp. 129—137. 127
второе допущение. Оно предполагает, что слова предложения появляются каждое по одному в их естественной временной последовательности, то есть слева направо, в соответствии с обычной орфографией, и что для правил грамматики непосредственно составляющих применяется метод расширения, то есть раскрытие сверху вниз, как показано на наших диаграммах. S NP VP Τ Ν Ν V · — · ► * ► NP + VP Τ + V + the mon ball hit N NP ball,4 Рис. 1. Построение предложения включает применение грамматических правил, подобных тем, какие приведены справа. Для этих правил применяется метод расширения, и расширяются они слева направо. Номера индексов показывают порядок применения правил. На рис. 1 показано, как действовали бы эти допущения при реальном построении предложения с помощью данной модели. Где-то в памяти машины хранится перечень правил грамматики непосредственно составляющих, подобных приведенным справа, который обеспечивает непосредственно составляющие для каждой конструкции данного языка. Предполагается, что этот перечень правил является конечным и что в лингвистическом отношении безразлично, в каком порядке эти правила перечисляются. Любой порядок годится. Например, может оказаться удобным алфавитный порядок. На вершине дерева находится 128
символ S, обозначающий предложение. Первое правило, которое следует применить, предписывает расширить символ S до его непосредственно составляющих: именной группы (NP) — подлежащего и глагольной группы (VP) — сказуемого. Затем именная группа подлежащего расширяется до артикля (Т) и имени (N), и так далее (в соответствии с приведенными правилами). Порядок расширения конструкций до их составляющих обозначается индексами. Этот порядок во всех случаях предусматривает в первую the Рис. 2. Неограниченно длинные предложения можно получить путем повторного применения определенных правил. Здесь правило S->NP+VP применялось в узле 1 и затем вновь в узле 13. очередь расширение левостороннего члена каждой конструкции, а после того, как будет достигнут конец ветви,— возвращение к следующему, более высокому, правостороннему члену. Таким путем слова производятся в их обычном порядке, слева направо. Хотя принятая нами грамматика состоит из конечного числа правил, наша машина благодаря своим особенностям может произвести любое предложение, выбранное из бесконечного множества предложений. Она делает это путем повторного применения правил неограниченное число раз, вновь и вновь создавая придаточные предложения внутри предложения. Рис. 2 показывает, как одно и то же правило может быть применено дважды. На вершине 9—2238 129
дерева предложение S расширяется до NP и VP, а справа оно расширяется до NP и VP снова, но уже в зависимом предложении. Так может продолжаться без конца. Например: The girl knows that the papers reported that the woman said that the man... и т. д. «Девочка знает, что газеты сообщили, что женщина сказала, что мужчина...». Каким образом ограниченность объема памяти отражается в нашей модели, можно понять из нижеследующего. При выдаче предложения машина должна как-то запоминать, что ей предписывается правилами грамматики данного языка делать далее. Расширив S до подлежащего NP и сказуемого VP, она переходит к расширению самой левой составляющей NP. Но где-то в своей памяти она должна записать информацию о том, что когда она закончит со всеми ветвями, зависящими от NP, она обязана расширить некоторое VP, так как иначе она не получит грамматически правильного английского предложения. Подобным же образом после расширения NP до Τ и N она должна отослать N в запоминающее устройство на то время, пока она расширяет Т. Таким образом, всякий раз, когда машина спускается по левой ветви, она должна записывать в своей оперативной памяти один символ для каждого шага, сделанного вниз по этой ветви. На левой диаграмме рис. 3 машина работает над узлом 5 некоторого предложения. Она отослала в запоминающее устройство четыре названия узлов, отмеченных кружками. На диаграмме справа эта же самая структура показана на более поздней стадии. Машина закончила с узлом 5, получила узлы 6 и 7 из своей памяти и расширила их, а теперь работает над узлом 11. Она все еще имеет в своей памяти четыре символа: два из записанных первоначально и два новых, которые появились в результате расширения узлов 7 и 10. В конечном счете ей придется вернуться и расширить их все. Если в соответствии с правилами грамматики разрешается производить неограниченно длинные предложения (или, что то же самое, если перечень предложений бесконечен), то, спрашивается, какого объема оперативная память потребуется машине? Неограниченно большого? Попробуем исследовать этот вопрос. На рис. 4, слева, показана регрессивная структура. Мы называем ее регрессивной структурой потому, что машине приходится спускаться по стволу, расширяя узлы 1, 2, 3, 4 и 5 и записы- 130
Рис. 3. Применяя правила, необходимо удерживать в оперативной памяти символы, обеспечивающие грамматическое завершение предложения. Кружками представлены названия узлов, которые сохраняются в оперативной памяти на указанных двух стадиях построения предложения. Цифры показывают порядок применения правил. 2 / / 9V / / Регрессивная Прогрессивная структура структура Рис. 4. Регрессивная структура, подобная представленной слева, требует, чтобы запоминался дополнительный символ для каждого шага вниз. Структура, имеющая глубину, равную четырем, требует запоминания четырех символов Л, В, С и D. Прогрессивная структура, подобная представленной справа, может расширяться неограниченно, путем использования оперативной памяти, которая может сохранить только один символ. 131
вая в своей памяти некоторое количество символов (в данном случае четыре, потому что имеются четыре нерасширенных ветви), после чего она должна вернуться наверх и расширить по очереди ветви, отходящие от A, B, С и D. Данная регрессивная структура имеет глубину, равную четырем. Глубина узла численно равна количеству символов, записанных в оперативной памяти непосредственно перед тем, как очередной узел должен быть расширен. Справа представлена прогрессивная структура. Машина может продолжать спускаться вдоль главного ствола, производя расширения по мере продвижения и ни разу не возвращаясь назад, причем при каждом шаге она отсылает в оперативную память только один символ, всякий раз выбирая его снова из памяти и расширяя его. Понятно, что регрессивные структуры, становясь все более длинными, требуют все большего и большего запоминания, тогда как прогрессивные структуры этого не требуют. Последние могут продолжаться бесконечно, удовлетворяясь минимумом памяти. Остается описать схему, представленную на рис. 5. Если бы память позволяла запоминать одновременно только три символа, то можно было бы построить структуру, подобную представленной на рис. 5, но было бы невозможно построить такую структуру, которая проникла бы за пунктирную линию. Мы уже говорили, что человек может запомнить одновременно и воспроизвести только около семи наименований. Английские предложения можно представить деревьями, которые как бы ограничены пунктирной линией на глубине, равной примерно семи. Таким образом, структура английского языка оказывается внутренне асимметричной в том смысле, что она не располагает такими возможностями ветвления влево, какие имеют место при ветвлении напразо. Интересно, что системы обозначений в математике и символической логике не имеют этого ограничения. По существу своему они являются письменными языками. Проблема запоминания дальнейших шагов разрешается математиком при помощи просмотра того, что он написал; продолжая записывать, он не обязан хранить все написанное в своей памяти. Напротив, при устном общении приходится держать в голове высказанную часть сообщения, имея ограничение на объем непосредственной памяти, равное приблизительно семи названиям. 132
s Рис. 5. Если оперативная память может хранить только три символа, то структуры, которые могут производиться при этом, ограничиваются глубиной, равной трем, и никогда не смогут проникнуть за пунктирную линию. Утверждать, что очень глубокие структуры допускаются в английском языке, но не употребляются из-за ограничения памяти, нельзя. Суть дела здесь в следующем: грамматика английского языка строится таким о0разом, что в ней исключаются слишком глубокие конструкции, а взамен их вводятся конструкции меньшей глубины. Именно этим и объясняется большая сложность английского языка по сравнению с системами обозначения в математике и символической логике. Одной из наиболее удивительных особенностей английского синтаксиса является связь системы частей речи с правилами порядка слов. Мы имеем в виду следующее. Возьмем, к примеру, предложение Very clearly projected 133
pictures appeare «Очень четко спроектированные [на экран] изображения появились». Это чисто регрессивная структура с глубиной, равной четырем. На рисунке 6 показано, как строится это предложение. Считая вниз от вершины, мы имеем сначала глагол «appeared», затем существительное «pictures», затем прилагательное «projected», затем наречие «clearly» и наконец вторичное наречие «very» особого, ограниченного класса. VERB noun ADJECTIVE SEC. ADVERB ADVERB Рис. 6. Иерархия частей речи в английском языке служит для подсчета регрессивных шагов и помогает избежать предложений слишком большой глубины. В английском языке отсутствует аналогичный подсчет в прогрессивном направлении. Дальше продолжать построение этой структуры в регрессивном плане весьма затруднительно. Система частей речи обеспечивает способ автоматического подсчета шагов вниз по регрессивной ветви и прекращения расширения конструкции прежде, чем она пересечет предел глубины. Ясно, что эта система представляет собой схему подсчета и не связана со значением слов, потому что нередко оказывается возможным передвигать слова вниз и вверх по этой лестнице, относя их в соответствии с этим то к одним, то к другим частям речи. Например, в сочетании a very clear projection «очень четкая проекция [на экран]» причастное прилагательное projected «спроектированный» становится существительным projection «проекция», а наречие clearly «четко» — прилагательным clear «четкий». Неизменными остаются и категории частей речи, которые служат для учета длины регрессии. Для английского языка характер- 134
но, что он не располагает средствами для подсчета в прогрессивном направлении. Существует немало прогрессивных конструкций, которые могут продолжаться бесконечно. Прежде всего это координация (co-ordination) [=сочинительная связь], которая, например, имеет место в длинной цепочке коорди- нативных именных групп. В прогрессивном направлении она может продолжаться бесконечно. Затем нужно отметить модель накапливания нескольких прилагательных перед именем существительным. Но когда мы сталкиваемся с подчиненными придаточными предложениями, мы должны рассмотреть их более детально. у\ /\ /\ /\ /\ /\ Рис. 7. Неограниченное применение правила А, соответствующее схемам, показанным слева, привело бы к структурам, превышающим любой предел глубины. Эти структуры грамматически неправильны. Неограниченное применение в соответствии со схемами, данными справа, не приводит к беспредельному возрастанию глубины и поэтому они безопасны. На рис. 7 представлены разнообразные структуры, предполагающие повторное применение правила А. Структуры, находящиеся слева от пунктирной линии, были бы грамматически неправильными, потому что требуемая ими возможность неограниченного применения правила А привела бы к неограниченному возрастанию глубины. Таким образом, мы были бы введены в заблуждение, стремясь к достижению слишком большой глубины. Структуры, находящиеся справа, не приводят к ошибке, поскольку 135
они могут встретиться на самом деле. В английском языке имеется значительное количество структур, включающих подчиненные придаточные предложения, которые могут повторяться в неограниченном числе. Эти структуры аналогичны данным справа. В качестве примера приведем придаточное дополнительное предложение: I watched him watch Mary watch baby feed the kitten «Я наблюдал, как он наблюдал, как Мэри наблюдала, как ребенок кормил котенка». Или придаточное дополнительное предложение другого типа: I imagined him hearing the announcer reporting Bill catching Tom stealing third base «Я вообразил, что он слышал, как диктор сообщил, что Билл «запятнал» Тома, который пытался достичь третьей «базы дома»». Или, например, придаточное предложение с that [относительное «что»]: John said that Paul said that Bill said that he had won the race «Джон сказал, что Поль сказал, что Билл сказал, что он выиграл гонки». Но придаточное предложение с that можно поставить также в качестве придаточного-подлежащего перед глаголом, и это уже будет регрессивная конструкция. Ее нельзя повторять неограниченно, например: That it is true is obvious «To, что это справедливо, очевидно». Теперь рассмотрим два придаточ- ных-подлежащих с that: That that it is true is obvious isn't clear «To, что то, что это справедливо, очевидно, не ясно». Грамматически это построение неправильно. Эта структура расположена в левой половине рис. 7 ближе к пунктирной линии. Вместо нее в английском языке употребляется «вводящее» it — одно из типичных усложнений английского синтаксиса: It isn't clear that it is obvious that it is true «He ясно, что очевидно, что это справедливо». Наконец, надо сказать, что существует еще одна прогрессивная структура, которую можно расширять неограниченно — это дополнительное придаточное предложение с what (вопросительное «что»): Не knows what should have been included in what came with what he ordered «Он знает, что следовало бы включить в то, что пришло с тем, что он заказывал». Но если придаточное предложение с what выступает в позиции подлежащего, тогда повторение не должно иметь места. Вот попытка использовать сразу три придаточных-подлежащих с what: What what what he wanted cost would buy in Germany was amazing «Что, что, что он хотел бы заплатить, купило бы в Германии, было поразительно». Это грамматически неправильное по- 136
строение. Оно является регрессивной структурой. Вместо нее, используя три принятые в грамматике усложненные структуры — прерывную составляющую, пассивный залог и номинализацию,— можно построить заменяющую ее прогрессивную структуру: It was amazing what could be bought in Germany for the cost of what he wanted «Было поразительно, что можно было бы купить в Германии за ту цену, за которую он хотел». Прерывные составляющие в английском языке служат, по-видимому, для того, чтобы отложить построение потенциально глубоких структур до момента, когда будет достигнута точка наименьшей глубины, осуществляя это путем перенесения структур из левой части дерева в правую. Приведем интересный пример. Если пассивный залог используется таким образом, что подлежащее активного залога может оставаться невыраженным, тогда построение с большой мерой глубины можно передвинуть на место подлежащего, где оно приобретает начальную величину глубины, равную единице. Например: In a recent paper, measurements of the effect of alloying on the superconductive critical temperature of tin were presented «В недавней статье результаты измерения влияния примесей на критическую температуру сверхпроводимости олова были изложены». Такие структуры получили у грамматистов название «сверхгромоздких» («top heavy»). В качестве альтернативы подлежащее нередко расщепляется на прерывные составляющие: In a recent paper, measurements (were presented) of the effect of alloying on the superconductive critical temperature of tin «В недавней статье результаты измерений (были изложены) влияния примесей на критическую температуру сверхпроводимости олова». Здесь, в результате синтаксического усложнения, предложная группа, определяющая подлежащее, ставится после сказуемого, и таким образом мы получаем грамматически правильный, но «нелогичный» порядок слов: подлежащее, сказуемое, определения к подлежащему. Из-за недостатка времени я ограничусь этими примерами, хотя их существует гораздо больше. На основании концепции, изложенной в настоящей статье, мы утверждаем, что английские предложения можно производить с помощью машины с конечным числом состояний. Синтаксис английского языка не представляет собой бесконечного списка замысловатых усложнений, 137
хотя в нем и сохраняются некоторые следы прошлого. Но английский язык не оказывается и абстрактной формальной системой, выступающей наравне с определенными изящными системами обозначений в математике. Вместо этого он предстает как чрезвычайно хорошо построенное орудие общения, обладающее многими искусными инновациями, позволяющими приспособить его к возможностям его носителей и обойти, насколько возможно, ограничения человеческой памяти. Остается выяснить, насколько удачно можно применить нашу гипотезу к другим языкам. Я надеюсь, что некоторые из вас заинтересуются проведением таких экспериментов. Несомненно, что другие языки отличаются от английского. У них может не оказаться именно тех черт, какие мы объяснили на основе гипотезы глубины. Они могут обладать особенностями, прямо противоположными тем, которые присущи английскому языку, например наличием послелогов вместо предлогов. Не смущаясь этим, следует подвергнуть анализу в свете нашей гипотезы общую структуру синтаксиса рассматриваемого языка, поскольку обычно как раз взаимодействие ряда особенностей языка и препятствует тому, чтобы то или другое предложение становилось слишком глубоким. Следует ожидать, что все языки располагают способами ограничения регрессии, способами сохранения глубины, а также способами, которые дают возможность обойти ограничения объема памяти, для того чтобы сберечь экспрессивную силу. В последней части гипотезы предлагается причислить явления глубины к списку уже известных факторов, влияющих на развитие языка. Фактор глубины в языковых изменениях, если таковой существует, должно быть, нетрудно обнаружить, и он, вероятно, быстро проявится, если сравнить грамматические описания различных периодов в развитии языка.
Ч. Хоккетт ГРАММАТИКА ДЛЯ СЛУШАЮЩЕГО* Введение. Этот доклад служит введением к обсуждению проблемы построения грамматики с точки зрения, выгодной для слушающего, то есть человека, владеющего языком, который в данный момент молча слушает говорящего. Впрочем, эта точка зрения скорее должна быть названа невыгодной, чем выгодной. Грамматист может рассматривать предложение как постоянную структуру, поддающуюся тщательному и повторному изучению, причем как справа налево, так и слева направо или в любом другом порядке. Это возможно потому, что грамматист оперирует не непосредственно с предложением, а только с его изображением, распростертым перед ним, подобно трупу на мраморной плите, который он может рассечь по своему усмотрению. Слушающий же не имеет ни одного из этих преимуществ. Он слышит высказывание только один раз и вынужден регистрировать все его составные части в той же самой временной последовательности, в какой они до него доходят. Слушающий не может определить точно, по ходу предложения, что будет сказано дальше; самое большее, он может строить предположения, основанные на его предыдущем опыте (то есть на его знании языка) и на том, что уже было сказано до этого (то есть на его частичном знании произносимого предложения). Таким образом, грамматическая система с точки зрения слушающего должна рассматриваться как стохастический процесс. Наиболее простой стохастической моделью, которую необходимо рассмотреть, является конечная марковская * Charles F. Hockett, Grammar for the Нearerb «Structure of Language and Its Mathematical Aspects» (Proceedings of Symposia in Applied Mathematics, vol. XII), 1961, pp. 220—236. 139
цепь. Такая модель, представляющая собой «порождающую грамматику», называется грамматикой с конечным числом состояний, и она порождает «язык» с конечным числом состояний. Хомский показал, что если мы примем некоторые вполне резонные эмпирические допущения в отношении английского языка, то английский язык не будет являться языком с конечным числом состояний 1. Он также утверждает, что никакая аппроксимация с конечным числом состояний к английскому языку не может сочетать известные факты этого языка в той мере, чтобы они представили какой-нибудь интерес. Я думаю, что это второе утверждение является несостоятельным. В настоящем докладе будет показано, что теоретически возможно связать факты английского языка с конечной марковской цепью так тесно, как это было бы желательно. 1. Эмпирические допущения. Для настоящего исследования мы примем некоторые обычные и два специальных допущения. Обычные допущения включают следующие три: (A1) Словарь языка конечен. (А2) Грамматика и семантика могут быть разграничены. (A3) Мы можем с полным основанием сосредоточить наше внимание на отрезках конечной длины, называемых предложениями (хотя они и необязательно должны точно отвечать любому традиционному определению «предложения»). Кроме того, обычные допущения включают еще и следующие два допущения, которые очень редко формулируются в явном виде: (A4) Мы можем различать обстоятельства, при которых слушающий изучает язык, и обстоятельства, при которых он его просто использует, причем первыми мы можем пренебречь. (А5) Слушающий всегда слышит правильно, то есть он воспринимает два слова или последовательности слов как различные, если и только если они имеют разный фонемный, состав. 1 Нестрогое доказательство дано Хомским в книге «Синтаксические структуры», 1957 [2, гл. 3] [русск. перевод см. в сб. «Новое в лингвистике», вып. II, 1962, стр. 412—527]. Строгое доказательство см. в его же книге «Три модели для описания языка», 1956 [I]. 140
Каждое из этих пяти допущений, за исключением, пожалуй, второго, можно исследовать на эмпирической основе, и каждое из них можно считать почти истинным, так что результаты, основанные на этих допущениях, могут составить некоторую разумную аппроксимацию к фактам. Нашими двумя специальными допущениями являются следующие: (А6) Для того чтобы понять, что он слышит, слушающий иногда должен произвести синтаксический анализ предложения, то есть вскрыть его грамматическую организацию почти тем же самым образом, как это делает грамматист. (А7) Любой факт, касающийся предложения и используемый слушающим при синтаксическом анализе предложения, сам по себе является грамматическим фактом. Допущение (А7) должно предотвращать возможность того, чтобы в некоторых случаях слушающий мог сначала сообразить, о чем сказано в предложении, а затем, используя эту информацию о смысле предложения, наметить его грамматическую структуру. Это чаще наблюдается при изучении языка. При простом использовании уже известного языка эти два процесса в такой последовательности, по-видимому, не всегда имеют место, так как основной целью слушающего является понять, что он слышит; если он достигает понимания, не прибегая к детальному синтаксическому анализу предложения, то надобность в завершении анализа для него отпадет. Допущение (А6) требует уточнения, прежде чем мы сможем им воспользоваться. В качестве одной крайности мы могли бы предположить, что слушающий никогда не производит синтаксического анализа предложения до тех пор, пока он не услышит предложения целиком. Такое предложение едва ли будет правильным: не говоря уже о том, что последующий синтаксический анализ пришлось бы производить очень быстро, это, кроме того, могло бы поставить слушающего в один ряд с грамматистом в том смысле, что синтаксический анализ, сделанный тем и другим, был бы основан на всем объеме информации, которую содержит предложение: слова, полученные в последнюю очередь, оказались бы существенными для синтаксического анализа первой части предложения, и наоборот. Этот вариант допущения является почти очевидно неверным. 141
Тем не менее он представляет своего рода противоречащее фактам «допущение от противного», которое часто принималось на определенных этапах анализа в любой области исследования. В сущности, оно является как раз тем допущением, на котором базировался грамматический «анализ на мраморной плите» от Дионисия Фракийского и Панини до наших дней. В качестве противоположной крайности мы могли бы считать, что слушающий производит максимальный синтаксический анализ непосредственно вслед за восприятием каждого последующего элемента предложения, скажем, после каждой новой морфемы или после каждого нового слова. Этот крайний вариант, несомненно, также является ложным. Более правдоподобно, что реальная частотность проведения слушателем синтаксического анализа варьирует от случая к случаю, так же как изменяется завершенность, точность и степень осознания слушающим этого процесса. Некоторые из предложений, какие мы слышим, представляют собой длинные «идиомы», и они вовсе не нуждаются в синтаксическом анализе. Правда, они обладают внутренней организацией, поддающейся анализу грамматиста, но слушающий, если только он узнает, что произносится такая-то и такая-то идиома, может рассматривать ее как единую лексическую единицу. В других предложениях большая часть компонентов строится говорящим заново. А слушающий, возможно, производит их синтаксический анализ, привлекая большее количество последовательных элементов. Но поскольку в большинстве реальных ситуаций мы не можем знать, как часто или с какой полнотой проводится слушающим синтаксический анализ, то имеет смысл рассматривать синтаксический анализ, проводимый слушающим, принимая допущение о том, что возможности его ограничены. Такое допущение является противоположным по отношению к общепринятому. Иначе говоря, будем считать, что слушающий после восприятия каждого последующего слова в предложении проводит синтаксический анализ наилучшим образом в рамках его возможностей. Тогда ячейка в нашей рыбацкой сети, хотя и более мелкая, чем требуется, будет по крайней мере меньше той рыбы, которую мы хотим поймать. Слушающий едва ли сможет произвести более последовательный синтаксический анализ, чем это предусматривается нашей моделью. 142
2. Поясняющие примеры. Представим себе, что мы слушаем лекцию и что первым словом, которое мы услышим, оказывается empathy «эмпатия». Допустим, что это слово не сопровождается интонацией, указывающей на «законченность высказывания». Как может проанализировать это единственное слово слушающий и грамматист? В сущности они не могут сделать этого. Поскольку, однако, первое слово не сопровождается интонацией, указывающей на законченность высказывания, то мы ожидаем, что за ним последует еще какое-либо слово и что любое последующее слово будет находиться в той или иной грамматической связи с первым словом. Таким образом, можно представить различные грамматические отношения, в которые может вступать это первое слово с любым соседним, следующим за ним словом, в виде диаграммы, показанной на рис. 1. I empathy Рис. 1. Рис. 2. Символ «Na» означает, что слово, которое мы слышим, является существительным определенного подкласса. Знаки на этих диаграммах не имеют никакого отношения к семантике, символической логике или математике и означают следующее: «>» означает, что то, что будет сказано дальше, может оказаться определением по отношению к тому, что уже было сказано, как, например, в сочетании «эмпатические методы» (empathy methods) и т. п.; «О означает, что то, что будет следовать дальше, может быть постпозиционным атрибутом, определяющим empathy «эмпатия», как, например, в сочетании empathy in psychotherapy «эмпатия в психотерапии»; «+» означает, что то, что последует затем, может находиться в сочинительной конструкции с тем, что уже было сказано: empathy or intuition «эмпатия или интуиция», или, например: empathy and all similar magic «эмпатия и все подобные средства магии»; 1 empathy 222. 1 as 1 Jb /гХ« > 143
«=» означает, что то, что может последовать дальше, явится приложением к слову «эмпатия» и прозвучит, скажем, как empathy, a method used in modern psychotherapy «эмпатия — метод, используемый в современной психотерапии». Через «е» мы хотим передать, что в слове «эмпатия» заключен весь комплекс подлежащего и следующим элементом в предложении будет сказуемое: empathy is a powerful tool «эмпатия — это мощный инструмент». Таков широкий диапазон грамматических возможностей, хотя не исключено, что по невнимательности какие- то из них были упущены. Но некоторые грамматические особенности, функционирующие в английском языке, заведомо должны быть опущены. Так, например, полностью исключено, что следующим за «эмпатией» элементом может быть дополнение в том смысле, в каком you «вы» является дополнением к for «для» в выражении for you «для вас» или к слову see «видеть» в выражении see you «видеть вас», поскольку слово «эмпатия» — это слово такого сорта, которое не может встречаться в начальной позиции ни в одной из подобных конструкций. Предположим теперь, что следующим словом, которое мы действительно слышим, является слово as «как». Последовательность двух слов empathy as... «эмпатия как...» можно изобразить на диаграмме, которая будет сильно отличаться от первой (см. рис. 2). Большинство возможностей, остававшихся открытыми после произнесения слова «эмпатия», теперь исключены. «As» является первым компонентом грамматической формы, которая будет выступать как постпозиционный атрибут к слову «эмпатия»2. Этот факт обозначен знаком «<» на грани соединения столбцов диаграммы для empathy и для as. За as «как» должно следовать то, что выступает по отношению к нему как дополнение — в этом смысл знака «->». Смысл трех других знаков не изменился; они взяты в скобки, так как уже не указывают на то, что может случиться немедленно вслед за этим. Возможность появления последующего постпозиционного атрибута или какого-нибудь приложения или чего-нибудь в этом роде остается «замороженной» до тех пор, пока не будут произнесены элементы, требуемые сло- 2 Возможность чего-то, похожего на «Эмпатия, как вы знаете...», устранена предполагаемой интонацией. 144
вом as. Все эти возможности не могут быть исключены, хотя в данный момент еще нельзя решить, имеет ли место какая-либо из них. В дальнейшем они еще активно себя проявят. ill I empathy I as I a I technique Рис. 3. Рис. 4. Рисунки 1 и 2 получены на основе того, что мы назовем открытым синтаксическим анализом (open-ended parsing), и представляют грамматические состояния, установленные соответственно первым и первыми двумя услышанными словами. Мы можем представить себе, что наш идеальный слушающий не регистрирует поступление слова empathy просто как цепочку фонем. Скорее всего сам факт восприятия этого слова порождает в нем всю информацию, показанную на рис. 1, частично определенную, а частично данную в виде некоторой «схемы ожидаемого» (pattern of expectation). Поскольку наш идеальный слушающий не делает ошибок, то каждое последующее слово соответствует одной из возможностей, предусматриваемых схемой ожидаемого, и заменяет эту схему новой схемой ожидаемого, в то же самое время расширяя ту часть, которая уже определена. Таким образом, каждое новое слово заменяет прежнее грамматическое состояние новым грамматическим состоянием. На рисунках 3—8 представлены открытые синтаксические анализы рассматриваемого предложения после восприятия его слушающими, начиная от третьего и кончая восьмым словом. Заметим, что восприятие слова technique «метод» (рис. 4) может быть описано как «восстановление» тех возможностей, которые были временно «заморожены». Так, например, ни за empathy as, ни за empathy as а не могло следовать ничего, что представляло бы собой постпозиционное определение к слову empathy, или к сочетанию слов, зависящих от слова empathy; с добавлением же слова technique такая возможность восстанавливается, и поэтому круглые скобки у знака > на рис. 4 опущены. 10-2238 145
Рис. 5. empathy as Jb technique M behavioral k<& "Ф ■e- -Ф ■β -< + > -< + > -< + > Рис. 6. Отметим также резкое различие в ситуациях после слова research и после слова designates (рис. 7 и 8). Грамматические возможности, открывающиеся после произнесения слова research, весьма многочисленны; если диаграммы точны — их одиннадцать. После слова designates of I behavioral I research 2*1 Δ I fia +<€ Рис. 7. их оказывается гораздо меньше; все, кроме одной из одиннадцати возможностей, имеющих место после произнесения слова research, исключаются, и только одна превращается в достоверность. В конечном счете устанавливается, что все до сих пор сказанное, за исключением самого designates, образует единицу (то есть подлежащее предложения) и что любые дальнейшие элементы в предложении будут относиться к этой составной единице в целом, а не к каждому из ее отдельных компонентов. Сле- 146
Рис. 8. дует также отметить, что отнюдь не то, что мы воспринимаем как последнее слово в подлежащем, указывает на его завершение; об этом сигнализирует скорее всего то первое слово, которое воспринимается нами после завершения подлежащего. 3. Остаточная неопределенность. В нашем первом контрольном предложении, как покажет рассмотрение рис. 1—8, неопределенности после первых η слов связаны только с грамматическими отношениями, которые имеют место между чем-то уже сказанным и чем-то еще не сказанным. Но вполне возможно также, что при синтаксическом анализе уже услышанных слов последние могут частично оставаться неопределенными, пока не будет добавлен еще один «решающий» элемент. Например, предположим, что говорящий начинает с (1): (1) The old men and women... «Пожилые мужчины и женщины...» Открытый синтаксический анализ этого начального фрагмента дает нам нечто похожее на то, что изображено на рис. 9. Происходящее в дальнейшем зависит отчасти от того, с чем сочетается old — с men или с men and women; однако слушающий не может сказать, какой из этих двух Рис. 9. 10* 147
случаев будет иметь место, пока он не услышит дальнейшего. Даже когда предложение завершено, может оказаться, что синтаксический анализ остается двусмысленным, например, если в конце предложения мы имеем: (2) ... were all frightened. «... были все испуганы». В каждом таком случае мы будем говорить об остаточной двусмысленности. Остаточная двусмысленность является структурной основой для одного из видов словесных шуток — каламбуров. С другой стороны, предположим, что наше предложение было бы продолжено следующим образом: (3) ...stayed at home while the young folks went off to the dance. «.. .остались дома, тогда как молодежь пошла на танцы». (4) ...stayed at home while the young men went off to the war «...остались дома, в то время как молодые мужчины ушли на войну». Кажется, что существует незначительная семантическая двусмысленность в выражении old men and women, если оно дополнено одним из этих предложений (1—3 или 1—4). Но прежде чем мы сможем сделать вывод, что существует также остаточная двусмысленность синтаксического анализа, мы должны вспомнить допущение (А7). Если слушающий снимает двусмысленность синтаксического анализа (1) посредством информации, полученной позднее в предложении, то эта информация должна быть грамматической, а не информацией семантического порядка. Рассматривая высокую степень параллелизма между (3) и (4) примерами, мы можем заключить, что folks и men или dance и war, или обе эти пары слов имеют более глубокие грамматические отличия, чем различные в лексическом отношении члены одних и тех же классов форм. Подобное же рассмотрение других предложений в дальнейшем покажет, что для слушающего словарь языка должен распадаться на значительно большее количество грамматически различных классов, чем то, с которым хотели бы иметь дело многие грамматисты3. 3 Хэррис в своей работе в 1946 г. [3] привлек приблизительно восемнадцать классов форм слов, а в работе 1957 г. [4] — только семь; 148
Я не вижу ничего плохого в таком заключении, но необходимо рассмотреть и его альтернативу. Мы могли бы сказать, что никакое продолжение не устраняет двусмысленности синтаксического анализа примера (1). Однако если никакой контекст не может устранить двусмысленности, то лучше сказать, что грамматической двусмысленности в нашей фразе не существует, ибо любая двусмысленность является чисто семантической. Нашу схему синтаксического анализа в этом случае следовало бы построить таким образом, чтобы она обеспечивала одно и то же грамматическое описание фразы old men and women независимо от контекста предложения, в котором встречается это сочетание. Сделать это довольно легко: мы просто выделяем конструкцию из четырех частей, в которой первая составляющая должна быть описательным прилагательным, вторая и четвертая — существительными во множественном числе, а третья — словом and. Эта вторая альтернатива могла бы быть приемлемой, если бы мы могли сказать, что в конце предложения нельзя зафиксировать никаких остаточных двусмысленностей синтаксического анализа. Однако я сильно сомневаюсь в том,что мы могли бы достичь такого результата, если только не решимся отнести к сфере семантики огромное число различий, которые, по нашему мнению, всегда являлись грамматическими и без которых наша концепция грамматики заметно бы оскудела. То, что нам кажется на интуитивном уровне неопределенностью значения, по-видимому, соотносится с двоякой интерпретацией грамматической организации. Мы хотим формализовать грамматические различия отчасти как шаг для объяснения семантических. Поэтому всякий раз, когда нам предстоит некоторый выбор, мы должны предпочесть более «богатую» грамматику более бедной. В этой связи наши эмпирические допущения не навязывают нам ни одного из двух типов решения, а только позволяют сделать выбор4. Мы выберем более «богатую» грамматику, не обязательно надеясь на то, что приведенные выше частные примеры должны быть среди но в обоих случаях его классы не были попарно разделяющимися, как этого требуем мы. 4 Конечно, третья возможность позволяет устранить допущение (А7). Но это бы угрожало очень ценному фундаментальному постулату о разделимости грамматики и семантики (наше допущение А2). 149
тех, которые предусматривает данная грамматика, поскольку эти примеры имели эвристический характер. Наше заключение можно, пожалуй, подкрепить вторым примет ром. Начальная последовательность (5) демонстрируе- двусмысленность синтаксического анализа, не устраняемую завершением предложения (6), разрешаемую одним способом (или по крайней мере стремящуюся к такому результату)— завершением (7),и другим способом — завершением (8). (5) A man eating fish... (6) ...has an unbalanced diet. «Человек, питающийся рыбой... ...имеет несбалансированную диету». или «Человекоядная рыба... ...имеет несбалансированную диету». (7) ...called the piranha is found in the tropical waters of Brazil. [«Человекоядная рыба...] ...называемая пиранхой, найдена в тропических водах Бразилии». (8) ... on Friday is not necessarily a catholic. [«Человек, кушающий рыбу...] ... в пятницу,—не обязательно католик». Или еще такой пример (благодарю за него Наума Xомского): (9) Flying planes... (10) ...can be dangerous. «Летящие самолеты... ... могут быть опасны»; или «Летать на самолетах... ... может быть опасным». (11) ... is dangerous. [«Летать на самолетах...] ... опасно». (12) ... are dangerous. [«Летящие самолеты...] ... опасны». 4. Двусмысленные шутки. Придя к выводу, что двусмысленность синтаксического анализа можно устранить 150
благодаря следующим за двусмысленной фразой словам, мы должны задаться вопросом, может ли иметь место обратное? Иными словами, можно ли недвусмысленную структуру, выраженную ранее в предложении, превратить в двусмысленную посредством того, что будет сказано после нее? Нечто подобное встречается в определенного рода шутках. Остряк убеждает слушающего в том, что слово или фразу нужно интерпретировать определенным образом, а затем добавляет что-нибудь такое, что делает фразу либо двусмысленной, либо вынуждает к другой, недвусмысленной интерпретации. (13) Не waxed wroth when I hit him and Roth didn't like it a bit. «Он пришел в гнев, когда я ударил его, и Роуту это не понравилось». (Гручо Маркс)*. (14) We were going to take the plane to Chicago but it was too heavy. «Мы собирались взять самолет до Чикаго, но он был слишком тяжел». (15) Woman who cooks carrots and peas in same pot very unsanitary. «Женщина, которая готовит морковь и горох в одном и том же горшке, очень негигиенична» (Конфуций). Однако в нашей модели мы имеем дело со слушающим, не допускающим ошибок. Он всегда производит весь возможный для него открытый синтаксический анализ после каждого последующего слова, не обращая внимания на относительные вероятности, связанные с различными возможностями. Недостаток такого не допускающего ошибок слушающего заключается в том, что он может не обладать чуством юмора. Он не может уловить разницу между прилагательным wroth и фамилией Roth, когда он впервые слышит эти слова, так как они являются омофонами. Поэтому его открытый синтаксический анализ начальной последовательности Не waxed wroth оказывается двусмысленным. Таким образом, влияние подобного рода шутки на слушающего зависит от того факта, что реальные слушающие * Примеры (13) и (15) имеют смысл лишь при чтении вслух соответствующих английских предложений.— Прим. ред. 151
допускают ошибки: их можно ввести в заблуждение. Их можно побудить пренебречь некоторыми из грамматических возможностей и ожидать других, и тогда они будут поражены неожиданным, хотя и вполне грамматическим оборотом. Следовательно, в пределах принятых нами предложений ту структуру, которая была вначале недвусмысленной, нельзя сделать двусмысленной с помощью того, что последует дальше. Всякий раз, когда это случается, структура, о которой идет речь, оказывается по существу двусмысленной с самого начала. 5. Конец предложения. До сих пор мы пользовались выражением «конец предложения», не определяя его; теперь пора задать вопрос, что же сигнализирует о «конце предложения» (для слушающего)? Многие специалисты по английскому языку сразу бы сказали, что о конце предложения сигнализирует появление заканчивающей предложение интонации. Несомненно, существует позитивная статистическая корреляция между так называемой интонацией законченного предложения и грамматическим концом предложения, но эта корреляция далеко не совершенна. Так, кто-нибудь мог бы сказать (мы используем для обозначения интонации символы Смита и Трейгера)5 (16) I didn't want to go there at3all1# «Я не хотел идти туда совсем». Открытый синтаксический анализ показывает, что это предложение может быть предложением полным (по крайней мере в смысле обычного определения «предложения»). Слушающий, регистрируя эту возможность, мог бы продолжить разговор, сказав что-нибудь в ответ. Если же этого не происходит, то говорящий после значительной паузы может продолжить это предложение словами: (17)3yesterday2 || , 2though to3day2 | 2don't 3mind so much1 # «вчера, хотя сегодня я не имею особых возражений». Теперь последовательность (16) может стать полным предложением, так же как и последовательность (16—17); 5 Отмечены только нужные нам интонации. Голос повышается снизу вверх, от (1) до (4); ( | ), ( || ) и (#) представляют конечные паузы в порядке возрастания их значимости. 152
однако последовательность (17), взятая отдельно, не может быть полным предложением. Поэтому, если после (16) в действительности следует (17), то оказывается, что (16) не было целым предложением, а только началом предложения. В общем, самое большее, что может дать слушающему открытый синтаксический анализ начальной последовательности — если даже слушающий принимает во внимание сопровождающие интонации, что он, конечно, делает,— это ответ на вопрос, может или не может быть данная начальная последовательность законченным предложением. (16) является примером последовательности, которая может быть законченным предложением. На рис. 3 представлена последовательность, которая не может быть предложением. Если начальная последовательность способна быть полным предложением, тогда единственным надежным сигналом того, является ли действительно она предложением, будет то, что сказано дальше. Если сказанное дальше — тем же говорящим или кем-либо другим, например прежним слушающим,— начинает новое предложение, то предшествующая последовательность должна являться предложением — только так и не иначе. Примером может служить ситуация, представленная на рис. 7 и 8: research заканчивает подлежащее, но слушатель не может этого знать, пока он не услышит designates. 6. Конструкционная грамматика. Наше понимание грамматики для слушающего и выбор той или другой абстрактной грамматической модели тесно связаны. Прежде чем продолжать исследование первой, мы должны ненадолго вернуться к последней. Диаграммы, представленные на рис. 1—9, являются в этом случае хорошей отправной точкой. Они предусматривают символическое изображение для четырех различных видов элементов: 1) слов; 2) классов форм, к которым слова относятся; 3) иерархической организации или структуры непосредственно составляющих (НС); 4) типов конструкций. Тип конструкций представляет собой множество конструкций, которые обладают некоторым общим формальным свойством, например black cat «черный кот» и ran quickly «бежал быстро» — обе построены с помощью кон- 153
струкций так называемого «атрибутивного» типа, где один из составляющих элементов более близок всей форме, чем другой (black cat можно использовать скорее как cat, но не как black; ran quickly можно использовать как ran, но не как quickly). На наших диаграммах мы стремились символически изобразить типы конструкций, а не индивидуальные конструкции, представленные в интересах удобства. Конструкцию можно определить как способ соединения форм в более крупные формы — слова в словосочетания, слова и словосочетания в более сложные сочетания. Обобщая, можно сказать, что конструкция есть отношение: это класс упорядоченных п-членных форм, где число η всегда конечное, обычно малое, часто равное 2, но иногда 1. Форма, «построенная» при помощи конструкции, необходимо является составной; это значит, что наименьший элемент (слово в нашем предположении) не принадлежит конструкции. Две формы, простые или составные, относятся к одному и тому же классу форм, если они обладают совершенно одинаковыми условиями появления, то есть если каждая из них может фигурировать в качестве i-той составляющей в той конструкции, где в качестве i-той составляющей фигурирует другая. Две составные формы относятся к одной и той же конструкции, если для всех значений (возможных для данной формы) t-тая составляющая каждой из этих двух форм относится к тому же самому классу форм, что и i-тая составляющая другой, и если сами эти две составные формы относятся к одному и тому же классу форм. Отсюда следует, что каждый член конструкции относится к одному и тому же классу форм, но обратное не всегда имеет место. Расположение (arrangement) составляющих в составной форме определяется конструкцией: две конструкции различны, если расположение их составляющих различно. Так, предложения John is here «Джон здесь» и Is John here? «Джон здесь?» оба имеют непосредственно составляющие John и is here, которые соединены двумя различными конструкциями одного и того же типа. Первая конструкция требует, чтобы составляющая John предшествовала is here, в то время как вторая — чтобы John было поставлено в определенное место внутри is here. 154
В английском языке эмпирическим фактом является то обстоятельство, что во многих случаях конструкция, к которой принадлежит основная форма, выводится без остатка из тождества составляющих (и их расположения). Так, black cat, по-видимому, встречается только в контекстах, конструкция которых принадлежит к типу «определение + существительное = конституент». Однако имеют место и двусмысленные случаи, а потому многие свойства нашей абстрактной грамматической модели зависят от того, как мы будем обращаться с этой двусмысленностью. Рассмотрим составленную из двух слов форму yellow clothes «желтые платья». Она может встречаться в контекстах предложений одного из двух следующих вариантов: (18) Washing in streng soap will yellow clothes «Стирка в крепком мыле желтит платье». (19) She likes to wear yellow clothes «Она любит носить желтые платья». С позиций конструкционной грамматики мы говорим, что yellow в обоих случаях является одним и тем же словом и что одним и тем же словом является также clothes, хотя эти слова и соединены посредством разных конструкций. Первая конструкция — это конструкция типа «глагол+дополнение», вторая конструкция типа «определение+существительное=конституент». Кроме того, следует заметить, что: а) два слова являются одним и тем же словом, если и только если состав их фонем тождествен (нет омофонов или нулевых фонем), и б) ни одно слово нельзя отнести более чем к одному классу форм. Двусмысленность, таким образом, снимается полностью или при помощи конструкций (yellow clothes), или при рассмотрении организации по непосредственно составляющим (old men and women). Другой метод состоит в введении не воспринимаемых на слух различий между словами, для того чтобы конструкции как независимые ингредиенты грамматической модели были полностью исключены. Так, например, мы считаем, что существует два слова yellow: yellowi и yellow2. Первое принадлежит некоторому подклассу класса глаголов, второе — некоторому подклассу класса прилагательных. Предложение (18) содержит первое, предложение (19) — второе. (Или, что тоже возможно, одно слово yellow при- 155
писывается двум различным классам форм, и говорится, что оно является членом одного класса форм в одном контексте, а другого — в другом.) Данный альтернативный метод старается разрешить двусмысленность при помощи понятия омофонии или рассмотрения классов форм yellow clothes и организации по непосредственно составляющим (old men and women). Этот метод исключает конструкции, сводя их все к единой «конструкции», часто называемой словосочетанием. При помощи некоторых дальнейших установок,— например при помощи требования, чтобы формы в словосочетании всегда были примыкающими и никогда— разделенными,— этот метод дает то, что было названо грамматикой непосредственно составляющих 6. Грамматика непосредственно составляющих (в обычном понимании) имеет ряд известных недостатков, осознание которых послужило главной причиной развития трансформационных грамматик. Конструкционная грамматика не имеет этих недостатков. Прежде всего конструкционная грамматика, как мы сейчас увидим, способна совершенно просто управлять такими явлениями, какие любая практически приемлемая грамматика непосредственно составляющих в лучшем случае оставляет для трансформационного анализа. Во-вторых, в конструкционной грамматике можно допустить интуитивно желательное представление о том, что некоторые слова, такие, как and или or, совсем не входят в число составляющих, а скорее являются показателями конструкции (если нет конструкции, то тогда, очевидно, этими элементами нечего и отмечать). Наконец, отнесение двусмысленности к построению по непосредственно составляющим и к конструкциям и исключение омофонии на уровне слов, как нам кажется, подтверждает, особенно в случае грамматики для слушающего, что грамматику непосредственно составляющих, даже при условии дополнения ее трансформационной грамматикой, можно использовать только более косвенным и сложным путем. Однако, для того чтобы использовать конструкционную грамматику в качестве основы для нашего построения грамматики для слушающего, необходимо, очевидно, до- 6 См. Хомский, 1956, 1957 (1, 2). Здесь мы не будем ограничивать термин «грамматика непосредственно составляющих/ условием, что составляющие должны находиться по соседству. 156
бавить еще одно допущение к допущениям, приведенным в § 1: (А8) Число конструкций в языке конечно. Эмпирически это допущение так же реально (или нереально), как и наши прежние допущения. Оно должно быть записано отдельно, так как нельзя доказать, что оно вытекает из ранее принятых допущений. Если бы нам нужно было рассмотреть только те конструкции, в которых обе (или все) составляющие могут быть отдельными словами, то тогда на основе допущения (A1) о том, что словарь конечен, мы, безусловно, получили бы лишь конечное число различных конструкций. Однако в ранее принятых допущениях нет ничего, что устраняло бы такие конструкции, в которых составляющие сами являются составными формами. Допущение (А8) гласит, что для некоторого конечного n любая составная форма, содержащая более чем n слов, строится с помощью конструкции, которая требует составных форм не более чем из п слов. Его также можно перефразировать в терминах класса форм: для некоторого конечного n любая составная форма более чем из n слов принадлежит к классу форм, которые включают формы не более чем из n слов (отсюда вытекает, что и само количество классов форм в языке является конечным). Наконец, следствие из (А8) можно формулировать с помощью понятия циклической эндоцентричности. Если, несмотря на конечное число конструкций, не существует предела для длины грамматических форм, как это, очевидно, имеет место, то должно существовать по крайней мере одно конечное множество конструкций Ci, С2, ..., Сп со следующим свойством: для 1<i<п конструкция Сi образует формы, которые можно использовать в качестве составляющих в формах, образованных посредством Сi+1; а Сп образует формы, которые могут быть использованы в качестве составляющих в формах, образованных посредством С1. (Если n=1, то одна конструкция С1 будет эндоцентричной в традиционном смысле.) 7. Сводимость трансформаций. Грамматика, которая использует как конструкции, так и некоторое конечное число трансформаций, может быть превращена в чисто конструкционную грамматику. 157
Для подтверждения этого достаточно рассмотреть пассивную трансформацию в английском языке как типичный случай всех необязательных трансформаций7. Предположим, что начальной последовательностью является (20) The corpse of the seventh victim... «Труп седьмой жертвы...» Среди возможностей нужно выбрать такую, при которой (20) будет являться целиком подлежащим. Тогда возможные сказуемые будут включать: (21) ... was lying behind some bushes. «... лежал в кустах». (22) ...was found by a troop of Boy Scouts, «...был найден отрядом бойскаутов». Открытый синтаксический анализ примера (20) может предусматривать различие между этими двумя типами возможностей следующим образом. Мы заменяем единственный символ «е» двумя. Пусть «6» будет обозначать, что то, что предшествует, может стать подлежащим предложения в активном залоге, а «е»— что то, что предшествует, вместе с тем, что следует за ним, образует пассивный трансформ предложения активного залога, в котором то, что предшествует, становится дополнением. Как только окажется, что предложение достаточно «выросло» для того, чтобы исключить одну из этих возможностей, в открытом синтаксическом анализе будет не хватать символа для обозначения этой возможности. Таким образом, мы видим, что конструкционная грамматика создает основу для трансформации путем увеличения количества конструкций. Так как имеется лишь конечное число различных необязательных трансформаций в добавление к конечному числу конструкций, это увеличение дает опять-таки конечное число конструкций. Преобразование в противоположном направлении также, очевидно, является возможным при условии, что некоторые из конструкций в чисто конструкционной грамматике могут быть определенным образом связаны. По многим соображениям смешанный тип конструкционно- трансформационной грамматики может обладать преиму- 7 Обязательные трансформации являются предметом морфофонемики и поэтому не представляют для нас никакого интереса. 158
ществами компактности и тем, что она позволяет выдвинуть на первый план такие отношения, которые в противном случае могли бы быть упущены. При построении грамматики для слушающего чисто конструкционная грамматика кажется в какой-то мере более предпочтительной. 8. Сводимость конструкций. Истолковав трансформации как конструкции, мы получаем более «однородную» абстрактную грамматику, в которой имеется меньшее разнообразие кажущихся различными элементов. В свою очередь конструкционная грамматика может быть превращена в более однородную, если мы заново определим конструкции уже не как отношения между составляющими, а как сами составляющие. Сравнение рис. 10 с рис. 8 показывает, как это можно осуществить. На рис. 8, где конструкции рассматриваются как отношения, конструкция, в которой имеются две составляющие, указана (посредством символа для типа конструкции) в точке соединения столбцов для этих составляющих. На рис. 10 те же самые символы поставлены в одной строке со словами; теперь столбцы показывают не что иное, как структуру непосредственно составляющих. empathy! <| £» techniquel ü£ behavioral Л research Na €|designatсs Vt3 Рис. 10. (Это становится еще очевиднее на рис. 11, где структура непосредственно составляющих представлена в виде «дерева», то есть наиболее популярным в настоящее время способом.) Обратное преобразование требует различения составных форм с тремя, а не с двумя непосредственно составляющими, но это, очевидно, тривиально. По-видимому, менее тривиальным является то, что наше преобразование требует различения двух видов основных элементов словаря: таких элементов, которые слушающий может слышать (слова), и таких (конструкции), которые слушающий не может слышать, а может только примыс- 159
лить. Для абстрактной грамматики это несущественно, поскольку примысливание такого рода всегда можно осуществить (эта тема уже обсуждалась). Во всяком случае, дихотомия очерчена здесь не вполне ясно. С точки зрения, принятой нами раньше, некоторые «слова» понимаются не как составляющие, а как указатели конструкций. Согласно нашей прежней точке зрения, men and women можно было бы изобразить так, как fia Jb fi£ £& Δ fia V££ "Τ" Рис. 11 это показано в верхней половине рис. 9: здесь and и знак «+» действительно дают одинаковую информацию. Согласно новой точке зрения, диаграмма выглядела бы так, как это показано на рис. 12, где опущен лишний знак «+». Логический статус слышимой формы and является таким же, как и статус неслышимых элементов, написанных в строке на рис. 10 и 11. Сходным образом обращение со словами а и of на рис. 10 и 11 основывается на представлении, что некоторые составляющие могут находиться во взаимно однозначном соответствии с конструкциями, так что каждая из них не нуждается в специальном распознавании. Итак, мы видим, что конструкционная грамматика может быть превращена в грамматику непосредственно составляющих; в соответствии с § 7 можно сделать вывод, что и трансформационную грамматику можно превратить в men I and Л* women 160
грамматику непосредственно составляющих. Однако это превращение влечет за собой расширение (хотя и конечное) основного словаря. Если мы будем считать, что основной словарь должен быть инвариантным при переходе от одной возможной абстрактной грамматики к другой, то эти редукции окажутся невозможными. В следующем параграфе будет более целесообразным говорить о конструкциях как об отношениях, но сказанное нами будет в одинаковой степени относиться и к тому виду грамматики непосредственно составляющих, который мы получаем при помощи описанного выше преобразования. 9. Формальная законность грамматических состояний. Мы представили себе слушающего, который не допускает ошибок и может произвести весь возможный для него открытый синтаксический анализ. Но в какой степени это законно? Если возможности, приписанные идеальному слушающему, решительным образом отличаются от возможностей реальных слушающих, а также грамматистов, тогда данная схема не принесет нам никакой пользы. Грамматист, пытаясь открыть и описать грамматическое состояние, установленное начальной последовательностью слов, применяет процедуру испытания различных предложений этой последовательности и определяет, каким образом каждое возможное продолжение будет грамматически согласовываться с начальной последовательностью. Если он не занимается этим систематически, он легко может пропустить ряд возможностей. Но даже если он продолжает поиски систематически, он все же может пропустить некоторые из этих возможностей, если только они все не будут вскрыты путем конечного числа операций по методу проб и ошибок. Нам кажется, что это подходящее ограничение, наложенное на возможности нашего идеального слушающего. Теперь ясно, что грамматическое состояние, установленное данной начальной последовательностью, не может быть связано с целым классом предложений, которые могли бы начинаться с начальной последовательности, так как обычно этот класс предложений является бесконечным. Мы все еще должны были бы оперировать бесконечным классом, если бы потребовалось рассматривать только одно из каждого множества грамматически тождественных предложений всего класса, поскольку два предложения 11—2238 161
необходимым образом грамматически отличны, если они имеют разную длину, а теоретического ограничения длины предложения не существует. Дальнейшую процедуру, по-видимому, можно изложить так: предложения, которые начинаются с данной начальной последовательности, распадаются на семейства. Два предложения принадлежат к одному и тому же семейству, если все конструкции (недвусмысленные и двусмысленные) в пределах начальной последовательности будут одинаковыми для обоих предложений и если одинаковыми для обоих будут все конструкции (недвусмысленные и двусмысленные) на границе между последовательностью и продолжением. Большинство, а может быть, все семейства включают бесконечное число предложений, но число семейств конечно. Если последнее верно, то грамматическое состояние в конце начальной последовательности можно вскрыть с помощью конечного числа операций по методу проб и ошибок, поскольку в рассмотрении нуждается только одно предложение каждого семейства. Но в этой форме наше допущение является, безусловно, истинным. Допустим, что мы ничего не знаем о начальной последовательности, за исключением того, что она состоит из η слов. Каждое из η слов является грамматической формой. Может оказаться, что каждая пара слов, все равно — примыкающая или нет, будет грамматической формой; таким же образом каждые три слова, каждые четыре слова и т. д., вплоть до целого предложения, будут представлять собой грамматическую форму. Поэтому действительное число грамматических форм в начальной последовательности не может превышать η которое, очевидно, конечно. Любая из этих грамматических форм входит в конструкцию только с другими грамматическими формами в пределах начальной последовательности, а также еще с грамматическими формами в предложении. Таким образом, возможно только конечное число грамматических форм с составляющими по обеим сторонам границы, проходящей между начальной последовательностью и продолжением. Далее, согласно допущению (А8), каждая из этих последних форм может вхо- 162
дить в состав лишь той или иной конструкции, так как число разных конструкций конечно. Это доказывает, что существует лишь конечное число семейств. Бесконечное число членов любого отдельного семейства объясняется отсутствием предела длины грамматических форм в возможных продолжениях. Предельным случаем нужно считать выраженную начальную «последовательность», не имеющую слов вообще. Тогда все возможные «продолжения» дают предложения одного семейства. 10. Стохастическое представление. Общее число грамматических состояний, предусматриваемых языком, не является конечным. Достаточно посмотреть на рис. 7, чтобы вскрыть причину этого. Число дополнительных постпозиционных определений, которые можно было бы добавить после Empathy as a technique of behavioral research, неограниченно отодвигая начало сказуемого,— беспредельно. Каждое из них усложнило бы диаграмму добавлением горизонтальной строки справа, и таким образом каждое дало бы новое грамматическое состояние, а не повторение уже имеющихся. Однако за каждым грамматическим состоянием может непосредственно следовать только одно из конечного числа грамматических состояний. Это вытекает из допущения A1; данная начальная последовательность может быть расширена за счет одного дополнительного слова только конечным числом способов. Указанные два факта, описывающие состояния, означают, что грамматику для слушающего можно было бы рассматривать как марковский процесс с бесконечным числом состояний. Для того чтобы построить матрицу, мы задаем бесконечное множество состояний таким образом: первым следует то, какое имеет место, когда ничего не сказано; затем все те (их конечное число), которые могут быть установлены начальной последовательностью из одного слова; затем мы задаем остальные в таком порядке: для некоторого конечного n и для всех т>п абсолютная вероятность (m+1)-го состояния (или частота его появления) не больше, чем вероятность m-го состояния. Суммы вероятностей перехода по строкам равны единице, потому что вероятность того, что за грамматическим состоянием будет следовать некоторое следующее грамматическое состояние, равна единице. Для любой строки можно будет зафиксировать некоторое конечное п, такое, 11* 163
что все элементы этой строки после п-го будут равны нулю. Элементы, не равные нулю, будут появляться только в двух местах: на узкой полоске столбцов у края матрицы слева и на узкой полоске диагоналей. Первое расположение ненулевых элементов объясняется тем, что существуют некоторые относительно общие состояния (они устанавливаются без начального слова или после единственного начального слова), которые могут появляться после большого числа различных состояний. Второе расположение имеет место потому, что любое действительно редкое состояние может иметь место только после такого состояния, которое встречается почти так же редко, как первое. Из этого стохастического представления следует, что грамматика языка может быть аппроксимирована с такой степенью точности, какая нам нужна, при помощи марковского процесса с конечным числом состояний: из бесконечной матрицы для процесса с бесконечным числом состояний мы можем вычеркнуть все ряды и столбцы после n-го для некоторого довольно большого n и сделать значительные добавления к элементам, не равным нулю, для того чтобы сохранить единичную сумму в строке. 11. Грамматика для слушающего и для говорящего. Существует большой и важный класс явлений, обнаруживающихся при использовании английского языка, который не предусматривается ни одной существующей абстрактной теорией грамматики, в том числе и грамматикой для слушающего. Любое добросовестное исследование современного разговорного английского языка показывает, что четкое и полное «грамматическое» предложение является редкостью (и это утверждение, по-видимому, будет справедливым независимо от нашего выбора определения «предложения», если, конечно, мы не изберем настолько слабое определение, что оно окажется бесполезным). Без сомнения, мы найдем несколько таких «грамматических» предложений; но мы найдем также и немалое число неправильных начал предложений, вводных конструкций, неграмматичных псевдопредложений и т. д. Грамматисты десятилетиями старательно игнорировали эти явления. Но говорящие и слушающие не игнорируют их, поскольку они несут порядочную долю коммуникативной нагрузки. Таким образом, нам следовало бы пересмотреть наши основные посылки, а может быть, совершенно перестроить 164
их и ввести новые. Однако, прежде чем предпринимать такой решительный шаг, нужно проанализировать те пути, которые позволили бы нам практически использовать результаты абстрактной грамматической теории. Можно оспаривать, что грамматика для слушающего в таком виде, как она изложена в настоящей статье, является более важной, чем грамматика для говорящего. Говорящий иногда знает, что он собирается сказать дальше; слушающий же не может знать, что последует дальше, пока он не услышит продолжения. Однако различие между терминами «слушающий» и «говорящий» является обманчивым. Некоторое время мы можем находиться в роли слушающего. Но альтернативой этому не является роль говорящего — ею будет роль как говорящего, так и слушающего, поскольку каждый слышит свою собственную речь. Проекцию в будущее, к которой, очевидно, прибегает говорящий, можно рассматривать как быстрый обзор альтернатив, допускаемых грамматически уже сказанным к данному моменту, и как выбор одной из них. Эти альтернативы являются общественной собственностью, в равной степени доступной как публике, так и самому говорящему. Таким образом, слушание не включает операций, которые не входили бы в говорение; но говорение включает все операции, входящие в слушание, плюс логические операции обозрения будущего и выбора. Логистика говорения напоминает в какой-то степени любительскую игру в шахматы, где позволяется «брать ходы обратно» и где можно не увидеть часть ситуации на шахматной доске (даже не заметить, что королю объявлен шах!). Однако обратный ход не уничтожает звуковых волн, которые были произнесены: присутствующие слышали их и сделали свои выводы. Например: (23) I felt like kiss — like shaking his hand. «Мне захотелось поцеловать — попрощаться». От прежнего направления можно отказаться ввиду изменения внешних обстоятельств: (24) I felt like— Get out of here, Joe! «Мне захотелось — Убирайся отсюда, Джо!» Изменение может быть временным, и возобновление прежнего направления может повлечь (или не повлечь) за собой краткое повторение: 165
(25) I felt like — Get out of here, Joe! — like shaking his hand. «Мне захотелось — Убирайся отсюда, Джо! — попрощаться». Говорящий может «потерять нить» и построить предложение, не поддающееся синтаксическому анализу, которое тем не менее будет понято в его контексте. (26) Empathy as a technique of behavioral research developed originally in psychiatry but later taken over by anthropologists, and some of the latter have put it to work in ways the psychiatrists never dreamed of. «Эмпатия, как метод изучения поведения, первоначально развитый в психиатрии, но позднее принятый на вооружение антропологами,— и некоторые из них нашли ему такое применение, о каком никогда и не мечтали психиатры». Читая эти строки, мы, пожалуй, сможем, наконец, прийти к пониманию различия между языком как абстрактной системой и тем, как реальные человеческие существа пользуются этой системой. Однако одно общее явление препятствует этому: редукция слов в слитной речи. Я однажды хотел сказать: «people born and raised in a culture» «люди, рожденные и воспитанные в культуре», а выпалил: «people braised in а culture» «люди, тушенные в культуре». Каждый понял и то, что я сказал, и то, что намеревался сказать. Я не знаю, как анализировать данную фразу, чтобы выявить редукцию. Но до тех пор, пока мы не найдем пути к этому, наши грамматические теории будут оставаться неадекватными. ЛИТЕРАТУРА 1. Noam Chomsky, Three Models for the Description of Language. «IRE-Trans. on Information Theory», vol. IT—2, 1956, pp. 113—124. 2. Noam Chomsky, Syntactic Structures,'s-Gravenhage, 1957 [русск. перев. см. в сб. „Новое в лингвистике", вып. II, 1962, сгр. 412—527]. 3. Zellig Harris, From Morpheme to Utterance, «Language», vol. 22, 1946, pp. 161—183. 4. Zellig Harris, Co-occurence and Transformation in Linguistic Structure, «Language», vol. 33, 1957, pp. 283—340 [русск. перев. см. в сб. „Новое в лингвистике", вып. II, 1962, стр. 528—636]. 166
Р. Уэлз МЕРА СУБЪЕКТИВНОЙ ИНФОРМАЦИИ*1 1. Цель статьи. Можно ожидать, что теория информации будет иметь три аспекта, если к ней применить деление семиотики, предложенное Чарлзом Моррисом. Синтаксическая часть будет иметь дело со знаками (символами), рассматриваемыми в отвлечении от их значений; семантическая часть должна иметь дело со знаками qua значимыми, но таким образом, что она будет отвлекаться от тех индивидуумов, или существ (не принимать их во внимание), которые используют эти знаки; и, наконец, прагматическая часть принимает во внимание как потребителей (интерпретантов), так и носителей знака и их значения и, следовательно, завершает дело семиотики. До последнего времени теория информации была синтаксической. Указывая на то, что «часто... сообщения имеют значение», Шеннон2 затем отмечает, что «эти семантические аспекты связи не имеют отношения к техническим проблемам». Основной вклад в семантическую теорию информации сделали Карнап и Бар-Хиллел3. Они применили логику Карнапа (включая и его трактовку * Rulon Wе11s, A Measure of Subjective Information, в «Structure of Language and Its Mathematical Aspects» (Proceedings of Symposia in Applied Mathematics, vol. XII), 1961, pp. 237—244. 1 Исследования по этому вопросу финансировались научно- исследовательским управлением ВМС; тема: «Решение проблем и социальное взаимодействие». 2 Claude Ε. Shannon and Warren Weaver, The Mathematical Theory of Communication, Urbana, University of Illinois Press., 1949, p. 3. 3 Rudolf Carnap and Yehoshua Bar - Hillel, An Outline of a Theory of Semantic Information, Massachusetts Institute of Technology, Research Laboratory of Electronics, Technical Report, № 247, October 27; Υ. Bar - Hillel, Semantic Information and Its Measures. Cybernetics—Circular Causal and Feedback Mechanisms in 167
вероятности) к теории информации. Прагматическая часть мало разрабатывалась; в теории информации, в том виде как она развивалась до сих пор, «мы не проводим различия между полезной и бесполезной информацией... Идея «ценности» говорит о возможном ее использовании живым наблюдателем. Это выходит за рамки нашей теории»4. К этому вопросу имеют отношения работы некоторых экономистов5. В настоящей статье намечаются в общих чертах два положения: первое в области прагматики, второе в области семантики. В прагматической части рассматривается «субъективная информация», благодаря которой одно предложение, даже логически истинное, может быть субъективно более информативным (важным, ценным, эвристичным), чем другое; в семантической части рассматривается функция предложений, называемая «информативностью». Ввиду того что возможности синтактики в некотором смысле более ограниченны и бедны по сравнению с возможностями семантики, а возможности семантики в свою очередь более бедны по сравнению с возможностями прагматики, то хотелось бы знать, насколько третья может быть представляема второй, а вторая — первой. В настоящей статье обсуждается как раз этот вопрос. Информативность служит семантической моделью или репрезентацией субъективной информации. Дело в том, что каноническая форма прагматического утверждения о субъективной информации имеет вид: «А считает, что предложение S1 более информативно, чем предложение S2»; и если просто опустить фразу: «Л считает, что», то можно получить семантическое утверждение. Полученное семантическое утверждение будет, если оно истинно, истинным a priori. 2. Подход Карнапа — Бар-Хиллела. Основная идея теории информации заключается в том, что объем информации в сообщении следует рассматривать как функцию Biological and Social Systems. Transactions of the Tenth Conference [April, 22, 23, и 24, 1953], New York, The Josiah Macy, Jr. Foundation, 1955, pp. 33—48. 4 Leon Brillouin, Science and Information Theory, New York, Academic Press., 1956, pp. 9—10. 5 J acob Marschak, Towards an Economic Theory of Information and Organization, «Decision processes», ed. by R. M. Thrall, С. H. Coombs, and R. L. Davis, New York, Wiley, 1954, pp. 187—220. 168
числа возможных альтернативных сообщений. Основная идея Карнапа и Бар-Хиллела заключается в необходимости работы с семантическим аналогом информации как с функцией числа возможных условий, при которых сообщение было бы истинным. Для того чтобы реализовать эту основную идею, они истолковывают «возможные условия» посредством предложенного Виттгенштейном термина «описание», которое Карнап положил в основу своих последних работ по логике. Число элементов множества описаний зависит от того языка, на каком даны эти описания. Некоторые теоретические трудности, возникающие для всех языков, за исключением очень простых, нас не интересуют (Кемени6 указал, как разрешить некоторые из них), поскольку оказывается, что для нашей цели подход на основе описания является в корне неверным. Подход, основанный на описании (то есть подход, который является общим для всего многоообразия моделей описания), формализует ряд философских идей «Логико- философского трактата» Виттгенштейна: 1) Всякая необходимая истина является логической, а всякая случайная истина — эмпирической. 2) Логические истины можно рассматривать как истины, которые сохраняют свое значение во всех возможных положениях вещей (или во всех возможных мирах). 3) «Все предложения логики говорят одно и то же. А именно ничего» (5.43; ср. 5.142 и 6.11). Все три идеи включены в теоремы (Т4—2а, Тб—lb, Т6—4b, Т7—8b, ср. R5—2*) Карнапа и Бар-Хиллела, которые придают числовое значение нуля всем L-истинным предложениям. 3. Необходимость альтернативы для подхода, основанного на описании состояния. Карнап7 перечисляет три «требования для экспликата», первое из которых является требованием «сходства с экспликандой». Мейтс8 в сущности 6 John G. Kemeny, A Logical Measure Function, «Journal of Symbolic Logic», vol. 18, 1953, pp. 289—308. 7 Rudolf Carnap, Logical Foundations of Probability, Chicago, 1950, p. 5. 8 Benson Mates, Synonymity. University of California Publications in Philosophy, vol. 25, 1950, pp. 201—226, p. 209. Ho cp. Carnap (см. сноску 7), pp. 430—435, § 80: «Requirements of Adequacy». 169
уточняет это требование, предлагая положить в основу условия адекватности, которым должен удовлетворять успешный экспликат. Его предложение может быть использовано дальше, поскольку оно подсказывает нам, как отличать различимые экспликанды в тех случаях, где требуется специальная помощь. Например, объяснения вероятности, данные Карнапом, основаны на гипотезе, что существует две различимые экспликанды под одним названием «вероятность», которые следует эксплицировать. Однако у Карнапа нет развитой методологии для подкрепления этой гипотезы, если не считать обычных методов проверки гипотез по их следствиям. В данной статье я выдвигаю ту гипотезу, что существует по крайней мере две различимые экспликанды под одним названием «информация», но кроме обычных методов проверки гипотез я использую еще и метод «условий адекватности» и предлагаю следующее. Смысл слов «объем информации» (а отсюда и слова «информация») таков, что не все логически истинные предложения имеют один и тот же объем информации. Это условие адекватности служит критерием различения по крайней мере двух смыслов: смысла, который требует этого условия, и смысла, который его не требует. Карнап и Бар-Хиллел объяснили смысл «информации», который его не требует; я предлагаю назвать это «фактической (или «случайной», или «a posteriori») информацией». Задача настоящей статьи состоит в том, чтобы подготовиться к объяснению смысла, который требует этого условия. Если понимать «информацию» в этом смысле, то мы будем наблюдать в сфере a priori различные случаи, аналогичные существующим в сфере эмпирического факта. Например, нам известно, что эмпирические предложения могут отличаться по содержанию информации (information- content, 1С), степени информации (information-degree, ID) и объему информации (information-amount, ΙΑ); оказывается, что те же особенности присущи и предложениям, которые являются истинными или ложными а priori. Вероятное следствие предложения S может нести информацию, превышающую информацию S; то же самое может иметь место и с необходимым следствием. Как (Карнап и Бар-Хиллел, стр. 30—31, §9) конъюнкция двух предложений о фактах, так и конъюнкция двух предложе170
ний a priori может дать значительно больше информации,, чем каждое из них, взятое в отдельности. При изложении теории информации принято связывать информацию с неожиданностью: чем предложение более информативно, тем оно более неожиданно, если оно передается в синтаксических вариантах или если оно является истинным (в семантических вариантах). Например, если S является истинным L, то IA (5) = 0, то есть данное предложение полностью согласуется с учением Виттгенштейна о том, что в логике не существует неожиданностей, а также ошибок (5.473) или экспериментов (6.2331). Виттгенштейн мог иметь в виду только то, что имел в виду Аристотель («Метафизика», А.З: 983а, строки 12—21) в своем высказывании, гласящем, что хотя «у всех и вызывает удивление, что некоторые вещи нельзя измерить самою малой мерой», все же «ничему бы так не удивился человек, сведущий в геометрии, как тому, что соизмеримой оказалась диагональ». Но существует и другой вид неожиданности, который никогда не уменьшается или не исчезает, или если не неожиданности, то информативности, важности, значимости или чего-нибудь в этом роде. Например, все соглашаются, что теорема Пифагора является более информативным предложением, чем «7+5=12», хотя оба они L- истинны. То же самое относится ко всем системам предложений. Грамматику языка можно рассматривать как систему предложений; для того чтобы грамматика считалась «хорошей» или «удовлетворительной», она, в соответствии со взглядами многих грамматистов, должна быть не только эмпирически истинной, но также «эвристичной» и «нетривиальной». Что касается меня, то я бы сказал, что формальные изложения Карнапа и Бар-Хиллела, хотя их легко можно было бы выразить на формализованном метаязыке как L-истины, являются в значительной степени информативными. То обстоятельство, что априорные истины могут различаться по информативности, вытекает также из другого факта. Этот факт состоит в том, что мы судим об открытиях и о первооткрывателях, подходя к некоторым из них как к более важным, а к другим как к второстепенным. Главным открытием в сфере a priori будет открытие важной истины (например, теоремы Гёделя), то есть открытие того, что такое-то и такое-то важное предложение является истинным. Гением же, то есть великим первооткрывателем, 171
будет тот, кто сделал это очень важное открытие, то есть нашел очень важные (высокоинформативные) истинные предложения. Существует и третий аргумент в пользу признания переменной информативности в сфере a priori; это то, что фигурирует в «рациональности» (rationale) исследования. Математическая трактовка Пирса, рассматривающего эту «рациональность»9, принимает во внимание две переменные: стоимость и полезность. При более детальном рассмотрении, которое сможет адекватно объяснить «рациональность» как в сфере a priori, так и в сфере a posteriori, полезность должна быть расчленена на ее компоненты, из которых одной будет вероятность успеха, а другой — информативность различных возможных результатов. 4. Мера субъективной информации. Принципы, изложенные в предыдущем параграфе, представляют собой эмпирические утверждения об определенных суждениях, выраженных или подразумеваемых человеком. Эти суждения можно было бы собрать и обработать при помощи уже известных методов10. Их структура была бы последовательной (сравнительной), подобно структуре сравнительных суждений о вероятности a posteriori 11; на эту последовательную структуру можно было бы наложить метрику, произвольно во всяком случае и возможно на основе некоторого подходяще выбранного отношения соединения j (Гемпель, стр. 63—65), например, в таком виде: m(xjy)=m(x)+m(y). (Очевидный кандидат, на первый взгляд,— логическая конъюнкция — не может служить этой цели; мы хотим доказать, что объем информации не является аддитивным относительно логической конъюнкции. Аддитивность определяется у Гемпеля, стр. 75). Принципиальный интерес в эмпирическом исследовании вышеприведенного типа будет представлять степень согласия различных экспертов, чьи суждения собраны. 9 Charles S. Peirce, Note on the Theory of the Economy of Research (первоначально опубликованы в 1879 г. Перепечатано в его Собраниях сочинений, т. 7, под редакцией Артура В. Беркса, Кембридж, издание Гарвардского университета, 1958, § 139—157). 10 Cari G. Hempel, Fundamentals of Concept Formation in Empirical Science, Chicago, 1952, в разных местах, особенно стр. -54—78. 11 Carnap (см.сн.7),стр. VIII—IX, 22— 23, 219— 226,428—482. 172
Одна из причин для наложения метрики, при условии, что она будет наложена на последовательные суждения каждого эксперта до сравнивания с суждениями других экспертов, состоит в том, что метрика делает сравнение суждений возможным и легким. Метод, подобный «коэффициенту корреляции ранга» Кендалля 12, который метрически сравнивает просто последовательные сравнения, возможен, но не так прост. Не известно, как повлиял бы выбор самих экспертов на степень согласия. Было бы интересно изучить суждения группы экспертов, которые, будучи однажды избранными, оценили бы самих себя и друг друга по своим знаниям и значению таким образом, чтобы при конечном синтезе суждений можно было бы приписать различную весомость суждениям различных экспертов. Многие согласились бы с Гемпелем (стр. 62) в том, что «использование „человеческих инструментов" сравнения не свободно от недостатков... Согласие сонаблюдателей часто является далеко не полным..; вместе с тем даже один и тот же наблюдатель может дать противоречивые ответы. К тому же, по-видимому, большинство понятий, определяемых при помощи соотнесения с показаниями „человеческих инструментов", имеет весьма ограниченное теоретическое значение, поскольку они не могут быть основой для точных и исчерпывающих обобщений». Однако по поводу этого заключения можно сделать несколько замечаний. Во-первых, может случиться, что согласие между наблюдателями и согласие сонаблюдателей будет заметно улучшено некоторыми мерами предосторожности, (а) Нет оснований считать, что суждения должны выноситься поспешно и в уединении, как это часто практикуется в психологических экспериментах; нет оснований считать, что эксперты не должны совещаться друг с другом и обдумывать свои суждения на протяжении многих месяцев или лет, прежде чем сообщить о них. (б) В частности, каждый эксперт мог бы использовать некоторые методы проверки непротиворечивости своих суждений, убеждаясь, например13, что они никогда не нарушают транзитивности отношения «является более информативным, чем». 12 Maurice G. Kendall, Rank Correlation Methods, London, 1948. , 13 Kenneth J. Arrow, Mathematical Models in the Social Sciences, The Policy Sciences, ed. by D. Lerner and H. D. Lasswell, Stanford, Stanford University Press, 1951, pp. 129—154; см. стр. 135—136 и сн. 20. 173
Во-вторых, если даже не все эксперты придерживаются одного и того же мнения, то все-таки иногда они могут составить относительно небольшое число групп, представляющих различные точки зрения, таким образом, что члены каждой группы в основном будут согласны друг с другом. И тогда может случиться, что две группы расходятся в мнениях не по основным вопросам, а только в деталях. В-третьих, все собранные и синтезированные суждения можно использовать не один раз. Можно считать, что они имеют эмпирическое значение. Но их также можно считать и ценными в эвристическом отношении данными для теоретика a priori, который поставил бы себе целью построение чистой теории, допускающей эмпирическое применение (интерпретацию), удовлетворительно согласующееся с этими данными. Исследования, которые были здесь намечены, связаны с «субъективной информацией», то есть с информацией в таком виде, как она представляется различным субъектам. Их суждения могут быть или не быть субъективными в общераспространенном смысле, а именно неустойчивыми, непостоянными и не согласующимися друг с другом. Следовательно, можно было бы без ущерба для дела назвать наш предмет «прагматической информацией». Однако среди философов и ученых широко распространено мнение, что, поскольку суждение не является просто субъективным в этом уничижительном смысле, его можно заменить суждением, которое также не будет являться прагматическим. Если привлечь пример из теории вероятности — области, тесно связанной с нашей,— то критика субъективной теории вероятности побуждает нас к тому, чтобы вероятность определялась или устанавливалась не на основании той степени уверенности, которую имеет человек, а на основании той, которую он должен иметь14. Принудительная сила иногда включается в понятие «идеальный верующий», то есть верующий, убеждения которого имеют как раз ту силу, которую они должны иметь. Но в действительности вероятность является семантической; ее прагматическая видимость (через ее отношение к наблюдателю) является иллюзорной, поскольку этот фактор может быть без ущерба для дела опущен. Теперь я перехожу к описанию чисто семантического и априорного рассмотрения информативности. 14 Carnap (см. сн. 7), pp. 46, 50. 174
5. Чисто семантическая модель: информативность. Здесь будет изложено несколько утверждений, которые, как мне кажется, целесообразно включить в строгую систему. IA(S) является (метрическим) объемом информативности (informativeness-amount) предложения S; IC(S) является (качественным) содержанием информативности (informativeness-content) предложения S. Переменные S (с индексами или без них) пробегают по всем необходимо- -истинным предложениям. Мы ограничиваемся только истинными предложениями, потому что надеемся избежать проблемы смешения объемов информативности IA ложных предложений (и, в частности, необходимо ложных предложений) с объемами информативности IA истинных предложений (например, при приписывании первым отрицательных значений). Ограничиться только необходимо- -истинными предложениями мы вынуждены для того, чтобы избежать проблемы смешения объемов информативности IA необходимо-истинных предложений с объемами информативности IA случайно-истинных предложений. Может случиться, конечно,что кто-то захочет произвести одно или оба эти смешения или, наоборот, оставить два или четыре «промежутка», не связанных друг с другом. Следующие утверждения нельзя воспринимать как застывшие аксиомы. Они слишком не полны и слишком избыточны, чтобы быть удовлетворительными с этой точки зрения. Они скорее являются примерами того, что должно было бы быть включено в число теорем адекватно формализованной и аксиоматизированной экспликации информативности. 1. 0<1А(5)<оо. 2. (3Sb S2) ΙΑ^χίΑ^). 3. (35ь S2) IAiS^S^^AiSO + IAiS^-IAiSiV^^. 4. (3Sb S2) (Si^S2)&lA(S2)>lA(Si). 5. (Slf S2) IAiSi&S^^IAiSO + IAiSa)—IA(SiVS2). 6. (35i, S2) IA(S1V-S1)<IA(S2V-S2). 7. (3£i, E2) ЩЕ1=Е1)<:ЩЕ2=Е2). 8. (3Sb S2) IC(Si)C!IC(S2) & IA(Si)>IA(S2). 9. (3Si, S2) St<*S28clA(Si)<lA(S2). 10. (3Si, S2) lC(St) =£lC(S2)&lA(Si)=lA(S2). 11. (3Si, St, SJlCiS^lCiSà&lCiSi^lCiSsWCiS^IC (Ss)&lA(Si):>\A(S2) + \A(Sz). 175
Комментарии. (1) ограничивает диапазон значений объема информативности IA положительными реальными (конечными) числами. (2) допускает необходимые истины для различения объема информативности. (3) отрицает аддитивность по отношению к логической конъюнкции. (4) допускает, что следствие предложения S может быть более информативно, чем само предложение S. (5) фиксирует, что логическая конъюнкция никогда не может уменьшить объем информации. (6) и (7) будут обсуждаться в следующем параграфе. (8) допускает, что интенсионально более слабое предложение может быть более информативным, чем более сильное. (9) допускает, что логические эквиваленты могут различаться по объему информативности. (10) допускает, что качественно различные предложения могут иметь в количественном отношении одну и ту же информативность. (11) является примером утверждения, которое расширяет пункт (2), допуская довольно широкие различия в объеме информативности. Пункты (6) и (7) требуют специального объяснения. Они, будучи довольно простыми, предоставляют весьма полезные данные изучающему эвристику. Мы часто даем высокую оценку кому-либо не потому, что он доказал новую теорему, а потому, что он ввел новое понятие или поставил новый вопрос. Это как раз и осуществляется в тех условиях, когда имеют место (6) и (7). Мы можем установить между вопросами и дизъюнкциями одно-однозначное соответствие таким образом, что, например, вопрос «Сходятся ли все бесконечные ряды»? будет соответствовать дизъюнкции «Либо все бесконечные ряды сходятся, либо не все бесконечные ряды сходятся». В таком случае можно признать значительным вклад тех математиков, которые впервые серьезно поставили этот вопрос, приписывая более высокую ценность объему информативности IA этой дизъюнкции, чем объему информативности, скажем, дизъюнкции «Два — четное число или два — нечетное число». Данный метод легко применим к вопросам, на которые можно дать ответ «да» или «нет». Другие же вопросы, такие, как: «При каких обстоятельствах сходится бесконечный ряд?» или «Сколько имеется простых чисел?», требуют сведения с помощью того или иного метода к вопросам, предполагающим ответы «да» или «нет», прежде чем будет установлено разумным способом соответствие с дизъюнктивной тавтологией. Аналогичным образом формулой (7) можно 176
воспользоваться для проведения различия между понятиями неодинаковой ценности на основе различения объемов информативности тех тождеств, в которых они соответственно встречаются. Ни одно из вышеприведенных утверждений, образцы которых могла бы использовать семантическая теория информативности, не приписывает определенных значений объемам информативности. Следовательно, эту теорию можно интерпретировать в эмпирическом и прагматическом отношении таким образом, что она не будет противоречить каким бы то ни было эмпирическим значениям, которые сможет обнаружить эмпирическое исследование, изложенное в § 4. Отрицание аддитивности (пункт (3)) заслуживает дальнейшего разъяснения15. Оно предлагается в качестве частичного объяснения того, что Вильям Уэйвелл назвал коллигацйей [соединением]16. Концепция Уэйвелла в настоящее время стала широко известна благодаря частым ссылкам на нее Чарлза Пирса17. Коллигация связывает идеи или мысли и устанавливает между ними взаимозависимости; и как идеи могут быть представлены предложениями, так и их соединение может быть представлено логической операцией конъюнкции. Тогда коллигация, или процесс, о котором говорят попросту: «сообразить что к чему», может стать очень важным научным достижением, а формулировка (3) представляет собой способ выражения этого обстоятельства, приписывая более высокое значение объема информативности IA(S1 & S2) конъюнкции S1 и S2, 16 В правостороннем выражении (3) и (5) пунктов вычтен IA (S1 & S2) для того, чтобы не подсчитывать дважды то, что общо Slf взятому в отдельности, и 52, взятому в отдельности. Ср. Карнап и Бар-Хиллел, Т6—1 j; Т6—4j; Т7—8h. 16 Novum Organum Renovatum, 1858, II, iv. См. ценное исследование С. J. Ducasse, Whewell's Philosophy of Scientific Discovery, «Philosophical Review», vol. 60, 1951, pp. 56—69 и 213—234. На стр. 213 цитируется отрывок, в котором говорится о двух способах: экспликации, «при помощи которой понятие становится более ясным», и коллигации, «при помощи которой понятия более тесно связывают вместе факты». Заметьте сходство в употреблении термина «экспликация» у Уэйвелла и Карнапа. Слова Уэйвелла относятся к знанию a posteriori; я не знаю, различал ли он те же самые два способа по отношению к знанию a priori. 17 Основные места в собрании сочинений: том 2, 1932, §§ 253, 442, 451, 469, прим. 2 и т. 5, 1934, §§ 579, 581. 12-2238 177
чем исправленной сумме двух объемов инфэрмативностей IA(Sj) и IA(S2), взятых отдельно. 6. Две возможные связи. Почему модель, основанная на описании положения, не может адекватно объяснить информативность? Одна из основных причин заключается в том, что если из SiL-следует S2, то модель требует, чтобы Si было по крайней мере таким же информативным, как и S2. С другой стороны, как указывают Карнап и Бар- Хиллел (стр. 12, обсуждение R5—1*), это требование в свою очередь не требует модели описания положения. Из этого требования, независимо от того, рассматривается ли оно как аксиома или как производная теорема, непосредственно вытекают теоремы: (а) L-эквивалентные предложения одинаково информативны и (b) L-истинные предложения все минимально информативны (то есть имеют информативность, равную нулю, если мы условимся, что минимум выражается нулем). Ясно, что данное требование не вступает в противоречие с интенсиональностью. Интенсиональность имеет различные аспекты, и некоторые из них допускают различия в степенях. Однако некоторые логики поставили своей целью создать настолько сильно интенсиональные системы, что они не рассматривают все L-эквивалентные предикаты и все L-эквивалентные предложения как сходные, что присуще логике Карнапа вообще и приведенному выше требованию в частности. Последняя и очень обнадеживающая система этого вида дана Андерсоном и Белнапом18. Ее сильно интенсиональное отношение влечения выражается в том, что не каждое предложение влечет за собой логическую истину, так что не может быть доказано, что все логические истины являются в одинаковой степени и минимально информативными. 18 (1) A. R. Anderson, N. D. Belnap, A Modification of Ackermann's 'Rigorous Implication', «Journal of Symbolic Logic», vol. 23, 1958, pp. 457—458; (2) A. R. Anderson, Completeness Theorems for the Systems Ε of Entailment and EQ of Entailment with Quantification, «Z. Math. Logik Grundlagen Math.», vol. 6, №3, 1960; (3) N. D. Belnap, Jr., The Formalization of Entailment, специальный доклад № 7, Научно-исследовательское управление военно-морских сил, 1960. 178
Второй подход к строгой интенсиональности предложен Черчем19. Содержание информативности 1С вышеприведенных утверждений (8), (10) и (11) можно было бы отождествить со «смыслом» Фреге. Трудность заключается в том, что из предложенных до настоящего времени различных объяснений наиболее привлекательное объяснение («альтернатива (0)» Черча) является несостоятельным, поскольку противоречит теореме Кантора20. Но любое изменение, которое позволило бы избежать как этого, так и других противоречий, заслуживало бы рассмотрения в качестве экспликации содержания информативности. 19 Alonzo Church, A Formulation of the Logic of Sense and Denotation, из книги «Structure, Method, and Meaning», ed. by P. Henle, H. M. Kallen, and S. K. Langer, New York, Liberal Arts Press., 1951, pp. 3—24. 20 John Myhill, Problems Arising in the Formalization of intensional Logic, «Logique et Analyse», Nouvelle série, vol. 1, 1958, pp. 74-83 (p. 82).
II ЛИНГВИСТИЧЕСКИЕ НАПРАВЛЕНИЯ
СОВРЕМЕННЫЕ НАПРАВЛЕНИЯ В ЗАРУБЕЖНОМ ЯЗЫКОЗНАНИИ 1. Быть может, существуют науки, где каждый последующий этап (как более «высший» в смысле научного развития) отрицает предшествующий. Языкознание не принадлежит к их числу. В нем допустимо сосуществование разновременно возникших количественно не ограниченных и иногда несовместимых в методическом отношении точек зрения. В силу этого обстоятельства современное состояние лингвистических исследований как по своей проблематике, так и по используемым методам представляет довольно пеструю и противоречивую картину. Об этом, в частности, свидетельствует сборник «Направления в европейской и американской лингвистике (1930—1960)», из которого взяты статьи, включенные в настоящий раздел. Сборник не дает исчерпывающей картины современных лингвистических направлений. В нем отсутствует изложение принципов многих и при этом в научном отношении важных школ и направлений, теоретический удельный вес которых довольно велик. Это признают и сами составители и редакторы сборника (Кр. Мормен, Альф Соммерфельт и Дж. Уотмоу), которые обещают дополнительно выпустить вторую часть сборника. Из предназначенных для этой второй части работ в настоящий раздел включена статья Р. Якобсона1. Кроме того, необходимо отметить, что статьи сборника весьма неоднородны и неравноценны в научно-теоретическом отношении. В кратком предисловии к сборнику 1 Статья Р. Якобсона напечатана также в приложении к книге Josef Vасhеk, A Prague School Reader in Linguistics, Bloomin- gton, 1964. 183
составители и редакторы пишут:«Нельзя понять настоящую ситуацию в нашей науке без знания того, как она развивалась. Именно поэтому наш сборник содержит статьи, представляющие главным образом исторический интерес». К сожалению, это не всегда так. Историчность ряда работ (например, посвященных общему языкознанию в США или языкознанию в Италии) сводится (так же как и все содержание статей) к простому перечислению опубликованных за указанный период работ, разгруппированных по предметно-тематическому принципу. Нельзя не признать их безусловной полезности, но место им не в сборнике, ставящем своей задачей теоретическое осмысление лингвистических направлений, а в библиографическом справочнике. Работа же Р. Годеля о Женевской школе носит чересчур эскизный характер. По этим причинам сборник «Направления в европейской и американской лингвистике» использован не полностью. Из него взяты лишь теоретически наиболее значительные и интересные работы. Они, естественно, разбиваются на три подраздела. К первому, трактующему проблемы, которые выходят за пределы географических или национальных границ, относится статья Уоррена Плата о математической лингвистике. Ко второму — статьи, характеризующие преимущественно американское языкознание (школа Блумфилда и антропологическая лингвистика). И, наконец, к третьему — работы собственно «европейского» происхождения. Рассмотрим их последовательно в данном порядке. 2. Вторжение математики в лингвистику проходило настолько бурно, что некоторые лингвисты начали робеть и выказывать признаки откровенного уныния — уж очень уверенно (и даже самоуверенно) держались математики и уж очень было непонятно то, что они говорили, уверяя, что сами лингвисты не способны на подлинно научные утверждения. Другие, иногда почтенные языковеды, в которых не угас дух предприимчивости, решили пойти в ногу со временем и довольно невразумительно заговорили на мало им самим понятном наречии, смиренно при этом признавая свою научную непродвинутость по сравнению с математиками. 184
В этих условиях и проходило становление математической лингвистики, объявившей себя особой, пограничной дисциплиной и потребовавшей себе статуса суверенности. Но затем явилась необходимость трезвого пересмотра того, что было наговорено сгоряча. Такого рода пересмотру был посвящен доклад X. Спанг-Ханссена (по основной своей специальности представителя точной науки) на IX Международном конгрессе лингвистов. Автор доклада «Математическая лингвистика — ярлык или факт?» в следующих словах суммирует свои выводы: «С моей точки зрения, „математическая лингвистика" в действительности не образует особого направления. Соответственно я рассматриваю это обозначение как простой ярлык. В качестве такового он может быть безобидным, но в действительности его употребление затрудняет лингвистические дискуссии, с одной стороны, смазыванием существенных различий, а с другой стороны, созданием (совершенно ненужного) раскола на «нематематическую» лингвистику и мнимую «математическую» лингвистику, часто выдаваемую за новый, особый и более точный подход к лингвистическим явлениям»2. О математической лингвистике как отдельной дисциплине ныне уже никто и не говорит. Более того, сам термин «математическая лингвистика» изжил себя. Если все же он иногда употребляется, то под ним разумеется совокупность математических методов, которые наряду с другими методами применяются в лингвистике и которые также не противопоказаны этой последней, как и другим наукам. Именно в этом смысле понимает «математическую лингвистику» и Уоррен Плат — автор статьи под этим названием, включенной в настоящий раздел. Однако, когда делаются подобные оговорки относительно действительного смысла термина «математическая лингвистика», этим еще не все решается. Существует точка зрения, которой, к сожалению, все еще придерживаются слишком пылкие поклонники новейших методов, состоящая в том, что (грубо говоря) достаточно переформулировать лингвистические понятия на язык математики, чтобы получить безошибочное определение того или иного языкового явления. Это слишком простой путь решения трудностей, с которыми приходится сталкиваться каждой науке. 2 H.Spang-Hanssen, Mathematical Linguistics—a Trend in Name or in Fact? Preprints of Papers for the Ninth International Congress of Linguists, Cambridge, Mass., 1962, p. 133. 185
Против чересчур свободного употребления математических операций для лингвистического описания предупреждает и Уоррен Плат. Он совершенно справедливо указывает на то, что необходимо доказать полезность применения математического аппарата в лингвистике и наглядно показать, что полученные в результате системы не только не уступают традиционным, но и превосходят их —иначе теряется всякий смысл обращения к ним. Уоррен Плат дает в своей статье объективный и достаточно полный обзор использования математических методов для решения различных лингвистических задач. Они касаются проблем разного охвата, но преимущественно связаны с ограниченными участками лингвистической работы. В одних случаях математические методы представляются перспективными, в других — нет, и Уоррен Плат не считает нужным скрывать возникающие при этом трудности. Однако в отношении всех их можно сделать три общих вывода: 1) внедрение математических методов находится на начальной стадии, и оценка их полезности для лингвистики в большей мере покоится на априорном уважении к научным заслугам математики, чем на реальных результатах использования их при изучении языка; 2) полученные при посредстве математических методов результаты пока еще не представляются для значительной части лингвистов убедительными; и 3) математический подход часто не учитывает лингвистической специфики, сопряжен с известной односторонностью и поэтому не дает безусловных выводов (что было бы естественно ожидать от математики). Дабы проиллюстрировать эти общие замечания на конкретном примере, обратимся к недавно опубликованным исследованиям, относящимся к такой в общем ясной уже теперь в своих границах области, как стилостатистика, которая, кстати говоря, располагает большим количеством работ. В 1962 г. были изданы две работы Альвара Эллегорда, в которых с помощью статистических методов определяется авторство политических писем, опубликованных в 1769— 1772 гг. и подписанных псевдонимом «Юниус» (так называемые «Письма Юниуса»)3. Надо заметить, что в свое время 3 Alvar Ellegard, Who was Junius?, Stocholm, 1962; его ж e, A Statistical Method for Determining Authorship, Göteborg, 1962. 186
Эллегорд выступал против статистического метода определения родства языков, предложенного Крёбером и Кретьеном4. Эллегорд при этом указывал не только на допущенные ошибки (Кретьен и сам их обнаружил), но и на принципиальную неправомерность использования статистического метода при определении родства языков. Теперь Дуглас Кретьен подвергал критическому рассмотрению указанные работы А. Эллегорда 5. Пожалуй, наиболее интересным в его рецензии является сравнение работ Эллегорда с другими работами аналогичного характера: К. Бринегара относительно авторства писем, подписанных именем Квинтия Куртиуса Снодграсса и приписываемых Марку Твену 6, и Ф. Мостеллера и Д. Уоллеса о произведении «Федералист», автором которого считают либо Александра Гамильтона, либо Джеймса Мэдиссона7. «Бринегар, Мостеллер и Уоллес, а также Эллегорд,— пишет Д. Кретьен,— представляют нам три современных исследования, которые как будто имеют одни и те же цели: 1. Они идентифицируют авторство; 2. Они используют лексику в качестве основы этой идентификации; и 3. Они обрабатывают лексику статистически. Но фактически их исследования согласуются только в одном — в идентификации авторства. В остальном они пользуется различными видами лексических единиц и различными статистическими методами8. Из этого сравнения явствует, что результаты во многом определяются субъективным в своей основе отбором лингвистического материала и даже набором статистических приемов. Естественно, они не могут дать безусловных и однозначных выводов. Оправдан и тот ответ, который в качестве вывода дает Д. Кретьен на поставленный им риторический вопрос: «Какой интерес для лингвиста представляют такие исследования? Большинство исследований, и, может быть, 4 A. L. Kroeber and С. D. Chretien, Quantitative Classification of Indoeuropean Languages, «Language», vol. 13, 1937,. pp. 83—103. 5 См. рецензию в журнале «Language», vol. 40, 1964, pp. 85—90. 6 С. S. Brinegar, Mark Twain and the Quintus Curtius Snodgrass Letters..., «Journal of the American Statistical Association», vol. 58, 1963, pp. 850—896. 7 F. Mostelle r, and D. L. Wallace, Inference in an Authorship Problem, «Journal of the American Statistical Association», vol. 58, 1963, pp. 275—309. 8 Указ. работа, стр^ 89—90. 187
значительное, очень малый или никакой , хотя сам по себе лингвистический анализ стиля привлекал и увлекал некоторых лингвистов, и это увлечение вполне оправдано»9. 3. Американскую лингвистику представляют две статьи — Ч. Фриза («„Школа" Блумфилда») и Г. Хойера («Антропологическая лингвистика»). Они воплощают в себе два направления, разделившие когда-то американских языковедов на два лагеря — «механистов» и «менталистов», между которыми в свое время велись горячие дискуссии по поводу основных проблем науки о языке. Сам Л. Блумфилд в следующих словах определял различие теоретических позиций двух направлений: «Менталистическая теория, более старая и все еще превалирующая как в народных представлениях, так и в научном обиходе, предполагает, что многообразие человеческого поведения обусловливается вмешательством некоего внефизического фактора—духа, воли или разума, наличествующего в каждом человеческом существе. Этот дух, согласно менталистической точке зрения, совершенно отличен от материальных вещей и соответственно подчиняется причинности иного порядка или вообще не подчиняется никакой причинности... Материалистическая (или, лучше, механистическая) теория предполагает, что многообразие человеческого поведения, включая речь, обусловливается только тем фактом, что человеческое тело представляет чрезвычайно сложную систему. Человеческие действия, согласно материалистической точке зрения,— это часть тех процессов, причин и следствий, которые мы, например, наблюдаем при изучении физика или химии»10. Как всегда в подобных случаях, противники упрощали в пылу спора теоретические аргументы друг друга. Но уже и из приведенного высказывания Л. Блумфилда ясно, к чему сводилось основное разногласие двух спорящих сторон. Механисты, борясь с психологизмом младо- 9 F. Mosteller and D. L. Wallace, Inference in an Authorship Problem, «Journal of the American Statistical Association», vol. 58, 1963, p. 90. 10 Л. Блумфилд, Язык, Цит. по книге В. А. Звегинцева «История языкознания XIX и XX веков в очерках и извлечениях», ч. 2, М., Учпедгиз, 1960, стр. 136. 188
грамматиков, настаивали на исключении из языкознания всего того, что не могло быть объяснено данными физиологии, физики, химии и других вполне «положительных» естествоведческих наук. Говоря современным языком, можно сказать, что речевую деятельность человека (именно она, а не язык была фактическим предметом изучения в блумфилдовской лингвистике) они рассматривали как функционирование сложного кибернетического устройства. В соответствии с этой точкой зрения внимание лингвиста должно было быть направлено лишь на действие механизма этого кибернетического устройства и не должно было отвлекаться на рассмотрение таких явлений, которые «не имеют вида». Это привело к последствиям двоякого порядка. Язык оказался замкнутым в самом себе, причем он был «выпотрошен» и от него осталась лишь доступная непосредственному наблюдению внешняя оболочка — «с корабля современности», как ненужный балласт, было выброшено значение, за которым якобы тянулся хвост всяких метафизических представлений. Тем самым язык лишался своего оправдания. В речевом акте исправно действовали стимулы и реакции, но направляющая сила работы всего «кибернетического устройства»—информация (или значение) была намеренно исключена. Чарльз Фриз затратил немало усилий на доказательство того, что Л. Блумфилд вовсе не игнорировал значения, а совсем наоборот — оказывал ему много знаков почтения! Об этом говорится в настоящей его статье, но еще больше в другой — «О значении и лингвистическом анализе»11, где приводятся в подтверждение даже цитаты из частных писем Л. Блумфилда. Нельзя не отдать должного глубокой преданности Ч. Фриза своему учителю — он сделал все от него зависящее, чтобы снять с Л. Блумфилда тяжкое с современной точки зрения обвинение. Нельзя также сказать, что и в своем основном теоретическом труде — «Язык», и в своей исследовательской практике сам Л. Блумфилд полностью обходил значение. Он этого не делал, но главным образом потому, что этого сделать было нельзя. Однако в его работах содержались необходимые теоретические предпосылки для осуществления акта изгнания значения из лингвистического царства. И духовные последователи Л. Блумфилда — дескриптивисты — предприняли смелую 11 См. «Новое в лингвистике», вып. 2, М., ИЛ, 1962. 189
попытку практического осуществления заветов учителя — с теми же плачевными результатами. Было бы, однако, совершенно неправильно и несправедливо рассматривать многогранную, плодотворную и проникнутую чувством ответственности деятельность Л. Блумфилда только с точки зрения его борьбы с лингвистическим значением. И сводить лишь к этому понятие «школа» Блумфилда (что время от времени делается) и нелепо, и безграмотно. Да и само понимание человеческого организма как кибернетического устройства не имеет научных противопоказаний — оно методологически несостоятельно, так как страдает односторонностью, но практически может быть плодотворным. На его основе нельзя также достигнуть адекватного познания языка, но с его помощью можно решать конкретные практические задачи. В этой связи следует заметить, что, пожалуй, напрасно Ч. Фриз употребляет понятие «школа» Блумфилда — оно столь же неопределенно и неясно, каким, например, было бы понятие «школа» Соссюра. Деятельность Л. Блумфилда придала американской лингвистике наиболее «американский» характер, но когда мы стремимся дать оценку научной роли Л. Блумфилда, речь может идти не о каких- то введенных им рабочих приемах, проблемах или догматах, а лишь об определенных тенденциях лингвистической мысли, инерция которых была сообщена Л. Блумфилдом. Вкратце эти тенденции можно охарактеризовать следующим образом. Во-первых, он всячески настаивал на необходимости объективизации методов научного исследования языка. По сути говоря, эта тенденция была обратной стороной его борьбы с психологизацией лингвистики, его механизма, физикализма или вульгарного материализма. Он хотел уйти от всего, что носило малейший оттенок неопределенности и что он суммарно обозначал метафизикой, но при этом допускал обратную крайность. Да, кстати говоря, он и сам не избежал психологии, примкнув к тому ее направлению, которое обладало качествами, любезными его сердцу в науке о языке,— бихевиоризму. О бихевиористских основах лингвистической концепции Л. Блумфилда писалось очень много. Собственно, всякий раз, когда заходила речь о Блумфилде, ему почти автоматически припоминали бихевиоризм, полагая, что этим сказано все и что уже эта ссылка полностью перечер- 190
кизает все научное творчество Л. Блумфилда. По-видимому, бихевиоризм как таковой — это действительно плохо. Однако будем логичны. Ведь использование в лингвистике объективных методов исследований, фактически связанное с бихевиористскими уклонами механистов, ныне отнюдь не является противопоказанным. И если внимательно приглядеться, например, к работе академика А. Колмогорова «Автоматы и жизнь»12, справедливо привлекшей к себе пристальное внимание нашей научной общественности, то разве она не содержит в себе довольно основательную дозу механицизма, физикализма и в конечном счете бихевиоризма? Видимо, вообще есть все основания полагать, что отчасти в бихевиоризме были заложены теоретические предпосылки кибернетического подхода к изучению интеллектуальной деятельности человеческого организма. Сказанное, разумеется, не следует расценивать как попытку реабилитировать бихевиоризм. Оно имеет в виду более скромные цели — отметить бесспорные заслуги Л. Блумфилда в деле объективизации методов лингвистического исследования. Дело историка науки установить, что в этой тенденции от бихевиористской позиции Л. Блумфилда и что от потребностей дальнейшего развития языкознания, отбирающего рациональные зерна в теоретических построениях своего прошлого. Во-вторых, Л. Блумфилд способствовал расширению границ науки о языке. Пожалуй, основной областью, расширившей пределы лингвистического анализа, было синхроническое исследование. Хотя Л. Блумфилд в соответствии с этой целеустановкой своего учения очень положительно (Ч. Фриз даже употребляет эпитет «восторженно») отнесся к «Курсу» Ф. де Соссюра, этот последний не оказал никакого влияния на становление синхронического уклона у Л.Блумфилда. Синхронизм Л. Блумфилда собственно американского происхождения и его истоки следует искать в работах Ф. Боаса. Именно поэтому дескриптивная лингвистика, воплотившая в своей методике эту тенденцию лингвистической теории Л. Блумфилда, не только не опирается на Соссюра, но даже отталкивается от него. 12 Она перепечатана в сборнике «Возможное и невозможное в кибернетике», М., Изд. АН СССР, 1963, стр. 10—28. 191
Важно при этом отметить, что, настаивая на необходимости синхронического описания языков, Л. Блумфилд вовсе не стремился к тому, чтобы оно вытеснило диахроническое исследование. Он ставил одно рядом с другим, признавал за ними равные права, указывая при этом, что они преследуют разные цели. Среди работ самого Л. Блумфилда одинаково хорошо представлены как исторические, так и синхронические исследования. В-третьих, Л. Блумфилд всячески подчеркивал практическую значимость науки о языке. Речь при этом идет не о важности изучения иностранных языков, хотя сам Л. Блумфилд составил методическое пособие по практическому изучению языков, а о языке как определенном аспекте человеческих знаний 13 и роли языка в объединенной системе поведенческих наук. Методологически это, пожалуй, наиболее сомнительная часть научной деятельности Л. Блумфилда, но она в какой-то мере предугадала и даже подготовила возникновение таких проблем, как анализ содержания (content analysis) и даже, как это ни может показаться парадоксальным, гипотезу Сепира — Уорфа. Тем самым механисты неожиданным образом смыкаются с менталистами. Следует вообще отметить, что хотя менталисты и механисты не раз вступали в жаркие дискуссии, последние носили в значительной степени абстрактный, а не персонифицированный характер, или же затрагивали лингвистов крайних позиций. Главой менталистов, условно говоря, можно считать Э. Сепира, но сам Л. Блумфилд очень высоко ценил этого ученого и многократно опирался в своих выводах на его суждения и авторитет. Весьма примечательно и то обстоятельство, что многих американских лингвистов последующего поколения — К. Пайка, Ч. Хокетта, Г. Хойера и др.— в одинаковой мере можно назвать учениками и Л. Блумфилда и Э. Сепира. Об этом пишет в своей статье и Ч. Фриз. Это объясняется тем, что в лингвистической теории Л. Блумфилда не было никакой теории, способной выполнять ограничительные функции. Это обстоятельство отмечает и М. Холлидей, когда пишет: «Готовность, с какой лингвисты, ранее придерживавшиеся «блумфилдовской» традиции, отказались от 13 См. две его статьи под одним и тем же названием «Linguistic Aspects of Science», 1935 и 1939. Данные о них—в статье Ч. Фриза. 192
этого метода в пользу метода Хомского, частично коренится в отсутствии у них теоретического основания»14. Менталистские установки американской науки о языке находят свое выражение в антропологической лингвистике — пожалуй, наименее известном в Советском Союзе направлении, несмотря на то, что оно имеет и свой специализированный журнал — «Anthropological Linguistics» (другой периодический орган — «International Journal of American Linguistics» — собственно, также в значичительной мере обслуживает потребности антропологической лингвистики), и уже богатую библиографию15» а самое главное, представляет бесспорный интерес для советских языковедов хотя бы уже потому, что само дается им в руки в силу наличия в нашей стране великого многообразия культур и языков. Малую популярность у нас антропологической лингвистики, быть может, следует (во всяком случае, отчасти) приписать тому факту, что ее границы и задачи остаются весьма неопределенными16. Эта неопределенность начинается уже с названия данного направления. Наименование «антропологическая лингвистика» очень свободно чередуется с наименованием «этнолингвистика» (Г. Хойер — см. далее его статью — рассматривает этнолингвистику как часть антропологической лингвистики, что является отнюдь не общепринятым), а иногда довольно неясным образом перекрещивается и с психолингвистикой 17. Такая же неопределенность и даже противоречивость наблюдается и при определении содержания антропологической лингвистики. Г. Хойер ориентируется при этом на языковой материал, с которым ей приходится иметь 14 М. Halliday, Categories of the Theory of Grammar, «Word», vol. 17, 1961, p. 241. 16 Библиографию, составленную R. J. Goodell, см. в «Anthropological Linguistics», vol. 6, 1964, № 2. Вышла также хрестоматия по антропологической лингвистике. См. D. H. H у m е s, Language in Culture and Society. A Reader in Linguistics and Anthropology, N. Y., 1964. 16 Это обстоятельство, в частности, было продемонстрировано и программой последнего Международного конгресса антропологических и этнографических наук (Москва, август 1964 г.), на секции этнолингвистики которого стояли доклады самой неожиданной тематики. 17 См. сборник (точнее, хрестоматию) под редакцией Sol Saporta «Psycholinguistics. A book of readings», Ν. Y., 1961. 13—223 8 193
дело. Он указывает, что лингвист-антрополог имеет дело с бесписьменными языками и вынужден получать свой материал непосредственно из уст туземца-информанта — якобы только этим он и отличается от «нормального» лингвиста. Однако этому определению противоречит включение в проблематику антропологической лингвистики гипотезы Сепира—Уорфа, которая, конечно, уходит далеко в сторону от обычной проблематики «нормального» лингвиста. Именно проблематику, подобную гипотезе Сепира— Уорфа, считает центральной для антропологической лингвистики (или этнолингвистики) другой автор исторического обзора этого направления — Д. Хаймз18. Все подобные факты дают основания заключить, что антропологическая лингвистика (или, все же вернее, этнолингвистика) в определении Г. Хойера предстает в чересчур обедненном виде. На основании тематики работ, относимых к области этнолингвистики, видимо, более правильно определять ее как направление, сосредоточивающее свое внимание на изучении связей языка с культурой, народными обычаями, социальной структурой общества и с народом или нацией в целом. В таких своих более широких границах, включающих и экстралингвистические модели, данное направление не может не заинтересовать советских лингвистов. 4. Статья X. Спанг-Ханссена о глоссематике оставляет впечатление чересчур затянувшейся эпитафии для надгробия подававшего большие надежды, но преждевременно скончавшегося человека. С эпитафиями, разумеется, спорить неприлично, но по поводу них можно говорить. Прежде всего хочется отметить, что X. Спанг-Ханссен весьма удачно выбрал жанр своей статьи — уже в самом этом жанре вольно или невольно находит свое отражение определенное отношение к глоссематике. В общем обзоре современных лингвистических направлений сказать о ней, конечно, надо, но едва ли кто-нибудь отважится теперь на утверждение, что это — живая и продуктивная концепция, хотя вместе с тем нельзя отрицать того, что 18 См. «Anthropological Linguistics», vol. 5, 1963, № 1. 194
она стимулировала возникновение идей, которые не только продолжают свое существование, но и получают дальнейшее развитие. Несколько иную, но по сути сходную формулировку этих двух сторон глоссематики мы находим у X. Спанг-Ханссена. Он отмечает, что «глоссематическая теория в том виде, в каком она представлена в имеющихся публикациях, видимо, не соответствует реальным запросам различных отраслей знания», но вместе с тем «стремление глоссематики к точности в отношении посылок, определений и процедуры исследования в значительной степени стимулировало интерес к этому специфическому подходу изучения языка»19. И первое и второе утверждения, бесспорно, справедливы. Собственно, этим сказано все, что в самой краткой форме можно сказать относительно исторической судьбы глоссематики. Однако так просто от нее не отделаешься, поскольку она все же слишком глубоко вросла в современную лингвистику. Как отмечает сам фактический создатель и единодержавный глава глоссематики Луи Ельмслев, глоссематика характеризуется четырьмя особенностями: это, «во-первых, трактовка аналитического процесса как единственно адекватного; во-вторых, выдвижение на первый план формы, которой до сих пор предпочиталось содержание; в-третьих, стремление видеть в языковой форме не только форму выражения, но и форму содержания; наконец, в-четвертых — и это вытекает из перечисленных выше черт,— трактовка языка как частного случая семиотической системы»20. Рассмотрим кратко указанные черты. Первая черта сводится в основном к взаимоотношению индуктивных и дедуктивных методов. Процедура анализа строится у Л. Ельмслева на основе операционцого набора функций и на первый взгляд носит явно выраженный дедуктивный характер. Но при ближайшем рассмотрении это оказывается не совсем так, и неспроста Л. Ельмслев называет свой метод эмпирическим. В действительности метод глоссематики комбинированный, сочетающий индукцию с дедукцией, хотя и с превалирующей ролью второй. В подтверждение этой точки зрения можно было бы 19 См. ниже, стр. 353. 20 L. Hjelmslev, La Stratification du langage, «Word; vol. 10, 1954, p. 164. t3* 195
привести немало высказываний Л. Ельмслева — ограничимся одним. Говоря о принципах анализа, он пишет: «Поскольку лингвистическая теория начинает с текста как единственно данного и пытается прийти к непротиворечивому и исчерпывающему описанию этого текста путем анализа или последовательного разделения, т. е. с помощью дедуктивного перехода от класса к сегменту и сегменту сегмента, постольку основные положения системы определений этой теории должны относиться к самому принципу анализа. Эти определения должны установить природу анализа и понятия, которые входят в него... Принцип анализа также должен быть установлен с учетом эмпирического принципа, и, в частности, именно в связи с этим требование исчерпывающего описания имеет в данном случае практический интерес. Мы должны установить, что является необходимым для обеспечения исчерпывающего результата анализа, и позаботиться, чтобы не вводился заранее метод, исключающий возможность регистрации факторов, которые другой анализ также признал бы принадлежащими объекту, изучаемому лингвистикой»21. Такая процедура анализа обычно связывается с гипотетико-дедуктивным методом, успешно используется рядом наук и сама по себе не противопоказана также и лингвистике. Но в лингвистической теории Л. Ельмслева она образует лишь часть ее постулатов, и притом, конечно, не автономную. Вторая черта глоссематики, касающаяся взаимоотношения формы и субстанции, вне всякого сомнения, является для нее основной. Она есть организующее начало всей теории, ставящее все прочие ее черты в отношение производности. В языке нет субстанции вне формы, но также и нет формы вне субстанции — именно эта взаимосвязь обусловливает дискретный характер всех единиц языка на всех его уровнях. Но Л. Ельмслев, разорвав эту взаимосвязь и приписав форме качества первичности, поставил свою теорию вне языковой реальности, сделал ее, например, неспособной установить различие между конкретными языками, что можно осуществить лишь на основе субстанции. Бессилие глоссематики как действенной ос- 21 Л. Ельмслев, Пролегомены к теории языка, «Новое в лингвистике», вып. 1, М., ИЛ, 1960, стр. 281—282. 196
новы для лингвистического описания проявляется даже и в пределах одного языка. Л. Ельмслев, например, многократно говорит о том, что для формы языка совершенно безразлична ее субстанциональная манифестация. При этом он ссылается на пример Соссюра, отождествлявшего язык с шахматной игрой. Уже Скаличка отмечал двусмысленность этого сравнения, указывая, что для шахматной игры как таковой далеко не безразличны внешние факторы ее осуществления22. Но особенно поучительны в этом отношении работы Й. Вахека, доказавшего, что язык, выступающий в двух своих субстанциональных формах — устной и письменной,— это не одна языковая система, а две, во многом отличающиеся друг от друга23. В конечном счете отношение абстрактной глоссемати- ческой алгебры языка, ориентированной на чистую форму, к языковой реальности можно свести к отношению формализованного языка к естественному. В этом отношении кроются все отрицательные качества глоссематики как универсальной теории лингвистического описания, но также и ее положительные стороны, создавшие инерцию использования логико-математических методов в лингвистике для решения некоторых частных задач. Подробнее этот вопрос рассматривается в статье «Применение логико-математических методов в лингвистике», помещенной в настоящем сборнике24. Две последующие черты глоссематики — третья и четвертая, детализируют и подтверждают то, что было сказано о ней в связи со второй чертой. Третья черта предписывает использование формальной процедуры и для описания того, что вне субстанции фактически вообще не существует — значения; точнее, не существует вне отношения формы и субстанции, так как, говоря словами Э. Бенвениста, «форма и значение определяются друг через друга, поскольку в языке они членятся совместно»25. Так же как и в плане выражения, Л. Ельмслев в плане содержания (то есть в значимой стороне языка) спускаясь на уровень, находящийся ниже знакового, обращается 22 V. Skalićka, Kadańsky structuralismus a «PraZska Skola». «Slovo a Slovesnost», t. X, 1948, № 3. 23 Josef Vachek, To Chapters on Written English. «Brno Studies in English», vol. I, Prague, 1959. 24 См. ранее, стр. 7—33. 25 См. далее, стр. 443. 197
к фигурам плана содержания. Тут уж начинается сплошная фантастика, ибо установление этих фигур не знает никаких строгих правил и построено на чистом произволе и домысле того, чего в фигурах недостает для поддержания всей теории в целом. Быть может, фигуры плана содержания следовало бы определить как набор элементарных понятийных элементов, извлеченных из реальных значений и используемых для исчерпывающего описания совокупности реальных значений данного языка. Но такой сугубо эмпирический подход никак не укладывается в схему логического построения глоссематики. Четвертая черта, трактующая язык как частный случай семиотической системы, во многом тавтологична. Она — логический вывод из предпосылки, заложенной в третьей черте. К ней целиком относится то общее заключение, которое было сделано относительно этой последней,— повторять его нет надобности26. В период 30—50-х годов глоссематика составляла весьма значительный компонент «европейской» лингвистики. Сейчас интерес к ней главным образом исторический. Однако не следует забывать того, что она — источник многих вопросов, которые волнуют и современное языкознание. 5. В значительной мере на прямом противопоставлении (вольном или невольном) глоссематике строится лингвистическая концепция Пражского лингвистического кружка, несмотря на то, что оба эти направления имеют общий теоретический источник — «Курс» Ф. де Соссюра, и оба они взяли на вооружение принцип структурности. Деятельности «Кружка» посвящена статья Р. Якобсона, в прошлом активного его участника. В ней кратко, но ясно изложены основные теоретические установки и проблемы этого лингвистического направления. Пражский лингвистический кружок (или просто Пражская школа), организационно оформившийся в 1926 г., очень скоро перерос локальные рамки и превратился в «общеевропейское» направление, обладавшее довольно чет- 26 О значении семиотического аспекта языка см. статью В. А. Звегинцева «Актуальные проблемы современного теоретического языкознания», «Вестник Московского университета», 1961, № 2. 198
кой лингвистической концепцией, несмотря на «интернациональность» своего состава. Это подчеркивалось и организационным единством «Кружка», выступавшего на многих лингвистических съездах и конгрессах по всякого рода дискуссионным вопросам не персонифицированно, а от имени «Кружка» в целом. В «Тезисах», приуроченных к I съезду славистов (Прага, 1929), намечена широкая программа исследований и изложены теоретические принципы «Кружка», которым он оставался в основном верен и в дальнейшем, хотя отдельные его члены затем отошли от него по тем или иным причинам. Эту программу исследований «Кружку» удалось выполнить лишь в небольшой ее части, очевидно, не в малой степени и потому, что вторая мировая война прервала естественное развитие его идей. В аспекте идей «Кружка» наиболее детальным образом оказались разработанными вопросы фонологии и поэтического языка. В меньшей мере — вопросы морфологии и синтаксиса (здесь главные заслуги принадлежат В. Матезиусу, по мысли которого и произошло организационное оформление «Кружка»). Как показывает ознакомление с «Тезисами», пражские ученые в общем сохраняли представление о филологии как комплексной науке и не разрывали связей между отдельными ее компонентами — языком, литературой, фольклором, мифологией. Это способствовало тому, что понятие структурности проникло не только в изучение языка, но и в традиционно сопредельные языкознанию науки. Связь между составляющими традиционную филологию науками поддерживалась также единым подходом к их изучению — с точки зрения их целенаправленности. Сами пражцы предпочитают в данном случае говорить о функциональности. Такой подход может опираться только на реальные качества изучаемых объектов, так как лишь в этих качествах может проявляться целенаправленность. Таким образом, основной теоретический принцип «Кружка» направляет исследование по определенному руслу, полярно противоположному тому, который прокламируется глоссематикой. Методическая ориентированность на функционализм, который особенно подчеркивается в последние годы (в этом отношении весьма характерна коллективная статья «К дискуссии по вопросам структурализма», опублико- 199
ванная в 1957 г. первоначально на русском языке27), ставит вопрос об общеевропейском (а может быть, и еще шире) теоретическом наследии «Кружка», которое, к сожалению, остается еще совсем нетронутым. А между тем совершенно очевидно, что, например, творчество многих лингвистов, официально не провозглашавших своей принадлежности к «Кружку», стоит под тем же знаменем функционализма или целенаправленности, хотя и формулируется иногда по-иному. Статья Альфа Соммерфельта («Французская лингвистическая школа») относит нас на несколько десятилетий назад и касается очень конкретных вопросов. Советским лингвистам они хорошо известны по многочисленным переводам книг А. Мейе и Ж. Вандриеса (об этих двух лингвистах и идет преимущественно речь в данной статье). Тем не менее полезно будет вспомнить о том, что творчество языковедов «французской школы» во многом подготовило возникновение современных идей, а в ряде случаев и современное толкование таких понятий, как «система», «внутренний закон», «общественная сущность языка» и пр. Не следует забывать и того, что «французская школа» — это не то, что «все в прошлом». К ней принадлежат и такие крупные и активно действующие лингвисты, как М. Коэн, Ж. Марузо, А. Вайан, Ж. Кантино и др. Следует надеяться, что в своем целом статьи настоящего раздела помогут советским лингвистам ориентироваться в разноречивости школ и направлений современной науки о языке. В. Звегинцев 27 См. «Вопросы языкознания», 1957, № 3. Перепечатана в книге В. А. Звегинцева «История языкознания XIX и XX вв. в очерках и извлечениях», ч. 2, М., Учпедгиз, стр. 100—110.
У. Плат МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА* 1. ВВЕДЕНИЕ За время, прошедшее после Восьмого международного конгресса лингвистов (1957 г.), интерес к математической лингвистике и количество исследований в этой области сильно возросли как в Америке, так и в Европе. В последние годы математическая лингвистика стала развиваться также и на Дальнем Востоке, результатом чего было возникновение в Японии журнала «Mathematical Linguistics» (1957) и «Японского общества математической лингвистики». Профессор Джошуа Уотмоу в своем докладе на Международном конгрессе в 1957 г. упомянул, что за два года до этого конгресса начал работать семинар по математической лингвистике в Гарвардском университете, и с этих пор впервые математическая лингвистика появилась в учебном расписании. В течение последующих лет математическая лингвистика стала завоевывать все более важное место как в исследованиях отдельных ученых, так и в университетских курсах — не только в Гарварде1, но и в других университетах Европы и Соединенных Штатов. Центрами математической лингвистики стали Массачу- сетский технологический институт, Мичиганский и Пенсильванский университеты в Соединенных Штатах, Боннский университет в Германии, а также Московский и Ленинградский университеты в Советском Союзе. Имеются свидетельства того, что математическая лингвистика получает все большее признание как академическая дис- * Warren Plath, Mathematical Linguistics в „Trends in European and American Linguistics 1930—1960", Utrecht/Antwerp, 1961, pp. 21—57. — Прим. ред. 1 В библиотеке Гарвардского колледжа имеется подшивка работ, доложенных на этом семинаре в течение года. 201
циплина. Курс по квантитативной лингвистике был введен в Индианском и Калифорнийском университетах, а в 1958 г. Министерство высшего образования СССР вынесло постановление о введении факультативных курсов по математической лингвистике и машинному переводу для студентов-филологов и математиков в Московском, Ленинградском, Горьковском, Саратовском и Томском университетах. Задача этой статьи— дать обзор последних достижений в области математической лингвистики, уделяя главное внимание основным теоретическим понятиям и тем сферам применения математической лингвистики, которые вырисовываются наиболее четко в обширной и разнообразной литературе по этому вопросу. Поскольку времени на изучение материалов у нас было мало, некоторые ценные результаты и даже целые области2, непосредственно связанные с математической лингвистикой, не отражены в настоящем обзоре. Мы надеемся, однако, что библиографический список, приложенный к настоящей работе (хотя он и не является ни в какой мере исчерпывающим), будет полезным пособием для тех, кто хотел бы составить себе более полное представление о предмете. Большая часть последних достижений лингвистики была основана на тех возможностях практического и теоретического описания формальных свойств естественного языка, которые заключены в дискретных моделях3. Хотя модели отдельных языков, начиная с орфографической системы английского языка и кончая построенными недавно грамматиками экзотических языков, часто подвергались суровой критике за их многочисленные недостатки, никто, как правило, не утверждал при этом, что дискретные модели являются в принципе неадекватными. Напротив, критика чаще всего сводилась к тому, что одна дискретная модель должна быть заменена другой, в большей степени обладающей желательными (с точки зрения критикующего) свойствами. Если рассматривать языковые модели как абстрактные системы дискретных элементов, то к ним можно применять 2 К ним относится, в частности, анализ и синтез речи. Читателя можно отослать в этой связи к журналу «Journal of Acoustical Society of America», где опубликовано много статей по этому вопросу. 3 О понятии модели см. Oettinger, 1957; см. также Joos, 1950, где лингвистика называется дискретной математикой. 202
различные математические понятия и методы, начиная от элементарной идеи числа и кончая сложными логическими, статистическими и теоретико-множественными операциями. Однако представление о том, что всякое привлечение чисел и математических операций для описания таких систем элементов делает утверждения более «точными» или более «научными», является абсолютно ошибочным. Нужно прежде всего показать, что новая система, полученная таким образом, является более удовлетворительной моделью, чем исходная система,— либо в том отношении, что она дает возможность формулировать более простые и более общие теоретические утверждения о некоторых аспектах моделируемой области4, либо потому, что операции над моделью проливают свет на результаты соответствующих операций в моделируемой области. Одна из самых больших опасностей, связанных с построением математических моделей языка, в особенности количественных, состоит в том, что неразборчивое использование математического аппарата неизбежно приводит к бессмысленным и даже дезориентирующим результатам. Поэтому необходимо ясно понимать, что предпосылкой обогащения лингвистики с помощью математики является не только знание соответствующих областей математики, но и, кроме того, глубокое понимание сущности лингвистических проблем, на разрешение которых должны быть направлены математические методы. Элементарные математические операции, основанные на счете, применялись при изучении языка еще в древние времена5. В последние годы простой подсчет символов уступил место исследованиям, в которых к результатам подсчета применяются методы математической статистики и теории информации 6. Эти методы с большим успехом использовались для изучения широкого круга языковых явлений; налицо результаты в самых разных областях — от изучения общих закономерностей дистрибуции слов в тексте до измерения степени генетического родства двух языков. Некоторые из важнейших достижений квантитатив- 4 Хомский (Chomsky, 1957) подчеркнул важность критериев такого рода в связи с оценкой относительных достоинств различных типов грамматик. 5 Ср. Whatmough, 1957. 6 За исчерпывающей библиографией по статистической лингвистике мы отсылаем читателя к книге Гиро (Guiraud, 1954 в). 203
ной, или статистической, лингвистики будут рассмотрены более подробно в разд. 2. Современная лингвистика усиленно занимается построением моделей языка, описывающих язык через возможные структурные конфигурации и взаимосвязи элементов на разных уровнях (фонологическом, морфологическом, синтаксическом). Для построения таких систем, по-видимому, особенно хорошо приспособлены понятия и методы современной алгебры, и большое количество исследований проводится сейчас именно в этом направлении7. В разд. 3, посвященном структурным моделям, будет показано, что хотя количественные методы и не имеют в этой области первостепенного значения, они все же могут играть вспомогательную роль в некоторых структурных моделях языка. Разд. 4, заключительный, содержит краткий перечень важнейших практических приложений математической лингвистики. Интенсивная работа в таких областях, как машинный перевод, переработка информации и построение автоматических программирующих языков для вычислительных машин, уже сейчас оказалась важнейшим стимулом для развития математической лингвистики и в дальнейшем, по всей вероятности, будет сильно влиять на развитие лингвистики в целом. 2. СТАТИСТИЧЕСКИЕ МОДЕЛИ ЯЗЫКА «Макролингвистические» модели. По-видимому, наиболее известной и широко обсуждаемой формулой статистической лингвистики является так называемый закон Ципфа (Zipf, 1949): r-f=C8. Эта формула гласит, что если слова достаточно длинного текста упорядочить по рангам, то есть расположить в порядке убывающей частоты их встречаемости в этом тексте, так что наиболее частое слово будет иметь ранг г= 1, следующее по частоте — ранг 7 Мы предлагаем читателю обратиться к трудам «Симпозиума по структуре языка в его математических аспектах», происходившего в 1960 г., где было представлено большое число работ, касающихся этой, а также других областей математической лингвистики. 8 Первое изд.—1929 г.; см. Harvard Studies in Classical Philology, 40, 1929, p. 89, гдеЦипф пишет XY = η (впоследствии — r-f = C) и приводит тот же самый график. Ту же формулировку см. в его диссертации по лингвистике (Harvard, 1929, pp. 2—3, η. 1); см. также его: Selected Studies (H. U. P., 1932), p. 27. 204
r=2, и т. д., то произведение ранга r на частоту f для любого слова в тексте будет равно приблизительно постоянному числу С, где С зависит от длины текста. Регулярность этого соотношения, проверенного Ципфом на текстах, взятых из широкого круга языков, привлекала внимание большого числа исследователей, поскольку в этом соотношении пытались найти ключ к объяснению самых общих закономерностей языкового поведения. Сам Ципф интерпретировал свои данные как свидетельство в пользу существования фундаментального закона человеческого поведения — закона, который он назвал «принципом минимального усилия» по аналогии с принципом минимального действия в физике. Однако такое объяснение соотношения частоты и ранга не получило достаточного признания, поскольку расплывчатость предложенного принципа не давала возможности строить математические модели порождения текста, которые можно было бы оценить с точки зрения их соответствия наблюдаемым данным. В прошедшее десятилетие появился целый ряд исследований, отталкивающихся от работы Мандельброта, в которых делались попытки «объяснить» соотношение частоты и ранга с помощью математических моделей, основанных на гипотезах, отличных от ципфовской. Мандельброт (Mandelbrot, 1957) изложил результаты своих исследований в этом направлении в большой теоретической работе о «макролингвистике». Эту дисциплину он определяет как новую область лингвистики, в задачи которой входит изучение (статистическими методами) «крупномасштабных» языковых явлений. Роль макролингвистики по отношению к микролингвистике (грамматике) должна быть, по Мандельброту, аналогична роли термодинамики по отношению к механике индивидуальных молекул газа: описание на макроскопическом уровне хотя и не противоречит микроскопическому поведению, описываемому грамматикой или законами механики, но игнорирует некоторые детали поведения на этом нижнем уровне. Макроскопический подход термодинамики в силу своей упрощенности дает, естественно, лишь очень неполное описание поведения газов; однако он оказался чрезвычайно полезным, так как привел к формулировке количественных соотношений, которые практически невозможно было получить при наблюдении за движением отдельных мо- 205
лекул, Мандельброт предположил, что таким образом макролингвистика может стать инструментом описания грубых свойств больших совокупностей текста, для которых полная, детальная грамматическая обработка может оказаться немыслимо громоздкой и сложной. При исследовании соотношений ранга и частоты с «макролингвистической» точки зрения Мандельброт предложил изменить исходную формулу Ципфа, чтобы приблизить ее к реально наблюдаемым данным; он ввел в нее два новых параметра ρ и B, получив то, что он назвал каноническим законом9: pr=P(r+p)~ß. Здесь г — это, как и ранее, ранг слова, рг — относительная частота слова с рангом r, а Ρ, ρ и В — константы данного текста; ρ дает поправку для слов низкого ранга, а —В (в формуле Ципфа —В равно —1) соответствует скорости убывания логарифма рг в зависимости от r. Мандельброту удалось вывести канонический закон математически из двух различных теоретических моделей порождения текста. В соответствии с первой, простейшей, моделью предполагается, что слова текста порождаются буква за буквой с помощью марковского процесса10 с конечным числом состояний, причем каждый символ, включая пробел между словами, характеризуется некоторой фиксированной вероятностью появления в тексте. Если текст порождается вероятностной моделью такого типа, со случайным распределением пробела, то распределение частот слов в этом тексте в точности следует каноническому закону (при этом В больше единицы)11. Вторая модель Мандельброта была разработана на основе аналогии с термодинамикой. Математически определяется «наиболее вероятное состояние» текста, на который наложены два ограничения: при декодировании слова отделяются друг от друга пробелами, и цена оптимального декодирования (то есть цена декодирующей системы, при которой для декодирования наиболее часто встречающихся слов требуется минимальное число операций) фиксирована. Эти условия вызывают максимизацию энтропии (в смысле 9 Канонический закон приводится здесь в такой форме, в какой он формулировался в некоторых ранних работах Мандельброта (см. Mandelbrot, 1954, 1955). 10 Марковские процессы с конечным числом состояний рассматриваются более подробно в ч. 3, разд. «Модели синтеза...» 11 Mandelbrot, 1957, стр. 36—37. 206
Шеннона)12, связанную с распределением вероятностей слов, и опять-таки результатом является такое распределение частот слов, которое подчиняется каноническому закону, на этот раз без ограничения на величину В. Из второй модели, которую Мандельброт явно предпочитает первой, он выводит несколько следствий; в частности, заключение о том, что слова являются основными единицами текста, а также и то, что теория информации чрезвычайно важна для лингвистики. Другие исследователи, изучающие ту же проблему, не соглашаются с Ман- дельбротом, уверяя, что для сильных допущений, требуемых моделью с максимизацией информации, нет достаточных оснований и что вытекающие отсюда заключения не являются обязательным следствием наблюдаемых данных. Миллер и Ньюман (Miller and Newman, 1958) привели особенно веские аргументы в пользу первой модели Мандельброта, указав, с одной стороны, что длинные последовательности букв, не прерываемые пробелом, менее вероятны, а с другой, что число различных длинных слов больше, чем коротких. Отсюда следует, что в достаточно длинном тексте размещение пробелов всегда будет по существу случайным18. Среди прочих моделей мы можем выделить модель Саймона (Simon, 1955), который трактует формирование текста как вероятностный «процесс порождений» и из этого допущения выводит функцию распределения, связывающую число слов заданной частоты с частотой их появления в тексте. Мандельброт (Mandelbrot, 1959) показал, что в выводе Саймона обнаруживается круг, и что поэтому хотя и можно построить функцию, которая будет соответствовать наблюдаемым данным, но это не дает положительного ответа на вопрос о том, действительно ли имеет место что-либо вроде «процесса порождений». Белевич (Belevitch, 1959) и Сомерс (Somers, 1959) утверждают, что для ципфовского соотношения частоты и ранга достаточно допущения о том, что логарифм относительной частоты слов имеет нормальное распределение. С помощью приближений (рядом Тейлора первого и второго порядка) нормального рас- 12 Ср. параграф «Теоретико-информационные модели» в разд. 2. 13 Ср. более раннюю фор\^лировку этого утверждения у Миллера (Miller, 1957). 207
пределения на ограниченном отрезке Белевич выводит сначала закон Ципфа, а затем канонический закон Мандельброта. Белевич считает, что для объяснения нормального распределения не требуется никаких специальных допущений, хотя фактически он делает очень сильное допущение, утверждая, что логарифм вероятности может рассматриваться в статистической лингвистике как естественная переменная. Поскольку различные статистические модели, в том числе очень простые модели со случайным размещением пробела, приводят к классическому соотношению частоты и ранга, описанному Ципфом и Мандельбротом, то распределение, которое имеет место в подавляющем большинстве длинных текстов, не должно нас удивлять. Скорее всего, регулярность распределения частоты и ранга в текстах сама по себе ни в какой мере не вскрывает сущности основных языковых процессов; по-видимому, проверка более сложных моделей, которые могут быть построены в будущем, должна производиться на основе других источников, в частности, с помощью психологических тестов. Все это не означает, что усилия, направленные на решение рассматриваемой проблемы, были затрачены впустую; установление того факта, что канонический закон весьма часто выполняется при B=l, наталкивает на мысль об использовании таких распределений в качестве единицы отсчета при измерении существенных отклонений в языковом поведении. Мандельброт еще раньше предположил, что параметр B (собственно говоря, в форме 1/B) может явиться полезной мерой эффективности словаря; это дает возможность использовать его для измерения умственных способностей и обнаружения некоторых патологических нарушений работы мозга. Таким образом, оказывается, что «макролингвистика» гораздо ближе к области, пограничной между лингвистикой и психологией, чем к области традиционной грамматики. Это вполне естественное следствие использования таких моделей, которые в соответствии со своим определением не включают деталей, составляющих самое существо грамматического описания. Статистика стиля и установление авторства. Если в в работах, о которых мы говорили ранее, главное внимание 208
обращается на сходство распределений частоты и ранга, то в других работах изучение статистики текста имеет прямо противоположную цель: здесь стремятся найти статистическую меру, которая наилучшим образом выражала бы различия в стиле у разных авторов14. Ученые этой группы пытались найти количественные критерии для решения таких проблем, как проблема установления авторства, относительная хронология работ одного и того же автора и описание литературного стиля вообще, видимо надеясь, что эти критерии могут привести к суждениям более объективным и обоснованным, чем те, которые были возможны ранее. В обиходном употреблении термину «литературный стиль» могут придаваться различные значения; этот термин может обозначать и характеристику отдельных произведений одного писателя (или даже какой-то части произведения), и характеристику писателя и даже группы писателей или исторического периода. При описании стиля часто принимается во внимание как форма, так и содержание произведения; это описание может содержать анализ звуковой модели стихотворения и исследование расположения фактического материала в прозаическом произведении. Понятие столь расплывчатое и общее, разумеется; нельзя сразу «свести к математике», надеясь при этом получить хоть сколько-нибудь осмысленный результат. Что в ряде случаев удавалось сделать — так это выделить некоторую частную стилистическую особенность (почти всегда формальную) и выразить ее количественно — обычно через относительную частоту языковых форм какого-то одного типа15. Классическим примером подобного подхода является работа Юла (Yule, 1944) по статистике литературного словаря, которая выросла из его интереса к спору об авторстве сочинения «De imitatione Christi». Начав с изучения распределения частот имен существительных в указанной работе и в работах двух наиболее вероятных 14 О попытках Луна (Luhn, 1958) и других применить аналогичные методы в автоматическом реферировании см. разд. 4. 15 Гиро (Guiraud, 1954) особенно настаивает на целесообразности использования относительных частот при изучении литературного стиля. 14-2238 209
ее авторов, Юл столкнулся с рядом важнейших методологических проблем, которые заставили его значительно расширить первоначальный объем исследований. Работа Юла очень важна, так как в ней четко выделяются два основных момента: первый — огромные трудности, которые приходится преодолеть, чтобы установить объем выборки и обеспечить ее нейтральность; второй — необходимость нахождения таких статистических характеристик, которые были бы независимы от размера выборки; при несоблюдении этого условия результаты, полученные для текстов различной длины, нельзя сравнивать друг с другом. Основным достижением Юла, имеющим большое значение для решения последней из упомянутых проблем, является введение им «характеристики К» — параметра, который, как он показывает экспериментально, не зависит от размера текста, если материал последнего однороден. Основной недостаток этой характеристики состоит в ее чрезмерной чувствительности к вариациям стиля в разных произведениях одного и того же автора; иногда чувствительность к вариациям стиля бывает столь же велика, как и чувствительность к различию между стилями разных авторов. Это свидетельствует, однако, лишь о том, что даже для одного и того же автора частные количественные характеристики распределения слов являются постоянными только в пределах группы произведений, объединенных единством темы. Как подчеркивает сам Юл, прежде чем целесообразность оценок типа характеристики К будет окончательно установлена, необходимо провести большое количество контрольных вычислений, базирующихся на новейших данных. Юла критиковали за то, что он ограничил свои исследования только словарем (и, более того, только существительными), но он и сам полностью осознавал эти свои недостатки и скромно оценивал свою работу как начальное и еще далекое от совершенства исследование лишь одного из важных аспектов литературного стиля. Ограничение масштаба исследований играло скорее не отрицательную, а положительную роль, так как оно способствовало тщательному и добросовестному анализу всех возникавших проблем; книга Юла в целом служит примером преданного, ответственного отношения к науке, и только такое отношение является залогом дальнейших существенных достижений в этой области. 210
Отдельные разделы вышедших недавно книг Хердана (Herdan, 1956, 1960) и Фукса (Fucks, 1955) также посвящены рассмотрению вопросов, связанных со статистикой литературного стиля. В своей первой книге Хердан вводит величину vm, очень близкую к «характеристике» К, не зависящую, однако, от допущения Юла о том, что распределение частот слов подчиняется закону Пуассона; более того, величина vm может быть описана просто как коэффициент вариации относительно среднего значения. Если не считать этого новшества, из которого Хердан делает весьма далеко идущие выводы, не имея на это достаточных оснований, то раздел о стилостатистике у Хердана в значительной степени является пересказом работы Юла. В соответствующем разделе второй книги Хердан вводит, однако, и некоторые оригинальные методики; в частности, показано использование отношений областей в диаграммах Лоренца для измерения концентрации словаря16. К сожалению, контрольные вычисления, связанные с этими оценками, аналогичные вычислениям Юла, в достаточно широком масштабе пока еще не были проведены. Работа Фукса основана на совершенно ином подходе к статистике литературного стиля, чем работы Хердана или Юла, поскольку за основную единицу Фукс принимает не слово, а слог. В связи с этим возникает необходимость изучения распределения слогов в слове, а также распределения других метрических и слоговых моделей. В процессе изучения статистических характеристик метрики Фукс вводит интуитивно оправданную меру метрических ограничений — величину, которая изменяется от 0 в «абсолютной прозе» (absolute Prosa) до 1 в «абсолютно связанной речи» (absolut gebundene Rede). Правда, он не приводит примеров применения этой простой оценки, а вместо этого переходит к разработке сложного математического аппарата, в котором используются векторы в двенадцатимерном пространстве, представляющие двенадцать типов рассматриваемых им метрических единиц. Хотя намерение Фукса, очевидно, состояло в том, чтобы наметить возможные пути подхода к статистическому анализу стиля, его книга тем не менее вызывает ощущение перегруженности математической техникой, примени- 18 Herdan, 1960, гл. 2. 14* 211
мость которой именно в этой области должна быть показана стдельно. Система с n измерениями не может быть использована для точного установления авторства до тех пор, пока не будет получено доказательств адекватности хотя бы некоторых из этих n стилистических характеристик. В области статистики литературного стиля предстоит еще очень много работы, так как придется попытаться найти новые оценки стиля, по возможности более постоянные, чем те, которые связаны со словарем. По-видимому, очень многое могут дать исследования на синтаксическом уровне, включая статистическое исследование соотношения между сочинением и подчинением, исследование типов и глубины «самовставления»17 в предложениях т. д.; эти аспекты литературного стиля никогда еще не подвергались изучению с количественной точки зрения. Важнейшей предпосылкой расширения масштабов исследования и превращения статистики стиля в более эффективное оружие анализа является участие в этой работе лингвистов — предпочтительно лингвистов, в какой-то мере владеющих статистическими методами. Статистика стиля — это такая область, где ничто не может заменить тщательной предварительной работы (как со стороны лингвистов, так и со стороны статистиков), которая должна быть проделана до начала подсчетов и тем более до формулирования каких бы то ни было выводов. Можно надеяться, что исследования, удовлетворяющие этим требованиям, перестанут в будущем быть исключением и в результате более тесного сотрудничества статистиков и лингвистов станут обязательными. Теоретико-информационные модели. После того как вышли в свет основные математические работы Винера (Wiener, 1948) и Шеннона (Shannon, 1949), теория информации стала полем активной деятельности не только для специалистов по теории связи, но и для ученых целого ряда других областей 18. В частности, линг- 17 Об этом понятии см. анализ работ Ингве и Эттингера по синтаксису в разд. 3. 18 Мы отсылаем читателя к работе Stumpers, 1953, где имеется указатель соответствующей литературы. 212
висты, психологи и инженеры пытались применить некоторые понятия и методы теории информации к решению лингвистических проблем. Особое внимание привлекла шенноновская мера энтропии (или «информации выбора») — величина, которая в сущности является средней статистической оценкой «неожиданности» знаков, производимых источником в данной системе связи. Измерение энтропии рассматривалось как возможное средство количественного описания языковых процессов и структуры языка. Как много раз подчеркивалось в литературе, мера информации, используемая в теории информации, не имеет ничего общего со смысловым содержанием передаваемых сообщений, а относится исключительно к статистической структуре их формального представления. Это сразу же исключает возможность применения теории информации к изучению семантических проблем (хотя если вырвать термин «информация» из его точного математического контекста, то именно такая связь прежде всего приходит в голову). Черри (Cherry, 1957, стр. 177) подчеркнул, что рассмотрение поведения источника знаков в терминах шенноновской меры информации имеет силу лишь в случае статистически стационарного источника, то есть такого источника, для которого наблюдение частот его знаков за ограниченный период времени дает достаточно точные оценки его статистических параметров. По мнению Черри, в подавляющем большинстве областей коммуникации в человеческом обществе знаковое поведение не является стационарным, так что в строгом смысле слова математическая теории здесь вообще не применима. Эту оговорку он делает только по отношению к языковому поведению отдельных индивидов, оставляя открытым вопрос о нормах поведения для групп. Хердан (Herdan, 1956, гл. 9), с другой стороны, настаивает на том, что распределение вероятностей языковых единиц постоянно и что теория информации является поэтому надежным средством лингвистического исследования. Какова бы ни была относительная ценность этих двух в значительной мере противоречащих друг другу точек зрения, энтропия распределения вероятностей фонем и букв подсчитана (и она оказалась в достаточной мере устойчивой); подсчитано также распределение длины слов с точки зрения числа слогов. В последнем случае Фукс (Fucks, 213
1955) использовал меру энтропии по Шеннону как статистическую характеристику индивидуального стиля, никак не учитывая роли этого понятия в теории связи. Такое использование информации выбора само по себе вполне правомерно. Однако оно получает практическое применение только в том случае, если собраны достаточно полные статистические данные о рассматриваемом классе распределений. Значительно больший интерес представляют те исследования, которые выходят за пределы чисто статистических приложений меры информации и используют в какой- то мере саму теорию. Особенно существенным для моделирования некоторых формальных свойств естественного языка явилось рассмотрение его как кода и применение к нему теоретико-информационного понятия избыточности. Коротко говоря, избыточность источника (и, соответственно, избыточность кода, используемого источником) определяется как R= 1 — Н/Нмакс, где Я есть действительная скорость передачи информации данного источника, а Hмакс —максимальная скорость, которая реализуется только в том случае, если знаки, порождаемые источником, являются статистически независимыми друг от друга и обладают равными вероятностями. Условие, при котором H=НМаксу то есть избыточность равна нулю, состоит, таким образом, в том, что знаки, порождаемые источником, не должны иметь иерархической структуры: в коде не должно быть предпочтительных последовательностей или комбинаций знаков. Код такого рода, хотя он и использует максимальным образом какой-то алфавит, обладает, однако, тем недостатком, что ошибки, возникающие при передаче сообщения, останутся незамеченными, поскольку все сообщения являются равновероятными. Между тем естественные языки с их предпочтительными и запрещенными комбинациями формальных единиц на нескольких структурных уровнях обладают относительно высокой степенью избыточности, что обеспечивает их эффективность как средства общения при неблагоприятных условиях. Произведенные независимо друг от друга исследования Шеннона (Shannon, 1952), с одной стороны, и Миллера и Фридмана (Miller and Friedman, 1957) — с другой, включали проведение разного рода психологических тестов для оценки энтропии и избыточности письменного английского языка. Их подсчеты показывают, что 214
избыточность английского языка на уровне букв составляет приблизительно 50%. Миллер и Фридман, которые проверяли способность испытуемых восстанавливать печатные тексты, подвергнутые искажениям разных типов и разных степеней, рассматривали также вопрос о том, каким образом можно производить компрессию (сжатие) письменного английского языка в целях экономии пропускной способности канала связи при их передаче. Они сделали вывод, что наилучшие результаты дает систематический пропуск гласных и пробелов между словами — вывод, представляющий определенный интерес для лингвистов (а именно для изучения систем письма и процессов фонетических изменений19). Применение теории информации к устному языку производилось главным образом на основе анализа по различительным признакам, принципы которого разработаны Якобсоном и его сотрудниками. Поскольку предполагается, что различительные признаки являются по своей природе бинарными (Halle, 1957), использование бита— двоичной единицы информации — оказывается здесь особенно удобным. При анализе структуры фонологических систем число различительных признаков можно сопоставить с минимальным числом бинарных противопоставлений, которым должен обладать код для того, чтобы закодировать каждую фонему однозначным образом (ср. Cherry, Halle, Jakobson, 1953; этот подход рассматривается также у Белевича — Belevitch, 1956). Продолжая работу в этом направлении, Гринберг, Осгуд и Сапорта (Greenberg, Osgood and Saporta, 1954) предложили рассматривать простое соотношение этих двух величин как меру эффективности фонологической системы. Несколько иной подход к анализу по различительным признакам будет рассмотрен в разд. 3 в параграфе «Теоретико-множественные модели». Количественные методы в историческом и сравнительном языкознании. Использование количественных методов в сравнительном и историческом языкознании, как ука- 19 Более полное описание роли избыточности в естественных языках см. в книге Глисона (Gleason, 1955, гл. 19). 215
зал Уотмоу (Whatmough, 1957), отнюдь не является чем-то совершенно новым. В индологии, например, имеется целая серия работ, начатая работой Арнольда (Arnold, 1905) о метрике Вед, где простые подсчеты частот являются средством определения относительной архаичности различных фрагментов «Ригведы». Однако средствам такого рода всегда уделялось относительно меньшее внимание. Между тем за последние несколько лет как лингвисты, так и антропологи проявили глубокий интерес к количественным методам измерения степени сходства между языками. Хотя было сделано несколько попыток (некоторые из них будут упомянуты ниже) установить количественную основу для типологического сравнения языков, в большинстве случаев«мера сходства» тщательно вычислялась лишь затем, чтобы использовать ее в качестве критерия генетической близости между языками одной семьи. Более сложные цели ставит перед собой то направление исследования генетических отношений, которое использует методы лексикостатистики, или «глоттохронологии», как она иногда называется. Здесь делается попытка не только представить отношения между членами данной семьи языков в форме родословного древа, но, кроме того, также датировать каждую из точек разветвления. Началом количественного подхода к установлению родства языков можно, по-видимому, считать работу Чека- новского (Czekanowsky, 1927), который пытался измерить степень близости родства индоевропейских языков на основе числа фонологических и морфологических признаков (из специально подобранного списка, включающего двадцать признаков), общих для рассматриваемой пары языков. Примерно на десять лет позже аналогичное исследование провели Крёбер и Кретьен (Kroeber and Chrétien, 1937), которые использовали расширенный список, содержавший семьдесят четыре признака. Их метод включал использование формул корреляции и таблиц с четырьмя клетками, из которых одна клетка содержит признаки, общие для данной пары языков, другая — признаки, присутствующие в первом языке, но отсутствующие во втором, и т. д. Результаты, полученные Крёбером и Кретьеном с помощью применения самых различных формул корреляции, оказались весьма сходными и в целом подтверждали общепринятое мнение о генетических отношениях между индоевропейскими языками. 216
Авторы сообщили, однако, что, по их сведениям, германская группа языков оказывается ближе к балто-славянской, чем к итало-кельтской, и что греческий язык более тесно связан с санскритом, армянским и иранским языками, чем с италийскими и другими языками группы centum. Позднее Эллегорд (Ellegard, 1959) показал (как это, впрочем, обнаружил до того и сам Кретьен — Chrétien, 1943), что большое число первоначальных оценок корреляции у Кретьена и Крёбера было статистически недостоверно. Эллегорд доказал, что во многих формулах Кретьена и Крёбера число признаков, присутствующих в обоих языках, и число признаков, отсутствующих в обоих языках, выступает в качестве симметричных переменных, что является потенциальным источником серьезных ошибок. Он предлагает формулу, в которую последняя из этих величин вообще не входит, и применяет ее к данным Росса (Ross, 1950) об индоевропейских корнях, а также к данным Крёбера и Кретьена. Несмотря на то что две серии результатов в основном соответствуют друг другу, Эллегорд все же находит расхождения, достаточные для того, чтобы утверждать, что никакая единая статистика не может оценить степени сходства между двумя языками в целом. Тем не менее он не отрицает возможности значительного прогресса в измерении сходства языков— при условии взаимно благоприятного развития лингвистической таксономии и статистических методов, разработанных в пределах некоторой заданной таксономической системы. Количественный подход к типологии языков разрабатывался Мензератом и Мейером-Эпплером (Menzerath and Meyer-Eppler, 1950), а также Гринбергом (Greenberg, 1954) — в обоих случаях на основе формальной структуры слов. Мензерат и Мейер-Эпплер предлагают следующие три критерия для классификации слов произвольного языка: число слогов в слове, число звуков в слове и формальный тип слова, определенный через допустимые сочетания гласных и согласных. После этого языки классифицируются с точки зрения распределения их словарного запаса по этим классам. Гринберг, основываясь на работе Сепира, развивает свою классификацию слов с точки зрения их морфологической структуры. Он вводит десять характеристик, отражающих относительную частоту 217
определенных типов морфем. Эти характеристики являются показателями тенденций к аналитическому или синтетическому строю, к агглютинации, к преимущественному использованию префиксов или суффиксов и т. д. Хотя разработка общей таксономии языков все еще остается делом будущего, очевидно, однако, что количественные методы,, аналогичные тем, о которых здесь идет речь, будут занимать в таких исследованиях очень видное место. Подсчеты «глубины лингвистического времени», которые производятся в лексикостатистике, разработанной Сводешом (Swadesh, 1950) и усовершенствованной Лизом (Lees, 1953), основаны на весьма специфическом аспекте сходства между языками: для каждой пары языков устанавливается множество корневых морфем, соответствующих тщательно разработанному списку понятий; после этого подсчитывается число случаев, когда соответствующие друг другу морфемы двух данных языков являются родственными (это устанавливается сравнительным методом); определяется процент таких случаев от общего числа слов в списке. На основе этой величины оценивается время, прошедшее от того момента, когда два языка начали развиваться независимо, до того периода, к которому относятся рассматриваемые языки. Подсчет производится по формуле i = logC / 2log r, где i — время (или «глубина времени»), обычно измеряемое в тысячелетиях, С— процент пар, составленных из родственных морфем, и r — коэффициент сохранения, то есть процент пар, сохраняющихся за единицу времени. Использование этой формулы основывается на ряде предварительных допущений (Lees, 1953). Первое из них состоит в том, что в каждом языке имеется множество основных корневых морфем, настолько устойчивое, что за такой большой период, как тысяча лет, лишь небольшая часть из них заменяется другими морфемами. Более того, предполагается, что некоторые из этих корневых морфем соответствуют универсальным понятиям, общим для всех языков; поэтому можно составить такой список понятий, что каждому из них в любом языке будет соответствовать корневая морфема. Иными словами, предполагается, что данный список может служить средством нахождения сравнимых между собой устойчивых словарных единиц различных языков. Второе допущение состоит в том, что скорость «отмирания морфем», то есть постепенной замены 218
элементов этого исходного списка, остается неизменной в различные периоды и в различных языках. Наконец, последнее допущение состоит в том, что рассматриваемые языки все это время развивались совершенно независимо друг от друга. Впрочем, Сводеш (Swadesh, 1955) попытался изменить формулу (по крайней мере символически) таким образом, чтобы она отражала различные степени взаимного влияния между языками. Для этого он ввел в формулу «фактор разделения» s. Коэффициент сохранения r в формуле «глубины времени» был определен на материале индоевропейских языков, поскольку в этой семье языков время разделения языков во многих случаях известно довольно точно. Лиз подсчитал величину r для тринадцати пар индоевропейских языков, используя первый список Сводеша, состоящий примерно из двухсот понятий; он получил для r значение, равное примерно 80% на тысячелетие. Сводеш (Swаdesh, 1955), который применял свою формулу для решения проблемы генетического родства языков американских индейцев, отнесся к результатам Лиза несколько критически, так же, как, впрочем, и к своим собственным результатам более ранних лет. В частности, он подчеркивает, что при установлении коэффициента сохранения необходима более тщательная общая проверка результатов, чем та, которую удалось обеспечить Лизу; он считает необходимым дальнейшее усовершенствование контрольного списка, который он доводит в этой работе до ста единиц. Сводеш выражает большие надежды на то, что, несмотря на все несовершенства лексикостатистики в ее современном состоянии, она будет в дальнейшем широко развиваться и превратится в «инструмент точного исследования» в сравнительно-историческом языкознании. Критика лексикостатистического метода, представленного работами Сводеша и Лиза, шла по нескольким различным направлениям. Хойер (Hoijer, 1956) заявил, что список понятий, пригодный для всех языков, составить, невозможно, поскольку универсальным понятиям в языке может соответствовать более чем одно слово. В подтверждение он приводит ряд примеров из языка навахо, показывая, что во всех случаях, когда имеется неоднозначное соответствие, мы можем в зависимости от того, как сделан выбор, констатировать либо сохранение, либо утрату 219
морфемы и таким образом прийти к ошибочным заключениям. Крёбер (Kroeber, 1955) особенно критически относится к вычислениям «глубины времени» как к свидетельству генетической близости в тех случаях, когда общая часть в словаре двух языков составляет менее чем 10%, поскольку в этих случаях заимствования и случайные сходства лишь в небольшом числе слов могут очень существенно изменить все результаты. По этой причине он считает, что лексикостатистику целесообразнее применять для изучения заведомо родственных языков, чем для обнаружения отдаленного родства. Одной из наиболее интересных работ в лексикостатистике, содержащих как критику, так и собственные исследования, является работа Арндта (Arndt, 1959) о германских языках. Арндт ставит перед собой сразу две цели: проверить пригодность методов лексикостатистики, а затем использовать эти методы для проверки нестатистических теорий, характеризующих исторические отношения между различными германскими языками. Его результаты во второй части довольно убедительно свидетельствуют против традиционного деления германских языков на три группы и дают основания для разделения германских языков на восточногерманские, северогерманские, германские языки Северного моря и языки внутренней части материка. Несмотря на кажущуюся пригодность лексикостатистических методов для решения такого рода теоретических вопросов, Арндт находит достаточно свидетельств их несовершенства. Один из его главных аргументов состоит в том, что применение формулы Сводеша к современным языкам регулярно дает меньшую глубину времени, чем для соответствующих пар древних языков, причем исторически наиболее правдоподобные хронологические оценки получаются для наиболее древних языков. Он видит в этом свидетельство сильного взаимного влияния и конвергенции различных языков более позднего периода и поэтому считает, что всякое усреднение расходящихся друг с другом результатов должно быть отвергнуто (аналогичные наблюдения сделал Ри (R е а, 1958), который применял лексикостатистический метод к романским языкам и получил для момента разделения датировку от 800 до 1600 г. н. э. вместо действительной даты около 100 г. н.э.). В заключение своей работы Арндт поднимает ряд вопросов, касаю- 220
щихся использования контрольного списка, возможных колебаний коэффициента сохранения и возможного влияния возрастающей грамотности на стабильность словаря. Существование столь многих источников потенциальных ошибок делает, с его тачки зрения, весьма сомнительной достоверность глоттохронологических выводов в отношении тех языковых групп, для которых мы располагаем более ограниченными историческими и лингвистическими данными, чем в индоевропеистике. Глисон (Gleason, 1959) предложил расширить понятие лексикостатистики, включив в него неглоттохронологические методы определения наиболее вероятных генетических отношений между членами языковых семей. Два предлагаемых им метода свободны от спорных допущений, о которых мы упоминали выше, поскольку они не претендуют на установление хронологии и не требуют обязательного использования списка, включающего только универсальные понятия. Первый метод, метод «противопоказаний», состоит в подсчете числа тех случаев, когда слова, соответствующие данному понятию, не являются родственными в данной паре языков, но для каждого из этих слов имеется родственное слово хотя бы в одном из языков данной группы. Главное допущение, лежащее в основе этого подхода, состоит в том, что всякое нарушение преемственности поведения (например, переход от одного слова к другому для обозначения одного и того же понятия) представляет собой исключительное явление и, таким образом, наиболее вероятной следует считать такую структуру родословного древа, в которой противопоказания минимальны. Второй метод Глисона, использующий так называемый характеристический словарный индекс, основан на применении таблицы с двумя входами, где заглавиями как столбцов, так и строк являются названия языков изучаемой группы. Каждому множеству родственных слов, найденному для данного понятия (из некоторого списка), присваивается значение единица. Если слово является родственным в трех языках, то в каждую из клеток, определяемых пересечением соответствующих столбцов и строк, ставится число 1/3; если данное слово является общим для семи языков, то в каждую из клеток ставится цифра 1/7 и т. д. После того как процесс закончен, относительная величина сумм, содержащихся в каждой клетке, рас- 221
сматривается как мера родства соответствующей пары языков. Методы Глисона, которые можно использовать для проверки результатов, полученных при глоттохронологическом подходе, помимо того, что они привлекают своей непосредственностью, обладают тем дополнительным достоинством, что основную часть работы по подсчету и вычислению может производить человек, не имеющий никакого лингвистического образования, поскольку вся процедура здесь чисто механическая и вполне может быть запрограммирована для вычислительной машины. Тем самым весь процесс может быть значительно ускорен, что избавляет лингвиста от большей части утомительной черновой работы, давая ему возможность сосредоточиться на более поздних этапах процесса, которые требуют лингвистических знаний и интуиции. Очень удачным оказалось то обстоятельство, что исследования по лексикостатистике, получившие широкое распространение, привлекли к себе внимание не только ученых, стремящихся к получению новых результатов, но и проницательных критиков. Использование вычислительных машин для выполнения громоздких операций по обработке данных будет иметь двойной эффект: с одной стороны, это освободит лингвистов для интенсивной работы над собственно лингвистическими проблемами, а с другой стороны, перспектива широких контрольных подсчетов (которые являются необходимой предпосылкой для точной оценки полученных результатов) станет менее устрашающей, чем прежде. 3. СТРУКТУРНЫЕ МОДЕЛИ ЯЗЫКА Теоретико-множественные модели. За последние несколько лет предложен также ряд структурных моделей описания и анализа языковых явлений. Беглый просмотр соответствующей литературы убеждает нас в том, что ученые основываются в большинстве случаев на современной алгебре и математической логике. Заимствуются не только понятия и методы анализа; во многих случаях все металингвистическое описание строго следует образцу дедуктивных математических систем20. Описание не- 20 Некоторые ученые только такие работы и относят к математической лингвистике, исключая из нее те, где математические 222
скольких исследований, содержащих применение теории множеств и родственных областей математической логики, поможет нам осветить характер достижений, имеющихся в этой области. Харари и Пейпер (Harary and Paper, 1957) в своей статье описывают применение теории отношений для построения строгой математической схемы описания дистрибуции фонем. Авторы исходят из множества Ρ всех фонем языка и из отношения «непосредственно предшествовать» R; затем они описывают дистрибуцию данной фонемы на основе шести свойств отношений, в число которых входит рефлексивность, симметричность и транзитивность. В рамках этой системы типичное утверждение о дистрибуции фонем имеет следующую форму: «фонема x симметрична фонеме y»; это означает, что в рассматриваемом языке встречается как последовательность /xy/, так и /ух/. После этого на основную алгебраическую структуру модели накладываются дополнительные количественные характеристики: вводится множество простых числовых индексов, которые определяются процентом числа случаев, при которых дистрибуция фонемы обладает данным реляционным свойством21. Индексы, представленные в этой работе, очень напоминают те индексы, которые использовал в своих типологических исследованиях морфологии Гринберг (Greenberg, 1954); Харари и Пейпер и сами предполагают, что их модель может быть использована для типологического исследования дистрибуции фонем. Каковы бы ни были успехи этого направления исследований в будущем, утверждение авторов о том, что их модель сделала понятие «свободы дистрибуции» более точным, достаточно хорошо подтверждается их собственными примерами. Спорным является только вопрос о том, в какой мере возможно распространение этой модели на п-местные последовательности без утраты простоты и ясности, свойственных данному варианту. Ряд алгебраических и логических представлений фонологических систем был предложен Унгехойером (Ungeметоды играют более вспомогательную роль; ср. например, Koschmieder, 1956. 21 Это иллюстрация того, что различение количественных и структурных моделей не есть дихотомическое деление; одна модель может иметь как структурные, так и количественные характеристики. 223
heuer, 1959a) в его исследовании логических оснований теории различительных признаков Якобсона. Унгехойер рассматривает различительный признак как класс с заданным дополнением; с другой стороны, он представляет различительный признак как переменную, принимающую два значения; на множестве таких переменных задаются булевы функции22. С помощью этих моделей он оказывается в состоянии выразить различие между «естественной» избыточностью звуковой системы и избыточностью формальной системы, возникающей в результате анализа, при котором некоторые признаки обычно объявляются иррелевантными. Второй подход, описанный Унгехойером, учитывает некоторые психологические соображения; здесь значимым признается лишь наличие положительного значения признака. Продолжая идти по этому пути, он описывает «пространство» всех возможных фонем в теоретико-множественных терминах — как множество N всех подмножеств множества различительных признаков. Он утверждает, что множество N может быть описано математически различными способами — например, как булева алгебра, где признаки играют роль образующих. Унгехойер делает, впрочем, вполне уместное предупреждение о том, что в этих моделях не следует «читать» слишком многое: любое применение высокоразвитой математической теории требует более полного понимания сути описываемых явлений. Построение грамматик для машинного перевода, основанных на теоретико-множественных понятиях, описывается в недавней работе Кулагиной (Кулагина, 1958). Неопределяемые понятия, такие, как «слово», отмеченная фраза, играют в формальных построениях Кулагиной роль аксиом. На этом фундаменте воздвигается иерархия грамматических классов — она получается в результате точно определенной последовательности делений исходного множества на непересекающиеся подмножества. На самом низком уровне — на уровне разделения слов на «семейства» — члены данного подмножества могут подставляться один вместо другого в предложение, не меняя его грамматической правильности. Переходя постепенно к более высоким уровням, Кулагина вводит формальный аппарат, который достаточен для 22 Булевы функции упоминаются в этой связи также у Белевича (Belevitch, 1956). 224
анализа некоторых простых грамматических понятий французского языка; Кулагина утверждает при этом, что для русского языка эта система недостаточна — в частности из-за того, что в любом падеже существительные образуют три различных семейства в единственном числе и только одно во множественном. Предложенная модель имеет ряд ограничений также в других отношениях; в частности, в системе взаимно исключающих друг друга грамматических категорий не предусматривается тех случаев, при которых одна и та же форма может принадлежать к более чем одной части речи — а такую возможность, разумеется, нельзя игнорировать в машинном переводе. Прежде чем переходить к синтаксическим моделям, уместно, по-видимому, упомянуть об усилиях, затраченных на построение «исчисления неколичественных функций» лингвистами глоссематической школы; это исчисление представляет собой, по замыслу, новую алгебру, предназначенную для описания явлений, тесно связанных с человеком, таких, как язык. Алгебра глоссематиков, так, как она представлена Ульдаллем (Hjelmslev and Uldall, 1957), во многом использует терминологию и символику логической теории множеств, с той особенностью, что некоторые вполне обычные понятия — такие, как функция или отрицание,— определяются совершенно необычным образом. Более того, как указывал один из критиков (Ungeheuer, 1959 b), терминология глоссематики не всегда используется последовательно самими Ельмслевом и Ульдаллем, видимо, вследствие смешения понятий, которые в формальной логике обычно трактуются как различные. Из анализа того, что написано глоссематиками к настоящему времени, следует, по всей вероятности, что их алгебра сильно выиграет от перехода на обычную систему логических понятий. Модели синтеза предложения и описания синтаксической структуры. Вся остальная часть разд. 3 будет посвящена рассмотрению синтаксических моделей. Прежде всего мы рассмотрим описание синтаксической структуры и синтез предложения, а после этого перейдем к моделям, предназначенным для синтаксического анализа. Хотя исследования, которые описываются в этой второй части, 15 -2238 225
значительно отличаются друг от друга по своим масштабам и общей направленности, все они подчинены одному и тому же замыслу — построить систематическую механическую процедуру синтаксического анализа текстов, прежде всего в связи с машинным переводом. Первая группа в этом отношении менее однородна; тем не менее модель Ингве для порождения предложений (Yngve, 1960) будет рассматриваться вместе с описательными по своему характеру моделями Хэрриса (Harris, 1957) и Хомского (Chomsky, 1957), поскольку все эти модели, без сомнения, имеют между собой много общего. Классификация грамматик, произведенная Хомским, согласно которой все грамматики делятся на три типа — грамматики с конечным числом состояний, грамматики непосредственно составляющих и трансформационные грамматики,— представляет для нас удобную схему изложения, хотя центр внимания здесь будет несколько иным. Грамматика с конечным числом состояний (Chomsky, 1957) может быть охарактеризована как устройство с конечным числом внутренних состояний, которое порождает23 предложения языка следующим образом: от начального состояния устройство переходит во второе состояние, «производя» первое слово предложения; затем, производя по слову при каждом новом переходе, устройство переходит от одного состояния к другому, пока не достигнет конечного состояния. За это время оно порождает законченное предложение. Такое устройство является особым видом марковского процесса с конечным числом состояний, и поэтому оно может быть представлено, как обычно представляют такие процессы,— «диаграммой состояний», в которой каждое состояние обозначается точкой или маленьким кружочком, а каждый дозволенный переход — стрелкой, связываю- 23 Хомский (Chomsky, 1959) моделирует свойства различных типов грамматик, основываясь на терминологии теории автоматов: с каждой грамматикой ассоциируется тип автомата, достаточно сильный для того, чтобы порождать предложения в соответствии с правилами этой грамматики. Лиз (Lees, 1959) заметил, что грамматики Хомского «порождают» предложение лишь в очень специфическом смысле, а именно, они дают правила, достаточные для построения всех предложений языка. Такие грамматики имеют своей целью прежде всего компактное описание синтаксиса и не совпадают с программой порождения предложений, предназначенной для вычислительной машины. 226
щей соответствующие точки. Диаграммы такого типа, обычно дополненные указанием вероятности каждого перехода, часто используются в теории информации для моделирования статистических свойств источника с конечным алфавитом символов24. В одной из своих ранних статей по машинному переводу Ингве (Yngνе, 1955) предлагает использовать диаграммы состояний как возможное средство сжатия грамматики — средство, достаточно сильное для того, чтобы предложения целиком могли помещаться в память вычислительной машины. Как первый шаг в достижении этого сжатия предлагается связать переход от одного состояния к другому не со словом, а с частью речи. Дальнейшее упрощение может быть достигнуто за счет объединения отдельных путей в типовые синтаксические группы, далее, в типы простых предложений и, наконец, в типы фраз. Последние уровни этих многоступенчатых грамматик с конечным числом состояний до конца не разработаны, поэтому об их возможностях пока судить трудно. Хомский (Сhоmskу, 1956, 1957) показал, однако, что грамматики с конечным числом состояний по самому своему существу неспособны отразить свойства некоторых конструкций английского языка, где возможна бесконечная рекурсия. Такие чисто теоретические аргументы, разумеется, не исключают возможности построения грамматики с конечным числом состояний для довольно сложных предложений, с которыми приходится иметь дело при машинном переводе; тем не менее это достаточно убедительное свидетельство того, что такая грамматика будет недопустимо сложной. Вторая грамматическая модель, рассмотренная Хомским,—это модель структуры составляющих или грамматика непосредственно составляющих. В различных своих формах эта модель использовалась американскими лингвистами в течение достаточно длительного периода25. Хомский формализовал эту теорию, определив грамматику непосредственно составляющих как операционную сис- 24 Ср. Shannon and Weaver, 1949, стр. 15 и далее; ср. также параграф «Теоретико-информационные модели» в разд. 2 настоящей работы. 25 Наиболее известной является работа Уэллса (Wells, 1947), который попытался объединить и систематизировать результаты, имеющиеся в этой области. 15* 227
тему (Σ, Γ), состоящую из конечного множества Σ начальных цепочек и конечного множества F правил, определяющих структуру составляющих; правила имеют простую форму X-+Y. Правила из Γ применяются к цепочкам по одному и производят новые цепочки; каждое правило определяет замену одного символа одним или несколькими другими символами. Во всех интересных случаях повторное применение правил развертывания, начиная с одной из начальных цепочек, дает такую последовательность цепочек, что к самой последней из них правила из Γ уже неприменимы. Такие неизменяемые цепочки, называемые терминальными, являются предложениями языка, описываемого (Σ, ^-грамматикой. Последовательность цепочек, полученная в ходе порождения предложения, определяет структуру составляющих этого предложения, которая может быть представлена диаграммой вида дерева. Грамматики непосредственно составляющих, как показал Хомский, лишены тех недостатков, которые в первую очередь бросаются в глаза при рассмотрении грамматик с конечным числом состояний: такие грамматики способны отразить рекурсивные свойства естественных языков — для этого достаточно включить в Γ рекурсивные правила. Хомский показал, однако, что в английском языке имеются типы конструкций — в частности, конструкции с прерванными составляющими,— для которых модель непосредственно составляющих в лучшем случае даст громоздкое описание. Считая на этом основании, что на уровне составляющих никакой приемлемой модели построить нельзя, Хомский (Chomsky, 1957, сноска 6, стр. 41—42) предлагает в качестве пути преодоления этих трудностей новый, более высокий уровень описания — уровень грамматических трансформаций. Однако прежде чем перейти к обсуждению трансформаций, рассмотрим модель автоматического синтеза предложения, построенную преимущественно на аппарате грамматики непосредственно составляющих. Некоторые из последних работ Ингве посвящены исследованию моделей устройства предложения, которые можно было бы использовать в качестве составной части программы синтеза при машинном переводе. Поскольку подход Ингве ориентирован на машинное использование модели, то в основе его лежит требование о том, что уст- 228
устройство, порождающее предложения, должно иметь конечную оперативную память. Используя грамматику ненепосредственно составляющих, описанную выше26, механизм порождает предложение слева направо, причем правила подстановки всегда применяются сначала к более левому символу в цепочке, чем к тому, который правее его; таким образом производится вся терминальная цепочка. Промежуточные результаты хранятся в оперативной памяти, где ввод и считывание возможны всегда только с одного конца, в соответствии с правилом о порядке развертывания символов. Этот тип устройства памяти, описанный в литературе как магазинная память (pushdown store), как было показано Эттингером (Оеttinger, 1960b), имеет важные применения в автоматическом синтаксическом анализе; некоторые из этих применений будут рассмотрены ниже27. Один из интересных аспектов модели Ингве состоит в том, что предложение порождается вместе с эксплицитным описанием его разложения на составляющие. Это описание построено по принципу бесскобочной символики Лукасевича (Lukasiewicz, 1957): за каждым узлом дерева составляющих непосредственно следуют узлы, которые от него ответвляются. В ходе обсуждения адекватности этой модели Ингве показал непосредственную связь между структурой дерева предложения и объемом оперативной памяти, который необходим для ее порождения. На основе нумерации ветвей, отходящих от одного узла (нумерация производится справа налево), он определяет «глубину» каждого из конечных (тупиковых) узлов: это сумма чисел, сопоставленных ветвям, которые ведут к этому узлу. Максимальная из длин конечных узлов называется глубиной предложения. Оказывается, что это как раз число «единиц объема» оперативной памяти, необходимое для порождения данного предложения. Ингве показал, что глубина предложения зависит от направления ветвей в соответствующем ему дереве. Предложения, у которых деревья ветвятся преимущественно влево, имеют относительно большую глубину; те, у кото- 26 Ингве предложил также принципиально несложную схему включения в порождающее устройство правил типа А-+В-{-... + С, которые позволяют производить некоторые конструкции с прерванными составляющими. 27 Ср. описание предсказательного анализа в разд. 3. 229
рых деревья ветвятся в основном вправо,— относительно малую. Эти два типа структур Ингве назвал соответственно регрессивным и прогрессивным. Из наблюдения над явлениями, связанными с глубиной предложений английского языка, Ингве заключает, что в английском языке существуют верхний предел глубины предложения, и это довольно точно согласуется с данными Миллера (Miller, 1956) о приблизительном объеме непосредственной памяти у человека. Ингве указывает, кроме того, что в английском языке существуют многочисленные средства уменьшения глубины предложений при сохранении выразительных возможностей языка; к таким средствам относятся прерванные конструкции, вводное употребление it и т. д. Многие ненужные на первый взгляд сложности грамматики, как он утверждает, оказываются вполне целесообразными, так как использование разных конструкций в одном и том же значении является одним из средств ограничения глубины. Ингве обобщил свои наблюдения над английским языком в форме гипотезы о том, что различные языки будут вести себя по отношению к глубине одинаковым образом. Эта гипотеза, несомненно, имеет значение не только для лингвистики, но и для психологии. Если проверка гипотезы Ингве на других языках даст положительные результаты, то этот механизм порождения предложений нужно будет принять в качестве модели порождения речи человеком — независимо от того, какова окажется роль этого механизма в машинном переводе. Возвращаясь теперь к грамматическим трансформациям (это понятие было формализовано Хэррисом — Harris, 1952 — в связи с его работой по анализу текста), мы рассмотрим самые последние описания трансформационного анализа в работе Хэрриса (Harris, 1957) и Хомского (Chomsky, 1956, 1957). Хотя в работах Хэрриса и Хомского, как они сами указывают, имеется большее число общих идей, исследования этих ученых развиваются сейчас в резко различных направлениях. Хэррис описывает грамматические трансформации через совместную встречаемость различных классов морфем в разных предложениях. Он вводит трансформацию как средство соотнесения друг с другом различных конструкций с одинаковыми классами совместной встречаемости. После того как введен уровень трансформаций, нет оснований рассматривать 230
вать все типы предложений независимо друг от друга: предложения, в которых дистрибуция контекстных классов такая же, что и в ранее рассмотренных предложениях, может считаться результатом трансформации последнего. Далее, сложные предложения и некоторые последовательности предложений часто должны рассматриваться как результат соединения одного предложения с результатом трансформации другого предложения. Развивая более формальную часть своей грамматической теории трансформаций, Хомский и Хэррис сходятся на том, что в языке имеется так называемое ядро. Ядро состоит из элементарных предложений, из которых с помощью трансформаций получаются все остальные предложения языка. В трансформационной грамматике Хомского к ядру относятся простые предложения в утвердительной форме, не содержащие пассивных конструкций, то есть предложения, которые могут быть порождены с помощью грамматики непосредственно составляющих. Трансформационная часть грамматики, которая составляет уровень, независимый от уровня непосредственно составляющих, содержит правила, превращающие цепочку с некоторой заданной структурой составляющих в цепочку с другой структурой составляющих. Эти правила трансформаций в результате применения их к простым предложениям из ядра способны породить все оставшиеся предложения языка. Хомский подчеркивает, что трансформационные грамматики по своей природе являются более сильным средством порождения предложений, чем грамматики непосредственно составляющих,— не только ввиду упрощения, связанного с различением двух уровней в синтаксическом описании28, но и вследствие фундаментального различия этих уровней: символы данной цепочки содержат всю информацию, необходимую для определения того, какие из правил грамматики непосредственно составляющих могут быть к ней применены; между тем, для определения применимости трансформации к данной цепочке может потребоваться информация о предыдущих этапах вывода этой цепочки, например информация о том, принадлежит ли эта цепочка к типу NP (именная группа) 28 Помимо двух синтаксических уровней, трансформационная грамматика Хомского включает третий уровень, состоящий из правил морфонемики, превращающих цепочки слов в цепочки фонем. 231
и может ли она подвергаться трансформациям, которые являются законными для именных групп29. Как утверждает Хомский, трансформационные грамматики не только дают более простой и более мощный аппарат описания синтаксиса естественных языков, но обладают и другими достоинствами. К таким достоинствам относится, например, то, что двусмысленность выражений типа the shooting of hunters («стрельба охотников» или «расстрел охотников») получает в трансформационной грамматике простое объяснение: данная конструкция является результатом трансформации двух различных ядерных предложений; в одном hunters является подлежащим, во втором — дополнением. Уорс (Wоrth, 1958) попытался недавно использовать это свойство трансформаций для классификации конструкций с творительным падежом в русском языке. В заключение своего исследования Уорс выдвигает общий тезис о том, что трансформационный аппарат может не только оказаться полезным для установления более тонкой классификации конструкций, но и послужить удобной схемой проверки обязательности того или иного типа определения. Работа Уорса в силу своей чрезвычайно узкой направленности не может еще служить доказательством возможности построения полных трансформационных грамматик естественных языков. Успешность этой работы показывает, однако, что время для широкомасштабной проверки модели Хомского уже назрело. Как указывает Лиз (Lees, 1957), оценка модели Хомского в конечном счете должна определяться тем, каковы будут результаты ее применения к естественным языкам. Модели синтаксического анализа. Как известно, искусственно построенные системы обозначений в логике и в математике обладают регулярностью и простотой синтаксического построения, отсутствующей в естественном языке. Как подчеркивает Ингве (Yngνе, 1960), синтаксическая система естественного языка может содержать 29 Выходами порождающего устройства Ингве являются цепочки, содержащие именно эту информацию, в связи с чем выходы устройства Ингве как раз могут быть входами устройства, совершающего трансформационные операции по грамматике Хомского. 232
большое количество различных средств для выражения одного и того же грамматического отношения (например, отношения подчинения), тогда как характерным свойством формально-логических языков является то, что они, как правило, пользуются в таких случаях каким-то единообразным способом. Несмотря на огромные различия по степени сложности, между синтаксическими системами естественных и логических языков существует немалое сходство, и это позволяет утверждать, что логические языки моделируют свойства естественных языков, притом нетривиальным образом. Эта тесная связь между естественными и логическими языками имеет большое значение для разработки автоматических методов синтаксического анализа языка в связи с машинным переводом. Главное понятие в синтаксической теории формальнологических языков — понятие правильно построенной формулы — тесно связано с понятием грамматической правильности, обычно используемым в применении к конструкциям и предложениям естественного языка. Правильно построенными формулами, а также грамматически правильными предложениями являются такие выражения, которые построены в соответствии с правилами; при этом ясно, что большое практическое значение имеет существование надежных средств различения правильно построенных последовательностей и неправильно построенных, или неграмматических, последовательностей, так как в противном случае язык теряет свою ценность как средство сообщения информации. В работе по автоматическому переводу проверка правильной построенности имеет первостепенное значение — она служит средством определения границ конструкции, которая является частью другой конструкции, а также ценным способом проверки правильности общего анализа предложения. По всем этим соображениям некоторые из ранних работ по машинному переводу содержали попытки построения синтаксических исчислений, которые могли бы использоваться как основа машинных операций для проверки грамматической правильности. Типичная в этом отношении работа Бар-Хиллела (BаrНillеl, 1953), основанная на некоторых идеях логики Айдукевича (Ajdukiewiсz, 1935), беспристрастно характеризует все те усилия, которые были предприняты в этом направлении. Бар-Хиллел исходит из двух элементарных символов s и η (первые буквы английских слов 233
sentence «предложение» и noun «имя существительное») и строит систему грамматических обозначений, которые позволяют затем использовать для проверки грамматической правильности очень простую операцию, похожую на арифметическую операцию сокращения дробей. Глаголам, которые сочетаются с существительным и дают в результате предложение, приписывается символ s/n. Например, последовательность, состоящая из имени существительного, за которым идет глагол, будет проанализирована как предложение, поскольку п, соответствующее имени существительному, сократится с п в «знаменателе» обозначения, соответствующего глаголу, и останется только символ s. Бар-Хиллел определяет цепочку грамматических символов как «синтаксически связную», если существует такая последовательность операций сокращения, которая сводит всю цепочку к одному элементарному символу. Синтаксически связные цепочки представляют собой грамматически правильные предложения или правильно построенные части предложений. Как разъясняет сам Бар-Хиллел, его модель страдает несколькими недостатками; в частности, первоначальная цепочка символов, обозначающих классы, может быть приписана фразе несколькими различными способами, в зависимости от того, как мы представим комбинацию элементов предложения друг с другом. Дальнейшие трудности (аналогичные тем, на которые наталкивается грамматика непосредственно составляющих в связи с прерванными составляющими) обусловлены тем, что сокращаться могут только символы, расположенные в цепочке непосредственно рядом. Ламбек (Lambek, 1958), построивший синтаксическую модель, аналогичную модели Бар-Хиллела, предложил следующий способ преодоления первой из указанных трудностей: вначале в рассматриваемом предложении всеми возможными способами расставляются скобки; затем слову приписываются все возможные грамматические индексы; после этого вычисляется тип результирующего выражения — в соответствии с той группировкой элементов, которая указана скобками. Существование конечной процедуры такого рода может удовлетворить чистого математика или логика, который скажет, что проблема таким образом решена. Однако «решения» такого характера являются слишком сложными и общими по своей природе и не дают эффектив- 234
эффективных операций, которые могли бы практически использоваться в машинном переводе. В противоположность теоретическим исследованиям синтаксических исчислений, работы, описывающие практические попытки решения проблем автоматического синтаксического анализа, начали появляться лишь недавно. Несколько групп машинного перевода объявили об успехе, достигнутом в распознавании синтаксических конструкций, меньших, чем предложение,— таких, как предложные или именные группы; обнаружение конструкции происходит обычно в результате поиска в ограниченном контексте. Подобного рода «микросинтаксические» методы синтаксического анализа обладают, однако, по крайней мере двумя недостатками. Первый состоит в том, что группировки, полученные в результате такого анализа, часто оказываются неправильными из-за ограничений после высокого уровня, природа которых не может быть установлена в результате такого просмотра предложения. Второй недостаток заключается в том, что методы микросинтаксического анализа не дают в ходе своего естественного развития никакого сколько-нибудь плодотворного подхода к анализу предложения в целом: ни увеличение просматриваемого контекста, ни простое повторение процесса не могут привести к решению проблемы. Некоторые из лиц, занимающихся машинным переводом, осознав, что микросинтаксический подход в каком- то смысле заводит в тупик, попытались найти более эффективную процедуру анализа предложения. Эти ученые разрабатывают сейчас двухступенчатую систему анализа, в которой «макросинтаксические» операции (применяемые к предложению, уже обработанному «микросинтаксичес- ки») определяют более общие характеристики структуры предложения и исправляют ошибки, сделанные на более низком уровне анализа. Более желательной, с точки зрения как красоты, так и экономичности, была бы, однако, единая схема, охватывающая весь синтаксический анализ. Система предсказательного анализа, первоначально предложенная Родес (Rhodes, 1959 а, b) из Национального бюро стандартов, и усовершенствованная Шерри (Shеrrу, 1960), Эттингером (Оеttinger, 1960b) и другими исследователями в Гарвардском университете30, по-ви- 30 Воssert, 1960 и Bossert, Giuliano and Grant, 1960. 235
димому, не только удовлетворяет этому требованию, но обладает также и другими важными положительными качествами. Поскольку детальное описание механики предсказательного анализа можно найти в указанной литературе, мы упомянем здесь лишь две характеристики этого процесса. Очевидно, наиболее важное, с точки зрения машинной реализации, свойство предсказательного анализа состоит в том, что элементы предложения просматриваются здесь один за другим по очереди слева направо по одному разу. Для каждого слова в предложении необходимо определить, соответствует ли оно списку «предсказаний», который хранится в оперативной памяти. Предсказания — это, по существу, информация о различных синтаксических единицах всех структурных уровней, которые можно ожидать в данном положении. Некоторые предсказания, например предсказания о подлежащем и сказуемом, хранятся в оперативной памяти к началу анализа любого предложения. Остальные определяются в процессе анализа, в соответствии с синтаксической функцией, приписанной ранее пройденным словам. Оперативная память, содержащая список предсказаний, работает по принципу «последний внутрь — первый наружу», как и магазинная память, так что предсказания, добавленные непосредственно предшествующим словом, всегда будут проверяться первыми. Слову приписывается синтаксическая функция, определяемая первым из предсказаний, которым это слово может соответствовать. Например, личная форма глагола может быть главной частью сказуемого, и ей в качестве синтаксической функции будет приписано: «главная часть сказуемого»; после этого предсказание «главная часть сказуемого» будет снято из списка предсказаний, а взамен в список будет вставлено предсказание «объект» — в том падеже, которого требует данный глагол. Такой способ анализа, использующий все преимущества магазинной памяти, как оказалось, особенно хорош в случае «самовставленных» конструкций с прерванными составляющими. Рассмотренная система имеет две возможности самопроверки. Прежде всего на особой ленте записываются все случаи, когда слово может удовлетворять более чем одному предсказанию. Поскольку в этих случаях слову 236
приписывается только одна синтаксическая функция, то всегда имеется некоторая вероятность неправильного выбора. Наличие такой записи дает возможность пересмотреть информацию, если на более поздней стадии анализа будет обнаружено противоречие. Второй путь самопроверки: если данное слово не удовлетворяет ни одному из предсказаний, то это значит, что нарушена «синтаксическая связность» предложения — либо в результате неправильного анализа, либо из-за неправильности начальной информации, обусловленной, например, типографскими ошибками. Экспериментальная проверка алгоритмов синтаксического анализа, составленных Эттингером и его сотрудниками для русского и английского языков, показывает, что предсказательный анализ является многообещающим аналитическим инструментом для самых разнообразных синтаксических систем естественных языков. Работа над русским языком доведена до такого уровня, что для большинства предложений научного текста правильный анализ получается уже после первого просмотра. Одна из главных особенностей этой системы состоит в том, что, несмотря на одновременный анализ явлений, принадлежащих разным уровням, ошибки на верхнем уровне, каковы бы ни были их источники, как правило, не препятствуют получению правильного результата на более низких уровнях. Так, даже если предложение в целом будет проанализировано неверно, его правильно построенные части, такие, как предложные группы, тем не менее часто получают правильное истолкование. Последнее свойство предсказательного анализа может оказаться очень ценным при создании автоматических программирующих систем, которые осуществляют перевод с символического языка алгоритма на язык машинных операций. Если в такой системе будут использоваться приемы предсказательного, анализа, то в случае обнаружения первой ошибки программирующее устройство может не останавливаться, как это происходит обычно, а продолжать свою работу дальше, поскольку можно рассчитывать на то, что по крайней мере отдельные части алгоритма будут запрограммированы правильно. Эттингер сформулировал это свойство предсказательного анализа в виде «теоремы Aw», которая доказана им (Оеttinger, 1960) с полной строгостью для ряда алгорит- 237
алгоритмов предсказательного перевода в формальных языках31. Последняя работа Шерри и Эттингера (Sherry and Oettinger, 1960) также посвящена изучению соотношения между естественными и искусственными языками; авторы создают новый формальный язык, моделирующий поведение естественного языка, подвергнутого предсказательному синтаксическому анализу. Определив последовательность абстрактных моделей, каждая из которых отражает большее число свойств естественного языка, чем предшествующая, авторы дают описание предсказательного анализа шаг за шагом, причем из этого описания вырисовываются не только его возможности в настоящее время, но и области, в которых этот анализ должен быть улучшен в ближайшем будущем. 4. ПРИКЛАДНАЯ МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА Как неоднократно указывалось ранее, некоторые модели и методы математической лингвистики имеют важное практическое применение за пределами самой лингвистики. Статистические методы анализа языка, например, с давних пор играют важную роль в криптографии и криптоанализе. Однако в силу атмосферы секретности, которая по понятным причинам окружает все достижения в этой области, лингвисты не могут извлечь из этих достижений обратную выгоду для себя. Такая ситуация, разумеется, весьма неблагоприятна, в особенности если учесть, какие усилия затрачиваются лингвистами на дешифровку древних письменных памятников — область, в которой опыт, накопленный при дешифровке секретных документов, по-видимому, весьма значительно способствовал бы более быстрому прогрессу. В течение последних десятилетий коммерческая доступность разного рода систем обработки данных, с одной стороны, и постоянное увеличение объема публикуемой литературы, в особенности технической,— с другой, явились двойным стимулом развития автоматических систем 31 Вундхейлер и Вундхейлер (Wundhеilеr and Wundheiler, 1955) утверждали в свое время, что перевод с «фронтальных» языков (вроде бесконечной символики Лукасевича) возможен с помощью одного лишь словаря. Работа Эттингера подтвердила это экспериментально. 238
поиска и переработки информации32, которые используются в библиотеках, государственных учреждениях, в промышленности и в частных заведениях. Многое из аппарата математической лингвистики, включая не только технику построения искусственных языков, моделирующих естественный, но и статистическое описание языка, все шире и шире используется в этой области. Так, например, замечено поразительное родство между некоторыми проблемами реферирования литературы так, как они были поставлены Луном (Luhn, 1958), и проблемами статистического изучения литературного словаря33. Ввиду указанных связей дальнейшие достижения в области переработки информации будут представлять непосредственный интерес для лингвистов. Однако следует сказать, что практической областью, где математическая лингвистика применяется наиболее интенсивно, несомненно, является машинный перевод. Мы не пытаемся здесь обозреть всю ту огромную литературу, которая имеется по данному вопросу34. О влиянии машинного перевода на математическую лингвистику можно судить уже по тем многочисленным ссылкам на работы по машинному переводу, которые приводились нами в разд. 3. Помимо обогащения лингвистической теории, которое является побочным продуктом таких достижений машинного перевода, как предсказательный анализ или гипотеза Ингве35, работа в области машинного перевода может иметь и дальнейшее далеко идущее влияние на будущее развитие лингвистики в целом. Богатый опыт, собранный лингвистами и математиками в области применения алгоритмов автоматической обработки данных к естественному языку, является весьма ценным фундаментом для будущих лингвистических исследований в областях, не имеющих отношения к переводу. Как указал Сгалл 32 Мы обращаем внимание читателя прежде всего на публикации Патентного бюро Соединенных Штатов (с 1957 г.) и на работы, опубликованные в сборнике «Preprints of Papers for the International Conference on Scientific Information», 1958. 33 Ср. параграф «Статистика стиля и установление авторства» в разд. 2 данной работы. 34 За руководством к литературе по машинному переводу мы отсылаем читателя к работе Делавене и Делавене (Delavenay and Delavenay, 1959) и к журналу «Mechanical Translation» (с 1954 г.). 35 См. разд. 3 настоящей работы. 239
(Sgall, 1959), достижения в области построения вычислительных машин впервые дали возможность «ввести» в машину языковую систему, в связи с чем структурные и статистические исследования языка могут осуществляться теперь в таком широком масштабе, какой был немыслим еще лет десять назад. Ввиду того, что вычислительные машины занимают ключевую позицию в различных аспектах математической лингвистики, специалисты по математической лингвистике должны испытывать большое удовлетворение от того, что некоторые из их достижений применяются при синтезе автоматических кодирующих систем в вычислительных машинах. Как уже было замечено ранее, попытки автоматического перевода с одного языка на другой привели к открытию возможности простых и надежных алгоритмов перевода для формальных языков, и это окажет большое влияние на развитие автоматического программирования. Такая цепь событий некоторым может показаться весьма необычным случаем поэтической справедливости, но на самом деле это лишь яркий пример тесной и взаимно благоприятной связи, которая установилась между математикой и лингвистикой. ЛИТЕРАТУРА Ajdukiewiсz, Α., Die syntaktische Konnexität, "Studia Philosophica", vol. I, Lwow, 1935, pp. 1—27. Arndt, W. W., The Performance of Glottochronology in Germanic, "Language", vol. 35, 1959, pp. 180—192. Arnold, Ε. V., Vedic Metre in Its Historical Development, Cambridge, 1905. Вar-Hillel, Y., A Quasi-Arithmetical Notation for Syntactic Description, "Language", vol. 29, 1953, pp. 47—58. Вeleνitсh, V., Langage des machines et langage humain, Bruxelles, Office de Publicité, 1956. Вeleνitсh, V., On the Statistical Laws of Linguistic Distributions, "Annales de la Société Scientifique de Bruxelles", 1959, vol. 7B, pp. 310—326. Booth, A. D., Вrandwооd, L., and Cleave, J. P., Mechanical Resolution of Linguistic Problems, New York, Academic press., London, Butterworths, 1958. Воssert, W., The Implementation of Predictive Analysis, "Mathematical Linguistics and Automatic Translation", Rpt. № NSF-4, Harvard Comp. Lab., Sec. VIII, 1960. Воssert, W., Giulianо, V. E., and Grant, S. В., Automatic Syntactic Analysis of English, "Mathematical Linguistics and Automatic Translation", Rpt. № NSF-4, Harvard Comp. Lab., Sec. VII, 1960. 240
Cherry, Ε. С, On Human Communication, New York, Wiley, 1957. Cherry, E. C, Halle, M., and Jakobson, R., Toward the Logical Description of Languages in Their Phonemic Aspect, "Language", vol. 29, 1953, pp. 34—46. [Русск. перев. см. в сб. «Новое в лингвистике», вып. II, М., 1962, стр. 279—298.] Chomsky, Ν., Three Models for the Description of Language, "IRE Trans, on Information Theory", vol. IT-2, 1956, pp. 113—124. Chomsky, N., Syntactic Structures, 's-Gravenhage, Mouton, 1957. Русск. перев. см. в сб. «Новое в лингвистике», вып. II, М., 1962 стр. 412—527.] Chomsky, Ν., On Certain Formal Properties of Grammars, "Information and Control", vol., 2, 1959, pp. 137—167. Chomsky, N., and Miller, G. Α., Finite State Languages, "Information and Control", vol. 1, 1958, pp. 91—112. Chrétien, С. D., U.C.P.L., vol. 1, 1943, pp. 11—20. Czekanowski, J., Wstep do historii Slowian (Lwow; Poznan, 1957), 1927. Delavenay, E. and Delavenay, K., Bibliography of Mechanical Translation (International Study Group on Mechanical Translation, "UNESCO"), 1959. Εllegard, Α., Statistical Measurement of Linguistic Relationship, "Language", vol. 35, 1959, pp. 131—156. Fucks, W.,· Mathematische Analyse von Sprachelementen, Sprachstil und Sprachen, «Arbeitsgemeinshaft für Forschung des Landes Nordrhein-Westfalen», Köln und Opladen, Westdeutscher Verlag, 1955. Gleasοn, Η. Α., An Introduction to Descriptive Linguistics, New York, Holt, 1955. [Русск. перев.: Г. Глисон, Введение в дескриптивную лингвистику, М., ИЛ, 1959.] Gleasоn, Η. Α., Counting and Calculating for Historical Reconstruction, "Anthropological Linguistics", vol. I, № 2, 1959, pp. 22—33. Gleasоn, H.A., Genetic Relationship in Language («Proceedings of the Symposia in Applied Mathematics», vol. 12 (Providence, American Mathematical Society), 1960. Greenberg, J. H., A Quantitative Approach to the Morphological Typology of Language в "Method and Perspective in Anthropology" (Papers in Honor of Wilson D. Wallis), ed. R. Spencer, Minneapolis, 1954, pp. 192—220. Greenberg, J. H., Osgood, С Ε., and Saρоrta S., Language Change, Sec. 6.3 of Osgood, С. E. and Sebeok, T. A. (eds.), "Psycholinguistics: A Survey of Theory and Research Problems", Дополн. к журн. "International Journal of American Linguistics", vol. 20, 1954. Gudsсhinsky, S. C, The ABC's of Lexicostatistics (Glottochronology), "Word", vol. 12, 1956, pp. 175—210. Guiraud, P., Les caractères statistiques du vocabulaire, Paris (Presses Universitaires de France), 1954a. Guiraud, P., Bibliographie critique de la statistique linguistique. Revised and completed by T. D. Houchin, J. Puhvel, and С W. Watkins, under the direction of J. Whatmough, Utrecht, Spectrum, 1954b. 16 —2238 241
Halle, M., In Defense of the Number Two, Studies Presented to Joshua Whatmough, 's-Gravenhage, Mouton, 1957, pp. 64—72. Harаry, F. and Paper, H. H., Toward a General . Calculus of Phonemic Distribution, "Langauge", vol. 33, 1957, pp. 143—169. Harris, Z. S., Discourse Analysis, "Language", vol. 28, 1952, pp. 1—30. Harris, Z. S., Co-occurrence and Transformation in Linguistic Structure, "Language", vol. 33, 1957, pp. 283—340. [Русск. перев. см. в сб. «Новое в лингвистике», вып. II, М., 1952, стр. 528—636.] Hаrwооd, F. W., Axiomatic Syntax — The Construction and Evaluation of a Syntactic Calculus, "Language", vol. 31, 1955, pp. 409—415. Herdan, S., Language as Choice and Change, Groningen, Noordhoff, 1956. Herdan, G., Type-Token Mathematics, 's-Gravenhage, Mouton, 1960. Hjelmslev, L. and Uladall H. J., Outline of Glossematics, Copenhagen, 1957, Nordisk Sprog- og Kulturforlag. Hockett, C.F., Two Models of Grammatical Analysis, «Word», vol. 10, 1954, pp. 210—234. Hoijer, H., Lexicostatistics: A Critique, "Language", vol. 32, 1956, pp. 49—60. [Русск. перев. см. в сб. „Новое в лингвистике'*, вып. I.j Hymes, D. H., Genetic Classification: Retrospect and Prospect, "Anthropological Linguistics", vol. I, № 2, 1959, pp. 50—66. "Information and Control" (Journal), New York, 1957, Academic Press. Joos, M., Description of Language Design, «Journal of the Acoustical Society of America», vol. 22, 1950, pp. 701—708. Josselson, H. H., The Russian Word Count (Detroit, Wayne University Press.), 1953. Keller, К. C. and Saporta S., The Frequency of Consonant Clusters inChontal, "International Journal of American Linguistics", vol. 23, 1957, pp. 28—35. Koschmieder, E., Die Mathematisierung der Sprachwissenschaft, "Forscnungen und Fortschritte", vol. 30, 1956, pp: 210—216. Kroeber, A. L., Linguistic Time Depth Results So Far and their Meaning, "International Journal of American Linguistics", vol. 21, 1955, pp. 91—104. Kroeber, A. L. and Chrétien, C. D., Quantitative Classification of Indoeuropean Languages, "Language", vol. 13, 1937, pp. 83—103. Кyлaгинa, О. С, Об одном способе определения грамматических понятий на базе теории множеств, (Проблемы Кибернетики, I, Москва, Государственное издательство физико-математической литературы, стр. 203—214). Lambek, J., The Mathematics of Sentence Structure, "American Mathematical Monthly", vol. 65, 1958, pp. 154—170. Lees, R. В., The Basis of Glottochronology, «Language», vol. 29, 1953, pp. 113—127. Lees, R. В., „Review of Chomsky "Syntactic Structures", в "Language", vol. 33, 1957, pp. 375—408. 242
Lees, R. В., Automata and the Generation of Sentences, "Anthropological Linguistics", vol. 1, №4, 1959, pp. 1—4. Luhn, H. P., The Automatic Creation of Literature Abstracts, "IBM Journal of Research and Development", vol. 2, 1958, p. 159. Lukasiewicz, J., Aristotle's Syllogistic, Oxford, 1957. Mandelbrot, В., Structure formelle des textes et communication: deux études, "Word", vol. 10, 1954, pp. 1—27. Mandelbrot, В., On Recurrent Noise Limiting Coding (Symposium on Information Networks, Proceedings, 1954, New York, 1955, Polytechnic Institute of Brooklyn), pp. 205—221. Mandelbrot, В., Linguistique statistique macroscopique в книге Apostel, L., Mandelbrot, В., and Morf, Α., Logique, langage, et théorie de l'information, Paris, Presses Universitaires de France, 1957. Mandelbrot, В., A Note on a Class of Skew Distribution Functions: Analysis and Critique of a Paper by H. A. Simon, "Information and Control", vol. 2, 1959, pp. 90—99. "Mathematical Linguistics" (Journal), Tokyo (National Language Research Institute), 1957. "Mechanical Translation" (MT) (Journal), Cambridge, Mass., M.I.T., 1954. Menzerath, P., Typology of Languages, "Journal of the Acoustical Society of America", vol. 22, 1950, pp. 698—701. Menzerath, P. and Meyer-Eppler, W., Sprachty- pologische Untersuchungen, I, Lund, 1950. Meyer-Eppler, W., Anwendung der Kommunikationsforschung auf lautsprachliche und tvpographische Probleme, "Sprachforum", vol. 1, 1955, pp. 70—77. " Meyer-Eppler, W., Grundlagen und Anwendungen der Informationstheorie, Berlin-Göttingen-Heidelberg, Springer, 1959. Miller, G. Α., Human Memory and the Storage of Information, "IRE Transactions on Information Theory", vol. IT-2, 1956, pp. 129—137. Miller, G. Α., Some Effects of Intermittent Silence, "American Journal of Psychology", vol. 70, 1957, pp. 311—313. Miller, G. A. and Friedman, Ε. Α., The Reconstruction of Mutilated English Texts, "Information and Control", vol. 1, 1957, pp. 38—55. Miller, G. A. and Newman, E. G., Tests of a Statistical Explanation of the Rank-Frequency Relation for Words in Written English, "American Journal of Psychology", vol.71, 1958, pp. 209—218. Miller, G. Α., Newman, E. G., and Friedman, Ε. Α., Length-Frequency Statistics for Written English, "Information and Control", vol. 1, 1958, pp. 370—389. Oettinger, A. G., Linguistics and Mathematics, в "Studies Presented to Joshua Whatmough", 's-Gravenhage, Mouton, 1957, pp. 179—186. Oettinger, A. G., Automatic Language Translation: Lexical and Technical Problems в "Harvard Monographs in Applied Science", № 8, Cambridge, Mass., Harvard University Press, 1960a. Oettinger, A. G., Automatic Syntactic Analysis and the Pushdown Store, Proceedings of the Symposia in Applied Mathematics, vol. 12 (Providence, American Mathematical Society), 1960b. 16* 243
Patent Office, Research and Development Report (U. S. Dept. of Commerce). Preprints of Papers for the International Conference on Scientific ^ Information (Washington, D. C, National Research Council), 1958. Rea, J. Α., Concerning the Validity of Lexicostatistics, "International Journal of American Linguistics", vol. 24, 1958, pp. 145—150. Rhodes, I., A New Approach to the Mechanical Translation of Russian (Washington, D. C, National Bureau of Standards; неопубликованный доклад), 1959a. Rhodes, I., A New Approach to the Mechanical Syntactic Analysis of Russian (Washington, D. C, National Bureau of Standards; неопубликованный доклад), 1959b. Ross, A. S. С, Philological Probability Problems, «Journal of the Royal Statistical Society», vol. 114, series Α., 1950, pp. 19—59. Saporta, S., Methodological Considerations Regarding a Statistical Approach to Typologies, "International Journal of American Linguistics", vol. 23, 1957, pp. 109—113. Sgall, P., Nové otâzky matematickych metod ν jazykovèdë, "Slovo a slovesnost", vol. 20, 1959, pp. 44—55. Shannon, С. Ε., Prediction and Entropy of Printed English, "Bell System Technical Journal", vol. 30, 1951, pp. 50—64. Shannon, С Ε. and Weaver W., The Mathematical Theory of Communication, Urbana, University of Illinois Press., 1949. Sherry, M. E., Syntactic Analysis in Automatic Translation, в "Mathematical Linguistics and Automatic Translation", Rpt. No. NSF—5, Harvard Comp. Lab., 1960. Sherry, M. and Oettinger, A. G., A New Model of Natural Language for Predictive Syntactic Analysis (Proceedings of the Fourth London Symposium on Information.Theory, Sept., 1960). Simon, Η. Α., On a Class of Skew Distribution Functions, "Biometrika", vol. 42, 1955, pp. 425—440. Somers, H. H., Analyse mathématique du langage, Louvain, 1959. Stumpers, F. L., A Bibliography of Information Theory— Communication Theory—Cybernetics, "IRE Transactions on Information Theory", vol. PGIT—2. First Supplement в vol. IT—1, №2 (Sept., 1955), pp. 31—47. Second Supplement в vol. IT—3 (June, 1957), pp. 150—166. Swadesh, M., Salish Internal Relationships, "International Journal of American Linguistics", vol. 16, pp. 157—167. Swadesh, M., Towards Greater Accuracy in Lexicostatistic Dating, "International Journal of American Linguistics", vol. 21, 1955, pp. 121—137. [Русск. перев. см. в сб. «Новое в лингвистике»» вып. I, М., 1960, стр. 53—87.] Symposium on the Structure of Language and Its Mathematical Aspects, «Proceedings of the Symposia in Applied Mathematics», vol.12 (Providence, American Mathematical Society), 1960. Ungeheuer, G., Das logistische Fundament binärer Phonemklassifikationen, "Studia Linguistica" 1959a, pp. 69—97. Ungeheuer, G., Logischer Positivismus und moderne Linguistik (Glossematik), Uppsala, Almqvist and Wiksell, 1959b. Wells, R., Immediate Constituents, "Language", vol. 23, 1947, pp. 81—117. 244
Whatmough, J., Language, London and New York, chapter XI, 1956. Whatmough, J., Poetic, Scientific and Other Forms of Discourse (California University Press), 1956. Whatmough, J., Mathematical Linguistics, Proceedings of the VIII International Congress of Linguists, Oslo, 1957. Wiener, N., Cybernetics or Control in the Animal and the Machine, New York, Wiley, 1948. Worth, D. S., Transform Analysis of Russian Instrumental Constructions, "Word", vol. 14, 1958, pp. 247—290. [Русск. перев. см. в сб. «Новое в лингвистике», вып. II., М., 1962, стр. 637—683.] Wundheiler, L. and Wundheiler Α., Some Logical Concepts for Syntax, в "Machine Translation of Languages", eds. Locke W. N., and Booth A. D., New York, Wiley, 1955. Υngve, V. Η., Sentence-for-sentence Translation, "Mechanical Translation (MT)", vol. 2, 1955, pp. 29—37. Υngve, V. H., A Model and an Hypothesis for Language Structure, "Proceedings of the American Philosophical Society", vol. 104, 1960, pp. 444—466 Yule, G. U., The Statistical Study of Literary Vocabulary, Cambridge, Cambridge University Press, 1944. Ζipf, G. K-, Human Behavior and the Principle of Least Effort, Cambridge, Mass., Addison-Wesley, 1949.
Ч. Фраз „ШКОЛА" БЛУМФИЛДА* Название этой статьи, наверное, очень огорчило бы Блумфилда. Он презирал «школы», считан, что обычно поведение приверженцев той или иной «школы» подрывает самое основание всякой серьезной науки. Он полагал, что наука должна быть преемственной и объективной. Она не может строиться на теориях того или иного отдельного лица. Подводя итоги двадцатилетнего существования Лингвистического общества Америки, Блумфилд указывал, в частности, что оно «спасло нас от пагубы odium theologicum (т. е. присущей богословам ненависти к инакомыслящим) и догмата „школ"». Сам Блумфилд всегда оставался «неизменно великодушным», скромным и непритязательным. Его скромность «мешала ему осознать свое собственное величие и принимать всерьез то почтение, с которым относились к нему другие ученые»1. Приводимое ниже высказывание Блумфилда о «школах» отражает не только его взгляды, но также его собственный опыт и правила поведения, особенно по отношению к младшим коллегам. «Когда несколько американских лингвистов обнаруживают, что их объединяют какие-то общие интересы или точки зрения, они не поднимают из-за этого шума, провозглашая себя «школой» и понося всех, кто придерживается иного мнения или просто предпочитает говорить о чем-то другом. Но они также, за небольшим исключением, не * Charles С. Fries, The Bloomfield 'School', в "Trends in European and American Linguistics 1930—1960", Utrecht/Antwerp, 1961, pp. 196-224. 1 Bernard Bloch, Leonard Bloomfield, "Language", 25, 1949, p. 94. 246
выдвигают обвинения в формировании «школы» и против других ученых и, следовательно, не вводят в действие правило коллективной ответственности. Единоборство с упрямыми фактами, неподатливыми и сложными, приучает активно работающих ученых к скромности, вырабатывает привычку объективно признавать ошибки; но в немалой мере эта скромность усиливается и развивается в чувство терпимости и сотрудничества благодаря общению с товарищами по работе и социальной дисциплине, которую рождает участие в определенном коллективе людей, работающих в одной и той же области науки. Коллега (часто более молодой) высказывает мнение, которое кажется нам неправильным до тех пор, пока в последующей беседе мы не обнаружим, что его суждение основано на более широком и более верном наблюдении или на рассуждении более точном или более соответствующем фактам, и у нас рождается прозрение, которое никогда не смогло бы возникнуть, если бы мы работали в одиночку»2. И все же, несмотря на свою скромность и постоянное стремление избегать публичных выступлений, Блумфилд оказал огромное влияние на американских лингвистов и американскую лингвистику в целом. Источником этого влияния были не его лекции, которые он в качестве преподавателя читал своим студентам. По правде говоря, если не считать молодых «докторов философии», которые толпами приходили на его лекции, посвященные общим вопросам «науки о языке», в течение тех немногих лет, когда он был штатным преподавателем Института лингвистики в Мичиганском университете, студентов-лингвистов как таковых у него было очень немного. Могущественное влияние оказывали его рецензии, его статьи и его книги, особенно книга «Language» (1933), которой пользовались как учебником и которую широко изучали во всех университетах страны. Поэтому наиболее глубокое влияние Блумфилда испытали именно представители более молодого поколения — те, кто только начинал в то время свою ученую карьеру, а не уже сложившиеся и признанные лингвисты и исследователи языка старшего поколения. 2 Twenty-One Years of the Linguistic Society, «Language», 22, 1946, p. 23. 247
Сам Блумфилд рассматривал книгу «Language» просто как «упорядоченный обзор» достижений «науки о языке», предназначенный главным образом для «широкого читателя и для ученых, только приступающих к работе в области лингвистики». Он считал, что эта книга является как бы пересмотренным изданием другой его работы—«Introduction to the Study of Language» (1914), которая в свою очередь преследовала те же цели, что и работы Уитни «Language and the Study of Language» (1867) и «The Life and Growth of Language» (1875). Блумфилд считал, что в каждый из периодов — с 1875 по 1914 и с 1914 по 1930 г.— наука о языке («наша наука») достигала все новых и новых успехов в понимании природы и функционирования человеческого языка — «достаточное оправдание для моей попытки дать краткое резюме того, что нам теперь известно о языке». В 1933 г. еще одно обстоятельство побудило его изложить материал гораздо полнее — убеждение, что «и ученые, и образованные люди вообще придают теперь все большее значение правильному пониманию человеческой речи». Книга Блумфилда «Язык» (1933) оказалась, однако, отнюдь не простой; она представляла собой нечто гораздо большее, чем общий обзор. Для младшего поколения лингвистов, полного энтузиазма, эта книга явилась источником приемлемой научной доктрины. Бернард Блок, по-видимому, правильно охарактеризовал положение, когда в 1949 г. писал следующее: «Не будет преувеличением сказать, что все значительные усовершенствования метода анализа, осуществленные в Америке с 1933 г., явились прямым результатом того стимула, который дала лингвистике книга Блумфилда. И если сейчас наши методы в каких-то отношениях лучше, чем методы Блумфилда, и мы более ясно, чем он, представляем себе некоторые аспекты структуры языка, впервые открытые Блумфилдом, то все это потому, что мы стоим у него на плечах» 3. Таким образом, если и существует сейчас нечто вроде «школы» Блумфилда, то возникла она потому, что значительное число исследователей в области лингвистики усвоило основные принципы, которыми руководствовался Блумфилд в своей собственной работе. Для него важны 3 Блок, Цит. раб., стр. 92. 248
были именно эти основополагающие принципы, а не конкретные приемы и методы исследования сами по себе. Однако в разработке и понимании этих принципов у последователей Блумфилда (то есть среди всех тех лингвистов, которые признают, сколь глубоко они обязаны поддержке и влиянию Блумфилда) можно обнаружить большие расхождения 4. Охарактеризовать «школу» Блумфилда и значит поэтому изложить прежде всего те принципы, которые он рассматривал как основу всякой серьезной научной работы в области лингвистики. Некоторые из них были и остаются спорными. Но хотя в целом Блумфилд уклонялся от полемики, в этих основных вопросах он был непреклонен. Принятые им принципы служили ему критерием для суждений, которые он высказывал в своих рецензиях, а также вселяли в него уверенность в том, что лингвистика — это образец, который позволит сделать и другие науки о человеке (human sciences) плодотворными в научном отношении. И именно эти важнейшие принципы, лежащие в основе учения Блумфилда и его убеждений, вызвали уже при жизни Блумфилда серьезные возражения и явились причиной недоразумений, которые имеют место и в наши дни. Многие из лингвистов, извлекших огромную пользу из той или иной части обширнейшего лингвистического наследия Блумфилда и признающих большую зависимость своих концепций от концепции Блумфилда, возражают вместе с тем против некоторых из его основных положений, без которых учение Блумфилда утрачивает по существу свою стройность и последовательность. Точнее говоря, они выступают против некоторых черт в «образе» Блумфилда, сложившихся, как мне представляется, в результате неполного и неправильного прочтения ряда его сочинений. Характеризуя «школу» Блумфилда, мы попытаемся поэтому привлечь внимание к тем его воззрениям, которые он высказывал наиболее часто, и особо подчеркнем те из его высказываний, которые, по-види- 4 Следует также иметь в виду, что многие из «последователей» Блумфилда признают, что они испытали также и значительное влияние Эдуарда Сепира. Некоторые, несомненно, захотят, чтобы их считали одновременно «последователями» и того, и другого ученого, несмотря на большие различия между этими двумя учеными. 249
мому, ускользнули от внимания лингвистов, по недоразумению относящих себя к оппозиционерам. Все, кто знал Блумфилда лучше других, согласятся, вероятно, с тем, что главной его заботой было сделать лингвистику наукой. И все подлинные «последователи» Блумфилда стремились продолжить его работу. Время от времени, правда, разгорались горячие споры о том, что такое «научная» лингвистика, но сама конечная цель всегда оставалась неизменной. «Нет никакого сомнения, что величайший вклад Блумфилда в языкознание состоял в том, что он сделал эту отрасль знания наукой. И другие ученые, до Блумфилда, подходили к лингвистике как к науке, но никто из них не отверг столь бескомпромиссно все донаучные методы и никто с такой последовательностью не старался, говоря о языке, использовать только те термины, которые не были связаны с молчаливым допущением факторов, лежащих вне сферы наблюдения»5. Стремясь подойти к языку научно и расширить круг языковых явлений, доступных научной обработке, Блумфилд обращался к разным проблемам, но в этом последовательном изменении проблематики нет внезапных скачков. У того, кто рассматривает работы Блумфилда в хронологическом порядке, неизбежно возникает впечатление глубокой внутренней связи между каждой новой проблемой, оказывающейся в центре внимания Блумфилда, и прежними проблемами, то есть впечатление стройности всей картины в целом. Ниже мы остановимся на основных лингвистических принципах Блумфилда. А. „РЕГУЛЯРНОСТЬ" ЗВУКОВЫХ ИЗМЕНЕНИЙ Примечательно, что именно более строгий научный анализ остаточных явлений — отклонений от установленных типов фонетических соответствий — неожиданно открыл перед Блумфилдом в самом начале его научной деятельности новый мир и стал делом всей его жизни6. 5 Блок, Цит. раб., стр. 92. 6 В июне 1906 г. девятнадцатилетний Блумфилд получил в Гарварде степень бакалавра искусств, завершив там курс в три года. Этим же летом он отправился в университет в Висконсине, как 250
Строгое и точное применение «метода, лежавшего в основе этого анализа»,— допущение «регулярности звуковых изменений» в противовес теории «спорадических необъяснимых изменений» — стало главным критерием, которым Блумфилд руководствовался в своих рецензиях 1910—1914 гг. Он считал негодными все телеологические «объяснения» остаточных форм, настаивая на необходимости научного признания того, что «обусловленные звуковые изменения являются чисто фонетическими» и «не зависят от нефонетических факторов, таких,, как значение, частотность, омонимия и т. д. и т. п. той или иной конкретной языковой формы». Блумфилд не шел ни на какие компромиссы в этом вопросе, полагая, что допущение «регулярности» звуковых изменений — это основа прогресса лингвистики как науки. Во всех своих лингвистических работах, от самых ранних до самых последних, Блумфилд постоянно подчеркивал принципиальное научное значение указанного допущения7. он рассказывал, «только что из колледжа в поисках вакансии ассистента. Я хотел зарабатывать на жизнь научным трудом, но у меня не проявилось еще ни понимания, ни склонности ни к какой определенной отрасли науки. Любезный профессор Холфилд поручил Прокошу, одному из своих молодых преподавателей, на один день взять шефство надо мною как гостем. На маленьком столе в столовой Прокоша стояло несколько книг по лингвистике (мне помнится, что среди них была «Грамматика древнеболгарского языка» Лескина), и в беседе перед завтраком Прокош объяснил мне их назначение и содержание. К тому времени, когда мы сели завтракать, то есть минут через пятнадцать, я уже принял решение, что буду работать в области лингвистики. К концу двухлетнего ученичества, которое последовало за этой встречей, я не знал большего интеллектуального наслаждения, чем слушать Прокоша...» («Language», 14, 1938, р. 311—312.) 7 Приведем лишь некоторые из многочисленных высказываний Блумфилда, взятые главным образом из его рецензий. а) «Следующие этимологии представляются мне ошибочными — они включают и те очень немногие отклонения от надежного и строгого принципа, которые снижают (хотя и в равно небольшой степени) ценность другой брошюры Лоу». ("Journal of English and Germanic Philology", 10, 1911, p. 124.) б) «Синонимия сама по себе — это еще недостаточное свидетельство родства... Из такого обширного материала легко набрать 6 изобилии параллельные слова для доказательства почти· любого желаемого «фонетического закона», особенно если закон, подобно шифру "Baconians", сформулирован ad hoc; но подобные беспредметные группировки слов и претенциозные гипотезы не имеют отношения к истине...в рецензируемой книге нет пустого и бездока- 251
С допущением «регулярности звуковых изменений» неразрывно связан и так называемый «механицизм» Блумфилда. В одной из своих ранних статей, написанной на основе наблюдений над американо-индейскими языками алгонкинской семьи, Блумфилд определенно намеревался со всей строгостью применить к этим языкам бесписьменных народов принцип «регулярности звуковых изменений». зательного теоретизирования». ("Journal of English and Germanic Philology", 10, 1911, p. 628, 630.) в) «Излишне оговаривать, что звуковые изменения и изменения ло аналогии не подвластны нашим потребностям выражения, но являются соответственно психо-физиологическими и психологическими процессами, которые происходят непроизвольно и не могут быть направляемы нашими потребностями и желаниями. Эти процессы постоянно изменяют форму нашего речевого материала. Определенный отбор слов и форм из этого речевого материала, производимый образованными людьми, не имеет никакого отношения к звуковым изменениям и изменениям по аналогии; в свою очередь и эти процессы не оказывают даже отдаленного «влияния» на отбор, происходящий в литературной и образованной речи и представляющий собой дело коллективного вкуса — социальной нормы. «...ошибочно мнение, будто бы семантическое значение или отсутствие значения у соответствующих звуков может каким-то образом регулировать звуковое изменение. ...Подобные взгляды вполне естественны, но поскольку никаких фактов в их пользу так и не было найдено, наука их отвергла;более того, при конкретном анализе условий маловероятно, что такие факты будут когда-либо обнаружены. Явления, которые мы называем фонетическими изменениями, представляют собой непрерывные и постепенные бессознательные изменения в навыках производства некоторых в высшей степени отработанных, употребительных и потому в большой мере автоматизированных движений, а именно движений, связанных с артикуляцией. ...Подобное желание или потребность [выразить свои мысли — Ч. Ф.] может повлиять на мой выбор слов или целых выражений, на их расположение, эмфазу и мелодику, может даже привести к изменению по аналогии, но не может повлиять на ту глубоко сокрытую часть моей психики, которая без моего приказания или ведома заставляет меня, по мере того как идут десятилетия, передавать последующим поколениям некоторые навыки положения языка, отличающиеся на миллиметр или на несколько сигм от тех, которым учили старшие меня самого». ("Journal of English and Germanic Philology", 11, 1912, pp. 623, 624.) г) «И представляется сначала, когда изучаешь эти сочинения, что социальная психология Вундта сыграла точно такую же роль для нашего понимания развития языка, какую она сыграла в других сферах социальной деятельности. В частности, процессы языкового изменения слишком часто трактовались как акты логического мышления; положив конец подобным объяснениям и показав конкретный психологический характер изменений в языке, Вундт оказал языкознанию неоценимую услугу...» 252
«Я надеюсь также помочь избавиться от представления о том, что обычные процессы языкового изменения утрачивают силу на американском континенте (Meillet, Cohen, Les Langues du monde, Paris, 1924, стр. 9). Если предположить, что где-то существует язык, в котором эти процессы не происходят (звуковые изменения, независимые от значения, изменения по аналогии и т. п.), тогда с их помощью нельзя объяснить и истории индоевропей- « Когда же Вундт высказал мнение, что отсутствие словоизменения является характерной чертой примитивных языков, он вступил в прямое противоречие с всем известными фактами истории языков. В подтверждение своего взгляда он сослался затем на широкое распространение так называемого звукового символизма, но и здесь имеет место явление, которое мы наблюдаем в процессе эволюции некоторых высокоразвитых языков... Причина ошибки Вундта заключается в том, что его социальная психология не содержит представления об общем развитии языка, сопоставимого с подобным представлением в других областях социальной деятельности... Достаточно сказать, что рационализирующая интерпретация, которая и здесь искажает действительный ход развития, не преодолена полностью и в «Völkerpsychologie». («American Journal of Psychology», 24, 1913, pp. 450—452.) д) «...характеристика «фонетических законов» как «законов природы» не может считаться правильной: звуковое изменение — это не закон природы, но историческое явление. Тот, кто считает приведенное выше определение чем-то большим, чем простая метафора, введен в заблуждение одной из разительных особенностей фонетических изменений — их асемантическим характером...» «Исследователи, не имеющие специальной лингвистической подготовки, часто утверждают, что возможного звукового изменения не происходит потому, что в противном случае стертым оказалось бы какое-то важное семантическое различие, или, наоборот, что данное звуковое изменение происходит именно потому, что то или иное семантическое различие, которое оно затемняет, уже не ощущается как необходимое. Для того чтобы продемонстрировать несостоятельность подобных утверждений, нет нужды обращаться к конкретным деталям процесса. Следует заметить, что в настоящее время на наших глазах осуществляется звуковое изменение, которое должно уничтожить самые четко выраженные из самых универсальных различий в английском языке. По крайней мере именно это наблюдалось вновь и вновь во всех языках, история которых нам известна». («Language», 1914, pp. 204, 205, 206.) е) «Понимание процессов звукового изменения, имеющее огромную «диагностическую ценность» для психологии, этнографии и, по существу, для всех форм науки о человеке,— это наше ценнейшее наследие, полученное нами от исторического в полном смысле этого слова языкознания XIX в. Оно отражает ту стадию развития, на которой наши предшественники воздерживались от скороспелых и непродуманных психологических объяснений...» («The Classical Weekly», 15, 1922, p. 143.) 253
ских и любыхдругих языков. Закон, подобный принципу регулярности фонетических изменений, не связан с какой-то определенной традицией, передаваемой каждому новому говорящему на данном языке, но представляет собой либо универсальную черту человеческой речи, либо вообще ничего собой не представляет, то есть является ошибкой»8. Для Блумфилда особая важность допущения «регулярности» звуковых изменений заключалась в том факте, что оно было в высшей степени продуктивно с научной точки зрения. Все другие допущения не давали научных (доказуемых) результатов, а лишь затемняли проблемы, возникающие при анализе «остаточных форм» (так называемых исключений)9. ж) «...и было там одно место, из которого в конечном счете следовало, что утрата (в результате звуковых изменений) словоизменительных окончаний в английском языке была обусловлена тем обстоятельством, что эти окончания уже больше не были нужны для выражения значения. ...достаточно указать, что с самого зарождения лингвистической науки именно такие идеи — соотносящие языковые изменения с желаниями или потребностями людей — проверялись вновь и вновь: ведь они находятся на столбовой дороге нашего коллективного здравого смысла; но эти идеи были отброшены как несостоятельные, потому что оказались бессильными объяснить факты. ...Несостоятельность научного метода (или гипотезы, или допущения) может быть доказана только путем строгого применения самого этого метода — и никогда при помощи перечисления специально отобранных изолированных фактов или апелляций, пусть даже очень хитроумных, к здравому смыслу. В этих вопросах не должно быть никаких уступок». «Заслугой Гримма (не говоря уже о гениальности этого человека) было то, что силой своего метода он завоевал для науки такую огромную массу фактов, что с ними работают вот уже многие поколения лингвистов, так почти и не выходя за их пределы». («American Journal of Philology», 43, 1922, pp. 371, 372, 373.) з) «Постулат о звуковых изменениях, не знающих исключений, вероятно, так и останется лишь допущением, поскольку другие типы языковых изменений (изменения по аналогии, заимствования) также неизбежно оказывают влияние на весь наш материал. Тем не менее, и в качестве допущения этот постулат позволяет без особого труда делать предсказания, что в других случаях было бы невозможно. Иными словами, положение о том, что фонемы изменяются (звуковые изменения не знают исключений),— это проверенная гипотеза, насколько вообще можно говорить о таких вещах, истинность ее доказана». («Language), 4, 1927, р. 100.) 8 «Language», 1, 1925, р. 130. 9 «В 1870 г., когда специальные термины были менее точными, чем в наши дни, допущение единообразных звуковых изменений получило туманную и метафорическую формулировку: «Фонетические законы не знают исключений». Очевидно, термин «закон» употреблен здесь не в прямом значении, поскольку звуковое изменение 254
«В действительности спор идет об объеме классов фонетических соответствий и значении форм, не охваченных этими соответствиями. Младограмматики утверждали, что результаты исследований позволяют сделать классы соответствий непротиворечивыми, а также произвести полный анализ остаточных форм... Младограмматики, в частности, настаивали на том, что их гипотеза плодотворна в этом последнем направлении: она помогает выделить черты сходства, возникшие в результате не фонетических, но других изменений, и тем самым приводит нас к пониманию этих факторов». «Задача, следовательно, заключается в том, чтобы устранить ложные этимологии, пересмотреть наши формулировки фонетических соответствий и признать наличие других языковых изменений, кроме изменений звуковых». «Противники младограмматиков утверждают, что совпадения, которые не подводятся под установленные типы фонетических соответствий, могут быть вызваны к жизни просто спорадическими явлениями, или отклонениями от звуковых изменений, или тем, что звуковые изменения остались неосуществленными...» «Младограмматики же видят в этом серьезное нарушение научного метода. Возникновение нашей науки было связано с появлением метода, который исходил из регулярности фонетических изменений, и ее дальнейшие успехи, как, например, открытие Грассманна, также основывались на том же неизменном допущении. Разумеется, вполне возможно, что какое-либо другое допущение привело бы к установлению еще более правильного соотношения фактов, но защитники спорадических звуковых изменений не предлагают ничего подобного; они признают результаты, полученные благодаря применению существующего метода, и вместе с тем пытаются объяснять некоторые факты при помощи прямо противоположного метода (или, точнее, при отсутствии метода), который подвергался проверке на протяжении всех столетий, предшествовавших Раску и Гримму, и был признан несостоятельным» 10.. ни в каком смысле не является законом, но лишь историческим явлением. Выражение «не знают исключений» очень неточно передает мысль о том, что нефонетические факторы, такие, как частотность или значение отдельных языковых форм, не оказывают влияния на изменение фонем». («Language», 1933, р. 354.) 10 «Language», 1933, pp. 354—355. 255
Таким образом, положение о строгой «регулярности» звуковых изменений не является догмой, в которую нужно верить слепо, без рассуждений. Это, скорее, вполне обоснованная гипотеза, оказавшаяся достаточно плодотворной на практике. Б. „ИСКЛЮЧЕНИЕ" ПСИХОЛОГИИ Как было сказано, Блумфилд, занимаясь лингвистическими проблемами, с самого начала осуждал «бездоказательное теоретизирование» (1911), «телеологическую интерпретацию» (1912), «скороспелые психологические объяснения» (1914). Он полностью присоединялся к следующему заключению Лескина, сделанному в 1876 году: «Тщательный анализ остаточных форм, не подходящих под установленные звуковые соответствия, настолько часто приводил к открытию непротиворечивых фактов или к устранению ошибочных этимологии, что лингвисты вправе предполагать, что изменения фонем являются абсолютно регулярными». Еще в 1912 г. Блумфилд писал: «Явления, которые мы называем фонетическими изменениями, представляют собой непрерывные и постепенные бессознательные изменения в навыках осуществления некоторых в высшей степени отработанных и потому в большой мере автоматизированных движений, а именно движений, связанных с артикуляцией». Формирование «механистического», а не «менталист- ского» подхода к языку у Блумфилда относится к более раннему времени, чем его первое знакомство с психологом А. Р. Вайссом (осенью 1921 г.). Правда, особое внимание к «механистическим» формулировкам обнаруживается у Блумфилда с наибольшей ясностью после 1921 г. Но в целом факты, по-видимому, свидетельствуют не о том, что под влиянием Вайсса Блумфилд начиная с 1922 г. становится «бихевиористом», а затем «механистом», а о том, что, напротив, Вайсе под воздействием Блумфилда пришел к новому пониманию значения языка, которое соответствовало и отвечало его собственному пониманию «некоторых возможностей прогресса человечества, когда за основной постулат поведения человека берется научный механицизм». Приводимые ниже строки являются частью высказывания Блумфилда о Вайссе. 256
«Вайсс не был исследователем языка, но он был, вероятно, первым, кто увидел его огромное значение. Он понял, что язык дает ключ к тем явлениям человеческого поведения и прогресса, которые до того относили за счет нематериальных сил. Всегда находились ученые, которые отказывались верить в призраки нашего коллективного анимизма (мозг, сознание, воля и т. п.), но эти ученые никогда не давали четкого и удовлетворительного объяснения сверхбиологическим действиям человека — поступкам, которые выходят за пределы возможностей животных. В наше время такими учеными являются бихе- виористы — безобразный термин, по мнению Вайсса, который, однако, принял его за неимением лучшего. Вайсc был верным учеником Макса Мейера; система последнего, наиболее законченная в тех своих частях, которые направлены против анимизма и финализма, легла в основу работ Вайсса. Огромный шаг вперед по сравнению с учителем ученик смог сделать именно благодаря признанию первостепенной роли языка...» «Механизм языка составляет специфический фактор в поведении человека...» «Знаменательно, что, найдя этот ключ, Вайсc посвятил все последние годы своей жизни исследованию эстетических и этических явлений, которые до сих пор меньше всего поддавались материалистической интерпретации»11. С другой стороны, «бихевиоризм» Вайсса в том виде, в каком он изложен в его книге «A Theoretical Basis of Human Behavior» (не «бихевиоризм», приписываемый обычно Д. Уотсону), произвел на Блумфилда огромное 11 «Language», 7, 1931, pp. 219—221. Часто утверждают, что книга Блумфилда 1914 г. была основана на психологической системе Вундта, что к 1933 г. Блумфилд уже стал бихевиористом и что в книге 1933 г. свой анализ языка он строит на бихевиоризме. Подобные утверждения не соответствуют тому, что говорил сам Блумфилд. В «Предисловии» к книге «Language» (1933) есть следующее место, которое необходимо читать очень тщательно и принимать буквально: (курсив мой.—Ч. Ф.) «Глубоко укоренившиеся языковые навыки, наиболее важные для всех нас, обычно игнорируются во всех исследованиях, кроме самых передовых и новых: данная книга ставит своей целью рассказать о них простыми словами и показать их воздействие на человека и его дела. В 1914 г. я исходил на этой стадии изложения из психологической системы Вильгельма Вундта, которая была тогда общепринятой. С того времени в психологии произошли большие сдвиги; мы узнали, во всяком случае, то, что один из наших учителей подозревал еще тридцать 17 —2238 257
впечатление именно потому, что он полностью соответствовал основным взглядам, уже выработавшимся у него по отношению к лингвистическому исследованию, и подтверждал их. Но вместе с тем абсолютно безосновательно представлять себе Блумфилда крайним «бихевиористом», который руководствуется в своем подходе к языку самой вульгарной разновидностью бихевиористской психологии. Что касается блумфилдовской «бихевиористской психологии» и того значения, которое он придавал «механицизму», то необходимо с максимальным вниманием отнестись к следующим замечаниям. 1) Блумфилд решительно настаивал на том, что «мы можем изучать язык независимо от какой бы то ни было психологической теории и что, поступая так, мы обеспечиваем надежность наших результатов и увеличиваем их значение для ученых в смежных областях». Такая точка зрения не была новой для Блумфилда в 1933 г. Еще в 1914 г. он писал: «Ученый, который работает в области науки, имеющей дело с психикой [например, лингвистика.— Ч. Ф.], вероятно, может и в идеале должен воздерживаться от каких бы то ни было поспешных психологических объяснений»12. Он с удовлетворением цитировал следующий отрывок из статьи Эдуарда Сепира: «Это более новое направление затрагивает два важнейших вопроса... Во-вторых, мы уже не зависим от психологии, сознавая, что лингвистика, как и всякая другая наука, должна изучать свой объект в себе и для себя, исходя из своих собственных основных принципов; только при этом условии полученные нами результаты будут представлять ценность для смежных наук (в нашем случае особенно для психологии), и в свете данных этих смежных наук они бу