Текст
                    УДК 153:519:612:621:681
Вопросы, связанные с построением "науки об интеллекте”, ставшие особенно
актуальными в эпоху ЭВМ и НТР, рассматриваются в сборнике как в аспекте
человеческого интеллекта, так и в аспекте выяснения принципов построения
"интеллектуальных” машин. Затрагиваются темы изучения сенсомоторики, памяти, языка
и общих интеллектуальных функций (моделирования мира,, планирования, управления,
обобщения и др.).
Сборник рассчитан на специалистов широкого профиля, интересующихся проблемами
искусственного интеллекта.
Рецензенты:
B.C. Гурфинкель, Н.В. Мотрошилова. Д.А. Поспелов
и 1502000000-321 |24.g7_m
042(02)-87
© Издательство ’’Наука”, 1987г.


ВВЕДЕНИЕ Тема интеллекта, уходящая корнями в древность, в эпоху ЭВМ оказалась современной в самом непосредственном смысле слова. Благодаря достижениям физики развитие элементной базы ЭВМ дало фантастические возможности, которые еще требуется понять и научиться использовать. Необходимы новые идеи и, более того, систематическая теория, теория интеллекта. Принципы, лежащие в основе интеллектуальных процессов — узнавания и понимания, обоб¬ щения и абстракции, планирования и оптимизации и т.д., — далеко выходят за пределы задач познания психики. В прошлом эти прин¬ ципы часто представлялись в мистической или натурфилософской форме, например ’’учения о воле”. В наше время они приобретают естественнонаучную конкретность, становясь базой информационной технологии. Теория интеллекта как общая основа изучения и конст¬ руирования интеллектуальных систем, осуществляющих построение модели мира и на ее основе планирование целенаправленного дей¬ ствия, стала актуальной. Нет необходимости подробнее останавливаться на этой мысли. Наука об интеллекте под различными названиями (когнитивная нау- 'ка, когитология и др.) уже развивается. Ее знамением пока является компьютерная метафора: можно заметить много обещающих аналогий в организации памяти ЭВМ и человеческого интеллекта, таких, как модульность строения, разделение на систему представления зна¬ ния и систему планирования действия, учет контекста, использование символьного общения, отделение рабочей памяти от долговременной и многое другое. Подобные аналогии при поверхностном взгляде могут показаться поверхностными, но нет сомнения, что их значение будет возрастать по мере развития архитектуры ЭВМ, превращения ее в многоуровневую систему взаимодействующих автоматов. Это развитие должно преодолеть и известную ’’ортогональность” интеллекта человека и машины: когда то, что легко доступно одному, представляется недостижимым для другого. Главное же сейчас состоит в выяснении наиболее естеетвенного и гармоничного пути междисцип¬ линарного объединения областей психологии, психофизики, нейробиоло¬ гии, лингвистики, математической логики и т.д. Силы всех этих дис¬ циплин направлены на изучение с разных сторон проблемы организации памяти для моделирования мира и выработки действия, адекватного данному контексту. Дистанция от ’’действия” спинальной лягушки, сбрасывающей лапкой смоченную кислотой бумажку, до речевого 3
действия человека огромна. Но оба они представляют собой целенап¬ равленные реакции, организованные с учетом внешних условий и внут¬ реннего состояния и в согласии с какими-то глубинными принципами. Прояснение последних и составляет важную задачу. Надеемся, что сборник найдет свое место в ряду многих уже вышед¬ ших и будущих книг, содействующих этому Великому Объединению. Такую задачу можно выполнить только настойчивыми и координиро¬ ванными усилиями многих исследователей. Конечно, в рамках одной книги невозможно охватить эту тему дос¬ таточно полно. В сборнике затронуты лишь отдельные вопросы изу¬ чения сенсомоторики, памяти, языка как в аспекте человеческого ин¬ теллекта, так и в аспекте машинного моделирования. При составлении сборника преследовалась цель представить читателям различные точки зрения в специальных областях, которым авторы посвятили многолет¬ ние ^как правило, более чем 15—20-летние) исследовния, показать не только сложившийся уровень знаний, но и намечающиеся контуры возможных продвижений. Е.П. Велихов, А.А. Веденов, В.М. Сергеев, А.В. Чернавский
Раздел 1. БИОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ ИНТЕЛЛЕКТА УДК 612:153 МОТОРИКА И ИНТЕЛЛЕКТ P.M. Абдусаматов, М.Б. Беркинблит, А.Г. Фельдман, А.В. Чернавский Моторика и связанное с нею мышечное чувство играют в развитии психики, интеллекта и личности фундаментальную роль. Это поло¬ жение занимает важное место в современных научных представлениях и является результатом длительных изысканий, насчитывающих не одно столетие. Задачу статьи мы видим в том, чтобы с учетом новых данных, полу¬ ченных в физиологии, рассмотреть некоторые аспекты обширного вопроса о роли сенсомоторики в генезисе интеллекта. Под интеллек¬ том здесь будем понимать целенаправленные операции на модели внеш¬ него мира. Иными словами, где-то в нервной системе имеется отоб¬ ражение среды — модель внешнего мира, а также возможность рабо¬ тать на этой модели, т.е. осуществлять внутренние действия (логиче¬ ские операции, вычисления, поиск аналогий и т.д.), которые исполь¬ зуются для решения некоторой задачи, в первую очередь для состав¬ ления плана решения. Итак, можно выделить две составляющие интеллекта: модель мира и набор операций. Постараемся показать, что развитие обеих состав¬ ляющих в значительной мере обусловлено моторикой. Начало современного периода изучения моторики можно соотнес¬ ти с появлением книги Н.А. Бернштейна [1], где систематизирован огромный клинический и экспериментальный материал и заложены основы современных теоретических представлений. Одна из центральных идей этой книги — наличие разных уровней построения движений, ко¬ торые были классифицированы и подробно описаны. В статье будут рассмотрены лишь два уровня организации: врож¬ денные моторные программы и программы, сформировавшиеся в результате обучения. Вначале речь пойдет о моторике животного без учета памяти и психики. При этом будет иметься в виду не столько примитивный организм, сколько некий идеализированный объект, удобный для анализа некоторых теоретических вопросов (так сказать, декартовское ’’животное-машина”). Во второй части будет рассмотрена связь моторики и интеллекта у животного, способного к обучению. 5
ВРОЖДЕННЫЕ МОТОРНЫЕ ПРОГРАММЫ - ПРЕДЫСТОРИЯ ИНТЕЛЛЕКТА Среди биологов достаточно распространенной является точка зрения, что само развитие нервной системы в ходе эволюции в значительной мере определялось развитием моторики. Нервная система просто организованных животных в основном осуще¬ ствляет связь между рецепторами и мышцами. При этом само разви¬ тие рецепторов обусловлено двигательными возможностями живот¬ ного: ведь рецепторы бесполезны, если нет возможности отреаги¬ ровать. Реакция же в подавляющем большинстве случаев — то или иное движение (возможен еще выброс чернил, вспышка света и т.д.). ’’Нигде в филогенезе созерцание мира не фигурирует как само¬ цель, как нечто самодовлеющее”, — писал Н.А. Бернштейн [1, с. 14]. Примеры организмов, которые перешли от свободного образа жизни к прикрепленному (усоногие раки, асцидии и др.), ярко показывают,что утрата двигательных возможностей неизменно сопровождается ре¬ дукцией нервной системы. Вероятно, древнейшие организмы имели только контактные темпе¬ ратурные, химические, тактильные рецепторы, дававшие информа¬ цию о непосредственном окружении. С появлением дистантных ре¬ цепторов расширяется, по словам И.М. Сеченова, смысл сигнала как регулятора мышечной деятельности: ”... приходя издалека, сигналы преуведомляют животное и, будучи разнообразными по содержа¬ нию, способны вызывать не машинально-однообразную двигатель¬ ную реакцию, как прежде (вроде, например, сужения отверстия, за¬ хлопывания клапана и т.п.), а серии подобных реакций” (см. публи¬ кацию [2], с. 21)- Согласно Н.А. Бернштейну, необходимость плани¬ рования и организации подобной осмысленной цепочки движений и действий имеет предпосылкой эволюционное усовершенствование цент¬ рально-нервных приборов [1]. Именно в этой связи Шеррингтон го¬ ворил, что телерецепторы создали головной мозг. Здесь подра¬ зумевается, что сами телерецепторы развивались, обслуживая мотор¬ ный аппарат. Но и моторика приобрела новые возможности с появле¬ нием дистантных рецепторов. "Самой существенной стороной в дея¬ тельности нервных регуляторов является согласование движений с чувствованием” (см. публикацию [2], с. 14). Животные без дистантных рецепторов, как правило, медленно пла¬ вают или ползают, а на раздражения отвечают локальными реак¬ циями (отдергиванием части тела, его изгибанием и т.д.). Развитие моторной системы сделало полезными дистантные рецепторы. Дис¬ тантные рецепторы сделали полезной и возможной быструю локо- моцию — быстрое перемещение всего тела в пространстве. Вторая важнейшая заслуга дистантных рецепторов состояла в том, что они позволили организмам овладеть дальним пространством, до ко¬ торого нельзя дотянуться. Итак, наряду с развитием рецепции шло развитие самого мотор¬ ного аппарата: появились рычажные конечности с многими суставами, сотни мышц разнообразного назначения и т.д. Эта моторная систе¬ ма имеет свой собственный рецепторный аппарат: мышечные, сустав- 6
ные, сухожильные рецепторы. Обработка сигналов, идущих от нее (проприорецепторов), становится, пожалуй, не менее сложной, чем от телерецепторов, и тоже требует развития мозга. С другой стороны, координация работы разных мышц и суставов становится все более сложной задачей и требует появления соответствующих систем управ¬ ления. Мы эскизно очертили проблему совместной эволюции сенсорики и моторики, которые во многом и определили развитие нервной сис¬ темы. Вторая важная для нашей темы мысль состоит в том, что организ¬ му приходится иметь дело с двумя сложными системами: внешним ми¬ ром и своим собственным моторным аппаратом. В нервной системе должны присутствовать модели обеих, а также должно быть обеспечено их взаимодействие. В ходе эволюции выработались врожденные схемы управления сложным моторным аппаратом: безусловные рефлексы и ’’центральные программы”. Модели Безусловные рефлексы. За 300 лет, прошедших с того момента, как Декарт ввел в научный обиход понятие ’’рефлекс”, а особенно за пос¬ леднее столетие биологами обнаружено и изучено огромное количест¬ во безусловных рефлексов. С 60-х годов выявлены нейронные схемы, лежащие в основе многих таких рефлексов (описание рефлекторных дуг вошло в школьные учебники). Нашей целью не является перечисление известных рефлексов или детальное описание их конструкции. Рассмотрим рефлексы с сеченов¬ ской точки зрения: в какой мере их можно принять за один из источ¬ ников возникновения интеллекта. Любой, даже самый простой рефлекс осуществляется специализи¬ рованным устройством, в конструкции которого учтены и свойства внешнего мира, и особенности анатомии животного. Возьмем в ка¬ честве простейшего примера один из защитных рефлексов — флексор- ный рефлекс, который состоит в том, что животное или человек уда¬ ляет конечность от болевого раздражителя еще до того, как осознает ситуацию. Этот рефлекс начинается с возбуждения болевых рецепторов, затем следует передача сигналов по’тонким нервным волокнам. Сиг¬ налы эти после нескольких переключений на интернейронах спинного мозга достигают мотонейронов, которые вызывают сокращение соот¬ ветствующих мышц. Фактически в конструкции этого рефлекса ’’запи¬ саны” определенные сведения о внешнем мире: те факторы, которые раздражают болевые рецепторы, вредны и от них следует удалиться (огонь, острый шип, хищник и т.д.). С другой стороны, в конструкции рефлекса "записаны” и сведения о собственном моторном аппарате: если мы укололи палец, то возбуждаются мышцы, сгибающие руку, удаляя его от раздражителя. Эти сведения, которые можно считать простейшими моделями как внешнего мира, так и собственного тела, неразрывно связаны с кон¬ струкцией ’’машины” и собственно в ней заключаются: сведения о внеш¬ нем мире и собственном теле записаны в конструкции рецепторов и
соответствующих нервных связях. Они накоплены в ходе филогенеза и введены эволюцией в геномы соответствующих организмов. С другой стороны, рефлексы — это готовые правила действия в дан¬ ных ситуациях. Подобно школьнику, выучивающему правило: ’’чтобы сложить две дроби...”, организм имеет правило: ” чтобы избежать ис¬ точник боли...” Можно сказать, что в рефлексе содержится план вер¬ ного движения, но он неразрывно связан с самим движением и опять- таки записан в системе нервных связей. Таким образом, в безуслов¬ ном рефлексе модели и планы не дифференцированы. Сигналы, запускающие рефлексы. Рассмотрим теперь пример другой защитной реакции, возникающей в ответ на сигнал дистантных рецеп¬ торов. Если поднять руку над головой черепахи так, что на ее глаза падает тень, черепаха втягивает голову под панцирь. В ответ на зате¬ нение муха взлетает, медуза сокращает колокол, лягушка прыгает с берега в воду и т.д. Большая тень — сигнал возможной опасности, и на это у животных выработались соответствующие рефлексы. Однако конструкция рефлекса зависит от характера взаимоотно¬ шений животного с внешним миром. У многих копытных новорож¬ денный детеныш в ответ на затенение поднимает голову вверх и начи¬ нает искать сосок матери. Мир детеныша устроен иначе, и тень для него значит совершенно иное: чаще всего появление матери. Необходимо подчеркнуть, что для вызова рефлекторной реакции существенным является не весь комплекс раздражителей, а только некоторая его часть — обобщенные сигналы. Так, рефлекс отдерги¬ вания возникает в ответ на особенности раздражителей (огонь, шип, укус хищника и т.п.), представляющие собой обобщенный сигнал о боли. Запах бабочки-самки, по которому самец отыскивает ее за не¬ сколько километров, — это тоже ’’знак”, один из признаков, сигнали¬ зирующий о наличии самки. Движущееся небольшое темное пятно — символ добычи для лягушки и т.д. Итак, рефлексы запускаются достаточно обобщенными сигналами, связанными с существенными признаками ситуаций или объектов. В этом отношении пусковые сигналы несколько аналогичны понятиям, заменяющим предмет при интеллектуальных действиях; понятия также отражают существенные признаки предметов. Конечно, в случае реф¬ лекторных сигналов существенным оказывается тот признак, который имеет биологическую значимость для животного. Таким образом, эволюция, вырабатывая рефлексы, решала и за¬ дачу обобщения, выделения сходных ситуаций и их общих признаков. Иными словами, эволюция была вынуждена решать проблему узнава¬ ния — столь важную операцию для интеллектуальных действий1. Узиаваиие и детекторы. Для решения задачи узнавания существу¬ ют специальные устройства. Это может быть некий класс рецепторов (болевые рецепторы) или же достаточно сложные нервные сети. При¬ мером является часть зрительной системы, которая узнает ’’большую тень” или ’’маленькое темное пятно” и вызывает реакции бегства или прыжок на добычу. У амфибий такая узнающая система локализована 1 См. статью Ш.А. Губермана в наст. сб.
непосредственно в сетчатке. Соответствующие устройства называют детекторами. Таким образом, входная часть рефлекторных машин может рас¬ сматриваться как узнающая машина или система классификации сиг¬ налов внешнего мира. Существуют детекторы самой разной модаль¬ ности и весьма разного уровня сложности. Например, лягушки отли¬ чают не только кваканье особей своего вида, но его местный ’’диа¬ лект”. Для сверчков отмечен замечательный факт: при межвидовой гибридизации гибридные самки привлекаются в наибольшей степени стрекотанием соответствующих гибридных самцов. Это показывает, что геном гибридов меняет и их двигательное поведение (особенности стрекотания), и систему восприятия (слуховую систему самок) кор¬ релированным образом. Показано, что в мозгу обезьян тоже существу¬ ют специализированные узнающие устройства для восприятия звуков и зрительных образов. Так, обнаружены нейроны слуховой коры, ко¬ торые реагируют на крики обезьян данного вида, записанные на маг¬ нитофон, но если ту же магнитофонную ленту разрезать на куски и по¬ менять их последовательность, то реакция нейронов не возникает. У обезьян и людей есть специализированная система для узнавания лица, на обезьянах показано, что ее нейроны не дают ответов на дру¬ гие зрительные образы. Эти опознающие системы выработаны эволюцией и не требуют для своей работы предварительного обучения животного. Рефлексы и пространство. Модель потирательного рефлекса. Среди безусловных рефлексов есть и такие, в которых конечный эффект состоит в выделении слюны, разряде электрического органа и т.д. Од¬ нако у большинства рефлексов конечным звеном является движение. Чтобы оно было эффективным, при построении рефлекса должны пра¬ вильно учитываться пространственные отношения. По мере отработки рефлексов в ходе эволюции в нервной системе возникают разные спо¬ собы учета пространственных свойств окружающей среды и собствен¬ ного тела. Такие рефлексы, как отдергивание руки при уколе или убегание от большой тени, не требуют точности движений — достаточно весьма грубой ориентировки в пространстве. Однако существуют и другие рефлексы, требующие куда более ос¬ новательного его знания. Рассмотрим два примера. По крайней мере полтораста лет изве’стен так называемый потира- тельный рефлекс лягушек. Он состоит в том, что лягушка сбрасывает кончиком лапки с тела кусочек фильтровальной бумаги, смоченной сла¬ бым раствором кислоты. Этот рефлекс хорошо выражен и у спиналь¬ ных животных, т.е. лягушек, у которых головной мозг отделен от спинного. У них рефлекс выполняется только одним спинным мозгом. Уже давно было показано, что спинальная лягушка может удалять задней лапкой бумажку с самых разных точек кожи. Чтобы попасть в них, лягушка использует различные моторные программы для зад¬ ней конечности. Следует отметить, что задняя лапка лягушки состоит из пяти звеньев (если не считать суставов между фалангами пальцев, ко¬ торые на самом деле тоже используются в построении движения), и само 9
Рис. 1. Прицельные позы задней конечности при потирательном рефлексе у спиналь¬ ной лягушки а — вариации прицельных поз в разных циклах рефлекса (7—5). направленного иа одно и то же место кожи (зачерненный квадрат): зачерненные кружки — положения рабочих точек коиечиости; б—д — прицельные позы при разных локализациях стимула по себе управление пространственными движениями такой много¬ звенной системы — непростая задача. Спинальная лягушка успешно выполняет потирательный рефлекс при изменении конфигурации ее тела [3]. Опыты состояли в том, что бумажка помещалась на кожу передней лапы, которая располагалась под разными углами к туловищу (поднималась вверх, опускалась вниз, ставилась перпендикулярно к плоскости тела и др.). Лягушка соот¬ ветственно меняла движения задней лапы, успешно удаляя бумажку с кожи. Спинальное животное ведет себя, как если бы оно ясно пред¬ ставляло взаимное положение частей своего тела в пространстве (име¬ ло бы ’’схему тела”). Таким образом, движение пятизвенной конеч¬ ности строится в зависимости от положения раздражаемой точки кожи и конфигурации тела (рис. 1). Отсюда видно, что уже спинной мозг мо¬ жет работать с весьма сложными пространственными системами. Этот пример показывает, в какой мере врожденные рефлексы овладевают пространственными отношениями, связанными с собственным телом. Отметим одну чрезвычайно важную черту рассматриваемого движе-
Яия. Непосредственно перед смахиванием бумажки лягушка принима¬ ет некоторую позу, которую назвали прицельной [4]. Задняя лапка ля¬ гушки в этой позе помещается так, что кончики пальцев оказыва¬ ются прямо перед стимулом. При повторных движениях лягушка при¬ водит кончики пальцев в одно и то же место (с точностью до несколь¬ ких миллиметров), но при этом значения углов в суставах конечнос¬ ти могут не повторяться. Такой способ управления движениями — управление рабочей точкой — наблюдался и при рабочих движениях человека [1]. Например, при ударе молотком по зубилу рабочая точ¬ ка — конец молотка — точно попадает в цель, а суставные углы при последовательных движениях заметно варьируют. Управляющая систе¬ ма следит не за изменением каждого отдельного угла во времени, а за некоторой функцией всех этих углов (при пятизвенной конечности лягушки эта функция достаточно сложная). Кроме того, успешное прицеливание и смахивание бумажки осу¬ ществляется лягушкой даже в том случае, если ввести искусственные ограничения на движение, например зафиксировать один из суставов. Это еще раз показывает, что при построении движения учитывается взаимное положение звеньев, т.е. ’’схема тела”. Вариации суставных углов в повторных движениях и возможность достижения цели при фиксации сустава заставляют предположить, что рефлекс^выполняется по некоторому алгоритму, который позво¬ ляет по заданному положению стимула и конфигурации цели опре¬ делить необходимые команды для движения суставов задней конеч¬ ности лягушки. Опишем кратко такой алгоритм, имитирующий ука¬ занные выше особенности потирательного рефлекса [5]. Рассмотрим движения в плоскости, реализуемые конечностью, состо¬ ящей всего из трех звеньев единичной длины (рис. 2, а). Конфигура¬ ция конечности задается тремя суставными углами. Рабочую (дисталь¬ ную) точку конечности необходимо привести к цели. Примем, что система управления с помощью каких-то рецепторов осведомлена о значениях всех суставных углов и локализации цели. Упрощая, пока считаем, что система управления определяет кинема¬ тические переменные — углы и их производные. В основе предполага¬ емого алгоритма лежат следующие простые соображения. Во-первых, каждый сустав поворачивает ’’свой” вектор по направлению к цели, не обращая внимания на то, что делают в это время другие суставы, и не учитывая конфигурацию всей конечности. В этом отношении систе¬ ма управления суставами ведет себя как коллектив автоматов Цет- лина [6]. Во-вторых, скорость поворота векторов больше для тех углов, которые могут обеспечить более успешное продвижение рабочей точ¬ ки. Один из возможных вариантов такого алгоритма можно записать в следующем виде: ф, = a,{R, X R], где а,- — некоторые положительные константы, а квадратные скобки означают векторное произведение. Такой алгоритм обеспечивает дости¬ жение цели при разных исходных условиях, разных положениях целе¬ вой точки и при фиксации одного из суставов (рис. 2, б). 11
I R ' o Рис. 2. Модель управления трехзвенной конечностью при движении ее рабочей точки (зачерненный кружок) к цели (незачерненный кружок) а — графическое представление коиечиости: сплошная и штриховая линии — начальное и финальное положение соответственно, ф|—фз — суставные углы; R — прицельный вектор всей конечности, R,—R, — индивидуальные векторы суставов; б, в — примеры траекторий движения рабочей точки к цели и три промежуточных положения конечности; г — пример сильной зависимости финальных поз конечности (/) и/2) от начальных поз (/1 и /2); д — фиксация одного из суставов (зачерненные треуголь¬ ники) ие препятствует достижению цели 12
^ Рассмотренный пример относится к пространственным отношениям, связанным с собственным телом. Второй пример относится, напротив, 1C внешнему пространству. Далеко не все рефлексы направлены на столь непосредственные цели, как устранение боли, схватывание добычи и т.д. Важным является, например, ориентировочный рефлекс. При появлении в поле зрения какого-либо предмета (или при новом звуке и др.) многие животные поворачивают глаза и голову по направле¬ нию к появившемуся предмету. Частью этого рефлекса является скачок глаз по направлению к пред¬ мету, привлекшему внимание, который при этом попадает на централь¬ ную область сетчатки, что позволяет хорошо его рассмотреть. Скачкй глаз осуществляются особой нейронной машиной среднего и продолго¬ ватого мозга, которая управляет шестью глазными мышцами так, чтобы направить ось глаза в нужном направлении2. Скачок глаза выполняется с высокой точностью. Рассмотрим в качестве третьего примера тот же четверохолмный ориентировочный рефлекс: поворот головы и глаз в сторону нового объекта. Такой рефлекс вызывают и зрительные и слуховые стимулы, а также тактильные, обонятельные и др. Можно было бы сделать много отдельных рефлекторных устройств для каждого стимула. Однако реально это устроено иначе. Для поворота глаз и на зрительные и на слуховые стимулы используются те же самые верхние холмы четверо¬ холмия, на которые есть и проекция сетчатки, и проекция положения зву¬ ковых источников в пространстве, а также проекции от рецепторов мышц глаз и шеи, задающих схему тела (положения глаз в орбитах и головы относительно туловища). Выработаны соответствующие операции для правильного поворота головы и глаз. Например, недавно было показано, что у обезьян поворот глаз в новое положение приводит к сдвигу ’’зву¬ ковой карты” относительно карты запуска скачков. Таким образом, взаимодействие рефлексов приводит к сложному взаимодействию сиг¬ налов разной природы, причем они обслуживают организацию движе¬ ний, в нашем примере — поворот головы и глаз. Этот пример является отнюдь не уникальным. Например, в области мозжечка, которая издавна считалась "вестибулярным мозжечком”, сейчас обнаружены входы от сетчатки, от мышечных рецепторов глаз и шеи. При возникновении такого рода областей нервные клетки, связанные с .разными органами чувств, приобретают способность находить друг ДЕУГа. Фактически верхние холмы — это специализированная область мозга, которая оценивает положение внешних предметов в пространстве и продуцирует движения глаз с учетом схемы тела. В ней уже представ¬ лены способы работы с пространственными отношениями, но еще в полном подчинении моторной задаче. Упомянутые здесь и многие другие рефлексы образуют базовый механизм для овладения пространством (как ближним, так и дальним). Это относится и к самим движениям, и к обслуживающей их системе врожденных механизмов восприятия пространственных отношений: 2 См. подробнее в статье Е.Н. Соколова в наст. сб. 13
способности оценивать расстояние, знанию о "крае” и т.д. Среди движений, связанных с ближним пространством, хорошо изучены, например, такие сложные движения, как умывание ряда млекопитаю¬ щих или прыжок для ловли взлетающей птицы у кошки (это движение обслуживается "центральной программой”). Два класса движений. Большинство движений можно разделить на два класса, так сказать, на пространственные и временные. Для первого класса движений организующим фактором является наличие целевой точки, принадлежащей внешнему пространству (это может быть участок поверхности своего тела, ближнее или дальнее окружающее простран¬ ство). Такие движения имеют задачу: совместить с этой точкой "рабо¬ чую точку” (чаще всего дистальную точку конечности или определен¬ ную точку инструмента и т.п.). Второй класс движений имеет другой характер. Здесь главным является точное временное согласование элементарных движений, образующих целое, — "кинетическая мелодия”. Н.А. Бернштейн называл движения такого типа синергиями. Кроме этих двух классов движений, можно указать и промежуточные, состав¬ ные движения. В чесательном рефлексе, например, на фоне колеба¬ тельного движения лапы (второй класс), совершается придвигание определенной точки тела или головы к кончику движущейся конеч¬ ности — движение, относящееся к первому классу. Движения первого класса в основном направлены на решение внеш¬ них задач и в большей степени связаны с развитием интеллекта. Во второй класс входит триада выразительных движений (мимика, пан¬ томимика и пластика), связанных с субъективной стороной развития личности. «Центральные программы». За последние десятилетия было показа¬ но, что для целого ряда движений внутри нервной системы имеются специализированные нейронные машины — центральные программы, которые могут работать у обездвиженного животного, когда мышечные рецепторы не могут посылать сигналы в мозг. Хотя мышцы у таких животных не сокращаются, в соответствующих нервных клетках при ра¬ боте центральных программ сменяются процессы возбуждения и тор¬ можения в той же последовательности, что и при нормальных движе¬ ниях, с периодами, соответствующими нормальной ходьбе, жеванию и т.д. (такие режимы называются "фиктивная локомоция”, "фиктивное жевание” и т.д.). Центральные программы особенно тщательно изучены для ряда движений второго класса по введенной выше терминологии (локомоция, жевание, глотание и т.д.), хотя существуют центральные программы и для таких движений, как прыжок для поимки взлетающей птицы. Если в простейших рефлексах, о которых шла речь выше, в структуре нервной системы отражаются как некоторые свойства внешнего мира, так и анатомия животного, в центральных программах прежде всего отражается строение моторного аппарата животного. В некотором отношении центральная программа — это шаг вперед от безусловного рефлекса. В рефлексе свойства внешнего мира и своего тела были еще почти неразрывно объединены, в центральной программе произошла дифференциация этого единства. 14
(Если безусловный рефлекс — это прежде всего специализированное устройство для реакции на определенную ситуацию внешней среды, тр центральная программа — специализированное устройство для ор¬ ганизации определенного типа движений, которые могут возникать прйгралТТых внешних условиях. Именно поэтому центральные програм- йыдюлее независимы от текущей афферентации. В безусловном рефлексе им^етоГнепрерывная цепь событий — афферентный сигнал вызывает двигательную реакцию. В эволюции нервная система приобрела воз¬ можность прерывать эту последовательность на любом этапе. Аф¬ ферентный сигнал может анализироваться, не вызывая двигательной реакции. Такой процесс можно назвать восприятием. С другой стороны, оказалось возможным вызывать двигательную реакцию без афферент¬ ного сигнала извне. Это, по-видимому, и привело к возникновению центральных программ. / Подобно тому как центральные программы возникают из эффек- торного конца рефлекса, восприятие возникает из его афферентного конца. Детекторы и другие узнающие системы, запускающие рефлексы, дают начало ’’чистому восприятию”, как центральные программы являются механизмами ’’чистых движений”. Вопрос о генезисе такого ’’расщепления” рефлексов заслуживает специального анализа. Заметим лишь, что в результате этого процесса у входных устройств появи¬ лось несколько потребителей, а у выходных — несколько хозяев. Впрочем, выразительные движения, в согласии с точкой зрения Дарвина (’’О выражении ощущений у человека и животных”) и этологов (напри¬ мер, так называемая ритуализация), приобретают определенного хозяина, именно ту или иную мотивацию. Интересно сопоставить с изложенным ’’расщепление” в организа¬ ции памяти ЭВМ: базы данных создаются, по мнению специалистов, когда оправдано отделение данных от задач или программ их обработки. Командные нейроны и управляющие центры. Центральные прог¬ раммы обычно запускаются (’’включаются”) вполне определенными структурами: у беспозвоночных, как правило, отдельными нейронами (их называют командными нейронами данного движения), у позво¬ ночных — теми или иными центрами (например, локомоция кошки может быть вызвана раздражением области среднего мозга, называемой мезенцефалическим локомоторным центром [7]). Команда от управляющего центра или командного нейрона может быть очень проста. Она не имеет ничего общего с вызываемым ею движением. Например, полет саранчи можно вызвать, раздражая соот¬ ветствующий отдел ее мозга последовательностью импульсов от ге¬ нератора случайных чисел. Локомоторную область у кошки можно раздражать, например, ритмически с частотой 50 Гц, не имеющей ни¬ какого отношения к частоте провоцируемой ходьбы. Весьма простая команда может вызывать весьма сложное движение. Например, в слу¬ чае локомоции — упорядоченные во времени и по усилиям сокращения многих мышц конечности и согласованные движения четырех конеч¬ ностей (это напоминает ситуацию, когда при нажатии на кнопку двер¬ ного звонка исполняется некоторая мелодия). Совершенно ясно, что в данном случае сигнал от командных нейро¬ 15
нов не несет информации о том, как построить соответствующее слож¬ ное движение. Такая информация содержится в структуре нервной системы, которая отражает особенности устройства моторного аппара¬ та. А сигнал от командных нейронов играет чисто пусковую роль. EqJin в случае рефлексов пусковой сигнал отражал какое-то свойство внешнего мира ("опасность”, ’’добыча” и др.), то в случае командных нейронов такой сигнал запускает некоторое движение, независимое от внешней ситуа¬ ции (’’локомоция”, ’’жевание”, ’’глотание” и т.д.). Подобно тому как набор рефлексов задает модель внешнего мира, набор командных ней¬ ронов задает двигательный репертуар, обеспеченный готовыми нейрон¬ ными машинами. Возможность запуска командных нейронов создает предпосылки возникновения системы порождения произвольных дей¬ ствий. Операции На первый взгляд операции, которые осуществляются рефлексами и центральными программами, — это более или менее сложные дви¬ жения, в то время как для развития интеллекта требуется возникновение совершенно иных (внутренних) операций. Однако в действительности движения — это только внешняя, наиболее бросающаяся в глаза кар¬ тина, за которой стоит набор внутренних операций. Возможно, что именно такие внутренние операции, используемые при выполнении отдельных рефлексов и центральных программ, подготавливают базу интеллектуальных операций. Операции, используемые при выполнении отдельных рефлексов и центральных программ. В ходе эволюции врожденных моторных программ в нервной системе выработался ряд устройств для выпол¬ нения как простых, так и достаточно сложных операций. Рассмотрим для примера тот же потирательный рефлекс. Время, ко¬ торое проходит от наложения бумажки с кислотой на кожу лягушки до начала движения, называют латентным периодом. Он тем больше, чем меньше концентрация кислоты, т.е. чем слабее сигнал, идущий от кожи. Это значит, что в нервной системе есть временной сумматор, который накапливает сигналы и запускает реакцию, когда сумма дос¬ тигает некоторого значения. Когда концентрация кислоты слишком мала, реакция не возни¬ кает вообще (сигнал подпороговый). Но если на другой участок кожи положить вторую бумажку, которая сама по себе тоже не вызывает ^реакции, то движение возникает (причем оно точно направлено на один из стимулов). Это показывает, что сумматор может накапливать сигналы, приходящие с разных точек кожи. Но тот же потирательный рефлекс дает нам пример гораздо более сложных операций. Как уже говорилось, многозвенная конечность по¬ падает в нужную точку кожи при разных конфигурациях тела лягушки. Можно было бы предположить, что для попадания в данную точку кожи нервной системе вообще не требуется вычислений, что эволюция выра¬ ботала способ включения сразу нужных мышц. Однако опыты показали, что достижение цели происходит и при существенном утяжелении лапы и при фиксации одного из суставов (в этих опытах принимал 16
участие М.JI. Латаш). Они позволяют думать, что спинной мозг обла¬ дает в некотором смысле вычислительным алгоритмом, который приводит рабочую точку в цель, учитывая разные внешние условия. Пример такого возможного алгоритма был описан выше. В таком врожденном движении, как скачок глаза на движущуюся цель, управ¬ ляющая система решает задачу экстраполяции, так как глаз перево¬ дится на движущуюся точку с учетом ее скорости и при этом сам при¬ обретает ту же угловую скорость. При локомоции кошки необходимо обеспечить согласованное дви¬ жение четырех конечностей, так чтобы они имели одну и ту же час¬ тоту и сдвиг фаз, зависящий от скорости. Тут должна быть решена задача синхронизации (с временной задержкой) по крайней мере че¬ тырех нейронных осцилляторов. Система синхронизации устроена так, что она предусматривает переход от противофазной работы конечностей одного пояса (ходьба, рысь) к синфазной (галоп) [7]. Следует еще иметь в виду пропуск отдельных блоков, на которые могут быть разбиты данные врожденные движения (’’бессознательная комбинаторика”), возникновение новых сочетаний блоков (возможно, так создаются в эволюции центральные программы) и т.д. «Логика рефлексов». Животное существует в мире, из которого одновременно поступает много сигналов. Каждый из них в принципе может запускать какие-то свои рефлексы. Если взаимодействие меж¬ ду ними не организовано, то поведение будет хаотичным. Поэто¬ му даже нервной системе, работающей на чисто рефлекторном уровне, необходимо регулировать взаимодействие рефлексов, определять зна¬ чимость сигналов (которая может меняться в зависимости от потреб¬ ностей организма) и т.д. Рассмотрим вначале проявления рефлекса — геотаксиса моллюска прудовика (т.е. его движение по направлению действия силы тяжести или против нее ) — в зависимости от внешних условий. Например, если в воде мало кислорода и температура комнатная, то улитка, погруженная в воду, ползет вверх, но при понижении температуры до 5—10°С улитка начинает ползти вниз (обычно при низкой темпера¬ туре в воде растворяется больше кислорода). Если же повысить дав¬ ление примерно на Ша, то и при низкой температуре моллюск пол¬ зет вверх (такое давление означает, что прудовик забрался слишком глубоко — на десятиметровую глубину). Здесь наблюдается прояв¬ ление достаточно сложной обработки входных сигналов по принци¬ пу ’’если ..., то ...” с учетом содержания кислорода в воде, темпера¬ туры и давления. Другой пример взаимодействия рефлексов состоит в том, что у мно¬ гих моллюсков очень силен "рефлекс отдергивания”: при прикосно¬ вении головой к любому предмету моллюск быстро отдергивает го¬ лову назад. Если бы признаки пищи не отключали этот сильный за¬ щитный рефлекс, все обладающие им моллюски отдергивали бы го¬ лову от пищи и погибали бы от голода. Итак, первый способ взаимодействия рефлексов — использование дискретной логики при решении вопроса о том, в каких обстоятельст¬ вах и какой рефлекс использовать. 2. Зак. 1668 17
Второй способ взаимодействия рефлексов, который представляется нам очень интересным, — комбинаторика блоков от разных рефлек¬ сов. Видимо, разные блоки могут использоваться в разных сочета¬ ниях, как в современной радиотехнике. Эволюция давно использовала этот прогрессивный путь. Например, при потирательном рефлексе лягушка после смахива¬ ния стимула резко распрямляет лапу, по-видимому используя тот же блок, что и во время толчка при плавании. Спинальная кошка при спотыкании использует блок ’’коррекция спотыкания” (подъем лапы над препятствием), вставляя его внутрь программы ’’ходьба”. Интактная лягушка способна смахнуть задней лапой со спины бумажку с кислотой во время прыжка, в полете, ис¬ пользуя блок ’’смахивание” внутри программы ’’локомоция” и т.д. Хотелось бы подчеркнуть два момента. Во-первых, центральные программы, с одной стороны, хороши тем, что могут быть исполь¬ зованы в разных ситуациях, но, с другой стороны, плохи тем, что сами по себе не имеют прямой связи с внешней средой. В результате цент¬ ральные программы взаимодействуют со средой через специальные рефлексы, которые действуют не на мышцы, а именно на сами цент¬ ральные программы. Приведем удивительный пример, когда афферентная ситуация моди¬ фицирует смысл сигнала командного нейрона. У таракана найден командный нейрон, который запускает бег насекомого, если его лапы касаются опоры. Если же лапы находятся в воздухе, то раздражение того же самого командного нейрона вызывает не бег, а полет. В этом случае командный нейрон посылает достаточно абстрактную команду ’’включаю локомоцию”, конкретный смысл которой придает об¬ становка. Во-вторых, сама возможность нейронных машин использовать раз¬ ные сочетания блоков представляется нам крайне существенной. Сма¬ хивание стимула лягушкой в полете не менее удивительный мотор¬ ный гибрид, чем кентавр греческой мифологии. Воображение, фантазия тоже используют комбинации из блоков, хотя и иной природы. Наконец, рассмотрим непрерывное изменение свойств одного реф¬ лекса под влиянием другого. Существует целый класс рефлексов, свя¬ занный с положением тела животного относительно направления сиЯы тяжести. Они позволяют, например, животному, перевернутому на спину, быстро принять нормальное положение. Эти рефлексы обус¬ ловлены сигналами, идущими от вестибулярного аппарата, ‘кожных рецепторов, мышц шеи и др. Если животное находится на наклонной поверхности, то под действием таких сигналов меняются параметры рефлексов на растяжение мышц конечностей. У конечностей, которые будут нести большую нагрузку, эти рефлексы становятся более эффек¬ тивными3. Таким образом, в нервной системе есть участки, воздей- 3 Интересно отметить, что рефлексы положения занимают как бы промежуточное место между безусловными рефлексами, обслуживающими внутреннюю среду, а также выразительными движениями, не имеющими пространственного характера, и "экстра- вертивными" движениями, направленными на взаимодействие с внешней средой и тре¬ бующими отражения в модели мира пространственных свойств афферентации. В них 18
ств^я на которые можно управлять параметрами рефлексов. То же от¬ носится и к центральным программам. Фактически командные нейроны и являются таким местом воздействия, так как при раздражении их с разной силой в ряде случаев можно получить регуляцию управля¬ емого ими движения (рост скорости локомоции, амплитуды чесания и т.д.). Итак, на рефлекторном уровне в ходе эволюции выработался ряд операций и на уровне отдельных рефлексов (суммация, экстраполя¬ ция, и т.д.), и для согласования рефлексов. В последнем случае можно выделить операции дискретной логики (запрет, условный переход и др.) и, так сказать, ’’непрерывную логику” (не в обычном смысле слова, а именно параметризацию рефлексов). Мы пришли к заключению, что наше животное, наделенное рефлексами и центральными программами, обладает ’’филогенетическим интел¬ лектом”, который во многом похож на интеллект индивидуумов. Здесь имеется и модель мира, и возможность ее целесообразно ис¬ пользовать, и свойства, несколько сходные со свойствами обычного интеллекта (возникновение ’’ассоциаций”, ’’фантазий” и т.д.). Фило¬ генетический интеллект обладает и еще одним важным признаком обычного интеллекта: на основе уже имеющихся ’’знаний” возможны новые достижения. Но возникают они не у отдельного животного, а в процессе естественного отбора. ПРОИЗВОЛЬНЫЕ ДВИЖЕНИЯ И ИНТЕЛЛЕКТ До сих пор мы рассматривали только ’’животное-машину”, считая что оно полностью лишено памяти, а следовательно, и индивидуаль¬ ного опыта и обходится только врожденными программами. Теперь мы перейдем к рассмотрению животного, наделенного ’’верхними этажами” психики, прежде всего активностью и памятью. Укажем на некоторые существенные для дальнейшего изложения различия между ’’животным-машиной” и активным, обучающимся животным. Одно из них состоит, очевидно, в том, что обучающееся животное способно к накоплению индивидуального опыта. Историческое зна¬ чение работ И.П. Павлова заключается, в частности, в том, что он ввел в физиологию изучение процесса обучения — условного рефлек¬ са. Вместе с тем изучение условных рефлексов, как и рефлексов без¬ условных, — это изучение реакций на сигналы, поступающие из внеш¬ ней среды. За последнюю четверть века в научный обиход вошло понятие ак¬ тивности [8]. Оно означает, что движения и вообще поведение живот¬ ного могут возникать не только как ответ на приходящие сигналы, но и в отсутствие таковых за счет собственных возможностей доста¬ точно развитой нервной системы. Н.А. Бернштейн писал, что действия, для которых не только программа, но и инициатива начала целиком определяются изнутри индивида, в наиболее точном определении их имеет значение в первую очередь одно направление внешнего пространства — верти¬ каль, а также ускорения, в том числе угловые. Но эти характеристики воспринимаются исходно как бы изнутри, как свойства внутренней среды. 19
являются тем, что принято называть произвольными действиями [8]. Это понятие с трудом прокладывало себе дорогу в сознание ис¬ следователей, привыкших тесно связывать поведение организма с воздействиями окружающей среды. Внутреннюю активность нередко сме¬ шивали с беспричинностью действий. Хотя сейчас в самом общем плане отношение к понятию ’’активность” изменилось, ее конкретные физиологические механизмы остаются почти совершенно невыяс¬ ненными. Память Память и интеллект. Выше отмечалось, что уже ’’рефлекторное жи¬ вотное” сделало существенные шаги в овладении пространством. Не¬ которые успехи были и в овладении временем. Например, для правиль¬ ного скачка глаза на движущуюся цель необходимо учесть время дви¬ жения цели в период подготовки скачка, для согласования движений четырех конечностей — иметь линии временной задержки для пере¬ дачи соответствующих сигналов. Однако только память позволила всерьез овладеть временем, использовать в поведении опыт даже да¬ лекого прошлого. Это требует специальной организации памяти, воз¬ можности быстро найти в ней нужное событие (ситуация тут несколь¬ ко сходна с записью генетической информации: хотя гены располо¬ жены в хромосоме линейно, имеется возможность включить или вы¬ ключить нужный ген, найдя его ”по адресу”). Наличие памяти принципиально меняет требования к органам чувств. Для врожденных программ требуется, чтобы на ’’входе” стояли некие ’’фильтры”. Они могут быть очень грубыми, например обеспечивать ответ на любую большую тень, либо они могут быть очень ’’остры¬ ми” и узнавать видоспецифическую песню или видоспецифичный за¬ пах, но во всех случаяхпропускаютлишь обобщенные сигналы. Таким образом, рефлекторные существа живут в мире своеобраз¬ ных абстракций, и только достаточно высокоразвитые организмы способны подняться до восприятия конкретных образов (чтобы потом подняться до нового — знакового — уровня абстрактности). Только для организма, способного обучаться (запоминать, узнавать, делать выбор), приобретает смысл достаточно детальный анализ свойств окружающего мира (знание особенностей местности, повадок раз¬ ных видов жертв или врагов, индивидуальные особенности партне¬ ров по стаду или стае и т.д.). Подобно тому как дистантные органы чувств вообще бесполезны для неподвижного животного, сложные органы чувств практически бесполезны для животного с бедным, стандартным репертуаром дви¬ жений. Наличие памяти позволяет животным учиться новым сочета¬ ниям врожденных движений и вообще новым движениям. Это делает целесообразным развитие тонкого восприятия. Возникновение памяти — это отделение специализированного нервного субстрата от конкретной ситуации внешнего мира. При врожденных рефлексах определенный сигнал внешнего мира активирует 20
совершенно определенные нервные связи, специально для этого пред¬ назначенные, а действие и его нервный субстрат неразрывно связаны. Животное с памятью может запомнить любой предмет, любое событие, для которых нет заранее приготовленных нервных связей. Локали¬ зация образа памяти не предопределена генетически (запоминаться может объект, который никто из предков животного не видел), а за¬ висит скорее от предшествующего опыта животного. Возможность запомнить любой объект означает появление принципиально нового свойства нервной системы — универсальности, способности работать с любыми сигналами. Это свойство и требует выработки новых спосо¬ бов оперирования с входной информацией — замену фильтров универ¬ сальными операциями, применимыми к любым образам, в частности операцией конструирования новых фильтров. Подобно тому как постоянная температура тела сделала животных независимыми от условий внешней среды, создала возможность быть активными и днем и ночью, жить и в тропиках и на севере, возникновение памяти, универсальных систем обработки информации сделало возмож¬ ным для животных и человека освоение новых сред обитания и нового поведения. Отсутствие предопределенной локализации образа памяти влечет за собой еще одно чрезвычайно важное последствие. Оно означает, что данное место в памяти нельзя заранее связать с определенным движением или вообще определенной ответной реакцией, так как не¬ известно, какой именно образ будет здесь локализован. Нужную вы¬ ходную реакцию можно подключить только после запоминания. На¬ зовем его условно переключаемостью. По-видимому, это одно из важнейших свойств, позволяющих ’’развязать” восприятие и действие. В системе с переключениями сигнал от органов чувств, поступая в па¬ мять, может либо вообще не вызывать ответной реакции, либо вы¬ зывать одно из нескольких возможных действий. Таким образом, возникновение памяти означает возникновение параллельных путей от органов чувств не в рефлекторные дуги, а в высшие отделы мозга. Точно так же возникают и новые нисходящие пути, регулирующие действия организма. Однако самое главное то, что память дает животным новую форму модели мира, внутреннюю, дающую нервной системе возможность работать с информацией без реальных внешних действий. Ясно, что возникновение такой модели требует выработки целого ряда новых внутренних операций. В то же время эта модель должна иметь доступ к механизмам управления движениями, чтобы быть эффективной. Врожденная система рефлексов меняется очень медленно. В каж¬ дом данном поколении ее можно считать застывшей. Появление памяти позволяет индивидууму иметь меняющуюся картину мира и внутренние операции, чтобы ее строить и достраивать . > Говоря об активности организма, мы подчеркивали, что она дает возможность запускать движения изнутри, т. е. связывали активность ‘ См. также статью М.Н. Вайнцвайга и М.Н. Поляковой и статью Г.М. Зенкина и А. П. Петрова в наст. сб. 21
в первую очередь с моторикой. Однако активность организма крайне важна и для перестройки внутренней картины мира. Познавательная активность — это и та же моторика, которая позволяет реально ’’ощу¬ пывать мир”, и выдвижение гипотез о строении мира, т. е. его ’’мыслен¬ ное прощупывание”. Пока мы говорили лишь о, так сказать, афферентной памяти на сиг¬ налы, образы, факты. Но обособление афферентации и эффекторики сопровождается и возможностью роста модели мира с эффекторного конца, появлением памяти на навыки. Итак, у животных с памятью и внутренней активностью имеются черты, которые принципиально отделяют их от рефлекторных животных. Последние "настроены” на определенную систему входных сигналов, и их модель мира на протяжении жизни индивидуума неизменна. Обу¬ чающиеся животные обладают универсальной познающей системой, и их модель мира и система реакций динамичны. Возникает вопрос: каково соотношение двух разных форм функ¬ ционирования нервной системы? Развивается ли вторая высшая форма из первой или же она возникает независимо? Если новые операции возникают из старых, то какую роль в процессе такого перехода игра¬ ет моторика? К сожалению, вопросы эти мало исследованы, и их постановка, как нам кажется, вполне оправдана. Ответ на последний вопрос, который является центральным для данной статьи, затрудняется тем, что у высокоорганизованных организмов очень трудно разделить две воз¬ можности: операции, выработанные при развитии моторики, затем в ходе эволюции были использованы и в других интеллектуальных областях; операции, выработанные в ходе эволюции при развитии интеллекта, применяются параллельно и при управлении моторикой. Рассмотрим некоторые факты и соображения, которые намечают подходы к ответам на сформулированные вопросы. Проблема возникновения памяти. Принципиальный шаг в воз¬ никновении нового уровня работы нервной системы — появление ин¬ дивидуальной памяти. Выше мы вели изложение так, как если бы са¬ мо по себе появление памяти позволяет животному подняться на более высокий уровень. Однако в действительности этого недостаточно. Представим себе ЭВМ с хорошими входными устройствами для анализа изображений, с хорошими манипуляторами и большим объемом па¬ мяти. Совершенно очевидно, что она будет абсолютно беспомощной без специального программного обеспечения: программы самообу¬ чения3. Но у живых организмов такой программы не может быть среди рефлекторных программ. Более того, и входные устройства рефлек¬ торного животного, представляющие собой фильтры, не слишком-то подходят для использования памяти. Таким образом, для появления более высокого уровня работы нервной системы необходимо возникновение одновременно трех ком¬ понент: памяти, программы самообучения и присоединенных к ним универсальных сенсомоторных средств (или по крайней мере двух s См. также статью Г.М. Зенкина и А.П. Петрова в наст. сб. 22
первых). Ясно, что одновременное возникновение всех этих компонент в ходе эволюции невероятно. Как же именно могла возникнуть память? Ответ на этот вопрос неизвестен. Приведем гипотезу, возникшую в нашем коллективе, об образовании памяти с помощью смены функций. На первом этапе своего развития память могла возникнуть как дополнительное хранилище образов, на которые должны следовать рефлекторные реакции. Когда лягушка убегает от большой тени, то признак узнается определенными клетками сетчатки, которые и за¬ пускают убегание. Однако возможен другой вариант организации по¬ ведения, когда внешние сигналы после обработки сравниваются с не¬ которым эталоном, после чего в случае совпадения запускается ре¬ акция. Память исходно могла играть роль хранилища врожденных эталонов, т. е. в ней в ходе жизни ничего не запоминалось. Основная операция для использования такой памяти — сравнение с эталоном6. Поясним это соображение конкретным примером. Показано, что у птенцов некоторых птиц имеется рефлекторная реакция затаивания. Она возникает на разные стимулы. Одним из них является силуэт летящего хищника. Эталонный образ хищника является врожденным. Здесь уже требуются достаточно сложные органы чувств для обнару¬ жения силуэта реального хищника и сличение с эталоном. Следова¬ тельно, зрительная система должна узнавать форму. Кроме того, нужно уметь узнавать ее при разных размерах, положениях относительно птенца, направлениях движения и т. п. Для этого необходимо под¬ ключение к такой памяти выходных устройств, обеспечивающих зата¬ ивание. Однако тут еще не требуется ни умения запоминать, ни уме¬ ния обучаться. Подобные эталоны имеются не только у высокоорга¬ низованных животных. Показано, например, что у пау ков-прыгунчиков есть врожденные эталоны мухи и самки или самца. Другой пример того же типа: узнавание детенышами многих животных края обрыва и реакция отползания от края. В дальнейшем вместо хранения готовых эталонов память могла приобрести новую функцию: запоминание, но по-прежнему без обучения. О возникновении такой функции нам говорит явление импринтинга. Оно состоит в том, что животное в некий критический период раннего детства запоминает некоторый объект, который в дальнейшем играет роль эталона. Это фактически предыдущая ситуация, но только место эталона в момент рождения не заполнено. Например, птенцы неко¬ торых птиц запоминают первый движущийся объект, который попадает в их поле зрения, и следуют за ним (это эволюционно целесообразно, так как в большинстве случаев таким объектом оказывается мать птенца). Эталон не является врожденным, он запоминается заново, т. е. фактически тут и возникает настоящая память. Но этим дело и огра¬ ничивается. Дальше эталон узнается и вызывает рефлекторную реак¬ цию. Это самый примитивный способ обучения (заполнение места эталона), совпадающий с запоминанием. Правда, эталон в случае импринтинга более сложен, чем плоский силуэт летящего хищника. 6См. статью Ш.А. Губермана в наст. сб. 23
Запоминается и потом узнается трехмерный движущийся объект, кото¬ рый птенец видит в определенном ракурсе, потом в ином виде, на разных расстояниях и т. д. Значит, при импринтинге формируется достаточно сложная система записи в память информации и работы с ней. Импринтинг обнаружен не только у птиц и млекопитающих, но и, например, у муравьев. Для муравья ’’своим” является тот муравей¬ ник, в котором он вывелся. Импринтинг, возможно, есть свидетельство дозревания определен¬ ных отделов центральной нервной системы в постнатальный период, но дозревания, требующего определенной стимуляции от рецепторов7. Можно представить себе, что дальнейшее развитие памяти связано с совершенствованием этого свойства. Произвольные движения Односуставные произвольные движения. Лямбда-модель. Как по¬ казывает анализ, между моделями рефлекторного животного и живот¬ ного с памятью возникает разрыв. У первого движения возникают как ответ на пусковые сигналы с помощью рефлексов и центральных программ, у второго — могут запускаться изнутри, произвольно, за счет собственной активности. Итак, даже простейшие движения в этих двух случаях должны выполняться, казалось бы, совершенно различно. Как же обстоит дело с произвольными и рефлекторными движе¬ ниями у реальных животных и человека? В статье уже упоминался ’’рефлекс на растяжение”. Он состоит в том, что при растяжении мышцы она начинает развивать ббльшую силу за счет изменения ее механических свойств под действием нервной сис¬ темы. Этот рефлекс был изучен на животных [9]. Наши современные знания о его механизмах можно представить следующим образом. Мышца млекопитающих содержит два основных типа волокон: собственно мышечные волокна, выполняющие работу по сокращению мышцы (они называются экстрафузальными), и волокна, снабженные для измерения их длины и скорости ее изменения рецепторами (так называемые интрафузальные волокна). Соответственно в спинном мозгу имеются два типа мотонейронов — нервных клеток, управляю¬ щих мышечными волокнами: а-мотонейроны, управляющие экстра- фузальными волокнами, т. е. собственно двигательные мотонейроны, и у-мотонейроны, посылающие аксоны к интрафузальным волокнам для ’’установки” рецепторов. Афферентные волокна, идущие от мы¬ шечных рецепторов, — волокна 1а — кончаются на а-мотонейронах собственной мышцы и на других клетках (рис. 3). При растяжении мышцы растягиваются и интрафузальные волокна, усиливается частота разряда рецепторов, больше импульсов посту¬ пает на а-мотонейроны, от этого частота импульсации самих мото¬ нейронов тоже возрастает, что приводит к увеличению силы, разви¬ ваемой мышцей. Кроме того, при увеличении импульсации от рецеп- 7См. статью Я.Г. Дорфмана и В.М. Сергеева в наст. сб. 24
Рис. 3. Упрощенная нейрофизиологическая схема управления активностью мыщцы ИН — интернейроны; а- и у-МН — мотоиейроны; ЭВ, ИВ — экстрафузальные и интрафузальные волокна торов в работу вступают до того молчащие новые могонейроны, об¬ ладающие более высоким порогом возбуждения, который скорре¬ лирован с размерами мотонейрона. Зависимость силы, развиваемой мышцей в таких условиях, от ее длины называется мышечной ха¬ рактеристикой (рис. 4, а). Буквой «лямбда» на этом рисунке обо¬ значена та мышечная длина, при которой начинают активироваться мотонейроны данной мышцы, имеющие самый низкий порог. Мышца вместе с обслуживающими ее нервными клетками ведет себя, как нелинейная пружина. При каждой данной внешней нагрузке мышца будет растянута до определенной длины. По мнению Шеррингтона, этот рефлекс в основном служит для под¬ держания позы. Если на спину стоящего животного положить груз, его мышцы-разгибатели начнут растягиваться и возникнет рефлекс на растяжение. В результате животное хотя и пригнется, но сущест¬ венно меньше, чем в отсутствие рефлекса. Перейдем теперь к процессу произвольного управления мышцей. Как показало изучение произвольных движений человека [10], такое уп¬ равление отдельной мышцей состоит в изменении одного параметра X, т. е. в сдвиге мышечной характеристики вдоль оси абсцисс прак¬ тически без изменений формы. Посмотрим, к чему приведет такой сдвиг в разных условиях. Пусть мышца! работает против постоянной нагрузки (рис. 4, б) и вначале Х = Хо, а мышечная характеристика пе¬ ресекает характеристику нагрузки в точке «о при длине х0. Точка а0 будет равновесной точкой, при которой достигается равновесие сис¬ темы мышца—груз. Пусть теперь нервная система изменит значе¬ ние X так, что А. = А.ь В первый момент сила, развивае¬ мая мышцей, будет гораздо больше нагрузки и мышца начнет укора¬ чиваться. В конце концов будет достигнута точка равновесия щ при длине мышцы xi. Пусть теперь длина мышцы фиксирована (хо), а мышечная харак¬ теристика вновь сдвинулась на то же значение (рис. 4, в) — изометри- 25
I Рис. 4. Лямбда-модель произвольного управления длиной (х) и силой (F) мыщцы Статическая характеристика нагрузки (штрих-пунктирная линия) взята произвольно; х« — рав¬ новесная длина мыщцы а — мышечная характеристика, обусловленная как свойствами самой мыщцы, так и системой регуляции ее активности в зависимости от длины (рефлекс на растяжение); X — параметр, уста¬ навливаемый центральной командой и определяющий положение мышечной характеристики, РТ — равновесная точка системы мыщца—нагрузка; б — произвольное изменение длины мыщцы в изотони¬ ческих условиях; в — увеличение мышечной силы от Fo до F] в изометрических условиях; г — пред¬ полагаемая форма изменения центральной команды при быстром изменении длины мыщцы х (!) ческий режим работы. Теперь мышца при той же длине будет разви¬ вать ббльшую силу. Таким образом, конечный результат сдвига параметра X сущест¬ венно зависит от характеристики нагрузки: в изотонических условиях изменяется только длина мышцы, в изометрических — только сила, а в иных случаях меняются обе величины. Нервная система должна оце¬ нивать характеристику нагрузки, чтобы выбор параметра X соот¬ ветствовал требуемой позе. Этот способ управления обладает рядом особенностей. Остано¬ вимся на следующих. Во-первых, для достижения заданной длины мышцы при известной нагрузке (т. е. для совершения движения) нерв¬ ная система не вычисляет ни сил, необходимых для движения, ни траектории движения. Деятельность мозга не подчиняется законам Ньютона, а использует совсем другой внутренний параметр для уп¬ равления движениями. Внешние движения и внутренние операции при этом совершенно различны. При изучении быстрых движений руки человека в одном суставе было выяснено, что, в то время, как внешнее движение является достаточно сложным (разгон руки, ее остановка, 26
нередко ”перехлест” мимо цели и возврат назад), центральная ко¬ манда состоит в смещении мышечной характеристики из одного поло¬ жения в другое с постоянной скоростью. В данном случае за внешней сложностью меняющихся сил и скоростей стоит очень простой управ¬ ляющий сигнал (рис. 4, г). Вторая особенность состоит в том, что управление произвольным движением осуществляется с помощью из¬ менения параметра рефлекса. Выше уже отмечалось, что при взаимодействии рефлексов их па¬ раметры могут меняться. Например, параметры рефлекса на растя¬ жение могут зависеть от состояния мышцы-антагониста, от общего состояния возбуждения, от вестибулярных сигналов, возникающих при повороте головы животного и т. д. С. Гриллнер показал, что вести¬ булярные сигналы действуют одновременно и на а- и на у-мотоней- роны. Система управления произвольными движениями, по крайней мере в простейших случаях, ’’подключается” к системе регуляции врожденных движений. Имитационная гипотеза. Разнообразные факты показывают, что в ряде случаев произвольные движения возникают в результате воз¬ действия высших отделов мозга на те нейронные структуры, которые обеспечивают возникновение рефлекторных движений или их регу¬ ляцию. Исходя из этого была сформулирована гипотеза о том, что при произвольных движениях верхние отделы нервной системы имити¬ руют сигналы, идущие либо прямо от органов чувств, либо в системе взаимодействия рефлексов, и таким способом осуществляют установку параметров рефлексов (’’имитационная гипотеза” [11]). Кроме того, верхние уровни могут включать центральные программы, имея доступ к таким центрам, как локомоторная область. Укажем для примера, что сдвигами мышечных характеристик в от¬ дельных суставах, по-видимому, управляет часть пирамидных ней¬ ронов моторной зоны коры больших полушарий. Фроммом показано, что активность этих нейронов меняется одинаково, когда обезьяна смещает руку и когда давит на препятствие, хотя и углы в суставах, и развиваемые силы различны. При этом пирамидные нейроны влияют на а- и на у-мотонейроны, как и в случае вестибулярных влияний. Кора больших полушарий через пирамидный тракт может запускать локо- моцию [7]. Фронтальные глазодвигательные зоны коры больших полушарий при вызове глазных саккад включают тот же рефлектор¬ ный генератор продолговатого мозга, что и верхние холмы четверо¬ холмия. Итак, верхние уровни управления подключаются к тем нейронам, через которые идет регуляция рефлексов или включение централь¬ ных программ, и тем самым берут под контроль древние врожденные механизмы, имитируя афферентные сигналы. Простое односуставное движение, запуск ходьбы и поворот глаз осуществляются именно таким образом. На рассматриваемых более высоких этажах нервной системы появ¬ ляется центральное представительство таких регуляторных участков врожденных движений. Эти области мозга весьма интересны тем, что, с одной стороны, они имитируют некоторую совокупность сенсор¬ 27
ных сигналов (например, разнообразных стимулов, действие которых на сетчатку вызывает поворот глаз), а с другой — являются моторны¬ ми центрами. Эфферентные моторные команды тут выступают замени¬ телями афферентных сигналов от органов чувств. Образование в нервной системе таких центров — пример ’’филоге¬ нетической интериоризации”: образование внутреннего специализиро¬ ванного представительства сигналов внешнего мира, а также и предста¬ вительства разных типов движений собственного тела. Появление таких систем внутреннего отображения мира и себя в этом мире и есть появление истинного интеллекта. Возникновение в мозгу участков, которые занимаются запуском изнутри движений, бывших до этого рефлекторными, стало следующим важнейшим ша¬ гом после командных нейронов и двигательных центров. Мы уже отмечали, что сенсорные сигналы могли поступать в па¬ мять, могли сравниваться с эталонами и только после этого либо вызывали движения, либо оставлялись без внимания. Теперь аналоги этих сенсорных сигналов из ’’центров имитации”, которые стали обо¬ значать движение, поступают в память и играют роль моделей дви¬ жения. С другой стороны, и сам внешний мир получил возможность модифицироваться в памяти. Вспомним, что в нервной системе долж¬ ны были выработаться такие операции, как мысленное вращение объекта для его сличения с эталоном. Так намечаются контуры происхождения системы, которая поз¬ воляет мысленно выполнять движение и мысленно рассматривать его результаты. Позволим себе еще одну фантазию. Существует теория возник¬ новения новых генов посредством удвоения (дубликации) старых. Тог¬ да старый ген занимается прежним делом, а новый может мутировать и искать себе другую ’’профессию”. Возможно, таким же образом возникают и новые отделы централь¬ ной нервной системы. Они не набираются постепенно из новых нейро¬ нов, а возникают как дубли ранее существовавших отделов. В нервной системе имеется, например, много экранных структур, являющихся про¬ екциями сетчатки. Их назначение различно: одни служат для анализа изображений, другие — для вызова движений глаз, третьи —для передачи сигналов, идущих из памяти, и т. д.8 В эволюции экранные структу¬ ры, вероятно, возникали целиком, как удвоение уже имеющейся про¬ екции, а первая проекция — это удвоение сетчатки и появление тем самым первой внутренней сетчатки. Если такие отделы нервной системы — копии друг друга, то проще понять, почему между ними легко возникают поточечные связи, почему у них обнаруживаются многие общие свойства. Описанная выше неод¬ нозначность разделения участков мозга на афферентные и эфферент¬ ные вполне приложима и к этим проекциям. Есть множество проекций для слуховых сигналов, множество проекций поверхности тела. Ясно, что такой способ возникновения новых отделов должен сильно уско¬ рять время эволюции центральной нервной системы. 8 См. статью Я. Г. Дорфмана и В. Н. Сергеева в наст. сб. 28
Появление нескольких копий, функции которых оказываются раз¬ личными, создает разные уровни нервной системы. В книге Н.А. Берн¬ штейна [1] описан ряд таких уровней, связанных с задачей построе¬ ния движений. Конечно, таких уровней много, и наше идеализирован¬ ное разделение на два уровня (с памятью и рефлекторный) сверх¬ упрощение. Например, движения глаз могут возникнуть самопроиз¬ вольно в генераторе среднего мозга, могут быть вызваны появлением стимула на периферии сетчатки через верхние бугры четверохолмия, либо стимулом, либо по желанию (из памяти) через черную субстан¬ цию — подкорковое ядро (интересно, что в данном случае вызов глаз¬ ного движения обеспечивается снятием торможения с соответствующе¬ го участка верхних бугров четверохолмия; управление с помощью растормаживания — частый случай в нервной системе), а также с фрон¬ тального глазодвигательного поля коры больших полушарий и т. д. Заметим, что уровней, связанных с памятью, может быть при этом достаточно много (возможно, следует говорить не ’’уровень, свя¬ занный с памятью”, а ’’уровень, обладающий памятью”). Следует еще отметить, что при удвоении той или иной структуры дублируется не просто анатомический субстрат, но и все те операции, которые были ему присущи. Поэтому высшие уровни в готовом виде получают операции, выработанные в филогенезе. Подводя итоги, можно сказать, что если наша гипотеза верна, то высшие отделы мозга напрямую порождены низшими рефлекторными отделами, впитали в себя выработанные ими операции, умеют управ¬ лять ими, воздействуя на их ’’регуляторные участки”. Конечно, такая чисто вертикальная иерархия — тоже упрощение реальной ситуа¬ ции. Движение и прогнозирование. Выше отмечалось, что уже на реф¬ лекторном уровне (например, на уровне прослеживающих движений глаз) существуют механизмы экстраполяции на будущее. Если проана¬ лизировать лямбда-модель управления произвольными движениями, то можно понять, что для ее работы необходимо использование ме¬ ханизма экстраполяции. Если мы хотим согнуть руку на определенный угол, то должны сдвинуть параметр лямбда на определенную вели¬ чину. Это операция, которая совершается в нашем внутреннем мире, причем значение сдвига зависит от той цели, которую мы ставим. Если же существует внешняя нагрузка (груз, трение и т. д.), то си¬ туация становится еще более ясной. Для достижения желаемой цели надо выдвинуть гипотезу о характеристике нагрузки, а затем сдви¬ нуть порог лямбда к ’’желаемому будущему”. В данном случае лямбда-модель касается важного аспекта произ¬ вольных движений: их связь с фундаментальными познавательными операциями — выдвижением гипотез. Здесь невольно вспоминается теория установки Д.Н. Узнадзе и сходные построения. Мышечное чувство и эфферентные копии. Восприятие простран¬ ства. Еще одна особенность рассматриваемого способа управления состоит в следующем. Если нет оснований для выдвижения гипотезы о характеристике нагрузки, то заранее неизвестно, куда надо сдви¬ нуть мышечную характеристику, и моторная задача может быть реше¬ 29
на только в ходе движения на основании показаний мышечных ре¬ цепторов, обусловливающих мышечное чувство. Однако сигналы, посылаемые этими рецепторами, сами по себе не имеют однозначной интерпретации. Дело в том, что центральные команды при управлении сдвигом мышечной характеристики меняют активность не только а-, но и у-мотонейронов, а следовательно, и чувствительность рецепторов. Для оценки показаний рецепторов оказывается необходимым знать управляющие моторные сигналы. Следовательно, те отделы нервной системы, которые оценивают ход движения и характеристику нагрузки, должны получать сведения об эфферентных командах, которые обычно называют "эфферентными копиями” (идея эфферентных копий была выдвинута, видимо, Гельм¬ гольцем в связи с изучением влияния движения глаз на зрительное восприятие). Как показало изучение вибрационных иллюзий (раздражение мы¬ шечных рецепторов вибрацией, когда человек не совершает произволь¬ ного движения, вызывает иллюзию движения), именно центральные команды определяют систему отсчета (начало отсчета и масштаб) для восприятия и правильной интерпретации афферентных сигналов. Восприятие положения конечности оказалось неразрывно связанным с сигналами, управляющими ее движениями [12]. Иными словами, для правильного восприятия схемы тела (т. е. углов между звеньями тела и скорости их изменения) необходимо использовать совместно сигналы от рецепторов и центральные команды (а последние соглас¬ но имитационной гипотезе сами являются некоторым аналогом аффе¬ рентных сигналов) [12]. Может быть, тот факт, что при изучении движений выяснено, что центральные команды заменяют рефлекторные сенсорные сигналы и создают масштабы для оценки сенсорных сигналов во время движения, будет способствовать лучшему пониманию того, как можно изнутри, в воображении, менять схему тела, т. е. представлять собственные движения. Рассмотренный нами пример односуставного движения является достаточно типичным. Учет движений — необходимый компонент пра¬ вильного восприятия пространства. При прослеживающих движениях глаз картина мира смещается по сетчатке, но человек видит мир поко¬ ящимся, так как учитывает движения своих глаз. У человека с парали¬ чом глазных мышц при попытке прослеживания движущегося объекта глаз остается неподвижным, но зато возникает иллюзия движения всего окружающего мира9. Таким образом, и в данном случае восприятие обеспечивается сопоставлением сенсорных сигналов и моторных ко¬ манд10. 9 См. также статью Г.М. Зенкина и А.П. Петрова в наст. сб. 10 Изучение соотношения между эффекторикой и восприятием было начато "новой теорией зрения” Беркли, в которой возникновение пространственности в зрительном вос¬ приятии было поставлено в связь с движениями глаз и руки, с осязательными ощущени¬ ями. Менее известным сейчас является анализ, проведенный в конце XVIII в. шотландским философом Р. Брауном, который впервые выделил мышечное чувство в качестве осо¬ бого компонента "осязания” и установил существенные свойства и функции мышечного 30
Рассмотрим ассоциативные зоны коры больших полушарий, прежде всего поля теменно-затылочной коры, лежащие между зрительными, 'слуховыми и сомато-сенсорными областями. Там есть клетки, полу- 'чййщие сигналы и от сетчатки, и от кожи, и от мышц. Эти зоны коры "получают зрительные, тактильные и мышечные сигналы, позволяющие определить расположение и форму внешних предметов, создавая це¬ лостную картину мира. Кроме того, из премоторной коры (в основном из поля 6) поступают эфферентные копии моторных команд, что поз¬ воляет иметь тут же и схему тела, т. е. расположение частей тела отно¬ сительно друг друга, а также положение и движение его во внешнем пространстве. Эфферентные копии входят необходимой составной частью в разнообразные эфферентные синтезы. О построении движений. Выше мы в основном обсуждали роль дви¬ жений в построении модели мира, теперь же хотелось особо под¬ черкнуть роль этой модели для построения движений [1]. Н.А. Берн¬ штейн, например, говорил, что маленькая и большая окружности ри¬ суются человеком с использованием совершенно разного набора мышц, ио с использованием одного и того же образа, который и играет роль плана для движения [1]. Остановимся на этом вопросе несколько подробнее. Как при дви¬ жениях, выполняемых под контролем зрения, так и при движениях без такого контроля существует несколько разных пространств перемен¬ ных. Вернемся к потирательному рефлексу лягушки и его модели. Здесь имеется внешнее целевое пространство, в нем находится раздражае¬ мая точка кожи, внешнее двигательное пространство, описывающее конфигурации рабочей конечности и два внутренних пространства: пространство афферентного синтеза, которое определяет для нервной системы отношение рабочего органа и цели с учетом центральных команд, и пространство управления, в котором задаются лямбда-па¬ раметры, определяющие желательное состояние суставных углов. В случае простой модели принимались следующие допущения: координаты цели во внешнем целевом пространстве заданы, как и положение рабочей точки, в том же пространстве; стадия афферентного синтеза в этой модели не рассматривалась; модель управляет непосредственно кинематическими переменными, хотя в действительности следует рассматривать изменение параметров лямбда [5]. Перейдем теперь к произвольным движениям. В этом случае целевая точка (X Y) задается не извне бумажкой с кислотой, а изнутри, причем может задаваться не точка, а траектория (Х(/)> У(0)> т- е. план движения. Машинные эксперименты показали, что даже такая простая модель будет отслеживать рабочей точкой траекторию, заданную в этом об¬ разном пространстве (окружность в примере Бернштейна), причем при разных размерах такой окружности разные суставы будут вовлекаться в разной мере. Распределение обязанностей между суставами и выра- чувства в возникновении пространственных представлений. И. М. Сеченов считал, что благодаря мышечному чувству человек учится сравнивать предметы и "проходит перво¬ начальную школу предметного мышления” [13]. 31
ботка значений лямбда-параметров проводится на другом уровне и может не достигать уровня сознания. Модель показывает, как может проводиться перекодирование с языка образов на язык управляющих переменных. Таким образом, в результате овладения пространством возникает возможность планировать движения на образном уровне. Резюмируя, можно сказать, что связь моторики и сенсорики — это взаимопроникновение: без эфферентных копий нет верной модели ми¬ ра, без операций на модели мира нет планирования и осуществления движений. О сходстве и различии в построении рефлекторных и произволь¬ ных движений. Проведем сравнение поведения рефлекторного и обучающегося животного11. Начнем с входных, устройств. Мы уже отмечали, что в основе реф¬ лекторных движений лежат входные фильтры. Однако в работе филь¬ тров можно выделить весьма специализированные устройства, такие, как реакция на определенный запах или на черную точку, и достаточно универсальные операции, например оценка расстояния до предмета или оценка скорости движения. В то время как специализированные устрой¬ ства могут исчезать в ходе эволюции (например, детектор черной точки есть в сетчатке лягушки, но отсутствует в сетчатке кошки), уни¬ версальные операции используются в работе входных устройств и построении картины мира высших организмов (например, методом условных рефлексов показано, что новорожденные младенцы верно определяют расстояние до предметов). Другие специализированные устройства, играющие важную роль у данного вида животных, напротив, могут, по-видимому, развиваться заново, например специализирован¬ ная область мозга у обезьян и человека для узнавания лица. Наряду с такими универсальными операциями, как определение расстояния до предмета или его цвета, сохраняется и развивается операция узнавания, в частности с помощью сравнения с эталоном (например, установление того факта, что показываемый предмет является чело¬ веческим лицом). Уже на рефлекторном уровне в процессе выработки системы взаимо¬ действия рефлексов появились участки мозга, в которых сопоставля¬ лись сигналы разных модальностей. Выше мы приводили примеры верхних бугров четверохолмия, в которых взаимодействуют зритель¬ ные и слуховые сигналы, или вестибулярного мозжечка, где взаимо¬ действуют зрительные и вестибулярные сигналы. Такие системы сох¬ раняются и у высших животных, у которых, кроме того, возникают ас¬ социативные зоны коры больших полушарий, осуществляющие син¬ тез разнообразных афферентных сигналов, например зрительных, тактильных и мышечных. Это способствует возникновению целостных образов предметов, но уже не врожденных, а вырабатываемых в про¬ цессе деятельности животного, что приводит к созданию индивидуаль¬ ной внутренней модели внешнего мира. На рефлекторном уровне мы видели, что спинной мозг лягушки " См. статью М.Н. Вайнцвайга и М.П. Поляковой в наст. сб. 32
учитывает схему тела при смахивательном рефлексе, а четверохолмие — положение головы и глаз при расчете скачка глаза. У высших организ¬ мов схема тела, кроме того, встраивается во внутреннюю картину ми¬ ра, так что учитывается отношение звеньев тела не только по отноше¬ нию друг к другу, но и по отношению к разным предметам внешнего мира. Вообще учет пространственных отношений разных предметов, как уже говорилось, — важнейшая функция некоторых ассоциативных зон коры головного мозга. Глубокие связи и аналогии выявляются и в исполнительной деятель¬ ности. В целом ряде случаев высшие отделы мозга при инициации про¬ извольных движений прямо используют готовые врожденные меха¬ низмы (например, при запуске локомоции, при произвольных измене¬ ниях суставных углов, при осматривании изображений). В других случаях произвольные движения формируются заново. Человеку, при¬ ходится вырабатывать целый ряд произвольных движений, не преду¬ смотренных эволюцией: застегивание пуговиц, шнуровка ботинок, наде¬ вание пальто, еда вилкой, работа лопатой, езда на велосипеде и т. д. Пе¬ речисленные движения используются человеком многократно, и в ре¬ зультате вырабатываются так называемые навыки. Необходимо обратить внимание на существенное сходство моторных навыков и центральных программ. Отработанный до автоматизма навык становится действием, вполне сходным с тем, для которого имеется врожденная центральная программа. Отдельные моторные эле¬ менты сливаются в навыке в единый комплекс, подобно тому как в центральной программе ’’склеиваются” отдельные рефлексы. Навык включается целиком, как включается центральная программа, из соответствующего моторного центра. Мы так же перестаем замечать собственные движения при застегивании пуговиц (и даже не можем описать словами, как это делается, если не обратим специального вни¬ мания на свои движения), как и движения ног, когда мы на ходу беседуем с приятелем. Движения, выполнение которых доведено до автоматизма, опуска¬ ются фактически на уровень врожденных моторных программ. Часто человек после долгого перерыва успешно совершает подобные движе¬ ния. В таких случаях говорят, что ’’руки сами помнят”. Человек, овладевший навыком езды на велосипеде, сохраняет это на всю жизнь (интересно, что грубое овладение принципом езды на велосипеде или плаванием происходит внезапно в результате процесса, сходного с инсайтом или пониманием в интеллектуальных задачах). Таким обра¬ зом, наличие памяти увеличивает ’’библиотеку моторных программ” организма, в которую почти на равных начинают входить и централь¬ ные программы и навыки. Существенная особенность нервной системы высокоорганизованных животных — переключаемость, которая создает возможность неод¬ нозначных реакций, позволяет выбирать то или иное произвольное движение, ведущее к цели, позволяет при построении сложного дви¬ жения комбинировать в том или ином порядке отдельные ’’блоки”, элементарные движения. Конечно, эта особенность наиболее резко отделяет произвольные движения от рефлекторных. Однако и здесь, 3. Зак. 1668 33
более пристально вглядываясь в устройство рефлекторного уровня, в нем можно увидеть черты, которые являются предшественника¬ ми переключаемости. Выше мы говорили, что в потирательный реф¬ лекс входит в качестве блока движение, используемое при прыжке, что сам потирательный рефлекс бывает вмонтирован внутрь программы ’’локомоция” и др. Наконец, при рефлекторных движениях используется экстраполяция (например, при скачке глаза на движущийся предмет учитывается скорость цели и движение осуществляется с упреждением). Вообще всякий рефлекс включает в себя план движения, который неразрывно связан с его выполнением. Но в случае врожденных движений с экстра¬ поляцией план учитывает изменения, происходящие во внешнем мире. При произвольных движениях характер планирования меняется. Ко¬ нечно, и тут могут учитываться движения внешних объектов, но су¬ щественно другое: всякому движению предшествует его внутренний план, его образная реализация, которая и запускает самое движение. Количество сопоставлений и аналогий можно было бы еще уве¬ личить. Однако гораздо важнее понять их смысл и значение. Основное отличие произвольных движений связано с внутренней моделью мира и возможностью планировать движения, используя модель. Однако возникает впечатление, что при построении модели существенно используются те устройства и операции, которые выработались в хо¬ де более ранней эволюции, точно так же, как реализация внутренних планов осуществляется в значительной мере через имеющиеся у орга¬ низма рефлекторные машины. По нашему мнению, одной из важных задач физиологии движений является ответ на вопрос, какие устройства и операции обучающееся животное получило в наследство, а какие выработались в связи с возникновением памяти. От сенсомоторики к интеллекту Произвольные движения и интеллект. И произвольные движения и интеллект связаны с операциями, выполняемыми на внутренней модели мира. Легко видеть, что многие из таких операций очень близки для обоих, например планирование. В других случаях такое сходство не столь очевидно, но тоже может быть установлено. Приведем не¬ сколько примеров. При выработке двигательных навыков нервная система нередко использует набор более или менее сложных "элементарных” движений, которые комбинируются в тех или иных сочетаниях. Некоторую анало¬ гию этому процессу можно видеть в работе фантазии. Память орга¬ низована таким образом, что в ней можно легко находить отдельные "элементарные блоки”, а работа воображения включает в себя ком¬ бинирование таких блоков, которое, конечно, как и при построении движений, не является чисто случайным. Важной чертой интеллекта является критичность, т. е. способность сравнивать полученный результат действия с конечной целью. Кри¬ тичность легко соотнести с контролем правильности выполнения про¬ 34
извольного движения, но, возможно, она является отдаленным потом¬ ком более древних операций — мы имеем в виду сравнение с эталоном. Вспомним птенца, сравнивающего силуэт летящей над ним птицы с силуэтом хищника, хранящемся у него в наследственной памяти. В случае критической оценки результата интеллектуального действия осуществляется фактически та же операция, но роль эталона играет цель, которую надо достигнуть и которая фиксируется в памяти в связи с постановкой задачи. Произвольные движения не только сходны с интеллектуальными действиями по ряду признаков, но их выполнение в ряде случаев свя¬ зано с работой тех же или соседних отделов мозга. Выше мы говорили про теменно-затылочные поля коры больших полушарий, в которые сходятся разные афферентные сигналы и эффе¬ рентные копии и которые обслуживают движения в экстраперсональ- ном пространстве (по выражению Маунткасла). Оказалось, что эти же области коры могут служить и для анализа пространственных от¬ ношений независимо от движений. Эти зоны коры выполняют анализ отношений между предметами: порядок их расположения, относительные размеры, касается один предмет другого или находится за ним, столкнуться ли два движу¬ щихся предмета или нет и т. д. Если эти области (в частности, поля 39 и 40) у человека повреж¬ дены, у него страдает как восприятие, так и возможность спра¬ виться с относительно простыми двигательными задачами: он стелит одеяло поперек кровати; не может расположить свои руки так, как показывает врач; выйдя из палаты, не может найти пути назад и т. д. [14]. Кроме того, нарушения тех же корковых областей связаны и с нару¬ шениями некоторых интеллектуальных функций. Представляется дос¬ таточно естественным, что у таких больных страдает анализ не только пространственных, но и иных отношений. Можно думать, что те зоны коры, которые "работают” с отношениями сигналов разной модаль¬ ности (должны сравнивать, например, тактильные сигналы со зри¬ тельными) и с пространственными отношениями предметов, использу¬ ются мозгом и при операциях, требующих анализа отношений совер¬ шенно иного типа. В этих случаях часто страдают логические операции, что не так уж удивительно, если вспомнить изображение силлогизмов кругами Эй¬ лера. Логические суждения выражают, в частности, принадлежность объекта к некоторому множеству, что достаточно сходно с чисто пространственными отношениями. Наконец, у таких больных часто страдает и возможность выпол¬ нять арифметические операции. И это представляется естественным, если учесть, что они связаны с отношениями типа "больше—меньше” и операциями с множествами. Опыты Роланда с изучением изменения кровотока у здоровых людей с помощью позитронной томографии под¬ твердили участие этих зон мозга в выполнении арифметических опе¬ раций. Итак, отделы мозга, связанные с анализом пространственных от¬ ношений, используются как для обслуживания движений, так и для 35
грамматических, арифметических и логических операций (или для создания соответствующих моделей, к которым применяются эти операции). С другой стороны, передние отделы коры используются при пла¬ нировании как произвольных движений, так и интеллектуальных опе¬ раций. О чем говорят все эти данные? Их можно интерпретировать и так, что некоторые высшие отделы коры, возникшие в ходе эволюции, зани¬ маются разными сложными функциями, среди которых находятся как управление движениями, так и интеллектуальные процессы. По¬ жалуй, против такой точки зрения отчасти говорит тот факт, что у низших млекопитающих гомологичные области коры обслуживают движения, но явно не занимаются арифметическими или грамматичес¬ кими операциями. Он свидетельствует в пользу того, что интеллек¬ туальные функции развивались из сенсомоторных. Однако приведенный нами аргумент в действительности не является столь уж сильным, так как вместо арифметики и грамматики соответствующие отделы мозга низших млекопитающих могли быть заняты какими-то важными сто¬ ронами их достаточно сложного поведения, а не просто построением движений. К развитию интеллекта в онтогенезе. В случае затруднений, подоб¬ ных отмеченным выше, биологи часто прибегают к анализу онтогене¬ за, т. е. процесса индивидуального развития, надеясь, что это даст им дополнительные недостающие аргументы. Большое число публикаций посвящено проблеме развития ин¬ теллекта и психики ребенка. Глубокий анализ этой проблемы был проведен в свое время И.М. Сеченовым. В XX в. много сделано для понимания развития интеллекта зна¬ менитым швейцарским психологом Ж. Пиаже [15]. Изучая формиро¬ вание умственных действий у детей, он открыл очень важный процесс интериоризации. Позже исследования этого процесса получили серь¬ езное развитие в рамках советской психологической школы. Суть явления интериоризации заключается в следующем. Когда человек осваивает решение сколько-нибудь сложной задачи, включающей в себя планирование, принятие решений и согласованное выполнение действий, деятельность его протекает в основном во внешнем плане, т. е. выражается в совершении движений. Так, осваивая прохождение нарисованного на листе бумаги лабиринта, ребенок вы¬ нужден водить пальцем по его ’’коридорам”, чтобы найти выход; обу¬ чаясь сложному логическому правилу (например, умножению или де¬ лению ’’столбиком”), ученик неизбежно проговаривает вслух все выполняемые им действия и непосредственно на бумаге регистрирует промежуточные этапы (перенос между разрядами числа и т. п.); начи¬ нающий закройщик подбирает оптимальное расположение листов выкройки, многократно перемещая их по куску материала. По мере освоения задачи все больше промежуточных действий переходит из плана внешнего в план внутренний, становясь действиями ”в уме”. В конечном итоге все решение задачи переходит во внутренний план, план умственных действий. Действия же внешние (физические) свора¬ 36
чиваются и крайне ослабляются, так что зарегистрировать их можно только в специальном эксперименте. Например, движение пальца по лабиринту заменяется на прослеживающее движение глаз, произнесение вслух правила — на едва заметное напряжение голосовых связок и гортани и т. п. Обычно интериоризацию действий рассматривают в связи с фор¬ мированием отдельных умственных операций и навыков12. Отметим роль этого явления в формировании целостной интеллектуальной картины мира — среды, в которой протекают интеллектуальные про¬ цессы. Из изложенного выше о системе рефлексов и произвольных движений как своеобразной "чувственно-двигательной” картине мира становится очевидной огромная важность интериоризации, перено¬ сящей эту картину в интеллектуальный план. При таком подходе "чувственно-двигательная” картина мира выступает как предтеча ин¬ теллектуальной, а система регуляции рефлексов и движений — как некоторый предынтеллект. Ж. Пиаже назвал его "сенсомоторным интеллектом”. Для человека он является ведущим на раннем уровне развития, т.е. в младенчестве и раннем детстве. Очень интересным является путь развития произвольных движений. Вначале ребенок способен совершать лишь спонтанные некоординиро¬ ванные движения (размахивать рукой, открывать и закрывать ладонь, шевелить пальцами и т.д.). Затем он научается удерживать оп¬ ределенную позу (руку — около рта, когда сосет палец; руку — в поле зрения и т. д.). С точки зрения Изложенного выше пред¬ ставления о параметрическом управлении произвольными движе¬ ниями — это естественный порядок овладения движениями. Ес¬ ли произвольное движение — переход от одной позы, задан¬ ной параметром лямбда, к другой позе, то прежде всего надо на¬ учиться удерживать позу, т. е. задавать и сохранять соответствующий ей параметр. Тогда становится понятным и переход к следующему этапу — направленным движениям, например схватыванию предмета. Важную роль играет и возникновение сочетаний движений (одновре¬ менных или последовательных), при которых блоки "склеиваются” воедино (рука движется ко рту, который в нужный момент открывается; рука движется к предмету, сжимается, хватает его и подносит ко рту и т. д.). Овладев движениями, ребенок существенно использует их для вы¬ яснения отношения между предметами и построения картины мира (трясет погремушку, бросает предметы, наблюдая действие тяготения, 12 Хотелось бы подчеркнуть, что процесс интериоризации (понятый широко) имеет место не только при формировании интеллектуальных функций, но и иа более ранних стадиях. Например, упомянутое в изложении имитационной гипотезы явление парамет¬ ризации рефлекса тоже есть в некотором смысле интериоризация. Действительно, заменяя действие реального стимула на действие его внутреннего "эквивалента”, мо¬ дифицирующего рефлекс, нервная система создает внутреннюю модель стимула. От клас¬ сической интериоризации эта ситуация отличается лишь тем, что здесь "переводится вовнутрь” не собственное действие, а воздействие внешней среды. Представляется, что именно в параметризации двигательных рефлексов (лежащей в основе произвольных движений) можно усмотреть первый шаг в построении внутренней модели окружающей среды и поведения особи в ней, т. е. первичный элемент психического отражения. 37
притягивает к себе удаленный предмет за веревочку и т. д.). Именно на сенсомоторной стадии ребенок научается строить планы, экстра¬ полировать и т. д. Наблюдения над детьми позволяют проследить, как на базе врожденных механизмов на основе моторики идет разви¬ тие высших функций. Таким образом, изучение развития ребенка показывает, что ново¬ рожденный существенно использует "коллективный опыт”, опыт ви¬ довой и довидовой, опыт предшествующего миллиарда лет. На этой основе накапливается опыт индивидуальный, который обладает огром¬ ным преимуществом (возможностью ускоренного овладения миром за счет обучения) и огромным недостатком (исчезает со смертью индиви¬ дуума). Наконец, появляется система социальной передачи опыта, поз¬ воляющая индивидууму в ходе обучения воспользоваться плодами пре¬ дыдущих поколений и передать его достижения поколениям будущим. * * * Размеры статьи не позволяют нам достаточно скрупулезно про¬ цитировать литературу по обсуждаемым вопросам, поэтому мы огра¬ ничились минимальным списком. В него входят некоторые собствен¬ ные работы, существенно использованные при написании статьи, и работы тех исследователей, которые оказали наибольшее влияние на формирование изложенных представлений как своими книгами и статьями, так и в некоторых случаях личным общением. Мы имеем в виду прежде всего лекции Н.А. Бернштейна и семинар по физиологии, руководимый И.М. Гельфандом и М.Л. Цетлиным. ЛИТЕРАТУРА 1. Бернштейн Н.А. О построении движений. М.: Медгиэ. 1947. 255 с. 2. Сеченов И. М. Физиология нервной системы // Физиология иервиой системы. М.: Медгиз, 1952. Вып. 3. 624 с. 3. Fukson O.I., Berkinblil М.В., Feldman A. G. The spinal frog takes into account the scheme of its body during the wiping reflex 11 Science. 1980. Vol. 209. P. 1262—1263. 4. Беркинблит М.Б., Жаркова И. С., Фельдман А. Г., Фуксон О. И. Особенности кине¬ матики потирательного рефлекса лягушки // Биофизика. 1984. Т. 29, N 3. С. 483—488. 5. Беркинблит М. Б, Гелъфанд И. М., Фельдман А. Г. Модель управления движе¬ ниями многосуставной конечностью // Биофизика. 1986. Т. 31, N 1. С. 136—146. 6. Цетлин М.Л. Исследования по теории автоматов и моделированию биологичес¬ ких систем. М.: Наука, 1969. 316 с. 7. Шик М.Л. Управление наземной локомоцией млекопитающих животных // Руко¬ водство по физиологии: Физиология движений. Л.: Наука, 1976. 375 с. 8. Бернштейн Н.А. Очерки по физиологии движений и физиологии активности. М.: Медицина, 1966. 350 с. 9. Крид Р., Денни-Броун Д., Икклс И., Лиддел К, Шеррингтон Ч. Рефлекторная де¬ ятельность спинного мозга. М.: Гос. иэд-во биол. и мед. лит., 1935. 268 с. 10. Фельдман А. Г. Центральные н рефлекторные механизмы управления движениями. М.: Наука, 1979. 184 с. 11. Berkinblit М.В., Feldman A.G.. Fukson О.I. Adaptability of innate motor patterns and motor control mechanisms' // Behav. and Brain Sci. 1986. Vol. 9, N 4. P. 485—510. 12. Feldman A. G., Latash M.L. Interaction of afferent and efferent signals underlying position sense: Empirical and theoretical approaches 11 J. Mot. Behav. 1982. Vol. 14. N 2. P. 174—193. 13. Сеченов И.М. Избранные произведения. М.: Иэд-во АН СССР, 1952. Т. 1. 771 с. 14. Лурия А.Р. Основы нейропсихологии. М.: Изд-во МГУ, 1973. 374 с. 15. Пиаже Ж. Избранные психологические труды. М.: Просвещение, 1969. 497 с. 38
УДК 681. 5:612.8:611 НЕЙРОМОРФОГЕНЕЗ И МОДЕЛИ МИРА В СЕТЯХ НЕЙРОННЫХ ПРОЦЕССОРОВ Я. Г. Дорфман. ,В.М. Сергеев Фундаментальной проблемой развития вычислительной техники стало совершенствование архитектуры ЭВМ и развитие их элемент¬ ной базы. Произошедший технологический прорыв создал возможности для появления принципиально новых конструкций. Это привело, од¬ нако, к своеобразному "кризису идей” в области проектирования ЭВМ, выражающемуся в том, что существует несколько путей развития, каждый из которых требует для достаточно полной про¬ работки вложения огромных сил и средств, а результаты от этого пока представляются неясными. Каким же образом можно прояснить ситуацию и выбрать наиболее перспективное направление технических поисков? Существует давняя традиция обращаться в подобных случаях к науке о мозге — наиболее совершенном в настоящее время устройстве обработки информации. Прогресс в экспериментальной нейробиологии и нейропсихологии привел к появлению большого объема интересных экспериментальных данных. Однако уровень теоретических представлений, на основе которых эти данные интерпретируются, как правило, значительно отстает от уровня теоретических представлений об информационных процессах, развиваемых в настоящее время в рамках информатики, когнитивной науки и искусственного интеллекта. Прогресс в экспе¬ риментальной нейробиологии сдерживается расхожими представления¬ ми о том, какие принципы биологической организации необходимо привлекать для объяснения функционирования нервной системы. Например, до самых последних лет нейробиологией практически полностью игнорировался морфогенетический аспект функционирова¬ ния мозга. В настоящей статье мы попытаемся: проинтерпретировать некоторые наиболее устоявшиеся результаты нейропсихологических исследований с точки зрения новых кон¬ цепций организации вычислительных систем и обработки знаний и выявить, какие же из этих концепций помогают наиболее естест¬ венно описывать работу мозга; рассмотреть возможности, которые предоставляются для объяс¬ нения функционирования нейронов — "элементной базы” мозга — последними исследованиями в области онтогенеза и морфологической динамики нервной системы; проанализировать, как то и другое могут повлиять на перспек¬ тивные тенденции в развитии вычислительной техники. 39
I НАУКА О МОЗГЕ И ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА: БАЗА ДЛЯ ДИАЛОГА Обмен идеями между нейрофизиологией и кибернетикой начался с первых шагов становления последней как науки. Так, концепции системы управления, обратной связи [1], автомата [2], персеп- трона [3,4], ассоциативной памяти были результатом теоретического осмысления представлений, задолго до этого бытовавших в науке о строении и функциях нервной системы. С другой стороны, кибернетика является основным источником концептуальных моделей функционирования нервной системы. Дело в том, что сами по себе ни морфологические данные, ни экспери¬ ментальный анализ того, как циркулируют и взаимодействуют по¬ токи нервных импульсов, почти ничего не могут сказать о смысле тех операций, которые осуществляют различные участки нервной системы. С подобной ситуацией столкнулся бы специалист по электрон¬ ной технике, который по сигналам из разных точек вычислитель¬ ной машины пытался бы понять, какую задачу решает работающая в этот момент программа. Особенно непонятными остаются функции высших отделов нервной системы, ’’далеких” как от контролируемых сенсорных входов, так и от двигательных проявлений. Для того чтобы понять экспе¬ риментальные данные, здесь необходима гипотеза о функциях от¬ дельных блоков, участвующих в процессе обработки информации, формах ее представления и кодирования, априорное знание о функцио¬ нальной архитектуре системы. Нейробиология и кибернетика неиз¬ бежно должны развиваться в тесном взаимодействии. Однако после короткого периода в конце 40-х—50-х годах плодотворного диалога между наукой о нервной системе и наукой о технических системах обработки информации практически не было. Долгое время господствовавшая в нейрокибернетике ’’компьютерная метафора” основывалась на архитектуре ЭВМ, предложенной фон Нейманом, и представлениях о булевой алгебре и арифметике как универсальной основе работы ’’думающих” устройств. Применительно к мозгу подобная концептуальная схема оказалась малоэффективной. В результате нейропсихологи и нейрофизиологи долгое время факти¬ чески игнорировали достижения в области создания новых типов вы¬ числительных систем. Ситуация стала радикально меняться в послед¬ ние годы. Программисты стали создавать не отдельные программы, а программные системы со сложной архитектурой [5]. В них каждая программа выполняет, подобно органу в организме, ограниченный набор ясно очерченных функций. Наметился переход к многопроцес¬ сорным системам с разделением функций между отдельными про¬ цессорами. Стали разрабатываться единые архитектурные принципы построения систем, в которых взаимодействует много моделей, несколько ЭВМ и комплексы программ [6]. Неоправданно, по инерции, в нейробиологии игнорируются также современные представления когнитивной науки и искусственного ин¬ теллекта о фундаментальной роли знаний в моделировании мышления. 40
Дело в том, что после нескольких лет увлечения программами, реализующими формальный логический вывод [7], в искусствен¬ ном интеллекте стали активно использоваться представления о мыш¬ лении, сложившиеся в психологии, лингвистике, содержательной ло¬ гике, социологии, истории культуры и других гуманитарных областях [8—12]. Польза от контакта этих наук с наукой об искусствен¬ ном интеллекте была обоюдной. В настоящей статье мы не будем подробно обсуждать развитие идей искусственного интеллекта. Отметим лишь два весьма важных для дальнейшего изложения результата, полученных в рамках этого направления. Прежде всего это вывод о том, что всякая интел¬ лектуальная система должна уметь оперировать внутренними моде¬ лями мира, уметь их синтезировать и видоизменять [13, 14]. Во-вторых, для того чтобы можно было эффективно моделировать мир, знания о различных аспектах его организации должны быть по-разному структуризованы и представлены в ЭВМ в форме, поз¬ воляющей реализовывать естественную для данного аспекта логику манипулирования с моделями [15]. Заметим, однако, что оба выво¬ да оставляют в стороне проблему естественной макроархитектуры интеллектуальных систем, т.е. именно то, что могло бы пролить свет на вопрос о вероятных функциях различных частей мозга и способах их взаимодействия в интеллектуальных процессах. МНОГОПРОЦЕССОРНАЯ МЕТАФОРА В АРХИТЕКТУРЕ СОВРЕМЕННЫХ ЭВМ Попытаемся использовать некоторые новые идеи вычислительной техники для концептуального осмысления работы нервной системы. По морфологической сложности нервная система высших позво¬ ночных превосходит весь остальной организм. Она состоит из многих десятков отдельных образований, отличающихся друг от друга раз¬ мерами, формой и внутренним строением. Даже эволюционно самая молодая часть нервной системы — новая кора полушарий большого мозга — у человека дифференцирована на десятки полей с различ¬ ной цитоархитектоникой [16,17]. Все эти структуры соединены друг с другом весьма сложной и до конца еще не изученной системой пучков нервных волокон. Различные по строению части мозга, как правило, отличаются и своими функциями, и своей ролью в процессах переработки информации. Некоторые авторы метафорически сопоставляли морфологически выделенные отделы мозга с отдельными процессорами вычисли¬ тельных устройств [18]. Особенно много работ в последнее время было посвящено двухполушарности. Следует, однако, подчеркнуть, что эта метафора понималась в значительной мере формально. Для объяснения принципов функционирования нервной системы не использовались многие важные атрибуты процессоров и многопро¬ цессорных систем. Отдельные процессоры в технических многопроцессорных системах обработки информации, как правило, обладают следующими ха¬ рактеристиками, которые фактически придают процессору особый 41
онтологический статус в рамках вычислительной системы, делают его своего рода "субъектом”: собственной памятью (быть может, нескольких видов, например для данных и программ); формой представления информации, адекватной решаемому кругу задач; возможностью по-разному коммутироваться с другими процессо¬ рами в различные функциональные конфигурации; возможностью быть перепрограммированным извне; входными и выходными дисплеями. Многопроцессорные устройства отличаются от однопроцессорных по целому ряду свойств. Прежде всего эти устройства, так сказать, полисубъекты. В них могут циркулировать не только потоки данных, но и потоки знаний (в том числе программы), потоки метапро¬ цедур, запросы на ту или иную информацию, а также- разно¬ образные управляющие и контрольные сигналы. Вообще говоря, функцией некоторых из процессоров могут быть планирование и организация работы всей многопроцессорной системы как целого. Для последовательной ее настройки на выполнение тех или иных макрозадач специализированные процессоры могут перекоммутиро- ваться каждый раз по-новому. В то же время перекоммутация — это отнюдь не управление в том смысле, в каком это слово обычно понимается. Коммутирующий процессор может почти ничего не знать о содержании программ тех процессоров, работой которых он, так сказать, управляет. Тем самым многопроцессорное устрой¬ ство напоминает скорее некое социальное или биологическое сооб¬ щество, чем отдельный организм в его традиционном смысле. Рассмотрим теперь, каковы, на наш взгляд, преимущества мно¬ гопроцессорных систем как устройств переработки информации. За счет распараллеливания процессов обработки информации онн гораз¬ до более надежны и производительны, что позволяет строить их из относительно уязвимых и медленно работающих элементов. Такие системы могут решать несколько задач одновременно без частых перезагрузок процессоров. Многопроцессорность позволяет закрепить за отдельными процессорами выполнение небольшого круга задач, сделать их специализированными, т.е. уже на уровне внутренней архитектуры приспособленными для работы с определенными формами представления информации. Это, если исходить из опыта построения технических систем, в свою очередь, на несколько порядков уве¬ личивает эффективное быстродействие. Например, многие задачи, легко решаемые с помощью геометрического построения, очень трудны, если их решать арифметически. При решении задач в естественном представлении отпадает, как правило, необходимость в их предварительной формализации, суще¬ ственно упрощается структура используемых программ. Далее спе¬ циализация процессоров позволяет однозначным образом связать физически разные состояния процессоров со смысловыми различиями во входной и выходной информации. Это невозможно в универ¬ сальной ЭВМ, где совершенно разной по смыслу информации может 42
соответствовать одно и то же состояние ячейки памяти или какого-то регистра. В универсальной ЭВМ информацией можно манипулировать бесконтекстно, опираясь лишь на присвоенное ей имя, но в отрыве от внешнего по отношению к ЭВМ контекста ее нельзя интер¬ претировать, что далеко не всегда удобно. Специализация про¬ цессоров позволяет снять эту проблему и дает возможность эффек¬ тивно контролировать работу процессора. Наконец, каждая форма представления информации выделяет, делает непосредственно зримыми разные аспекты окружающего мира. Одновременная работа множества специализированных процессоров в принципе позволяет системе, сопоставляя эти аспекты, синтези¬ ровать представления об объектах мира как о многогранных динами¬ ческих целостностях, а не просто как о носителях некоторого набора признаков. Заметим, что пока многими из перечисленных достоинств технические многопроцессорные системы обладают лишь в потенции. Еще одним достоинством многопроцессорных систем, содержащих внутренние дисплеи, является то, что такие системы в принципе обладают широкими возможностями эффективно оперировать ими¬ тационными моделями внешнего мира и своих собственных дей¬ ствий. Это необходимо, в частности, для того, чтобы система могла прогнозировать развитие ситуаций, за которыми наблюдают ее сенсорные датчики. Если имитационная модель происходящего уже сформирована, то, опираясь на нее, одна группа процессоров может на сенсорном дисплее в наглядной форме проиграть для другой группы процессоров возможное развитие ситуации. Мир дисплея по онтологическому статусу близок к мирам театральной сцены и модельного физического эксперимента. Это позволяет по-новому подойти к анализу проблем понимания [13]. Обратим особое внимание на то, что в многопроцессорном устрой¬ стве возможны операции, которые радикально меняют наше пред¬ ставление о возможностях ЭВМ. В системе, состоящей из процес¬ соров, общающихся между собой через дисплеи с помощью программ распознавания образов и оперирующих каждый своей, специали¬ зированной формой представления знаний, разумным образом можно ввести представление о смысле. Роль ’’смысла” берет на себя интер¬ претация одним процессором состояния других в своей форме представления. Посмотрим теперь, насколько изложенные выше идеи могут рассматриваться как концептуальная модель функционирования нер¬ вной системы, как новая ’’многопроцессорная метафора”. МНОГОПРОЦЕССОРНАЯ МЕТАФОРА: ОБОСНОВАНИЕ Рассмотрим сначала некоторые экспериментальные факты о прин¬ ципах организации мозга. Различные участки головного мозга рабо¬ тают параллельно и относительно независимо друг от друга. Об этом свидетельствует прежде всего то, что при локальных пора¬ жениях оставшиеся незатронутыми районы продолжают нормально 43
функционировать. Например, человек с тяжелыми нарушениями речи, возникшими после разрушения зоны Брока [19], может правильно узнавать окружающие предметы, читать и даже сочинять музыку [20]. Участки мозга специализированы. Помимо областей, ответствен¬ ных за управление изолированными движениями, за первичный анализ зрительной, слуховой и тактильной информации, в коре больших полушарий выделяются районы, которые выполняют весьма сложные интеллектуальные операции [21—25]. По крайней мере функционально зоны коры можно сопоставить с процессорами вы¬ числительных устройств. Посмотрим теперь, в какой мере эти зоны соответствуют представлениям о процессоре вычислительного устрой¬ ства, проделав сопоставления между свойствами зон коры и про¬ цессором по введенным выше характеристикам. Необходимо заметить, что экспериментальный материал, с по¬ мощью которого обосновывается справедливость различных аспектов ’’многопроцессорной метафоры”, конечно, неравнозначен по убеди¬ тельности. Несмотря на плодотворность нейропсихологического под¬ хода, экспериментальные методы зачастую слишком грубы, а выводы и интерпретации слишком произвольны. Поэтому постараемся ограни¬ читься наиболее хорошо установленными фактами, полученными при¬ знанными классиками нейропсихологии. Собственная память. И нейропсихологические и нейрофизиологи¬ ческие данные ясно указывают на то, что большинство из участков коры мозга обладает своей собственной памятью. При локальных поражениях задних конвекситальных отделов коры больших полу¬ шарий всегда одновременно исчезают и возможность оперировать с информацией какой-то модальности, и ее следы [26]. Все по¬ пытки найти единый центр памяти неизменно терпели неудачу. Аргументом в пользу существования центра памяти мог бы по¬ служить тот факт, что поражение ряда глубинных отделов мозга приводит к таким нарушениям внимания и управления общей актив¬ ностью мозга, которые делают эффективное запоминание невозмож¬ ным [27]. Но это никак не опровергает факта распределенности памяти по зонам. Действительно, для того чтобы запоминаемая'1' информация зафиксировалась, необходимы два условия. Во-первых, соответствующий участок мозга должен находиться в режиме актив¬ ного запоминания достаточно долго. Во-вторых, в его деятельность (или в деятельность той его части, которая занята запоминанием информации) некоторое время не должны вмешиваться новые задания или потоки информации. Оба эти требования нарушаются при по- ражении глубинных управляющих структур мозга [28]. Собственная форма предоставления информации. В качестве пер¬ вичного представления информации при зрительном восприятии исполь¬ зуется прямая проекция изображения на сетчатке в паттерн возбуж- , дения четвертого слоя семнадцатого поля коры мозга по Брод- L-ману. На следующем этапе обработки зрительной информации возбуж¬ дение отдельного нейрона уже означает наличие в его ’’поле зрения” информации в другом представлении (определенным образом ори- 44
ентированной границы объекта, движущейся полосы и т.п.) [29]. ' Чем дальше по коре мозга от сенсорных зон, тем более целостные! семантически становится представление обрабатываемой информации. Анализ нейропсихологических данных показывает, что участки мозга специализированы не столько на задачах, которые решаются, сколько на работе с той или иной формой представления входной информации. Опираясь на эту форму представления, каждый из них способен решать не одну, а целый спектр задач. Правда, такое понимание функций областей мозга нельзя считать общепринятым. По традиции, восходящей еще к прошлому веку, в нейропсихо¬ логии сохраняется тенденция закреплять зонами не формы пред¬ ставления, а целостные психические функции или хотя бы их отдель¬ ные элементы. Однако поражение одной и той же зоны мозга может привести к столь разным нарушениям, как потеря возмож¬ ности пользоваться географической картой, вести счет с переносом разрядов вправо или влево и понимать сложные грамматические конструкции [30]. Все эти функции объединяются лишь необходи¬ мостью использовать ’’квазипространственную форму” представления информации. Ряд участков мозга, расположенных в основном в области зри¬ тельного анализатора, специализируются на работе с симультанными пространственно развернутыми формами представления знаний. С другой стороны, в области мозга, обычно занимающейся анализом акустических сигналов, могут решаться задачи, для которых необ¬ ходимо рассмотрение длинных временных рядов. Это различие со¬ ответствует хорошо известной декларативно-процедурной контраверзе в представлении знаний [10]. Возможность коммутироваться в различные конфигурации. Раз¬ личные по специализации участки мозга могут, по-разному коммути¬ руясь друг с другом, образовывать сложные функциональные системы [30, 31]. В зависимости от того, какой именно участок мозга раз¬ рушен, у больного наблюдаются различные формы нарушения восприятия,предметной деятельности или речи. С другой стороны, одна и та же зона коры, как правило, участвует в решении весьма различных макропсихологических задач. ^ Еще одной отличительной чертой высших психических процессов I человека является тот факт, что "локализация их в мозговой коре / не является устойчивой, постоянной, а меняется как в процессе/ развития ребенка, так и на последовательных этапах упражнения. Участие слуховых и зрительных зон коры, обязательное на ранних! этапах формирования некоторой деятельности, перестает быть необ- \ ходимым на его поздних этапах, и та же деятельность начинает/ опираться на иную систему совместно работающих зон” [32]. -— Способ, которым осуществляется некоторое интеллектуальное дей¬ ствие, и соответственно локализация используемых для этого областей коры мозга даже у одного человека могут меняться в зависимости от того, какие еще задачи в этот момент необходимо решать мозгу [33]. Перепрограммируемость. Многие, если не большинство, зоны мозга 45
’’перепрограммируемы”, точнее, могут перестраивать характер инфор¬ мационной деятельности как автономно, так и под действием сиг¬ налов, исходящих из других отделов. Оговоримся, что термины "программа” и ’’программирование” с известной осторожностью сле¬ дует применять к зонам мозга, которые, по-видимому, по принци¬ пам функционирования близки к аналоговым системам. Ряд фактов говорит о том, что внутренняя структура этих зон, а вместе с ней и их функции изменяются не только в ходе эмбрионального развития и самообучения. Самым удивительным при¬ мером возможности передачи программы из одного участка в другой представляется перенос навыков и умений, например владения ино¬ странным языком, из одного полушария мозга в соответствующие его отделы другого полушария. Обучение идет не через внешнюю деятельность, а с использованием внутренних межзональных связей [34]. Входные и выходные дисплеи. Уже давно в мозгу человека и всех сколько-нибудь высокоорганизованных животных обнаружены многочисленные проекционные структуры. Только в зрительной хоре некоторых ночных обезьян их насчитывается не менее девяти [35]. Попытаемся показать, что для участков мозга эти структуры выпол¬ няют функции входных и выходных дисплеев ЭВМ. Информация на проекционных структурах мозга представляется в пространст¬ венно развернутой форме — в виде мозаики (как правило, дву¬ мерной) из возбужденных и невозбужденных нейронов. Зрительные и соматосенсорные образы внешнего мира проецируются в мозг с сохранением их топологической структуры [36]. Так, возбуждение близко расположенных элементов сетчатки глаза приводит к возбуж¬ дению близко расположенных нейронов в проекционных областях зрительной коры, а прикосновение к соседним точкам кожи проеци¬ руется в возбуждение соседствующих групп нейронов в области мозга, специализированной на анализе соматосенсорной информации. Соматотопически организована и двигательная кора мозга. В слу¬ ховом анализаторе возбуждения близких районов соответствуют близким по высоте звукам [37]. К сожалению, внутренние формы представления информации в мозге практически не исследованы. Однако коммутация проекционных структур подобна коммутации в процессорах вычислительных устрой¬ ств. Возбуждение нейрона в какой-то точке выходной проекционной структуры свидетельствует о наличии определенного паттерна из возбужденных нейронов в соответствующей этой точке части входной проекционной экранной структуры. Выходные; проекционные структуры одного участка (а их так же, как входных, может быть несколько) без топологических нарушений проецируются с помощью пучков нервных волокон на входные проекционные структуры других уча¬ стков. Обнаруживаются и встречные проекции, когда участок А смотрит на проекционную структуру участка В, а участок В — на одну из выходных проекционных структур участка А [38]. Участки мозга управляют не только своими выходными проек¬ ционными структурами, но и в какой-то мере вмешиваются в со¬ 46
бытия, разыгрывающиеся на их входных проекционных структурах. Об этом ясно свидетельствует характер связи между слоями коры мозга, а также то, что мы способны вызывать перед своим мыслен¬ ным взором сенсорные образы объектов окружающего мира. Особенно яркими становятся эти идущие изнутри образы во сне и при гал¬ люцинациях. В соответствии с развиваемыми в данной статье представлениями проекционные структуры предоставляют мозгу пространство, в ко¬ тором он разворачивает целый модельный мир, объекты которого для мозга сенсорно эквивалентны объектам окружающего мира [39—41]. Изложенное относится не только к объектам как тако¬ вым, но также к их свойствам и отношениям. В отличие от окружающего мира всем, что происходит во внутреннем модельном мире, мозг может оперировать непосредственно ’’силой мысли”. Фрагменты внутреннего мира, созданные одними процессорами, ана¬ лизируются (в срезе, соответствующем их специализации) другими процессорами мозга. Таким образом, наличие проекционных структур (внутренних дис¬ плеев) делает доступными мозгу не только имена объектов окру¬ жающего мира, но и в определенном смысле сами эти объекты. Именно поэтому мозг — это не просто устройство, перетасо¬ вывающее по некоторым правилам знаки, значение которых в ко¬ нечном итоге ему недоступно, а когнитивная система, предметно понимающая смысл той информации, с которой оперирует [42—48]. * * * Итак, сопоставление зон коры с процессорами вычислительных устройств по свойствам, а архитектуры мозга в целом с архи¬ тектурой многопроцессорной вычислительной системы со специализи¬ рованными процессорами представляется достаточно убедительным. НЕЙРОН — ЭЛЕМЕНТАРНЫЙ ПРОЦЕССОР МОЗГА До сих пор мы обсуждали особенности макроархитектуры мозга и пришли к выводу, что небольшие его участки (объемом 1—2 см3) являются сверхмощными процессорами, специализированными на вы¬ полнении различных интеллектуальных задач. В каждом таком участке содержится по нескольку миллионов нейронов, большая часть которых имеют размеры от 5 до 50 м к. И плотность ’’монтажа” и общие размеры процессоров мозга сопоставимы с соответствующими характеристиками современных вычислительных устройств, построен¬ ных на кремниевых кристаллах. Однако по быстродействию, памяти и тем более по сложности решаемых задач искусственные компьютеры еще очень сильно уступают естественным. Чтобы в этом убедиться, достаточно вспомнить сколь эффективно и с какой скоростью животные и человек решают задачи анализа изображений, сколько различных образов хранится в нашей зрительной памяти. Ситуация предстанет еще более удиви¬ тельной, если мы вспомним, что, по данным зоопсихологии [49], 47
абсолютные размеры мозга вообще мало что говорят об ннтел- , лектуальности животного. Определяющим параметром здесь счи¬ тается отношение веса мозга животного к весу его тела. Многие /насекомые, общий объем мозга которых составляет доли кубического миллиметра, справляются с анализом зрительных образов немногим хуже, чем человек [50]. Заметим, что нервные системы насекомых, так же как других беспозвоночных, состоят из относительно не¬ большого числа нейронов. В чем же причины высокой эффективности процессоров мозга? Некоторые причины, например специализированность нервных сетей на работу с конкретными формами представления информации, мы уже отмечали. Еще одна и, как представляется, главная состоит в том, что отдельный элемент нервной системы — нейрон — уже представляет собой сложное и довольно мощное устройство для обработки информации. Эта точка зрения не является общепризнанной. Многие нейро¬ биологи не считают концепцию ’’премудрого нейрона” убедительной. Действительно, за информационной сложностью нейрона должна стоять его структурная сложность. По крайней мере разнообразию функций нейронов должно соответствовать разнообразие их струк¬ тур. Поскольку все нейроны построены в принципе единообразно и отличаются друг от друга в основном лишь формой и струк¬ турой ветвления их дендритов, пространственным распределением на них синаптических контактов, а также, быть может, типом ветвления терминалей аксона и характером пространственного распре¬ деления свойств цитоплазматической мембраны, то именно эти характеристики должны, по-видимому, быть определяющими для функций нейрона. Это решительно не согласовывалось с господствовавшей до не¬ давнего времени теорией работы нервных клеток, согласно которой нейрон возбуждается, как только сумма сигналов на его входах (при любом расположении на дендритах и любой их форме) превысит некоторый порог. Кроме того, признание связи между морфологическими и физиологическими характеристиками нейрона подразумевает, что чрезвычайно сложная геометрия дендритов и их контактов с терминалами аксонов имеет неслучайный характер. Это требует большой точности и целесообразности от нейромор¬ фогенеза, в чем многие авторы высказывали определенные сомне¬ ния. Однако стали накапливаться данные, которые противоречат взгляду на нейрон как на простой пороговый элемент, существенно обога¬ тились также знания о нейроморфогенезе. Попытаемся привести аргументы в пользу того, что по сложности решаемых задач многие нейроны приближаются к современным процессорам. Кроме того, изложим факты, которые позволят выдвинуть гипотезу о том, что во время работы нервные клетки меняют свое морфо¬ логическое строение, и это, по всей видимости, является меха¬ низмом долговременной памяти мозга. Прежде всего хотелось бы оспорить кочующее из публикации в 48
публикацию утверждение, что нейрон — медленно работающее устройство. Действительно, частота импульсов на выходе подавляющего боль¬ шинства нейронов редко превосходит 100 импульсов в секунду, а переходные процессы в мембранах длятся по нескольку микро¬ секунд. Однако многие нейроны имеют десятки, а то и сотни тысяч входов. Для того чтобы имитирующая нейрон ЭВМ могла даже просто последовательно опросить эти входы за 0,01 с, быстро¬ действие машины должно было бы превышать 106 операций в секунду. А ведь значения входных сигналов не просто суммируют¬ ся. Последовательность явлений, которую пришлось бы промодели¬ ровать, в общих чертах такова. Когда к синаптическому окон¬ чанию приходит нервный импульс, в синаптическую щель выде¬ ляется ббльшая или меньшая порция медиатора. Взаимодействие медиатора с рецепторами постсинаптической мембраны приводит к ее электрической деполяризации (или гиперполяризации, если синапс тормозной). Возникающие токи воздействуют на мембрану дендри- тов и тела клетки, а в конечном итоге вызывают частичную депо¬ ляризацию триггерного участка нейрона, лежащего в основании аксона — аксонного холмика. Если в результате совместного дей¬ ствия нескольких активных синапсов эта деполяризация оказыва¬ ется больше критической, то в дальнейшем она начинает нарастать лавинообразно. Возникает нервный импульс, который затем не зату¬ хая будет распространяться по аксону — выходному отростку клетки. Сразу заметим, что такая картина типична для боль¬ шинства, но не для всех нейронов. И тем не менее даже те нейроны, для которых она справедлива, это отнюдь не простые сумматоры, соединенные с пороговыми элементами. Во-первых, количество медиатора, выделяющееся в синаптиче¬ скую щель при переходе нервного импульса, отнюдь не постоянно. Известны феномены потенциирования и привыкания синапсов. Потен- циация приводит к тому, что на каждый следующий сигнал выделя¬ ется все больше медиатора. Медленно развивающееся привыкание или усталость синапса приводят к обратному эффекту. Во-вторых, на многих синапсах находятся другие, управляющие синапсы. Ре¬ зультат их совместного действия отнюдь не пропорционален сумме пришедших на них сигналов. Поляризация (гиперполяризация) постсинаптической мембраны, выз¬ ванная отдельным нервным импульсом, развивается не мгновенно. После некоторого латентного периода, она быстро нарастает, а за¬ тем затухает в течение нескольких микросекунд. Следующий нервный импульс приходит, как правило, до того, как исчерпалось действие предыдущего. В результате они нелинейным образом суммируются (так называемая временная суммация). Таким образом, картина деполяризации постсинаптической мембра¬ ны достаточно нетривиальным образом зависит от временнбй струк¬ туры потока импульсов, поступающих на данный вход [51]. Отклик постсинаптической мембраны на цепочку нервных импульсов зависит 4. Зак 1668 до
также от общего состояния клетки, которое определяется ее актив¬ ностью на больших интервалах времени (минимум — десятки секунд). Из теоретических соображений следует, что близко расположен¬ ные синапсы (а упаковка синапсов на мембранах дендритов до¬ вольно плотная) должны влиять на эффективность друг друга [52]. Характер этого влияния зависит от свойств мембраны дендри¬ тов. В одних случаях следует ожидать взаимного шунтирования синапсов. В других, если, например, мембрана возбудима, синапсы должны как бы усиливать действие друг друга. Возможны и менее тривиальные варианты взаимодействия близко расположенных синап¬ сов. Вопрос о том, каковы на самом деле свойства мембран дендритов, в настоящее время до конца не исследован. Ряд авторов считают, что дендритные мембраны могут иметь весьма причудли¬ вые характеристики* не похожие на свойства ни пассивных, ни клас¬ сических возбудимых мембран, таких, как, например, мембрана аксона [53]. Уже сейчас, однако, ясно, что у разных типов нейронов харак¬ теристики дендритных мембран разные. Более того, на различных участках дендритной мембраны даже у одной клетки ее свойства могут варьироваться. Например, в узлах ветвления дендритов многих нейронов обнаружены триггерные возбудимые зоны. Именно на узлах ветвления плотность расположения синапсов обычно особенно велика [54]. Характер взаимодействия близко расположенных синапсов за¬ висит по-видимому и от расположения окружающих нейрон глиаль¬ ных клеток. Встречаются, например, группы синапсов, отделенные от окружения специальной изолирующей капсулой [55]. Потенциалы, вызванные деполяризацией различных постсинапти- ческих мембран, взаимодействуют также и по мере их распростра¬ нения к аксонному холмику, так как среда, в которой они распро¬ страняются, обладает нелинейными свойствами, хотя бы из-за наличия в ней возбудимых мембран. На характер этого взаимодействия сильно влияет геометрия дендритов и расположение на них триггерных зон. Сигналы, пришедшие на близко расположенные ветви дендрит¬ ного дерева, суммируются совсем не так, как сигналы, пришедшие на удаленные друг от друга дендриты. Еще больше усложняет картину тот факт, что сигналы от распо¬ ложенных в разных местах синапсов приходят в триггерные зоны с различной задержкой. С учетом этого даже в моделях, в ко¬ торых свойства дендритной мембраны предполагаются линейными, функции нейрона оказываются зависящими от геометрии дендритов и распределения на них синапсов. Такой нейрон может легко отличать одну последовательность возбуждения синапсов от дру¬ гой [56]. Наконец, значение порога возбуждения аксонного холмика может зависеть от состояния клетки. Нелишне здесь напомнить, что многие нейроны обладают спонтанной импульсной активностью и прихо¬ дящая афферентация лишь меняет ее временные характеристики, например частоту. Для подобной системы вообще бессмысленно 50
рассматривать такую характеристику, как зависимость выхода в данный момент времени от состояний входов на предыдущем вре- меннбм такте. Частота выхода нейрона в данный момент времени зависит от характеристик импульсных потоков на его входах в течение довольно большого отрезка времени, предшествующего дан¬ ному. Математически связь между входным и выходным импульсными потоками могла бы быть описана весьма сложным нелинейным интегро-дифференциальным оператором (104 взаимодействующих вхо¬ дов!), в простейшем случае — оператором типа свертки. Приведем еще некоторые факты и соображения, характеризующие сложность и разнообразие функциональной организации нервных клеток. Влияние нейронов друг на друга не исчерпывается пере¬ дачей сигналов через классические химические синапсы. Во-первых, многие нейроны выделяют при возбуждении не медиаторы, а нейромоду¬ ляторы [57], т.е. вещества, которые не вызывают у контакти¬ рующих с ними клеток непосредственно деполяризации или гипер¬ поляризации мембраны, а лишь регулируют характер их ответа на сигналы, поступающие от других нейронов. Во-вторых, изме¬ нение мембранных потенциалов нервных клеток может непосред¬ ственно, через так называемые электрические синапсы передаваться на мембраны соседей [58]. Не все нейроны возбудимы. В ряде случаев обработка информа¬ ции и ее передача осуществляются на подпороговом уровне. На¬ конец, помимо классических синапсов между аксонами одних ней¬ ронов и дендритами других, встречаются и дендрит-дендритные, дендрит-аксонные и тому подобные синапсы. Это дало основание ряду авторов (см., например, публикацию [59]) высказать предпо¬ ложение о том, что, в сущности, на самом деле обработка ин¬ формации в нервной системе происходит в нейропиле — плотной массе сплетенных и имеющих многочисленные и разнообразные взаимные контакты отростков нервных и глиальных клеток. Возможности отдельных нейронов настолько велики, что в неко¬ торых случаях им доверяется управление сложными динамическими системами или организация целостных поведенческих реакций. Напри¬ мер, у ряда насекомых всей динамикой машущего полета управляют менее десятка специализированных нервных клеток [60]. Так назы¬ ваемые командные нейроны (как правило, гигантские) используются у многих животных для распознавания угрожающей ситуации и быстро¬ го запуска целостной реакции избегания. Командные нейроны орга¬ низуют пение сверчка и цикады, обеспечивают пищевые и обо¬ ронительные движения моллюсков, управляют саккадическими дви¬ жениями глаз человека и т.п. Подчеркнем, что очень часто ко¬ мандные и сходные с ними нейроны не просто запускают сложные врожденные программы поведения, но и управляют их разверты¬ ванием, адаптируют их течение к конкретным обстоятельствам среды. Более того, такие нейроны способны в одиночку или небольшими группами решать достаточно сложные задачи анализа афферентной информации. Для некоторых нервных клеток характерно наличие гигантских рецептивных полей. У позвоночных такие ’’макронейроны” 51
занимают стратегическую локализацию на' входе и выходе клю¬ чевых участков мозга [61]. Итак, даже элементарная структурная единица нервной системы — нейрон — является весьма сложным устройством для обработки информации. Для имитации его функций в реальном времени по¬ надобилась бы ЭВМ с быстродействием не менее 10 операций в секунду и достаточно большой памятью. Эффективность работы нейрона в значительной мере определяется тем, что значение вы¬ ходной функции от десятков тысяч входов определяется не путем реализации длинной цепочки бинарных операций, а находится сразу, за один такт — время переходного процесса в системе. В качестве простого линейного сумматора с пороговым элемен¬ том нейрон работает лишь в исключительных, предельно простых случаях. Способ, которым нейрон преобразует входные сигналы в выходные, т.е. программа его функционирования, непосредственно определяется морфологической и молекулярной структурой нейрона. Эта программа ’’запаяна” в его hardware. Как же перепрограмми- руется такой нейронный процессор? Как организована и функцио¬ нирует его память? Для того чтобы приблизиться к ответам на эти вопросы, сле¬ дует обратиться к современным данным о морфологической и функциональной пластичности элементов нервной системы. ПАМЯТЬ И МОРФОГЕНЕЗ Природа памяти до сих пор остается одной из самых интригующих загадок нейробиологии. В технических устройствах память и соб¬ ственно процессор обычно разделены, представляют собой два почти независимых устройства. Первое из них обязательно должно иметь комбинаторно большой спектр долгоживущих состояний с как можно более быстрыми индуцированными переходами между ними. Наличия долгоживущих состояний от второго устройства в принципе не требуется, зато его выходной блок должен быстро приходить в состояние, которое определенным, как правило нетри¬ виальным, образом соответствует состояниям входных блоков. Нейрон выполняет функции обоих этих устройств сразу. Это оказывается возможным вследствие того, что одни характеристики его состояния могут меняться медленно, а другие — быстро. Нейрон представляет собой систему с несколькими уровнями дина¬ мики, каждый из которых имеет свой масштаб времени. При этом медленно меняющиеся характеристики нейрона определяют параметры и граничные условия протекающих в нем быстрых процессов. С другой стороны, многократное повторение одного и того же быстрого процесса может в принципе постепенно сдвинуть медленно меняющиеся характеристики нейрона, что замыкает круг взаимных влияний различных уровней его динамики. Естественно, что подобная система будет и долго помнить свою историю, й быстро реаги¬ ровать на поступающие извне воздействия. Такой взгляд на принципы организации долговременной памяти хорошо согласуется с общим направлением исследований этой проблемы в нейробиологии. 52
Под быстрыми процессами в нервной системе подразумеваются процессы формирования и распространения нервных импульсов на мембранах нейронов. Многократное стереотипное повторение таких процессов легко обеспечивается циркуляцией импульсов по замкнутым путям в нервных сетях. Это само по себе, как доказывают результаты ряда исследований, является основой кратковременной памяти. Для некоторых отделов мозга, например для гиппокампа и мозжечка [62], удалось экспериментально показать, что длительная одно¬ типная стимуляция существенно облегчает ответ нейронов на ее повторное предъявление. О том же, хотя и косвенно, свидетель¬ ствует факт, что для надежного запоминания необходимо повторе¬ ние. И тем не менее проблема долговременной памяти еще не решена. Неясно, какие именно медленно меняющиеся характеристики ней¬ ронов и нервных сетей являются ее основой. По этому поводу выдвигаются разнообразные, более или менее обоснованные гипотезы, многие из которых не являются взаимоисключающими. Значительное признание получила гипотеза об изменении в ходе повторного функционирования весов синапсов, т.е. количества выделяемого в них за одно возбуждение медиатора и соответственно уровня вызванной деполяризации постсинаптической мембраны. Обнаружены согласую¬ щиеся с этой гипотезой изменения строения многократно активи¬ рованных синапсов. Нейрофизиологические данные также подтвержда¬ ют такое представление [62]. Ясно, однако, что такой механизм не может быть основным в организации долговременной памяти, поскольку нейрон должен обучаться реагировать не только на возбуждение отдельных акти¬ вированных синапсов, но и узнавать повторно встречающиеся пра¬ вильно организованные во времени сочетания активности многих синапсов. Тем же недостатком страдает и гипотеза о том, что основным механизмом памяти является миелинизация глиальными клетками аксонов активных нейронов [63]. Миелинизация повы¬ шает эффективность проведения нервных импульсов. Выход много¬ кратно возбуждавшихся нейронов как бы отпирается. В этой гипо¬ тезе несомненно интересным кажется предоставление достаточно активной роли окружающей нейроны глии. Кроме того, гипотеза опирается на данные о морфогенетических процессах в работающем мозге. Глиальные клетки действительно сползаются к активным нейронам, что не может не изменить работы последних. Многие исследователи связывают с долговременной памятью морфогенетические изменения, наблюдающиеся в цитоплазме длитель¬ но возбуждавшихся клеток [64, 65]. Например, характер шерохо¬ ватого эндоплазматического ретикуума в теле гигантского нейрона, выполняющего у рака функцию механорецептора, достаточно точно отражает уровень его возбудимости. Последний можно искусственно менять, последовательно раздражая механорецептор или подавая на него тормозные сигналы. Естественно, что с морфологическими перестройками цитоплазмы сопряжены изменения биохимических па¬ раметров клетки, что и определяет в конечном итоге общее из¬ менение возбудимости ее мембраны. 53
Не будем здесь обсуждать многочисленные гипотезы о том, что долговременная память имеет чисто биохимическую природу. Факти¬ ческие данные, подтверждающие такой взгляд, скудны и проти¬ воречивы, а главное, совершенно непонятно, как паттерн актив¬ ности цитоплазматической мембраны может быть непосредственно перекодирован в структуру макромолекул, и наоборот. По нашему мнению, все долговременные (длящиеся больше не¬ скольких минут) изменения тонкой функциональной организации нейрона, т.е. определяющее его дифференцированное отношение к различным паттернам возбуждения входов, должны отражаться и фиксироваться в морфологическом строении нейрона. Соответственно, поскольку многие нейроны остаются во взрослом состоянии функцио¬ нально пластичными, пластичной, меняющейся в зависимости от обстоятельств, должна оставаться их пространственная структура. Это для многих, по-видимому, неожиданное предположение пред¬ ставляется достаточно, хотя и косвенно, обоснованным. Хорошо известно, что живые клетки, которые бы были морфо¬ логически статичны и совершенно не меняли бы с некоторого момента свою форму, являются редкими исключениями. Практи¬ чески во всех тканях животных клетки непрерывно, хотя и мед¬ ленно, движутся или по крайней мере меняют форму. Именно по этим движениям при просмотре цейтрафферного микрокино¬ фильма живую клетку всегда можно отличить от мертвой. Обычно особенно активно изменяется форма клеточных отрост¬ ков. Они удлиняются, проникая в щели между соседними клет¬ ками, втягиваются назад, ветвятся и сливаются, устанавливают и разрывают временные контакты с соседними клетками. Было бы очень странно, если бы оказалось, что такая клетка, как нейрон, имеющая множество отростков и морфогенетически очень активная в ходе развития мозга, с некоторого момента замирала бы, переставала, хотя бы отчасти, изменять свою форму и струк¬ туру контактов с окружающими клетками. И действительно, извлеченные из взрослых животных нейроны в культуре ткани активно перемещаются, не говоря уже о росте и изменениях формы их отростков или ’’ползании” синаптических контактов по мембране дендритов и сомы [66]. У взрослых живот¬ ных морфология нервных клеток достоверно меняется при всевоз¬ можных реактивных состояниях, вызванных неблагоприятными аген¬ тами [67], а также при радикальной смене характере их афферентации. К сожалению, длительные прижизненные наблюдения за отдель¬ ными нейронами с их отростками внутри нервной системы ме¬ тодически очень сложны. Еще труднее сочетать эти наблюдения с адекватной физиологической стимуляцией и контролем состояния нейронов. С помощью же серий зафиксированных в разное время или в разных условиях гистологических препаратов можно досто¬ верно судить лишь об очень грубых и массовых изменениях струк¬ туры клеток. В тех немногих случаях, когда прижизненные наблю¬ дения все-таки проводились, исследователи неизбежно обнаруживали, что форма нейрона и его отростков не статична. 54
Гораздо более обильный и убедительный экспериментальный материал стоит за нашими знаниями об изменениях форм нейронов в ходе развития мозга. Показано, что нервные клетки не только меняют свою структуру в ходе развития (это тривиально), но и то, что характер изменений решительным образом зависит от афферен- тации [68]. Какое же отношение эти данные имеют к морфологической дина¬ мике взрослых нейронов? Дело в том, что у по крайней мере высших позвоночных животных мозг продолжает развиваться, морфо¬ логически совершенствоваться долгое время после рождения в прямой связи с характером его функциональной активности. Таким об¬ разом, период активного обучения совпадает у этих животных с периодом активного формирования цитоархитектуры мозга. Проти¬ вопоставлять в данном случае онтогенетические изменения морфо¬ логии тем изменениям, которые связаны с осуществлением функции, попросту нельзя. Естественнее думать, что развитие структуры мозга медленно продолжается в течение всей активной жизни и опреде¬ ляется в значительной мере ее информационным содержанием. Приобретенные знания и умения ’’запаиваются” непосредственно в структуру системы. Никаких противоречий с современными представлениями о гене¬ тическом определении морфогенеза здесь нет. Во-первых, хорошо известно, что генетически, через биохимию, задается не дефини¬ тивное морфологическое строение животного, а лишь норма реакции его клеток и тканей на окружение и факторы внешней среды — законы морфогенеза. В различных условиях реализация этих за¬ конов приводит к построению организмов с более или менее различ¬ ной структурой. Такие ’’мелочи”, как точная форма отдельных клеток и положение контактов между ними, полностью предопределены генетически лишь в исключительных случаях. Элементарные подсчеты показывают, что всей содержащейся в геноме информации не хва¬ тило бы, чтобы точно задать все детали архитектуры мозга. По-видимому, для большинства областей мозга генетически опре¬ делено лишь то, каким образом их тонкое строение будет зави¬ сеть от обстоятельств функционирования. Ряд специалистов счи¬ тают, что структуры мозга, начинающие функционировать в раннем онтогенезе, своей активностью оказывают существенное влияние на формирование его позднее развивающихся частей [61]. Такой взгляд хорошо согласуется с известными соотношениями между врожденными и приобретенными формами поведения. Приведем еще некоторые аргументы в пользу высказанного предположения. Во-вторых, по данным современной экспериментальной морфологии нейроны внутри работающего мозга попросту не могут не изменять своей структуры. Дело в том, что локальная деполяризация мембран, связанная с проведением и генерацией нервных импульсов, как хорошо известно, приводит к тому, что в окружающей нейрон среде возникают перепады потенциалов порядка 10 мВ на клетку (10 мкм) и ионные токи плотностью порядка 10~6 А/см2. Такой же порядок величины имеют и медленно меняющиеся потенциалы мозга. 55
! На них активность нейронов влияет опосредовано, через глиальные клетки. Убедительно показано, что электрические поля такой же плотности оказывают сильное, а иногда и организующее влияние на морфогенез [69—71]. Более того, в экспериментах с культурой ткани прямо показано, что такие поля ориентируют рост аксонов по направлению к катоду [72, 73]. На характер нейроморфогенеза существенное влияние оказывают по-видимому, не только электрические поля, но и диффузионные потоки метаболитов. Уже отмечалось выше, что активность нейрона вызывает миграцию к нему глиальных клеток. Характер его микроокружения меняется, меняется и система его контактов с глиальными клетками. В таких случаях клетки, как правило, отвечают изменениями своей морфологической структуры, особенно перераспределением рецепторов, каналов и ионных насосов на клеточной мембране. Нет никаких оснований считать, что нейроны представляют собой в этом смысле исключение. Таким образом, морфологическая структура нейрона непосред¬ ственно определяет характер его функционирования, а оно за до¬ статочно большое время должно приводить к изменению морфо¬ логической структуры. Это и служит, по нашему мнению, основой долговременной памяти мозга. Напомним, что для того, чтобы некоторая информация была зафиксирована нашей памятью надолго, активность мозга после получения этой информации не должна прерываться по крайней мере в течение нескольких минут. Именно за такое время в тканях мозга могли бы произойти достаточные структурные изменения. При этом морфогенетические и нейрофизиологические процессы как бы сливаются воедино. Во всяком случае, выделяется класс процессов, соответствующих ’’медленному” мышлению, т.е. мышле¬ нию, идущему через последовательную перестройку отпечатанных в мозгу моделей, а не просто через комбинирование ими в неиз¬ менном виде. На наличие таких длительно идущих в подсознании процессов и их роль в творчестве указывали многие крупные ученые и литераторы [74]. В рамках предлагаемой гипотезы неожиданно простой ответ могут найти некоторые классические вопросы нейробиологии. Понятно, например, почему нейроны взрослого мозга не должны делиться. При этом терялись бы знания, так как из одного нейрона, форма которого несет следы прошлого опыта, получались бы два с ’’бес¬ смысленной” формой. МОРФОДИНАМИЧЕСКАЯ МОДЕЛЬ НЕЙРОНА Приведенные выше соображения позволяют предложить новую мо¬ дель работы нейрона. Фундаментальным отличием от предлагавшихся ранее представлений является предположение о том, что положение синапсов на дендритах меняется и зависит от прошлой активности этих синапсов. Тем самым получаем морфологически пластичный 56
элемент для переработки афферентной информации, способный осу¬ ществлять широкий класс преобразований входных сигналов (в частности, обучаться распознаванию образов). Допустим для определенности, что мембрана дендритов является возбудимой, а также что одновременно возбуждающиеся синапсы в момент возбуждения и некоторое время после него ползут по дендритному дереву навстречу друг другу. Эти допущения пред¬ ставляются вполне обоснованными в свете того, что было изложено выше. Так, если считать, что синапсы перемещаются в слабых электрических полях в том же направлении, что и растущие нейроны [72], т.е. ”к катоду”, то зона частичной деполяризации дендритной мембраны, вызванная активностью одного синапса, должна ’’при¬ тягивать” к себе другие синапсы. Напомним, что чем ближе на возбудимой мембране расположены синапсы, тем ббльшую депо¬ ляризацию мембраны они вызывают при одновременном возбужде¬ нии [52]. Следовательно, группа исходно разрозненных, но синхронно возбуждавшихся синапсов, активность которых не могла привести к возбуждению всего нейрона после того, как они сползлись, оказывается способной это сделать. Морфогенез как бы выделяет из всего множества синапсов ту их группу, которая несколько раз возбуждалась синхронно. Нейрон обучается распознаванию активности такой группы или даже ее части, если эта часть сползшихся синапсов достаточно велика, чтобы его возбудить. Тем самым нейрон начинает функционировать как обучающийся ассоциативный элемент, способный в одиночку выделить повторяющийся паттерн синхронных возбуждений. Если учесть тот факт, что сама зона деполяризации смещается во вре¬ мени, а синапсы ползут не друг к другу, а к деполяризованным одновременно с их возбуждением участкам мембраны, то обнаружится, что такой нейрон обучается распознавать не только пространственные, но и пространственно-временнйе паттерны возбуждения. Каждый следующий синапс после того, как он правильно расположится, будет активизироваться в тот самый момент, когда дойдет волна частичной деполяризации, и тем самым синапс будет ее усиливать. Еще более интересные свойства обнаруживают ансамбли из таких нейронов. А именно если несколько нейронов, связанных взаимной афферентацией, возбуждаются приходящими извне стимулами в не¬ которой последовательности, то через определенное время ока¬ жется, что достаточно в правильной последовательности возбудить часть из этих нейронов, чтобы весь ансамбль возбудился, продолжая ту же последовательность. Не представляется чрезмерно смелым предположить, что цепочки из частично перекрывающихся по своему составу ансамблей служат субстратом, на котором осуществляется цепь образных ассоциаций. Еще более широкие возможности для объяснения принципов обра¬ ботки информации в мозгу выявляются при учете процессов из¬ менения формы дендритов (в частности, их шипикового аппарата), роста аксонов, формирования новых синапсов, изменений мембраны нейрона, сопряженных с изменениями в системе его контактов с 57
г глиальными клетками. Имеется одно непосредственное свидетель¬ ство того, что синхронно возбуждающиеся синапсы сползаются вместе [75], что делает изложенные выше соображения достаточно жиз¬ ненными. "СЛОЖНЫЙ НЕЙРОН” И КЛАССИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ КИБЕРНЕТИКИ Все изложенное выше позволяет по-новому поставить вопрос о природе мышления. Ясно, что возможности мозга как системы обработки информации непосредственно связаны со свойствами и возможностями его ’’элементной базы”. Мозг представляется сложным самоорганизующимся аналоговым устройством, каждый элементарный блок которого сравним по сложности с процессором современной ЭВМ. Парадоксально, но это устройство будет крайне плохо рабо¬ тать с формальными знаковыми системами. В частности, оно будет плохо считать, и в нем крайне трудно усмотреть сходство с уни¬ версальной машиной Тьюринга. Вряд ли можно сомневаться в вы¬ числительной универсальности мозга, хотя он в этом отношении крайне малоэффективен. Тем самым серьезным- предметом обсуждения становится само понятие универсальности устройств, преобразующих информацию. Универсальность оказывается не имеющей ничего общего с эффек¬ тивностью — существуют резко различные классы формально уни¬ версальных устройств, которые эффективны в практически не пере¬ секающихся интеллектуальных сферах. Хорошо известно, что уни¬ версальную ЭВМ можно построить из аналоговых элементов, реали¬ зующих дифференциальные и интегральные операторы, и простей¬ ших нелинейных устройств, и наоборот, операции дифференцирования и интегрирования можно выполнять численно на цифровых ЭВМ. Однако количество необходимых элементов, время их работы и затрата труда программистов для решения одной и той же задачи на разных устройствах совершенно не сопоставимы. Некоторые задачи естественно решать на аналоговых устройствах, некоторые — на цифровых. Естественный, базисный круг задач, с решением которых мозг сталкивался в процессе эволюции, это распознавание образов, имитационное моделирование и предсказание поведения динамических систем в реальном времени, формирование ассоциатив¬ ных связей путем обучения. Возможности осуществлять арифмети¬ ческие операции, работать со знанием по определенным формальным правилам являются позднейшими приобретениями и представляют собой скорее часть культуры, чем имманентные биологические спо¬ собности. В это вовлечены массивные области новейшей коры. Вопреки мнению, распространенному среди широкого круга спе¬ циалистов, занимающихся математическим моделированием функций мозга [76], эти задачи, как показано в классических нейропси- хологических исследованиях, отнюдь не являются элементарными. Таким образом, представление об эффективности универсального устройства обработки информации существенным образом опреде¬ 58
ляется семантизацией тех базовых физических состояний и операций над ними, которые лежат в основе работы данного устройства. Любое устройство обработки информации является в своем ис¬ ходном понимании физическим устройством, характеризующимся определенными физическими состояниями и операциями над ними. Превращение физического устройства в информационное происходит путем определенной семантизации, т.е. приписывания смысла ба¬ зисным физическим состояниям и операциям. Для эффективности работы устройства используемая семантика должна быть естест¬ венной как по отношению к интерпретации состояний и операций, так и по отношению к тем задачам, для решения которых данное устройство предназначено. Естественно семантизировать в виде двоич¬ ных арифметических и логических операций взаимодействие триг¬ геров, а затем строить из них цифровые ЭВМ. Столь же естест¬ венно моделировать динамику с помощью дифференцирующих и ин¬ тегрирующих электрических цепей. Каждый раз, когда рассматривается новое устройство обработки информации, принято по сложившейся традиции исследовать его на универсальность, фактически же просто проверить, удается ли семантизировать (хотя бы искусственно) часть его состояний как полный набор состояний вполне определенного дискретного авто¬ мата, а именно машины Тьюринга (или эквивалентного ей устрой¬ ства). При этом совершенно не рассмотренным оказывается допрос о возможностях естественной для данного устройства семантизации. Ведь отнюдь не исключено, что определенное устройство пере¬ работки информации будет эффективно действовать в рамках семан¬ тики, недоступной "универсальному” дискретному вычислительному устройству. Например, будет доказывать теоремы существования клас¬ сической математики, оперируя, скажем, с топологическими объек¬ тами, или получать утверждения о глобальных свойствах натуральных чисел, например об асимптотических свойствах распределения простых чисел, т.е. свойствах, существенным образом зависящих от беско¬ нечных совокупностей. Легко заметить противоречие этого утверждения с утверждением, которое обычно (хотя ошибочно) отождествляется с тезисом Черча, что работа любого физического устройства, пригодного для пере¬ работки информации, может быть представлена как реализация дискрет¬ ного алгоритма. Последнее, однако, не только не доказано, но и в отличие от тезиса Черча не апробировано. Необходимо признать, что адекватной семантизации для функций нейрона до настоящего момента еще не найдено. Однако даже заведомо упрощенная семан- тизация этой функции в виде оператора свертки (обоснованная выше) уже дает достаточно широкие возможности обработки инфор¬ мации, что можно показать, используя аппарат, предложенный Н. Винером для анализа нелинейных вероятностных задач [77]. Действительно, если считать распределение синапсов на денд¬ ритах случайным, оператор свертки дает возможность реализовать базисный для теории Винера функционал F(a)= f<p(t)dx(t, а), . (1) 59
где x(t, а) — определенная Винером функция Ьроуновского дви¬ жения; а — параметр, или ’’номер”, броуновской траектории. Центральная операция в формализме Винера, позволяющая рас¬ сматривать преобразование (1) как нелинейный аналог преобразования Фурье, — усреднение по а. Если реализовывать случайные функции с помощью распределения синапсов, то усреднение по а можно просто заменить суммированием по большому числу параллельно включенных нейронов, что в принципе позволяет реализовывать на сетях из нейронов чрезвычайно богатый набор операций — анализ спектров, построение аналога ’’передаточной функции” для нелиней¬ ных устройств, кодирование, декодирование и предсказание времен¬ ных рядов и т.п. Это, в частности, открывает возможности для построения имитационных моделей по сенсорной информации и пере¬ носа моделей из одной части мозга в другую. В известном смысле анализ нейронных сетей возвращается тем самым к классическим постановкам, намеченным Н. Винером в 40—50-х годах. Учитывая количество нейронов в мозге, можно предположить, что сети из такого рода элементов смогут имитировать в реальном времени и предсказывать поведение динамических систем с весьма большим числом степеней свободы. В монографии [77] показано, что, имея аппарат по реализации функционала от функций броунов¬ ского движения, можно решить большое число самых разнообразных нелинейных задач, в том числе и ’’задачу самоорганизации” по заданному образцу, заменяя любое нелинейное устройство без само¬ возбуждения некоторой конечной комбинацией из бесконечного набора стандартных линейных блоков. МОЗГ КАК ФАБРИКА ВЫЧИСЛИТЕЛЬНЫХ УСТРОЙСТВ Возвратимся к более сложной, морфодинамической модели ней¬ рона. Что же в этой модели существенного с точки зрения общей теории обработки информации? Прежде всего такая модель позволяет реализовать известный прин¬ цип, согласно которому вычисления проводятся наиболее эффек¬ тивным образом в системе, аппаратная реализация которой спе¬ циально приспособлена для данного класса вычислений. Когда появи¬ лись возможности для конструирования разнообразных интегральных схем под конкретный тип вычислительных операций, стало ясно, что именно специализация аппаратной реализации — верный путь повышения быстродействия. В развитии вычислительной техники можно выделить в данном смысле четыре фазы. В первой — один универсальный процессор выполнял по очереди все операции в схеме вычислений. Во вто¬ рой — вычисления, относящиеся к разным независимым ветвям вычислительной схемы, выполнялись различными, но однотипными универсальными процессорами. В третьей фазе, которая реализуется в настоящее время, имеется тенденция использовать по возмож¬ ности специализированные процессоры для выполнения различных по содержанию операций в схеме вычислений. Развитие этого направ¬ 60
ления, однако, сдерживается тем, что специализированные про¬ цессоры имеют ’’жесткую” физическую структуру и не могут быть перестроены, в результате чего ЭВМ на таких элементах плохо перенастраиваются с одной вычислительной схемы на другую. По нашему мнению, четвертая (пока лишь едва наметившаяся) фаза развития вычислительной техники потребует создания гибких элементов, перестраиваемых на уровне аппаратной реализации, что позволит использовать одинаковые по исходному устройству процес¬ соры в самых различных местах вычислительной схемы как специа¬ лизированные на уровне hardware. Речь идет, таким образом, об объединении в одной ЭВМ функ¬ ций, которые в настоящее время выполняются людьми — разра¬ ботчиками моделей, алгоритмов, программ, системами автомати¬ ческого проектирования, технологическими линиями производства интегральных схем и собственно работающим компьютером. Естест¬ венно, что подобная схема будет реализована на технологиях, от¬ личных от используемых в настоящее время. По нашему мнению, именно так работает мозг. При этом морфо¬ генез выполняет как раз функцию, непрерывного перевода software в hardware, которая позволяет системе, обучаясь, перестраиваться так, чтобы наиболее эффективным образом осуществлять обработку информации. Подобная система может работать во множестве ре¬ жимов, в том числе когда одна часть ее управляет построением другой, а именно так, по-видимому, и обстоит дело в процессе онтогенеза [61]. Системы с двумя и более уровнями динамики, один из которых определяет параметры и граничные условия для другого, или, что то же, системы, в которых объединено функцио¬ нирование и нх собственное строительство, математически мало исследованы. Это сдерживает изучение не только мозга, но и дру¬ гих самоорганизующихся систем, таких, как, например, экосистемы или зародыши животных, для которых подобная динамическая структура представляется типичной [78]. МОЗГ КАК ПЛАСТИЧНОЕ МНОГОПРОЦЕССОРНОЕ УСТРОЙСТВО: ПЕРСПЕКТИВЫ Мы хотели бы очертить некоторые возможные направления даль¬ нейшего исследования многопроцессорных систем, построенных из гибких элементов. Имитационные модели сенсорных образов. Те же данные, изло¬ женные выше, свидетельствуют и о том, что высшие уровни рас¬ познавания объектов и ситуаций строятся у человека не на реду¬ цирующих преобразованиях сенсорной информации и не на поиске ключевых признаков, а на активном встречном моделировании предъявленной сцены из имеющихся имитационных моделей. Именно это определяет тенденцию нашего зрительного анализатора видеть целое, в то время как ему доступна лишь часть объекта. Наглядный синтез имитационных моделей используется даже при ’’логических” рассуждениях. Например, утверждение вида ’’если А и 61
В, то С” очень часто являются плодом не формаль' мани¬ пуляций со словесными описаниями А. В и С, а результатом прямого умозрения. Как представляется наиболее вероятным, сначала из мо¬ делей ситуаций А и В синтезируется их совместная имитационная модель, а затем из анализа генерируемых ею образов на внутрен¬ нем дисплее делается вывод о справедливости утверждения С. Синтез имитационных моделей лежит, по-видимому, в основе и некоторых форм понимания. Ясно, что если система смогла построить модель некоторой ситуации из уже полученных ранее моделей и отрефлексировала, как и из чего она этот синтез выполнила, то она до какой-то степени и в каком-то смысле поняла структуру — со¬ держание ситуации. Еще раз подчеркнем,что законы, принципы и механизмы синтеза имитационных моделей в мозге еще совершенно неизвестны и являются предметом будущих исследований1. Одним из возможных подходов к этой проблеме, как пред¬ ставляется, может быть анализ нарушений синтеза образных моделей при различных патологиях мозга, а также в снах и при галлю¬ цинациях. Некоторые идеи о возможных принципах синтеза целого из частей н законах развития мысленных образов можно, по-ви¬ димому, почерпнуть из экспериментальной эмбриологии [79]. Пред¬ ставляется далеко не случайным тот факт, что многочисленные уродцы и химеры на полотнах ряда художников поразительно на¬ поминают хорошо известные специалистам по биологии развития (но не широкой публике) последствия аномалий раннего развития зародышей животных. Природа многих таких аномалий уже выяс¬ нена в экспериментальной эмбриологии [80]. О надежности систем, построенных из гибких процессоров. Чем больше элементов в системе, тем меньше, как правило, ее общая надежность. Такой тенденции в иерархически построенных много¬ процессорных системах легко противопоставить ряд мер, хорошо известных в общественных иерархиях. На верхних этажах системы специально выделяются элементы (процессоры), основной функцией которых является выявление неисправных элементов нижнего уровня, их ремонт или замена. Для этого неисправные элементы должны сами или в ответ на соответствующий запрос сигнализировать о своем состоянии центрам, ведающим выявлением и исправлением неполадок в системе. Периодические опросы периферийных процес¬ соров могут содержать и тесты, призванные обнаружить и диагно¬ стировать неисправность даже тех частей, которые сами о ней не сигнализируют. Затем в зависимости от характера поломки и возможностей си¬ стемы либо взамен неисправных в нее включаются резервные блоки, либо перераспределяется нагрузка между оставшимися в сохранности частями, либо, наконец, принимаются меры для ремонта неисправности. Последняя возможность, конечно, более доступна 'См. статью А.А. Веденова, А.А. Ежовой, JI.A. Книжникова, Е.Б.Левченко, Ю.Г. Черновой в наст. сб. 62
системам, построенным из пластичных, способных к регенерации элементов. Как представляется, подобная ремонтная служба функционирует и в нервной системе животных. Об этом говорит (да простят нас читатели за столь косвенный аргумент) относительный успех таких методов медицины, как иглоукалывание и гомеопатия. В обоих случаях основной смысл применяемых слабых воздействий на орга¬ низм — ’’обратить его внимание” и прежде всего ’’внимание” нервной системы на имеющиеся неполадки. Именно такую цель пре¬ следует раздражение контрольных точек на коже или введение микроскопических доз ядов по ’’закону подобия” их действия имею¬ щемуся недугу. ЛИТЕРАТУРА 1. Винер Н. Кибернетика. М.: Сов. радио, 1968. 326 с. 2.фон НейманДж. Теория самовоспроизводящихся автоматов. М.: Мир, 1971. 382 с. 3. Розенблатт Ф. Принципы нейродинамики. М.: Мир, 1965. 480 с. 4. Минский М., Пейперт С. Персептроны. М.: Мир, 1971. 262 с. 5. Хьюз Дж., Мичтом Жд. Структурный подход к программированию. М.: Мир, 1980. 256 с. 6. Системы параллельной обработки информации / Под ред. Д. Ивенса. М.: Мир, 1985. 414 с. 7. Хао Ван. На пути к механической математике // Кибернетический сборник. М.: Изд-во иностр. лит., 1962. N 5. С. 114—163. 8. Минский М. Фреймы для представления знаний. М.: Энергия, 1979. 151 с. 9. Шенк Р. Обработка концептуальной информации. М.: Энергия, 1980. 360 с. 10. Виноград Т. Программа, понимающая естественный язык. М.: Мир, 1976. 294 с. 11. Abelson R.P. The structure of belief systems // Computer models of thought and language / Ed. R.C. Shank, K.M. Kolbi. San Francisco: Freeman, 1973. P. 263—269. 12. Hofstadter D. Codel, Esher, Bach. N.Y.: Basic books, 1979. 777 p. 13. Сергеев B.M. Проблема понимания: некоторые мысленные эксперименты // Теория и модели знаний: Тр. по искусств, интеллекту. Тарту: Тартус. гос. ун-т, 1985. N 8. С. 133—146. (Уч. зап. Тартус. гос. уи-та; Вып. 714). 14. Hofstadter D.R., Dennet D.C. The minds. I. Fantasies and reflection on self and soul. N.Y.: Bantom books, 1982. 499 p. 15. Bobrow D. Dimensions of representation // Representation and understanding / Ed. D. Bobrow, A. Collins. N.Y.: Acad, press, 1975. P. 26—34. 16. Brodmann K. Vergleichende Lokalisationslehre der Grosshirnrinde in ihren Prin- zipen dargestellt auf Grund des Zellenbaues. Leipzig: Barth, 1909. 350 S. 17. Bolton l.S. The cortical localization of cerebral function. L.: Oliver and Boyd, 1933. 310 p. 18. Гешвинд H. Специализация человеческого мозга // Мозг / Под ред. П.В. Симонова. М.: Мир, 1984. С. 219—240. 19. Broca P. Perte de la parole etc. // Bull. Soc. anthropol. 1861. Vol. 2. P. 524—575. 20. Нурия A.P. Высшие корковые функции человека. 2-е изд. М.: Изд-во МГУ, 1969. 542 с. 21. Афазия и восстановительное обучение / Под ред. Л.С. Цветковой, Ш.М. Глоз- ман. М.: Изд-во МГУ,*1983. 216 с.' 22. Luria A.R., Hutton G.T., Hutton Т.A. Modern assessment of the basic forms of aphasia // Brain and Lang. 1977. Vol. 4. P. 823—826. 23. Бернштейн Н.А. О построении движений. М.: Медгиз, 1947. 255 с. 24. Adjuriaguerra J.de, Hecean Н. Amusia // Le cortex c£r£bral: Etude neuro- psychopathologique / Ed. J.de Ajuriaguerra, H. Нёсаеп. P., 1960. P. 214—220. 25. Мозг I Под ред. П.В. Симонова. М.: Мир, 1984. 280 с. 26. Лурия А.Р. Нейропсихология памяти. М.: Педагогика, 1974. 311 с. 63
27. Корсакова Н.К., Микадзе Ю.В. Нейропсихологические исследования памяти: итоги и перспективы \\ А.Р. Лурия и современная психология / Под ред. Е.Д. Фо¬ миной, Л.С. Цветковой, Б.В. Зейгарник. М.: Изд-во МГУ, 1982. с. 101 —110. 28. Киещенко Н.К. Нарушение памяти при локальных поражениях мозга. М.: Изд-во МГУ, 1973. 283 с. 29. Hubei D.H., Wiesel T.N. Ferrier lecture: Functional architecture of macaque monkey visial cortex // Proc. Roy. Soc. London B. 1977. Vol. 198. P. 1—59. 30. Лурия A.P. Основы нейропсихологии. М.: Изд-во МГУ, 1973. 341 с. 31. Выготский Л.С. Развитие высших психических функций. М.: 1960. 402 с. 32. Симерницкая Э.Г. Мозг человека и психические процессы в онтогенезе. М.: Изд-во МГУ, 1985. 188 с. 33. Бехтерева Н.П. Здоровый и больной мозг человека. Л.: Наука, 1980. 241 с. 34. Спрингер С., Дейч Г. Левый мозг, правый мозг. М.: Мир, 1983. 256 с. 35. Allman J.M., Kaas J.H., Miezen F.M. A representation of the visual fields in the inferior nucleus of the pulvinar in the owl monkey (Aotus trivirgatus) // Brain Res. 1972. Vol. 40, N 2. P. 291—302. 36. Hubei D.H., Wiesel T.N. Reseptive fields and functional architecture of monkey striate cortex // J. Physiol. (Gr. Brit.), 1968. Vol. 195, N 2. P. 215—244. 37. Blade Дж., Форд Д. Основы неврологии. М.: Мир, 1976. 350 с. 38. Крик Ф. Мысли о мозге // Мозг / Под ред. П. В. Симонова. М.: Мир, 1984. С. 256—275. 39. Kosslyn S.M. The medium and the message in mental imagery: A theo¬ ry // Physiol. Rev. 1981. Vol. 88, N 1. P. 15—21. 40. Величковский Б.М. Современная когнитивная психология. М.: Изд-во МГУ, 1982. 336 с. 41. Заварзин А.А. Очерки по эволюционной гистологии нервной системы. Избр. тр. Т.З. М.: Изд-во СССР, 1950. 477 с. 42. Поляков Г.И. О структурной организации коры лобной доли мозга в связи с ее функциональным значением // Лобные доли и регуляция психических процессов / Под ред. А.Р. Лурия, Е.Д. Хомской. М.: Изд-во МГУ, 1966. С. 231—248. 43.Лурия А.Р., Цветкова Л.С. Нейропсихологический анализ решения задач. М.: Просвещение, 1966. 292 с. 44. Лурия А. Р., Хомская Е.Д. Нарушение познавательных процессов при локальных поражениях мозга // Докл. Акад. пед. наук РСФСР. 1962. N 6. С. 485—489. 45. Лурия А.Р., Лебединский В.В. О нарушении логических операций при по¬ ражении лобных долей мозга // Психологические исследования. М.: Изд-во МГУ, 1968. 46. Милнер П. Физиологическая психология. М/. Мир, 1973. 648 с. 47. Тихомиров O.K. Нарушение программирования активного поиска у больных с поражением лобных долей мозга // Лобные доли и регуляция психических про¬ цессов I Под ред. А.Р. Лурия, Е.Д. Хомской. М.: Изд-во МГУ, 1966. С. 119—141. 48. Мэгун Г.В. Бодрствующий мозг: Пер. с англ. М.: Мир, 1965. 211 с. 49. Фабри К.Э. Основы зоопсихологии. М.: Изд-во МГУ, 1976. 284 с. 50. Францевич Л.И. Зрительный анализ пространства у насекомых. Киев: Наук, думка, 1980. 251 с. 51. Шаповалов А.И. Постсинаптические процессы в центральных нейронах Ц Общая физиология нервной системы. Л.: Наука, 1979. С. 347—397. 52. Дунин-Борковский В.Л. Информационные процессы в нейронных структурах. М.: Наука, 1978. 257 с. 53. Гутман А.М. Новые факты, подтверждающие N-образную нелинейность дендритов: Материалы VII Всесоюз. конф. по электрофизиологии ЦНС. Каунас: Каунас, мединститут. 1976, с. 128. 54. Leinas R., Sugimori М. Calcium conductance in Purkinje cell dendrites: Their role in development and integration // Progr. Brain Res. 1979. Vol. 51. P. 321—334. 55. Sandeman D.C., Luft S.E. The structural organization of glomerular neuropil in the crayfish // Ztschr. Zellforsch. 1973. N 537. S. 61. 56. Rail W. Theoretical significance of dendritic trees for neuronal input-output relations // Neural theory and modelling: Proc. 1962 Osai Sympos. / Ed. R.F. Reiss. Stanford (Cal.): Univ. press, 1964. P. 73—97. 57. Freeman R., Hoffer B.J., Puro D., Woodward D.J. Noradrenaline modulation 64
of the responses of the cerebellar Purkinje cell to afferent synaptic activing // Brit. J. Pharm. 1976. Vol. 57. P. 603—605. 58. Беркинблит М.Б., Чайлахян Л.М. Электрические синапсы // Общая физио¬ логия нервной системы. J1.: Наука, 1979. С. 398—448. 59. Проссер Л., Браун Ф. Сравнительная физиология животных. М.: Мир, 1967. 766 с. 60. Свидерский В.Л. Основы нейрофизиологии насекомых. Л.: Наука, 1980. 561 с. 61. Шулейкина К.В. Функциональные свойства развивающейся нервной клетки // Нейроонтогенез / Под ред. к.В. Шулейкиной, С.Н. Хаютина. М.: Наука, 1985. С. 127—198. 62. Воронин Л.Л. Анализ пластических свойств центральной нервной системы. Тбилиси: Мецниереба, 1982. 280 с. 63. Ройтбак А.И. Физиология глии // Общая физиология нервной системы. Л.: Наука, 1979. С. 607—702. 64. Загускин С.Л., Загускина Л.Д. Пространственно-временная организация мито¬ хондрий в нервной клетке в состоянии покоя и возбуждения / / Цитология. 1977. Т. 14, N 9. С. 951—958. 65. Павленко В.К. Нейроплазматический комплекс — микротрубочки, септальный ретикулум // Немышечные формы подвижности / Под ред. Г. М. Франка. Пущино: Ин-т биофизики АН СССР, 1976. С. 70—84. 66. Сотников О. С.. Костенко М.А. Механические напряжение и подвижность межклеточных контактов в культуре нервной ткани // Докл. АН СССР. 1985. Т. 281, N 3. С. 690—693. 67.Сотников О.С. Динамика структуры живого нейрона. Л.: Наука, 1985. 159 с. 68. Гладковин H.F. Развитие дендритов в норме и в условиях деафферен- тации // Нейроморфогенез / Под ред. К.В. Шулейкиной, С.М. Хаютина. М.: Наука, 1985. С. 77—121. 69. Jaffe L.F. Developmental currents, voltages and gradients // Developmental order: Its origin and regulation // Fd. S. Subtelny, P.B. Green. N.Y.: Liss, 1973. P. 183—215. 70. Borgens R.B., Rouleau M.F., Delanney L.E. A steady efflux of ionic current predicts hind Limb development in the axolotl // J. Exp. Zool. 1983. Vol. 228, N 3. P. 491—503. 71. Stern C.D. Control of morphological and physiological cell assymmetries in early chick development // J. Embryol. and Exp. Morphol. Suppl. 1984. Vol. 82. P. 162. 72. Patel N.. Poo M.-M. Orientation of the neurite growth by extracellular ele¬ ctric fields // J. Neurosci. 1982. Vol. 2. P. 483—496. 73. Hinkle L., Me Caig L.D., Robinson K.R. The direction of growth of dif¬ ferentiating neurons and myoblasts from frog embryos in on applied electric field // J. Physiol. (Gr. Brit.). 1981. Vol. 314. P. 121—135. 74. Пуанкаре А. Избранные труды: В 3 Т. Т. 3. Математическое наслед¬ ство. М.: Наука, 1974. 771 с. (Классики науки). 75. Jnaveri S., Merest D.K. Sequential alternations of neuronal architecture in nucleus magnocellularis of the developing chiken: A Golgi study // Neuroscience. 1982. Vol. 7. P. 837—853. 76. Me Culloch W.S., Pitts W. A logical calculus of the ideas immanent in nervous activity // Bull. Math. Biophys. 1943. Vol. 5, N 1. P. 115—133. 77. H. Винер. Нелинейные задачи в теории случайных процессов. М.: Изд-во иностр. лит., 1962. 159 с. 78. Thom R. Stabilite structurelle et morphogenfcse. Menlo Park (Cal.): Benjamin, 1969. 189 p. 79. Дорфман Я. Г., Сергеев В. М. Морфогенез и скрытая смысловая структура текстов // Логика рассуждений и ее моделирование / Под ред. Д.А. Поспе¬ лова. М.: Науч. совет по компл. пробл. ’’Кибернетика” АН СССР, 1983. С. 137— 147. (Вопросы кибернетики). 80. Дорфман Я.Г., Северцов А.С. Система эквифинальных путей онтогенеза и ее изменение в ходе эволюции // Эволюционные идеи в биологии / Под ред. Ю.И. Полянского. Л.: Изд-во ЛГУ, 1984. С. 71—85. (Тр. Ленингр. о-ва естествоиспытателей). 5. За к. 1668 zr
УДК 591.17:612.76:621.52 ОТ ИНВАРИАНТОВ ГЕОМЕТРИЙ К ИНВАРИАНТАМ УПРАВЛЕНИЯ В. В. Смолянинов Эрлангенская программа Ф. Клейна [1] — интерпретация геометрии как теории инвариантов — оказала и продолжает оказывать пре¬ образующее влияние на современное естествознание. С одной стороны, как это отметил еще А. Пуанкаре, сама геометрия перестала быть агрегатом теорем, она приобрела единство [2], а с другой — успехи "фи¬ зического” освоения методологии инвариантов стимулируют все более широкое ее внедрение, включая проблемы искусственного интеллекта [3] и биологической организации [4]. Несомненно, стремление к концептуально-методологической целост¬ ности — основная причина исходного и последующего расширенного использования языка инвариантов, который, как становится понят¬ ным на фоне современных системных подходов, может играть роль базового языка системной организации. Этому аспекту идеологии инвариантов и посвящена настоящая статья, содержащая четыре раздела: Что такое геометрия? Что такое хроногеометрия? Что такое локомоция? Что такое управление? Вопросительная форма заголовков разделов выбрана для подчер¬ кивания отсутствия окончательных определений даже для привычных и, казалось бы, совершенно понятных понятий. Например, в одном из вариантов ответа на первый вопрос А. Пуанкаре считает, что ’’гео¬ метрия есть некоторое условное соглашение, своего рода компро¬ мисс между нашей любовью к простоте и нашим желанием не слиш¬ ком удаляться от того, что нам сообщают наши инструменты” [2]. Ответ же Ф. Клейна, как отмечалось, можно выразить следующим образом: геометрия — это теория (геометрических) инвариантов. Не останавливаясь на других вариациях, обратим внимание на гносео¬ логическую универсальность приведенных ответов: они в равной мере применимы к различным областям нашего знания. Унифицируя ответ Пуанкаре, можно сказать, что разные области знания (геометрия, физика, биология и др.) отличаются выбором инструментов и разными формами ’’простоты”. Унифицируя же понятие инварианта, можно, следуя Клейну, отвечать подобным образом на любой аналогичный вопрос: физика — теория (физических) ин¬ вариантов, биология — теория (биологических) инвариантов и т.д. Но расширенная трактовка инвариантности позволяет и ответ Пуанка¬ ре считать модификацией ответа Клейна, так как инструменты и измерительные процедуры предопределяют собственные инварианты, а понятия простоты тоже выражаются в инвариантной форме. Какова конструктивная основа расширенной трактовки инвариан¬ тов, отличающаяся от более узкой алгебраической [5, 6]? В общем случае понятие инварианта подразумевает существование некоторого разнообразия, относительно которого и определяются свойства неизменности, т.е. инвариантности. Поэтому использова¬ 66
ние языка инвариантов предполагает изучение разнообразий свойств и состояний в разных вариантах ограничений как инвариантов. Следовательно, в системно-конструктивном контексте инварианты имеют смысл редукций избыточной изменчивости, которая, в свою очередь, обеспечивается степенями свободы системной организации. Отсюда как раз и вытекает обобщенное эвристическое значение клейновской формы ответа. Она указывает на возможность универ¬ сальной научной методологии раскрытия конструктивной семантики в разных конкретных случаях — через изучение разнообразий систем¬ ных организаций с целью выявления свобод и инвариантов. Види¬ мо, именно в этом и состоит обобщенное содержание научного поиска в разнообразиях неживой и живой природы. ЧТО ТАКОЕ ГЕОМЕТРИЯ? В геометриях общее разнообразие объектов порождается двумя процедурами: построения и преобразования. Первые служили основой древней геометрии. Здесь интересны попытки упрощения и канонизации построений на основе ограниче¬ ния выбора инструментов (линейки и циркуля), которое определило и разнообразие базовых геометрических объектов (прямые и кривые второго порядка), и критерии простоты геометрических доказательств. Аналитическая методология Р. Декарта совершила, так сказать, технологическую революцию в геометрии, и парадигма построений сменилась парадигмой вычислений — роль объектов и инструментов стали играть формулы и аналитические преобразования. Хотя понятие геометрического инварианта возникло в доанали- тическую эру, его автономизация и унификация стали возможными только при обобщенном аналитическом подходе. Таким образом, появление клейновской программы оказалось исторически законо¬ мерным. Наиболее общими конструкциями современной геометрии являются многообразия, играющие роль и объектов и носителей (пространств). Рассмотрим только узкий вопрос метризации линейных многообра¬ зий, и главным образом на примере планиметрий, являющийся как бы краеугольным в общем фундаменте геометрических представлений [5-9]. Линейные многообразия — минимальные метрические системы. Декартова процедура координатизации линейного я-мерного много¬ образия ("пространства”) R*сводится к выделению базисных одно¬ мерных многооодразий — прямых R,— {х,}, где нижний индекс — номер оси, (/= 1, ..., л), а верхний — размерность. Алгебраически связь R" с осями Rj определяется посредством операции декартового (’’прямого”) произведения R" = RiX...XRj, означающего, что произвольный точечный элемент х £ R" задается я-мерным числом (xi, ..., х„), компоненты которого называются координатами точки или компонентами соответствующего вектора 67
x=(xi, ..., xj, где штрих означает операцию транспонирования, т.е. всякий вектор — это столбец. С геометрической точки зрения оси Л'образуют пучок прямых общего положения: имеют общую точку, попарно неколлинеарны, по тройкам некомпланарны и т.д. Углы здесь не определяются, а длины определяются только вдоль направлений осей и автономно для каждого направления. Обычно используется линейная параметризация осей: общей точке присваива¬ ется нулевое значение, xi = ... =х„ = 0, на осях выделяются масштабные векторы е,, которые служат эталонами единичной длины для измере¬ ний вдоль соответствующих осей R). Хотя и существует произвол геометрического выбора, так сказать, единичных отрезков осей, но принцип межосевой автономии всегда позволяет считать их единичными и с арифметической точки зре¬ ния, т.е. представлять единичными векторами, у которых i-я ком¬ понента х,= 1, а остальные равны нулю. Тогда всякий вектор одно¬ значно определяется линейной формой x=xiei +... +х„е„ = Ех, (1) где квадратная матрица Е как строка вектор-столбцов е, является единичной: Е=(еь ..., е„) = diag (1, ..., 1). Только после того как проведена некоторая коордннатизация пространства R" посредством некоторого базиса, мы получаем воз¬ можность определить векторное пространство Х = {х} и, кроме того, абсолютизировать введенную систему отсчета, т.е? изучать свойства геометрических объектов или других систем отсчета относительно данной системы отсчета (Х-СО). Новую систему отсчета как пространство Z = {z} можно определить, выделяя в Х-СО новую совокупность базисных векторов Ь„ обра¬ зующих базисную (невырожденную) матрицу В =(bi, ..., b„), и вводя но¬ вое разложение ’’старого” вектора х посредством линейной формы x = zibi + ...+z„b„ = Bz, (2) где координатные числа z, тоже суть длины вдоль осей z,b/. Прн переходе в Z-СО формулы (1) и 2) приобретают следующий вид: z = ziei +... +z„e„ = Ez = xiai +... +x„a„ = Ax, (3) где A = B_I — обратная матрица. В описанной ’’арифметической” модели (2), (3) линейного про¬ странства единичная матрица Е всегда представляет собственный базис произвольной системы отсчета, а нееднннчная матрица В — не¬ собственный, или относительный, базис. Такое упрощение межсистем- ных отношений согласуется с концепцией Г. Вейля [5] об универ¬ сальности абстрактной коордннатнзацин, формализующей принцип относительности Лейбница: любые две системы отсчета неразличимы, если каждую рассматривать саму по себе. Итак, декартова параметризация использует минимальные метри¬ 68
ческие правила, достаточные для решения проблемы координатиза- ции пространства, а принцип автономии пространственных направ¬ лений предоставляет максимальное число свобод межкоординатных преобразований. Метрические правила — неизбежные спутники всякой координатизации. В этом смысле неметрических геометрий не сущест¬ вует. Основной пафос настоящих метрических геометрий сводится к проблеме унификации метрических правил для произвольных прост¬ ранственных направлений, и за унификацию приходиться расплачи¬ ваться несвободами координатных преобразований. Геометрию, кото¬ рая определяется на линейных многообразиях и использует макси¬ мальное число свобод линейных преобразований, можно называть декартовой для подчеркивания контруктивной схемы ее определения, но несомненно удачным для такого случая является общепринятое название ’’аффинная геометрия”. Далее, если не оговорено противное, рассматривается случай л = 2, т.е. двумерные плоские геометрии или ’’планиметрии”. Аффинная геометрия — это геометрия без инвариантов? Основная теорема аффинной планиметрии утверждает совместимость (конгруэнт¬ ность) любых троек точек, не лежащих на одной прямой (трехвер- шинников или треугольников) [10, 11]. Что это значит? Алгебраически общее аффинное преобразование а задается некото¬ рой невырожденной матрицей А и вектором а: а = {А, а} =?■ а: х — z = Ax + a, (4) а~‘={В, b}=?“ а z —• х — Bz + Ь, где матрица А=В~‘ геометрически задает центролинейное преобразо¬ вание, а вектор a = B"‘b — параллельный перенос. По признаку сохранения при композициях линейности и мультипликативно-адди¬ тивной алгебраической структуры общие аффинные преобразования образуют группу с единицей £ = {Е, о}. В двумерном варианте матрица центролинейного преобразования имеет четыре произвольных параметра, а вектор переноса — два. Поэтому общее аффинное преобразование обладает всего шестью сте¬ пенями свободы, и это — максимальное число свобод линейных преобразований плоскости. Если аффинную плоскость рассматривать как часть трехмерного пространства R3, то надлежащим выбором базиса В £. R3 можно пару двумерных преобразований (центролинейное н перенос) заменить одним трехмерным центролинейным преобразованием, следующим образом редуцируя общий трехмерный базис: Число степеней свободы такой модели аффинной планиметрии остается прежним. Кроме свобод преобразований, существуют еще свободы построения (задания) геометрических объектов. Так как множество из к независи- В =(bi, 1)2, Ьз) — ЬцЬггЬц b\\ Ь\2 Ь\ъ 0 0 1 (5) 69
I мых точек плоскости /**" = {xi, х*} fe R2 имеет 2к степеней свободы, то трехвершинник Р3 имеет шесть степеней свободы, т.е. столько же, сколько общее аффинное преобразование в R2. Сравнение числа г степеней свободы преобразований с числом q степеней свободы построений, по-видимому, естественно использовать для глобальной оценки разрешимости проблем совмещений и, сле¬ довательно, геометрической эквивалентности. С этой целью по ана¬ логии с кибернетическим законом Эшби можно выделить следующий: геометрический закон необходимого разнообразия: для разрешимости проблемы совмещения необходимо, чтобы число г степеней свободы преобразования было не меньше числа q степеней свободы построения фигуры, т.е. r^q. (6) Достаточность равенства демонстрирует аффинная совместимость трехвершинников Р3. Действительно, если/’3 определять не посредством задания вершин однородным способом />3 = {Х1, Х2, х3}, а используя неоднородное аффинное представление (4): Р3={В, Ь}, где одна из вершин хз=Ь выбирается за опорную, а две другие за¬ даются относительно опорной векторами Ь, = х,-хз, или матрицей В — (bi, Ьг), то искомая конгруэнция a: Pi3 ~Рг вычисляется как A = BiB2*, а = Ьг — bi. (7) Описанное неоднородное представление Р} позволяет обосновать следствие об аффинной эквивалентности системы отсчета: задание произвольной системы отсчета на плоскости равносильно построению базисного трехвершинника, опорная вершина которого представляет начало системы отсчета, а две другие относительно опорной — базисные векторы (в л-мерном случае справедливо аналогичное следствие для базисных симплексов). Казалось бы, логично все свойства неизменности геометрических объектов относительно общего аффинного преобразования называть инвариантными, но следует ли их называть инвариантами геометрии? Из сравнения разных типов инвариантности следует, что одни обуслов¬ ливают редукцию степеней свободы общего аффинного преобразо¬ вания, а другие нет. Так, если из требования инвариантности прямой L: х{\) = 1Ьг + (1 —A.)b, = Bz, (8) где z = (l—X, X)', т.е. из требования сохранения линейности этой параметрической формы представления прямой следует необходимость н достаточность линейности преобразования а:Z-i -'Ьг, но вместе с тем прямая инвариантна в этом смысле относительно линейного преобразования произвольной размерности. В рамках же линейной геометрии такую инвариантность можно считать следствием 70
применения линейного преобразования (5) или (7) к линейному объекту и называть это свойством коинвариантности. Напротив, из требования инвариантности квадратичной формы где М — некоторая симметричная матрица, вытекают определенные огра¬ ничения на структуру общего аффинного преобразования, которые редуцируют степени свободы преобразования и имеют смысл инвариан¬ тов соответствующих метрических геометрий. С целью разобщения разных типов инвариантности примем: определение 1: инвариантом геометрии называется условие, редуцирующее одну степень свободы координатных преобразований; определение!: инвариантом геометрического объекта называется условие, редуцирующее одну степень свободы его построения (за¬ дания). К инвариантам построения в широком смысле следует относить условия выделения подмногообразий из многообразий. Например, общее построение прямой (8) содержит четыре степени свободы задания опорных точек bi и Ьг, но введением соответствующих от¬ резков di и <Ь, отсекаемых на осях Х-СО (рис. 1, а), можно редуцировать избыточность до двух степеней свободы построения, тогда К инвариантам геометрий (тоже в широком смысле) можно от¬ носить условия выделения подгрупп из групп базисных преобразо¬ ваний. В аффинной геометрии используются линейные преобразования без каких-либо дополнительных ограничений, т.е. линейная группа с максимальным числом параметрических степеней свободы. Поэтому согласно определению 1, получается, что на разнообразии линейных геометрий аффинная геометрия не содержит собственных (’’внутрен¬ них”) инвариантов. Здесь свойство постоянства простого отношения длин отрезков на прямой [10, И] тоже следует называть коинваринтным, так как оно является следствием ковариантного изменения линейной параметризации прямой (8), сохраняющего линейность параметриза¬ ции. Например, частный случай постоянства простого отношения — преобразование середины отрезка хг—xi в середину отрезка гг—г\ — эквивалентен линейному изоморфизму a: X2±xi -*Z2±zi. (11) Отсюда же следует аффинная коинваринтность параллельности пря¬ мых. Простое отношение является аффинным инвариантом тогда, когда оно действительно редуцирует некоторое разнообразие. Например, разнообразие А плоских четырехвершинников РА является вообще говоря восьмимерным (A=AS), но, фиксируя одну из таких фигур, в частности фиксацией четвертой точки в задании: Р* — {о, ei, ег, х4}, К: х'Мх + 2ш'х + т = 0, (9) L: Xi/di + хг /Аг = 1. (10) на множестве общего аффинного преобразования получаем шести- 71
Рис. 1. К определению систем отсчета а — координатное и параметрическое описание прямой L; б — обобщенные эталоны длины и угловые параметризации мерное разнообразие А6 аффинно эквивалентных фигур а: {о, ei, е2, х4}-»-{а, аь а2, z4}. В таком случае два инварианта /,, /2, осуществляющих редукцию Л*-*Л6, можно выразить в виде двух простых отношений, характеризующих положение точки пересечения диагоналей (И) относительно пар проти¬ воположных вершин. Эти инварианты и будут представлять устойчивые признаки аффинной эквивалентности. Новые линейные геометрии, содержащие собственные инварианты, естественно строить на базе аффинной геометрии, редуцируя степени свободы общего аффинного преобразования. Именно на такой основе, которую можно назвать конструктивной, целесообразна классифика¬ ция геометрий в духе программы Клейна — по числу и типу несвобод преобразований, которые приобретают смысл внутренних инвариантов общей аффинной группы. Проективный инвариант как условие соответствия осей. Понятие инварианта, видимо, впервые возникло в синтетической (доанали- тической) проективной геометрии, которую первыми придумали худож¬ ники: изобразительные задачи поставили вопрос о неизменных свойст¬ вах объектов прн разных проективных ракурсах. Проективный ин¬ вариант принято называть двойным ("сложным”) отношением, харак¬ теризующим распределение четырех точек на прямой [10—12]. Обратим внимание на следующее интересное обстоятельство: за¬ дание четырех коллинеарных точек имеет шесть степеней свободы (две — для прямой и четыре — для точек), т.е. столько же, сколько аффинное преобразование плоскости, но общее аффинное преобразо¬ вание не решает задачи совмещения таких точек. Это — пример не¬ достаточности равенства свобод в законе (6). С аналитической точки зрения главное отличне проективной гео¬ метрии от аффинной состоит в нзмененнн способа параметризации прямых и линейных многообразий большей размерности. Вместо ли¬ нейной параметризации по величине X в условии (8) используется нелинейная (дробно-линейная) параметризация по величине и= х2/X] ={d2/dx)/{X'x— 1), (12) 72
равной отношению координат точки, принадлежащей прямой/, (рис. 1, а), которая согласно условию (10) определяется относительно некоторой плоской Х-СО. При этом параметр и называется неоднородной коор¬ динатой точки на прямой L, а аффинные координаты х\, х2 в выраже¬ нии (12) — однородными. Какие же новые возможности предоставляет параметризация (12) для построения преобразования 7t:{xi,X2,x3}-*{bi,b2,b3} (13) в случае коллинеарных троек точек? Для краткости ограничимся ситуацией, когда прямые, несущие тройки точек в преобразовании (13), совпадают. Пусть точки xi и \г находятся на осях Х-СО, x,=diet, x2 = d2e2, а х3 =(xi + хг)/2, т.е. третья точка находится на диагонали базиса x=(xiX2). По аффинной параметризации этим точкам отвечают значения Х = 0,1, 1/2, а по проективной и = 0, 00 di/d\. Легко сделать точки bi и Ьг образами базис¬ ных xi и хг — достаточно ввести базис B = (bi, Ьг) новой Z-CO: x = Bz. Но из произвольности Ь3 следует, что эта точка, вообще говоря, не ле¬ жит на диагонали нового базиса. Казалось бы, использование В-базиса бесполезно. Как раз в этом месте и оказывается существенным проективный способ параметризации (12), из которого следует, что при проек¬ тивном соответствии (13) совмещаются не сами точки, а только пря¬ мые, проходящие через эти точки и начало системы отсчета. А это обстоятельство позволяет считать параметры длины векторов bi и Ьг произвольными и выбирать так, чтобы удовлетворялось условие 2b3=b2+bi, (14) т.е. чтобы третья точка все же оказалась на диагонали эталонного пара¬ ллелограмма Z-CO. Теперь общее проективное преобразование можно представить дробно-линейной формулой: v = {bi\+bnu)/(bl\-\-b\2u), (15) в которой u — zi/z\ — новая проективная параметризация прямой L относительно Z-CO. Далее, используя условие (14), можно выраже¬ ние (15) преобразовать к традиционной форме двойного отношения: U = ((V 2 V})/(V) Cl))((u Vt)/(V2 U)). (16) Из определения (12) видно, что величина и остается неизменной на одномерном семействе прямых, параллельных L, поскольку в правой части стоит отношение d2/d\. Но отношение проективных параметров v2/v 1 вообще не зависит от параметров прямой L, и поэтому неиз¬ менно на всем двумерном разнообразии прямых плоскости. В такой инвариантности и состоит геометрический смысл проективной эк¬ вивалентности при проективных преобразованиях. Аналогичной инвариантностью обладает двойное отношение (16). Поэтому если обозначить правую часть формулы (16) функцией n(i>i, и2, с3, о) и зафиксировать четвертую точку условием k(di, и2, i>3, с4) = const = g, (17) то свойство постоянства двойного отношения сохраняется при всех 73
проективных преобразованиях, другими словами: условие (17) пред¬ ставляет собой проективный инвариант. Традиционное использование двойного отношения скрывает одну важную его особенность как условия соответствия координатных осей при построениях проективных преобразований. Чтобы наглядно продемонстрировать это свойство, положим в условии (17) проектив¬ ные параметры третьей н четвертой точек равными соответственно 0 и этого можно достичь подходящим выбором новой Х-СО, связан¬ ной со старой системой X преобразованием С. Обозначим такие новые значения новых параметров для первых двух точек через m и №. Тогда проективный инвариант приобретает простейший вид: л(№, №, 0, °°)g =g=?U'2/vi =g. (18) Используя далее запись отношения проективных параметров через однородные координаты, приходим к необходимому представлению проективного инварианта в виде билинейной формы: (Ъгг/Ь 12)/(Ъг^/Ъх 1) = <7 ^B'iGB2 = 0, (19) где матрица G=(-ge2, ei). Общий случай отличается от рассмотренного, конечно, только струк¬ турой матрицы билинейной формы: в = св = ь;сь2=о, (20) гще G=(C"‘)'G(C '); С — матрица координатного преобразования Х-*Х. Такое представление проективного инварианта как некоторого усло¬ вия ’’ортогональности” осей ведет к новому пониманию организа¬ ции н метрических геометрий. Метрические сущности — эталоны и параметризации. Прежде чем классифицировать метрические геометрии полезно рассмотреть обоб¬ щенную модель таких геометрий. Общее определение параметризованного семейства преобразований систем отсчета X-»Z можно осуществить заданием параметрически упорядоченных множеств базисных векторов, или базисных матриц: B = B(01, 02) = (bi(0i), ь2(02)), (21) где 0, — некоторые параметры независимых эталонных семейств; Ь,(0,) — векторно-параметрические функции соответствующих эталонов длины: прн независимых изменениях параметров 0, каждый базисный вектор новой системы отсчета ’’рисует” в старой Х-СО эталонные линии В,, проходящие, например, при значениях 0, = 0 через концы единичных масштабных векторов е, осей Х-СО. Смысл эталонности линий ^ заклю¬ чается в следующем мероопределении длины. Предположим, что эталоны Я, исходно нарисованы (рис. 1,6). Нарисуем также в Х-СО произвольные прямые, проходящие через ее начало и пересекающие эталоны В, в некоторых точках Ь,-. Тогда векторы Ь, назовем базисными соответствующей новой Z-СО, считая их единичными масштабами для длин, измеряемых вдоль построен¬ ных осей. Именно в таком смысле аффинной параметризации прямых линии В, представляют собой границы ’’эталонов единичной длины” для всех возможных направлений новых осей. Непараметрическое описание эталонов возможно в тех случаях, 74
когда для каждого эталона осуществима процедура исключения па¬ раметра. Тогда эталоны удается описывать явными или неявными функциями от координат базисных векторов: Я/.-ДЬ,) = const. (22) Вообще говоря, непараметрическое представление (22) не всегда возможно (простейший пример — геометрия Галилея). В этом смысле параметрическое представление (21) является универсальным, но воз¬ можность непараметрического представления (22) не элиминирует необходимость параметризации эталонов длины: параметризация эта¬ лона длины служит мерой поворота оси, определяет угловую метриза¬ цию пространства. Следует подчеркнуть, во-первых, двойственный смысл параметри¬ зации эталона длины — угла для поперечных направлений (осей) и длины для продольных направлений (вдоль линии эталона), во-вто¬ рых, множественность возможных реализаций параметризаций — когда эталоны задаются ’’голыми” или неразмеченными, как в при¬ мере с графическим заданием, тогда проблему их параметризации в принципе можно решать многими различными способами, разно¬ образие которых несчетно. Задание эталонов длины редуцирует две степени свободы опре¬ деления нового базиса. Но знание эталонов и даже их параметри¬ заций не определяет базис полностью: выбирая одну ось указанием значения 01, мы должны иметь некоторое правило выбора № величи¬ ны 02 или правило ставить в соответствие одному базисному вектору — другой. Такое правило можно формулировать разными способами: (p:bi — Ьг или ф(01, 02) = const. (23) Кроме того, что более существенно, для заданных эталонов и их параметризаций можно априорно формулировать разные правила соответствия осей. Это обстоятельство открывает новый аспект определения метрических и неметрических геометрий. Итак, полное (замкнутое) определение метрической планиметрии требует задания двух метрических инвариантов (эталонов длины) и одного неметрического инварианта (правила соответствия осей), совместно образующих систему базисных инвариантов, которая ре¬ дуцирует три степени свободы задания нового плоского базнса. Оста¬ ется одна степень свободы на поворотные ’’дела”. При размерности л^2 число метрических инвариантов т=п, число р инвариантов соот¬ ветствия и число г степеней свободы поворотных преобразований — одинаковы: р = г = п(п—1)/2 при общем числе степеней свободы линейного преобразования п2 — т+р + г. Матричный аккумулятор элементарных геометрий. Выше отмечалась возможность определения метрических геометрий на основе тре¬ бования инвариантности квадратичной формы (9) с метрической (симметричной) матрицей М. Это требование в простейшем случае 75
порождает следующее матричное уравнение для базисной матрицы: В'МВ = М. (24) С алгебраической точки зрения это уравнение эквивалентно системе из п(п +1)/2 скалярных уравнений, которые и задают систему базисных инвариантов. При л = 2 имеем из уравнения (24) следующую систему базисных инвариантов: b'iMbi=wjn, Ь'гМЬг = Шгг, b'iMb2 = »ii2, где первые две квадратичные формы представляют метрические инварианты, а последняя билинейная — инвариант соответствия осей. Любопытно, что матричное уравнение (24) потенциально аккумули¬ рует в себе все известные элементарные геометрии, причем и такие, которые явно не задаются квадратичными формами, как, например, геометрия Галилея. Чтобы показать это удивительное свойство производящего уравнения (24), удобно воспользоваться специальной формой канонического представления матрицы второго порядка: B = fciE+fc2F + M+M, (25) где E=(ei, е2); F = (-e,, е2); I=(e2, ei); J=(e2, -ei). Обычно используется следующая форма покомпонентного представ¬ ления: . (Ъ1—Ьг Ьг—Ьа \ - 1, (26) Ь} + Ьа bi+Ьг J где структура матриц Е,у очевидна: (/, J) — элемент единичный, осталь¬ ные — нулевые; правая часть равенств (26) указывает связь с разло¬ жением (25). Основной недостаток разложения по компонентам Е,у за¬ ключается в том, что эти матрицы вырожденные и не образуют груп¬ пу, а вариант (25) лишен такого недостатка. Групповые свойства компонент (25) иллюстрирует рис. 2, а. Детерминант матрицы в записях (25) и (26) представляется сле¬ дующим образом: | В| —Ь\\Ьгг—b\ibi\=b\—Ьг—bl + bl. (27) Операция транспонирования в записи (25) выражается изменением знака элемента Ьг, поэтому у симметричной матрицы М компонен¬ ты J нет: M = miE+miF +/я21. (28) Если же в каноническом разложении типа (25) некоторой мат¬ рицы N отсутствует первое слагаемое («1 =0), то она квазиннволютивна: N2=HN|E. (29) Используя разложения (25) и (28) и подставляя их в матричное уравнение (24), можно попытаться решить матричное уравнение ал¬ гебраическими средствами, но более короткий и изящный путь — дифференциальный. 76
E F I J Г E J I 1 -3 E -F J -I F -E Рис. 2. Группа канонических матриц Q _ полное множество преобразований (слева) и фрагмент таблицы умножения (справа); б — эта¬ лоны длины геометрии Лобачевского, определяемой внутри единичного круга, когда мерой длины служит двойное отношение, для центральной точки эталоны представляются концентрическими ок¬ ружностями, для нецентральных точек — неконцентрическими эллипсами Поскольку выписанная выше система базисных инвариантов урав¬ нения (24) редуцирует три степени свободы общего определения базиса В, эта матрица имеет один свободный параметр, т.е. опре¬ деляет однопараметрическое представление В = В(0) линейной группы. Продифференцируем уравнение (24) по этому параметру. Тогда согласно 77
обычному правилу дифференцирования произведения б'МВ = -В'Мб, где кружок над матрицей — символ производной по параметру 0. Пусть N = 6b\ (30) предыдущее равенство переписывается в виде N'M = -MN, а отсюда с учетом симметричности матрицы (28) следует представ¬ ление N=1VT'J, которое справедливо с точностью до произвольного ненулевого ска¬ лярного множителя (последующие нормировки позволяют сразу считать этот множитель единичным). Выполнив необходимые вычисления, получаем v, = oi,/|M| =>N = V3F — V2I+V1J. Наконец, учитывая соотношение (30), находим окончательное решение: В(0) = e(6~e")N. (31) Хотя экспоненциальная запись предельно лаконична, она скорее символична, чем практична. Для вычислительных целей приходится разлагать матричную экспоненту в матричный степенной ряд. Квази- инволютивное свойство (29) матрицы N позволяет свернуть такой беско¬ нечный ряд в две основные формулы, определяемые знаком детер¬ минанта метрической матрицы: I М| >0 ^B^cosaE + sinaL, 1321 |М| <0 =^B = ch aE+sh aL, где косинус- синус-функции переменного параметра а являются скаляр¬ ными множителями постоянных матриц Е и L; кроме того, для компакт¬ ности здесь положено: 0о = О; a = Q/m; L = mN; т = abs | М|. Исполь¬ зованная нормировка N-»L обеспечивает унимодулярность матри¬ цы L, т.е. | oiN| =| L| = 1. Частные варианты решений (31), (32) как примеры классических элементарных геометрий представлены в таблице, в которую не вклю¬ чен вариант решения уравнения (24) для случая M = J, так как косо¬ симметрическая матрица J не является в обычном смысле метрической. Однако формальное решение уравнения B'JB=J имеет вид B = chaE+shaN, где N =mF + лз! + яД, | В| = 1. Здесь матрица N содержит дополнитель¬ ные свободные параметры {щ, «з. щ}, частные варианты выбора которых {1, 0, 0}, (0, 1, 0}, {0, 0, 1} соответствуют геометриям M=I, F, Е. Целостные свойства кругового, гиперболического и линейных поворотов базисов в соответствующих геометриях иллюстрирует рис. 3. 78
Матричные представления планиметрий № М М~’ N N2 в *(<*«. a:) tfou V2) 1 Е 2 F 3 I 4 — 5 — Е F I (E + F)/2 E + I J I F (I+J)/2 -F-f-J j2 = -e i2 = e f2 = e n2 = o n2=o cosaE + sinaJ = eaJ chaE + shal = ea* chaE + shaF = eaF E + vN = euN E + aN=eQN a2—ai =я/2 a*—ai =0 az—ai =0 az—a( =0 0|U2 — “I 01, 02= 1 02 + 02 = 0 01V2 — 2oi Примечание. № 1 — геометрия Евклида (см. рис. 3, а); №2 — геометрия Минковского или каноническая гиперболическая геометрия (см. рис. 3, б); № 3 — особая гиперболическая геометрия (оси совпадают с асимптотами), особые свойства которой проявляются в том, что угол а отсчитывается от биссектрис квадрантов, а базисные векторы не поворачиваются, а только изменяют свою декартову длину, тогда как их длина в собственной метрике всегда равна нулю; № 4 — геометрия Галилея (см. рис. 3, в), для кото¬ рой существует обратная метрическая матрица, но она является вырожденной, поэтому прямая мет¬ рическая матрица отсутствует; N“5 — общая геометрия лилейного поворота (см. рис. 3, г), для которой так же, как и для гиперболических, инвариант соответствия осей является проективным инвариантом; М, N, В — метрическая матрица, матрица степени экспоненты и базисная матрица соответственно; #(ai, aj), g(vi, 02) — выражения инварианта соответствия осей через угловые и проективные параметры соответственно. Проблема инвариантных направлений. В заключение кратко остано¬ вимся на геометрической интерпретации ключевой проблемы хроно¬ геометрии. Геометрию Галилея можно исходно определять как унимодулярную с одним инвариантным направлением, а геометрию Минковского — как унимодулярную с двумя инвариантными направлениями. Такой подход описан в учебнике М.М. Постникова [10]. Ниже излагается обобщенная версия проблемы двух инвариантных направлений, описан¬ ная ранее в публикации [13]. Задача. Пусть некоторые фиксированные направления в Х-СО оп¬ ределяются матрицей C=(ci, с2). Требуется построить семейство базисов B=(bi, Ьг) для Z-CO исходя из условия инвариантности выде¬ ленных направлений относительно искомого семейства, при этом характеристики инвариантных направлений относительно Z-CО зада¬ ются постоянной матрицей S =(si, S2), которая в общем случае не со¬ впадает с матрицей С, определяемой относительно Х-СО. В анализе этой задачи используются четыре разные системы отсчета, связи между которыми показаны на следующей диаграмме: х * х ■■ Bz Сх = Sz х = Dz В = cds- ОЗ) Поскольку оси X и Z систем отсчета принадлежат одним и тем же прямым, постоянные наклоны которых оцениваются по разному в X- и Z-CO (ci и сг относительно Х-СО, 5i и относительно Z-CO), мат¬ рица D в диаграмме (33) является диагональной. Поэтому матрица В = CDS'1 может быть не более как двупараметрической. Основной результат такого анализа — условие инвариантности двух направлений — обусловливает инвариант соответствия осей Z-CO 79
! а — круговая геометрия Евклида; б — гиперболическая геометрия Минковского; в — линейная геометрия Галилея; г — общая геометрия линейного поворота проективного типа. Используя принятые в формулах (16)—(20) обозна¬ чения, этот инвариант можно представить либо в виде двойного отношения: я(иь 02, ci, c2) = s,/s2, (34) либо в виде билинейной формы (20). Условие инвариантности направлений является неметрическим усло¬ вием, поэтому естественно, что оно в первую очередь предопреде¬ ляет неметрический инвариант геометрии. То, что этот инвариант оказывается проективным, чрезвычайно интересно с конструктивной точки зрения, и инструментальные аспекты обеспечения такой инва¬ риантности будут обсуждаться ниже. Но не менее интересен и обрат¬ ный аспект: выше отмечалось, что задание метрических инвариантов как эталонов длины, вообще говоря, не предопределяет неметрический инвариант, и наоборот. Поэтому существует проблема совместимости проективной инвариантности с разными метриками. 80
ЧТО ТАКОЕ ХРОНОГЕОМЕТРИЯ? Глубокая нетривиальность метрической проблемы единого эталона для всех направлений особенно явно проявляется в хроногеометрии — геометрии пространства—времени. Если в чисто пространственных задачах мы можем ориентироваться на метод ’’прикладывания ли¬ нейки” и от опыта идущее виденье пространственной перспективы, то в пространственно-временных ракурсах мы в этом отношении ’’слепы”, а экспериментальное тестирование разных направлений ”про- странственно-временнбго континиума” можем проводить только по¬ средством распространяющихся процессов, выполняющих комплекс¬ ную функцию ’’линеек и часов”. По разным историческим и практическим причинам абсолютный приоритет в выборе тестовых сигналов отдается электромагнитным волнам или свету. В силу этого проблематику физического реля¬ тивизма принято связывать с постулатом постоянства скорости света [14—16]. Но является ли такое сужение тестовых операций обя¬ зательным и единственно возможным?. Разве, например, специальная теория относительности предска¬ зывает абсолютную величину необходимой скорости сигнала? Нет! Сле¬ довательно, принципиальная возможность сверхсветового и досвето- вого релятивизма существует. На кинематическом этапе полезно отвлечься от физических аспек¬ тов распространения волн и анализировать необходимые и достаточ¬ ные условия существования релятивизма с чисто геометрических позиций — как проблему инвариантных направлений. Этот путь позволяет выявить проективную сущность постулата постоянства ско¬ рости света, понять инструментальную природу проективной инва¬ риантности и построить модель мира, удовлетворяющую постулату постоянства скорости сигнала, но без эффектов сокращения длины и замедления времени. Постулат постоянства скорости и геометрия Минковского. В своих недавних лекциях А.А. Логунов критикует ограниченный подход к ре¬ лятивистским проблемам "от постулата” и предлагает опираться на представления ’’единого пространства—времени”, которые ’’являются более общими и фундаментальными” [17]. Попробуем проанали¬ зировать разобщаемость таких подходов. Представления специальной теории относительности сформирова¬ лись, как известно, в связи с анализом свойств инвариантности урав¬ нений распространения электромагнитных волн — уравнений Максвел¬ ла—Лоренца [15, 16]. Для хроногеометрических рассмотрений сущест¬ венны главным образом кинематические свойства света, которые кратко выражаются постулатом постоянства его скорости. Разобщая основные ингредиенты этого постулата, имеем: П1) скорость света не зависит от скорости источника; П2) скорость света не зависит от скорости приемника. Собственно, именно положение П1 составляло кредо концепции эфира, или светоносной среды, которая отражала, так сказать, ма¬ териалистические устремления классической (в смысле нереляти¬ вистской) научной методологии физиков, пытавшихся безуспешно 6. Зак. 1668 81
устранить метафизическую обособленность электромагнитных яв¬ лений — ведь многие другие процессы, быть может, кроме еще гра¬ витации, обладают материальными носителями (звук, нервный импульс и др.). Вообще говоря, гипотеза эфира вполне естественна для фи¬ зического мировоззрения, другое дело, как к ней относиться: нужно ли отказываться от того, от чего можно не отказываться, или лучше отказаться от того, что не удается выявить явно? Суть специальной теории относительности не состоит в необ¬ ходимости отказа от гипотезы эфира. Для понимания содержания по¬ ложения П2 как раз полезно сначала исходить из этой гипотезы, а уже потом решать: позволяют ли кинематические средства ’’при¬ вязаться” к системе отсчета эфира? Поэтому к предыдущим посту¬ латам добавим следующий: ПЗ) светоносная среда (однородная, изотропная) существует. Тогда положение П1 можно интерпретировать как следствие по¬ стулата ПЗ, среду же при этом можно связать с ’’абсолютной” системой отсчета X = {xi, х2}. Часто используемое четырехмерное описание пространства—времени не является необходимым, если мы ограничиваемся проблемами ста¬ ционарных прямолинейных движений. Поэтому ниже используется та же геометрическая символика, которая введена выше. Только абсциссы Х-СО и Z-CO теперь считаются ’’времениподобными”, а ординаты — ’’пространственноподобными”. Следовательно, теперь семейство Z-CO, задаваемое базисом В(и) относительно ’’абсолютной” на Х-СО, эквивалентно семейству инерциаль- ных систем отсчета. В такой координатной конкретизации содержание положения П2 выражает принцип инвариантности: траектории света суть инва¬ риантные направления семейства инерциалъных систем отсчета. Эта формулировка постулата П2 уже соответствует рассмот¬ ренной выше проблеме инвариантных направлений или в данном слу¬ чае траекторий. Пользуясь физической терминологией, можно ска¬ зать, что описанное общее решение этой проблемы соответствует анизотропной среде, а также общей ангармоничной форме проек¬ тивного инварианта, когда, вообще говоря, Ji/s2#-l. Применительно к обычной нормированной физической модели Ci=5l=c=l, о =J2 =-с = -1, (35) т.е. в случае, когда скорость света с= 1, получаем изотропную среду и, так сказать, гармоничную (si/.s2 =-1). Проективный инвариант (34) приобретает здесь крайне простую форму: l>ll>2=l =$’Vi=V, V2—1/V, (36) которая как условие соответствия осей инерциальных систем отсчета, конечно, известна в специальной теории относительности. Однако ранее не обращалось внимание на то, что за этой простотой скрывается свойство проективной инвариантности. Во-первых, это относится к ранним работам, в связи с которыми 82
В. Паули [18] в своем обширном обзоре релятивистских проблем отметил, что проективная группа дробнолинейных преобразований играла большую роль в ранних исследованиях математиков по неевкли¬ довой геометрии, но для физиков эта группа не так важна. Во-вторых, в современных версиях специальной теории относи¬ тельности проективные представления используются более явным обра¬ зом (наиболее полно эту линию излагает Д.Э. Либшер [19], но они имеют смысл развития идеи Ф. Клейна [20], предложившего исполь¬ зовать двойное отношение в качестве меры длины в геометрии Ло¬ бачевского или меры угла в геометрии Минковского). Метрическое использование двойного отношения представляет самостоятельный интерес (см. рис. 2, б) — этот же аспект отражает схема девяти гео¬ метрий Кели—Клейна [12]. В моей же трактовке геометрий двойное отношение выступает как неметрический проективный инвариант в составе системы базисных инвариантов метрических геометрий, в частности в геометрии Минковского. Конструктивное определение геометрйй посредством задания эта¬ лонов и параметризаций позволяет разными и многими, а не только девятью, как в схеме Кели—Клейна, способами совмещать метрические правила друг с другом и с неметрическими (23). Особый интерес приобретают естественные формы ’’симбиоза” инвариантов. Один из таких примеров естественного совмещения инвариантов в систему дает проблема инвариантных направлений. Редуцируя общее описание (33) к случаю (35), приходим к почти однозначному представлению базиса инерциальных систем отсчета: В(о)=2>(Е+ (Л)л/1-(^ B(o)=2>(ch0E+sh0I). (37) Первая формула отражает скоростную (проективную) параметриза¬ цию (12), а вторая — натуральную, где 0 — длина дуги гипер¬ болы в гиперболической метрике [13]. Неоднозначность форм задания базисов (37) обусловлена только одной степенью свободы доопределения множителя Ъ. Как увидим ниже, этот аспект существенен для конструк¬ тивной версии специальной теории относительности. Традиционный метод доопределения базиса (37) — требование унимодулярности: | В| = 1 =^Ь = 1. Именно в этом случае и приходим к геометрии Минковского, которую обобщенно, согласно формуле (24) и таблице, можно определить посредством матричного уравнения B'FB = F. (38) Итак, при дополнительном требовании унимодулярности, которое следует считать естественным, так как оно обеспечивает групповые свойства межкоординатных преобразований, что отмечал еще А. Пуанка¬ ре [2], постулат постоянства скорости света однозначно предопре¬ деляет геометрию Минковского, и наоборот. Однако такое заключение об однозначности, создающее впечатление о неизбежности ’’этого странного мира” Минковского, является следствием фундаменталь¬ ного построения специальной теории относительности, когда постоянст¬ во скорости света постулируется исходно, т.е. задается как свойство пространства—времени. 83
Перейдем далее к конструктивной версии специальной теории относительности. Инструментальное определение одновременности. Проективный инвариант в качестве условия соответствия осей инерциальных сис¬ тем отсчета, очевидно, непосредственно связан с понятием одно¬ временности. Экспериментальное определение одновременности можно получить, используя эффект отражения световой вспышки от экранов, равно¬ удаленных от источника. Подобной экспериментальной моделью часто пользовался А. Эйнштейн для объяснения физического смысла отно¬ сительности одновременности [5, 16]. Инструментальный вариант эксперимента представляют ’’часы Ланжевена”. Это стержень длиной 21, на концах которого установлена пара зеркал, а в середине — им¬ пульсный источник света. Логика использования этого ’’прибора одно¬ временности” проста: так как в Х-СО сигналы от вспышки дости¬ гают зеркал одновременно, будем считать эту пару событий достиже¬ ния одновременными и во всех инерциальных системах отсчета. Если принимается гипотеза ПЗ о существовании однородной изотропной среды, то время достижения сигналом зеркала можно определять как Т, тогда 2Т — полное время (период) распространения сигнала от источника и обратно (рис. 4, а). Назовем кратко описанный экспериментальный метод определения одновременности процедурой Эйнштейна. Поступим теперь следующим радикальным образом: не вводя ника¬ ких фундаментальных постулатов, будем определять все инерциаль- ные системы отсчета только посредством процедуры Эйнштейна. Конструктивно такое нововведение означает следующее построение. Если прибор находится в базисе инерциальной системы отсчета B(v) (см. рис. 4, а), то ось zt задается мировой траекторией его середины, а ось одновременности гг строится по событиям достижения сигналов зеркал. При этом траектории световых сигналов образуют паралле¬ лограмм {р, г, bi, Ьг). Оси базиса B(v) представляют собой диагонали параллелограмма прямых и обратных (отраженных) световых сигналов. Но с проективной точки зрения диагонали параллелограмма находятся в гармоническом отношении со сторонами[11]. Следовательно, условие соответствия осей базиса B(v) есть проективный (гармонический) инвариант, который согласно предыдущему имеет вид (36). Вполне понятно, что и в случае анизотропного варианта, когда скорости сигналов в разных направлениях неодинаковы по абсолют¬ ной величине, мы придем к аналогичному заключению о проектив¬ ной инвариантности осей инерциальных систем отсчета, так как и тогда оси являются диагоналями параллелограмма прямых и отражен¬ ных сигналов. С конструктивно-инструментальной точки зрения получается, что фундаментальная версия специальной теории относительности — это перестановка местами причины и следствия. Такое обстоятельство само по себе не исключает необходимости фундаментальных под¬ ходов, просто всегда следует учитывать их априорно конвенцио¬ нальный характер. 84
Рис. 4. Пространственно-временнйе диаграммы метрических эталонов а — процедура Эйнштейна для ииерциальиых систем отсчета: б — нзоритмометрнческая модель (метрические эталоны представлены толстыми гиперболическими ветвями на фоне точечных эталонов геометрии Минковского); р — инициирующее событие; г, Ь; — события отражения; bt — событие встречи сигналов Возможен ли акустический релятивизм? Сначала обратим внимание на простую аналогию: процедура Эйнштейна является малой моделью радиолокационного метода ’’измерения длин посредством времени”, отправляясь от которого можно существенно упростить изложение специальной теории относительности. Однако Г. Бонди не довел эту оригинальную идею до конструктивного завершения, ограничившись описанием преимуществ ”Аг-метода” [21]. 85
Заметим, что в процедуре Эйнштейна совершенно безразлично, какой источник сигналов используется — световой, звуковой и др. Здесь только существенно, что, выбирая тип волны в качестве эта¬ лона определения одновременности, следует каждый вариант эталон¬ ный волны определять независимо от других и полагать для прос¬ тоты среду—носитель эталонной волны бесконечно протяженной. Такая автономизация важна по меньшей мере для понимания необходимости замкнутого определения хроногеометрии. Потому что, как нетрудно видеть, обычные противопоставления звуковых и световых волн [21] существенно опираются на зрительную информацию. Практически, и это естественно, мы исследуем акустические явления посредством световых волн (т.е. посредством эталонной волны), имеющих значитель¬ но ббльшую скорость распространения, чем звук. Однако если отказаться сознательно от визуальных критериев одновременности и изучать прост¬ ранственно-временною геометрию посредством акустического варианта процедуры Эйнштейна, то, оставаясь в однородной воздушной или вод¬ ной среде, мы придем к выводу о постоянстве скорости звука во всех инерциальных системах отсчета. Учитывая этот аспект, можно высказать гипотезу, что для эхо¬ локации некоторых животных (например, летучих мышей, дельфинов), по-видимому, должен существовать соответствующий акустический ре¬ лятивизм, возможность которого становится просто очевидной с по¬ зиций конструктивного подхода. Тогда как в рамках фундаменталь¬ ного подхода такая идея выглядела ’’достойной лишь цирковых ко¬ миков” (см. [22], с. 485). Конечно, используя опыт визуальных исследований, нетрудно при¬ думать эксперимент по выявлению ’’эффекта увлечения воздушной среды”, например помещая пару акустических часов Ланжевена сразу на внутренней и внешней стороне движущегося ’’вагона”. В данном случае мы исходно знаем, где и как увлекается среда. Однако осу¬ ществленные порознь такие эксперименты не выявят эффекта увлечения. Необходимо понять, что феномены увлечения не существенны для внутренней геометрии релятивизма, связанного с определенным ти¬ пом эталонной волны, и поэтому неважно, в какой именно инерциаль- ной системе отсчета покоится среда: если в двух разных инерциальных системах отсчета мы тестируем посредством процедуры Эйнштейна одну и ту же скорость эталонной волны, то не имеет значения, су¬ ществуют ли дополнительные движения относительно среды. Поэтому в тех случаях, когда невозможно создать границу раз¬ дела увлекаемой и неувлекаемой сред для одноместной и одно¬ временной регистрации, невозможно выявить существование среды в кинематических экспериментах с одним типом эталонной волны. Значит, можно считать ее несуществующей, как это и было сделано по отношению к эфиру. Мир без замедления времени и сокращения длин. В предыдущем описании процедуры Эйнштейна выделялись проективные свойства, а метрические остались в стороне. Ясно, что если далее следовать обычной схеме и использовать условие унимодулярности, то придем к системе базисных инвариантов геометрии Минковского (38), т.е. 86
к таким гиперболическим эталонам ’’интервала” (см. рис. 3, б), ко¬ торые обусловливают известные эффекты сокращения длины и замед¬ ления времени. Конструктивно этот случай интерпретируется следующим образом. Задается параллелограмм эталонной волны, например так, что его оси-диагонали пересекаются в начале Л'-СО: стороны параллелограмма пересекают оси Л'-СО в точках ±Т и +1 (рис. 4, б). Координаты базис¬ ных векторов определяются как координаты точек пересечения осей Z-С О и сторон параллелограмма. Отсюда в нормированном виде (с= 1) получаем bп — 621 = —ТЬц, Ь\г ~Ь\г= 1Ьгг или, учитывая выражения (3) и (4), имеем Tb\ 1 — 1Ъгг — 1. Следовательно, приходим к известным соотношениям Т = 1=у/{—о2 = 1/che. Здесь скоростные зависимости длины стержня l(v) и ритма T(v) часов Ланжевена определены с точки зрения .^-наблюдателя и исходя из заданной формы эталонов геометрии Минковского, т.е. гипербол: бп 621=-1, б,22—б222= 1. (39) Это развернутая запись метрических инвариантов матричного урав¬ нения (38). Конструктивный подход позволяет действовать обратным образом: определять форму эталонов исходя из гипотез о зависимостях 1(d) или Т(ч), обеспечивая при этом проективные свойства осей инер- циальных систем отсчета, т.е. свойство постоянства скорости света. Рассмотрим сначала изометрическую модель, когда неизменна длина, т.е. / = const. (40) Вообще говоря, такую гипотезу не следует отождествлять с ги¬ потезой абсолютно ’’жесткого” стержня, ибо динамически инерциаль- ные системы отсчета определяются как такие, в которых отсутствуют внешние силы, поэтому упругие характеристики стержня здесь несущест¬ венны. Условие (40) следует понимать только как кинематическое. Тогда на пространственно-временнбй диаграмме условие (40) пред¬ ставляется пучком прямых, которые пересекают ось хг в точке хг = 1. Это мировые траектории границ стержня при разных и (рис. 4, б), описываемые уравнениями хг—uxi=±/. (41) В данной задаче мы встречаемся с принципиально новой ситуацией. Условие (40), строго говоря, имеет смысл инварианта для искомого семейства инерциальных систем отсчета, но этот инвариант не явля¬ ется метрическим, а как бы целевым: мы хотим чтобы выполнялось условие (40), и ищем, какая метрика может обеспечить это условие, т.е. здесь заданный целевой инвариант индуцирует соответствующий 87
метрический инвариант — эталон интервала. Как же построить такой эталон? По аналогии с предыдущей диаграммой (см. рис. 4, а) будем и в этом случае выбирать основные события (инициации р, отражения г, Ьг и встречи bi сигналов) так, чтобы диагонали параллелограмма пересекались в начале Х-СО (рис. 4, б). Тогда метрический эталон базисного вектора Ьг определяется условием инцидентности этого вектора прямой (41) и инвариантом соответствия (36), удовлетво¬ ряя которым, получим Ъ\2 Ь' //>22 ~ 0; затем эталон вектора bi достраивается по условию bi = 1Ьг, что позволяет реконструировать базис инерциальной системы отсчета: В(Ъ) = (Е + (Л)/ (1—г2), B(0) = ch0(ch0E+sh0I). (42) Если сравнить формулы (42) (37), то последние формально получаются из соотношений (37) при специальном выборе свобод¬ ного множителя b — 1 /\J\—и2', или Ъ = ch0. Геометрический анализ показывает, что здесь участвуют кано¬ нические гиперболические эталоны (39), но со смещенными центрами. Это свойство более наглядно отражает матричное уравнение (2В — E)'F(2B— E) = F. (43) Матричные уравнения (39) и (43) сходны (гомологичны) в том, что совпадают их метрические матрицы F, поэтому эти матричные квадратичные формы можно назвать гомометрическими, как и соот¬ ветствующие геометрии. Изучая далее изоритм'ическое условие Т = const, (44) нетрудно обнаружить, что условие (40) обеспечивает выполнение условия (44), и наоборот. Таким образом, чтобы мир (хроногео¬ метрию) Минковского превратить в мир без замедления времени и сокращения длины достаточно необходимым образом сместить эталоны. Итак, рассмотренные модели специальной теории относительности конструктивной версии согласуются с фундаментальным постулатом постоянства скорости эталонного сигнала, в частности светового. Этот постулат в силу проективных сройств оказывается совмести¬ мым с разными метриками. ЧТО ТАКОЕ ЛОКОМОЦИЯ? На фоне разрастающейся интеллектуальной деятельности современ¬ ного человека двигательные акции приобретают как бы все меньшую актуальность и интерес как производные более низкого порядка, играющие второстепенную роль. Так ли это? Конечно, в филогенетической ретроспективе легко усматривается производящая функция движений вообще и локомоции в частности 88
для формирования структуры и функций центральной нервной системы. Отсюда естественно предположение, что базовые принципы интеллек¬ туальной деятельности имеют как бы двигательное происхождение: просто мы пока еще не умеем находить соответствующие связи, хотя попытки в этом направлении предпринимали И.М. Сеченов, И.П. Павлов и многие другие. С другой стороны, и в индивидуальном развитии произвольные движения — не только выходные (эфферентные и эффекторные) сущ¬ ности, подчиняющиеся целевым установкам перемещения, труда и т.д., но и способ ’’сбора информации”, общения с внешним миром и формирования целостных интеллектуальных, в частности геометри¬ ческих, представлений о нем. А. Пуанкаре уделил специальное вни¬ мание этому аспекту, пытаясь ответить на вопрос: как возникает и что означает наша способность умозрительной локализации пред¬ метов в воображаемом пространстве? Согласно А. Пуанкаре, это просто означает, что мы представляем себе движения, которые на¬ до совершить, чтобы достигнуть этого предмета. Зрение и осязайие не могли бы нам дать понятие пространства без помощи мускульного чувства [2]. Тема ”от физиологии движений к геометрическим представлениям” в связи с проблемой формирования ’’понятия пространства” и тем более ’’понятия пространства—времени” сама по себе чрезвычайно интересна, но представляется преждевременной, так как мы пока располагаем скудными знаниями о геометрии самих движений, включая локомоторные. Такая оценка состояния науки о движениях может показаться читателю сильно заниженной, ведь биомеханика встала на путь систематических количественных исследований более века назад [23]. В чем же дело? Следуя Т. Куну, можно сказать, в парадигме: физио¬ логи развивали преимущественно парадигму рефлексов, а биомехани¬ ки — парадигму силы, т.е. видели проблемы организации движений с позиций ’’силы и суставных моментов”. Из-за этого парадигма сво¬ бод — системный подход с позиций объективизации степеней сво¬ боды — оставалась неразработанной. Н.А. Бернштейн, видимо, первый охарактеризовал суть двигатель¬ ной координации как преодоление избыточных степеней свободы двигательного органа [24]. Однако этот тезис не был сформулирован и, следовательно, воспринят конструктивным образом. Долгое время он принимался во внимание с фатально-описательной позиции: ко¬ нечности животных и человека из-за многозвенной организации имеют избыточные степени свободы. Увидеть необычное в привычном не сразу и не всегда удается. Для этого, как правило, необходим переход в другую систему отсчета. Вот только нужно еще ее найти. Формирование целостного понимания проблем организации произ¬ вольных движений несомненно должно идти по пути синтеза разных подзадач построения двигательных актов — кинематических, ди¬ намических и физиологических, но с выделением кинематического образа, который, по-видимому, служит целевой функцией управления 89
[ тории (в, г) движения ноги человека при ходьбе, представленные в системе отсчета грунта (а, в) и в инерциальной системе (б, г\ перемещающейся относительно грунта со скоростью ходьбы 0—2 — тазобедренный, коленный, голеностопный сустав соответственно; 2 — носок; светлые знач¬ ки — фаза опоры, темные — фаза переноса; ЦТ — целевая траектория для конкурентно настроенных динамических исполнителей [13]. Рас¬ смотрим частный аспект этой комплексной проблемы — от анализа кинематических свобод в задаче построения целевой траектории к синтезу функциональных связей и алгоритмов их обеспечения. Цель — траектория, средства — синергии. Полное кинематическое описание ходьбы человека даже в плоском варианте (в проекции на вертикальную плоскость) является сложным, что частично видно из рис. 5, а адекватное динамическое описание — это существенно более сложная задача [25]. Но сложности реалистично преодолевать последовательно, начиная с главных целевых задач. Видимо, в случае ходьбы — это задача построения дистальной целевой траектории конечности. Кинематические законы адаптивной изменчивости этой 90
траектории должны отражать глобальные принципы управления ша- гательной локомоцией как целостным актом взаимодействия с дви¬ жущимся внешним пространством. С одной стороны, эта задача является универсальной в ряду ходоков от членистоногих до человека, конечности которых сущест¬ венно различаются по анатомии, морфометрическим и динамическим характеристикам. В самом деле, по поступательным и возвратным продольным перемещениям все ноги, вообще говоря, одинаковы, т.е. реализуют однотипные пространственно-временные траектории, составленные из участков фаз опоры и переноса. На рис. 5, в, г упро¬ щенный вариант такой траектории выделен на пространственно- временных графиках отрезками прямых, где смежные отрезки, имеющие разные скоростные наклоны, как раз и представляют фазы 91
опоры и переноса. Далее под целевой траекторией подразумевается такой графический образ мировой линии стопы относительно грунта, т.е. в У-СО, или относительно тела, т.е. в Х-СО. Эти две системы отсчета связаны друг с другом преобразованием Галилея Г :Х^~ Y =>Y = Гх, Г= Е+ гЕ2,, где и — продольная скорость ходьбы (см. рис. 3 и таблицу). С другой стороны, среди произвольных движений ходьбу принято характеризовать как высокоорганизованную синергию, т.е. сложный (по числу участвующих степеней свободы двигательной системы) локомоторный стереотип, автономизированный посредством автома¬ тизации связей всех избыточных степеней свободы. Однако высокий уровень автоматизма выполнения шагательных движений, по-видимо- му, не исключает необходимости текущего контроля целевой траекто¬ рии и прогнозирования пространственно-временных координат событий фазовых переключений в цикле шага. Существуют ли основания для такой гипотезы? В привычной обстановке мы действительно способны ходить, как бы не замечая окружения, например беседуя с попутчиком. Но это не означает, что контроль внешнего пространства и дороги полностью выклю¬ чается, в чем нетрудно убедиться, пытаясь ходить с закрытыми глазами, — в движениях появляется неуверенность. Более явно значимость текущего контроля проявляется в так называемом ’’эф¬ фекте экскалатора”: переход от неподвижного пола к подвижному экскалатору мы обычно ”не замечаем”, но если ступаем на непод¬ вижный экскалатор, считая его подвижным, то обнаруживаем его непод¬ вижность скорее не визуально, а ’’мускульным чувством” — по повышен¬ ному сопротивлению, испытываемому ногой при контакте с непод¬ вижным экскалатором. Следовательно, при обычном, привычном переходе с неподвижного грунта на подвижный и обратно автоматически происходит перепро¬ граммирование на ожидаемую ситуацию поведения или состояния грунта. Поэтому такое же текущее прогнозирование, осуществляемое активно от шага к шагу, естественно и для внешне стабильных ситуаций нормальной ходьбы; тогда именно стабильность и прогно¬ зируется для реализации следующего шага. Таким образом, несмотря на крайнюю простоту строения целевой траектории, задача перестановки ног не является тривиальной, типа рефлекторной подстановки ног ’’под постоянно падающее тело”, как это представляется в некоторых простых моделях ходьбы [26]. Нетри- виальность как раз и проявляется в том, что целевая траектория строится активно и целостно: посредством использования базовых синергий, которые стандартизуют отдельные этапы построений. Если ориентироваться на пространственно-временнбй образ целевой траектории, то простейшую гипотезу ее построения можно представить в виде метода проведения типовой кривой через расчетные опорные точки, в данном случае отвечающие событиям фазовых переходов: один алгоритм вычисляет (прогнозирует) координаты таких точек (не обязательно в буквальном смысле), второй — в соответствии с текущим про- 92
гнозом предопределяет соответствующий фрагмент траектории, а авто¬ номные динамические синергии преобразуют кинематические инструк¬ ции в реальное действие. Целостные синергии-алгоритмы как наборы стандартных подпрограмм текущего локомоторного обеспечения целе¬ сообразно фракционировать на элементарные компоненты, например по операционным структурам, если знать принципы организации со¬ ответствующих операционных систем. Но с биомеханической точки зрения удобен другой принцип фракционирования — по степеням свободы задачи построения, принимая следующее определение. Определение 3: элементарной называется синергия формиро¬ вания одиночной связи между независимыми переменными, редуциру¬ ющая одну степень свободы задачи построения движения. Сравнение с определением 1 позволяет ввести в описание локомотор¬ ных и других движений язык инвариантов через соответствие синергия ** инвариант, которое дает нам конструктивный метод изучения синергий как редукторов избыточных степеней свободы. Только в отличие от узкого тезиса Н.А. Бернштейна здесь следует учитывать как структурные (конфигурационные или позные) степени свободы, так и функциональные, присущие целевой задаче или целевой траектории. Итак, чтобы понять законы построения целевой траектории следует: объективизировать степени свободы пространственно-временнбй организации целевой траектории; изучить функциональные связи между независимыми параметрами, т.е. выявить инварианты, формируя достаточное разнообразие измен¬ чивости параметров целевой траектории. Принцип однопараметрического управления. Как же подсчитать и описать кинематические степени свободы, присущие целевой траектории стационарной шагательной локомоции? Разнообразие пространственных конфигураций конечности обеспе¬ чивается суставными степенями свободы, которые обобщенно можно назвать позиционными или структурными, чтобы отличать от функ¬ циональных свобод построения траектории. Последняя как непре¬ рывная пространственно-временная линия формируется последователь¬ ными трансформациями поз конечности. Всякая же непрерывная линия с математической точки зрения в общем случае имеет бесконечное число свобод априорного задания. Практическая элиминация такой теоретической избыточности осуществляется выбором типа линии — прямой, кривой второго порядка и др. Тогда реальные функциональ¬ ные свободы определяются числом изменчивых параметров траекто¬ рии. При стационарной ходьбе каждая нога делает шаг постоянной длины / с постоянным периодом Т (или частотой 1/Г) и тело пере¬ мещается относительно грунта, т.е. в У-СО (рис. 5, б), с постоянной средней скоростью и. В инерциальной же системе отсчета X, которая перемещается относительно грунта со скоростью v в направлении локомоции, тело в среднем неподвижно, каждая нога совершает маятниковые движения-качания с размахом L (см. рис. 5, б, г). Обычный 93
механический маятник совершает симметричные качания, поэтому имеет две параметрические степени свободы — по частоте и ампли¬ туде. Нога совершает асимметричные качания — вот источник третьей степени свободы. Асимметрия качания ноги проявляется в длитель¬ ностях фаз опоры 71 и переноса Т+, где 71 + Т+= Т, но так как за это время проходится одно и то же расстояние то скорости на участках целевой траектории фазы переноса и и опоры -и различны по зна¬ чению и знаку в Л'-СО: Полное трехпараметрическое описание целевой траектории осуществ¬ ляется ’’тройкой независимых”, выбираемой из перечисленных. Напри¬ мер, тройка Т, I, v не удовлетворяет условию независимости, а доста¬ точны следующие: в чем нетрудно убедиться, если попытаться построить целевую траек¬ торию по заданным параметрам. Далее удобно использовать не одно из этих множеств, а трехмерное пространство Р3, оси которого представляют одну из троек выделенных параметров, т.е. Р3 — парамет¬ рическое пространство кинематического разнообразия локомоции. В этом пространстве каждая стационарная проходка представляется одной точкой. Ставя задачу, выяснения межпараметрических связей, которые и составляют законы управления — законы ходьбы, мы должны стремиться получить как можно больше разных точек в Р3 и затем описать реальное разнообразие математически. На первый взгляд может показаться, что мы способны произ¬ вольным образом распоряжаться своими кинематическими степенями свободы и ходить так, чтобы результирующие точки располагались в Р3 произвольно. Но это не так. Предложим испытуемому (или сами можем повыступать в этой роли) ходить произвольно, соблюдая только два условия: в одиночных проходках реализовать стационарный режим по ско¬ рости локомоции; в разных проходках стараться идти с различными скоростями, перекрывая весь возможный диапазон от медленной до быстрой ходьбы (это условие для того, чтобы получить побольше разных точек Р3). Если затем все результаты эксперимента — массив точек — пред¬ ставить в Р3, то обнаружится, что они выстраиваются вдоль некоторой линии L1 — одномерного разнообразия реализаций, которое назовем нормальным или самопроизвольным режимом локомоции, ведь ника¬ кие специальные ограничения не накладывались. Следовательно, нормальное управление ходьбой представляет однопараметрический принцип: все избыточные степени свободы редуцируются устойчивыми синергиями и выделяется только одна степень свободы по тактическому параметру управления. Но как выявить такой тактический параметр, ведь даже выбор множества независимых параметров (46) неоднозначен? и = L/T+, u = L/T_ = l/T. (45) Р = {Т, Т+, о}\'Р = {Т+, 71, /_}, (46) 94
Не менее интересно другое обстоятельство: если организация целевой траектории имеет три степени свободы, а реальное разно¬ образие — только одну степень свободы, то, значит, существуют две дополнительные функциональные связи, редуцирующие две избы¬ точные степени свободы. Как выявить эти связи? Из общих сообра¬ жений ясно, что следует попытаться расширить разнообразие. Но как это сделать? Являются ли редуцированные степени свободы потенциально ’’свободными” или ’’аппаратно зашитыми”, вернее, имеют ли фиксированное программное обеспечение? Традиционный метод ’’раскачивания систем” известен — это навя¬ зывать ’’волю” экспериментатора и создавать вынужденные режимы. Например, важно зафиксировать ритм ходьбы (’’под метроном”): Т= const. (47) Действительно, оказывается, что в этом случае в пространстве Р3 получается другая линия L'r, т.е. это уже не нормальный режим, а изо- ритмический. Изменяя длительность шага Т фиксированного ритма в условии (47), можно получить семейство разных линий L'T, или семейство изоритмических режимов. Далее нетрудно зафиксировать длину шага (’’ходьба по шпалам”) / = const, (48) и по аналогии с предыдущей фиксацией получить семейство изо¬ метрических режимов. Что нового смогли мы теперь узнать? Ока¬ зывается, что довольно много, а главное, прояснилась вся организация целевой траектории. Во-первых, оказалось, что все семейства (47) и (48) образуют в про¬ странстве Р3 некоторую единую ’’поверхность ходьбы” W , которой принадлежит и линия L1 нормального режима. А раз получилась поверхность, значит, выявилась одна общая для всех режимов связь, редуцирующая одну степень свободы целевой траектории, имеющую смысл инварианта ходьбы — это, так сказать, общий инвариант. Во-первых, на фоне одной выявленной связи известны варианты двух типов возможных дополнительных связей (47) или (48) — это частные или целевые инварианты, определяющие режимы ходьбы (ненормальные). В-третьих, знание общего инварианта позволяет посредством ма¬ тематических исследований о писать и частный инвариант нормальной ходьбы. Количественные данные по перечисленным экспериментам содер¬ жатся в статье [27], графический образ поверхности W2 приведен в публикации [28]. Однообразие разнообразий, или принцип гомометричности. Перей¬ дем к вопросу математического описания кинематических законов ходьбы, т.е. к формулам шага, оставляя в стороне аспекты меж- конечностной координации — формулы для инвариантов походок [13]. Сравнительный математический анализ наших и литературных экс¬ периментальных данных [13], представляющих зависимости кинема¬ тических параметров шага от скорости ходьбы для разных режи¬ мов ходьбы человека и нормальных режимов разных животных, по- 95
зволил выявить универсальную формулу для общего инварианта шага в виде дробно-линейной связи двух скоростей (45): и = (ао +a\v)/(\ +a2v), (49) где а, — эмпирические константы. Трехмерный образ описанной выше ’’поверхности ходьбы” W‘ получается из формулы (49), если скоростные параметры заменить согласно определению (45) ’’однород¬ ными” пространственными и временными координатами. Тогда вместо соотношения (49) получаем формулу второго порядка: аоТ+Т. — ах T+L —TJ_ + aill = 0. (50) Частный инвариант нормального режима тоже изучался в разных представлениях. Обобщенная форма, подходящая не только для опи¬ сания ходьбы человека, но и животных такова: о07 + — (1 + a\)T+l_ -f a2ll + qx T+ + q2L +q0 = 0, (51) где qi —дополнительные эмпирические константы. Последняя формула выглядит неестественно громоздкой в срав¬ нении с другими, более простыми вариантами представления част¬ ного инварианта, которые тоже удовлетворительно описывают экспе¬ риментальные данные (например, для выделения нормального режима человека среди режимов (47) и (48) была предложена формула T+l — const [27, 28]). Но выделение именно формулы (51) подсказано следующими интересными и, следует отметить, интригующими обстоятельствами. Нетрудно видеть, что общий инвариант шага (49) является по своей форме проективным инвариантом (ср. с формулой (15)). По¬ этому, учитывая возможность интерпретации проективного инварианта как условия соответствия осей систем отсчета, целесообразно ввести новую Z-CO, связанную с участками целевой траектории фаз опоры и переноса, и изучить хроногеометрические свойства нового базиса В(и), т.е. метрические инварианты разных режимов ходьбы, для кото¬ рых частные инварианты (47) или (48) играют роль определяющих (’’целевых”) условий. Физический аналог подобных определяющих условий как индукторов хроногеометрии был описан выше. Определим Х-СО так же, как и выше, но совмещая начало координат с серединой фазы переноса одной ноги и серединой про¬ тивофазного отрезка опоры другой ноги — здесь удобно противо¬ фазные целевые траектории обеих ног рассматривать совместно (рис. 6). Тогда ближайшие к началу координат события переключения фаз в положительной полуплоскости времени представляются сле¬ дующими векторами: 2х+ = (Т+, U' = T+( 1, и)\ 2г_= (Т_, -/_/ = Г_(1, -о/. (52) Можно ли эти события принять за базисные векторы bi, Ьг новой Z-CO? Из собственного опыта участия в описанных выше экспери¬ ментах можно заключить, что привязки к заданному ритму (в изо- ритмическом режиме) и к заданной длине шага (в изометрическом режиме), осуществляются по событию наступания х+. Следовательно, в этих режимах справедливо следующее правило. Правило ’’финиша”: текущий контроль и корректировка 96
/ 0J г К Рис. 6. Базисные векторы целевой траектории ноги а — схема; 6 — эталоны добытой наступания в изометрическом, изоритмическом и нормальном режимах цикла шага при ходьбе осуществляются по событию окончания фазы переноса*. Если положить bi =х+и строить метрический эталон Si путем исключе¬ ния параметра 71 из формы (50), используя условие 71 = 7'—7+, то получим при дополнительном условии (47) эталон целевого события изо- ритмического режима вида (51), для которого q1 = -аоТ, q2 = Т, qo = 0. Если далее положить Ь2 = х_ и исключить из формы (50) Т+ = Т—71, то определим второй эталон В2 изоритмического режима, отличающийся от формы (51) заменой Г+на 71 и значениями qi=aoT, q2 = -aiT, qa=0. Таким образом, события х+ и х_ можно принять за базисные в случае изоритмического режима ходьбы, а соответствующую систему базисных инвариантов можно обобщенно представлять матричной формой: где В = (u); Bo = B(0); Q — матрица центров эталонов, которые яв¬ ляются гиперболическими. Имея в виду возможность описания ба¬ зиса матричным уравнением (53), будем называть события (52) компле¬ ментарными для базиса изоритмического режима. Естественная компле- ментарность здесь проявляется в том, что суммарное событие явля¬ ется неподвижным: х+ -f х_ =(Т, 0/. Для изометрического режима в качестве первого базисного вектора тоже можно выбрать событие наступания: bi=x+, а второй базисный * Прыжки, броски (как и артиллерийская стрельба) реализуются, так сказать, по правилу ’’старта”, когда конечное событие подготавливается начальными условиями. Видимо, такое правило характерно для бега, т.е. смещение целевого события на начало илн конец фазы переноса ноги — один из признаков отличия бега и ходьбы. Другой пример реализации правила ’’финиша” для рук — игра на фортепиано. (В — Q) М(В — Q) = (Во — Q)'M(Bo — Q), (53) 7. За к. 1668 97
вектор принять из условия изометрической комплементарности: b,+b2 = (0, /)'. Соответствующая система базисных инвариантов тогда тоже опи¬ сывается квадратичной матричной формой (53) с той же метрической матрицей где а = ( 1 +а\)/2. Изометрический режим отличается от изоритмического по коор¬ динатам центров гиперболических эталонов, т.е. по значениям ком¬ понент матрицы Q в форме (53). Получается, что разные режимы ходьбы строятся с помощью одинаковых гиперболических ветвей как метрических эталонов, а различия в режимах формально проявля¬ ются в разных смещениях их центров. Такой способ организации мобильной метрики можно назвать принципом гомометричности. Теперь понятно, почему интересна возможность описания част¬ ного инварианта формулой (51). Это позволяет считать, что и нор¬ мальный режим ходьбы организуется по принципу гомометричности. Однотипные гиперболы как метрические эталоны трех режимов ходьбы построены на рис. 6, б. * Волновые инструменты мозга. Если следовать освоенной в техни¬ ческих системах теории регулирования, то и инварианты шага можно пытаться объяснять на основе цепей обратных связей и т.д. Однако более адекватной для распределенных сред мозга представляется гипотеза волнового управления, ведущая к принципиально новым понятиям нейрофизиологического релятивизма. Умозрительное осво¬ ение этого аспекта естественно начинать с постулата ’’эталонных волн”, но прежде полезно договориться (хотя бы в абстрактной форме) о связи событий внешнего мира, например представляющих целевую траекторию движения конечности, с внутренними событиями центральной нервной системы. Минимальное условие согласования позволяет сформулировать следующие предположения. Гипотеза. В распределенных средах мозга формируется неко¬ торая линейная копия (образ) внешней пространственно-временной целевой траектории. Такое предположение позволяет для описания внутрицентрального образа целевой траектории использовать (с точностью до линейного изоморфизма) те же параметры, что и ранее, а также совмещать пространственно-временные траектории конечности и эталонной волны как кинематические сущности карты мозга. Пусть далее Л'-СО — карта тела (в мозге), а Z-CO — карта, свя¬ занная, как и выше, с образом целевой траектории. Теперь, следуя фундаментальному подходу, примем еще одну ги¬ потезу. Пост улат эталонных волн: измерительные процедуры упорядочения событий в Х-карте осуществляются посредством пар стандартных распространяющихся процессов, постоянные ско¬ 98
рости которых в X- и Z-картах имеют скорости с\, о и sь 5: соответ¬ ственно. Так как этот постулат является аналогом проблемы инвариант¬ ных направлений, он связывает эмпирическую формулу (49) с тео¬ ретической (34) и позволяет по величинам а, оценить скорости с,, с2. Хотя абсолютные величины оценок несущественны из-за неопределенности по масштабным пространственным коэффициентам, качественные вы¬ воды, отражающие общие тенденции, характерные для ходьбы человека и животных, заслуживают внимания. На основе таких расчетов по¬ лучены основные свойства скоростей эталонных волн: скорости ci и сг имеют одинаковый знак, т.е. эталонные волны распространяются в одном и том же направлении; значения скоростей различаются примерно в 100 раз; сг/с\ =100; свойство ангармоничности, т.е. типично, что 51/52^-1, но 5i/i2<0; последнее согласно (15) означает, что-траектории эталонных волн и оси Z-СО являются разделяющимися парами. Таким образом, по свойствам унидирекциональности, анизотро¬ пии и ангармоничности эталонных волн локомоторная хроногеометрия отличается от физического аналога специальной теории относитель¬ ности. Из-за этих необычных свойств, пространственно-временные диаграммы локомоторной теории относительности строятся иначе, чем в специальной теории относительности. На рис. 7 приведены примеры таких новых диаграмм, которые в кинематической форме представляют алгоритм построения события окончания фазы переноса Ьг посредством процедуры, аналогичной процедуре Эйнштейна (ср. с рис. 4, а), но не эквивалентной ей, во-первых, из-за унидирекциональных свойств эталонных волн, во-вторых, из-за принципиальных различий не столько в природе (что тоже сущест¬ венно), сколько в свойствах распространения света и нервных сиг¬ налов. Например, для света возможен эффект отражения, который существенен в процедуре Эйнштейна, а для нервных сигналов — нет. Поэтому в последнем случае события п и го на рис. 7 суть события реинициации эталонных волн нейрофизиологической природы, которые формируются средствами волновой логики при встречах эталонных волн, инициированных пейсмекерным событием р, с опорным участком траектории L смежной конечности. Для такого алгоритма можно предложить нейрофизиологическую модель, которая представляет собой локомоторный генератор в виде распределенной ’’среды”, включающей несколько типов нейронов как пороговых элементов. Нейронная схема модели и описание ее функ¬ ционирования приведены в публикации [13]. Существенной особенностью нейрофизиологического релятивизма является свойство активной организации событий и тем более образов траекторий типа образа целевой траектории. Только организация эталонных волн может осуществляться примитивным образом — по¬ средством использования одной и той же (при разных скоростях и режимах ходьбы) проводящей системы аксонов, ибо в таких ’’эта¬ лонных системах стандартных по скорости нервных импульсов” отсутствует необходимость регуляции скорости. Как организуются 99
а. / Рис. 7. Пространственно-временные диаграммы эталонных волн а _ гармоническая модель локомоторного генератора. 6 — ангармоническая модель; в — про¬ цедура Паскаля построения гиперболического пространственно-временного эталона посредством унидерикциональных волн в распределенных структурах мозга движения образов с разными скоростями? Это особый вопрос, который требует дополнительных модельных и экспериментальных исследований. Простоту физических моделей не так-то легко обеспечить в мозге. Ограничиваясь здесь кинематическим ракурсом, следует еще обра¬ тить внимание на проективные свойства диаграмм с унидирекцио- нальными эталонными волнами (см. рис. 7, в), где опорная прямая имеет проективный смысл так называемой прямой Паскаля. Учет этого простого математического обстоятельства позволяет понять, как на основе измерительно-логических процедур может формироваться с участием эталонных волн гиперболическая метрика пространства— времени. Одна из возможных схем построения гиперболического 100
эталона показана на рис. 7, в. Подчеркивая проективное содержание этой схемы, ее удобно назвать процедурой Паскаля, чтобы отличать от физической процедуры Эйнштейна, представляющей с математи¬ ческой точки зрения определенную модификацию процедуры Паскаля. Процедура Паскаля, тоже, конечно, элементарная в том смысле, что позволяет осуществить графическое построение гиперболы только посредством рейсшины, имеет глубокое значение для понимания кон¬ структивной природы метрики хроногеометрии (где роль рейсшины играют эталонные волны), а также природы гомометричности и др. Таким образом, процедура Паскаля позволяет построить конструк¬ тивное обоснование локомоторной хроногеометрии. Инструментально-измерительная природа релятивизма. Взгляд на управление движениями как на управление событиями пространст- венно-временнбго континиума — таков общий итог анализа био¬ механической природы инвариантов шагательной локомоции, который кратко можно выразить следующими тезисами: задача построения целевой траектории движения конечности реша¬ ется мозгом как целостная пространственно-временная задача; алгоритм построения целевой траектории реализуется в распреде¬ ленных структурах мозга посредством использования волновых процес¬ сов нервной природы с целью определения координат опорных собы¬ тий, например событий переключения фаз движения; конечные значения скоростей распространения сигналов по нерв¬ ным волокнам обусловливают релятивистскую хроногеометрию управ¬ ляющих процессов мозга, т.е. релятивизм в данном случае имеет инст¬ рументально-измерительную природу. Окончательная проверка концепции ’’релятивистский мозг” — дело будущих экспериментальных исследований, включая, несомненно, ней¬ рофизиологические. Здесь еще много подготовительной работы, так как пока не ясна форма необходимых экспериментов: как тестировать эталонные волны и доказать, что они эталонные; как понять роль карты тела в решении задачи построения движений; как выявить образ целевой траектории. Из этих неясностей следует, что релятивистская концепция, предлагая новый язык представления внутримозговых процессов, требует разра¬ ботки и новых экспериментальных подходов. Таким образом, прикладная адекватность и значимость биореля¬ тивизма — это пока в области надежд, непонятно насколько скоро осу¬ ществимых. Тем не менее фундаментальная значимость такой пара¬ дигмы уже налицо — это конструктивное перСосмысливание общей при¬ роды релятивизма, включая физический, на основе более свободной трактовки хроногеометрий как следствий измерительных процедур с использованием волн в качестве эталонных процессов. ЧТО ТАКОЕ УПРАВЛЕНИЕ? Отмечая, что в настоящее время в биологии нет определения живого, жизни или процесса жизнедеятельности, а это чрезвычайно осложняет развитие теоретической и тем более математической биологии, А. А. Ля¬ пунов объявил управление характеристическим свойством жиз- 101
ни в широком смысле [29]. С таким мнением, конечно, невозможно не согласиться, но приближает ли оно к пониманию сущности жизни? Ка¬ залось бы, должно, ибо в таком приближении и состоят стратеги¬ ческие цели кибернетики как науки об управлении и связи в животном и машине [30]. Однако сам А.А. Ляпунов не дает определения управле¬ ния, а характеризует управляющие процессы тем, что передача неболь¬ ших масс или порций энергии вызывает действия, состоящие в передаче или переработке гораздо больших энергий или масс. Отсутствие конструктивного определения управления и, следова¬ тельно, понимания его сущности стало осознаваться мной в связи с по¬ пытками перенесения языка инвариантов на биомеханическую и более широкую биологическую почву. Эти попытки естественным образом привели к проблеме формирования биоинвариантов, ведь в живом ничто не существует само по себе как неживая материя, все строится, синтези¬ руется, поддерживается активно. Поэтому и отношение к биоинвариан¬ там должно быть не фатально-формальным, а конструктивным, отве¬ чающим ’’духу” биопостроений. В предварительном решении этой проб¬ лемы полезно использованное в предыдущем разделе соответствие: синергия инвариант, (54) конструктивная гносеологическая значимость которого состоит в том, что позволяет от разговоров о синергиях как специализированных фор¬ мах автономного управления перейти к количественным методам изучения результатов деятельности такого управления, выявляя устой¬ чивые связи на разнообразиях виртуальной изменчивости. Выше была показана эффективность такого подхода. Но, как говорится, хорошее начало — лишь половина дела. Поэтому, естественно использовать накопленный прикладной опыт для решения центрального вопроса кибернетики: что такое управление? Прежде чем останавливаться на этом вопросе, полезно охарактеризовать историчес¬ кую ретроспективу. От рефлекторной парадигмы к парадигме синергий. Как хорошо известно, совсем еще недавно в физиологии доминировала рефлектор¬ ная теория И.П. Павлова, называемая ’’павловским учением”, которое завершало, так сказать, предкибернетический период становления физиологии. Поэтому ранние кибернетические модели начинались с этого уровня понимания функций мозга, т.е. ориентировались на услов¬ но-рефлекторные понятия [30, 31]. Только с развитием машинных моде¬ лей интеллектуальных задач стала выясняться недостаточность и неадек¬ ватность рефлекторной схемы для понимания принципов мышления. Работа М.М. Бонгарда и его коллег была первой научной публикацией в этом направлении моделирования [32]. С другой, а именно с биомеханической, стороны, изучением альтерна¬ тив физиологических представлений занимался Н.А. Бернштейн. Его книга ’’О построении движений”' во многих отношениях опередила ви- неровскую кибернетику. Сам Николай Александрович склонялся к концепции рефлекторного кольца, но, чувствуя ограниченность этой 1 Бернштейн Н.А. О построении движений. М.: Медгиз, 1947. 389 с. 102
версии, развивал представления о целеполагании, о различиях реак¬ ций и акций. Он выделил основные уровни центрального управления дви¬ жениями, относя к нижнему рефлексы и регуляции, к следующему — си¬ нергии координационно-временного типа, а к более высоким — задачи пространственной координации, динамического воплощения и семанти¬ ческих оценок. Будущие классификации уровней управления могут оказаться други¬ ми, но в свете современных представлений отправную часть должны составлять понятия синергии. Исходно термин ’’синергия”, введенный в физиологию Ч. Шеррингтоном в конце прошлого века, использовался в узком обозначении кооперации мышц в реализациях целостных дви¬ гательных актов. Обобщенная физиологическая трактовка синергии как комплексного акта управления, включающего кооперацию разных уровней, была предложена И.М. Гельфандом, B.C. Гурфинкелем, M.JL Цетлиным и М.Л. Шиком [33]. Существенным новым аспектом этой концепции явилось выделение не столько формы организации синер¬ гии — кооперативности уровней, сколько содержания — организации стандартных связей, которые обеспечивают функциональный фон реше¬ ния jraKTHHecxHx. целевых задач, или ’’словарь движений”. Можно сказать, что мои попытки расшифровки ’’словаря движений” были инициированны конструктивным зерном этой концепции, относя¬ щимся к редукции избыточных параметров, которые и привели затем к разработке количественного языка инвариантов в виде соответствия (54), которое можно переформулировать в следующий тезис. С и с т е м н о-к онструктивный тезис: и синергии, и инварианты ограничивают число независимых переменных, характеристик, пара¬ метров, т.е. оба конструкта определяют в разных семантических формах (причин и следствий) редукцию избыточных свобод изменчи¬ вости систем, вообще говоря, в смысле структуры и функций. В современной физиологии концепция синергий становится довольно популярной. Это обстоятельство естественно оценить как смену пара¬ дигм: от рефлексов к синергиям, т.е. физиологическая наука поднялась как бы на следующий уровень проблем управления, если исходить из классификации уровней управления по Н.А. Бернштейну. Каким может быть следующий уровень проблем управления? Существуют ли в настоящее время предпосылки для новой смены парадигм? Принцип активности: жизнь — не реакция, а акция. Основная пред¬ посылка дальнейшего обновления кибернетических и биологических представлений, по-видимому, заложена в бернштейновском принципе активности, который исходит из идей разобщения понятий ’’реакция” и ’’акциям Однако пока не удается определить этот принцип явно; Ничего не поделаешь, но в современной науке возможны только варианты мировоззрений и методологий, выросших на физико-хими¬ ческих понятиях. Поэтому предложение трактовать живые организмы как весьма сложные химические машины [34] является вполне совре¬ менным, т.е. отражающим современную точку зрения на биоорганиза¬ цию. Несомненно, машинный подход является во многих отношениях перспективным в силу своей конструктивности, но вместе с тем огра¬ 103
ниченным в широком смысле, так как машина в общем случае — это всего лишь некоторый заранее организованный преобразователь (ме¬ ханический, электрический, химический и т.д.), а ЭВМ с введенной прог¬ раммой является цифровым преобразователем в рамках той задачи, для решения которой написана программа. Несомненно также и то, что дея¬ тельность живых организмов во многих отношениях организуется ма¬ шиноподобным образом — на основе эволюционно подготовленных рефлексов, обратных гнязей_ы_синергий. Но тем не менее она не исчер¬ пывает, а, возможно, только подготавливает и обеспечивает реали¬ зации истинных акций. Этот аспект можно проследить на примере синергий. Например, речь и письмо реализуются на базе автоматизмов или синергий произнесения фонем, слов и написания букв, благодаря кото¬ рым мы способны реализовать содержательные акции построения фраз, не замечая промежуточной работы нейронных вычислительных машин. Современный прогресс ЭВМ обязан внедрению принципа синергий посредством так называемых операционных систем, представляющих собой скрытую часть программного обеспечения компьютера, упро¬ щающую работу пользователя, но, конечно, не самой машины. Обратное сравнение здесь тоже полезно. Оно позволяет и конкре¬ тизировать, и расширить функциональный статус синергий — это в об¬ щем случае не столько ’’словарь”, сколько операционная система ней¬ ронной вычислительной машины, так как операционная система имеет широкий сервисный смысл, включая словари, меню, часы, программы трансляции, стыковки с периферией и т.д. Однако как же быть с акциями, как их характеризовать? Н.А. Бернштейн пришел к общим положениям физиологии активнос¬ ти в результате анализа задач построения движений [24]. Не указывает ли методология Н.А. Бернштейна также и путь теоретического освоения содержания АКЦИИ и АКТИВНОСТИ? Понятие ’’построения” как раз и является здесь тем необходимым и ключевым, которое и следует, согласно А.А. Ляпунову, объявить характеристическим свойством АКЦИИ в широком смысле. Данный подход ставит в центр нашего внимания в первую очередь конструктивную, новаторскую деятельность, творчество. Но уже пред¬ принимались попытки интерпретировать такую деятельность старыми идеологическими средствами, в частности на основе концепции сто¬ хастического детерминизма [29]. Поэтому следует идти дальше и по¬ нять источник различий РЕАКЦИЙ и АКЦИЙ в отношении задач пост¬ роения. С одной стороны, когда предпринимаются попытки ответить на воп¬ рос, что такое интеллект, используются примеры задач (см., нап¬ ример, монографию [35]), решение которых требует опре¬ деленной конструктивной сообразительности, связанной не столько с поиском и перебором подходящих комбинаций (такой вариант как раз и характерен для современных машинных реализаций интеллектуаль¬ ных задач), сколько с построением подходящего способа достижения цели с учетом исходных данных и возможных средств. С другой стороны, когда задача решена, тогда снимается самая глав¬ 104
ная проблема — проблема неизвестных альтернатив. Тогда можно ре¬ шение алгоритмизировать, запомнить, а последующие решения реали¬ зовать по принципу копирования эталона, т.е. алгоритма. Такой принцип, в частности, реализуют ’’плохие” ученики, списы¬ вая решения у ’’хороших”. Но так же ’’поступают” и ЭВМ, так как ’’хо¬ рошие” программисты берут на себя творческую работу создания прог¬ рамм, предоставляя вычислительной машине быть машиной и слепо следовать заданной последовательности команд и инструкций. Чем же в данном случае ’’хорошие” программы отличаются от ’’пло¬ хих”? Тем, что решают проблему преодоления альтернатив? Да, но аль¬ тернативы, иначе говоря, означают степени свободы. Значит, общая зада¬ ча построения суть АКЦИЯ преодоления избыточных степеней свободы, присущих условиям, методу решения и т.д. Кроме того, из связи АКЦИИ с задачей построения вытекает эврис¬ тическая идея. Эвристика: реакции — это действия, которые не требуют до¬ полнительных степеней свободы для реализации, а акции — действия, которые требуют свобод. Нетрудно видеть, что данное определение общей задачи построения соответствует по стилю определению, по Н.А. Бернштейну, задачи по¬ строения произвольного движения. Таким рефреном хочется подчерк¬ нуть те глубокие параллели, которые открываются при конструктивном взгляде на проблемы построения систем произвольной природы — от движений до интеллекта, — а может быть, и в более широком диапазоне строительных задач жизни — от генома до социальных задач. Ключевое слово кибернетики и биологии. Вообще говоря, невоз¬ можно адекватно понять конструктивный смысл синергий, управле¬ ния и, следовательно, жизни, если не опираться на понятие свобод, кото¬ рое в механике заменяется понятием степеней свободы. Видимо, такое словосочетание, представляюшее свободы в виде ’’сте¬ пеней”, вошло в научно-технический быт для подчеркивания существо¬ вания у машин и у физических процессов многих свобод изменчивости — по разным независимым характеристикам или степеням ’’податливости”. Действительно, если обратиться к энциклопедическому словарю [36], то в нем содержится лишь антропоморфная трактовка: СВОБОДА — способность человека действовать в соответствии со своими интересами и целями. Подобное разграничение "свобод” и ’’свободы” представляется уста¬ ревшим и неправильным, так как действия или акции человека облада¬ ют многими степенями свободы и в рамках одной целевой задачи, и тем более в принятиях многоцелевых решений. Целесообразнее унифициро¬ вать понятие свобод как обобщенной кибернетической категории и, конечно, физической. Именно такой унификации не хватает кибернетике и всей биологии. Огромную эвристическую ценность адекватного выбо¬ ра ключевого понятия в науке неоднократно подчеркивал еще А. Пуан¬ каре [2]. Особое внимание сменам языковых форм, ведущим к сменам научных парадигм, уделяет Т. Кун [37]. Сложилась парадоксальная ситуация. В кибернетике понятие сво¬ боды, либо обходится [38], либо играет подсобную роль [39]. Но можно ли 105
организовать управление некоторым объектом, если он не обладает не¬ обходимыми для реализации целевой задачи свободами? Очевидно, иет. А может ли управляющая система справиться с решением некоторой задачи, если она не обладает необходимой управленческой гибкостью, т.е. опять же не обладает достаточными степенями свободы? Тоже нет. Отсюда, казалось бы, однозначно следует простая прикладная ре¬ комендация, значение которой трудно переоценить. Эвристика: всякой организации управления должна предшест¬ вовать организация необходимых и достаточных свобод, в против¬ ном случае управление не может быть эффективным. Р. Эшби предложил другую версию этой эвристики — в форме закона необходимого разнообразия [39], т.е. подменил понятие степеней сво¬ боды понятием разнообразия. Но такая замена выглядит неконструк¬ тивной, ведь именно свободы служат источником разнообразия прояв¬ лений, основой изменчивости и управляемости. Управление как системная категория. Еще одна парадоксальная си¬ туация: кибернетика исходно формировалась на интуитивной основе, без явных попыток определения основных референтов. Н. Винер и его последователи отошли от центрального вопроса, перенеся центр вни¬ мания на обсуждение проблем передачи информации, и долгое время бессодержательное понятие информации служило как бы синонимом кибернетики. В силу этого и появились предложения смены названия на ’’информатику” и др. [38]. Подобное смещение референтов представ¬ ляется неадекватным. Возможно, разобщение проблем связи (инфор¬ матика) и управления (кибернетика) целесообразно, но в любом случае назрела необходимость в конструктивном решении центрального воп¬ роса. Если снова обратиться к энциклопедическому словарю [36], то на¬ ходим описательный вариант определения, посредством перечисления задач: УПРАВЛЕНИЕ — функция организованных систем различной при¬ роды, обеспечивающая сохранение их определенной структуры, под¬ держания режима деятельности, реализации их программ и целей. Но с точки зрения полноты этот список задач управления далеко не полный. Например, сохранение структуры — одна из задач управления, если при этом структура обладает свойствами изменчивости, но есть еще задача построения структуры машины, организма и др. То же самое можно отметить про режим, программы, цели. Конечно, метод перечислений полезен для начального очерчивания гра¬ ниц понятия: при достаточной полноте можно выявить общее содержа¬ ние частных проявлений, т.е. найти общий абстрактный признак. Элемент необходимой общности содержится в начальной части предыдущей дефиниции. Несомненно, управление — это функция, при¬ сущая организованным системам, но не менее существенно, что это организаторская функция. Следует только выяснить, что именно ор¬ ганизует управление в общем случае. Учитывая предшествующие об¬ суждения можно предложить следующее конструктивное абстракт¬ ное определение: 106
УПРАВЛЕНИЕ — целевая акция редукции избыточных свобод системной (структурной и/или функциональной) организации. В этом определении свободы или степени свободы играют роль эле¬ ментов управления как системной категории, а смысл редукции — в фор¬ мировании между независимыми характеристиками связей, в изменчи¬ вости которых материализуются свободы. При этом роль организато¬ ров связей, или редукторов свобод, могут выполнять программы, синергии или же регуляторы, фиксаторы и т.д. Здесь важно понимать, что управление есть не только функция некоторой управляющей системы, но само есть система с собственными базисными компонентами, пос¬ кольку общее определение системы включает минимум два множества компонент — множество элементов и множество связей элементов [4]. Для раскрытия существа управления в общем случае необходимо объективизировать степени свободы изучаемой системы и исследовать разнообразия виртуальной изменчивости, тогда ограничения раз¬ нообразия — инварианты — будут служить индикаторами связей, т.е. акций управления. Еще один принципиальный момент, связанный с пониманием сущ¬ ности управления. Конкретные системы могут воплощаться на разных материальных носителях — механических, электрических и др. Тогда форма воплощения определяет природу управляющих переменных, но как раз материальное разнообразие воплощений — одно из свидетельств нематериальной сущности управления. Этот аспект пока еще не понят достаточно широко, и он замаскировывается под, так сказать, мате¬ риальные представления, что, в частности, относится и к характерис¬ тике управления, данной А.А. Ляпуновым. С другой же стороны, вполне ясно, что сущность управления не просто в количественных различиях величин носителей (которые всегда материальны), а в том, что для уп¬ равления существенны значения в символьной значимости, именно как нематериальные семантические сущности. Чересчур бурная полемика прошлых лет сделала многих из нас неадекватно осторожными в проведении границы между ’’материей” и ’’идеей”. Но основной вопрос философии о первичности материи давно решен, тем не менее из этого постулата вовсе не следует материальность сознания. Более того, сознание направляется движением идей. Как раз управление и его атрибуты — алгоритмы и информация — яркие при¬ меры не материальных, а символьных, идеальных сущностей. Призна¬ ние этого не умаляет значения материализма, а открывает путь к адек¬ ватному пониманию сущности жизни в широком смысле. * * * Завершая изложенную выше сквозную тему, полезно сделать еще один шаг к обобщению понятия инварианта, отвечая на вопрос: что такое организация? Здесь тоже необходима смена точки зрения с далеко идущими следствиями. Проблема в том, что традиционная трактовка ’’организации” базируется на категориях ’’случайного” и ’’необходимо¬ го”. Кратко эту связь удобно выразить следующей семантической фор¬ мулой: {случайное, необходимое} -*■ организация. (55) 107
Именно эта формула лежит в основе концепции стохастического детерминизма, которая, в свою очередь, служит идеологической плат¬ формой современного дарвинизма (см., например: [29]), где роль пер¬ вой компоненты в соответствии (55) играют мутации, а роль второй — ес¬ тественный отбор. Казалось бы, эта концепция вполне гармонична и безупречна, она позволяет ’’все” объяснить, разве что, кроме некоторых’’пустяков”, ко¬ торые тоже можно попытаться объяснить, усовершенствуя синтетичес¬ кую теорию эволюции. Однако такой теоретический путь представляет¬ ся бесперспективным, так как он противоречит конструктивной сущ¬ ности биоорганизации. Действительно, вдумаемся в содержание концеп¬ ции стохастического детерминизма, немного синкопируя главные положения. Первый постулат, который не вполне явно, но принимает¬ ся, — это постулат несвободы, или, попросту говоря, постулат центра¬ лизованного рабства, например отражающий генетическую предопреде¬ ленность структуры и функций. Далее отсюда вроде бы естественно про¬ истекает идея второго постулата: только ’’случай” является основой эво¬ люционной изменчивости, а также нашего интеллектуального творчест¬ ва. При этом фенотипическая изменчивость сводится к адаптационному приспособленчеству, которое некоторые философы предлагают принять за главное положение ’’общей теории жизни” [40]. Если возражать эмоционально, то следовало бы в рифму с крылатыми словами известной песни ”Мы — кузнецы!”, сказать ”Мы — творцы!”. Конечно, рутинные процессы, закрепощающие и геном, и интеллект, составляют огромную часть жизнедеятельности, но все же они носят лишь вспомогательный, сервисный характер (что выше отмечалось на примере синергий), создавая фон для конструирования и проявления ’’свободы воли”. В своей деятельности человек стремится многими разными способами автономизировать и минимизировать рутину или ’’черную работу” не столько из-за природной лени или ради экономии, которая представляет собой самостоятельную задачу жизнеобеспечения, \ сколько потому, что наш мозг функционирует по конструктивным за- ! конам [41]. Не случайно созидательная, конструктивная, строительная деятельность представляется нам наиболее привлекательной и важной, независимо от сферы ее осуществления — в ’’маленьких хитростях” или в решениях больших проблем. Другое дело, как такие способности развиты, насколько высока культура и мастерство, совершенны на- выки (синергии) преодоления рутины и т.д. Естественность таких тенденций к акциям, к преодолению избыточ¬ ных свобод действия можно понять только с позиции принципа актив¬ ности как основного принципа Жизни, но невозможно — в рамках па¬ радигмы стохастического детерминизма. Мировоззрение стохастичес¬ кого детерминизма исторически закономерно, оно отражает описатель¬ ные методы прежней гносеологии, т.е. адекватно, так сказать, пара¬ дигме Наблюдателя: когда изменчивость рассматривается как первич¬ ная данность, существенной является только мера ее определенности или неопределенности. Кроме того, позиция Наблюдателя более естест¬ венна была физическому мировоззрению, т.е. воззрению на мир как на формы существования и движения материи. 108
Кибернетика принесла радикальное изменение в позиции биологи¬ ческого мировоззрения, способствуя переориентации научной методо¬ логии: все более актуальными становятся не проблемы форм существо¬ вания, а проблемы правил построения. Поэтому для понимания сущнос¬ ти биоорганизации становится необходимым переход с описательной точки зрения на конструктивную, с позиции Наблюдателя на позицию Конструктора. Но с такой позиции первичным становится не понятие изменчивости, а понятие избыточности свобод, которая и обусловливает возможности изменчивости направленной или ненаправленной, случай¬ ной или неслучайной, т.е. сам характер изменчивости остается сущест¬ венным, но служит лишь характеристикой способа реализации избыточ¬ ности. Понятно, что такое изменение позиции требует смены категорий, оп¬ ределяющих организацию. Обобщенную конструктивную версию орга¬ низации следует строить на понятиях ’’избыточность” и ’’инвариант” как абстрактной формы редукции избыточности, что можно выразить следующей семантической формулой: {избыточность, инварианты}-*- организация. (56) Такое понимание организации представляется более адекватным ее системной сущности. Нетрудно видеть, что форма (56) аналогична данному выше определению управления. Следует обратить внимание, что из конструктивных определений управления и организации вытекает остававшаяся до сих пор в тени новая проблема: необходимо создавать те свободы, те избыточные воз¬ можности, которые затем преодолеваются в акциях управления или в акциях самоорганизации. Как раз двигательные системы организмов — это один из нагляд¬ ных примеров предварительного, целевого и системного формирования большого числа избыточных свобод, в частности двигательных органов, которые затем используются развитым организмом как для выработки двигательных стереотипов — синергий, так и для освоения новых клас¬ сов движений, где существенную роль играют функциональные свободы. Пока еще невозможно охарактеризовать все разнообразие свобод, которое необходимо и присуще биосистемам разных уровней, но несом¬ ненно, что никакие мутации, адаптации и тем более эволюции были бы невозможны при отсутствии свобод биопостроений. Пора, видимо, за¬ думаться над наиболее загадочным фактором эволющш, а именно над программами формирования избыточности, ибо они создают первич¬ ную основу актов творения, осуществляемых программами редукции избыточности. Действительно, если управление есть акция преодоления (редукции) свобод, то что такое их творение? Если кибернетика есть наука об управлении, т.е. наука преодоле¬ ния свобод, то проблемами творения свобод, по-видимому, должна зани¬ маться новая наука — ’’либернетика”? 109
ЛИТЕРАТУРА 1. Об основаниях геометрии. М.: Гостехиздат, 1956. 527 с. 2. Пуанкаре А. О науке. М.: Наука, 1983. 559 с. 3. Зарипов Р.Х. Машинный поиск вариантов при моделировании творческого процес¬ са. М.: Наука, 1983. 232 с. 4. Смолянинов В.В. Структурные и функциональные инварианты распределенных биологических систем: Реф. Пущиио: Ин-т биофизики АН СССР, 1985. 43 с. 5. Вейль Г. Классические группы, их инварианты и представления. М.: Изд-во иностр. лит., 1947. 404 с. 6. Дьёдонне Ж., Керрол Дж., Мамфорд Д. Геометрическая теория инвариантов. М.: Мир, 1974. 280 с. 7.Дубровин Б.А., Новиков С.П., Фоменко А.Т. Современная геометрия. М.: Наука, 1986. 759 с. 8. Гельфанд И.М. Лекции по линейной алгебре. М.: Наука, 1971. 271 с. 9. Дьёдонне Ж. Линейная алгебра и элементарная геометрия. М.: Наука, 1972. 335 с. 10. Постников М.М. Аналитическая геометрия. М.: Наука, 1973. 751 с. 11. Четверухин Н.Ф. Проективная геометрия. М.: Просвещение, 1969. 368 с. 12. Яглом И.М. Принцип относительности Галилея и неевклидова геометрия. М.: Наука, 1969. 304 с. 13. Смолянинов В.В. Локомоторная теория относительности: Препр. М.: Ин-т пробл. передачи информации АН СССР, 1984. 75 с. 14. Эйнштейн А. Физика и реальность. М.: Наука, 1965. 360 с. 15. Принцип относительности. М.: Атомиздат, 1973. 330 с. 16. Мардер Л. Парадокс часов. М.: Мир, 1974. 223 с. 17. Логунов А.А. Лекции по теории относительности. М.: Изд-во МГУ, 1984. 221 с. 18. Паули В. Теория относительности. М.: Наука, 1983. 336 с. 19 Либшер Д.Э. Теория относительности с циркулем и линейкой. М.: Мир, 1980. 150 с. 20. Клейн Ф. Неевклидова геометрия. М.; Л.: ОНТИ, 1936. 294 с. 21. Бонди Г. Гипотезы и мифы в физической теории. М.: Мир, 1972. 104 с. 22. Философские проблемы современного естествознания. М.: Изд-во АН СССР. 1959. 664 с. 23. Марей Э. Механика животного организма. СПб.: Знание, 1875. 358 с. 24. Бернштейн. Н.А. Очерки по физиологии движений и физиологии активности. М.: Медицина, 1966. 350 с. 25. Белецкий В.В. Двуногая ходьба. М.:Наука, 1984. 286 с. 26. Неймарк Ю.И., Коган Н.Я., Савельев В. П. Динамические модели теории управле¬ ния. М.: Наука, 1985. 399 с. 27. Карпович А.Л., Смолянинов В.В. О связи кинематических характеристик ходьбы человека/ /Физиология человека. 1975. Т. 1. С. 167—175. 28. Карпович А.Л., Смолянинов В.В. Кинематические закономерности ходьбы чело¬ века/ /Биомеханика. Рига: АН ЛатвССР, 1975. Вып. N 13. С. 672—677. 29. Кибернетика живого. Биология и информация. М.: Наука, 1984. 140 с. (Киберне¬ тика — неограниченные возможности и возможные ограничения). 30. Винер Н. Кибернетика. М.: Сов. радио, 1968. 326 с. 31. Косса П. Кибернетика. М.: Изд-во иностр. лит., 1958. 122 с. 32. Бонгард М.М. Проблема узнаваиия. М.: Наука, 1967. 320 с. 33. Модели структурно-функциональной организации некоторых биологических сис¬ тем. М.: Наука, 1966. 323 с. 34. Волькенштейн М.В. Общая биофизика. М.: Наука, 1978. 590 с. 35. Эндрю А. Искусственный интеллект. М.: Мир, 1985. 264 с. 36. Энциклопедический словарь: М.: Сов. энциклопедия, 1983. 1600 с. 37. Кун Т. Структура научных революций. М.: Прогресс, 1976. 378 с. 38. Джордж Ф. Основы кибернетики. М.: Радио и связь, 1984. 272 с. 39. Эшби Р. Введение в кибернетику. М.: Изд-во ииостр. лит., 1959. 230 с. 40. Югай Г.А. Общая теория жизни. М.: Мысль, 1985. 254 с. 41. Доналдсон М. Мыслительная деятельность детей. М.: Педагогика, 1985. 191 с. 110
I УДК 519.95 ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ: ЭЛЕМЕНТЫ И СТРУКТУРЫ Е.Н. Соколов Под интеллектом следует понимать внутреннее преобразование отображения ситуации, которое ведет к достижению поставленной цели. Искусственный интеллект—это реализация такого преобразования искусственной системой. В настоящее время сложились два подхода к решению проблемы искусственного интеллекта [1]. Большинство специалистов считают, что при создании искусственного интеллекта нет оснований следовать за нейронной организацией, лежащей в основе интеллектуальных функ¬ ций. Для этого достаточно создавать программы работы компьюте¬ ра, совпадающие с интеллектуальными функциями лишь по конечному результату. Меньшинство исследователей считают, что наиболее перс¬ пективным путем построения искусственного интеллекта является ими¬ тация нейронных структур, реализующих интеллектуальные функции. В настоящей работе рассматривается синтетический подход к искусст¬ венному интеллекту, основанный на данных психофизиологии [2]. Пред¬ лагаемый путь вытекает из общей стратегии психофизиологического исследования. Психофизиологическое исследование начинается с изучения общих закономерностей перекодирования внешних сигналов в систему вер¬ бальных реакций человека [3]. Однако на этом психофизиологическое исследование не останавливается, а идет дальше к выяснению вклада отдельных нейронов в это преобразование. Объединение данных, полу¬ ченных на макро- и микроуровнях, достигается построением модели исследуемой функции. Модель строится из нейроноподобных элементов (формальных нейронов), обладающих основными информацион¬ ными характеристиками реальных нейронов. При этом вся модель как целое воспроизводит закономерности преобразования сигналов на макроуровне. Вместе с тем каждый нейроноподобный элемент модели воспроизводит характеристику одного из реальных нейронов исследу¬ емой системы [4]. Модель как совокупность систем определенным об¬ разом связанных между собой нейроноподобных элементов образует структуру, реализующую функцию искусственного интеллекта. Прос¬ тейшей интеллектуальной функцией является операция классификации сигналов. о Психофизиологическое исследование классификации цветовых сиг¬ налов, знаковых конфигураций и стереоскопических изображений поз¬ волило предложить обобщенную структуру из формальных нейронов, реализующую функцию классификации. При предъявлении двух сигналов человек не только может обнару¬ жить различие между ними, но и оценить его в баллах. Матрица балль¬ ных оценок субъективных различий отвечает аксиомам метрики, что позволяет представить все множество сигналов в пространстве, которое принято называть перцептивным пространством. Геометрические рас¬ стояния между точками, представляющими воспринимаемые сигналы 111
в перцептивном пространстве, в высшей степени коррелируют с исход¬ ными субъективными различиями между сигналами. При этом точки, представляющие сигналы, размещаются в перцептивном пространстве неравномерно, образуя гиперсферу. Если оси перцептивного прост¬ ранства ориентировать так, чтобы сигналы, сохраняющие свои перцеп¬ тивные характеристики в процессе адаптации, лежали на базисных осях, то координаты сигналов в перцептивном пространстве получают нейро¬ физиологическую интерпретацию как возбуждение независимых ней¬ ронных каналов. Используя процедуру балльных оценок в отношении различий между терминами, обозначающими сигналы, можно построить семантическое пространство [5,6], в котором термины, обозначающие сигналы, предс¬ тавлены точками так, что геометрические расстояния между ними про¬ порциональны субъективным различиям между значениями терминов. Семантическое пространство, представляя собой гиперсферу, изомор¬ фно перцептивному пространству. Если при ориентации его осей использовать термины, обозначающие реперные сигналы перцептивного пространства, то отображение сигналов в перцептивном пространстве удается согласовать с обозначающими их терминами семантического пространства. Отдельным точкам — терминам — соответствуют определенные области. На нейронном уровне базис перцептивного пространства представ¬ лен реальными нейронами, образующими независимые каналы. Внеш¬ ний сигнал кодируется вектором возбуждения, компонентами которого являются возбуждения независимых нейронных каналов. Эти нейронные каналы связаны с рецепторами так, что при всех изменениях сигнала векторы возбуждения равны по модулю. Нейроны, образующие базис, предшествуют слою нейронов-детекторов и поэтому называются пре- детекторами. Вектор возбуждения, образованный реакциями предетекторов, пос¬ тупает по множеству параллельных каналов на нейроны-детекторы. Синаптические контакты каждого нейрона-детектора образуют вектор синаптических связей. Все нейроны-детекторы обладают равными по модулю векторами связей. Каждый нейрон-детектор, суммируя попарные произведения возбуждений на коэффициенты синаптических связей, реализует операцию скалярного произведения. Тот нейрон-детектор, вектор связей которого коллинеарен поступившему вектору возбужде¬ ний, ответит на действие внешнего сигнала максимальной реакцией. Нейроны-детекторы, характеризующиеся’равными по модулю векто¬ рами связей, образуют гиперсферу в пространстве, размерность ко¬ торого равна числу независимых каналов, сходящихся на каждом из нейронов-дете кторов. Место максимального возбужденного нейрона на гиперсфере, об¬ разованной множеством детекторов, является кодовым обозначением сигнала. При изменении входного сигнала меняется композиция ком¬ понентов вектора возбуждения на уровне предекторов, и максимум воз¬ буждения, перемещаясь по гиперсфере, отображает изменение сигнала. Если отображение сигнала достигается с помощью нейронов- детекторов, то операция классификации сигналов реализуется при учас¬ 112
тии следующего слоя нервных элементов — командных нейронов. Командный нейрон запуская специфическую реакцию, реализует оп¬ ределенную категорию ответа. На каждый командный нейрон посту¬ пают сигналы от всех нейронов-детекторов. При этом связи между нейронами-детекторами и командными нейронами являются пластич¬ ными. Те связи, которые были задействованы непосредственно перед разрядом командного нейрона, усиливаются. Те связи, активация кото¬ рых не сопровождается разрядом нейрона, ослабевают. Таким образом, в ходе обучения на каждом командном нейроне формируется матрица разных по своей эффективности синаптических контактов, реакция командного нейрона определяется скалярным произведением вектора возбуждения, компонентами которого являются реакции нейронов-де¬ текторов, и его вектора связей. В результате командный нейрон отвечает избирательно только на те сигналы, которые возбуждают нейро¬ ны-детекторы, эффективно связанные с данным командным ней¬ роном. Совокупность командных нейронов, избирательно связанных с определенными участками перцептивного пространства, об¬ разует семантическое пространство. Операция классифика¬ ции сигналов основана на установлении соответствия определенных областей перцептивного пространства определенным точкам семанти¬ ческого пространства. Классификация сигналов, являясь функцией искусственного интеллекта, может быть реализована путем параллель¬ ной обработки информации в сетях, построенных из нейроноподобных элементов, кодирующих сигналы номером канала по принципу мече¬ ной линии. Примером классификации сигналов как функции искусственного интеллекта может служить операция категоризации цветных объектов [7—8]. Рассмотрим структурную организацию классификатора цветов. На входе системы стоят аналоги трех типов колбочек, соответствен¬ но чувствительных к коротковолновым, средневолновым и длинновол¬ новым излучениям видимой части спектра. Реакция на выходе колбочки пропорциональна логарифму интенсивности света. Линейные комби¬ нации возбуждений колбочек образуют три типа фотопических гори¬ зонтальных клеток (L, Ro и BY), реакции которых при действии опреде¬ ленного излучения на колбочки составляют компоненты вектора воз¬ буждения, кодирующего цвет стимула в ортогональной системе коорди¬ нат. Модуль вектора возбуждения на уровне горизонтальных клеток характеризует яркость стимула. Направление этого вектора возбуж¬ дения определяет цвет стимула. Равноярким цветам соответствуют равные по модулю вектора возбуждения. Это означает, что все множество равноярких цветов размещается на поверхности сферы в трехмерном пространстве. На следующем уровне цвета разной яркости кодируются на гиперсфере в черырехмерном пространстве. На уровне биполярных клеток формируется четырехкомпонентный вектор постоянной длины пу¬ тем вычитания сигналов горизонтальных клеток из спонтанно активного в темноте нейрона D. Кроме того, клетки Ran BY трансформируются соответственно в /?+а+, ТГсГ, FtY~ и B~Y+. Это обеспечивает передачу тормозной фазы реакции оппонентных клеток Ra и BY по возбужде¬
ниям отдельных каналов. В случае, если данный участок сетчатки при освещении окружен индуцирующим полем большей яркости, сигнал яркости от нейрона Wh индуцирующего поля приводит к Возбуждению нейрона В1. Таким образом локальный участок сетчатки представлен семью каналами, из которых каждый раз только четыре возбуждаются в зависимости от действующего излучения. Этот четырехкомпонентный вектор возбуждения постоянной длины действует параллельно на набор детекторов, каждый из которых имеет четыре синаптических контакта, образующих вектор синаптических связей. Каждый детектор обладает своим уникальным набором синаптичес¬ ких контактов и характеризуется специфическим для него вектором 'связей. Векторы связей нейронов-детекторов равны по модулю. Ней- рон-дётёктор цвета суммирует попарные произведения поступающих возбуждений на веса синаптических связей. Формально реакция та¬ кого нейрона-детектора равна скалярному произведению вектора возбуждений и вектора синаптических связей. Поскольку все векторы возбуждения предетекторов и все векторы связей детекторов по моду¬ лю равны между собой, их скалярные произведения зависят только от косинуса угла между ними. Тот цветовой детектор, вектор связей которого окажется коллинеарным вектору возбуждения, вызванному в предетекторах действующим излучением, ответит максимальной реакцией. Этот максимально возбужденный детектор и Является ко¬ довым обозначением цвета. При изменении действующего на глаз излучения меняется вектор возбуждения и максимум реакции перемещается с одного На другой. Поскольку все детекторы характеризуются равными по длине четы¬ рехкомпонентными векторами связей, они лежат на поверхности гиперсферы в четырехмерном евклидовом пространстве. Перемещение максимума возбуждения с одного детектора на другой при изменении излучения эквивалентно движению точки по поверхности гиперсферы в четырехмерном пространстве. Субъективные различия между цветами измеряются как евклидовы расстояния между детекторами, представ¬ ляющими цвета, на гиперсфере. Поэтому если мы знаем матрицу субъективных различий между цветами, то по ней можно найти коорди¬ наты точек, представляющих эти цвета. Вместе с тем если известны реакции предетекторов, то по ним можно найти эквиваленты субъек¬ тивных различий, вычисляя евклидовы расстояния между Концами век¬ торов возбуждения, кодирующих сравниваемые стимулы. Отнесение цвета к определенной категории, завершающееся на¬ зыванием цвета, определяется связями детекторов цвета с команд¬ ными нейронами речевых реакций называния цвета. Связи детекторов цвета с командными нейронами называния цвета определяются обуче¬ нием. Потенциально каждый командный нейрон речевой реакции может быть связан со всеми детекторами цвета. Под влиянием обучения командные нейроны речевых реакций, участвующие в назывании цвета, образуют эффективные связи только с определенными детекторами. Множество детекторов, подключенных к данному командному нейрону речевой реакции, образует ее рецептивное поле. Возбуждения нейро¬ нов-детекторов цвета образуют вектор возбуждения, который парал¬ 114
лельно поступает на целый набор командных нейронов цветовых назва¬ ний. Синаптические связи нейронов-детекторов на данном командном нейроне образуют его вектор синаптических связей. Реакция команд¬ ного нейрона определяется скалярным произведением вектора возбуж¬ дения и вектора синаптических связей. Отнесение цвета к определенной категории и генерация названия цвета зависит от того, в каком командном нейроне будет наибольшее возбуж¬ дение. Совокупность командных нейронов речевых реакций цветовых названий образует семантическое цветовое пространство, которое изоморфно перцептивному цветовому пространству. Отдельные цвето¬ вые термины ’’вырезают” в перцептивном цветовом пространстве области, представленные цветовыми детекторами, связанными с ко¬ мандными нейронами, генерирующими эти термины [8]. Различия между перцептивным и семантическим цветовым простран¬ ством демонстрируют клинические наблюдения над нарушениями цве¬ тового зрения при локальных поражениях затылочной области мозга. Было установлено существование трех типов нарушений: выпадение восприятия отдельных цветов при сохранности четырех¬ мерной структуры цветового перцептивного пространства и функции цветоназывания, что объясняется нарушением селективных детек¬ торов цвета; выпадение отдельных групп цветов иногда с редукцией размерности цветового перцептивного пространства при сохраненной функции цветоназывания; нарушение функции цветоназывания при полностью сохранном цве¬ товом перцептивном пространстве, измеренном не по речевым, а по двигательным реакциям, что связано с нарушением связей между де¬ текторами и командными нейронами речевых реакций. Рассмотренная схема классификации цветовых сигналов не со¬ держит детального описания механизмов управления движением ар¬ тикулирующих органов. Вместе с тем важнейшей функцией искус¬ ственного интеллекта является целенаправленное движение. Анализ нейронных механизмов управления саккадическими движениями глаз [3] позволяет представить общую схему целенаправленных движений. Саккадические движения глаз подразделяются на непроизвольные в виде переноса взора на новый неожиданный раздражитель, появив¬ шийся в поле зрения, и произвольные саккады в виде переноса взора с одного объекта на другой при осмотре зрительной сцены. Непроизвольные и произвольные саккады контролируются независи¬ мыми параллельными каналами. Непроизвольные саккады реализуются^ ретинотектальным механизмом. Произвольные саккады — ретино¬ кортикальными структурами. ~ Рассмотрим канал управления непроизвольными саккадами. Сет¬ чатка проецируется на поверхность переднего двухолмия по прин¬ ципу ретинотопической проекции. Нейроны верхних слоев перед¬ него двухолмия, обладая локальными рецептивными полями, яв¬ ляются детекторами элементарных событий. Каждая область сет¬ чатки представлена в переднем двухолмии колонкой нейронов с рецептивными полями, размер которых увеличивается с глубиной. 115
К мономодальным нейронам в глубоких слоях переднего двухолмия присоединяются полимодальные нейроны, отвечающие на тактильные и звуковые раздражения. Наконец, в глубине колонки появляются нейроны, разряжающиеся только непосредственно перед началом саккады, но не любой, а только такой, которая перемещает центр сетчатки на объект, попавший на участок сетчатки, представленный данной колонкой нейронов. Нейрон, специфически связанный с саккадой фиксированной длины и направления, является командным нейроном. Это доказывается тем, что электрическое раздражение, подаваемое через микроэлек¬ трод, который использовался при регистрации активности командного нейрона, приводит к возникновению именно такой саккады, которая предварялась разрядом этого нейрона. При длительной электрической стимуляции командного нейрона возникает лестница саккады — по¬ следовательность саккадических скачков постоянной амплитуды и направления, разделенных участками удержания глаз в каждом до¬ стигнутом положении. Лестница саккад продолжается до тех пор, пока глаза не дойдут до крайнего положения в орбитах, после чего следует центрирующая саккада и глаза возвращаются в централь¬ ное положение. При раздражении разных точек глубоких слоев переднего двухолмия возникают саккады разной амплитуды и направ¬ ления. Во всех случаях амплитуда и направление саккады опре¬ деляются расположением рецептивного поля той колонки нейронов, к которой он принадлежит относительно центра сетчатки. Можно сказать, что если поверхностные слои переднего двухолмия образуют карту сетчатки, то глубокие его слои образуют карту моторных команд, обеспечивающих перенос центра сетчатки на объект, появив¬ шийся в рецептивном поле данной колонки нейронов. Каким образом разряд специализированного командного ней¬ рона превращается в саккаду фиксированной амплитуды и направления? Для объяснения этого эффекта следует учесть следующий слой командных нейронов. Особенностью вторичных командных нейронов является то, что в них разряд одиночного первичного командного нейрона превращается в разряд двух фазических нейронов. Воз¬ буждение одного нейрона пропорционально горизонтальной состав¬ ляющей саккады, а возбуждение другого — ее вертикальной составля¬ ющей. Таким образом, возбуждение первичного командного ней¬ рона из скалярной величины превращается в вектор возбуждения, определяющий амплитуду и направление последующей саккады. Эта трансформация возбуждения командного нейрона в вектор возбуж¬ дения зависит от коэффициентов синаптических связей первичного командного нейрона с вторичными командными нейронами горизон¬ тальной и вертикальной составляющих саккады, которые локали¬ зованы в ретикулярной формации моста. Управление движением каждого глаза реализуется шестью мыш¬ цами. Сигналы горизонтального и вертикального нейрона посту¬ пают на мотонейроны. Управляющие этими мышцами мотонейроны, обладая разными порогами, вовлекаются в зависимости от ампли- rv ты поступающего на них сигнала. Число вовлеченных мото¬ lit
нейронов тем больше, чем больше амплитуда саккады. При дости¬ жении цели глаза удерживаются в достигнутом положении. Фик¬ сация глаз в достигнутой точке определяется двумя механизмами. Первый реализуется специальным нейроном—генератором пауз, кото¬ рый блокирует фазические нейроны горизонтальной и вертикальной составляющих саккады. Тем самым к мотонейронам глазных мышц перестают поступать команды на смену положения глаз. Удержа¬ ние глаз в достигнутом положении реализуется вторым механиз¬ мом — тоническими нейронами горизонтальной и вертикальной составляющих, которые управляются тоническими командными ней¬ ронами, получающими возбуждение от детекторов положения взора. В течение всего времени фиксации нейроны—генераторы пауз не¬ прерывно разряжаются, препятствуя приходу к мотонейронам сигналов по фазическому каналу управления движением глаз. Роль нейронов, генерирующих паузы и локализованных вблизи ядра отводящего нерва, состоит в остановке движения глаз. Это демонстрируется электрическим раздражением этих нейронов через подведенный к ним микроэлектрод. Разряд, вызванный в молчащем во время испол¬ нения саккады нейроне, ’’замораживает” глаза в точке, достигну¬ той к моменту раздражения. Саккадическое движение глаз, вызванное световым раздражителем, характеризуется привыканием, развивающимся по мере повторения применения сигнала. Процесс привыкания нельзя отнести к команд¬ ному нейрону, поскольку прямое электрическое раздражение вызывает неугасающие саккады. Анализ электрической активности мозга по¬ казывает, что угасание саккадического движения на световой стимул связано с угасанием генерализованной активности, вызванной возбуж¬ дением ретикулярной системы ствола мозга. Особенностью привыкания саккадических движений глаз является его селективность в отношении параметров сигнала: положение в поле зрения, интенсивности, размера, цвета. Поскольку на уровне переднего двухолмия эти параметры сигнала не выделяются в меха¬ низме угасания, приходиться учитывать более высокий уровень анализа сигнала. ^ Изучение нейронов гиппокампа показало, что их реакции иа сенсорные раздражения угасают селективно относительно параметров сигнала так, что они отвечают только на новые раздражители. Сигнал новизны, генерируемый нейронами гиппокампа, вызывает . реакцию активации ретикулярной формации ствола мозга. Можно предположить, что на командном нейроне саккадических движений глаз переднего двухолмия сходятся два сигнала: сигнал от ло¬ кальных детекторов положения стимула на сетчатке, поступающий от нейронов верхних слоев переднего двухолмия, и активация, запускаемая сигналом новизны нейронов гиппокампа. Но мере повторения стимула вклад сигнала новизны умень¬ шается, активация ослабевает и локальный детектор переднего двухол¬ мия уже не может возбудить командный нейрон саккадического движения глаз. Если световое раздражение изменяет свое положение -_в поле зрения (интенсивность, размер или цвет), возникающий 117
сигнал новизны приводит к развитию активации, складывающейся с ^возбуждением локального детектора и возбуждающей командный нейрон, реализующий саккаду. Следует подчеркнуть, что селектив¬ ное угасание реакций гиппокампальных нейронов определяется от¬ ключением от них входов кортикальных детекторов. Таким образом, селективность угасания саккад определяется угасанием корковых структур в анализе того сигнала, который запускает саккаду. Произвольные саккады в виде переноса взора с одной точки зрительной сцены на другую реализуются параллельным каналом с участием командных нейронов лобных отделов коры головного мозга [10, 11]. Особенностью произвольных саккад является то, что в их генерации участвуют нейроны константного экрана. Кон¬ стантный экран образован нейронами теменной коры, учитывающими сигналы относительно положения глаз в орбитах. При переносе взора с одной точки на другую вся зрительная сцена смещается относительно сетчатки, но остается неподвижной на константном экране. Рассмотрим простейшую зрительную сцену, состоящую из нескольких точек одинаковой интенсивности. Пусть глаза фикси¬ руют одну из этих точек. Все остальные точки, равные по интен¬ сивности, не имеют преимуществ в запуске саккады. Приоритет та или иная точка на константном экране приобретает в резуль¬ тате ее селективной активности, которая осуществляется по меха¬ низму временной связи. Произвольная саккада реализуется набором первичных команд¬ ных нейронов лобной коры, за каждым из которых ’’закреплена” определенная саккада за счет фиксированных связей с двумя вто¬ ричными командными нейронами, ответственными за вертикальную и горизонтальную составляющие саккады. Эти фазические премо- торные нейроны являются общими для ретинотектальных и ре¬ тинокортикальных саккад. Особенностью первичных командных ней¬ ронов лобной коры является то, что все лобные детекторы кон¬ стантного экрана потенциально подключены ко всем первичным командным нейронам. Выбор связей между локальными детекто¬ рами константного экрана и первичными командными нейронами лобной коры происходит при участии вторичных селективных де¬ текторов положения линии взора, которые дают аксоны, образующие синапсы на синапсах, связывающих локальные детекторы константного экрана с первичными командными нейронами лобной коры. В зависимости от того, какой детектор линии взора возбужден, происходит соответствующая активация синапсов детекторов кон¬ стантного экрана на командных нейронах. В результате командные нейроны подключаются к элементам константного экрана так, что точка, фиксируемая на константном экране, становится центром от¬ счета саккад. Теперь точка, активированная в качестве цели произ¬ вольной саккады, возбуждает такой командный нейрон, который обеспечивает перенос взора на эту целевую точку. Одновременно вся зрительная сцена смещается по сетчатке и зрительной коре, но остается неподвижной относительно константного экрана в теменной коре. В результате смещается линия взора на цель, связи нейронов 118
константного экрана с первичными командными нейронами опять перестраиваются так, что отсчет следующей саккады начинается опять от фиксируемой точки. Удержание фиксируемой точки происхо¬ дит под влиянием селективных детекторов линии взора, связанных с тоническими командными нейронами, удерживающими глаза в достиг¬ нутом положении посредством тонических нейронов вертикальной и горизонтальной составляющих. Зачем нужен константный экран в управлении произвольными саккадами? Дело в том, что на тектальном аконстантном экране все точки даны в координатах сетчатки и при движении глаз их координаты меняются. Поэтому различить точки по их положению в объективном пространстве невозможно. В результате и систе¬ матический обзор зрительной сцены с использованием тектального аконстантного экрана оказывается невозможным. Константный экран, позволяя производить систематический обзор сцены, кроме того, связан с мнемическим экраном, содержание ко¬ торого пополняется в ходе обзора сцены. На мнемическом экране Строится изображение сцены, накопленное за определенный период времени. Используя изображение, накопленное на мнемическом экране, можно организовать целенаправленные движения глаз в полной темноте, а также в отношении объектов воображаемой сцены. Мнемический экран подсоединен к командным нейронам управления глаз парал¬ лельно актуальному константному экрану по тому же принципу. Выбор связей между элементами мнемического экрана и командными нейронами реализуется от детекторов положения глаз. Выше были рассмотрены нейронные механизмы классификации сигналов и управления движением в пространстве. В действитель¬ ности программа классификации сигналов и программа управления целенаправленным движением образуют единую систему, позволяю¬ щую организовать движение в соответствии с результатами анализа свойств объектов, образующих зрительную сцену. Параллельная переработка информации в этой интеллектуальной системе управ¬ ления движениями открывает возможность для ее эффективного ис¬ пользования в робототехнике. ЛИТЕРАТУРА 1. Эндрю А. Искусственный интеллект. М.: Мир, 1985. 264 с. 2. Соколов Е.Н. Нейронные механизмы памяти и обучения. М.: Наука, 1981. 161 с. 3. Соколов Е.Н. Нейронные механизмы саккадических движений глаз // Вопр. психологии. 1980. Т. 12. С. 62—77. 4. Соколов Е.Н., Измайлов Ч.А. Цветовое зрение. М.: Изд-во МГУ, 1984. 175 с. 5. Клацки Р. Память человека: Структуры и процессы. М.: Мир, 1978. 251 с. 6. Норман Д. Память и научение. М.: Мир, 1985. 185 с. 7. Максимов В.В. Трансформация цвета при изменении освещения. М.: Наука, 1984. 160 с. 8.Фрумкина P.M. Цвет, смысл, сходство: Аспекты психолингвистического ана¬ лиза. М.: Наука, 1984. 175 с. 9. Дудкин К.Н. Зрительное восприятие и память. Л.: Наука, 1985. 205 с. Ю.Батуев А. С. Нейрофизиология коры головного мозга: Модульный принцип организации: Курс лекций. Л.: Изд-во ЛГУ, 1984. 214 с. II. Шевелев И. А. Нейроны зрительной коры: Адаптивность и динамика рецеп¬ тивных полей. М.: Наука, 1984. 232 с. 119
Раздел 2 МЫШЛЕНИЕ И ЯЗЫК УДК 15.153 ПСИХОЛОГИЧЕСКИЕ ПРОБЛЕМЫ ИЗУЧЕНИЯ ИНТЕЛЛЕКТА Б. М. Величковский, М.С. Капица "... в неизмеримом большинстве случаев характер психического содержания на 999/1000 дается воспитанием в обширном смысле слова и только на 1/1000 зависит от индивидуальности. Этим я не хочу, конечно, сказать, что из дурака можно сделать умного..." И. М. Сеченов Слово ’’интеллект” является переводом древнегреческого понятия ”ум”. В современные языки оно перешло из латыни в XIV в., постепенно став синонимом способности понимать. Особенностью русской лексики является сравнительно более частое использование производного от него понятия ’’интеллигент” (неологизм писателя П.Д. Боборыкина). Поэтому обыденное понимание этого слова в русском языке включает в себя также нравственную характеристику, отсутствующую или не выраженную в других европейских языках. Этнолингвистические исследования свидетельствуют о том, что в разных языках мира существует множество понятий, указывающих на различные проявления умственных способностей. Несмотря на разнообразие накопленных здесь данных, можно считать, что комп¬ лекс представлений о разумном поведении является инвариантным для представителей разных культур. Вместе с частично синонимичными понятиями ’’рассудок”, ”ум”, ’’разум”, ’’познание” понятие ’’интеллект” относится к числу цент¬ ральных категорий домарксистской философии. В учениях Платона и Аристотеля этим понятием обозначалось то, что выражает ра¬ зумное индивидуальное начало. На разных этапах развития фило¬ софской мысли интеллект понимался то как высшая, то как низшая познавательная способность. В последнем случае ему как природной способности противопоставлялось божественное провидение, при¬ нимающее форму чувственно-эмоционального экстаза. Единство аф¬ фекта и интеллекта при ведущей роли интеллекта подчеркивалось в рационалистической концепции Б. Спинозы. Для классической не¬ мецкой философии характерно разведение интеллекта и разума. 120
Интеллект считался при этом аналитико-рассудочной формой поз¬ нания, уступающей по своим возможностям диалектическому пости¬ жению всеобщего посредством разума. В трудах французских мате¬ риалистов XVIII в. в соответствующем контексте используются понятия ’’мышление”, ’’познание”. Потеряв философское значение, ’’интеллект” продолжает оста¬ ваться важной общенаучной категорией. В специальной литературе обсуждаются интеллектуальные ресурсы отдельных групп населения и интеллектуальные потребности общества в целом. Одним из символов происходящей сейчас научно-технической революции яв¬ ляется понятие ’’искусственный интеллект”, используемое для обозна¬ чения технических систем, способных к адаптивному поведению и решению задач, в том числе таких, которые психолог отнес бы к сфере восприятия, организации движений, поиска в памяти, понимания текста, а не мышления в узком смысле слова. Постоянно возрастает и интерес к проблематике естественного интеллекта. Не будет преувеличением сказать, что абсолютное боль¬ шинство эмпирических исследований в психологии имеет отношение к изучению познавательной сферы личности. Накопленный материал, однако, еще не получил достаточно глубокого теоретического объяс¬ нения. Одним из симптомов этого служит тот факт, что в настоящее время существует свыше 60 определений интеллекта [1]. Даже для простой классификации высказанных точек зрения потребовался бы факторный или кластерный анализ. В рамках дан¬ ной статьи ограничимся анализом наиболее общих психологических подходов к изучению интеллекта. ПСИХОМЕТРИЧЕСКИЙ ИНТЕЛЛЕКТ По сегодняшний день ’’интеллект” чаще всего трактуется как понятие дифференциальной психологии. В основе данного подхода лежит интуитивное различие прототипов ’’умный — глупый”, ’’яр¬ кий — посредственный”, ’’способный — неспособный”. В одной из своих работ Л.Б. Торндайк писал, что интеллект — это то ка¬ чество психики (мозга или поведения), по отношению к кото¬ рому Аристотель, Платон, Фукидид и им подобные более всего отличались от афинских идиотов того времени [2]. Первые шкалы интеллекта были созданы под влиянием запросов общеобразова¬ тельной школы. Предметом оценки, естественно, стали те свойства личности, которые определяют успех в области школьного и, шире, академического образования. Однозначность даваемых тестами интеллекта количественных оценок настолько резко контрастировала с разноголосицей мнений о при¬ роде интеллекта, что выполнение тестовых заданий фактически стало его операциональным определением. Согласно классической формулировке Э. Боринга, интеллект — это то, что измеряется с помощью тестов интеллекта [3]. Однако явная циркулярность данного определения не могла устроить значительную часть иссле¬ 121
дователей. Попытки расширения диапазона измеряемых умственных способностей и прояснения содержания понятия "интеллект” при¬ вели к созданию многочисленных факторных моделей и соответ¬ ствующих им психометрических процедур. Такие распространенные методики, как Станфорда—Бине и шкала интеллекта для взрослых Векслера представляют собой по су¬ ществу батареи тестов, оценивающих множество познавательных структур и функций. К ним относятся знание лексикона родного языка, непосредственное запоминание, узнавание конфигураций, их пространственные трансформации и т.п. Коэффициент интеллекта (IQ — от англ. intelligence quotient) является взвешенным средним оценок, полученных по отдельным шкалам. Следовательно, итоговая оценка представляет собой статистиче¬ скую абстракцию и не характеризует какую-то определенную ког¬ нитивную способность. Тем не менее эта оценка достаточно стабильна и полезна в качестве предиктора будущего выполнения заданий того же типа. При соблюдении соответствующих требований, важ¬ нейшим из которых является стандартизация теста, корреляция между оценками IQ одного и того же индивида в возрасте 18 и 40 лет составляет примерно 0,70, что свидетельствует о хорошей надежности теста, независимо от того, что в действительности им измеряется. Хотя различные группы тестовых заданий многомерных шкал создавались для измерения разных познавательных функций, полу¬ чаемые с их помощью оценки почти всегда коррелируют друг с другом. Это говорит о том, что успешность выполнения зада¬ ний может быть детерминирована относительно небольшим числом базовых способностей. Природа их выявляется в психометрике с помощью факторного анализа. Современная психометрика трак¬ тует индивидуальные опенки в некотором задании как результат аддитивного вклада факторов, обеспечивающих решение всей бата¬ реи тестов. Так, если речь идет о нахождении аналогии между парами понятий, то задача попадает примерно между факто¬ рами вербального интеллекта и умозаключения. Получаемая не¬ которым индивидом оценка X аналитически описывается как сумма влияния вербального интеллекта V, способности к умозаключениям R и специфической для самой измерительной процедуры компо¬ ненты С: X = aV + bR + С, где а и Ь — весовые коэффициенты. Аналогичные выражения будут описывать результаты, полученные в других местах. Модель удобна, поскольку достижение индивида в Р тестовых испытаний описывается комбинацией К способностей, число которых значи¬ тельно меньше числа испытаний. Рассмотрение психометрических исследований требует упоминания теорий интеллекта, возникших на основе применения факторного анализа. Первой из них можно считать глобальную модель ин¬ теллекта, на базе которой возник ’’бинетариум” (шкала Бине— 122 Ml
Симона), и его последующие модификации [4]. Двухфакторная мо¬ дель Ч. Спирмена предполагает существование единого для всех тестов фактора общего интеллекта и группы специальных факто¬ ров [5]. В модели первичных факторов интеллекта, разработанной Л. Терстоуном, выделяются уже семь базовых способностей: ско¬ рость восприятия, счёт, легкость нахождения слова, вербальное по¬ нимание, пространственные отношения, память, индуктивное и де¬ дуктивное рассуждение [6]. Центральным для модели Р. Кеттела 'является различие кристаллизованного и текучего интеллекта [7]. Кристаллизованный интеллект состоит из шести факторов, напо¬ минающих первичные умственные способности модели Терстоуна. Эти способности формируются под влиянием окружения и теку¬ чего интеллекта, который понимается как врожденная, непосред¬ ственно связанная со свойствами нейрофизиологических процессов творческая сила. Перечисленные модели объединяет индуктивный способ построе¬ ния. Модель структуры интеллекта, предложенная Дж. Гилфор¬ дом [8], претендует на статус дедуктивной теории. Основой для иее послужила схема ’’стимул—организм—реакция”. Сочетание четырех типов стимульного материала ^фигуративный, символический, семан¬ тический, относящийся к социальному поведению), пяти типов внут¬ ренних операций (узнавание, запоминание, оценка, конвергентное мышление, дивергентное мышление) и шести типов поведенческих ответов (единицы, классы, отношения, системы, трансформации, импликации) задает 120 ортогональных факторов интеллекта1. Трудности, мешающие выбрать наиболее адекватную из длитель¬ ное время существующих факторных моделей, можно проиллюстри¬ ровать на примере фактора ’’вербальный интеллект”. По мнению большинства исследователей, его следует понимать как способность обращаться с культурно-релевантным, хорошо заученным материалом. Это определение близко определениям кристаллизованного и со¬ циального интеллекта. Совершенно ясно, что концептуально все три йонятия различны, но поскольку ’’культурно релевантный” почти всегда означает ’’вербальный” и "социальный”, развести их на основании корреляционных данных не представляется возможным. Есть ряд оснований для критики психометрического подхода. В силу статистического характера парадигмы результаты в зна¬ чительной мере определяются механизмом факторного йли другого вида многомерного анализа: в этот механизм можно ’’войти” без всяких представлений об интеллекте и личности, а ’’выйти” с некоторым подобием психологической концепции. Вместе с тем ма¬ тематическая проблема нахождения факторов недоопределена, пока не сделаны явные предположения об отношениях между ними. Клас¬ сической является проблема вращения: поскольку оси, получаемые 1 Интерес представляет, конечно, не сама эта априорная модель, а инициированное ею изучение "социального интеллекта” и "дивергентного мышления”, чаще назы¬ ваемого креативностью. Имеющиеся данные, в частности, свидетельствуют о низкой корреляции креативности с общим интеллектом, а с другой стороны — о связи социального интеллекта с вербальным интеллектом ряда традиционных тестов [9]. 123
в факторном анализе, допускают произвольное вращение, можно получить любое число наборов базовых способностей, каждый из которых будет навязывать свою содержательную интерпретацию. Исследователи обычно ищут статистически независимые факторы, иными словами, предполагается, что одни сочетания факторов встречаются в выборке не чаще, чем другие. Если конечной целью исследователей является создание своего рода ’’ментальной химии”, то именно это предположение не может не вызвать удивления, ведь оно аналогично допущению, что разные химические элементы с равной вероятностью вступают в соединение друг с другом. Серьезной является и другая проблема. Особенности интеллек¬ туальной активности глубоко индивидуальны: всякий человек, про которого вообще можно сказать, что он умен, умен на свой собственный лад. Факторный анализ выделяет гипотетическую струк¬ туру, которая характеризует типы решаемых задач, а не деятель¬ ность решающего задачу. Эти трудности преодолеваются в по¬ следнее время двумя различными способами. С одной стороны, разрабатываются методы компьютеризованной диагностики интел¬ лекта и индивидуальной стандартизации. Другое направление свя¬ зано с привнесением в психометрику идей и методов психосеман¬ тических исследований. С помощью многочисленных методик, позволяющих строить се¬ тевые и квазипространственные модели индивидуальной организации знания, операционализируется понятие ’’когнитивная сложность”. Последняя проявляется в использовании значительного числа осно¬ ваний для классификации понятий, событий, людей, несводимости этих оснований к одному только оценочному измерению ’’плохое— хорошее”. Не совсем понятно, впрочем, следует ли считать такую простоту признаком примитивности мышления. Быть может, не¬ большое число оснований классификации связано с использованием признаков высокого уровня абстракции, ведущим к выявлению ем¬ ких семантических категорий, тогда как множественная класси¬ фикация просто свидетельствует о неспособности выделить глав¬ ное? В историческом развитии человечества интеллектуальный про¬ гресс часто возникал в результате качественного упрощения ре¬ презентации знания. Примером когнитивно сложной, но громоздкой и неэффективной системы категорий может служить приписываемая древней энцикло¬ педии ’’Небесная империя благодетельных знаний” таксономия жи¬ вотного мира, в которой все животные делятся на: тех, которые принадлежат Императору; бальзамированных; дрессированных; сви¬ ней; бродячих собак; русалок и водяных; сказочных; дрожащих, как если бы они были бешеными; нарисованных очень тонкой верблюжей кисточкой; бесчисленных; тех, которые только что раз¬ били цветочную вазу; тех, которые включены в данную класси¬ фикацию; всех других; напоминающих мух с большого расстояния2. 2 См.: Борхес Х.Л. Проза разных лет. М.: Радуга. 1984. 319 с. 124
Любая модель когнитивной организации может получить оценку в качестве психометрически значимой только при ее сопоставлении с внешними критериями эффективности, причем в модели должны быть заданы не только формы репрезентации знания, но и осо¬ бенности стратегий метакогнитивного контроля. При таком по¬ нимании задачи дифференциальной диагностики интеллекта смыка¬ ются с целями общей психологии познавательных процессов. Соз¬ дание адекватных методических приемов измерения интеллекта по- прежнему может оставаться конечной целью исследователей, однако достижение этой цели обусловлено умением объяснить особен¬ ности макро- и микроструктуры индивидуальной познавательной активности. МАКРО- И МИКРОСТРУКТУРА ПОЗНАНИЯ Для повседневных жизненных ситуаций, в которых человек должен продемонстрировать свою разумность и интеллектуальные способ¬ ности, характерно то, что такие ситуации прежде всего частично знакомы субъекту и могут быть отнесены к определенной семан¬ тической области. Они никогда не разбиты на дискретные, никак не связанные друг с другом ’’задачи”, имеющие однозначные от¬ веты. Человеку самому приходится выделять проблемы, ставить и корректировать цели, находить средства их достижения, контро¬ лировать развитие событий (в особенности отдаленные послед¬ ствия своих действий и поступков), так как в реальных усло¬ виях решение одной проблемы практически всегда порождает нес¬ колько новых. Поскольку ситуация обладает собственной динамикой, контроль должен вестись с опережением событий, в режиме анти¬ ципации. Наконец, в жизни не бывает чисто когнитивных пррблем: их постановка и процессы решения включены в контекст социальны^ отношений, взаимодействуя с интересами других людей, социаль¬ ных групп и общества в целом. Иными словами, мир предстает перед мыслящим и действующим человеком как сложнейшая открытая система. В современной психологии познание рассматривается как кон¬ структивная активность, направленная на создание иерархии внутрен¬ них описаний (репрезентаций) окружения и их преобразование в соответствии с требованиями задачи. Ведущей претеоретической ме¬ тафорой таких исследований обычно является ’’компьютерная ме¬ тафора” — аналогия между познавательными процессами и пере¬ работкой информации в универсальном вычислительном устройстве. Накопленные в последние годы экспериментальные данные, однако, свидетельствуют о достаточно высокой специализации познавательных процессов в различных семантических областях. Так, память на слова, фразы или, скажем, абстрактные конфигурации принципиаль¬ но отличается от запоминания экологически естественного пер¬ цептивного материала. Реализующие такое запоминание процессы, в частности, не могут быть разделены на фазы ’’кратковременной” 125
I и ’’долговременной” памяти. Высокую степень специализации обна¬ руживают психолингвистические механизмы, а также процессы, обе¬ спечивающие разнообразные проявления ’’моторного интеллекта”. В основе таких специальных способностей и умений лежат отно¬ сительно автономные психофизиологические структуры. Координи¬ рованная работа подобных ’’модулей” может осуществляться только в режиме ’’коалиционного”, или "гетерархического”, управления [10]. j Примером гибкости познавательных стратегий служит подвижное I соотношение аналитико-вербальных и эмоционально-образных спосо- j | бов описания окружения и себя, предположительно связанное с \! балансом активности левого и правого полушарий. 'i Что дает знание микроструктуры процессов решения тех или иных познавательных задач для новой постановки традиционных проблем психологии интеллекта? Если стратегии, используемые при решении таких задач (тестовых заданий), содержат одинаковые операциональные компоненты, то результаты тестов, очевидно, должны коррелировать друг с другом. Этот вывод выходит за рамки психо¬ метрических констатаций, так как, зная микроструктуру операций, корреляции можно предсказать заранее. Так, скорость решения задач, основным звеном которых является доступ к внутреннему . лексикону (долговременной семантической памяти на слова), кор¬ релирует на уровне б,80. В то же время успешность верификации предложений, описывающих пространственные сцены, коррелирует лишь на уровне 0,30, хотя и относится обычно к маркерам вер¬ бального интеллекта. Причина такой низкой корреляции состоит в том, что задачи верификации могут решаться не только путем сравнения двух вербальных (пропозициональных) описаний ситуации, но и с по¬ мощью совершенно другой стратегии — преобразования самого предложения в квазипространственную ментальную модель и срав¬ нения ее с воспринимаемой сценой. Испытуемые произвольно кон¬ тролируют выбор различных форм репрезентации и способы работы (хотя с возрастом вероятность ’’визуального решения” снижается). Таким образом, экспериментальные исследования позволяют расши¬ фровать столь характерные для психометрики случаи слабой поло¬ жительной корреляции — одно и то же задание может оценивать разные процессы у разных индивидов и, более того, разные процес¬ сы у одного и того же индивида в различные моменты времени. Часто картина осложняется сменой не только стратегий, но и состоя¬ ний. Почти неизбежная для ситуации ’’проверки интеллекта” утрата внутреннего контроля вызывает или усиливает тревогу, снижает / пороги ориентировочной реакции, подготавливает общие поведен- j ческие ответы оборонительного типа, одновременно уменьшая эф- ^ фекТивность чисто познавательной активности. С рядом звеньев познавательных процессов интерферирует состояние утомления, ме¬ няющее условия доступа в семантическую память, а также приво¬ дящее к нарушению когнитивных навыков. В результате даже такие рутинные процессы, как поиск в памяти, начинают требовать посто¬ янного сознательного контроля [11]. 126
I Экспериментальные исследования познавательных процессов до¬ казывают, что они имеют значительно более сложное строение, чем это постулируется в факторных моделях интеллекта. Так, ’’перцептивный фактор” в действительности означает множество функ¬ ционально обособленных структур. Только в рамках зрительного восприятия можно выделить механизмы нескольких надстраиваю-' щихся друг над другом уровней. На наиболее низком из них находятся механизмы, ’’проприоцептивные в широком смысле слова” (зрительные кинестезии), выше расположены процессы локализации объектов в трехмерном пространстве и времени, еще выше — процессы восприятия перцептивной идентичности предметов. Меха¬ низмы последних уровней можно уверенно идентифицировать с двумя из выделенных Н.А. Бернштейном уровней построения движений — уровнями пространственного плана и действия [12].. Зрение участ¬ вует и в высших формах символического восприятия, обеспечивая, например, на поздних этапах формирования такого важнейшего когнитивного навыка, как чтение, прямое узнавание смысла слов без промежуточного фонологического кодирования [13]. Любая из выделенных подсистем может быть подвергнута зна¬ чительно более дробному анализу. Так, определение перцептивной идентичности предмета возможно с помощью двух частично автоном¬ ных^ структур: восприятия формы и восприятия цвета. В свою очередь, существуют разные механизмы спецификации формы, ко¬ торая может описываться в терминах глобальных очертаний и/или инвариантной геометрии внутренних деталей. Не менее подробно сегодня могут быть описаны процессы сил¬ логистических умозаключений или решения задач на установление аналогии, играющие, как показал анализ исторического развития интеллекта, важную роль в возникновении научных достижений обще¬ человеческого значения [14]. В самом общем виде задача на аналогию представима в следу¬ ющем виде: А:В, как С: (?) D\x...n- Развернутая психологическая структура решения включает большое число операций, таких, как анализ отношения между терминами первой пары, обращение к концептуальным структурам долговре¬ менной семантической памяти, установление взаимно-однозначного соответствия между элементами пар, проверка идентичности от¬ ношений и т.д. Исследования показывают, что базовые компо¬ ненты решения подобных задач, как и вообще всех задач на рассуждение, чрезвычайно сильно зависят от возможности дать предметно-ситуативную интерпретацию условиям. В этом случае поиск ответа разворачивается у значительной части испытуемых как своего рода мысленное экспериментирование с образом ситуации и его (нередко персонифицированными) эле¬ ментами. Вместе с тем измерение времени решения в экспери¬ ментах с широким варьированием материала (едовщ- символы, пространственные отношения, карикатуры) свидетельствует о том, 127
что в разных условиях воспроизводятся некоторые общие компо¬ ненты интеллектуальной активности. В частности, эффективность решения во многом оказывается связанной с выделением абстракт¬ ного отношения между элементами задачи — хорошо известного из классических исследований мышления ’’функционального реше¬ ния”. Изучение деятельности испытуемых в ситуациях решения твор¬ ческих мыслительных задач показывает, что успешность решения определяется здесь прежде всего умением работать с типогениче- скими и даже контрфактическими ментальными моделями (ср. ге- ductio ad absurdum как метод научного доказательства). Такие порожденные силой нашего воображения смысловые контексты мо¬ гут создавать сложные структуры рекурсивно вкладываемых друг в друга ментальных пространств [15,16]. Проиллюстрируем эту мысль на примере понимания следующего отрывка текста: ”В этом спектакле Смоктуновский играет Отелло. Отелло думает, что Дездемона ему неверна, хотя в действитель¬ ности она его любит”. Этот отрывок задает по крайней мере три пространства. Прежде всего он содержит указание на реаль¬ ность — пространственно-временнбй контекст жизнедеятельности го¬ ворящего, слушающего и артиста И.М. Смоктуновского. Мета¬ оператор ”в этом спектакле” вкладывает в реальность ментальное пространство М\, которое, в свою очередь, оказывается родитель¬ ским пространством для пространства Мг, задаваемого метаопера¬ тором пропозициональной установки "X думает”. В такой иерар¬ хической структуре метаоператор ”в действительности” возвращает наше воображение не к реальности, а к непосредственно объем¬ лющему мир мыслей и чувств Отелло пространству М\. . Вообще говоря, в каждый момент времени семантический кон¬ текст создается лишь объемлющим ментальным пространством3. Подобная организация создает известную непроницаемость менталь¬ ных пространств, запрещающую осуществление формальной подста¬ новки терминов. Так, хотя нам известно, что Гамлет убил скры¬ вавшегося за занавесом Полония, мы не можем сказать ’’Гам¬ лет убил скрывавшегося за занавесом”, нельзя утверждать ’’Гамлет хотел убить Полония” вместо ’’Гамлет хотел убить человека, скрывавшегося за занавесом” в силу непроницаемости созданного нашим воображением ментального пространства для наших же знаний о той же самой ситуации. Понимание представлений и образов как особых пространств I движения мысли субъекта, создающих возможности Для действия в / модальности ’’как если бы”, открывает путь для объяснения ряда ^ трудностей, которые возникают при трактовке образов как карти¬ 3 По-видимому, с этим обстоятельством связаны эффекты избирательного влияния пространственных систем отсчета, проявляющиеся в особенностях ряда перцептивных феноменов [18]. Воспринимаемое движение локальных объектов и самого наблю¬ дателя определяется при этом лишь непосредственно объемлющей системой отсчета, которая, однако, в свою очередь, перенимает движения своего окружения. 128
нок, которые одна часть мозга показывает другой. В частности, несмотря на существенную роль наглядной информации в реализа¬ ции мнемотехнической функции образов, корреляция между субъек¬ тивной отчетливостью представления образа и его эффективностью в качестве средства организации познавательной активности, как правило, отсутствует [171. Такой факт легко объясним с помощью развиваемого подхода. Пусть дана фотография, скажем, коллективное фото участников XVIII Международного психологического конгресса. Если известно, что на этой фотографии (метаоператор!) Дж. Брунер полностью закрыт Жаном Пиаже, то возникает как раз отмеченная пара¬ доксальная ситуация — всякая визуализация фотографии (построе¬ ние ментального пространства изображения) будет напоминать вам не только о Пиаже, но и Брунере, хотя никаких решительно сенсорных признаков, указывающих на него, ни в образе, ни в прообразе нет. На основании накопленных в психологии познания данных воп¬ рос о структуре интеллекта может быть поставлен более кон¬ структивным образом. При этом выявляется полная адекватность модели уровней построения движений Н.А. Бернштейна в качестве основы для модели иерархической структуры организации интеллекта. С некоторыми модификациями и дополнениями в ее ’’верхней”, семиотической части развитие схемы позволяет выделить шесть уров¬ ней интеллекта, краткая характеристика которых дана в таблице. ’’Способности” психометрического подхода, равно как и тради¬ ционные ’’познавательные функции”, оказываются здесь сложными, многоуровневыми образованиями. Так, ’’ощущения” связаны с работой трех уровней (А, В и С), ’’восприятие” — преимущественно двух (Си/)), "память” и ’’мышление” — трех (D, Е, F), ’’воображение” и ’’понимание” — двух (EhF). Феномены ’’внимания” оказываются результатом управляю¬ щих воздействий более высоких уровней на нижележащие (прежде всего F на Е и Е на D). Наконец, функции понимания и порождения речи, кото¬ рые зачастую относят к наиболее высокому уровню познавательной организации [19], на самом деле распределены между тремя уровнями ф, Е и F). Лишь самые творческие аспекты и формы этих функций, такие, как формирование речевой интенции, применение пропозициональных установок, порождение и понимание поэтического текста, связаны с уровнем метапознавательных (личностно-смы¬ словых) координаций. Чем выше уровень, тем существенней его роль в обеспечении интеллектуальных достижений. Если на уровнях А, В и С речь идет о сравнительно элементарных сенсорных и перцептивных функ¬ циях, то уровень предметных действий D реализует весьма сложные, формирующиеся прижизненно когнитивные автоматизмы. В ряде иссле¬ дований изучались различия экспертов и новичков в таких обла¬ стях, как чтение, жонглирование, игра в шахматы, медицинская диагностика, педагогика, теоретическая физика. Эксперты не просто больше знают (хотя это практически почти всегда так), они в полном 9. Зак. 1668 129
Уровни организации интеллекта | Палео-Кинетиче- Регуляция тонуса и простей- Тонические и палеовестибу- Протопатическая чувстви- Процедуры ские регуляции ших защитных реахций лярные рефлексы тельность
смысле слова более чувствительны к значимым характеристикам ситуации. По-видимому, эти различия отражают достаточно далеко зашедшую процедурализацию релевантных структур знания — приоб¬ ретение соответствующими процессами статуса автоматизмов и их сдвиг к этапу перцептивного узнавания, в результате чего шах¬ матист сразу видит, что "позиция белых предпочтительна”, врач отмечает, что у входящего в кабинет больна печень и т.п. По нашему мнению, переход управления от уровня Е к уровню D зафиксирован в исследованиях первичных понятий [20], показавших, что часть из них активируется в автоматическом режиме. Важ¬ ность концептуальных структур знания для оценки интеллектуальной компетентности доказывается тем обстоятельством, что большин¬ ство тестов интеллекта имеет отношение как раз к уровню Е (в том числе шкалы так называемого "практического интеллекта”). Особое значение в обеспечении интеллектуальной активности имеют, однако, структуры метапознавательного уровня F. Реализуемые этим наиболее высоким уровнем интеллекта про¬ цессы были названы метапроцедурами4 [21]. Некоторые из них (ПРЕДСТАВЛИВАНИЕ, ВРАЩЕНИЕ, ТРАНСФОРМАЦИЯ) позво¬ ляют работать с образными компонентами концептуальных структур, другие (ОПИСАНИЕ, МЕТАФОРИЗАЦИЯ, ВОСПРОИЗВЕДЕНИЕ) — преимущественно или исключительно с вербальными, третьи (ПО¬ НИМАНИЕ, РЕКУРСИЯ, АНАЛОГИЯ) имеют более универсальный характер, вероятно, определяя уровень так называемого общего интеллекта. Действительно, изучение поведения испытуемых при решении эк¬ спериментальных заданий позволяет сделать вывод, что различия в общих способностях связаны прежде всего с использованием разных мыслительных стратегий. Хорошие решатели тратят срав¬ нительно много времени на ПОНИМАНИЕ проблемы и создание адекватной репрезентации (ПРЕДСТАВЛИВАНИЕ и/или ОПИСА¬ НИЕ) условий. Плохие — быстро начинают искать ответ среди заданных в памяти (ВОСПРОИЗВЕДЕНИЕ). Лишь первая стратегия дает возможность генерализации приемов решения и их переноса на задания, отличающиеся предметной областью (АНАЛОГИЯ). Речь идет о достаточно общих закономерностях, проявляющихся, например, и в особенностях изобретательского творчества. Психо- лого-педагогические исследования также свидетельствуют о- том, что "хороший” студент или ученик отличается от "плохого” не столько большим количеством фактических знаний, сколько лучшим уме¬ нием "видеть”, что информация, полученная в одном контексте, пригодна для использования в другом. Роль уровня F ярко выступает в исследованиях, моделирующих обстоятельства реальной жизнедеятельности современного человека. В одном из экспериментов [22] испытуемые должны были в те¬ 4 Метапроцедуры были разделены на эвристики мышления и правила семанти¬ ческого синтаксиса [32]. К последним относятся общие стратегии, обеспечивающие порождение и интерпретацию речевых конструкций применительно к обстоятельствам конкретной коммуникативной ситуации. 131
чение ’’десяти лет” управлять небольшой административно-хозяйст¬ венной единицей — вымышленным городом Лохаузен, который был реализован с помощью ЭВМ как сеть из приблизительно 2400 взаимодействующих экономических, демографических, экологических, политических и психологических переменных. Испытуемые могли вызывать любую исходную информацию о состоянии системы. Они должны были оценить ее и предпринять адекватные дейст¬ вия, направленные на процветание Лохаузена и его жителей. Компью¬ тер моделировал последствия этих действий и по мере необхо¬ димости выдавал испытуемому информацию, на основании которой нужно было осуществлять новые управляющие воздействия (соб¬ ственная динамика системы характеризовалась легкой тенденцией к дестабилизации). Были выявлены, в частности, резкие индиви¬ дуальные различия испытуемых, одни из которых очень быстро могли довести подвластную им территорию до экономической и экологической катастрофы, тогда как другие оставляли Лохаузен после ’’десятилетнего правления” процветающим городом с трудо¬ устроенной молодежью, решенной жилищной проблемой и т.д. В чем же причины столь различных успехов? Корреляция с целым рядом хорошо стандартизованных тестов интеллекта оказалась равной нулю. Таким же оказался результат применения тестов кре¬ ативности. Мотивация испытуемых менялась лишь к концу экспе¬ римента, когда уже совершенно явно намечались контуры успеха или неудачи. Показателем, различавшим две группы, была общая установка на ПОНИМАНИЕ, которое выражалось по числу вопросов о состоянии системы и ее организации. Структуры памяти успешных испытуемых отличались не только большей абстрактностью, но и большей детальностью. Эффективный метапознавательный контроль за требуемым уровнем концептуального анализа позволял им, с одной стороны, легко ’’заземлять” представления об адекватных ’’здесь и теперь” действиях, а с другой — выделять глобальные характеристики ситуации и на основе умозаключения по АНАЛОГИИ осуществлять перенос способов решения на новые предметные об¬ ласти. Концептуальная ’’конвергенция” и ’’дивергенция” выступили, следовательно, не как независимые факторы, а как момент единой активности аналитико-синтетического типа [24]. На добротность решений влияли не только когнитивные переменные. Лица, харак¬ теризующиеся настойчивостью, уверенностью в своих силах, с хо¬ рошими навыками общения и склонностью к социалистической идеологии справлялись с работой лучше5. ! Одним из уроков данного исследования стал вывод о высокой эффективности профессиональной экспертизы. Если специально разработанные психометрические "инструменты” не позволяли дифференцировать испытуемых, то экспериментаторы, проводившие исследования, с высокой достоверностью узнавали "успешных” и "неус¬ пешных” испытуемых уже в первой пробе. Как психологи-профессионалы экспе¬ риментаторы могли также предсказать 1Q своих испытуемых, но делали это, выделяя совсем другие наборы признаков. Аналогичные выводы можно сделать на основании гигантского опыта применения тестов интеллекта в школе [1]. Как правило, глобальная оценка учителя служит лучшим предиктором будущих успехов, чем результаты самых изощренных психометрических процедур. 132
Относительно мало разработанной главой психологии познания остается вопрос о механизмах социального интеллекта. Есть все основания считать, что и в этом случае ведущая роль принад¬ лежит уровню F, в частности метапроцедуре РЕКУРСИЯ, позво¬ ляющей осуществлять многократные вложения ментальных простран¬ ств друг в друга. Поскольку в ряду таких вложений могут с не¬ которыми изменениями повторяться образы ”Я” и ’’значимого дру¬ гого”, возникают столь характерные для координаций уровня F эффекты стереоскопичности и рефлексивности семантики — мы смотрим на себя ”со стороны”, оцениваем других в зависимости от того, как они предположительно оценивают нас, пытаемся представить, как бы мы поступили на месте другого либо другой поступил в нашей ситуации и т.п. До недавнего времени эти эффекты описывались лишь в лингвистических и логических иссле¬ дованиях [25,26]. Эффективность интеллектуальной деятельности определяется и множеством других, еще менее специфичных, чем эвристики мыш¬ ления, процессов. В ряде исследований подчеркивается значение ’’интеллектуальной инициативы”, понимаемой как нестимулированная. 1щвне (следовательно, имеющая внутренний локус контроля) ак¬ тивность [27]. Регулирующая роль мотивов проявляется в том, что общая спонтанная активность, с которой коррелируют некоторые тесты креативности, принимает форму именно интеллектуальной инициати¬ вы, а, скажем, не бытового любопытства. Об удивлении как начале всякой философии писал еще Платон. Свидетельством совершенно особого мироощущения служит признание И. Ньютона, сравнившего себя в конце жизни с мальчиком, играющим в камешки на берегу бесконечного океана непознанного, или, например, следующее за¬ мечание А. Эйнштейна: ’’Нормальный взрослый человек едва ли станет размышлять о проблемах пространства—времени. Он полагает, что разобрался в этом еще в детстве. Я же, напротив, разви¬ вался интеллектуально так медленно, что только став взрослым, начал раздумывать о природе пространства и времени” [28, с. 62]. Многочисленные указания на значение ’’нравственного начала”, ’’вы¬ держки”, ’’хорошего характера”, ’’независимости”, ’’сильной воли” содержит, в частности, литература о А. Пуанкаре, В.И. Вернад¬ ском, А. Ухтомском, А. Эйнштейне, Н. Боре, П.Л. Капице. В пси¬ хологических работах показано значение волевых черт личности при решении практических проблем полководцем, администратором, политическим деятелем [29]. На наш взгляд, эти факты объясняются двумя основными при¬ чинами. Во-первых, в иерархической системе управления каждый уровень задает мотивы для работы нижележащих функциональных структур [12]. Это позволяет, например, понять адаптацию к оп¬ тическим искажениям как разновидность научения, которое раз¬ ворачивается в целом на уровне пространственного поля (уровень С), но подкрепляется актами практического достижения предметов 133
(уровень D). Ведущую роль в порождении специфических чело¬ веческих мотивов с этой точки зрения должен играть уровень метапознавательных координаций. К числу существенных моти¬ вационных переменных относятся такие формы метапознавательной активности, как определенные стратегии объяснения успехов и неудач предшествующих действий (каузальная атрибуция [30]). Анализ работ по психологии мотивации и метапознанию выяв¬ ляет едва ли случайное совпадение основных тем исследований: Мотивация Метапоэнание Оценка сложности задачи в зависимости от собственной компетентности Ожидание успешности Прогнозирование успешности Выбор уровня притязаний Выбор оптимальной стратегии Подсчет требуемых усилий Планирование действия Каузальная атрибуция успехов и неудач Концепция "Я” и "другого” Знание о знаниях и умениях Индивидуальный стиль атрибуции Метапроцедуры оценки успехов и не¬ удач Предсказание будущих результатов Предсказание результатов и их послед¬ ствий Оценка результатов действия Применение личностных ценност- Вывод о способностях и/или "мораль¬ ных шкал ности” -'^'Эмоциональные состояния, чувства, Оценка правильности или ложности ^ настроения ' Изменение самооценки и коррекция Модификация концептуальных струк- предубеждений тур и метапроцедур Речь несомненно идет об одних и тех же фундаментальных ме¬ ханизмах6. Вторая причина заключается в том, что мыслительные процессы всегда развертываются на фоне и под аккомпанемент столь же динамичных, но значительно более глобальных эмоциональных со¬ стояний. Отмечая моменты ослабления и восстановления контроля за развитием событий, эмоции выполняют по отношению к интел¬ лектуальной активности важную эвристическую функцию. Любая npoimeMHa? ситуация, не позволяющая использовать уже имеющиеся знания (уровень Е) и навыки (уровень D), индуцирует состояния напряженности и тревоги. В случае серьезных научных или практи¬ ческих противоречий столкновения конфликтующих требований пре¬ дельно обострено — они кажутся абсурдными, заведомо неразре¬ шимыми. Нахождение решения, когда для этого требуются зна¬ чительные умственные усилия в течение длительного времени, воз¬ можно только при достаточной силе воли и устойчивости позна¬ вательной мотивации, готовности пуститься в путь, исход которого не способна предсказать никакая антиципация. Если же проблема ‘В работе [32] указывается на возможность уровневой организации эмоционально¬ мотивационной сферы. Связь с предлагаемой нами моделью интеллектуальной орга¬ низации представляется вполне очевидной. 134
решена, то удовлетворение, гордость и торжество могут отметить это событие еще до того, как оно будет подтверждено последо¬ вательным рациональным анализом [31]. Включенность эмоциональных состояний в процессы метапозна- вательного контроля определяет их связь с интеллектуальной орга¬ низацией личности. Когда страх переходит в панику, восторг — в экстаз, ярость — в исступление, вместе с контролем теряется также отмеченное взаимодействие аффекта и интеллекта. Видимо, именно здесь проходит важное смысловое разграничение между пониманием интеллекта в психологии и категорией ’’искусственный интеллект”. Даже самые успешные действия под гипнозом или по инструкциям, заданным извне (внешний локус контроля), не остав¬ ляют впечатления интеллектуальных достижений, хотя они могут быть достаточны для высокой квалификации соответствующих техни¬ ческих систем. РАЗВИТИЕ ИНТЕЛЛЕКТА Центральный вопрос психологических исследований интеллекта — как люди выбирают наилучший, по их мнению, способ действо- вания в проблемной ситуации — не только очень сложен, но и чрезвычайно серьезен. Особую остроту ему придают продолжаю¬ щиеся свыше 100 лет утверждения о жесткой наследственной обу¬ словленности интеллектуальных различий. Однако эмпирические дан¬ ные, на которых строятся подобные представления, вызывают серьез¬ ные сомнения. Многочисленные исследования воссоздают иную картину взаимо¬ отношений генотипа и среды. Установлено, например, что с течением времени IQ приемных детей сближается с коэффициентами ин¬ теллекта их новых родителей, а совместное или раздельное воспи¬ тание вызывает сдвиги IQ у всех категорий родственников в направлении большего соответствия окружению. Согласно психофи¬ зиологическим исследованиям [33], наследуемыми оказываются пре¬ имущественно простые сенсо-моторные функции, в случае же более высоких уровней функциональной организации познавательных про¬ цессов влияние генотипа практически сходит на нет. Конечно, относя людей современного биологического типа к виду homo sapiens, антропологи тем самым наделяют разум, или разумность, качеством видовой характеристики человечества. Иссле¬ дования психического развития младенцев указывают на возможность генетической фиксации некоторых форм восприятия и памяти (вплоть до категориального восприятия фонем)7. 7 Показательно, что психобиологические задатки не накладывают ограничений на возможности онтогенетического развития в условиях различных культур. Так, хотя взрослые носители японского языка, как правило, не различают фонемы [р] и [л], соответствующие фонематические категории выделяются японскими младен¬ цами. Аналогично будущие носители индо-европейских языков в первые месяцы жизни чувствительны к фонематическим границам, разделяющим невоспринимаемые позднее фонемы языка таи [34]. 135
На общий вопрос о врожденности интеллекта, следовательно, нельзя дать общего ответа: для разных уровней он должен форму¬ лироваться различным образом. Например, безусловно врожденными в своей основе являются механизмы интермодальной динамической локализации объектов в трехмерном пространстве и времени (уро¬ вень С). Нельзя не видеть, однако, что эти природные задатки развиваются и модифицируются в условиях создававшейся по крайней мере на протяжении нескольких десятков тысяч лет человеческой культуры. Так, особенностью познавательной сферы, роднящей че¬ ловека с высшими 'приматами, является доминирование зрения. Но и значительная часть нашей культуры по праву может быть названа визуальной. Мимика, жест, танец, изобразительное искус¬ ство, архитектура, письменность, технический дизайн, компьютерная графика образуют системы визуальной семантики, роль которых в жизнедеятельности современного человека постоянно возрастает. К. Маркс писал, что глаз стал человеческим точно так же, как его объект стал общественным, человеческим объектом, создан¬ ным человеком для человека [35]. Значение среды, в особенности эмоциональной и интеллектуаль¬ ной атмосферы семьи, признается сейчас все большим числом исследователей. Этим объясняется феномен ’’первого ребенка” — слабое, но достоверное превышение IQ первых в семье детей над следующими. Первый ребенок пользуется преимуществом исклю¬ чительного общения со взрослыми, тогда как у следующих детей такая возможность слабеет. Картина, правда, осложняется тем об¬ стоятельством, что в семьях с двумя-тремя детьми их IQ обычно выше IQ единственного в семье ребенка. По-видимому, наличие в семье нескольких детей имеет развивающий, а не тормозящий эф¬ фект, причем наиболее благотворно это сказывается на старших детях. Особенно отчетливо роль общения ребенка и взрослого выступает на самых ранних этапах развития, когда по проница¬ тельному замечанию JI.C. Выготского, характеризуя личность ребенка, следует говорить, не о ”пра-Я”, а о ”пра-МЫ”. Не случайно в семьях со смешанным расовым составом родителей IQ детей ока¬ зывается ближе IQ матери, хотя на уровне генотипа ’’вклады” отца и матери совершенно одинаковы. Именно в этом направлении развиваются некоторые новейшие исследования глубинных структур, регулирующих процессы понимания и порождения речевых высказываний [36]. Наметилась возмож¬ ность объяснения чрезвычайно успешного оперирования ребенком грамматическими конструкциями уже на стадии первоначального ов¬ ладения речью. Вместо врожденной языковой компетентности роль катализатора развития могут играть все более усложняющиеся схемы коопера¬ тивного действия ребенка и матери. Овладение родным языком предполагает не перевод на гипоте¬ тический ’’язык мысли”, а совместную работу по крайней мере двух людей, развивающаяся логика совместных предметных и со¬ циальных действий оказывается долингвистическим прототипом буду- 136
щей падежной грамматики собственно речевых конструкций (с ее категориями ’’действия”, ’’актора”, ’’объекта”, ’’инструмента” и т.д.). Рефлексивный характер межличностных отношений объясняет, почему на этой основе начинают совершенствоваться формы произвольного контроля за своим поведением и познавательными процессами: внутрь психологической системы ребенка переносится та структура социальных отношений, которая и при таком переносе сохраняет все основные черты своего символического строения [37]. Сфера межличностных взаимоотношений является также ведущим ’’центром организации” ментальных пространств. Общение, в осо¬ бенности речевое, предполагает реконструкцию знаний и интересов партнера. В ситуации значимого общения оказывается необходимым дополнить это ментальное пространство представлением о представ¬ лении партнера о наших знаниях и интересах. Возникает трехуров¬ невая структура смысловых контекстов. Ее отличительной особен¬ ностью является наличие метапознавательного компонента, причем проявляется он как элемент ’’вклада” значимого другого. В 80-е годы начали детально рассматривать многочисленные следствия, которые вытекают из этого обстоятельства для изучения личности [38]. С точки зрения психологии познания хотелось бы подчеркнуть два момента. Наличие таких метакогнитивных включений в наши знания несомненно служит основой для произвольного управления поведением и познавательными процессами. Использование знания о знании чревато, однако, опасностью попадания в порочный круг, ведь' с логической точки зрения речь идет о множествах, вклю¬ чающих себя в качестве своих элементов. Разрыв порочного круга возможен лишь с помощью поименования всех элементов вклю¬ ченного множества, что, разумеется, сразу выявляет ограниченность объема буфера лингвистического процессора — вербальной кратко¬ временной памяти. Ее объем является едва ли не единственным надежным коррелятом уровня развития общего интеллекта. Говоря об онтогенезе высших символических координаций, сле¬ дует подчеркнуть, что он ни в коей мере не повторяет их фило- и социогенеза. В значительной степени направление развития оказы¬ вается здесь противоположным — "сверху вниз”, а не ?снизу вверх”, что позволяет освободить уровень F для решения задач, имеющих творческий характер. Процедурализация структур знания, в свою очередь, ведет к формированию перцептивных автоматизмов, связанных с еще более низким уровнем D. Такой подход, очевидно, отличен от наиболее известной кон¬ цепции познавательного развития, созданной Жаном Пиаже [39]. Многое в его концепции вызывает сегодня теоретические и эк¬ спериментальные возражения. Так, по мнению Ж. Пиаже, усилия маленького ребенка, направленные на создание координированной репрезентации мира, наталкиваются на принципиальное ограничение — его психика эгоцентрична. Утверждению о "полном и бессознатель¬ ном эгоцентризме первых стадий развития” противоречит весьма раннее появление у младенца инвариантного представления о пред¬ мете и о другом человеке [40,41]. Более того, часть знаменитых 137
феноменов Пиаже, по-видимому, можно объяснить не эгоцентриз¬ мом, а повышенным экзоцентризмом познавательной активности ребенка. Нельзя безоговорочно принять и вывод о формальной мысли как конечной стадии развития — слишком значительную роль в мышлении взрослого (даже владеющего формальной логикой) человека играют эвристики, основанные на использовании образных моделей ситуации, глобальных эмоциональных оценок и сокращенных приемов рассуждения. Особые трудности для теории Пиаже представляет объяснение явлений ’’декаляжа” (фр. decalage — неувязка). В случае так на¬ зываемого ’’горизонтального декаляжа” ребенок в определенном воз¬ расте демонстрирует достижения, соответствующие разным стадиям интеллектуального развития, по отношению к задачам, которые отличаются лишь незначительными изменениями условий (скажем, может решать задачи на сохранение объема, но не веса). О ’’вер¬ тикальном декаляже” говорят, когда способности к решению неко¬ торого класса задач вдруг как бы исчезают, чтобы вновь вернуться на более поздней стадии развития. С точки зрения развиваемой нами модели организации интеллек¬ та в этих феноменах нет ровным счетом ничего аномального, более того, они представляют собой прямое следствие разделен¬ ное™ метапроцедур (уровень F) и относящихся к различным со¬ держательным областям концептуальных структур (уровень Е). Факти¬ чески все примеры зависимости успешности решения задачи от соответствия представления условий и используемых эвристич*еских приемов, которые можно найти в любом учебнике по психологии мышления, есть примеры "горизонтального декаляжа”. Что касается случаев немонотонности развития, то кратко объяснение состоит в следующем. Разными уровнями задача совершенствования своей работы решается по-разному. Для механизмов предметного восприятия это прежде всего специализация процедур обработки. Для уровня Е — расширение существующих концептуальных структур за счет введения нового фактического знания. Есть и третий тип изме¬ нений, состоящий в частичной или полной перестройке концептуаль¬ ных структур. Его отражением являются ’’вертикальные декаляжи”, а механизмом — открытие и уточнение области применения метапро¬ цедур8. Начиная с 40-х годов Ж. Пиаже отказывался признавать какую- либо причинную связь между ’’социальной” и ’’внутренней” логикой. Однако другие люди в окружении ребенка представляют собой ’’объекты” совершенно особого рода [42]. Альтернативными гипо¬ тезами было и предположение о неспецифической активации в * Вообще говоря, любая из метапроцедур при ее избыточном использовании может увеличивать трудность решения задач. Так, экстенсивное применение ПРЕД- СТАВЛИВАНИЯ ведет к затруднениям в решении задач, требующих ОПИСАНИЯ или использования абстрактного математического правила. Многократная РЕКУРСИЯ может приводить к распаду целостного образа ситуации и т.д. Тенденция мета¬ процедур к сверхгеиерализации компенсируется в случае их социокультурных прототипов наличием различных, зачастую противоположных указаний. 138
условиях межличностного контакта н теория социального науче¬ ния”, согласно которой ребенок просто имитирует образцы пове¬ дения, демонстрируемые взрослым. Эксперименты показали, что ни активация, ни имитационное научение не объясняют положительных сдвигов в развитии интеллекта (они оценивались по критерию вы¬ полнения задач на сохранение). Развивающий эффект общения возникал в связи с преодолением появляющихся в совместной деятельности противоречий и конфликтов, причем все партнеры могли находиться к началу эксперимента на дооперациональной стадии развития. Социальная природа высших символических координаций делает потенциально возможным целенаправленное формирование интеллекта. Исследования по формированию умственных действий свидетель¬ ствуют о том, что уже сегодня психология располагает приемами формирования элементарных видов рефлексивного контроля, а также анализа типичных задач ”на соображение” [43]. В развитии когнитивной сферы личности можно выделить две стороны. Первая связана с формированием операционных компо¬ нентов стратегий выполнения и контроля. Как показывают иссле¬ дования, ни объем кратковременной памяти, ни зона фокального внимания, с которым со времен В.В. Вундта идентифицировалось сознание, не меняются сколько-нибудь существенно в ходе онто¬ генеза. Высшие символические координации, лежащие в основе сознания; первоначально формируются в процессах межличностной коммуникации и взаимодействия. Не случайно сознание навсегда сохраняет форму внутреннего диалога. Стратегии рефлексивного контроля позволяют координи¬ ровать работу специальных познавательных механизмов, менять баланс тонкого и глобального анализа, наконец, продуцировать новые стратегии, что крайне важно в условиях ’’открытости” пов¬ седневных проблемных ситуаций. Наряду с ростом интеграции част¬ ных интеллектуальных функций в онтогенезе не менее интенсивно происходит специализация и автоматизация стратегий, их превра¬ щение в относительно устойчивые структурные ’’модули”. Вторая, не менее важная, но, безусловно, менее изученная сторона разви¬ тия интеллекта — это формирование его интенционально-личностных особенностей. Внутренний диалог сознания разворачивается с инте- риоризованными образами других людей, определяя значимые для становления личности решения. В.А. Петровский отмечал, что «кон¬ кретно охарактеризовать личность — это значит ответить не только на вопрос о том, кто из других людей и каким образом пред¬ ставлен (интериоризирован) в индивиде, но и как он и в ком именно состоит в качестве этого ’’другого”, как бы изнутри опре¬ деляя чье-либо сознание и поведение» [44]. Свидетельством импли¬ цитной социальной психологии интеллекта и творчества служит фе¬ номен научной школы. Очерченный круг идей имеет прямое отношение к дальнейшему совершенствованию измерительных процедур дифференциальной пси¬ ходиагностики интеллекта. Разрабатываемые методики изучения со¬ циального интеллекта могут стать полезным средством анализа 139
социализации, формирования интеллектуальных запросов и направ¬ ленности, принятия социальных ролей, межличностного восприятия, эмпатии и общения. Складывается впечатление, что многие случаи задержки интеллектуального развития имеют в своей основе не дефекты когнитивной сферы, а нарушения общения и социальных контактов, например аутистического типа. Будущие исследования, как нам представляется, приведут к появлению новых метафор. Наряду с компьютерной метафорой (особенно в ее мультипроцессорном варианте) вероятно выдвижение социальной, или организационной, метафоры, основанной на аналогии между функцио¬ нальной организацией интеллекта и жизнью сложных социальных преобразований, таких, скажем, как государство или крупный уни¬ верситет. На самом деле такая метафора не нова. Шекспир срав¬ нивал каждого человека с "маленьким королевством”. Ряд сообра¬ жений говорит о том, что эта метафора может сыграть эври¬ стическую роль в решении задач психологии познания. Например, всякий достаточно сложный социальный организм обнаруживает черты иерархического (более того, гетерархического) строения. В отличие от беспроблемной, нарушаемой лишь короткими замыканиями и дефектами радиодеталей циркуляции информации в вычислительной машине в социальном целом знания претерпевают драматичные метаморфозы. ЛИТЕРАТУРА 1. Frank G. Measures of intelligence and conceptual thinking // Clinical methods in psychology / Ed. I.B. Weimer. N.Y.: Wiley, 1976. P. 123—186. 2. Thorndike E.L. Intelligence measurement: I. The present status. // Psychol. Rev. 1924. Vol. 31. P. 219—252. 3. Boring E. Intelligence as the tests test it // New Rep. 1923. Vol. 35. P. 35—37. 4. Binel A., Simon T. Le developpement de 1'intelligence chez les enfants // Ann. Psychol. 1908. Vol. 14. P. 1—94. 5. Spearman C. The abilities of man. L.: MacMillan, 1927. 391 p. 6. Thurstone L.L. Primary mental abilities // Psychol. Mon. 1938. Vol. 1. P. 2—183. 7. Cattell R.B. Abilities: their structure, growth and action. Boston: Houghton Mifflin, 1971. 573 p. 8. Gilford J.P. The nature of human intelligence. N.Y.: McGrawhill, 1967. 437 p. 9. GrofSmann K.J. Die Entwicklung der Intelligenzmessung // Enzyklopadie der Psychologie. Themenbereich B. Ser. II. Gottingen: Verl. Psychol. 1983. Bd. 2. S. 2—103. 10. Величковский Б.М., Зинченко В. П. Методологические проблемы современной когнитивной психологии II Вопр. философии. 1979. N 7. С. 67—79. 11. Леонова А.Б. Психодиагностика функциональных состояний человека. М.: Изд-во МГУ, 1982. 200 с. 12. Бернштейн Н.А. О построении движений. М.: Медгиз, 1947. 389 с. 13. Величковский Б. М. Зрительные автоматизмы в памяти человека // Психол. жури. 1985. Т. 6, N 5. С. 32—40. 14. Клике Ф. Пробуждающееся мышление: У истоков человеческого интеллекта. М.: Прогресс, 1983. 302 с. 15. Величковский Б.М., Блинникова И.А., Лапин Е.А. Представление реального и воображаемого пространства // Вопр. психологии. 1986. N 3. С. ЮЗ—112. 16. Fauconnier G. Espaces mentaux. P.: Minuit. 1984. 213 p. 17. Величковский Б.М. Современная когнитивная психология. М.: Изд-во МГУ, 1982. 336 с. 18. Величковский Б. М. О роли пространственных систем отсчета в восприятии собственного и объективного движения j j Вопр. психологии. 1973. N 2. С. 15—25. 140
19. Брунер Дж. Психология поэиания. М.: Прогресс, 1977. 412 с. 20. Хоффманн И. Активная память. М.: Прогресс, 1986. 237 с. 21. Поспелов Д.А. О "человеческих" рассуждениях в интеллектуальных систе¬ мах II Логика рассуждений и ее моделирование. М.: ВИНИТИ, 1983. С. 5—37. (Вопросы кибернетики). 22. Величковский Б. М. Психология познания и кибернетика // Кибериетиха живого. Человек в разных аспектах. М.: Наука, 1985. С. 92—106. (Кибернетика — неограниченные возможности и возможные ограничения). 23. Dorner D., Kreuzig H.W., Reither F.. Si dude I T. Lohhausen: von Umgang mit Unbestimmtheit und Komplexutat. Bern: Huber, 1983. 466 S. 24. Брушлинский А.В. Мышление и прогнозирование. М.: Мысль, 1979. 230 с. 25. Арутюнова Н.Д.. Падучева Е.В. Истоки, проблемы и категории прагмати¬ ки II Новое в зарубежной лингвистике. М.: Прогресс, 1985. Вып. 16. С. 3—47. 26. Hintikka J.. Hintikka М.В. Sherlok Holmes confronts modern logic // Ar¬ gumentation: Approaches to theory formation / Ed. E.M. Barth, J.L. Martens. Amsterdam: Benjamin, 1982. P. 75—96. 27. Богоявленская Д.Б. Интеллектуальная активность как проблема творчества. Ростов; Изд-во Ростов, уи-та, 1984. 172 с. 28. Зелиг К. Альберт Эйнштейн. М.: Атомиздат, 1964. 205 с. 29. Теплое Б.М. Ум полководца // Проблемы индивидуальных различий. М.: Изд-во Акад. пед. наук РСФСР, 1961. 536 с. 30. Хекхаузен X. Мотивация и деятельность. М.: Педагогика, 1986. Т. 1. 407 с.; Т. 2. 421 с. 31. Тихомиров O.K. Психология мышления. М.: Изд-во МГУ, 1984. 269 с. 32. Heckhausen Н. Wiinschen-Wahlen-Wollen: Vortrag gehalten bei der Eroffnung des Max-Plank-Instituts fiir psychologische Forschung am 11. Nov. 1985. Mtinchen: Max Plank Gesellschaft, 1985. 8 S. 33. Равич-Щербо И.В. Генетические аспекты психодиагностики // Психологи¬ ческая диагностика. М.: Педагогика, 1981. С. 141 —174. 34. Eimas P. Developmental aspects of speech perception // Handbook of sen¬ sory physiology. Berlin: Springer, 1978. Vol. 8. P. 357—377. 35. Маркс К., Энгельс Ф. Из ранних произведений. М.: Политиздат, 1956. 637 с. 36. Bruner J.. Sherwood V. Thought, language and interaction in infancy // Social cognition / Ed. J.P. Forges. L.: Acad, press, 1981. P. 27—52. 37. Выготский Л.С. Собрание сочинений. В 6 т. М.: Педагогика, 1982—1984. Т. 6. 398 с. 38. Петровский В.А. Принцип отраженной субъективности в психологических исследованиях личности // Вопр. психологии. 1985. N 4. С. 17—30. 39. Пиаже Ж. Избранные психологические труды. М.: Просвещение, 1969. 497 с. 40. Бауэр Т. Психическое развитие младенца. М.: Прогресс, 1979. 311 с. 41. Лисина М. И. Развитие познавательной деятельности детей первого полу¬ годия жизни II Развитие восприятия в раннем и дошкольном детстве. М.: Пе¬ дагогика, 1966. С. 93—115. 42. Doise W., Mackie D. On the social nature of cognition // Social cogni¬ tion // Ed. J.P. Forgas. L.: Acad, press, 1981. P. 53—83. 43. Гальперин П.Я.. Данилова В.Л. Воспитание систематического мышления в процессе решения малых творческих задач,// Вопр. психологии, 1980. N 1. С. 37—38. 44. Петровский В.А. Предпосылки психологии личности 'в свете идей Л.С. Вы¬ готского II Научное творчество Л.С. Выготского и современная психология. М.: ВНИИТЭ, 1981. С. 122—124. 141
г УДК 82.3.091 О ЯЗЫКЕ КАК МОДЕЛИ МИРА Вяч.Вс. Иванов Не только для современной лингвистики и общей семиотики (науки о знаках и их последовательностях — текстах, служащих для передачи, хранения и переработки информации), но и для це¬ лого ряда смежных научных дисциплин одной из основных проблем является вопрос о том, в какой степени язык служит моделью мира. В свою очередь, эта проблема, поставленная в широком аспекте кибернетического изучения "физиологии активности” Н.А. Берн¬ штейном [1], расчленяется на несколько связанных друг с другом вопросов. Перечислим важнейшие из них, на которые в пределах настоящей работы можно лишь указать; сколько-нибудь детальное их рассмотрение потребовало бы гораздо больше места, но и краткое упоминание дает возможность оценить важность проблем. Можно выявить общие и различающиеся черты моделей мира в разных естественных языках, строящихся посредством словарных и грамматических средств. В частности, в последнее время обра¬ щено внимание на специфику языкового представления простран¬ ства (в большинстве языков описываемого через ’’наивную физику” человеческого тела, части которого служат основными координа¬ тами; верх-низ и т.п.) и времени (языки, различающие три вре¬ мени или дающие циклическое обозначение повторяющихся событий; языки, описывающие действия и состояния вне времени), психи¬ ческой жизни (представление о ”я” как говорящем и думающем и его границах; многозначность терминов, описывающих психиче¬ скую жизнь; связь этих терминов с физиологическими и анато¬ мическими), предметов внешнего мира (языковые границы между предметами; различение и неразличение части и целого), разного рода ’’фиктивных” образов (язык и мифология, язык и перво¬ бытная ’’преднаука”). В этой связи возникает проблема развития языковой модели мира и смены одной такой модели другой (в частности, смена естественных языков искусственными языками науки). Особенно интересна гипотеза о преимущественно именном характере грамматики наиболее древних из известных языков и о господ¬ стве в них притяжательных конструкций, а также проблема ’’ак¬ тивных” (эргативных) языков с особым обозначением действующих лиц и предметов в отличие от недействующих (инактивных, неэр¬ гативных). Наконец, открыты нейролингвистические данные о раз¬ мещении функций называния (наименования) предметов, значений слов и грамматических конструкций в разных зонах обоих полу¬ шарий мозга, в связи с чем изучается вопрос о врожденности предпосылок использования языковых моделей. Особенно сущест¬ венным кажется семиотический аспект проблемы. Понятие модели мира, введенное в связи с языком и другими системами знакового представления информации Н.А. Бернштейном [1], а вслед за ним M.JI. Цетлиным [2, с. 186] и другими уче¬ 142 II1
ными, оказалось плодотворным и в общей науке о таких систе¬ мах — семиотике, и в лингвистике. Ниже рассмотрены некоторые из вопросов, возникающих, в частности, при сравнении с этой точки зрения обычных — ’’естественных языков” (разговорных и письменных) с теми, которые разработаны для более специфических задач однозначного представления информации о некоторых выде¬ ленных фрагментах научного знания и поэтому называются ’’искус¬ ственными” языками. Сравнение естественного языка с искусственными (в частности, с языками математической логики) важно не только для решения таких практических задач кибернетики, как перевод с ’’внешнего” естественного языка на ’’внутренний” машинный. Сравнение этих языков проливает свет и на историческое соотношение между ними. Эту сторону проблемы подчеркивал один из создателей кибер¬ нетики Дж. фон Нейман, писавший: ’’Язык есть в значительной степени историческая случайность. Основные человеческие языки обычно передаются от поколения к поколению в различных фор¬ мах, но сама их множественность показывает, что в них нет ничего абсолютного и необходимого. Такие языки, как греческий или санскрит, представляют собой факты истории, а не абсолют¬ ную логическую необходимость; будет только разумным предполо¬ жить, что логика и математика точно так же являются лишь исто¬ рическими, случайными формами выражения” [3, с. 59]. Сравнение искусственных языков математики (в частности, мате¬ матической логики) с разными типами естественных языков поз¬ воляет в какой-то степени проникнуть в историю этих форм вы¬ ражения. Специалисты в области математической логики уже не¬ сколько десятилетий назад обратили внимание на далеко идущее сходство естественного языка с одним из логических языков — исчислением предикатов. В этом логическом языке предметы отде¬ ляются от свойств (предикатов), которые этим предметам припи¬ сываются. Предикаты обозначаются знаками функций с пустыми местами, в которые могут быть подставлены обозначения пред¬ метов ("индивидов”). Если знаком Р обозначается предикат ’’быть простым числом”, то выражение Р(3) означает ”3 является простым числом”. Пустые места при предикатах могут быть заполнены переменными: Р(х) означает "х является простым числом”. В языке исчисления пре¬ дикатов индивиды и переменные соответствуют в известной мере су¬ ществительным, а предикаты — глаголам естественных языков. Вмес¬ те с тем в исчислении предикатов есть и такие элементы, которые в определенном смысле сходны с русскими местоимениями ’’весь”, ’’вся¬ кий”, ’’каждый” (V — квантор общности) и ’’некоторый” (3— квантор существования): Vх означает "для всех х'\ Я х означает ’’для некото- торого х ’’(или ’’существует такое х, что ...”). Кванторы (и вообще операторы — "грамматические” служебные элементы логического языка, частным, случаем которых являются кванторы) употребляют¬ ся всегда при некоторых переменных, подобно тому как артикли 143 J
всегда сочетаются с существительными в таких языках, как англий¬ ский, немецкий, французский; кванторы общности и существования и по значению сходны с неопределенным артиклем в этих языках (оп¬ ределенному артиклю соответствует логический оператор дескрип¬ ции г). Переменные, относящиеся к кванторам общности или су¬ ществования, называются связанными переменными (в отличие от сво¬ бодных). Областью действия квантора называется та часть форму¬ лы, к которой он относится; ее можно сравнить с той частью пред¬ ложения в английском языке, к которой относится артикль (например, a big red block — ’’большой красный кубик”). В языке исчисления предикатов есть также операторы, которые соответствуют отрицанию (1) и некоторым союзам ( &, отчасти сходное с ”и”; V, подобное ’’или”; —по значению напоминающее ’’если ..., то”) естественного языка. Все эти соответствия между русским или английском языком и исчислением предикатов неодно¬ значны. Сопоставление естественного языка с языками математической логики (в частности, с целью составления правил автоматического пе¬ ревода с одного языка на другой) представляет поэтому достаточно сложную задачу, над которой на протяжении последних десятилетий с успехом работают математики, логики и лингвисты. Существенные трудности, выявившиеся на первых же этапах этой работы, обусловлены некоторыми различиями языка исчисления пре¬ дикатов и таких естественных языков, как русский. В языке исчис¬ ления предикатов нет элементов, которые прямо бы соответствовали определению (например, русским прилагательным большой, крас¬ ный и т.п.). Ленинградский математик Г.С. Цейтин предложил поэтому строить промежуточный язык, близкий к исчислению предикатов, но содержащий "оговорки” — подобие определений. Формула, напи¬ санная на таком промежуточном языке, по определенным правилам преобразуется в формулу обычного исчисления предикатов, в неко¬ тором смысле эквивалентную первоначальной формуле [4]. Иначе говоря, автоматический перевод должен был бы осуществляться в два этапа: машина сначала должна была переводить с русского языка на промежуточный язык, а потом уже высказывания на этом последнем преобразовать в формулы исчисления предикатов. Однако сравнение логических языков с более широким кругом естест¬ венных языков (таких, как японский, юкагирский на севере Сибири, языки американских индейцев) не позволяет считать наличие прила¬ гательных отличием всех естественных языков от логических. Раз¬ личия в этом отношении между русским и юкагирским языками не меньше различий между русским языком и языком исчисления пре¬ дикатов. В юкагирском языке русские прилагательные переводятся качественными непереходными глаголами: тудэл лошэрюэ/, ”он — сильный”, переводится как ”он имеет качество быть сильным” [5]. В языке сомали русским прилагательным большой, красный соответ¬ ствуют глаголы weyn — ’’быть большим”, 'a's — ’’быть красным” [6]. В таких североамериканских индейских языках атапаскской группы, как навахо, русские прилагательные широкий, высокий, белый нуж¬ но было бы переводить глаголами состояния: te'el- — ’’быть широ- 144
ким”, -ne'ez - ’’быть высоким, длинным”, -g'ai — ”быть белым” [7]. В японском языке прилагательные (например, широи—’’белый” из древ¬ него сироки) сохраняют следы былого своего тождества с глаголами (широкатта—’’был белым”). Р- Том в изложении своей топологичес¬ кой модели языка ссылается на эту особенность японского языка как на подтверждение той глубокой аналогии между прилагательным и глаголом, которая следует и из его построений [8, с. 218]. Результаты новейших описаний таких современных языков, как английский, позволяют думать, что и в них определительные сочета¬ ния с прилагательными типа young girl—’’молодая девушка” можно считать вторичными производными от исходных глагольных пред¬ ложений, как, например, a girl is young — ’’девушка молода”. В русском языке в предложениях типа девушка молода, мужчина стар употреб¬ ляются краткие формы, исторически первоначальные по отношению к молодая {девушка), старый (мужчина); в этом можно видеть косвен¬ ный след того, что и в русском употребление прилагательного в глагольных сочетаниях ’’быть молодым”, '"быть старым” нужно счи¬ тать основой для употребления прилагательного в качестве опре¬ деления при имени. Подчеркнем, что эти соотношения, вскрываю¬ щиеся при описании, подтверждаются и историей языка: русские фор¬ мы прилагательных типа молодой, старый содержат ту же основу, что и краткие формы молод (более древнее молодь, -где -ь некогда читалось как -у краткое), стар (более древнее старь), в сочетании с элементом, который некогда был самостоятельным. Сравнение с такими близко родственными к славянским индоевропейскими языками, как литовский, показывает, что так называемые ’’членные” (или ’’пол¬ ные”) формы прилагательных типа молодой происходят из сочетаний с элементом, в старолитовских текстах (несколько веков назад) еще выступавшим отдельно от основы прилагательного (старолитовское -io-)\ в древнейшем (по абсолютной хронологии текстов) род¬ ственном индоевропейском языке — клинописном хеттском (тексты II тысячелетия до н. э) соответствующий элемент еще был отдельным словом в функции союза уо-"и’ \[9]- Самым существенным видом определений в таком языке, как рус¬ ский, можно считать определительные предложения. Все, другие определения выводятся из этих последних: зеленый кубик означает то же самое, что и кубик, который является зеленым. Робот, играющий с человеком в кубики, должен уметь понимать фразы типа цвет куби¬ ка — зеленый. На основании понимания таких фраз робот может понять и фразы типа возьми зеленый кубик, что означает возьми тот кубик, цвет которого — зеленый [10]. Для известных типов определительных предложений естественного языка хорошее соответствие представляет логический оператор дес¬ крипции: (\х) S(x), что означает ’’тот именно х, который обладает свой¬ ством S” (дескрипция обозначается перевернутой греческой бук¬ вой I — "йотой”, поэтому этот оператор называют ”йота-оператором”). Область действия йота-оператора — все предложения с х в качест¬ ве свободной переменной. Например, (ix) (Px&.'IQx) означает ”тот индивидуальный объект, который обладает свойством Р и не обладает 10. Зак, 1668
свойством Q”. Дескриптом называется объект, для которого дается дескрипция. Если существует только один объект, удовлетворяющий условию, соответствующему области действия йота-оператора, то дескрипция и ее дескрипт удовлетворяют условию единственности. Согласно толкованию дескрипций в системе Гильберта и Бернайса, индивидуальные объекты которой — натуральные числа, дескрипции допускаются только в том случае, если они удовлетворяют условию единственности. Сходным образом в естественном языке предпола¬ гаются обязательно существование и единственность объекта, о котором идет речь в определительных предложениях того типа, ко¬ торый соответствует дескрипциям [11, с. 138]. Таковы определительные предложения типа «писатель, который написал ”Юрия Милослав- ского”, жил во времена Гоголя». Предполагается, что такой писатель был единственным автором ’’Юрия Милославского” и что факт его существования бесспорен. В тех случаях, когда в определительных предложениях естествен¬ ного языка речь идет не об индивидуализированных объектах, в пе¬ редаче того же смысла на логическом языке используются переменные, связанные квантором общности (V) или существования (Я). Этим объясняется то, что предложение на естественном языке pick up a big red block — ’’подними большой красный кубик” (т.е. ’’кубик, цвет которого — красный”) робот переводит в команду "найди все большие красные кубики”. На квантор общности (V) в этом предложении указы¬ вает неопределенный артикль а. Если в предложении использован определенный артикль: the big red block — ’’этот (единственный) большой красный кубик”, то можно в логической передаче того же смысла использовать йота-оператор [12, с. 176, примеч. 2], но лишь тогда, когда дескрипция удовлетворяет условию единственности. Именно по этой причине команду pick up the big red block — ’’подними этот (единственный) большой красный кубик” робот реализует сразу же в качестве операции с конкретным объектом (без предварительного выбора предметов из некоторого множества), но лишь в том случае, еели имеется только один-един- ственный такой объект. В противном случае робот остановится и по¬ просит объяснить ему, какой именно предмет имеется в виду. Срав¬ нение естественного языка с логическими позволяет увидеть в неко¬ торых естественных языках как бы окаменелые следы того пути, ко¬ торым человек пришел к открытию математики. Еще Спиноза заметил, что если человек держит в руке сестерций и драхму (или, чтобы сделать пример более современным, доллар и франк), у него не возникает в уме понятия "два” до тех пор, пока он не обнаружит общего признака у этих разных предметов — не поймет, что это две монеты. Многие естественные языки сохранили в названиях числительных или особых счетных слов след того времени, когда пересчитывали конкретные множества предметов. Для каждого из таких конкретных множеств было особое числительное. В нивхском языке, на котором говорят в низовьях Амура и на Сахалине, есть особые числительные для каждого из таких множеств: длинных предметов, мелких круглых предметов, крупных круглых предметов, тонких 146
плоских предметов, рыб, людей, остальных живых существ, парных предметов, лодок, досок, нарт, неводных ячей, неводных полос, па¬ лок остроги, сетей, снастей, веревочных сплетений, мест, ручных са¬ женей, ручных четвертей, связок сушеной рыбы (юколы), связок ко¬ рюшки, связок корма для собак. Напротив, некоторые другие естественные языки в выражении идеи числа скорее приближаются к тем современным логическим теориям, в которых множества рассматриваются без какого-либо уточнения того, какие индивидуальные объекты в них входят [11, с. 405]. В таких естественных языках выражения типа ’’два” переводятся как коли¬ чественные предикаты (’’быть в количестве двух”). Именно так ус¬ троены слова, числа соответствующие русским числительным, в таких языках, как юкагирский, где мит-илэ kujoh — ’’наши олени находятся в количестве двух” соответствует русскому ’’наших оленей два”. Такие же конструкции были в древнекитайском — начиная с самых ранних иньских надписей более чем трехтысячелетней древности (а также и в не¬ которых других тибето-китайский языках). Древнекитайский язык и в ря¬ де других отношений обнаруживает значительное сходство с некоторыми искусственными логическими языками. Понятие числа в этих языках вводится как предикат от предиката: ’’четыре стороны света” пони¬ мается как предикат ’’быть четырьмя” от предиката ’’быть сторонами света”, ’’две монеты”—как предикат ’’быть двумя” от предиката ’’быть монетой”. Счетные слова-классификаторы, которые ставятся при чис¬ лительных определенных типов в некоторых языках Восточной Азии, можно считать достаточно близким приближением к такому понима¬ нию числа, как предиката от предиката. В современной китайской фразе чжэчжан чжоцзы санътяо туй — ”у этого стола три ножки” (букваль¬ но ’’этот стол — три ножки”) в состав предиката санътяо входят чис¬ лительное санъ — ’’три” и классификатор длинных предметов -тяо (буквально ’’ветка”). Следовательно, санътяо означает ’’быть тремя — о длинных предметах” или предикат ’’быть в количестве трех” от пре¬ диката ’’быть длинным (предметом)”. Буквально вся фраза означает ’’этот стол — его ножки (как неотъемлемая его часть) имеются в ко¬ личестве трех, будучи длинными предметами”. По степени близости к тому или иному типу искусственного ло¬ гического языка разные естественные языки существенно отличаются друг от друга. Характеристика свойств естественного языка в целом должна даваться на основании сопоставления между собой всех из¬ вестных естественных языков. Нет оснований выбирать один из них (например, английский) в качестве эталона естественного языка и считать другие языки (скажем, юкагирский или сомали) менее предста¬ вительными. В последнее время предположено сходство модели смысла основ¬ ных сочетаний глаголов с существительными (дополнениями и под¬ лежащими) в таком европейском языке, как французский, и в форма¬ лизованном языке механики Ньютона [8]. Возможно, что это сход¬ ство (в духе приведенной идеи Дж. фон Неймана об историческом характере математики) следует объяснить единством происхождения: математика Ньютона развилась на основе языков типа европейских 147
(сам Ньютон разговаривал по-английски, но писал преимущественно на тогдашнем международном языке науки — латинском). В основе глагольных категорий некоторых американских индейских языков лежат представления, которые, по мысли известного лингвиста Уорфа, ближе к физической модели Эйнштейна. Можно думать, что многообразие картин мира, описываемых ес¬ тественными языками, основано на тех же особенностях устройства человека, что и многообразие научных языков, описывающих мир. Поэтому сравнение различных естественных языков с исскуственными может представить интерес для современной науки в делом. Остановимся на глагольных конструкциях американского индей¬ ского языка хопи, в которых Уорф усматривал сходство с физичес¬ кими представлениями современной науки. Согласно альтернативно¬ му описанию, недавно весьма обстоятельно обоснованному [12], в языке хопи время выражается с помощью метафорических выражений, которые отдаленно лишь напоминают обычные европейские языковые способы описания времени, и поэтому их перевод всегда условен. Дадим для одной фразы на этом языке буквальный пословный перевод и более далекий пересказ: ри — ’’тогда”, antsa — ’’конечно”, pay — ’’дей¬ ствительно” (утвердительная частица), quvong-va-qu — ’’завтра”, pay — ’’действительно”, su- its — ’’очень — рано”, talavay — ’’утром”, kuyvan-sa-t - ’’посещать — в течение — определенного времени”, paa-sa-t-ham — ’’это — определенное время — примерно”, ри — ’’тогда”, рат — ’’это”, piw —’’опять”, maarat — ’’девушка”, tay-tay-na — ’’про¬ буждаться — заставлять”, т. е. ’’тогда действительно на следующий день совсем рано утром, в час, когда люди молятся солнцу, примерно в это время, тогда вот он и разбудил снова эту девушку”. Необычность в передаче временных понятий бросается в глаза. Речь идет не о том, что время в языке совсем не выражено (как иногда пишут в популяр¬ ных пересказах идеи Уорфа), но весьма усложненные способы его обозначения указывают на значение установления одновременности между разными наблюдаемыми событиями. Сопоставление француз¬ ского или латинского языка с физикой Ньютона, а языка хопи — с физикой Эйнштейна может служить примерами начинающегося сис¬ тематического сравнения разных естественных языков с языками науки. Начало такого сравнения намного предшествует возникновению ки¬ бернетики и даже современной науки о языке — лингвистики, по воз¬ расту намного превосходящей кибернетику. Еще Декарт, которого по праву считают не только предтечей многих достижений точной мысли последних трех веков, но и предвестником ’’картезианской” лингвистики второй половины нашего века, видел в математике осо¬ бый язык, вырастающий из естественного. К сходной мысли неодно¬ кратно обращался родоначальник современной квантовой механики Нильс Бор, считавший математику ’’скорее усовершенствованием общего языка, оснащающим его удобными средствами для отображе¬ ния таких зависимостей, для которых обычное словесное выражение оказалось бы неточным или слишком сложным. В связи с этим можно подчеркнуть, что необходимая для объективного описания однознач¬ ность определений достигается при употреблении математических 148
символов именно благодаря тому, что таким образом избегаются ссылки на сознательный субъект, которыми пронизан повседневный язык” [13, с. 96]. Глубина последней мысли Бора становится ясной благодаря лингвис¬ тическим исследованиям недавнего времени. Они подтвердили, что для всех естественных языков, в отличие от всех логических, общими являются прежде всего такие грамматические категории, которые определяются отношениями между говорящим и слушающим. В качестве простого примера приведем способы выражения отно¬ шений собственности, т. е. языковые обозначения притяжательности (типа русских притяжательных местоимений мой — ’’принадлежащий говорящему”, твой — ’’принадлежащий слушающему”) [14, 15]. Лю¬ бопытной особенностью значительного числа языков, в том числе почти всех древних письменных языков ранних культур древнего Ближнего Востока, является обозначение не только предметов, окру¬ жающих человека, но и пространственных и временных отношений и со¬ стояний человека и его действий посредством сочетаний именных и глагольных основ с притяжательными местоименными показателями. В таких языках разных семей, как индоевропейский древнехеттский, семитский староаккадский, ’’северокавказский” (в лингвистическом условном смысле, охватывающем и древние языки за пределами Се¬ верного Кавказа, близко родственные современным северокавказским), хурритский (в Северной Месопотамии, Сирии и Малой Азии), выра¬ жение притяжательности было обязательным не только по отношению к такой ’’неотъемлемой” (неотчуждаемой) собственности человека, как его части тела или родственники, но и по отношению к основным пространственным понятиям, как ’’верх” (’’его верх” в значении ’’над ним”), ’’низ” (’’мой низ” в смысле ’’подо мной”) и т. п. (такое же по сути обозначение есть и в современном английском языке: on his left — ”с его левой стороны”, т. е. ’’слева от него”, on his right — ”с его правой стороны”, т. е. ’’справа от Herov). Можно доказать, что многие пред¬ логи и приставки современных индоевропейских языков с пространст¬ венными и временными значениями возникли из подобных сочетаний древних имен существительных (некогда снабжавшихся притяжатель¬ ными местоименными показателями). Еще больший интерес представляет то, что судя по реконструкциям сравнительно-исторического языкознания, древнейшие глагольные формы в большинстве доступных для исследования праязыков отдель¬ ных семей языков представляют собой сочетание корня (для этого времени трудно сказать, глагольного или именного) с притяжательны¬ ми местоименными окончаниями или приставками: форма типа рус- кого ем происходит из праславянского *6мь, в свою очередь возводи¬ мому к индоевропейскому *6d-mi с возможным исходным значением "еда — моя”, едение — мое”. Как будто это служит доводом в поль¬ зу допущения, согласно которому различие имени и глагола, прово¬ димое во всех известных живых языках, еще несколько тысяч лет назад могло и не быть обязательным. В пользу этого говорит и такая структура глагола в тех же древне¬ письменных языках (хурритском и т. п.), где глагол явно обнаружи¬ 149
вает следы происхождения из сочетаний основы с местоимениями. Было бы заманчивым предположить, что развитие глагола как особого класса слов и было одной из предпосылок для появления предикат¬ ных способов обозначения понятий, постепенно в научном языке все более оттесняющих наглядные предметные обозначения. Но следует оговориться, что лишь у малого числа языков мира есть древние пись¬ менные тексты и для немногих семей языков осуществлена достаточ¬ но глубокая сравнительно-историческая реконструкция. Поэтому сформулированная гипотеза носит еще совсем предварительный харак¬ тер. Оживленное обсуждение в целой серии работ наших лингвистов с 40-х годов нашего века [16,17] вызвали грамматические гипотезы А. А. По- тебни, который еще более столетия назад предположил, что в архаичес¬ ких синтаксических конструкциях таких древних языков, как санскрит, можно видеть аналог такой передаче отношений между предметами, которая не соответствует прямой перспективе. Рассматривая глаголы, в древних индоевропейских языках управлявшие двумя падежами одного типа (двумя винительными, двумя творительными и т. п.), По- тебня приходил к выводу, что в этих языках не выражались те различия, например между непосредственно и опосредственно воспринимаемыми предметами, которые различаются в грамматике более поздних языков (ср. ’’услышать новость” и ’’услышать про новость” и т. п.). Трудность состоит, однако, в том, что не всегда в истории древних языков кон¬ струкции с двумя винительными (или вообще двумя одинаковыми) па¬ дежами исторически древнее конструкций с двумя различными паде¬ жами. Гипотетическая хронология разных этапов развития синтаксиса, предположенная Потебней на основе общих соображений, иногда не подтверждается письменными памятниками, в которых архаические (в смысле Потебни) формы могут появляться и позднее,-чем формы более развитого типа. Решение проблемы в большей степени зависит от того, на каких данных должны основываться заключения о языке архаического типа. В частности, было предположено, что выводы об отражении в языках архаического типа того неразвитого синтаксичес¬ кого строя, который предполагал Потебня, можно подтвердить дан¬ ными современных австралийских языков [18, 19]. Но прямо ли мы соотносим уровень культурного и социального развития австралийских аборигенов с характером их языков? Не были ли потеряны в этих язы¬ ках ранее в них существовавшие конструкции и формы? Последние исследования говорят об очень быстром темпе изменения языков вы¬ мирающих австралийцев. Архаический их тип может быть и результатом регресса. Еще более спорным остается вопрос о возможности выявления древ¬ них различий между языками не на основании их грамматической струк¬ туры, о которой преимущественно говорились выше, а на основании различий между их словарями. До сих пор не удалось установить таких отличий между словарными (лексическими) системами языков, которые однозначно свидетельствовали бы о разнице между картинами мира, ими передаваемыми. Разумеется, достаточно часто одно слово какого- либо языка (например, лицо в русском, face в английском и т. п.) может 150
соответствовать сочетанию слов (словосложению) в других языках, например северокавказских или уральских (финно-угро-самодийских), где в значении ’’лицо” употребляется соединение названий несколь¬ ких (чаще всего двух) частей тела, с ним связанных: ’’глаз” + ”рот” (из индоевропейских языков такой способ обозначения ’’лица” встречается в древнеписьменном тохарском языке на территории Восточного Турке¬ стана: ak-mal — ’’лицо”, где ак — ’’глаз”, родственно русскому око, mal — ”нос”). Но нельзя быть уверенным, что такой способ обозначения пред¬ мета означает первоначально другое его восприятие. Согласно точке зрения, развивавшейся В.Гумбольдтом, а позднее Сепиром, каждый язык навязывает свою модель мира. Это относится не только к описанию природных явлений. Лингвистика, лишь в послед¬ ние годы обратившаяся к серьезному исследованию словаря языка, обнаружила, что весьма существенные различия между языками обна¬ руживаются в системе конкретных слов (таких, как русские чашка, кружка, стакан, английские сир, mug и т. п.), соотносящихся с соот¬ ветствующими бытовыми предметами [20]. Различие между обо¬ значениями кружки пива и чашки кофе проявляется при сопоставлении таких европейских языков, как русский, английский, польский, рас¬ пространенных в обществах, где сама материальная культура, опре¬ деляющая форму и функцию этих предметов, достаточно единообраз¬ на. Вместе с тем выявляются и некоторые общие для разных языков черты, такие, как описание предметов в терминах, заимствованных из описания человеческого тела: ручка от рука и т. п. Существует (высказанная впервые еще в XVIII в. Вико) точка зрения, согласно которой и в этом (как во многих других существенных свойствах всех языков мира) сказывается антропоморфизм описаний мира, предла¬ гаемых естественным языком. С точки зрения соотношения универсальных и частных особенностей словаря языка интересны обозначения цветов. Особый интерес представляет локализация метаязыковых опе¬ раций, в частности метаязыковых высказываний (речевых сообщений о речи) у говорящих. Исследование людей, рано перенесших удаление од¬ ного из полушарий, а также афатиков и больных, подвергавшихся лечению электросудорожными шоками, заставляет прийти к выводу, что метаязыковые функции исполняются исключительно левым полу¬ шарием, в том числе и по отношению к тому языку, который локали¬ зуется в правом полушарии. Так, при размещении русского языка в левом полушарии, а туркменского — в правом метаязыковые операции, в частности грамматический анализ текстов на туркменском языке (в том числе с помощью русского), производятся только левым полу¬ шарием. Возможно, однако, что (как и целый ряд других особенностей размещения языков в мозге двуязычных людей) этот эффект зависит от школьного опыта, в частности от того, на каком языке человек учился в школе производить металингвистические операции [21—26]. Проблема соотношения разных полушарий при восприятии опре¬ деленных классов звуков вступила в новый этап благодаря исследо¬ ваниям японского ученого Цунода [27]. Применяя метод отсроченной звуковой обратной связи (delayed acoustic feedback), Цунода сопо¬ 151
ставил особенности восприятия разных классов звуков у лиц, гово¬ рящих на языках с различной структурой слога. Согласно выводам Цуноды, носители языков с открытыми слогами (японского и некото¬ рых полинезийских) резко отличаются от носителей других языков по степени участия левого полушария в обработке речевой и неречевой информации. У японцев и полинезийцев левое полушарие обрабаты¬ вает и согласные, и гласные звуки речи, а также неречевые звуки, включая и звуки японских музыкальных инструментов. В противо¬ положность этому у людей, воспитанных в среде языков не с откры¬ тыми слогами, на гласных и неречевых звуках специализируется преи¬ мущественно правое полушарие. Предположение о врожденном ха¬ рактере подобных отличительных способностей, в пользу чего могло бы говорить наличие австронезийского элемента в японском антропо¬ логическом типе и языке, опровергается исследованием японцев, вы¬ росших в неяпонской языковой среде и не обнаруживающих особен¬ ностей ’’японского” мозга, а также лиц других национальностей, вы¬ росших в японской языковой среде и разделяющих эти особенности с коренными японцами. Иначе говоря, предполагается, что именно сло¬ говая структура родного языка накладывает свою печать на мозг ре¬ бенка, формирующийся под воздействием этого языка. По отношению к японцам (но не полинезийцам) можно было бы также предположить, что перенос большего числа функций обработки акустических сигна¬ лов разных классов в левое полушарие мог быть полезен и при дальней¬ шем усвоении иероглифики, обработка которой производится преи¬ мущественно правым полушарием. Выводы Цуноды в случае, если они окажутся правильными, могут иметь большое значение и для изучения возможных воздействий других языков с открытыми слогами (таких, как праславянский) на их носителей. Но существует целый ряд еще не решенных вопросов, отсутствие ответа на которые заставляет мно¬ гих исследователей пока с осторожностью относиться к выводам Цу¬ ноды. Сомнения вызывает эффективность самого метода отсроченной звуковой обратной связи, представляющего довольно существенное вмешательство в обычный процесс восприятия звуков. Поэтому ре¬ зультаты Цуноды необходимо перепроверить с помощью других ме¬ тодов. В том, что касается гласных, дихотическое исследование вос¬ приятия у нормальных людей в языках, отличных от японского и поли¬ незийских, указывает на равную вовлеченность обоих полушарий, тогда как в патологии обнаруживается ббльшая значимость правого полушария. Если бы выводы Цуноды оказались верными, то в них можно было бы видеть доказательство того, что тип языка оказывает формирую¬ щее воздействие на мозг человека, воспитывающегося в данной язы¬ ковой среде. ЛИТЕРАТУРА 1. Бернштейн Н.А. Очерки по физиологии движений и физиологии активности. М.: Медицина, 1966. 350 с. 2. Иванов В.В. Из истории кибернетики в СССР. Очерк жизни и деятельности М.Л. Цетлииа // Вопросы кибернетики. Кибернетика и логическая формализация. 152
Аспекты истории и методологии. М.: Науч. совет АН СССР по комплексной проблеме "Кибернетика”, 1982. С. 166—190. 3. Нейман Дж. Вычислительная машина и мозг / Пер. с аигл. // Кибернетический сборник 1. М.: Изд-во иностр. лит-ры, 1960. С.1—65. 4. Цейтин Г.С. Черты естественных языков в языках программирования // Ма¬ шинный перевод и прикладная лингвистика. М.: Ин-т иностр. языков, 1974. Вып. 17. С. 134—143. 5. Крейновии Е.А. Юкагирский язык. М.: Изд-во АН СССР, 1958, 256 с. 6. Жолковский А.К. Синтаксис сомали. М.: Наука, 1971. 203 с. 7. Климов Г.А. Очерки общей теории эргативиости. М.: Наука, 1973. 211 с. 8. Том 3. Топология и лингвистика / Пер. с фр. с предисл. Ю.И. Манииа // Успехи матем. наук. 1975. Т. XXX, вып. 1, С. 199—221. 9. Гамкрелидзе Т.В., Иванов В.В. Индоевропейский язык и индоевропейцы. Тбилиси: Мецииереба, 1984. Т. 1. 351 с. 10. Виноград Г. Программа, понимающая естественный язык / Пер. с англ. М.: Мир, 1976. 254 с. 11. Френкель А.А., Бар-Хиллел И. Основания теории множеств / Пер. с англ. М.: Мир, 1966. 555 с. 12. Ekkehart М. Hopi Time. A linguistics of the temporal concepts in the Hopi language. N.-Y.; Amsterdam: Mouton-Springer, 1983. P. 341. 13. Бор. H. Атомная физика и человеческое познание / Пер. с англ. М.: Изд-во иностр. лит., 1961. 151 с. 14. Kurylowicz J. Esquisses linguistiques. MUnchen: W. Fink, 1975. Bd. II. 225 s. 15. Seiler H. Possession as an operational dimension of language. Cologne: Col. univ-ty, 1981.51р. 16. Кацнелъсон С. Д. К вопросу о стадиальности в учении Потебни / / Изв. АН СССР. Отд-ние литературы и языка. 1948. Т. 7, вып. 1. С. 83—95. 17. Виноградов В.В. Учение А.А. Потебии о стадиальности развития синтаксического строя в славянских языках j j Вести. МГУ, 1946. N 3—4. С. 84—91. 18. Десницкая А.В. Сравнительное языкознание и история языков. Л.: Наука, 1984. 253 с. 19. Кацнелъсон С.Д. Общее и типологическое языкознание. Л.: Наука, 1986. 283 с. 20. Wierzbicka A. Lexicography and conceptual analysis. Ann Arbor: Koroma Publishers, Inc., 1985. 321 p. 21. Capitani E.. Scott G., SpinnherH. Colour imperception in patients with focal excisions of the cerebral hemispheres // Neiiropsychologia. 1978. Vol. 16. P. 491—496. 22. Zaidel E. Concepts of cerebral dominance in the splitbrain // Cerebral correlates of consciousness / Ed. by C. Eccles. Amsterdam: Elsevier—North Holland Biomedical Press, 1978. P. 263—284. 23. Kitov N.. Kolev N.. Rene М.-C., Perraut F. L’aphasie d’un paintre // L’encepftale. 1969. N. 2. P. 377—417. 24. Galloway L., Scarcella R. Cerebral organization in adult second language acquisition: Is the right hemisphere more involved? // Brain and language. 1982. Vol. 16, N 1. P. 56—60. 25. Rappoport R.L., Ten C.T., Whitaker H.A. Language function and dysfunction among Chinese- and English-speaking polyglots cortical stimulation: Wada testing and clinical studies / / Brain and language. 1983. Vol. 18, N 2. P. 342—366. 26. Eepeiwrixq. Тарту: ТГУ, 1983, Вып. 16, 216 с. 27. Language functions and brain organization / Ed. by S. Segalowitz. N.-Y.: Academic Press, 1983. 372 p. 153 1
УДК 519.7:82.3.091 К ПРОБЛЕМЕ РАННИХ СТАДИЙ РЕЧИ И СОЗНАНИЯ (ФИЛОГЕНЕЗ) Ю.И. Манин ВВЕДЕНИЕ Пушкинская метафора ”дым столетий” точна: количество деталей, различимых историческим зрением, быстро падает, и субъективное время прошлого удобно отмечать в логарифмической шкале. Около двадцати лет назад родились Вы, или Ваш ребенок, или Ваш внук. Около двухсот лет назад родилась современная техническая циви¬ лизация. Около двух тысяч лет назад сформировалась духовная культу¬ ра, в которой живет современный (условно говоря, Западный евро- поцентричный) мир; к этому времени было сказано все, что мы зна¬ ем и сейчас о человеке как о социальном существе; были произне¬ сены все великие формулы морали; были кодифицированы все образ¬ цы человеческого поведения в отношении к богам, природе и людям. Нужды нет, что они противоречат друг другу, — мы таковы. Около двадцати тысяч лет назад, в верхнем палеолите, процесс гоминиза- ции, сделавшей нас таковыми, завершился биологически; человечес¬ кая конституция сложилась в современном виде; человек овладел раз¬ витой речью, изготовлял разнообразные каменные и костяные орудия. Где-то в середине этого двадцатитысячелетнего периода появился первый город — Иерихон, а ближе к началу нашей эры пала Троя, и сквозь ее пламя мы видим бесчисленные пожары Нового и Новейшего времени. Время, которое интересует нас в этой статье, — еще на порядок дальше: это интервал между 2104 и 2105 (может быть, 5105) лет до нашей эры. Десять тысяч праотцов отделяет каждого из нас от этой эпохи. К этому периоду относится процесс глоттогенеза, рождения речи и языка, развития органов речи и управляющих ими мозговых центров до современного уровня; формирование межполушарной асимметрии и кристаллизация человеческой психики, какой мы ее знаем сейчас. Научные представления об этом процессе накапливаются медленно и с трудом. Периоды умозрительных концепций сменяются времена¬ ми, когда сама постановка вопроса представляется ненаучной. Одна из трудностей любой эволюционной теории коренится в том, что мы всегда недостаточно знаем структуру того, чтб эволюционирует. Дело в том, что описание эволюции не есть описание истории как временнбго процесса: мы не пытаемся реконструировать все собы¬ тия, имевшие место, но лишь те, в которых менялся системный харак¬ тер изучаемого фрагмента действительности. Естественные языки как система подробно изучены на уровне фонологии, грамматики и в какой-то мере лексики. Благодаря такой направленности сравни¬ тельного языкознания появилась возможность глубоких реконструк¬ ций древних языков, и мы знаем словари ностратического и сино-кав- 154
казского языкового состояния, включающие несколько сот корней и относящиеся к дописьменному периоду, возможно, десятитысячелет¬ ней давности. Может ли компаративистика заглянуть намного дальше вглубь? Экспоненциальный распад основного словаря, постулируемый глоттохронологией для языкового развития, при продолжении назад означает полное исчезновение следов более раннего состояния [1,2]. До какого-то уровня дело спасает учет все более обширного совре¬ менного материала. Если мы хотим сказать что-нибудь о еще более ранней истории языка, мы должны отказаться от реконструкции слова¬ ря и начать следить за эволюцией других системных характеристик. Например, любое представление о структуре исполняемых языком функций позволяет поставить вопрос об эволюционном формировании этой структуры. Примем в качестве иллюстрации классификацию функций языка в зависимости от установки говорящего, по Р. Якобсону [3]: а)эмотивная (установка на выражение внутреннего состояния); б) конативная (установка на адресата с целью вызвать у него опреде¬ ленное состояние); в) поэтическая (установка на сообщение); г) мета- языковая (установка на систему языка); д) денотативная, когнитивная (установка на действительность); е)фатическая (установка на контакт). Обдумывая эту классификацию в эволюционном плане, мы можем кон¬ статировать, что эмотивная функция является наиболее архаичной и унаследована еще от животного состояния; что когнитивная и фати- ~ческая~ функции должны были играть огромную роль уже на первых стадиях глоттогенеза; что метаязыковая функция сформировалась поздно и ее преобладание характеризует очень своеобразные культуры, как древнеиндийская [4]. Конативная функция — один из особо инте- "рёсных для нас в этой статье сюжетов; мы попытаемся аргументиро¬ вать тезис о ее доминирующей роли на ранних стадиях глоттогенеза. Наконец, поэтическая функция, вероятно, неудачно выделена: при ориентации на эволюционный процесс генезис поэзии должен описы¬ ваться иначе. Переходя от эволюции словаря к эволюции системы функций языка, мы, однако, меняем предмет исследования — переходим от лингвистики к психолингвистике. Это означает, что внимание переориентируется с языка как знаковой системы на язык как феномен психики и сред¬ ство социального взаимодействия. Но психика человека эволюциони¬ ровала вместе с языком; более того, до окончательного формирования членораздельной речи не мог сформироваться и психический облик исторического человека. Следовательно, мы должны располагать и представлением о системной психике, которая могла бы меняться как система в диахроническом плане. Выбором такого системного описания будут определяться и вопро¬ сы, которые мы ставим. Например, мозг образует замечательно слож¬ ную материальную систему, которая обслуживает психику и является ее носителем. Поэтому законен и очень интересен вопрос об эволюции нейрофизиологических коррелятов психических процессов. С другой стороны, предположим, что нас интересует естественная история самосознания, представления живого существа о своем ”я”. Тогда окажется, что надежно переформулировать этот вопрос в проб¬ 155
лему эволюции центральной нервной системы мы не умеем. Исследова¬ тель в зависимости от своих ценностных установок либо откажется от такой задачи (таковы установки бихевиоризма), либо вынужден будет привлекать как можно более обширный материал, свидетель¬ ствующий о самосознании хотя бы косвенным образом: данные о пове¬ дении животных и психопатологии человека, сведения об эволюции синтаксического строя естественных языков и отчеты о действии гал¬ люциногенов; интерпретацию мифов и теорию баз данных; наконец, интроспекцию и мысленный психологический эксперимент. В начале века интроспекция и ’’понимающая психология” постепенно выходили из моды, и надолго стала влиятельной жесткая структурная схема организации психики по Зигмунду Фрейду, с топографией ’’Оно—Я—Сверх-Я” и четкими контурами теории развития этой сис¬ темы, как индивидуального, так н родового. Вероятно, нельзя считать исторической случайностью близость по времени возникновения та¬ ких концепций, как психоанализ Фрейда, теория фонетических зако¬ нов по младограмматикам, анализ волшебной сказки Проппом и принципы формальной школы в литературоведении. Критерии ав¬ торитетности и научности гуманитарного рассуждения сместились, образцом стали все в большей степени служить естественные науки, а течение психологии, избегшее абстракций фрейдизма, проявило склонность к превращению себя в науку о человеке как управляющем звене технологического процесса. Время покажет, наступает ли в конгломерате гуманитарных наук период нового синтеза. В этой статье мы занимаемся одним кругом вопросов психолинг¬ вистического характера, который связан со следующей проблемой. Стандартный прием исследования филогенетической эволюции сос¬ тоит в привлечении онтогенетических параллелей. В применении к истории речи и языка это означает, что мы должны сопоставлять раз¬ витие речи и истории гоминизации с развитием речевых навыков у ребенка. Но ребенок начинает говорить, лишь поскольку он погру¬ жен в речевую среду — вокруг него и с ним говорят взрослые. Кто был ’’взрослым” для раннего человека? В попытках ответить на этот вопрос мы обсуждаем два обсто¬ ятельства: неравномерность языкового развития индивидуумов и наличие на шкале речевого поведения двух полюсов, которые ниже условно названы ’’доминантным” и ’’субдоминантным”. Неравномерность языкового развития в историческое время прояв¬ ляется уже в том, что несмотря на демократизацию образования, такие национальные поэты, как Данте и Пушкин, настолько превос¬ ходят по своим языковым способностям общий уровень, что на столе¬ тия выступают учителями языка всей нации. Роль людей с выдающи¬ мися речевыми способностями, вероятно, была еще более значитель¬ на на заре становления языка. Мы противопоставляем доминантное и субдоминантное речевое поведение, грубо говоря, по степени участия в нем воли и сознания. В современной литературе, вопреки предостережениям А.С. Выгот¬ ского, речевое поведение рассматривается преимущественно как ком¬ петенция рациональных и целесообразных начал в человеческой пси- 156
хике. Если говорить упрощенно, предполагается, что при порождении речи в слове формируется (или оформляется) осознанная мысль, а при "восприятии речи эта мысль влияет на поведение воспринимающего опосредованно, через ее понимание и оценку. Именно такое поведе¬ ние мы называем доминантным, а скажем, некоторые типы поведения под гипнозом или в патологии — субдоминантным (см. ниже). Мы аргументируем позицию, согласно которой субдоминантное речевое поведение весьма архаично; оно играло важную роль в эпоху позднего глоттогенеза, после тысячелетий медленной, плохо артику¬ лированной и лексически бедной речи. Субдоминантное порождение речи — возможно, основная функция шаманов — могло быть мощным фактором суггестии, объединяющим первобытный клан независимо от степени понимания этой речи рядовыми членами клана. "Это архаичное говорение было в значительной мере речью вне языка, т. е. распространенными речевыми актами, не находящимися в рамках стабильной языковой системы. Парадоксальность представ¬ ления о речи вне языка, т. е. вне нормы, может быть несколько смяг¬ чена разными аргументами. Умелое ситуативное использование речи даже на незнакомом слушателю языке может быть вполне эффектив¬ ным. Специалист по искусственному интеллекту Э.В. Попов [5] от¬ мечает даже, что ’’благодаря ведущей роли смысла человеческая речь способна преодолеть практически любое сопротивление языка путем привязки речевого акта к той или иной ситуации”. К этому следует добавить, что „суггестивное воздействие речи предполагает актуали¬ зацию других.уровней значения, чем те, которые передаются словами сложившегося национального языка. В [3, с. 382] отмечено в ка¬ честве малоисследованной лингвистической задачи то обстоятельство, что языковая компетенция рядового индивидуума в роли слушающего, как правило, выше его же компетенции в роли говорящего. Мы уве¬ рены, что эта разница компетенций для древних людей была макси¬ мальной. Итак, концепция, обсуждаемая здесь, такова. Архаичной функцией речи в эпоху позднего глоттогенеза было программирование поведе¬ ния, в большей мере, чем сообщение информации. Носителями (потен¬ циального) языка были отдельные индивидуумы, в большей мере, чем социум. Порождение речи было вызвано мощными индивидуальными психологическими силами, действующими изнутри, в большей мере, чем общественными нуждами, хотя закрепление системы речевого поведения оказалось связано со способностью речи суггестивно объединять группу людей, превращая их в единый социальный орга¬ низм (в сочетании с ритуальным поведением). Кодификация и закре¬ пление структуры языка были долгое время сакральной функцией поколений жрецов-шаманов. Период распространения этого активного речевого поведения нового типа, совпавший с периодом превращения Homo sapiens в Homo sapiens sapiens, мог быть относительно коротким, поздним (50 ООО—20 ООО лет назад) и связанным с распространением по ойкумене специфического генотипа, условно говоря, кроманьон¬ ского, который вытеснил неандертальский, генотипа, несущего потен¬ ции новой человеческой речи. Этот относительно короткий период мог 157
быть также эпохой резкого повышения активности обоих полушарий головного мозга в связи с перестройкой межполушарных связей при_ формировании речевых центров; в таком случае не случайно его ко¬ нец в Европе совпадает с эпохой расцвета пещерной живописи. Отра¬ жением этого периода в мифологическом сознании служит комплекс черт ’’мифологического плута”. Формирование индивидуального са¬ мосознания относится к еще более позднему времени и завершается лишь в историческое время. Кратко говоря, можно утверждать, что речь предшествует языку, язык предшествует сознанию. Эта работа не является ни обзорной, ни полемической; это част¬ ная попытка рассмотреть проблему глоттогенеза в свете данных пси¬ холингвистики. Обзор различных точек зрения и современных иссле¬ дований можно найти в книгах [6—8]; особенно цельная и оригинальная концепция изложена в [9]. Я глубоко признателен Вяч. Вс. Иванову, Е.М. Мелетинскому, А. А. Нейфаху, В. А. Файвишевскому за многие стимулирующие обсуж¬ дения. В частности, роль суггестивной функции речи в филогенезе была аргументированно подчеркнута В.А. Файвишевским в ряде работ. РЕЧЬ И СОЗНАНИЕ Эксперименты Фромма В работе [10] описана серия гипнотических экспериментов со студен¬ том Доном. Отец и мать Дона были японцами американского прои¬ схождения. Дон родился за пять дней до нападения на Перл-Харбор. После этого нападения японцы, находившиеся в Америке, ’’нисеи”, были задержаны в Центрах для ’’перемещенных лиц” (которые Дон называет концлагерями). В результате детские годы Дон провел в японоязычной среде. К моменту эксперимента Дон, по его собственному утверждению, не говорил и не понимал по-японски, за исключением нескольких слов вроде arigato (спасибо), которым его научила бабушка. Один из экспериментов имел целью добиться ’’возрастной регрес¬ сии”. Во внушенном возрасте 7 лет Дон по-прежнему не понимал по- японски даже простых вопросов. Следующая стадия внушения перевела его в возраст около 3 лет, ”в день, когда он чувствовал себя хорошо и счастливо”. После недолгой паузы он возбужденно заговорил по- японски; монолог продолжался 15—20 мин. Возвращенный в семилетний возраст, он вернулся к английскому языку. К следующему аналогичному эксперименту был подготовлен маг¬ нитофон. Экспериментатор побудил Дона говорить по-японски не¬ прямым методом, использовав американское приветствие hi!, омо¬ нимичное японскому hai (”да”). Услышав это слово, испытуемый пов¬ торил его трижды и разразился потоком японской речи . Магнитофон¬ ная запись была позже прослушана и переведена. Сам Дон не помнил хода эксперимента в результате спонтанной амнезии (постгипнотическая амнезия может быть также внушенной). Слу¬ шая позднее запись, он мало что понимал. Он, однако, сумел вспом- 158
нить некоторые из своих мыслей во время говорения: он думал об ум¬ ной собачке с большими глазами, ее подарила мама, и он маму бла¬ годарил. Это воспоминание согласовалось с переводом магнитофонной записи. Вне гипнотического состояния Дон не помнил, что у него была собака, и полагал, что в Центре собаки были запрещены. С помощью нового гипнотического эксперимента, имевшего целью вызвать ’’скрытого наблюдателя”, удалось получить самоотчет Дона о его ощущениях во время японоязычной речи. [10, с. 82]: ’’Мои губы как будто сами вдруг стали так смешно складываться. Я хотел ска¬ зать что-то, но не знал, что/ я говорю на самом деле. Слова просто выходили сами, и я не знал, настоящие ли они. Самое удивительное было, что мускулы действовали помимо моей воли, как будто мое сознание (mind) в этом не участвовало”. Концепция доминантного и субдоминантного речевого поведения Мы будем понимать под речевым поведением производство или восприятие текстов, устных или письменных. Как уже упоминалось, речевое поведение изучается главным образом в его связи с рацио¬ нальными и волевыми инстанциями психики (ср. [11, с. 102] по поводу характерных формулировок). Такое речевое поведение мы будем называть доминантным. Описанные выше эксперименты Фромма доставляют образцы суб¬ доминантного речевого поведения. Когда Дон воспринимает гипно¬ тическое внушение, побуждающее его говорить по-японски, его пове¬ дение меняется не таким образом, каким оно могло бы измениться в обычной беседе. Когда Дон говорит по-японски, вопреки своему убеждению, что он этого делать не может, характер порождения речи также не таков, каким он бывает в нормальном состоянии. Хорошо известно, что у гипнабельных испытуемых прямое воз¬ действие слов экспериментатора может произвести амнезию, аналь¬ гезию и гиперестезию; положительные и отрицательные галлюцинации; каталептический мост; наконец, побудить испытуемого к отсроченному, постгипнотическому действию, истинный повод которого не осоз¬ нается. При таком воздействии речи на поведение сильно подавлены сознательные и критические механизмы ее восприятия; тем эффективнее оказывается само воздействие. Итак, в доминантной моде восприятия речи содержание речи осоз¬ нается, критически оценивается; реакция, речевая или поведенческая^ является произвольной. В субдоминантной моде восприятия содер¬ жание речи не подвергается критической оценке, уровень его созна¬ ния понижен, императивная компонента содержания речи приводит к непроизвольным реакциям (иногда такие реакции в норме и не бывают произвольными). По аналогичным признакам противопоставляется доминантное и субдоминантное порождение речи (см. самоотчет Дона и ниже): в субдоминантной моде речевой акт может стать полностью не¬ подконтрольным сознанию. Нельзя представлять себе, что субдоминантное поведение является только ущербным по отношению к доминантному: напротив, по ка¬ 159
ким-то параметрам оно может расцениваться как более эффективное. Сознание действует не как порождающий механизм речевого поведения, но скорее как фильтр, который задерживает или переориентирует действия и реакции, генерируемые более глубинными слоями психики. О выборе терминов В исследованиях по межполушарной асимметрии головного моз¬ га доминантным принято называть то полушарие, в коре которого находятся центры, управляющие речевым поведением (у праворуких в норме это левое полушарие). Противоположное полушарие называется субдоминантным. Наше предложение называть доминантным сознательное речевое поведение не противоречит духу этой терминологии. В более широком плане открытие межполушарной асимметрии часто рассматривалось как обнаружение нейрофизиологического коррелята большого количества оппозиций, обсуждавшихся ранее в разных областях исследования (ср. [12]). В [13] приведен неполный список таких дихотомий разных уровней, куда входят рациональное/инту¬ итивное, логическое/ образное, последовательное / одновременное, дискретное/непрерывное, сознательное/бессознательное и т.д., вплоть до таких широких культурно-исторических противопоставлений, как Запад/Восток. При этом сам характер корреляции таких пар друг с другом и с межполушарной асимметрией часто проблематичен и, во всяком случае, пока не может быть установлен на том же уровне стро¬ гости, на каком разными методиками и в разном материале обнаружи¬ ваются сами оппозиции. Тем не менее наличие корреляций представляется несомненным. Иными словами, мы полагаем, что все упомянутые оппозиции и мно¬ гие другие не без оснований выстраиваются в один ряд, хотя бы де¬ тальные связи между членами этого ряда оставались непрослеженными или плохо понятыми. В этих условиях удобно иметь родовые термины для двух членов постулируемой более фундаментальной оппозиции. Кажется, пара доминантный/субдоминантный могла бы эффективно выполнять эту роль. Пользуясь ею дальше в таком смысле, мы опре¬ деленно не постулируем конкретного участия механизмов разных полушарий в той или иной моде поведения, а лишь ставим вопрос о нем. Со всеми этими оговорками внимание к возможной неоднородности любого изучаемого материала по отношению к указанной оппозиции кажется полезным методическим принципом. Покажем это на примере двух конкретных исследований. Интересный цикл работ Фрумкиной, подытоженный в [14], посвящен изучению семантики цветообозначений естественного языка. При этом автор аргументированно отвергла любые системы семантических описаний, опирающиеся на науку о цвете (или же цветовосприятии): ”... наша исходная позиция состоит в том, что означаемое, сигнификат, раскрывается только через те отношения, которые устанавливаются между означаемыми во внутреннем мире говорящего”. Между тем рабо¬ 160
ты по межполушарной асимметрии с использованием временного уг¬ нетения одного из полушарий показывают, что лексика цветообоз- начений довольно четко делится на две группы по характеру своего сохранения в таких экспериментах. Так, простые цветообозначения ’’красный”, ’’черный” сохраняются при шоках доминантного полушария, тогда как ’’песочный”, ’’лимонный” (и, вероятно, такие выражения, как ’’цвета кофе со сливками” и т.п.) преобладают при шоке субдо- минантного полушария [15]. Возникает предположение, что ’’внутренний мир” испытуемого принципиально неоднороден уже в аспекте семан¬ тики цветообозначений и по-разному обрабатывает лексику из двух частей всего списка: типично доминантной и типично субдоминантной. Очевидно, это следует учитывать при организации эксперимента. Наш второй пример относится к проблеме ’’руки” в палеолитическом искусстве [16, 17]. В ’’репертуаре” верхнепалеолитического творчества известно большое количество оттисков ладони или кисти, намазан¬ ных охрой, на стенах пещер (реже встречаются оттиски черйой крас¬ кой и негативные изображения рук). ’’Гипотеза руки”, критике которой посвящена работа [16], состоит в предположении, что отпечатки рук суть ранняя стадия развития палеолитического рисуночного искусства, продолжением которой являются контурные анималистические рисунки (Столяр отвергает также старую концепцию, согласно которой отпе¬ чатки рук символизируют роль руки в трудовом процессе и гомини- зации предков человека). Столяр проницательно замечает что «си¬ луэтные эстампы отдельных рук и раннеориньякский контурный ри¬ сунок ’’зверя вообще” резко различаются как явления разной, генети¬ чески не связанной природы» (с. 24). Можно высказать гипотезу, что по своим психологическим корням отпечатки рук относятся к суб¬ доминантной категории, тогда как контурный рисунок — к доминант¬ ной (примерно такова точка зрения, высказанная в [17]. Согласно [15], ’’при угнетении правого полушария... кисти рук в целостном изображении человека обычно не представлены... При угнетении ле¬ вого полушария... чаще всего в целостном изображении человека представлены и кисти рук, и стопы, при этом может наблюдаться исключительно диспропорциональное увеличение их размеров”., Экспе¬ рименты с угнетением одного полушария, при которых испытуемым была бы представлена возможность выбора между техникой контурного рисования и техникой отпечатка, могли бы дать дополнительную информацию по этому вопросу. Филогенез речи неразрывно связан с формированием доминантности полушарий. Поэтому для темы нашей статьи существенны любые свидетельства о стадиях этого формирования. Вернемся теперь к субдоминантной моде речевого поведения. Ниже следует обзор некоторых относящихся к ней явлений. Эффекты внушения В обзоре [18] гипноз ставится в широкой контекст диссоциативных явлений психики. Согласно определению автора, ’’цель гипнотиче¬ ских процедур — привести испытуемого в состояние готовности к дис¬ социативному опыту (experience), нарушив обычную непрерывность I I- Зак. 1668 1 61
памяти и исказив или подавив ориентацию на реальность, посредст¬ вом прямой словесной суггестии, при выборочной концентрации вни¬ мания и невнимания и подходящей стимуляции воображения” (с. 226). Как подчеркивает В.А. Файвишевский, самое существенное в гип¬ нозе — измененное состояние сознания; повышенная внушаемость — лишь его эпифеномен. ’’Соскальзывание в гипноз подобно вывиху сус¬ тава”. Гипноз стал возможен лишь после возникновения речи. Когда гипнотическое состояние достигнуто, экспериментатор про¬ изводит то или иное словесное внушение и наблюдает поведенческие эффекты. Вот несколько типичных явлений. а)Гипнотическая амнезия. Согласно Хилгарду [18, с. 77], ’’первая и наиболее поразительная характеристика амнестического ответа — это власть слова при индуцировании и снятии амнезии”. В одном из экспериментов Хилгарда загипнотизированный Мэтт выучил список слов и получил внушение забыть его. Самоотчет Мэтта: ”Я не думал, что забуду эти слова, когда он велит мне забыть. Но потом я старался их вспомнить и повторить, и не мог. Первое слово или два вспоми¬ нались, а дальше никак. Потом и эти исчезали... Знаешь, что они где- то тут, прямо чувствуешь, что они тут, но на их месте пустота. До них невозможно добраться”. После снятия амнезии: ”Не то чтобы призошло озарение. Я должен был стараться вспомнить. Но теперь это удалось”. Степень произвольного участия испытуемого в достижении амне¬ зии может меняться. Некоторые гипнабельные испытуемые чувствуют, что они активно участвуют в амнестическом опыте, хотя не ощуща¬ ют ответственности за это. Самоотчет Мари: ’’Вдруг как будто экран появился между словами и мной... Странное ощущение, потому что знаешь, что что-то случилось, и чувствуешь себя глупо, потому что не можешь высказать это, и в то же время знаешь, что он сказал, что его слова забудешь... Как ни стараешься, не вспомнить... может, часа за два, но столько времени мне не дали”. После того как Мари сказали, что она может вспомнить все: ’’Экран вроде как медленно поднялся. Слова стали появляться, по одному”. б) Автоматическое письмо и автоматическая речь. Согласно клас¬ сическому описанию [19, с. 234], поле сознания человека может под¬ вергаться вторжению подсознательных импульсов к действию или бездействию, источника которых человек не сознает; соответствующие поведенческие реакции носят общее название автоматизмов. ’’Эти импульсы могут вызвать автоматическую речь или письмо, значения которых человек не сознает в самый момент их производства”. Постгипнотическая суггестия, на время или по сигналу, доставляет контролируемую технику порождения автоматизмов. Исполняя вну¬ шенное действие, испытуемый не сознает, что оно внушенное, и изоб¬ ретает его мотивировку. В эксперименте, описанном в [18, с. 200, 201], диссоциация была настолько полной, что и само действие не осозна¬ валось. Загипнотизированному испытуемому было внушено, что его левая рука потеряла чувствительность, а правая рука будет писать автоматически. Когда экспериментатор уколол левую руку иголкой, правая написала: ’’Ouch, damn it, you are hurting me”. Обе руки были 162
закрыты экраном и находились вне поля зрения испытуемого, который через некоторое время спросил, когда же начнется эксперимент. Другие образцы субдоминантного речевого поведения доставляют суггестивное обучение по Лозанову, аутотренинг и. т.п. Обилие име¬ ющегося материала здесь резко контрастирует с его теоретичес¬ кой неизученностью. Для дальнейшего обсуждения предположительной роли субдоми¬ нантного речевого поведения в процессе глоттогенеза существенно пред¬ ставлять себе, с какими свойствами личности связана высокая гипно¬ тическая внушаемость. Согласно [20, с.259, 260], гипнабельные люди не характерны ни патологией личности, ни слабостью ”я”, ни йнтро- вертностью. ’’Испытуемый — доброволец, проявляющий высокую гипнабельность, должен, по-видимому, быть охарактеризован скорее как в высшей степени общественная личность (которого привлекает группа и который способен ей противостоять)”. ’’Наиболее гипна- бельными по тесту Кэттелла оказываются самые открытые и власт¬ ные, и по тесту Гилфорда-Циммермана — самые общительные и поль¬ зующиеся достаточно сильным влиянием на окружающих”. Не вполне ясна роль эмоционального аспекта коммуникации при внушении; во всяком случае, с ним коррелирует степень императив¬ ности внушающего. Известно, что восприятие эмоционального аспекта речи часто является бессознательным и опирается на системы суб¬ доминантного полушария. Эмоциональная, субдоминантная семантика сообщения может восприниматься как главная, особенно если она про¬ тиворечит доминантной семантике прямого смысла слов. При этом, как отмечено Бассиным, «по своему ’’филогенетическому возрасту” он (эмоциональный аспект) не только не уступает аспекту содержа¬ тельно-смысловому, но в некоторых случаях его даже значительно пре¬ восходит. Этот ’’язык” врожденно воспринимаем не только всеми людьми Земли (независимо от их возраста и уровня культуры...), но даже высшими животными» [21, с. 22]. Глоссолалия, эхолалия, синдром Турретта Эхолалией называется непроизвольное повторение слушающим того, что он услышал (чаще — концов фраз или последних слов). Глоссолалия — это своеобразное речевое поведение, наблюдаю¬ щееся всегда в группах и всегда в контексте религиозных служб.Оно возникает вслед за некоторым состоянием транса и заключается в те¬ кучей речи, подобной речи на иностранном языке, непонятном для самого говорящего. Первые зафиксированные случаи глоссолалии связаны с ранним христианством. В ’’Первом послании к коринфя¬ нам” апостол Павел несколько раз упоминает это ’’говорение на язы¬ ках”, например в 14:2: ’’Ибо кто говорит на [незнакомом] языке, тот говорит не людям, а Богу, потому что никто не понимает [его], он тай¬ ны говорит духом”. Современные магнитофонные записи глоссолалии с несомненностью показывают, что эта речь не является речью ни на одном из естествен¬ ных языков. В то же время эти записи обнаруживают некоторые ин¬ 163
вариантные паттерны чередования ударных/безударных, интонации повышения/спуска в конце фраз и т.п., не зависящие от родного язы¬ ка говорящего. Вот образец (записан у индейца племени майя в Юка¬ тане): aria ariari isa, vena amiria asaria. У Данте (”Ад”, XXXI: 67) Немврод, первый царь Вавилона и стро¬ итель Вавилонской башни, стало быть, легендарный виновник диф¬ ференциации языков, произносит непонятную фразу: ’’Raphel mai amech zabi almi”. Интересно отметить, что по огласовке она очень напоминает цитированный глоссолалический запев. Наконец, редко встречающийся синдром Турретта [22, с. 351] сос¬ тоит в периодическом непроизвольном испускании, посреди нормаль¬ ной беседы, так называемой хульной речи, рычащих звуков, неприс¬ тойностей и др., что обычно относится к речевой компетенции субдо- минантного полушария. Почти все пациенты леворуки. Разобранные выше формы субдоминантного речевого поведения, возможно, отражают действие каких-то глубинных порождающих механизмов речи, не подвергнутое контролю высших инстанций. Смешанный случай субдоминантного поведения: «голоса» Слуховые галлюцинации (’’голоса”) представляют особо интересный образец субдоминантного речевого поведения, поскольку объединяют в себе субдоминантные порождение и восприятие речи. Трудным пред¬ ставляется вопрос о границах между нормой и патологией. Джейнз, из книги [22] которого почерпнуты следующие сведения, отмечает что после чтения лекций о голосах поразительно большое количество слушателей подходили к нему и рассказывали о своих голосах. Описано множество случаев слуховых галлюцинаций у шизофрени¬ ков (особенно до современных средств химической терапии, которые почти исключили классические формы заболеваний). Голоса могут как угодно относиться к пациенту: они беседуют, угрожают, клянут, критикуют, советуют, улещивают, утешают, издеваются, командуют, комментируют происходящее и предсказывают будущее, кричат, стонут; говорят медленно, быстро, в рифму, ритмично, на иностранном языке; два голоса могут обсуждать пациента. Очень существенно, что голоса обладают высокой степенью им¬ перативности; при независимости от контролирующего сознания, голос может побудить человека совершить самоубийство или, как в случае Жанны д’Арк, спасти страну и короля. Гипотеза Джейнза Одна из центральных концепций книги [22] основана на предполо¬ жении, что возбуждение слуховых галлюцинаций у человека связа¬ но с превышением некоторого порога стресса и что в древности этот порог был много ниже, а голоса слышал практически каждый человек, чем и определялось его поведение в критических обстоятельствах. Сознание современного человека, по Джейнзу, является весьма позд¬ ним психическим механизмом, заместившим следование голосам, которое воспринималось как следование голосу Бога (или богов). 164
”В бикамеральном человеке повиновение своему голосу и было заменой произвольности [действия]”. Распад этого поведения Джейнз относит примерно ко времени создания гомеровского эпоса, полагая, что в ’’Илиаде” зафиксировано еще архаическое состояние психики человека, управляемого голосами Богов, тогда как Одиссей — уже человек, обладавший современным сознанием (см. детальный разбор части аргументации Джейнза в [23]). Даже считая концепцию Джейнза чрезмерно жестко сформулиро¬ ванной, трудно отказаться от мысли, что в ней отражены существен¬ ные черты долгого процесса формирования современного сознания и ’’доминантной психики” в филогенезе. Сознание, диссоциации и компьютерная метафора ИтаКд психика древнего человека преимущественно субдоминант - на; современного — преимущественно доминантна; различие этих двух мод мы связываем с участием и развитостью сознания; так что следу¬ ет сказать несколько слов о сознании. Употребление этого слова никогда не имело терминологического характера: см. [24, 25], где обсуждены наиболее часто встречающиеся контексты. Мы попытаемся лишь выявить такие черты представления о сознании, которые существенны для целей этой статьи. Будем понимать под психикой совокупность информационных процессов, происходящих в центральной нервной системе, Мы ука¬ зываем, таким образом, на уровень рассмотрения: один и тот же про¬ цесс проведения импульса по нервному волокну мы не относим к пси¬ хике, пока и поскольку интересуемся его физическими характеристи¬ ками; но относим, если рассматриваем его в составе сигнала ”в поле зрения появилась косая черта”. Мы предполагаем, что часть психических процессов выполняет особую роль: информация, носителями которой они являются, есть информация о самой психике. В качестве первого приближения можно вообразить подробный план комнаты, лежащий на столе комнаты;' на этом плане есть изображение стола, а на нем — изображение са¬ мого плана. Введем теперь динамический аспект: предметы иа плане вырезаны из бумаги, их можно двигать, примеряясь к другой расста¬ новке мебели; план, таким образом, моделирует возможные состояния мира, информацию о котором он несет. Мы связываем представление о сознании с такими постулируемыми процессами внутри психики, которые: а) несут информацию о самой психике, т.е. рефлексивны; б) способны имитировать состояния психики, отличные от теку¬ щих, т.е. обладают моделирующей функцией; в) способны влиять на состояние психики в целом и через это на поведе¬ ние, т.е. обладают управляющей функцией. Согласно этому описанию, сознание есть относительно малый ’’функциональный” орган психики, динамическое содержание сознания включает очень обедненное и обобщенное отражение содержания те¬ кущих процессов психики, а также модели ее возможых состояний. 165
Почти вся психика относится к бес- или подсознательному. Сознание представлено достаточно изолированной частью динамических процес¬ сов в психике (иначе эта часть не сможет исполнять три упомянутые функции). Наконец, психика способна функционировать без того, чтобы ее специализированный функциональный орган, сознание, при¬ нимал активное участие в этом функционировании. Мера участия сознания в поведении — это а) мера отражения в соз¬ нании информационных процессов, обеспечивающих поведенческий акт (его начало, продолжение, завершение); б) мера роли сознания в формировании этих информационных процессов. Впервые обучаю¬ щийся игре по нотам осознает более значительную часть процессов, промежуточных между зрительным восприятием нотного текста и мо¬ торной реакцией пальцев, чем профессиональный музыкант: професси¬ онал сознательно решает начать игру, но бессознательно играет. Именно потому, что основной характеристикой сознания представ¬ ляется рефлексия (возможно, второго и более высокого порядка), участие сознания не является обязательным для таких действий, как реакция на внешние стимулы, использование навыков, речевое поведе¬ ние. вплоть до формирования суждений и творчества. Даже когда содержанием сознания кажется внешний опыт, это озна¬ чает лишь, что мы опускаем одну инстанцию в описании: ”я вижу” оз¬ начает ”я осознаю, что я вижу”, а если это не так, значит ”я вижу, не осознавая”. Психика может содержать два и более динамических отражений самой себя, с разным соотношением взаимно отражающих и управ¬ ляющих функций. Связанные с этим режимы функционирования психи¬ ки проявляются в широком спектре диссоциативных явлений [18]: кратные личности, автоматизмы, фуги, гипнотические феномены и т.д. Развитие речевой функции в процессе гоминизации открыло перед центральной нервной системой совершенно новые возможности для фор¬ мирования рефлексивных, моделирующих и управляющих механизмов. Может быть, самой принципиальной из них оказалась возможность сколь угодно точной рефлексии сколь угодно высокого уровня (дос¬ тижимой лишь на уровне социума, а не индивидуума). Идеология этого краткого очерка — соединение интроспекции с компьютерной метафорой. Интроспекция — „наше единственное прямое свидетельство о единстЬенном доступном нам сознании, своем; компьютерная метафора — единственный источник действительно сложных и динамических концептуальных моделей психики, способ¬ ных к саморазвитию и, в будущем, к сравнению с нейрофизиологи¬ ческими данными. Пользуясь этой идеологией, мы не пытаемся от¬ ветить на вопрос ’’что такое сознание”, но лишь выделяем его харак¬ теристики, которые представляются существенными. Если этими же ха¬ рактеристиками обладают какие-то техногенные информационные про¬ цессы, к ним можно, со всеми приличествующими оговорками, от¬ нести слово ’’сознание”. В таком именно плане в работе [5, с. 348] об¬ суждаются перспективы разработок компьютерных систем пятого поколения, допускающих общение с пользователем на естественном 166
языке: «С точки зрения модели себя (^модели системы) основное на¬ правление исследований лежит в создании систем, обладающих эле¬ ментами ’’самосознания”, т.е. способностями объяснить свои знания, возможности и состояния. Важность ’’самосознания” вызвана тем, что создание систем, понимающих и знающих ответ на любой вопрос поль¬ зователя (даже в ограниченноУпредметной области), недостижимо... По мнению автора, задача системы общения не в том, чтобы все понимать и знать, а в том, чтобы уметь объяснить пользователю, что система знает, что не понимает и почему. Единственным известным ав¬ тору средством решения указанной задачи является развитие ’’само¬ сознания”. Отметим, что необходимость ’’самосознания” является следствием не языка общения, а того, что для достижения цели в про¬ цессе общения система должна уметь в терминах, понятных пользо¬ вателю, выражать свои знания, свои состояния и причины затрудне¬ ний. Другими словами, необходимость ’’самосознания” является след¬ ствием не столько языка общения, сколько сложностью окружающе¬ го мира, обсуждаемого в процессе общения». Итак, в то время, когда пишется эта статья, ’’филогенез компью¬ теров” проходит стадию развития речи на естественном языке, и уже надвигается стадия развития ’’самосознания”, необходимость которой связана с потребностью в эффективном социальном функционировании. Предположительно, человеческая речь и человеческое сознание про¬ ходили в филогенезе гомологичные стадии в том же порядке. Раннее сознание — фильтр между психикой и поведением, новое сознание — канал связи между своей психикой и чужими психиками. Гомеровское ф^еуе^ и сознающее «я» Хорошо известно, что в разных культурах органом мышления, соз¬ нания, эмоциональной жизни считались сердце, пуп, печень — внут¬ ренние органы грудной клетки или брюшной полости. Например, ана¬ лиз гомеровских текстов, описывающих психические состояния (см. [23] и цитированную там литературу), показывает особую роль слова tpQEVEi^. Оно имеет двоякое значение: какой-то внутренний орган тела, диафрагма (в традиционном понимании) или легкие и сердце — и в то же время вместилище психики человека, сознания, эмоций. Распространена такая интерпретация этих свидетельств: они отра¬ жают отсутствие у древнего человека знаний о физиологии и роли центральной нервной системы. Люди ’’думали”, что сердце есть орган духовной жизни. Эта точка зрения страдает чрезмерным рационализ¬ мом и, что хуже, упускает роль психологической реальности, стоя¬ щей за этими представлениями. Современный западный человек также обладает ощущением лока¬ лизации своего ”я”, однако помещает его в голове, между глазами, в точке, смещенной вперед по отношению к центру черепной коробки. Эта позиция представляется почти само собой разумеющейся. Но эксперименты, связанные с сенсорной депривацией, когда человек проводит много часов в темном тихом помещении, погруженный в ванну с подсоленной водой при температуре тела, обнаруживают та¬ 167
кие измененные состояния сознания, при которых это ощущаемое рас¬ положение ”я” может сместиться в разные места внутри тела и даже спроецироваться вовне тела. Такие данные поддерживают представ¬ ление о сознающем себя ”я” как о рефлексивной структуре в ЦНС с планом психики , планом тела, планом окружения и буквальной лока¬ лизацией наблюдающего ”ego” на этом экране. Смещение ”я” есть сме¬ щение внутреннего наблюдателя. Поскольку со времен Гомера стандартное положение ”я” в теле из¬ менилось, оно должно считаться социально обусловленным. Поме¬ щение ”ego” в сердце, пуп, печень и др., отмеченное в разных культу¬ рах, фиксировало реальное самоощущение членов соответствующего социума. Приняв эту гипотезу как наполненную психологическим со¬ держанием, мы сможем сделать еще шаг и представить себе архаичные состояния расчлененного сознания. Два (или три) сознания египетского фараона, семь сознаний кетских шаманов должны подвергнуться психологическому изучению как возможные стадии на пути разви¬ тия человеческого сознания вообще. Современные материалы по рас¬ щепленному сознанию дают материал для изучения этого. АРХАИЧНОСТЬ СУБДОМИНАНТНОГО ПОВЕДЕНИЯ И ФИГУРА «МИФОЛОГИЧЕСКОГО ПЛУТА» Расщепленное сознание трикстера Вакдьюнкага 'Цикл мифов о трикстере, ’’мифологическом плуте” индейцев Вин- небаго, был получен в начале этого века в записи этнографом Пау¬ лем Радином и опубликован вместе со статьями П. Радина, К. Ке- реньи и К.Г. Юнга в книге [26]. Пятый эпизод этого цикла повеству¬ ет о том, как правая и левая руки Вакдьюнкаги боролись друг с дру¬ гом, после того как он (держа нож в правой руке) зарезал буйвола: «Вдруг левая рука ухватилась за буйвола. ’’Отдай, это мое! Отпусти,, не то я тебя зарежу!” — вскричала правая рука. — ”На куски тебя искромсаю!”. Левая рука выпустила буйвола, но тут же ухватилась за правую. И как только правая рука пыталась ободрать буйвола, ле¬ вая удерживала ее за запястье. Так руки подрались и дрались до тех пор, пока левая не оказалась изранена. ”Ах, зачем я это сделал(а)? Сам себе боль причинил(а)”. Левая рука сильно кровоточила». (Из немецкого перевода неясно, произносит ли последнюю реплику Вак¬ дьюнкага или его правая рука; левая рука, связанная с субдоминант- ным полушарием, характерно молчит.) Буквально такое поведение рук эпизодически наблюдалось у больных, перенесших комиссуротомию — операцию, разъединяющую два полушария головного мозга. ’’Один больной, в частности, описал такой случай: однажды он обнаружил, что его левая рука борется с правой при попытках надеть утром брю¬ ки. Одна рука тянула их вверх, в то время как другая вниз. В другом случае тот же больной, рассердившись, замахнулся левой рукой на свою жену, а его правая рука схватила левую, пытаясь ее остановить” [13, с. 44]. 168
Культурные герои и трикстеры Еще до того, как эффекты межполушарной асимметрии стали при¬ влекать всеобщее внимание, этот эпизод борьбы рук, как и другие ха¬ рактеристики Вакдьюнкаги, воспринимались публикаторами%ифоло- гического цикла как свидетельства о глубоко архаичном состоянии психики героя мифа. В частности, Радин писал [26]: ”Он [трикстер] живет еще в своем бессознательном, в детском состоянии психики, что и символизирует борьба его левой и правой рук, в которой левая оказывается тяжело пострадавшей” (с. 117). ”... его левая и правая руки борются, он сжигает свой анус и съедает собственные кишки, части его тела ведут независимое су¬ ществование и не исполняют свои собственные функции. Все происходит само собой, помимо его воли” (с. 117). ”В его фигуре воплощены смутные воспоминания архаичного и из¬ начального времени... Его голод, его сексуальность, его страсть к блуж¬ даниям не свойственны ни богам, ни людям. Телесно и духовйо они — из другого мира...” (с. 154). Сейчас можно слегка уточнить эти предположения. Расщепленное сознание трикстера могло быть характерным состоянием отдельных первобытных людей в эпоху нейрофизиологического оформления меж¬ полушарной асимметрии. Формирование речевых центров в коре ле- i вого полушария, связанная с этим перестройка межполушарной коопе- 1 рации и начало (или усугубление) дифференциации функций полушарий , могло служить постоянной основой неврологических дисфункций. Косвенные свидетельства в пользу этой гипотезы доставляет об¬ щий анализ мифологических мотивов, связанных с фигурой триксте¬ ра (см. подробнее [27]). ’’Мифологический плут” является комичес¬ ким спутником, братом-близнецом или травестией ’’культурного ге¬ роя”. Если сфера деятельности культурного героя — добывание огня, изобретение предметов культуры, кодификация поведения и уста¬ новление культурных запретов, то функции плута — уничтожение, нарушение, ложь и плутовство. Интересно, как эти архаические черты проглядывают в фигуре первосвященника Аарона, брата и духовного соратника пророка Моисея. Весьма характерна прежде всего мотивировка введения в по¬ вествование Аарона: Моисей, слышащий голос Бога, который пове¬ левает ему обратиться к сынам израилевым и призвать их к исходу из Египта, отговаривается своим косноязычием. Голос тогда велит приз¬ вать Аарона: ”... Я буду при устах твоих и устах его и буду учить вас, что вам делать. И будет говорить он вместо тебя к народу” (Исх. 4, 15—16). Аарон далее выступает толмачом Голоса, вещающего Мои¬ сею перед израильтянами и перед фараоном, так что, видимо, он ие только речист, но и полиглот. Когда фараон отказывается отпустить израильтян, именно Аарон осуществляет три первые теургические зна¬ мения — ’’египетские казни”: превращение посохов в змей и Др. Проис¬ ходит нечто вроде шаманской борьбы между Аароном и волхвами еги¬ петскими, и чары-чудеса Аарона оказываются сильнее. Сакральные функции Аарона, таким образом, сопряжены с исключительным владе- 169
нием речью, трюкачеством и, видимо, умением внушать коллективные гипнотические состояния (превращение воды в кровь). В то же вре¬ мя именно Моисей, несмотря на свое косноязычие, является провод¬ ником волн Голоса, тогда как в фигуре Аарона сохраняются черты мифологического плута. Табу нарушает, правда, не сам Аарои, но два его сына, за что их сжигает божественный огонь (Лев., 10,1—2; Чис., 3,4). Жадность Аарона проявляется в эпизоде с упреками Моисею за жену эфиопку (Чис., 12, 1—2), за что Мариам, жена Аарона, наказана семи¬ дневной "проказой”. Лишь в позднейшей традиции, как отмечает С. Аверинцев, Аарон приобретает образ идеального первосвященника, и архаичные приме¬ ты трикстера стираются. Плуты европейских мифологий также недвусмысленно обнаружива¬ ют черты, свидетельствующие о том, что они связаны с архаич¬ ной стадией речевой деятельности. В работе [28] читаем, например: "Целый ряд фактов указывают на то, что Гермес связан с непо¬ нятной речью, (гибельной, зло-вещей) ложью, бессмысленными зву¬ ками. В отличие от истины такие речи, во-первых, не-прямые, не-простые..., а во-вторых, не связаны с речевыми регистрами го¬ лоса. Во втором случае выделяются, с одной стороны, смех, шопот, бормотанье (...), а с другой стороны, — крик...”. Это описание хорошо согласуется с тем, что при прямой стимуляции определенных областей субдоминантного полушария, а также древ¬ ней лимбической системы регистрируются именно такие голосовые реак¬ ции. Вероятно, они были много более обычными в эпоху станов¬ ления левополушарной речи. Сама констатация неистинности снов и пророчеств возможна лишь на фоне достаточно развитой речи, функ¬ ция которой состоит в передаче истины. Следует учесть, что "истин¬ ность” снов и пророчеств еще весьма далека от привычной нам "ис¬ тинности” объективно проверяемых суждений. В них очень сильна императивная компонента, они побуждают к тому или иному вы¬ бору действий, и "истинность” является функцией от эффективности этих действий. Итак, трикстер — это воспоминание о человечестве, "которым речь учится говорить”; через которое впервые проявляются странные возможности речи — насилие запретов и ложь во их избежание; кото¬ рое начинает слышать речь всего окружающего — деревьев, воды, камней, собственного тела и богов и пытается разгадать этот язык; чье сумеречное и расщепленное сознание вспыхивает и гаснет; чьи "муки слова” являются также физическими муками, лишь слабое воспо¬ минание о которых мы храним через много поколений1. Более подробная интерпретация мотива трикстера приведена в статье автора "Мифологический плут по данным психологии и теории куль¬ туры” (Природа. 1987. N 7. С. 42—52). ‘Любопытно отметить в связи с нашей темой фигуру Феликса Крулля. Томас Мани, воспитавший в себе высокую чувствительность к мифологическим мотивам, безоши¬ бочно приписал этому современному герою-трикстеру почти магический и почти бес¬ сознательный полиглотизм — обстоятельство, которое следовало бы отмечать в исследо¬ ваниях по мифологизму в современной литературе. 170
Уроки санскрита Много позже периода начального становления древнеиндийская сан¬ скритоязычная культура зафиксирует и кодифицирует вполне созна¬ тельно это древнее состояние ’’говоримого” и ’’действуемого” человека, для которого Речь является субъектом говорения и действования. В работе [4], из которой заимствовано дальнейшее, выразительно описаны интересующие нас черты. Уже название речи у ведийских арьев vac не следует распространен¬ ной модели — по органу речи, языку во рту (русское — язык, древне¬ греческое — glossa, латинское — lingua и пр.). ’’Для древнеин¬ дийского языкового состояния назвать язык, считавшийся божествен¬ ным, по органу, служащему для его выявления, обнаружения, перехода из невидимого состояния в видимое, было бы недопустимым грехом механицизма, умалением вечной сущности языка. Язык-орган (jihviD не более чем проводник речи... vac как язык, речь, слово — не только и не столько некий результат говорения, внутренний объект соответству¬ ющего действия, сколько творческая сила (в смысле, который связывал с языком Гумбольдт)” [4, с. 6]. Это подчеркивание изнутри напирающей энергии речи, не подчинен¬ ной воле, но подчиняющей ее, совместимо с нашим предположением о субдоминантном характере праречи. Речь имеет своих хранителей и воплотителей; при этом существен ’’мотив создания мудрецами Речи как просеивания зерна с помощью сита” [4]. Мы усматриваем в этом мотиве метафору индивидуального сознания, фильтрующего, отсеивающего результаты действия порож¬ дающих механизмов речи в ЦНС, но также и метафору социальных механизмов отбора спонтанных речевых актов и формирование над речью нового структурного уровня — языка. „Напрашивается, по сути дела, естественное предположение, что древнеиндийский ’’грамматик” ведийского периода был одним из жрецов, контролировавших речевую часть ритуала... В этом случае получает свое объенение исключительное сходство операций, совер¬ шаемых ’’грамматиком”, с тем, что делает жрец [принесение жертвы. — Ю.М.]. Как и жрец, ’’грамматик” расчленяет, разъединяет на части первоначальное единство, целостность (текста, соответственно жертвы), идентифицирует разъятые элементы..., собирает воедино, синтезирует в новое единство более высокого плана эти элементы» (с. 10) . Грамматик-жрец обладал высокой чувствительностью к Слову. В каждом поколении каждого племени в предшествующие эпохи та- 2 Мифологема жертвоприношения как расчленения жертвы и разбрасывания ее частей по многим разным местам, реконструируемая в [4], может быть сопоставлена также с приемами анаграмматической зашифровки ключевых слов, в особенности имен бога, в древних мифоритуальных текстах, а также в современной поэзии. Психолингвистическое значение анаграмм нуждается в изучении. Напрашивается гипотеза о том, что анаграммы представляют собой некоторую имитацию правополушарной ”голографичности”, осуществляемую левополушарными средствами. В качестве (инвертированного) парал¬ лельного явления можно рассматривать чертеж или "мысленный эксперимент” как правополушарный аналог "вычисления” (осуществляемого манипуляцией над сим¬ волами). 171
кие люди должны были направленно отбираться, выделяться и вос¬ питываться. Вокруг них племя собиралось как вокруг станового хребта (гимн единения Ригведьг. sam gachadhvam sdm vadadhvam sam vo manansi janatam — ’’Вместе сходитесь! Вместе ведите речь! Вместе настраивайтесь в ваших помыслах!”). Сильный, властный, активный (и легко внушаемый) вождь племени и жрец-шаман, глоссолалиру- ющий, плутующий, слышащий голоса богов, полубезумный — эти две фигуры, вероятно, отразились в паре культурный герой/трикстер. Сгущающееся сознание Развитие сознания современного ребенка есть результат взаимо¬ действия двух типов процессов: нейрофизиологических (рост и соз¬ ревание нейронов, установление связей), которые происходят в нерв¬ ной системе, и социальных (обучение речи, социальному поведению, восприятию других людей и через них себя), которые обеспечивают¬ ся взаимодействием ребенка с другими, взрослыми, людьми. Огонек сознания разгорается в мозгу — социальное сознание ’’сгущается” и питает это пламя. Филогенез сознания должен быть реконструирован как такой же двойной процесс. Коллективное сознание предшествует индивиду¬ альному и является тем полем, средой, ’’грибницей” (К.Г. Юнг), из которой кристаллизуются индивидуальные самосознания. Реликтом эпохи ’’коллективного сознания” является, вероятно, зафиксированное в различных ранних юридических установлениях отсутствие противопоставления так называемой отчуждаемой собствен¬ ности (земля, имущество, дом) и неотчуждаемой собственности че¬ ловека (органы тела). ”... В законах Ману (VIII. 125), где излагаются десять видов объектов наказания, имущество как один из них вклю¬ чается в список, попадая при этом между ухом и туловищем” [29, с. 95]. Нанесение увечья вору не есть просто наказание — это есть воздеяние, эквивалентное проступку, ибо хищение собственности че¬ ловека равно нанесению ему увечья. Первобытное ”я” имело размеры ”я плюс мое имущество плюс мое племя”. Притом это отождествле¬ ние было данным первично, и не результатом волевого или рациональ¬ ного усилия, оно совершалось ”на минимальном уровне рефлексии” [Там же]. Следы этого состояния сохраняются очень поздно, вплоть до появления авторского типа литературного творчества. До этого речь не есть и не может быть принадлежностью индивидуума. Ее про- фанные, низшие виды принадлежат племени (племенной язык и есть ’’человеческий” язык), а сакральная речь принадлежит богам и лишь передается от поколения к поколению. Впервые человек осознает себя, когда начинает говорить от сво¬ его имени. В современной психологии феномен ’’расширяющегося сознания” играет маргинальную роль и практически находится вне поля зрения; называемое этим именем состояние, индуцированное приемом галлюци¬ ногенов, вероятно, является лишь эрзацем естественного примитивного сознания. В художественной литературе имеется глубокое описание пси¬ 172
хологии участника ночной атаки, где слом атаки описан именно как следствие слома первоначального коллективного сознания ата¬ кующих. Внезапное установление такого сознания в экстремальных ситуациях есть один из фундаментальных законов психологии боя. ИСТОРИЯ ЯЗЫКА И СОЗНАНИЯ И НЕКОТОРЫЕ ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ ОБЩЕЙ СЕМИОТИКИ Семиотика и большие системы Любые нынешние догадки о ранних стадиях языка и сознания поневоле выражаются метафорически из-за отсутствия надлежащего понятийного языка. Недостаток метафоры — не в том, что она неточна или неис¬ тинна, а в том, что она сопротивляется организации в систему. Науч¬ ная модель явления также может быть ложной или грубо приближен¬ ной, но ее преимущество — в том, что она входит в систему научного знания, которая эту модель поддерживает, питает извне и несет по¬ тенциал ее улучшения или смеиы. Метафора, выраженная на естест¬ венном языке, полагается лишь на самое себя; она гибнет или выжи¬ вает безотносительно к истине. ’’Компьютерная метафора” имеет, одиако, другой характер. То, что эта метафора призвана отобразить, — центральная нервная сис¬ тема и ее функции — является биологической большой системой. То, чем эта метафора пользуется в качестве образа, — компьютер, вы¬ числительный процесс, база данных — является техногенной боль¬ шой системой. Сама метафоризация есть динамическая, творческая и долговременная деятельность по наложению, примеркам и при¬ кидкам нашего разветвленного и точного знания о технологических процессах переработки информации к биологическим процессам. Любой промежуточный результат этой деятельности может быть (и, как правило, будет) отвергнут. Но в ходе этой деятельности медлен¬ но кристаллизуется новое знание. Основной постулат семиотики состоит в гипотезе о структурном подобии различных знаковых систем и возможности выделить иде¬ альный объект исследования — ’’знаковую систему”. В этом пункте мы обсудим возможность семиотического подхода к протопонятию ’’большая система” и соответствующего расширения компьютерной метафоры, которое представляется нам совершенно необходимым. На надлежащем уровне рассмотрения большими системами явля¬ ются вселенная, галактика, общество, биоценоз, биологический вид, экономика, промышленная отрасль, армия, ЭВМ, симфонический оркестр, организм, мозг, клетка, метаболизм. Большую систему нуж¬ но представляеть себе прежде всего как некоторую физическую дан¬ ность, подлежащую и поддающуюся естественнонаучному изучению. Ее пространственные характеристики образуют ее структуру, а вре¬ менное — поведение и эволюцию. В научном знании каждая боль¬ шая система представляется в виде совокупности относящихся к ней моделей. Модель обычно учитывает лишь часть объектов и процессов системы и притом рассматривает эту часть достаточно суммарно, 173
блочно, обобщенно. Интеграция моделей, относящихся к одной и той же системе, либо является новой моделью, либо совершается вне уровня научного знания — в индивидуальном или коллективном соз¬ нании, в действиях людей, обслуживающих, изучающих или исполь¬ зующих большую систему. Исторически новый метод интеграции мо¬ делей — компьютерная интеграция. Предметом общей семиотики должен быть уровень информационных процессов (в других контекстах — знакового или символического поведения) большой системы, притом те аспекты этого уровня, ко¬ торые поддаются сравнению во всех больших системах. Плодотворность такого сравнения может проявиться при двух условиях: а) сравниваемые системы достаточно хорошо изучены сами по себе; б) семиотические аналогии между ними нетривиальны. Струк¬ турализм в стиле Леви-Строса изобилует такими семиотическими со¬ поставлениями на уровне структура языка/структура социального поведения. Методологические этюды Р. Тома добавляют к этому сопоставления морфогенез/синтаксис/особенности гладких отоб¬ ражений и т.д. Справедливо предположить, что такие сопоставления по своему гносеологическому статусу подобны ’’компьютерной мета¬ форе”. Тогда будет понятно, что практически все они в своей конкрет¬ ности должны быть отвергнуты. Но если они станут исторически пере¬ ходящей стадией развития длительного процесса сравнительного изу¬ чения больших систем, тогда они сохраняют свое значение как рост¬ ки новой методологии. С точки зрения традиционного понятийного аппарата семиотики этот подход подразумевает обращение иерархии основных понятий. Если считать исходным понятием семиотики ’’знак”, то исходным протопонятием общей семиотики будет ’’информационный процесс”, а ’’знак” — возможно, последним результатом анализа данного клас¬ са информационных процессов. Есть все основания думать, что в будущей теории гомологи таких понятий, как ’’база данных” или "память”, следует относить к более элементарному уровню, чем "знак”. Так, во всяком случае, развиваются наше знание больших биологических систем и проектирование больших технических сис¬ тем. В пользу этой же точки зрения говорит известное явление ин¬ формационной безразличности материальной природы знака (ср. в лингвистике тезис о произвольности языковых знаков). Следующие разрозненные замечания относятся к некоторым пробле¬ мам общей семиотики. Проблема объективного выделения информационных процессов При естественнонаучном анализе большой системы информацион¬ ные (знаковые) аспекты ее поведения не могут считаться известными априори, оии должны как-то изолироваться в процессе анализа. По¬ пытки сформулировать критерии такой изоляции приводят к следую¬ щим предварительным наметкам. а) Критерий «спускового крючка». К информационным (сигнальным) процессам следует относить те, которые при прочих равных усло¬ 174
виях вызывают или прекращают другие процессы, энергетический масштаб которых значительно превосходит масштаб сигнального процесса. б) Критерий системности. Сигнальные процессы выделены пра¬ вильно, если анализ позволяет выявить черты их организации в систе¬ му: ’’речь” подчинена ’’языку”. в) Критерий автономности. Развитые информационные процессы имеют тенденцию образовывать "замкнутые вихри”, ’’сети”, ’’жесткие структуры” и пр., которые хорошо изолированы от обратного вли¬ яния на них высокоэнергетической материальной жизни системы. Обнаружение таких процессов и хранилищ, наоборот, позволяет пред¬ положить, что они выполняют информационные функции. Проблема многоязычия Большая система может пользоваться многими разными языка¬ ми, которые обслуживают разные уровни информационных процессов. Выявление и описание таких языков — важнейшая задача. Взаимоотно¬ шения языка (точнее, соответствующих информационных процессов) со своим окружением грубо описывается вариантом традиционной семиотической триады: язык чем-то производится, на что-то воздейству¬ ет и несет информацию о чем-то. Взаимодействие языков разных уров¬ ней изучено значительно хуже. Традиционное отношение между текста¬ ми на двух естественных языках — ’’один текст является перево¬ дом другого” — основано на идеализации существования общего значения двух текстов, который и сохраняется при переводе. Эта идеализация плохо работает уже в случае, когда один из текстов является программой на алгоритмическом языке, а другой — ее пере¬ водом в машинные коды. Значение первого текста определяется ха¬ рактером его взаимодействия с головным мозгом программиста, а смысл второго — с hardware компьютера. Гумбольдтовский те¬ зис о том, что высказывание само по себе не несет информации, вы¬ ступает в этой ситуации еще более выпукло. Язык программирования есть посредник между ’’внутренними мирами” человека и ЭВМ. Необ¬ ходимость такого медиатора вызвана несоизмеримостью элементар¬ ных семантических единиц этих миров. В частности, то, что элемен¬ тарно в А, может быть сложной конструкцией в В, и наоборот. В той мере, в какой языковое поведение большой системы должно обладать моделирующими возможностями по отношению к Миру, т.е. к другим большим системам (и к себе самой), такая семантическая несоизме¬ римость представляется естественной, если постулировать, что Мир представлен в большой системе иерархией моделей, так же как и в общечеловеческом научном Знании. С этой точки зрения (как и с ряда других) естественные языки можно рассматривать как изоморфные представления одного языка, который обладает значительным интегрирующим семантическим по¬ тенциалом. В особенности научная речь активно пользуется этим потенциалом, постоянно порождая выражения, семантика которых на¬ ходится выше уровня любой конкретной модели Мира или его части. 175
Оборотной стороной этого являются чрезвычайно бедные возможности естественного языка в отношении алгоритмической переработки тек¬ стов на нем, сохраняющей некоторые свойства ’’истинности”. Омонимия текстов на естественном языке, как она ни обильна, ис¬ черпывается перефразировками. Омонимия языка алгебраических вы¬ ражений несравненно более содержательна. Выполнение любого рас¬ чета, решение любой математизированной задачи с формально линг¬ вистической точки зрения может рассматриваться как перефрази¬ ровка условий задачи в ее решение по известным заранее пра¬ вилам. Однако эквиваленты этого процесса отсутствуют или не ха¬ рактерны в естественном языке. Для иллюстрации стоит вспомнить, что одним из первых языков математики, отделившихся от естест¬ венного языка, была позиционная система записи чисел. Ее фунда¬ ментальное преимущество состояло в том, что арифметические опера¬ ции над позиционными записями могут выполняться алгоритмически, а не с помощью бессистемной серии рецептов ad hoc. Римская запись целых чисел, промежуточная между словесной и позиционной, не обладает никакими преимуществами позиционной, кроме краткости; по своим структурным свойствам она почти тождественна системе словесных обозначений. Н. Бор отмечал, что математические обозначения важны в силу того, что они не несут никакой априорной семантической нагруз¬ ки, а позволяют рассматривать акт интерпретации как независимую мыслительную операцию. В соединении с обильными возможностями алгоритмической переработки это обстоятельство и определяет огром¬ ные моделирующие потенции математики. Существует ли ’’матема¬ тика мозга” и какие языки и структуры ее обслуживают? Очевид¬ но, что почти все содержание бессознательного должно относиться к такому информационному поведению просто потому, что любой алгоритмический процесс переработки информации, пока он про¬ исходит, не терпит вмешательства извне, кроме подачи входных данных и сигнала начать их обработку. Оппозиции и организация поведения Комбинаторный аппарат двоичных (иногда троичных) противо¬ поставлений (ср. [12]), широко применяемый в структуралистски ориентированных исследованиях, часто сближается с бинарной сис¬ темой записи чисел или булевой алгеброй классификационных приз¬ наков. Леви-Строс, констатируя основные оппозиции мифологичес¬ кого мышления, усматривает в них раннюю стадию развития логи¬ ки. Не оспаривая этого, мы хотим подчеркнуть специфику семанти¬ ки оппозиционных пар и черты этой семантики, имеющие, так сказать, ’’субдоминантный” характер (если логику, в духе обсуждения в разде¬ ле ’’Речь и сознание”, относить к ’’доминантной” области). Чтобы понять эту специфику, рассмотрим статус членов оппози¬ ции и самого их сопоставления. Отдельный член оппозиции, как ’’природа”, "культура”, ’’верх” и т.п. в других контекстах может, как термин, вводиться определе¬ 176
нием. и—предел—ение (ае—пп—ню; есть указание пределов, гра¬ ниц явления, обозначаемого данным термином. Вне пределов находится нечто другое. То, что говорит оппозиция о своих членах, вовсе не есть указание этих пределов; напротив, это указание некоего ядра, бассейна при¬ тяжения, аттрактора. При наложении оппозиции на реальность, при ее семантическом наполнении, элементы реальности начинают тяготеть к тому или иному полюсу, как опилки в магнитном поле. Одна и та же оппозиция, например добро/зло, может накладываться на реальность разными способами, включая собственную инверсию; одна оппозиция может быть символом или метафорой другой. Человеческое поведе¬ ние имеет тенденцию организовываться в систему даже тогда, когда в этом нет прямой социальной или биологической необходимости; как дети, мы предпочитаем ступать по квадратикам. Оппозиции помогают организовать систематическое поведение без того, чтобы сама конкрет¬ ная система поведения была обязательной в высшем плане. Элементар¬ ный пример этого — символика цветов в разных культурах. Мы полагаем, что эта функция оппозиций противостоит познава¬ тельной и является более архаичной по своей природе. Анализ Леви-Строса должен быть уточнен в плане выяснения того, какие из существенных для первобытного мышления оппозиций являются действительно ’’преднаучными”, а какие в широком смысле слова произвольны. Кроме того, как мы уже предполагали в другом месте, постулируемая Леви-Стросом медиация "эмоционально напряженных” оппозиций, вероятно, является артефактом исследовательской методи¬ ки. Целостное состояние психики представляется более архаичным, чем внутренне конфликтное, и в диахроническом плане мифы скорее фиксируют процесс рождения оппозиций, чем их медиацию. Проблема семантических примитивов В современной культуре язык осознается в первую очередь как средство передачи объективного знания. "Лингвистический крити¬ цизм” направил свои усилия на упрочнение и очищение именно этой функции языка. Организация поведения выступает как вторичное яв¬ ление и обычно понимается как организация эффективного поведения. Если принять точку зрения, согласно которой само по себе упорядоче¬ ние поведения является первичным явлением, "субдоминантным” по существу, то в новом свете предстанут роль табу и первичная семан¬ тика отрицания. В самом деле, любая организация поведения в первую очередь требует ограничения степеней свободы большой системы (типологи¬ ческая параллель — синергии в организации движений по Бернштей¬ ну), и в смысле Тома сигнал, способствующий этому, является ка¬ тастрофой. Такие сигналы образуют самый фундаментальный класс семантического тезауруса. А. Вежбицка, анализируя семантические примитивы, возвела отрица¬ ние к "nolo" — ”не хочу” [30, с. 239). Точнее было бы возводить его к "noli" — ’’нельзя”, как убедительно показано в [9]. 12. Зак. 1668 177
ЛИТЕРАТУРА 1. Иллич-Свитыч В.М. Опыт сравнения ностратических языков: Сравнительный словарь в—К. М.: Наука, 1971. 370 с. 2.Дыбо В.А., Терентьев В.А. Ностратическая макросемья и проблема ее временной локализации // Лингвистическая реконструкция и древнейшая история Востока: Тез. докл. конф. М.: Наука, 1984. Ч. 5. 45 с. 3. Якобсон Р. Избранные работы. М.: Прогресс, 1985. 455 с. 4. Топоров В.Н. Санскрит и его уроки // Древняя Индия. М.: Наука, 1985. С. 5—29. 5. Попов Э.В. Общие с ЭВМ на естественном языке. М.: Наука, 1982. 360 с. 6. Glossogenetics. The origin and evolution of language / Ed.by E. de Grolier. Cluer: Harwood, 1983. 654 p. 7. Якушин Б.В. Гипотезы о происхождении языка. М.: Наука, 1985. 137 с. 8. Чуприкова Н.И. Психика и сознание как функция мозга. М.: Наука, 1985. 200 с. 9. Поршнев Б. Ф. О начале человеческой истории (проблемы палеопсихологии). М.: Мысль, 1974. 187 с. 10. Fromm Е. Age regression with unexpected reappearance of a repressed childhood language // Internat. Journ. of clinical and experimental hypnosis. 1970. Vol. 18. P. 79—88. П.Дридзе T.M. Текстовая деятельность в структуре социальной коммуникации. М.: Наука, 1984. 321 с. 12. Иванов Вяч. Вс. Чет и нечет. М.: Сов. радио, 1978. 123 с. 13. Спрингер С., Дейч И. Левый мозг, правый мозг. М.: Мир, 1983. 234 с. 14. Фрумкина P.M. Цвет, смысл, сходство. М.: Наука, 1984, 175 с. 15. Николаенко Н.И. Функциональная асимметрия мозга и изобразительные способ¬ ности II Текст и культура, труды по знаковым системам. Тарту: ТГУ, 1983. Вып. XVI. С. 84—89. 16. Столяр А.Д. О "гипотезе руки” как традиционном объяснении происхождения палеолитического искусства // Первобытное искусство. Новосибирск: Наука, 1976. С. 8—24. 17. Иванов Вяч. Вс. Об одном типе архаичных знаков искусства и пиктографии // Ран¬ ние формы искусства. : Искусство, 1972. С. 105—147. 18.Hilgard E.R. Divided consciousness: multiple in human thought and action. N.Y.: Wiley and Sons, 1977. 423 p. 19. James W. The varieties of religious experience. Boston: Penguin, 1982. 876 p. 20. Шерток Л. Непознанное в психике человека. М.: Прогресс, 1982. 234 с. 21. Бассин Ф.В. О современном кризисе психоанализа // Вступительная статья к [20]. 22. Jaynes J. The origin of consciousness in the breakdown of the bicameral mind. Boston: Houghton Mifflin C°, 1976. 253 p. 23. Иванов Вяч. Вс. Структура гомеровских текстов, описывающих психические состояния I/ Структура текста. М.: Наука, 1980. С. 81—117. 24.Popper R.R., Eccles J.G. The self and its brain. An argument for interactionism. N.Y.: Springer, 1977. 654 p. 25. Дельгадо X. Мозг и сознание. М.: Мир, 1971. 264 с. 26.Jung C.G., Kerenyi К., Radin P. Der Gdttliche Schelm. Ein Indianischer Mythen- Zyklus. Zurich: Rhein Verlag, 1954. 354 s. 27. Мелетинский E.M. Первобытные истоки словесного искусства // Ранние формы искусства. М.: Искусство, 1972. С. 149—189. 28. Менская Т.Б. AMHXANOZ EPOZ в контексте мифа о Гермесе // Структура текста. М.: Наука, 1980. С. 174—183. 29.Романов В.Н. Из наблюдений о композиции "Махабхараты” // Древняя Индия. М.: Наука, 1985. С. 88—104. 30. Семиотика / Под ред. Ю.С. Степанова. М.: Радуга, 1983. 626 с.
УДК 681.3.01:003 КОГНИТИВНЫЕ МОДЕЛИ В ИССЛЕДОВАНИИ МЫШЛЕНИЯ: СТРУКТУРА И ОНТОЛОГИЯ ЗНАНИЯ В. М. Сергеев Целью настоящей работы является попытка корректно поставить и по крайней мере частично наметить пути для ответа на два следу¬ ющих вопроса. В чем с точки зрения анализа когнитивных механизмов состоит отчетливое интуитивное различие в структуре и функционировании математического (или математически ориентированного) знания, с одной стороны, и гуманитарного знания — с другой? Каковы когнитивные механизмы онтологизации знания, т.е. какие мыслительные операции приводят к тому, что возникают новые по¬ нятия, а их комбинации обретают статус истины? При всем видимом различии эти два вопроса оказываются чрез¬ вычайно тесно связаны. Ясно их поставить и ответить на них можно только в том случае, если разобраться достаточно глубоко в струк¬ туре человеческих умозаключений. Несмотря на то,что эти вопросы в той или иной форме ставятся уже очень давно, только в настоящее время в связи с интенсивным развитием когнитивной науки расши¬ ряются возможности научного анализа. Умозаключения стали предме¬ том не только интуитивного постижения, но и компьютерного моде¬ лирования [1—3], что создало принципиально новые возможности для понимания проблем, связанных со структурой и онтологией знания. Сопоставление формально-логического и когнитивного подходов. Прежде чем переходить к анализу поставленных выше вопросов, пос¬ мотрим, чем же отличается моделирование умозаключений с помощью специальной техники представления знаний (семантических сетей, аппарата теории концептуальной зависимости и пр. [1, 3]) от исполь¬ зования формальных логических исчислений [4, 5]. Конечно, формально-логические исчисления являются одной из форм представления знаний. Имеется, однако, принципиальное разли¬ чие между традиционным формально-логическим и когнитивным подхо¬ дами. Формальные логические системы оперируют не с понятиями, а с утверждениями. Эти утверждения имеют вид предикативных форм с кванторами, например: ”Все А обладают свойством В” или ”Не¬ которые А суть В" и т.д. В силу самой задачи — выделения универсаль¬ ных аспектов умозаключения — формальные логические системы ниче¬ го не говорят ни о структуре понятий, ни о контекстах их исполь¬ зования. Чрезвычайно важным, однако, оказывается следующий факт: эти универсальные аспекты умозаключений, экстрагированные факти¬ чески из текстов естественного языка, слишком бедны для того, чтобы хоть сколько-нибудь подробно промоделировать естественные умозаключения человека, что стало совершенно ясно в результате развития исследований в области искусственного интеллекта. Неболь¬ шого фиксированного числа логических связок и кванторов явно не¬ достаточно для этой цели. 179
Попытки ввести модальные операторы в формальные логические системы (см., например, монографию [6]) приводят к сильно раз¬ росшемуся и усложнившемуся аппарату, причем большинство правиль¬ но построенных формул оказывается неинтерпретируемыми, а часть — парадоксальными [7]. С начала 70-х годов недостатки логических исчислений в задачах моделирования умозаключений достаточно хо¬ рошо осознаны [8]. В отличие от формально-логического подхода когнитивный подход к анализу умозаключений основывается на сле¬ дующих положениях: необходимость экспликации структуры понятия; изучение взаимосвязи структуры понятия и контекста его использо¬ вания; изучение зависимости правил вывода от структуры понятия. Иллюстрация: сюжетные единицы. В большей части публикаций по методам представления знаний исследуются экспликационные средства, позволяющие строить сложные понятия из простых и связы¬ вать эти понятия в цепочки умозаключений. В качестве примера рас¬ смотрим формализм, предложенный в статье [9], и покажем, как работает механизм естественного вывода в рамках этого способа пред¬ ставления знаний. , Основная задача предложенного В. Ленерт формализма — дать аппарат представления знаний для структурирования сюжета расска¬ зов. Подобная задача решалась и раньше в рамках теории нарра¬ тивных грамматик [10] — направления структурного литературоведе¬ ния, инициированного в значительной мере известной монографией В. Проппа [11]. Однако эти исследования в основном строились на основе вычленения жестких правил развития сюжета. Такова, на¬ пример, стандартная линейная последовательность функций, выде¬ ленная В. Проппом в русских волшебных сказках. Для представления произвольного сюжета нужен иной подход — необходимо выявить совокупность понятий и связок, составляющих костяк сюжета, оставив в то же время достаточно свободы для конструирования различных вариантов. Основой структурного мето¬ да, предложенного В. Проппом, было выделение поступка как дей¬ ствия, реализующего функцию персонажа в процессе развертывания сюжета. Сюжет представлялся как жесткая последовательность функ¬ ций, реализующихся в фиксированном порядке. В более поздних публикациях предпринимались попытки построить достаточно универсальные нарративные грамматики, применимые не только к текстам волшебных сказок, но и к более широкому классу повествовательных текстов [12—15]. Для этого пришлось несколько трансформировать модель Проппа, дополнив ее, в частности, моделью, описывающей систему персонажей [12]. Структура сюжета рассматривалась также в рамках порождаю¬ щих грамматик [13]. По поводу адекватности и эффективности нар¬ ративных грамматик высказывались противоположные мнения, велась острая дискуссия [16]. В середине 70-х годов была осознана важ¬ ность анализа нарративных структур для работ в области искус¬ ственного интеллекта [17]. Для анализа нарративных структур были 180
использованы идеи представления знаний, что привело к практиче¬ скому слиянию в единое направление исследований, ориентирован¬ ных на литературоведение и изучение нарративных грамматик, с одной стороны, и на задачи "искусственного интеллекта”, связан¬ ные с анализом структуры сюжета методами представления знаний — с другой [18]. Наиболее отчетливо этот синтез был осуществлен в статье [9], где основой представления сюжета является выделение: персонажей; двух типов состояния у каждого из персонажей — ментального (в котором фиксируются желания, намерения и т.п.) и аффективного, характеризуемого двумя типами оценок: позитивные (+) и негатив¬ ные (—); пяти типов стрелок, связывающих состояния: актуализации (из ментального в аффективное); мотивации, оканчивающейся на менталь¬ ном состоянии; терминации, связывающей состояния, одно из которых замещает другое; эквивалентности и внешней каузации. С помощью указанных средств можно представить сюжет в ви¬ де графов (рис. 1). Наиболее важным в таком подходе [19] представляется, однако, возможность семантических разложений некоторых понятий, харак¬ теризующих развитие сюжета, и автоматической трансформации исход¬ ного описания в новое, выраженное с помощью этих понятий. Такой подход позволяет получить обратное описание закодированного с помощью сюжетных единиц текста, т.е. выразить сюжет через после¬ довательность высокоуровневых сюжетных единиц. (< Естественный вывод» и формализация гуманитарного зиаиия. Анализ приведенного выше примера использования методов представ¬ ления знаний в целях исследования структуры сюжета позволяет поднять более широкий вопрос: как можно осуществить формализа¬ цию тех рассуждений, которые обычно используются в гуманитарных науках? Ясно, что эти рассуждения во многом сильно отличаются от формальных выводов в математике. В основе математических выводов лежат синтаксические преобразования текстов некоторой знаковой системы по определенным правилам, в идеале — контекстно незави¬ симым1. В гуманитарных науках, как правило, объектом анализа является текст, а основная операция с этим текстом — описание его в иной, обобщенной системе понятий. Историк имеет дело с нарративными и археологическими источниками, причем в семиотическом смысле археологические свидетельства также являются своего рода текстом [21]. Он должен превратить эти тексты в некий текст, использующий совершенно иную систему понятий, чем исходный (стадии историче¬ ского процесса, взаимодействие социальных, экономических, полити¬ ческих факторов, взаимоотношения классов и социальных групп и т.д.). Литературовед рассматривает специфику жанров, задачи автора тек¬ ста, их связь с исторической ситуацией и т.п. Представители раз- 'Не будем затрагивать здесь чрезвычайно сложного вопроса о путях формирования математических понятий, оставаясь на позициях "формализма” [20]. 181
а успех м) т проблема Скрытое благодеяние Потеря персонаж А ■ М соревнование 'J обретенный успех С М. выполненное обещание М-1 J а - 2 J т — 3 ) Г-4 обещание и осуществленное _ 5 вознаграждение Рис. 1. Некоторые сюжетные единицы а — элементарные; б — высокоуровневые; 1 — ментальное состояние мира; 2 — актуализация; 3 — мотивация; 4 — терминаиия; 5 — внешняя каузация личных гуманитарных наук используют свои специфические системы понятий. Часто внутри одной области науки система понятий за¬ висит от научной школы, а иногда является индивидуальным инстру¬ ментом. Наше представление о схеме выводов в гуманитарных науках иллюстрирует рис. 2. В силу отсутствия формальных правил преобразования исход¬ ного материала в научный текст представители точных и естествен¬ ных наук, воспитанные в традиции математического знания, обычно рассматривают выводы в гуманитарных науках как нестрогие. Вместе с тем необходимо заметить, что логика этих выводов, часто не эксплицируемая в гуманитарных исследованиях, является достаточно жесткой и может быть описана. Правда, средства, необходимые для формального описания этой логики, совершенно иные, чем использу¬ емые для анализа математического знания. Основной операцией здесь является преобразование понятий. Выше было продемонстрировано, как из элементарных семанти¬ ческих единиц (см. состояния и стрелки на рис. 1) строятся по¬ нятия, описывающие элементы сюжета, и как исходный текст, зако¬ дированный определенным образом, может быть формально преобра¬ зован. Обобщая этот процесс, получаем формальную структуру выво¬ да в гуманитарных науках (рис. 3). Естественно, рассмотренный процесс является идеализацией. В реальных случаях и выбор семантически примитивных элементов, и построение семантической сети, и ее преобразование — чрезвычай¬ но сложные специальные задачи, решение которых должно быть ос- 182
новано на глубоком изучении опыта соответствующей науки. Однако в ряде простых случаев подобную схему удается реализовать на ЭВМ на основе идей’’когнитивной науки” и методов искусственного интеллекта [9, 19], что демонстрирует наличие значительных пер¬ спектив в области формализации гуманитарного знания. Пример описания качеств и поступков, содержащих оценки с точки зрения морали. Вопрос о формализации рассуждений на темы морали в литературе уже поднимался [22]. Следует заметить, что предложенный формализм [22] представляется весьма громоздким и все еще весьма далек от алгоритмической реализации, скажем, в системах искусственного интеллекта. Предлагаем использовать для описания рассуждений на темы морали графический формализм, не¬ сколько отличающийся от рассмотренного выше метода представле¬ ния знаний для структурирования сюжетов — а именно каузально¬ ценностное представление сюжета. Состояния мира, как и в статье [9], мы делим на два класса — ментальные (Л/(±)) и реальные (7?(±)). При этом вводятся три типа отношений между состояниями (рис. 4). Два ментальных состояния одного и того же персонажа могут быть одновременно связаны отношениями оценки на основе различаю¬ щихся ценностей. С помощью введенных символов легко представить все ситуации, описываемые с помощью формализма ’’сюжетных еди¬ ниц” [9]. Кроме того, введенный нами формализм дает возможность эксплицировать многие понятия, неэксплицируемые в формализме В. Ленерт [9]. Заметим прежде всего, что описание сказок с помощью ’’сюжет¬ ных единиц” не дает возможности ни вывести мораль, ни опреде¬ лить черты характера действующих персонажей сказок. В самом де¬ ле, герой, приходящий на помощь принцессе и убивающий похитив¬ шего ее дракона, может рисковать жизнью в силу совершенно раз¬ личных причин (например, жалости, ’’гражданского долга”, надежды на вознаграждение). В каждом из возможных вариантов характерис¬ тика поступка героя с точки зрения морали будет своя, и сказка 18В
ОЦЕНКИ (только между ментальными состояниями) ценность^ М1 лучшеМг сточки зрения ценности X ценность X А равноценно В КАУЗАЦИИ (между любыми парами состояний - четыре вида) ®^-~© актуализация ^способствует актуализации Y актуализация ^препятствует актуализации Y 0=^>© актуализация Xприводит к безусловной актуализации Y 0=^>© актуализация X не допускает актуализацию Y ЭКВИВАЛЕНТНОСТИ 0—Ч5> А эквивалентно В Рис. 4. Типы отношений между состояниями сама по себе будет иметь различный смысл. Это, однако, никак не отражается на представлении сюжета с помощью ’’сщжетных еди¬ ниц”. Совершенно иная картина будет в случае использования каузально¬ ценностного представления сюжета. В зависимости от системы цен¬ ностей героя сказки его поступок можно охарактеризовать в терми¬ нах морали. Интересно отметить, что комбинаторные схемы, подобные изо¬ браженным на рис. 5, а,б, оказываются избыточными для описания естественноязыкового словаря. Честолюбивым можно назвать чело¬ века, предпочитающего почести не только самосохранению, но и дру¬ гим ценностям, т.е. реализующим схему рис. 5, в, где X — про¬ извольная ценность. С помощью техники каузально-ценностного представления можно 184
Персонаж Л Персонаж И Рис. 5. Каузально-ценностные схемы для черт харак¬ тера героев сказки а. б — для конкретной ситуации; в, г — общая схема идентифицировать и другие понятия, например ’’действия из зависти” (см. рис. 5, г). Таким образом, каузально-ценностное представление дает возмож¬ ность осуществлять некоторые формальные выводы в области мо¬ рали, исходя из весьма простых операций поиска подграфов в се¬ мантической сети, представляющей сюжет. Естественный вывод и проблема онтологизации знания. Приступим к рассмотрению вопроса о различии между определяющими чертами математического (или точного) и гуманитарного знания и попыта¬ емся выяснить, в чем состоят наблюдаемые уже долгое время труд¬ ности в математизации гуманитарных наук, в то время как математи¬ зация наук о природе в целом происходит с успехом. Прежде всего любой математический аппарат — это формальная, т.е. знаковая сис¬ тема с жестким синтаксисом2. Наиболее экстремистски настроен¬ ные формалисты вообще рассматривают математику как операции над гВ ’’Очерках по истории математики” П. Бурбаки (М.: Изд-во иностр. лит., 1963. С. 15) такой взгляд на математику эксплицитно возводится к работам Лейбница. При этом имеется в виду создававшийся Лейбницем «некий символический язык, способный без двусмысленностей выражать все человеческие мысли, усилить нашу возможность дедукции, избегать ошибок благодаря чисто механическим усилиям внимания и, нако¬ нец, построенный так, что "химеры, которые не понимает даже тот, кто их создает, не могут быть записаны его знаками”...». 185
знаками на бумаге, пренебрегающие семантикой. В "формалисти¬ ческом” пределе семантика и синтаксис полностью совпадают, ни¬ какой семантики, кроме синтаксической, просто не остается3. Заметим при этом, что как задача построения формальной системы, так и ее интерпретация полностью игнорируются. Тем не менее в рамках по¬ добного подхода, а именно использования операций в знаковой сис¬ теме с априорно ограниченной семантикой, удается получить весьма значительные результаты, что и привело к широкому распростране¬ нию аксиоматического метода в математике. Однако попытки рас¬ пространения его на другие науки сталкиваются со значительными трудностями. Если аксиоматизация уже в теоретической физике полез¬ на лишь частично (слишком большую долю реальной работы физика- теоретика составляют естественноязыковые мета-рассуждения), то в гуманитарных науках использование аксиоматического метода явно себя не оправдывает. Дело в том, что основой исследовательской деятельности в гума¬ нитарных науках является работа с понятиями, с правилами соотнесения этих понятий с теми или иными реальными или имевшими место си¬ туациями и, кроме tofo, с состояниями сознания. Возможных спосо¬ бов ограничения на выбор базовых семантических единиц и вычленения правил оперирования с ними оказывается так много, что выбор и фиксация какого-то небольшого их числа совершенно не эффектив¬ ны. Центр тяжести методологии получения гуманитарного знания пе¬ реносится на "метауровень” — способы оперирования со знаниями, где объектом операции оказываются отнюдь не знаки, а сложные структуры знания, как мы это уже демонстрировали выше. Сама логика претерпевает существенные изменения. С нашей точ¬ ки зрения, центральным объектом логики естественных рассуждений, лежащей в основе получения гуманитарного знания, являются не ло¬ гические связки между суждениями и импликациями, а логические операторы, объект и результат действия которых — структуры зна¬ ния. Собственно говоря, логика естественных рассуждений сводится к последовательности применения ряда логических операторов к сово¬ купности исходных данных с целью получить на выходе структуру знаний определенного типа. Фундаментальным оператором естественной логики является опе¬ ратор онтологизации, изменяющий онтологический статус знания. Прежде чем перейти к обсуждению природы структуры этого опера¬ тора, рассмотрим несколько примеров. Онтологизация через самосогласование. Использование оператора онтологизации является частным случаем аргументации. Принципы !Во введении, например, к книге "Теория множеств” Н. Бурбаки (М.: Изд-во иностр. лит., 1965. С. 23) мы находим следующий пассаж: «Действительно, анализ механизма доказательств в хорошо подобранных математических текстах позволил раскрыть стро¬ ение доказательств с точки зрения как словаря, так и синтаксиса. Это привело к заклю¬ чению, что достаточно ясный математический текст можно было бы выразить на услов¬ ном языке, который содержит лишь небольшое число неизменных "слов”, соединяемых друг с другом согласно синтаксису, состоящему из небольшого числа не допускающих исключений правил; так выраженный текст называется "формализованным”». 186
когнитивного моделирования позволяют рассматривать аргумент как способ изменения модели мира адресата, влияющий на его выбор [7, 23]. Далеко не все виды аргументов, однако, являются операто¬ рами онтологизации. Не будут таковыми, например, аргументы о воз¬ можности использования силы или ссылки на социальные авторитеты. В то же время оператор онтологизации шире научной аргумен¬ тации, так как существует много способов изменения онтологиче¬ ского статуса знания у адресата без использования как научной ме¬ тодологии, так и "силовых” аргументов [24]. Однако здесь мы оставим в стороне проблемы ’’управления истиной” и сосредоточимся на про¬ цессе формирования научного знания. Рассмотрим пример, показывающий, что и в рамках научной де¬ ятельности приемы онтологизации знания иногда весьма далеки от традиционных методов логического вывода. В статье В.Л. Цымбурского [25] по проблеме мифологического отождествления Анхиза — отца Энея — результатом весьма изящного анализа является обоснование тезиса о том, что в первообразе мифа Анхиз — змеиное божество. Чрезвычайно интересной оказывается, на наш взгляд, экспликация приемов получения подобного заключе¬ ния из весьма косвенных и на первый взгляд никак не связанных между собой свидетельств. Последовательность приемов такова: анализ мифологических ситуаций, в которых имеется упоминание об Анхвзе: пастушество Анхиза, кара Зевса, лишившая Анхиза способности к прямохождению, подпускание Анхизом кобылиц к жеребцам Зевса и присвоение при¬ плода, называемое в мифе воровством; выяснение вопрос^ о том, какие мифологические персонажи дан¬ ного культурного ареала выступают в подобных контекстах в сход¬ ных ролях (таковыми персонажами оказываются хтонические, часто змеевидные божества); установление мифологической природы Анхиза (выявляются кон¬ тексты, в которых Анхиз выступает как первопредок троянцев, что является прямым указанием на его ’’божественную природу”); выяснение ассоциативных связей, существовавших в мифологичес¬ ком сознании античности между родом Анхиза и змеями (цитируется отрывок из ’’Энеиды” Вергилия, где в ответ на обращение Энея к предку на сицилийских играх в память Анхиза из пещеры выползает змей); точку в этих рассуждениях ставит установление лингвистической связи между именем ’’Анхиз” и индоевропейским названием змеи. После выполнения указанных процедур предлагаемое отождествле¬ ние представляется достаточно убедительным. Между тем ни одна из проведенных операций сама по себе не является обоснованием рас¬ сматриваемого тезиса. Убедительность создается не вследствие после¬ довательности операций, а вследствие согласованности их результатов. Изменяется наша оценка тезиса. Данный пример выбран в силу того, что подход к обоснованию тезиса как к согласованию косвенных свидетельств проведен чрез¬ вычайно ясно. Однако число примеров применения подобной методо¬ 187
логии, хотя и менее эксплицитно используемой, можно значительно умножить (такого рода умозаключения используются не только в нау¬ ке, вспомним хотя бы рассуждения Шерлока Холмса). Вообще говоря, такого рода рассуждения можно рассматривать как задачу реконструкции [26]. Каждое из косвенных свидетельств допускает несколько возможных смысловых контекстов интерпрета¬ ции. Кроме того, существуют правила их согласования (заранее за¬ данные). Эти правила и позволяют проводить отбраковку контекс¬ тов, оставляя в качестве допустимых одну или несколько из воз¬ можных реконструируемых смысловых структур. В случае, когда не получается единственного самосогласованного решения задачи ре¬ конструкции, необходимо привлечение дополнительных косвенных сви¬ детельств. В приведенном примере убедительность достигается тем, что согласованными оказываются пять различных типов косвенных свидетельств, что можно представить графом (рис. 6), где косвен¬ ные текстовые свидетельства представлены стрелками, а смысловые тождества — двойными линиями. Искомое тождество непосредствен¬ но усматривается из графа. В разобранном примере косвенные свидетельства (исходное зна¬ ние) в результате применения оператора онтологизации превра¬ щаются в реконструируемую структуру достоверного знания. Тем не менее приведенный анализ явно недостаточен для выявления строе¬ ния оператора онтологизации знания. Посмотрим теперь, можно ли разложить оператор онтологизации на более элементарные операто¬ ры и тем самым прояснить его структуру. Структура оператора онтологизации знания. Естественно ожи¬ дать, что изменение оценки достоверности знания, в частности ре¬ шение проблемы возможности использования данного знания в задан¬ ном ситуационном контексте, осуществляется посредством специаль¬ ных вспомогательных операций. Задача выяснения структуры опера¬ тора онтологизации в этом предположении сводится к выявлению этих вспомогательных операций, а также правил их использования. В качестве материала для анализа был использован ряд фило¬ софских и историко-филологических текстов с целью выявить наибо¬ лее ясно определяемые самим автором текста мыслительные операции и проследить за порядком их выполнения, а также проанализировать природу объектов действия этих операций и природу результатов. Мы предлагаем следующую общую конструкцию: абстрактное знание есть некоторая понятийная структура Кп; позитивное знание есть абстрактное знание Кп, снабженное оценкой Е, задающей онтологический статус Кп (вообще говоря, зависящий от ситуационного использования знания Кп)\ существуют некоторые другие знания Kna(EJ, которые вместе с неким оператором Ох позволяют изменять онтологический статус знания Кп: ОАКп(Е). Kn/Ej] = Кп(Е'). Заметим, что здесь Е1 может отличаться как от Е, так и от Еа, т.е. возможно получение более достоверного знания из менее достовер- 188
Рис. 6. Анализ мифологической природы Анхиза ного. Кроме того, результатом применения оператора онтологизации может быть абстрактная структура знания: OJ_Kna(Ea)]=Kn(E). Оценка сама по себе оказывается чрезвычайно сложным струк¬ турным образованием. В настоящей статье рассматривается оценка как основание для принятия решения об использовании или неисполь¬ зовании данной структуры знания в той или иной ситуации. В поня¬ тие оценки входят как минимум следующие существенные компоненты: система фреймов Ф„, задающих некоторые абстрактные описания ситуаций (см., например, работу [23]); структура порядка % в системе Ф„; программа распознавания конкретной ситуации S, в которой применимо знание Кп\ соотнесение структуры знания Кп, к которой применяется данная оценка Е ситуации S и одного из фреймов Ф„ с целью определить место, которое занимает S в структуре порядка и тем самым оце¬ нить знание Кп. К сожалению, в рамках статьи нет возможности подробно рас¬ смотреть функционирование основанных на подобном представлении об оценке когнитивных моделей принятия решений. Заметим, что естественным примером выработки оценки в соответствии с описан¬ ной выше процедурой является типологическая классифицирующая схема, где фреймам Ф„ соответствуют ячейки классификационной схемы, на которых задано отношение порядка, а знание Кп -некото¬ рый набор или структура признаков классифицируемых ситуаций. Вернемся, однако, к операторам онтологизации знания. Наиболее естественным способом их анализа является изучение текстов, основ¬ ная цель которых — порождение нового знания. Выполненная проработ¬ ка серии текстов Платона, Аристотеля, Монтеня, Канта [27], а также некоторых исследований по истории культуры позволила выделить пять основных типов операторов онтологизации. Метафора. Роль метафоры как операции естественной логики все более осознается в настоящее время [28—31]. Вместе с тем нельзя не отметить, что понимание метафоры у разных авторов радикально отличается. Это связано как с дисциплинарными рамками (лингвисти¬ 189
ческое, литературоведческое, науковедческое понимание метафоры), так и с индивидуальными взглядами. В одних случаях подчеркивает¬ ся различие между метафорой и сравнением, в других — это раз¬ личие практически стирается. Иногда метафора рассматривается как основа креативного мышления, иногда — как средство оформления мысли, стилистическое средство. Не будем приводить обзор теории метафоры. Ограничимся описанием наиболее продуктивного, как нам представляется, понимания метафоры. В статье [32] строится набросок теории метафоры. Делается это на основе анализа одного примера из поэзии Лопеса Пико. Ортега- и-Гассет X. решительно отвергает точку зрения, согласно которой метафора нас удовлетворяет именно потому, что мы угадываем в ней совпадение между двумя вещами более глубокое и решающее, нежели любое сходство. Ортега-и-Гассет X. подчеркивает, что основой метафоры является трансформация образа объекта в некую деятельность сознания — внут¬ ренний взгляд субъекта на рождающиеся в нем образы. Эти мысли Ортеги-и-Гассета X. можно рассматривать как пролегоме¬ ны к когнитивной модели метафоры. В статье [35] уже отмечалась важность процесса конструирования внутренней модели объекта как средства понимания. Метафора бесспорно является мощнейшим сред¬ ством объяснения, т.е. управления процессом понимания. Представ¬ ляется, что ее можно, в духе идей Ортеги-и-Гассета X., рассматривать не как уподобление структуры или признаков объектов (в этом слу¬ чае нет никакой деятельности, никакого конструирования), а как открытие идентичности в правилах порождения образов в нашем соз¬ нании или, если говорить в терминах когнитивного моделирования, как установление идентичности правила конструирования внутренних моделей объектов:”каждая метафора — открытие закона универсума” [32]. В формальном стиле это соображение можно пояснить следующим образом. Если у нас есть некоторые правила порождающей грамма¬ тики, то в принципе две совокупности слов, полученные с помощью этих правил, могут не иметь ничего общего. Однако обнаружение общих правил порождения вскрывает глубокую внутреннюю связь между этими совокупностями и является, вообще говоря, неким от¬ крытием. Этот процесс можно, на наш взгляд, рассматривать как примитивную модель творческой деятельности. Весьма важным для исследования метафоры представляется анализ ментальных про¬ странств [33]. Экземплификация. Приведение примера — одно из наиболее мощных средств онтологизации знания. Знание, достоверность которо¬ го требуется обосновать, демонстрируется, так сказать, в дейст¬ вии. С этой точки зрения интересным представляется мнение круп¬ ного английского политического деятеля и историка XVIII в. Бо- лингброка, что история — это философия, которая учит с помощью примеров [34]. Как демонстрируют современные лингвистические исследования, пример является основным средством онтологизации лингвистическо- 190
го знания. Приведение примеров — основа овладения абстрактными понятиями математики и теоретического естествознания. Поэтому представляется интересным проанализировать структуру примера как оператора естественной логики. Заметим, что на ’’входе” примера всегда есть нечто, что экземпли- фицируется (тезис). Как правило, это — некая семантическая струк¬ тура, некоторое знание. ’’Входом” экземплификатора может быть мета¬ фора, например ’’знание — свет”. В этом случае экземплификатор метафоры содержит разъяснение типа ’’свет позволяет воспринимать объекты” и т.п. Другая компонента знания на ’’входе” примера — это собственно экземплификатор (реальная ситуация, некое апроби¬ рованное знание, высказывание в авторитетном источнике и т.п.). Вообще говоря, то, чем экземплифицируется, — это тоже некоторое знание, обладающее для адресата примера высокой степенью досто¬ верности или значимости. Сама процедура экземплификации есть указание на существование у того, что экземплифицируется, и у того, чем экземплифицируется, общего аспекта. Кроме того, у примера есть еще одна непременная компонента — ценность, ради которой он приводится. Экземплификация проводится для повышения цен¬ ности знания (но ценности бывают разные). В целом логическая структура экземплификации выглядит при¬ мерно так: истинно, что знание Кп связано с некоей ценностью (оценка может быть самой различной — польза, справедливость, долг и т.п.), так как в ситуации N проявление Кп имело место (грубо говоря, актуализированность знания рассматривается как аргумент в пользу его истинности). В качестве классического образца онтологизации через экземпли- фикацию можно рассматривать ’’Опыты” Монтеня [35]. На первой же странице этой книги представлено исключительно ясное по тексто¬ вой структуре оперирование примерами: Тезис:”Если мы оскорбили кого-нибудь и он, собираясь отомстить нам, волен пос¬ тупить с нами по своему усмотрению, то самый обычный способ смягчить его сердце — это растрогать его своею покорностью и вызвать в нем чувство жалости и сострада¬ ния. И, однако, отвага и твердость — средства прямо противоположные — оказыва¬ ли порою то же самое действие”. Экземплификаторы: 1) Эдуард, принц Уэльский... 2) Скандербег... 3) Император Конрад III ... Речь идет об успехе воздействия на процесс принятия решения другим человеком — вот та ценность, с которой связано обосновы¬ ваемое (в противоречии с общим мнением) знание, а именно: будь тверд и отважен даже в руках оскорбленного врага. Интересно от¬ метить, что каждый из экземплификаторов начинается не с имени ли¬ ца осуществившего поступок (проявившего отвагу в безнадежной си¬ туации), а с имени того, кто оказался под воздействием этого по¬ ступка и проявил великодушие. Эти имена великодушных людей ста¬ новятся как бы символами ситуации. Историческое существование перечисленных выше личностей и придает онтологию указанному спо¬ собу действий. Важным компонентом экземплификации является наличие средств, 19)
обеспечивающих принятие примера адресатом. Возникновение сомне¬ ния в реальном существовании указанных лиц сильно колебало бы убедительность примеров. Выделение семантического примитива. Следующим оператором онтологизации является оператор выделения семанти¬ ческого примитива. Классическим употреблением этого оператора является введение новых фундаментальных физических понятий (та¬ ких, как энергия, квант действия, квантовый уровень и т.п.). К сожалению, здесь мы должны ограничиться, по существу, метафори¬ ческим описанием этого оператора, так как подробный анализ его применения выходит за рамки статьи4. Реальное использование этого оператора, как правило, предваряется метафоризацией — введе¬ ние новых фундаментальных понятий, по существу, не может проис¬ ходить без предшествующего применения метафоры, его объясня¬ ющей, — и закрепляется многократной экземплификацией с целью убеждения в пользе вводимого понятия. Выделение идеального типа. Следующий оператор — пос¬ троение идеального типа. Здесь основой является выделение в серии объектов исследования фундаментальной семантической структуры5. Таковы, например, планы строения биологических организмов, культур¬ ные или хозяйственные типы и т.п. Построение типологической схемы. Один из наиболее мощных онтологических операторов — оператор построения типоло¬ гической схемы, т.е. средство упорядочения и понимания разнород¬ ного на первый взгляд материала [40]. Заметим, однако, что логи¬ чески правильно построенная типологическая схема — чрезвычайно сильное средство онтологизации знания. Типологическая схема имеет тенденцию навязывать свою логику миру. Именно потому, что типоло¬ гия — это средство освоения мира когнитивной системой. Принимая типологическую схему, мы тем самым изменяем онтологию нашего мира. В частности, можно ожидать, что пустые клетки типологиче- ческой схемы — это результат нашего недостаточного знания мира, а не недостаток типологии. История науки показывает, что такое мнение в отношении хорошо обоснованных типологий отнюдь не бес¬ почвенно. Такие фундаментальные типологические схемы, как таблица Менделеева и классификация сильно взаимодействующих элементар¬ ных частиц Гелл-Мана, оказались способными предсказать ’’новые сущности”. Заметим, что детальное исследование каждого из выделенных здесь операторов естественной логики требует проработки огромного эмпи¬ рического материала. Между тем как объект исследования популяр¬ ностью пользуется, пожалуй, только метафора, и то, пожалуй, не в функции средства онтологизации знания. Иерархия операторов онтологизации. Эмпирическое исследование ряда философских и историко-филологических текстов демонстриру¬ ет тот факт, что операторы онтологизации используются в процес- 4Ряд весьма важных соображений по этому поводу содержится в книге Т. Куна [36]. 5См„ например, статью Б.М. Величковского и М.С. Капицы в наст. сб. 192
Рис. 7. Иерархия операторов в логике онтологизации се аргументации отнюдь не произвольно, а в рамках определенной грамматики. Вообще говоря, введение новых семантических примити¬ вов в качестве ’’новой сущности” предваряется приведением приме¬ ров и, как правило, метафорами. Идеальные типы, строящиеся из семантических примитивов, также предваряются примерами. Типоло¬ гии, являются ли они вариантами дихотомических или древесных классификаций или задаются таблицами, немыслимы без предвари¬ тельного выделения классифицирующих признаков (те же семанти¬ ческие примитивы) или идеальных типов, т.е. особо отмеченных семантических структур. В употреблении операторов онтологизации возникает своего рода естественная иерархия. Иерархии такого типа, характеризуемые тем, что вышележащий уровень становится доступ¬ ным для оперирования только после действий с более низким уров¬ нем, хорошо известны в исследованиях по синтаксису естественного языка. Это так называемые иерархии Доступности. Операторы онто¬ логизации можно расположить в виде иерархии доступности, форми¬ рующей обобщенный оператор онтологизации (рис. 7). Фактически указанные правила ’’грамматики онтологизации”, ко¬ нечно, могут нарушаться. Это, однако, приводит к разрушению убе¬ дительности текста, хотя и используется иногда как риторический прием (например, сообщение поражающего воображение результата и лишь потом его обоснование). Изучение грамматики онтологизации позволяет поставить ряд вопросов, связанных с построением модели прагматики, острую не¬ обходимость в которой ощущает широкий круг специалистов, в част¬ ности разработчики экспертных систем и средств человеко-машинного диалога на естественном языке. Одна из задач построения прагма¬ 13. Зак. 1668 193
тически правильного текста — это построение убедительного текста. Поэтому построение модели прагматики тесно связано с изучением риторических приемов. Хотя риторика отнюдь не сводится к пробле¬ мам онтологизации знания (например, риторическая цель может сос¬ тоять в разрушении некоторой онтологии, в вызове эмоциональной реакции и т. п.), проблемы онтологизации занимают в риторике существенное место. С проблемами онтологизации знания связано также объяснение трудностей, возникающих в диалогах между культурами или облас¬ тями знания. В тех случаях, когда традиции употребления операторов онтологизации существенно различаются (недопустимыми считаются некоторые классы метафор, используются несовпадающие ценности в операторах и т. п.), диалог зачастую становится невозможным. По существу, онтология знания — важнейший фрагмент процесса понимания. * * * Именно в многообразии онтологизационных установок и следует усматривать ответ на вопрос, поставленный во введении. Здесь, на наш взгляд, и коренится основное различие между математически и гуманитарно ориентированным знанием. Заметим в заключение, что указанная дихотомия во многом возвращает нас к логической про¬ блематике, поставленной в ’’Топике” Аристотеля [40]. ЛИТЕРАТУРА 1 .Шенк Р. Концептуальная обработка информации. М.: Энергия, 1980. 360 с 2. Логика рассуждений и ее моделирование. М.: Науч. совет по комплекс, пробл. ”Кибернетика” АН СССР, 1983. 180 с. (Вопросы кибернетики). 3. Чарняк Ю. Умозаключение и знание / / Новое в зарубежной лингвистике. М.: Радуга, 1983. Вып. 12. С. 170—207, 277—317. 4. Argumentation: Approaches to theory formation /Ей. E.M. Barth, J.L. Martens. Amsterdam; Philadelphia: Benjamin, 1982. 333 p. 5. Семантика модальных и интенсиональных логик. М.: Прогресс, 1981. 424 с. 6. Фейс Р. Модальная логика. М.: Наука, 1974. 520 с. 7. Сергеев В.М. Структура диалога и ’’неклассические логики” // Труды по знаковым системам. N 17. Тарту: Тартус. гос.ун-т, 1984. С. 24—32. (Учен. зап. Тартус. гос. ун-та; Вып. 641). 8. Поспелов Д.А. О "человеческих” рассуждениях в интеллектуальных системах / / Ло¬ гика рассуждений и ее моделирование. М.: Науч. совет по комплекс, пробл. ’’Кибер¬ нетика” АН СССР, 1983. С. 5—37. (Вопросы кибернетики). 9.Lehnert W.G. Plot units and narrative summarization // Cognit. Sci. 1981. Vol. 4. P. 293—331. 10. Бремон К. Структурное изучение повествовательных текстов // Семиотика. М.: Радуга, 1983. С. 429—436. 11. Пропп В.Я. Морфология сказки. М.: Наука, 1969. 204 с. 12. Greimos A.J. Semantique structurelle. P.: Larousse, 1966. 321 p. 13. Бремон К. Логика повествовательных возможностей // Семиотика и искус- ствометрия. М.: Мир, 1972. С. 108—135. 14. Ветке В. Tragic thought and the grammar of tragic myth. Bloomington (Ind.): Univ. press, 1982. 251 p. 15. Mandier J.M., Johnson N.B. Remembering of things parsed: Story structure and recall // Cognit. Psychol. 1977. Vol. 9. P.Ill —151. 194
16. Black J.B.. Wilenskv R. An evaluation of story grammar // Cognit. Sci. 1979. Vol. 3. P. 213—230. 17. Rumelharl D. Notes on a schema for stories // Representation and understanding / Ed. D C. Bobrow, A. Collins. N.Y. etc.: Acad, press, 1975. P. 401. 18. Alker HR. (Jr.). Fairy tales, tragedies and world histories: Towards interpretative story grammars of possibilist world models: Preprt. MIT. Cambridge (Mass.): 1983. 39 p. 19. Alker H R. (Jr.), Lehnert W.G.. Schneider D.K. Two reinerpretations of Toynbee’s Jesus: Explorations in computational hermeneutics: Prepr. MIT. Cambridge (Mass.): 1984. 56 p. 20. Гильберт Д., Бернайс П. Основания математики. Логические исчисления и формализация арифметики. М.: Наука, 1979. 557 с. 21. Гарден Ж.К. Теоретическая археология. М.: Наука, 1983. 295 с. 22. Мартемьянов Ю.С., Дорофеев Г. В. Опыт терминализации общелитературной лексики // Новое в зарубежной лингвистике. М.: Радуга, 1983. Вып. 12. С.38—102. 23. Баранов А.Н.. Сергеев В.М. Структура естественно-языковой аргументации // Се¬ миотические аспекты формализации интеллектуальной деятельности: Тез. докл. исообщ. М.: ВИНИТИ, 1985. 385 с. 24.Паршин П.Б., Сергеев В.М. Об одном подходе к изучению средств изменения моделей мира // Принципиальные вопросы теории знаний: Тр. по искусств, интеллекту. N7. Тарту: Тартус. гос. ун-т, 1984. С. 127—141. (Уч. зап. Тартус. гос. ун-та, Вып. 688). 25. Цымбурский В.Л. "Анхиз в Троаде и в Энеиде” // Античная культура и сов¬ ременная наука. М.: Наука, 1985. С. 140—143. 26.Сергеев В.М. Искусственный интеллект как метод исследования сложных сис¬ тем // Системные исследования: Методологические проблемы. М.: Наука, 1984, с. 116—129. 27. Сергеев В. М. О логике аргументации в основах метафизики нравственности И. Канта // Кантовский сборник. Калининград: Изд-во Калининград, гос. ун-та, 1986. С. 25—33. 28.Lakoff С.. Johnson М. Metaphors we live by. Chicago: Univ. press, 1980. 145 p. 29. Boyd /f.Metaphor and theory change: What it "metaphor” a metaphor for? // Metap¬ hor and thought / Ed. A. Ortony. Cambridge: Univ. press, 1980. P. 356—378. 30.Арутюнова Н.Д. Тождество или подобие // Проблемы структурной лингвис¬ тики, 1981. М.: Наука, 1983. С. 3—22. 31. Арутюнова Н.Д. Языковая метафора (синтаксис и лексика) // Лингвистика и поэтика. М.: Наука, 1979. С. 147—173. 32. Ортега-и-Гассет X. Эссе на эстетические темы в форме предисловия / / Вопр. философии. 1984. N10. С. 145—153. 33. Сергеев В.М. Проблема понимания: некоторые мысленные эксперименты // Те¬ ория и модели знаний: Тр. по искусств, интеллекту. N8. Тарту: Тартус. гос. ун-т, 1986. С. 133—147. (Учен. зап. Тарту с. гос. ун-та; Вып. 714). 34. Болингброк. Письма об изучении и пользе истории. М.: Наука, 1978. 359 с. 35. Монтень М. Опыты. М.: Наука, 1979. 704 с. 36. Кун Т. Структура научных революций. М.: Прогресс, 1978. 288 с. 37. Сиверцев М.А. Проблемы типологии в международной статистике занятости. М.: Наука, 1975. 173 с. 38. Аристотель. Топика // Собр. соч. М.: Мысль, 1978. Т. 1. 200 с.; Т.2. 500 с.
УДК 681.3.01 ПРАГМАТИКА РЕЧЕВОГО ОБЩЕНИЯ Х.Я. Ыйм ВВЕДЕНИЕ В настоящее время прагматика уверенно заняла центральное место в исследованиях по языковому общению и интеллектуальным процес¬ сам, лежащим в его основе. Можно сказать, что прагматика как в смысле актуальности, так и в смысле популярности и престижа занимает сейчас в теоретических и прикладных лингвистических исследованиях те позиции, на которых в семидесятые годы находилась семантика. Это не простая смена терминов: вместо термина ’’семантика” в мо¬ ду вошел термин ’’прагматика”. Произошел коренной сдвиг в исследова¬ нии языка, общения и соответствующих видов интеллектуальной дея¬ тельности. Область прагматических исследований представляете собой пока весьма пеструю картину переллетающихся концепций, подходов, методов. Однако это во многом внешнее впечатление. Если смотреть на прагматику ’’изнутри”, то можно обнаружить определенные идеи и принципы, вокруг которых вращается этот внешний калейдоскоп. И нельзя не заметить, что общая картина в прагматике заметно стабили¬ зируется. Например, показательно, что появилось несколько моногра¬ фий, которые претендуют не просто на обзор проблем и подходов, а на некоторую целостную, синтетическую концепцию прагматики [1,2]. Попытаемся выделить и проанализировать центральные идеи и кате¬ гории прагматики, а также обсудить ту роль, которую прогматике сле¬ довало бы играть в рамках общей программы моделирования коммуни¬ кативной и интеллектуальной деятельности людей. После короткого исторического обзора попытаемся дать анализ теоретических положе¬ ний, идей и категорий, которыми определяется специфика прагмати¬ ческого подхода, а затем очертить ту систему концептуальных средств, котррая необходима прагматике для выполнения своих задач. Сам термин ’’прагматика” в современном употреблении, очевидно, исходит из семиотики. В семиотической традиции (Пирс) принято делить область исследования знаковых систем на три подобласти: синтактику, семантику и прагматику. Синтактика изучает отношения между зна¬ ками, семантика — между знаками и реальностью, обозначаемой ими, а прагматика — отношения знаков к их пользователям: автору и адресату сообщения. Хотя такое истолкование термина ’’прагматика” в прин¬ ципе можно считать верным и в настоящее время, было бы неправиль¬ ным изображать дело так, будто и содержание прагматики представляет собой результат логического развития соответствующих идей семио¬ тики. Содержание современной прагматики в первую очередь берет свое начало в исследованиях, более тесно и непосредственно связанных с ес¬ тественным языком (в философии языка, в логических и психологичес¬ ких исследованиях языка и, наконец, в самой лингвистике). Корни указанного тройного деления прослеживаются в средневе¬ ковом тривии (лат. trivium) — в объединении наук, включающем грам¬ матику, логику и риторику [3]. Другими словами, тривий представлял 196
собой своего рода комплексную дисциплину своего времени, целью которой в современных терминах было изучение закономерностей языка, мышления и общения. Хотя первоначальные цели основополож¬ ников семиотики действительно охватывали более или менее ту же область исследований, семиотике не удалось реализовать этих перво¬ начальных планов в сколько-нибудь значительной мере. В настоящее время идея о такой комплексной дисциплине снова стала крайне акту¬ альной. ПРИНЦИПЫ И КАТЕГОРИИ ПРАГМАТИКИ В процессе созревания представлений о том, что должно входить в эту комплексную область исследований, постепенно вырисовывались и очертания современной прагматики, причем влияние было (и является) взаимным (см., например, монографии [4, 5]). Уместно особо остановиться на той роли, которую играл искусственный интеллект в формировании указанных выше взглядов. С одной стороны, искусственный интеллект можно считать ’’крест¬ ным отцом”- когнитивной науки — науки, которая объединяла бы уси¬ лия и результаты целого семейства наук: когнитивной и социальной психологии, социологии общения, лингвистики, информатики [6, 7]. С другой стороны, внутри самого искусственного интеллекта существует сильная тенденция к развитию некоторой интегральной, но достаточно, абстрактной теории знаний и интеллекта [8, 9]. Под влиянием исследований в области искусственного интеллекта описание процессов образования и интерпретации высказывания в прагматике стали непосредственно связывать с моделированием таких проявлений человеческого интеллекта, как целеполагание, способность к специфически человеческим способам рассуждения и к планирова¬ нию и осмысление действий на основе этих рассуждений. В свою очередь, прагматика представляет интерес для искусственного интеллек¬ та (а также общей теории интеллекта, насколько такая существует) как область исследований, которая должна обеспечить эти дисциплины дан¬ ными о закономерностях естественного человеческого общения и рас¬ суждения. Стало ясно, что без теоретического осмысления правил челове¬ ческого общения и рассуждения невозможно серьезное продвижение вперед в области соответствующих технических приложений — в раз¬ работке подсистем естественноязыкового диалога в рамках систем искусственного интеллекта. Следует отметить, что взаимодействие специалистов различных областей знания, занимающихся исследованием языка и языкового общения, обусловило существенные перемены в лингвистике. Узко структурный и формально-грамматическивй подход к языку постепенно заменяется функциональным [10—12]. Вместо абстрактной и ав¬ тономной языковой компетенции (грамматики) основным предметом теоретических исследований становятся закономерности употребления и понимания языка в общении. Центральные темы прагматики можно сформулировать следующим образом: 197
1) выявление общих принципов, которым подчиняется коммуни¬ кативная деятельность людей (исследование таких принципов, анализ их типов и функций в организации коммуникации широко ведется в прагматической литературе, главным образом на основе так называе¬ мых принципов и максим общения [13]; 2) выявление и определение ’’единиц общения”, т.е. специфически прагматических единиц, из которых строятся высказывания в комму¬ никации (сущность и типы таких единиц также интенсивно исследуют¬ ся в прагматике; до последнего времени эти исследования велись в ос¬ новном в русле теории речевых актов [3], однако появились и другие интересные подходы к данной проблеме); 3) выявление и разработка системы прагматических правил и меха¬ низмов, через которые общие принципы из темы 1) реализуются в конкретных коммуникативных структурах, построенных в соответствии с единицами темы 2), как при решении задачи на конструирование высказываний с определенным коммуникативным намерением, так и при решении проблем интерпретации высказываний партнера, т.е. при выявлении их смысла в конкретной ситуации общения (данная тема систематически пока разработана в наименьшей степени, что вполне естественно); в настоящее время именно в этой области ведутся наибо¬ лее интенсивные изыскания, развиваются различные подходы и ме¬ тоды как в теоретическом плане, так и в области прикладных иссле¬ дований. Прагматические принципы, максимы, импликатуры. Одна из ха¬ рактерных черт человеческого общения заключается в том, что смысл высказываний, употребленных в естественных ситуациях общения, мо¬ жет не совпадать с их прямым, эксплицитно выраженным значением, с их семантическим содержанием. Автор высказывания может подра¬ зумевать определенное модифицированное содержание (будем назы¬ вать такое содержание подразумеваемым смыслом), при этом предпо¬ лагая, что и реципиент высказывания распознает это модифицированное содержание, используя свои знания о законах общения, и будет реагировать именно на это, а не на прямое значение высказывания. Приведем для иллюстрации несколько высказываний, прямое значение которых представляет собой вопрос (запрос об информации), а подра¬ зумеваемый смысл варьируется от приказа до выражения удивления: Найдется ли у тебя листок чистой бумаги? (просьба). Ты будешь мне отвечать или нет? (требование, приказ). Мы пойдем вечером в театр. Не хочешь пойти с нами? (приглаше¬ ние, предложение). Как же так? (выражение удивления, недоразумения). При всех этих вопросах говорящий явно рассчитывает на нечто боль¬ шее, чем получение прямого ответа на вопрос. Так, первый вопрос задуман говорящим как просьба дать бумагу, т.е. если у слушающего есть бу¬ мага, то говорящий рассчитывает на получение ее, а не просто на ответ ”да”. Реципиент, получив вопрос такого типа, должен выполнить процедуру рассуждения, чтобы прийти к подразумеваемому смыслу вопроса. Такую процедуру, ведущую от прямого значения некоторо- 198
го высказывания к его подразумеваемому смыслу, назовем прагмати¬ ческой интерпретацией высказывания. Необходимость определенных процедур рассуждения при интерпре¬ тации воспринимаемых высказываний является универсальной харак¬ теристикой естественноязыкового общения. Можно сказать, что челове¬ ческое общение подчиняется общему принципу ’’общение через рассуж¬ дение”. Какими же общими соображениями, принципами и правилами люди руководствуются, когда они в качестве говорящих планируют свои реплики такими, что их понимание требует от реципиента совершения определенных преобразований, или когда в качестве реципиентов со¬ вершают именно те преобразования, которые приводят к распознава¬ нию подразумеваемого смысла говорящего? Это и есть вопрос об общих закономерностях и принципах, которым подчиняется человеческая коммуникативная деятельность. Рассматриваемый вид регулярностей коммуникативного поведения в прагматике описывается в терминах коммуникативных принципов (принципов общения). В них стараются зафиксировать наиболее общие закономерности, которым подчиняется человеческое общение. С дос¬ таточной степенью подробности обсуждался лишь один принцип — принцип кооперативности. Можно добавить принцип учтивости/веж¬ ливости, содержание и функции которого, а также отношение к принци¬ пу кооперативности весьмы подробно проанализированы в моногра¬ фии [1]. Содержание каждого принципа конкретизируется в ряде более спе¬ цифических принципов и субпринципов. Вслед за П. Грайсом [^прин¬ ципы более конкретного уровня стали называть максимами ввиду того, что они формулируются в виде общих правил-руководств: в ситуации такой-то веди себя таким-то образом. Например, сфера действия принципа кооперативности описывается четырьмя категория¬ ми максим: максима количества: передавай правильное количество информации, т.е. будь настолько информативным, насколько требуется, не будь более информативным, чем требуется; максима качества: постарайся дать верную информацию, т.е. не говори ничего такого, что, по твоему предположению, не является истиной, не делай таких утверждений, о верности/истинности ко¬ торых у тебя нет адекватных свидетельств /доказательств; максима релевантности: делай свои высказывания только тогда, когда они реле¬ вантны по отношению к соответствующей коммуникативной ситуации, т.е. содействуют достижению некоторой активизированной в этой ситуации цели; максима способа/метода: будь ясным и понятным в своих высказываниях, т.е. избегай расплывчатости в своих выражениях, избегай неоднозначности, будь краток, будь деловым. Приведенные максимы можно интерпретировать как правила, кото¬ рые, с одной стороны, в определенных аспектах ограничивают поведе¬ ние говорящего (что и как он может говорить в некоторой коммуни¬ 199
кативной ситуации, если хочет действовать как кооперативный парт¬ нер коммуникации), с другой стороны, для слушающего эти максимы являются той базой, на основе которой он может ’’вычислять” подра¬ зумеваемый смысл высказываний партнера при условии, что тот явля¬ ется кооперативным партнером. Разумеется, для того чтобы в конк¬ ретных ситуациях общения можно было бы применять приведенные максимы, их необходимо конкретизировать во все более специфи¬ ческих правилах — до уровня тех категорий, которыми люди опери¬ руют в этих ситуациях. В процессе прагматической интерпретации высказываний основной способ проявления принципов и максим общения заключается в том, что они являются основой специфических прагматических умозак¬ лючений — импликатур. Импликатуры — это умозаключения, которые делаются реципиентами в процессе интерпретации высказываний парт¬ нера и мотивируются двумя факторами: во-первых, высказывание партнера в прямом, непосредственном значении нарушает какой-нибудь принцип (какую-нибудь максиму) общения; во-вторых, существующая ситуация не дает оснований для предпо¬ ложения, что партнер нарочно не придерживается данного принципа (данной максимы). В подобной ситуации реципиент начинает строить гипотезы — умо¬ заключения, приводящие его к такой интерпретации, которая удов¬ летворяет соответствующей максиме. При отсутствии свидетельств о противном реципиент предполагает, что это и является тем смыслом, который подразумевался партнером. Рассмотрим конкретный пример: А: Где Петр? Б. Его машину я видел у входа в библиотеку. В данном диалоге ответ партнера Б, взятый в прямом значении, нарушает максимы количества и релевантности: он не дает А требуемую информацию, а вместо этого сообщает данные, о которых А не спро¬ сил. Однако если у А нет оснований считать, что Б намеренно явля¬ ется некооперативным, то это заставляет его искать какой-нибудь косвенный смысл в реплике Б. Это можно передать следующим образом: ‘Я точно не знаю, где Петр. Однако я видел, что его машина стоит у входа в библиотеку, и так как на основе этого факта можно предполагать, что Петр в библиотеке, я предъявляю тебе' этот факт как релевантный. То, какие окончательные выводы можно делать из этого факта, я оставляю решить тебе самому’. Общую схему рассуждений реципиента при выводе импликатур можно изобразить состоящей из следующих шагов (Г обозначает го¬ ворящего, схема представляется с точки зрения реципиента): Г сказал Р: а) в имеющейся ситуации общения нет оснований предполагать, что Г сознательно нарушает какой-нибудь принцип общения (в частности, принцип кооперативности); б) для того чтобы наблюдаемое поведение Г (высказывание Р) привести в соответствие с пунктом а), нужно сделать вывод, что Г думает так же, как q; 200
в) Г и сам должен сознавать, что в данной ситуации я, реципиент, буду делать вывод, что он думает (имеет в виду) то же, что и q; г) Г ничего не предпринимал, чтобы воспрепятствовать мне сде¬ лать этот вывод; д) следовательно, я делаю заключение, что говоря р, Г сознательно имел в виду, чтобы я в качестве импликатуры вывел q из р. Таким образом, импликатуры представляют собой умозаключения, которые делаются на основе определенных аспектов ситуации обще¬ ния (см. шаги а) и б)) и при отсутствии данных, говорящих против соответствующего умозаключения (см. шаг г)). Этими обстоятельствами определяются и некоторые специфические свойства импликатур как выводов. Наиболее существенным из этих свойств является возмож¬ ность аннулирования импликатур, например путем соответствующего эксплицитного указания в тексте. Это свойство делает импликатуры принципиально отличными от дедуктивных выводов. Например, в найтральной ситуации общения из (1а) в качестве импликатуры выводится (16): (1а) Некоторые мальчики нашего класса вчера были в кино. (16) Не все мальчики нашего класса вчера были в кино. Основой импликатуры (16) является максима количества: если говорящему известно, что свойство р верно о всех А, то сообщить р только о некоторых А означало бы дать меньше информации, чем имеется в распоряжении говорящего. Однако импликатуру (16) можно отменить. Например, из (1в) уже не выводится (16): (1в) Некоторые, а может быть и все мальчики нашего класса вчера были в кино. В терминах приведенной схемы можно сказать, что вывод рас¬ сматриваемой импликатуры не удается здесь из-за неприменимости шага г). Единицы общения. Вопрос о единицах, в терминах которых мож¬ но описывать языковое общение, является другой наиболее актуальной темой прагматики наряду с исследованием принципов и правил об¬ щения. Основные достижения в этой области пока связываются с тео¬ рией речевых актов. В классическом понимании речевые акты — это действия, соверша¬ емые партнерами в процессе речевой коммуникации — описываются в терминах интенций (целей) говорящего и условий успешности их совершения, причем эти последние, в свою очередь, оформляются в терминах так называемых эпистемических состояний (предполо¬ жений, оценок, знаний) говорящего. Условия успешности обычно де¬ лятся на несколько функциональных типов [14]; пропозициональное содержание; предусловия (или подготовительные условия); условия искренности; сущностное условие (интенция) некоторого речевого акта. Для иллюстрации приведем эти условия для актов просьбы и предупреждения (Г — говорящий, Р — реципиент; С — событие; Д — действие): 201 /
Условия Пропозициональное содержание Предусловия Условие искренности Сущностное условие (коммуникативная цель Г) Просьба Будущее действие Д реципиента Р 1) Г предполагает, что Р может делать Д 2) Г предполагает, что Р сам не собирается делать Д Г хочет, чтобы Р делал Д Обращение Г представляет собой попытку заставить Р делать Д Предупреждение Будущее событие С 1) Г предполагает, что С возможно и что оно не в интересах Р 2) Г предполагает, что самому Р не известно, что С будет иметь место Г верит, что С не в интересах Р Обращение Г представляет собой попытку заставить Р осознать, что С будет иметь место и что оно не в интересах Р Классификация условий может быть иной, но общий принцип оста¬ ется тем же: выделить условия, которые должны быть выполнены, чтобы совершаемое действие можно было бы называть тем или иным речевым актом. Объектом интенсивных исследований стали перфор¬ мативные глаголы — слова, произнесение которых сопровождает производство этих актов. Вовсе не желая преуменьшить значимость результатов, достигну¬ тых в рамках теории речевых актов, следует тем не менее подчерк¬ нуть, что одних исследований этого типа совершенно недостаточно для получения адекватного представления о единицах человеческого общения, их типах и возможных взаимоотношениях в коммуникации. Как отмечается многими критиками теории речевых актов, один из основных недостатков ее заключается в том, что речевые акты исследуются в изоляции от процессов актуального общения, в частности от закономерностей построения диалога [2]. Диалог не является конструкцией такого же типа, как, например, предложение, а представ¬ ляет собой результат взаимодействия' двух или более индивидов, преследующих свои цели и нередко имеющих противоположные ин¬ тересы. Структуры, образуемые взаимосвязанными коммуникативными ак¬ тами партнеров общения, не представляют собой готовых структур. Они создаются партнерами в ходе диалога как результат их опреде¬ ленных интеллектуальных процессов — рассуждения, целеполагания, принятия решений. Поэтому выявление закономерностей развития диалога неизбежно приводит к необходимости выявления закономер¬ ностей, которые лежат в основе перечисленных интеллектуальных процессов. Итак, основной недостаток всей ’’классической” теории языкового общения, как она до сих пор развивалась в прагматике, заключает¬ ся в чрезмерной абстрактности, неспособности учитывать многообра¬ зие факторов естественного человеческого общения. Или короче: в "классической” теории отсутствует человек с его специфическими спо¬ собами рассуждения, оценки ситуаций и выработки решений. 202
Поэтому неудивительно, что если в последние годы наблюдается быстрая конкретизация идей прагматики, то одна из основных линий этого развития происходит в рамках исследований, направленных на моделирование интеллектуальных процессов человека в искусственном интеллекте. Разрабатываются различные модели ’’естественных” рас- суждений, протекающих по законам здравого смысла [15—17]. Эти модели служат также основой развития теории прагматических импликатур [18, 19]. С другой стороны, понятие речевого акта в ходе построения диалоговых интеллектуальных систем подверглось сущест¬ венной переработке [20]. И наконец, в последнее десятилетие в центре внимания теоретиков тех же систем оказалась именно проблема мо¬ делирования человека как пользователя систем [21]. Рассмотрим некоторые основные результаты предложенного нами подхода к развитию теории языкового общения на основе синтеза ’’классической” прагматики и моделирования внутренних интеллек¬ туальных процессов человека [22—24]. ПРАГМАТИКА ОБЩЕНИЯ И МОДЕЛИРОВАНИЕ ИНТЕЛЛЕКТА Развиваемая в прагматике модель общения больше всего стра¬ дает от излишней рациональности, от того, что использование опре¬ деленных речевых актов в определенных ситуациях общения стараются описать почти исключительно в терминах целей и планов говорящих. Однако процесс образования целей сам требует объяснения, так что ответ на вопрос ’’как возникают речевые акты?” не может исчерпывать¬ ся указанием на цели, средством достижения которых эти речевые акты могут служить. Необходимо ответить также на вопрос ’’как возникают цели в общении?”. Например, если /’отказывается совершить некоторое действие Д, то коммуникативная цель Г заключается в отвергании соответствующего императива (приказа, требования, просьбы) со стороны партнера. Факторы же, порождающие у него такую цель, мо¬ гут быть разные: предположение, что он сможет делать Д, оценка дейст¬ вия Д как невыгодного, страх перед последствиями Д и т.д. Это приводит к весьма запутанной проблематике мотивации. Однако, как представляется, именно через моделирование базисных механизмов этой сферы человеческого интеллекта идет путь к объясне¬ нию специфических человеческих форм рассуждения и принятия реше¬ ний в общении. Иллюстрируем возможность моделирования ’’механиз¬ мов порождения целей” на основе понятий интереса и коммуникативной стратегии и некоторых связанных с ними понятий. Интерес можно рассматривать как одну из базисных движущих сил в функционировании интеллекта, которая в общении заставляет человека анализировать сообщения партнера и направляет его внима¬ ние на определенные их аспекты, а с другой стороны, управляет вы¬ работкой своих собственных обращений. Для нас интерес является техническим понятием, покрывающим, очевидно, целый круг мотива¬ ционных факторов. Не будем глубоко вникать в содержание этой ка¬ тегории, отметим только, что понятие интереса следует отличать от понятия цели. Заинтересованность в чем-то может заставлять 203
человека сформулировать определенную цель и преследовать ее, но между этими состояниями существует и действует сложный процесс выработки решения, так что далеко не каждый интерес реализуется в соответствующей цели. Интересы возникают у людей в общении либо как реакции на обращения партнера, либо из-за необходимости само¬ му обратиться к партнеру определенным речевым актом. С каждым речевым актом в модели общения можно связывать неко¬ торые правила (их можно называть правилами интереса), указываю¬ щие, на какие аспекты содержания этого акта типично направляется внимание у его агента и на какие — у его реципиента. Формально интересы в данном смысле можно представить в виде вопросов, кото¬ рые человек задает самому себе. Например: а) Г: ОТКАЗЫВАЕТСЯ выпол ► Р: Почему Г отказался, т.е. в чем нить просьбу Р МОТИВ отказа? б) Г: Предлагает некоторый ^Имеются ли ПРЕПЯТСТВИЯ ПЛАН для достижения об- к реализации данного плана? щей цели Ц в) Г: намеревается дать Р РАС —Г: Умеет ли Р делать Д, (имеет ли ПОРЯЖЕН ИЕ делать Д Р необходимые данные для этого)? Интересы как внутренние вопросы заставляют человека искать ответы на них. Найденные ответы, в свою очередь, могут привести к определенным действиям. Таким образом, с каждым правилом ин¬ тереса может быть связано одно или несколько правил действия, в которых возможные ответы на вопрос функционируют как условия соответствующих действий. Например, в случае правила б), если /’знает, что действительно существуют определенные препятствия на пути к реализации предложенного плана, то действия Р в качестве коопера¬ тивного партнера можно описать следующим правилом: а) Р знает, что на пути реализа- »- а) Р спрашивает у Г, известно ли ции плана, предложенного Г, ему существование препятст- существуют препятствия П вий П б) Р информирует Г о препятст¬ виях П В случае же отрицательного ответа на вопрос в правиле в) возмож¬ но такое правило: б) Г известно, что у Рнетнеобхо- — а) Г дополняет свое распоряже- димых данных для соверше- ние сообщением необходимых ния Д данных б) ... Правила интереса служат средством моделирования селективности движения внимания Г и Р в общении. Правила действия, спаренные с правилами интереса, служат основой для объяснения выбора опреде¬ ленных реакций Р на реплики Г (ср. правило действия а)) или же для объяснения включения в реплику Г сразу нескольких речевых актов бёз соответствующей инициативы со стороны Р (ср. правило дейст¬ вия б)). Однако если ограничиться только правилами приведенных типов, 204
то они дадут слишком прямолинейную и механическую картину ин¬ теллектуальных процессов, лежащих в основе динамики человечес¬ кого общения. Реальные процессы намного сложнее и многограннее. Поэтому в формальной модели требуются дополнительные средства для представления различных опосредующих механизмов, управля¬ ющих выбором конкретных коммуникативных актов в некоторой ситуации общения. Суть этих механизмов проиллюстрируем с помощью понятия ком¬ муникативной стратегии и связанного с ним понятия психологичес¬ ких параметров рассуждения. Положение, при котором поставленную цель в общении можно дос¬ тичь с помощью одного единственного обращения к партнеру, в ес¬ тественном общении является скорее исключением, чем правилом. Обычно диалог, направленный на решение некоторой коммуникатив¬ ной задачи, проходит через ряд взаимосвязанных обращений парт¬ неров, образуя целостный сеанс, или цикл диалога. При этом участ¬ ники диалога, преследующие свои цели в течение всего цикла, как пра¬ вило, не пользуются какими-нибудь готовыми схемами — последо¬ вательностями речевых актов, а конструируют свои обращения по ходу диалога в соответствии с оценкой сложившейся ситуации. По¬ нятие коммуникативной стратегии призвано объяснить эту внутрен¬ нюю связность длящихся диалогов. Общую идею, стоящую за данным понятием, можно охарактери¬ зовать следующим образом. Открывая определенный цикл в общении, Г имеет в виду достиже¬ ние коммуникативной цели Цо, которая, как правило, представляет собой некоторое действие Д партнера Р (физическое, умственное, ком¬ муникативное). В течении всего цикла Г пытается направлять реле¬ вантные интеллектуальные и эмоциональные процессы Р (его инте¬ ресы, оценки, рассуждения) таким образом, чтобы те в конечном сче¬ те привели Р к нужному решению. Метод, который Г преследует при ’’обработке” партнера, мы и называем коммуникативной стратегией. В этом смысле можно говорить, например, о стратегиях уговаривания или угрозы, о стратегиях обсуждения (плана, решения), а также, напри¬ мер, о стратегиях отклонения (например, совета), отказа (от выполне¬ ния требования, приказа) и т.п. Каждая стратегия направлена на определенные аспекты психики партнера, релевантные с точки зрения преследуемой цели: его зна¬ ния, предположения, оценки, желания. Такие аспекты называются пси¬ хологическими параметрами Р. Его решение совершить действие Д предполагает определенную конфигурацию значений его психологи¬ ческих параметров. Суть применения некоторой стратегии со сто¬ роны Г заключается в организации своих коммуникативных обра¬ щений так, чтобы результатом было изменение значений релевант¬ ных психологических параметров Р в нужном направлении: усиление какого-то его желания, увеличение или уменьшение его уверенности в чем-то, изменение его положительных и/или отрицательных оце¬ нок чего-то и т.д. По отношению к исходной, или стратегической, цели Цо установление намеченной конфигурации значений психоло- 205
гических па ов выступает как инструментальная, или такти¬ ческая, цель ци. Во всей совокупности психологических параметров как факторов, которые могут оказывать некоторое влияние на принимаемые реше¬ ния человека, можно выделить определенные базисные типы, кон¬ кретизациями которых являются остальные параметры. К базисным относятся, в частности, следующие психологические параметры: жела¬ ния, оценки, знания, предположения и т.п. В перечисленных типах параметров желания выступают как непос¬ редственные стимулы действий (для того чтобы Р сделал что-нибудь, необходимо заставить его в достаточной степени желать этого), дру¬ гие же функционируют как условия — либо для желаний (оценки), либо для самих действий Д. Среди оценок различают также оценки эмоционального типа (приятно—неприятно), которые могут не иметь рациональных объяснений, и оценки рационального типа (хорошо— плохо, выгодно—невыгодно и т.п.), которые люди, как правило, могут объяснить и аргументировать. Для того чтобы в рамках некоторой функционирующей модели связывать между собой коммуникативные стратегии и психологичес¬ кие параметры, следует сформулировать также определенные прин¬ ципы, отражающие, с одной стороны, закономерности взаимодействия психологических параметров, а с другой — связи между ними и реше¬ ниями человека. Можно начать, например, со следующих очевидных (но далеко не тривиальных!) параметров: Принцип 1. Человек желает такие ситуации (включая действия), оцен¬ ка которых (по сравнению с их отсутствием) по шкале приятности положительная; человек не желает таких ситуаций, оценка которых по шкале приятности отрицательная. Принцип 2. Если человеку придется выбирать между двумя не¬ приятными ситуациями, то он выбирает менее неприятную. Первый принцип связывает между собой оценки и желания. С по¬ мощью второго можно объяснить, например, механизм действия таких стратегий, как стратегии соблазна и подговаривания, а также таких, как стратегии угрозы и устрашения. Если теперь вернуться к правилам интереса и правилам действия, описанным выше, то связь между этими правилами и понятием ком¬ муникативной стратегии следующая. Одна из функций правил инте¬ реса — это выделение психологических параметров, релевантных для достижения коммуникативной цели на конкретной стадии (цикле) общения. С другой стороны, коммуникативная стратегия, определяя, какие изменения в значениях психологических параметров необхо¬ димо совершить, управляет выбором правил действия (более деталь¬ но понятие коммуникативной стратегии и связанные с ним по¬ нятия рассмотрены в публикации [24]). * * * В .настоящей статье мы попытались очертить основные идеи праг¬ матики как науки о закономерностях языкового общения. В итоге можно сказать: из первоначальной логико-философской дисциплины 206
прагматика переросла в область исследований, где пытаются соеди¬ нять данные лингвистики, логики и моделирования интеллекта чело¬ века. Занимаясь выявлением закономерностей языкового общения, прагматики приходят к выводу, что для объяснения процессов исполь¬ зования языка в общении необходимо учесть и специфику челове¬ ческих рассуждений, которые лежат в основе процесса конструиро¬ вания и интерпретации высказываний. ЛИТЕРАТУРА 1. Leech G.N. Principles of pragmatics. L.: Longman, 1983. 352 p. 2. Levinson S.C. Pragmatics. Cambrige: Univ. press, 1983. 270 p. 3. Степанов Ю.С. В поисках прагматики 11 Изв. АН СССР. Сер. лит. и яз. 1981. N 4. С. 256—258. 4. Лингвистическая прагматика. М.: Прогресс, 1985. 502 с. (Новое в зарубежной лингвистике; Вып. 16). 5. Теория речевых актов. М.: Прогресс, 1986. 422 с. (Новое с зарубежной лингвисти¬ ке; Вып. 17). 6. Norman D. Twelve issues in cognitive science // Cognit. Sci. 1980. Vol. 4, N 1. P. 12—15. 7. Pylyshyn 7- W. Computation and cognition: Toward a foundation for cognitive science. Cambridge: MIT press, 1984. 125 p. 8. Newell A. The knowledge level // Artif. Intel. 1982. Vol. 18, N 2. P. 183—192. 9.Winograd Т., Flores F.G. Understanding computers and cognition. Norwood: Ablex, 1986. 253 p. 10. Звегинцев В.А. Предложение и его отношение к языку и речи. М.: Наука, 1976. 145 с. 11. Кибрик Ф.Е. К построению лингвистической модели коммуникативного взаимо¬ действия II Методологические проблемы искусственного интеллекта: Тр. по искусств, интеллекту. N 6. Тарту: Тартус. гос. ун-т, 1983. С. 153—168. (Учен, зап. Тартус. гос. ун-та; Вып. 654). 12. The mental representation of grammatical relations /Ed. J. Bresnan. Cambrige: MIT press, 1982. 285 p. 13. Grice HP. Logic and conversation // Syntax and semantics. Vol. 3. Speech acts / Ed. P. Cole, J. Morgan. N. Y.: Acad press, 1975. P. 41—58. 14. Searle J.R. Speech acts. Cambridge: Univ. press, 1969. P. 253. 15. Поспелов Д.А. О ’’человеческих” рассуждениях в интеллектуальных системах // Логика рассуждений и ее моделирование. М.: Науч. совет по комплекс, пробл. ’’Кибер¬ нетика”, АН СССР, 1983. С. 5—37. (Вопросы кибернетики). 16. Сергеев В.М. Структура диалога и ’’неклассические логики” // Труды по знаковым системам. N 17. Тарту: Тартус. гос. ун-т, 1984. С. 24—32. (Учен. зап. Тартус. гос. ун-та; Вып. 641). 17. Formal theories of the common-sense world /Ed. J.R. Hobbs, R.C. Moore. Norwood: Ablex, 1985. 751 p. 18. Joshi A.. Webber B.. Weischedel R. Default reasoning in interaction. MS-C1S-84-58. Phyladelphia: Univ. Comput. and Inform. Sci. Dep., 1984. 283 p. 19. Joshi A.. Webber B., Weischedel R. Living up to expectations: computing expert responses II Proc. AAAI-84. Austin (Tex.), 1984. 234 p. 20. Allen J.F., Perrault C.R. Analysing intention in utterances // Artif. Intel. 1980. Vol. 15, N 3. P. 71—80. 21. User centered systems design: New perspectives in human-computer interaction / Ed. D.A. Norman, S.W. Draper. Lawrence Erlbaum, 1986. 781 p. 22. Oim H. Where do communicative acts come from? // Pragmatics and linguistics. Odense: Univ. press, 1986. P^jl—17. 23. Saluveer М., Oim H. Rules and reasoning in discourse understanding // Neue Ansatze zur Maschinellen Sprachiibersetzung. Tubingen:, Niemeyer, 1986. S. 25—82. 24. Койт М., Ыим X. Понятие стратегии в модели общения // Методологические проблемы искусственного интеллекта: Тр. по искусств, интеллекту. N 9. Тарту: Тартус. гос. ун-т, 1987. С. 121—139. (Учен. зап. Тартус. гос. ун-та; Вып. 751). 207
Раздел 3 МЫШЛЕНИЕ И ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ УДК 62-506.22 МЕХАНИЗМ МЫШЛЕНИЯ И МОДЕЛИРОВАНИЕ ЕГО РАБОТЫ В РЕАЛЬНОМ ВРЕМЕНИ М.Н. Вайнцвайг, М. П. Полякова ВВЕДЕНИЕ Мышление человека, отдельные функции которого моделиру¬ ются сейчас системами искусственного интеллекта, возникло и раз¬ вивалось не как устройство, предназначенное для решения каких-то сложных абстрактных задач, а как механизм управления поведением, направленный на то, чтобы в широком диапазоне изменений условий внешней среды обеспечивать организму возможность существования и продолжения рода. Естественно, что свойства, ответственные за обеспечение жизнеспособности и тем самым составляющие основу механизма мышления, должны найти свое отражение при разработке создаваемых систем. Рассмотрим некоторые из этих свойств. Поскольку жизнеспособность в значительной мере зависит от свое¬ временности реакций организма на происходящие в мире изменения, то очевидно, что механизм мышления должен обладать способностью работать в реальном времени, причем качество работы будет в зна¬ чительной мере определяться скоростью решения поведенческих задач. Принципиально невозможно вложить в конструкцию механизма мышления универсальную, т.е. применимую в любых условиях среды, способность безошибочно формировать реакции, которые были бы в определенном смысле оптимальными для обеспечения жизнедеятель¬ ности организма. Этот факт можно интерпретировать как следствие известной теоремы Геделя о неполноте. Любого человека легко пос¬ тавить в ситуацию, когда он не сможет адекватным образом отреа¬ гировать на происходящее (выполнить нужное действие, правильно ответить на вопрос, решить задачу и пр.). Умение правильно и своевре¬ менно реагировать в самых различных ситуациях у человека и живот¬ ных постепенно приобретается лишь благодаря способности к обуче¬ нию, без которой было бы невозможно умственное развитие чело¬ века. Эта способность тесно связана, в частности, с требованием ра¬ боты в реальном времени, поскольку в результате обучения появля¬ ется возможность не только решать новые, ранее недоступные задачи, но быстро решать те задачи, которые прежде решались медленно. Очевидно, что жизнеспособность организма зависит также от полно¬ 208
ты использования механизмом мышления информации, получаемой из внешнего мира. Это касается не только непосредственно этапа ана¬ лиза ситуации и принятия решений, когда важно не упустить что-либо, что может быть использовано в качестве уточнения условий задачи или сигнала для изменения реакций организма. Не менее важна пол¬ нота использования информации на этапе обучения, когда строятся правила и законы; по которым потом решаются задачи и формиру¬ ется поведение. Здесь ею определяются скорость и эффективность приспособления организма к изменениям условий среды. В основе обучения лежит обобщение, в результате которого в общем потоке информации, поступающей из внешнего мира, постепенно выявляются те устойчивые сочетания элементов, их свойств и отно¬ шений, в терминах которых описываются закономерности мира, ис¬ пользуемые потом при организации поведения. Заранее невозможно установить, какие из элементов войдут в описание закономерностей, — это выявляется лишь на основе статистики при рассмотрении мно¬ жества встречавшихся ситуаций. Поэтому, чтобы удовлетворить тре¬ бованию полноты использования информации и не потерять возмож¬ ность иметь в своем распоряжении все обобщения, которые в прин¬ ципе могут быть построены в данный момент времени на осно¬ ве того, что наблюдалось, механизм мышления должен во-первых, иметь полную память о прошлых ситуациях, точнее, помнить о них по меньшей мере все то, что не способен с достаточной уверен¬ ностью восстановить на основе уже имеющихся своих знаний, а во- вторых, вести обобщение непрерывно, чтобы быть в состоянии к каж¬ дому моменту времени рассмотреть и оценить все гипотезы, образуе¬ мые различными сочетаниями описаний ситуаций, предшествующих этому моменту. Таким образом, оптимальная с точки зрения выживаемости орга¬ низма конструкция механизма мышления должна удовлетворять сле¬ дующим условиям: работать в реальном времени; обладать способностью к обучению; максимально полно использовать поступающую извне информа¬ цию как на этапе принятия решений, так и на этапе обучения; иметь полную память о прошлых ситуациях и обладать способностью непрерывного обобщения поступающей информации. Эти условия оказываются невыполнимыми в рамках традиционной идеологии вычислений с помощью одного процессора, поскольку для их выполнения требуется практически мгновенная обработка громад¬ ных массивов данных. Единственный путь совместной реализации этих условий видится в использовании средств параллельных вычисле¬ ний. В настоящей работе предлагается проект обучаемой системы управ¬ ления поведением, моделирующей механизм мышления и рассчитанной на использование параллельно работающей ассоциативной памяти — процессора. Пока, конечно же, эта модель слишком груба, чтобы претендовать на сколько-нибудь полное отражение всего многообразия функций механизма мышления человека. 14. Зак. 1668 209
СХЕМА МОДЕЛИ МЕХАНИЗМА МЫШЛЕНИЯ Рассмотрим изображенную на рис. 1 (см. также [1]) схему системы и коротко опишем функции отдельных ее блоков. Информацию о внешнем мире и своих внутренних состояниях сис¬ тема должна получать с помощью рецепторов, и посредством эффек¬ торов она сможет выполнять те или иные внешние действия. Поведение системы в общем случае будет управляться двумя функциональными блоками: сенсорным анализатором и ассоциативной памятью—про¬ цессором. При этом следует подчеркнуть, что такое разбиение в значи¬ тельной мере условно. Первый блок можно, в частности, рассматривать как начальное состояние второго блока. Сенсорный анализатор — это устройство, осуществляющее обработ¬ ку входной (сенсорной) информации, основанную на жестких, необу¬ чаемых механизмах. Предполагается, что в него, в частности, входят: механизм зрительной константности, позволяющий разделить посту¬ пающую зрительную информацию на сведения об источнике освещения, о форме предметов, отражательных свойствах их поверхностей и их относительном расположении; механизмы бинокулярного стереосин¬ теза и восстановления формы предметов по движению, уточняющие и дополняющие результаты работы механизма константности; меха¬ низм тактильного восприятия формы и свойств поверхностей предме¬ тов; механизм проприорецептивного восприятия взаимного распо¬ ложения различных частей организма; механизм слуховой ориентации и пр. Сенсорный анализатор осуществляет согласование информации, получаемой от различных органов чувств, и обеспечивает костант- ное восприятие важных свойств и пространственно-временных харак¬ теристик предметов при перемещениях организма и его частей и изменениях условий восприятия. В результате своей работы сенсор- ньлй анализатор реализует следующие функции: 1) формирует первичные оценки качества ситуаций (первичные эмо¬ ции), т.е. меру удовольствия или неудовольствия, соответствующую таким исходным ощущениям, как бцль, голод, нехватка кислорода, усталость и пр.; 2) при выполнении соответствующих условий формирует команды безусловнорефлекторных (инстинктивных) действий, т.е. действий, которые позволяют лишь с относительно большой вероятностью при¬ ходить в ситуации с положительной оценкой и накопить необхо¬ димый для обучения опыт; 3) при выполнении определенных условий формирует те или иные цели (побуждения) — построить гнездо, добыть пищу, избежать опас¬ ности и пр., — которые, будучи занесенными в виде осознанных жела¬ ний в память, могут рассматриваться как метадействия, из которых строится как бы план поведения; 4) строит описание текущего состояния организма в терминах его ощущений, производимых действий, поставленных целей и испы¬ тываемых эмоций, которое через поле внимания может быть занесено в основную (долговременную) память и использовано для обучения и формирования дальнейшего поведения; 210
Рис. 1. Модель механизма мышления 5) выдает команды управления ’’внутренними эффекторами”, т.е. управляемыми параметрами самого сенсорного анализатора, такими, -нагфимер, как размеры и форма рецептивных полей, типы детекторов, размер эффективного поля зрения, степень подробности описания его содержимого и пр. По мере обучения ’’внутренние эффекторы”, так же как внешние — руки, ноги или те, например, что осуществляют кон¬ вергенцию глаз или аккомодацию хрусталика, начинают управляться памятью; 6) для каждого из результатов (п. 1—5) вычисляет значения их важности. Выходной буфер производит по максимуму важности выбор коман¬ ды, поступающей либо от сенсорного анализатора, либо от основной (ассоциативной) памяти и разворачивает ее в программу действий, выполняемых эффекторами. Блок эмоций суммирует оценки ситуации, получаемые от сен¬ сорного анализатора (первичные эмоции), и оценки, получаемые из основной памяти и зависящие от ее состояния (вторичные эмоции). Суммарная оценка служит мерой качества текущего состояния орга¬ низма. Она постоянно поступает в поле внимания и запоминается вместе с другой заносимой в память в данный момент информацией, в резуль¬ тате чего все события, сохраняющиеся в памяти, оказываются эмоци¬ онально окрашенными. Кратковременная память является местом, где хранится инфор¬ мация, поступающая от сенсорного анализатора, пока в основной па¬ мяти осуществляется коррекция ее важности, и откуда эта информация может потом попасть в поле внимания, если ее важность окажется достаточно большой. Поле внимания представляет собой регистр (или канал) основной памяти, на входе которого в каждый момент времени по максимуму важности производится выбор информации, поступающей либо от сен¬ сорного анализатора, либо из памяти. Объект, попавший в поле внима¬ ния, всегда запоминается, причем запоминаются все те и только те объекты, которые проходят через поле внимания. 211
I Основная память, или ассоциативная память—процессор, является как местом постоянного хранения информации, поступающей через поле внимания, так и процессором, осуществляющим обработку этой ин¬ формации, в основе которой лежит операция ассоциации, т.е. сопос¬ тавление описания текущей ситуации со всем содержимым памяти. Па¬ мять имеет два ассоциативных входа, на один из которых информа¬ ция поступает от сенсорного анализатора, на другой — из памяти. В процессе асоциации осуществляются: формирование понятий и законов, постановка задач, решение задач и формирование вторич¬ ных эмоций. Функциями ассоциативной памяти—процессора в основ¬ ном и определяется весь мыслительный процесс. Рассмотрим теперь работу некоторых блоков, их функции и взаи¬ модействие более подробно. ПЕРЕКЛЮЧЕНИЕ ВНИМАНИЯ В результате ассоциации объекта, находящегося в поле внимания, с содержимым памяти внимание может переключиться на некоторый объект из памяти, определенным образом связанный с тем, что нахо¬ дился в поле внимания. Ассоциированный объект (тот, на который переключилось внимание) может, в свою очередь, вызывать ассоциа¬ ции и т.д. Так возникает цепочка связных ассоциаций, которая опре¬ деляет последовательный ход наших мыслей. Эта цепочка может обор¬ ваться, т.е. внимание может переключиться на объект, поступивший из памяти или от сенсорного анализатора, не имеющий ничего общего с объектом, на который было обращено внимание. Так, ход наших мыс¬ лей может быть прерван резким звуком или тем, например, что мы вдруг вспоминаем о каком-то неотложном деле. При этом чем больше мы поглощены своими мыслями, чем важнее они нам представляются, тем труднее нас отвлечь и тем сильнее должен быть раздражитель, способный это сделать. На этом основании, собственно говоря, и мож¬ но предположить, что каждому объекту, находящемуся в памяти или поступающему от сенсорного анализатора, в момент обращения вни¬ мания соответствует некоторая величина — важность [2], и внимание всякий раз переключается на объект, для которого значение этой величины максимально. При этом очевидно, что для возникновения * цепочек связных ассоциаций необходимо, чтобы важности всех лежа¬ щих в памяти объектов зависели от конкретного вида объекта, нахо¬ дящегося в поле внимания, а это значит, что они должны перевычис- ляться при каждом переключении внимания. Учитывая, что переключения внимания происходят у человека дос¬ таточно часто, а число объектов, для которых нужно перевычислять важности, очень велико, естественно предположить, что такое пере¬ вычисление производится для всех объектов памяти одновременно. Это, в свою очередь, означает, что каждый объект памяти обрабатыва¬ ется своим процессором, т.е. обработка ведется распределенным по памяти множеством процессоров. 212
ВАЖНОСТЬ ВХОДНЫХ ОБЪЕКТОВ Как уже говорилось, выбор объекта, на который будет переклю¬ чено внимание, производится как среди объектов памяти, так и среди объектов, поступающих от сенсорного анализатора. Очевидно также, что важность объекта, поступающего от сенсорного анализатора, должна зависеть как от его конкретного вида, так и от состояния памяти. В частности, известно [3], что одной из величин, вносящих вклад в эту важность, является контраст, т.е. мера неожиданности появления объекта в данной ситуации. Чем неожиданнее объект, тем легче на него обратить внимание и тем легче и чаще он потом вспоминается. Эта важность должна также зависеть от распределения важностей стоящих в данный момент задач. Так, например, при поис¬ ках какой-либо вещи мы как бы настраиваем себя на то, что среди всех предметов, попавших в наше поле зрения, именно этой вещи бу¬ дет приписана высокая важность, благодаря которой она и попадает в поле нашего внимания. Очевидно, что в обоих случаях для вычис¬ ления важности входного объекта необходимо его сопоставление (ассоциация) с содержимым памяти, т.е. необходим канал (см. рис. 1), по которому объекты от сенсорного анализатора будут постоянно, помимо поля внимания, поступать в основную память для ассоциации (но не для запоминания!). Как будет видно из дальнейшего, этот канал используется не толь¬ ко для вычисления важности объекта, поступающего от сенсорного анализатора, но и для формирования бессознательных (условнореф¬ лекторных) действий. Пока в памяти производится коррекция важности входных объектов, они должны где-то храниться, чтобы была обеспечена возможность их попадания в поле внимания. Это значит, что должна существовать буферная (кратковременная) память (см. рис. 1), куда входные объекты поступают без важностей и откуда они попадают в поле внимания, а затем в основную память, если их важность оказывается достаточно большой. Итак, мышление можно рассмотреть как циклически повторяющий¬ ся процесс, состоящий из следующих этапов: 1) ассоциации входного объекта и максимально важного объекта из памяти одновременно со всеми объектами из памяти, в результате чего производится коррекция важности входного объекта и перевы- числяются значения важностей всех объектов из памяти; 2) записи объекта, находящегося в поле внимания, и его важности в память; 3) переключения внимания на объект (входной или из памяти), имеющий максимальное значение важности. СОЗНАТЕЛЬНОЕ И БЕССОЗНАТЕЛЬНОЕ Процесс переключения внимания осознаваем.^ Это значит, что чело¬ век на протяжении какого-то времени может дать себе отчет, т.е. посредством некоторого ассоциативного запроса вспомнить, на что и в каком порядке обращалось его внимание. По существу, слово ’’осознать” можно рассматривать как синоним выражения ’’обратить 213
внимание на ассоциируемый объект”, а слово ’’сознание” — как сино¬ ним "память об ассоциации”. В частности, если вспоминается (т.е. вновь поступает в поле внима¬ ния и заносится в память с модальностью ”из памяти”) только что виденный объект, говорят об осознании факта видения этого объекта; если образ конкретной собаки вызывает в памяти ассоциацию с ранее сформированным обобщенным понятием ’’собака”, говорят об осозна¬ нии того, что в данный момент видится собака. Осознан может быть построенный в памяти закон, возникшее желание;" стоящая задача и пр. Осознан (вспомнен) может быть и сам факт осознания. Лишь при наличии осознания, которое позволяет производить перегруппировку в описании естественного хода событий и соединять вместе разбро¬ санные по памяти элементы, появляется возможность сопоставлять и находить общее в различных процедурах поиска, путях рассуждений, решениях задач и пр. Следует подчеркнуть, что осознание возможно лишь при наличии канала, по которому информация из памяти может поступить в поле внимания и таким образом быть еще раз записана на новом месте памяти. Именно это отличает сознательную систе¬ му от условнорефлекторной. Естественно, что процесс ассоциации, вычисления важностей и формирования объекта, на который должно переключиться внимание, как и любой другой процесс, протекающий в промежутке времени между двумя последовательными переключениями внимания, не может быть осознан, так как не попадает в поле внимания, а потому не запо¬ минается. В самом деле, в противном случае возник бы порочный круг, поскольку каждое одиночное переключение внимания требовало бы многократного предварительного переключения внимания. Лишь в результате вспоминания и анализа последовательности объектов, проходивших через поле внимания, человек может прийти к выводу, что его внимание переключалось на интуитивно важные объекты (контрастные, эмоционально окрашенные, перспективные при решении стоящей задачи и пр.). Итак, в памяти имеется информация двух типов: 1) основные дан¬ ные, к которым относятся описания ощущений, эмоций, выполняемых действиях, законов, задач и путей их решений, словом, все, что прохо¬ дило когда-то через поле внимания, сохраняется в неизменном виде, а потому всегда доступно осознанию; 2) соответствующие основным данным вспомогательные параметры, такие, как величины ассоциа¬ ции, важности, надежности предсказания и пр., постоянно перевычис- ляемые в процессе ассоциаций, управляющие ходом последующих ас¬ социаций и используемые в процессах обучения, постановки и реше¬ ния задач, возникновения вторичных эмоций, переключения внимания, посылки команд эффекторами и пр. При осознанйи поступающая из памяти и вновь заносимая туда информация заносится вместе с текущими значениями тех вспомога¬ тельных параметров, которые определяли способ ее ассоциации (см. ниже), в результате чего они фиксируются в памяти в виде данных основного типа. Именно так происходит, например, осознание обоб¬ щении, стоящих задач и пр. 214
Расчленение мыслительного процесса на сознательный и бес¬ сознательный позволяет отделить основанный на ассоциации процесс параллельной (быстрой) обработки вспомогательной информации, иду¬ щий как бы в промежутке времени между двумя последовательными переключениями внимания, от последовательного (медленного) про¬ цесса заполнения памяти через поле внимания основной информацией. СОБЫТИЯ И СИТУАЦИИ Событием мы называем полную информацию об ощущениях системы, ее действиях, испытываемых эмоциях и состоянии поля вни¬ мания на данный момент времени. При этом в памяти сохраняется лишь описание события, т.е. та информация о нем, которая попадает в поле внимания. Эту информацию мы и будем иметь в виду, говоря в дальнейшем о событиях, хранящихся в памяти системы. Ситуацией, в которой находится система в некоторый момент вре¬ мени, мы называем совокупность всех данных, способных повлиять на формирование реакции системы в следующий момент. В принятой нами схеме текущая ситуация характеризуется соответствующими данному моменту времени событием и состоянием памяти системы. При этом считается, что в системе происходит лишь заполнение памяти в порядке поступления информации из поля внимания — с течением времени ничто из памяти не исчезает, могут лишь изменяться (в част¬ ности, при забывании уменьшаться) важности того, что помнится. Таким образом, ситуация, соответствующая каждому моменту времени, представляется в памяти последовательностью описаний событий с указанием начала отсчета, задающего прошлое, настоящее и будущее. АССОЦИАЦИИ Ассоциацией будем называть основанную на совмещении соответст¬ вующих начал отсчета операцию сопоставления описания текущей ситуации S, со всеми хранящимися в памяти описаниями прошлых ситуаций и их обобщениями. В результате ассоциации для каждого из лежащих в памяти описаний Sh во-первых, вычисляется величина ассоциации, т.е. мера сходства a(S„ SJ, а во-вторых, формируется так называемый след ассоциации T(Sh SJ, устанавливающий структурное соответствие сопоставляемых описаний с указанием мест их сходства и различия. Понятие ассоциации, очевидно, применимо как к линейным, так и к плоским или пространственным описаниям (картинкам, объемным сценам и пр.). Здесь, однако,для простоты мы ограничимся рассмот¬ рением ассоциаций лишь линейных описаний, представляющих собой последовательности символов. Пример мира, соответствующего таким описаниям, приводится в работе [2]. 215
АССОЦИАТИВНАЯ ПАМЯТЬ-ПРОЦЕССОР Итак, будем считать, что вся поступающая в память основная информация представлена в символьном виде. Приход каждого следующего символа будем рассматривать как новое событие, а пос¬ ледовательность символов, разбитую на настоящее, прошлое и бу¬ дущее, — как описание соответствующей ситуации. Как уже говорилось, работа памяти системы характеризуется тем, что запись в память и считывание из нее производятся последователь¬ но, а ассоциация описания текущей ситуации, представляющей собой сколь угодно длинную последовательность символов, со всеми прош¬ лыми описаниями ситуаций ведется одновременно. Это, по существу, приводит нас к описываемой ниже конструкции ассоциативной памя¬ ти—процессора (АПП). Основу АПП составляет [4] (см. рис. 2) однородная линейно упоря¬ доченная последовательность элементов памяти (ЭП), представля¬ ющих собой микроЭВМ с небольшой памятью. Каждый из ЭП предназ¬ начен для хранения и обработки информации, соответствующей оди¬ ночному элементу описания ситуации (в нашем случае — символу), и имеет память для хранения не только этого элемента, но и таких вспомогательных параметров, как важность, контраст, величина ас¬ социации и пр. Любой ЭП имеет доступ к памяти двух соседних ЭП (левого и правого) и к общей магистрали, которая выполняет, в частности, роль поля внимания. С помощью магистрали информация может поступать ко всем ЭП одновременно. Предполагается также наличие у АПП коммутационной среды (аналога телефонной сети), позволяющей устанавливать связи одновременно между многими па¬ рами ЭП, расположенных на произвольных расстояниях друг от друга, а также наличие некоторых дополнительных устройств, позволяющих быстро выполнить,в частности, такие операции, как поиск ЭП с мак¬ симальным (минимальным) значением некоторого параметра g\ сум¬ мирование значений параметра g по всем ЭП, принадлежащим АПП; прерывание или восстановление проводимости магистрали на участке, соответствующем ЭП в зависимости от значения его параметра g [5]. Работа АПП определяется заложенной в каждом ЭП программой (одной и той же для всех ЭП) и межет управляться сигналами (коман¬ дами), посылаемыми по магистрали. Коммутационная среда Магистраль (поле внимания) 1 ЭП 1 1 ЭП 1 1 ЭП 1 Суммирование по i Выбор максимума по i Рис. 2. Ассоциация память—процессор 216
Запись в АПП производится последовательно, символ за симво¬ лом, в порядке их поступления из поля внимания, т.е. по магистрали. В результате всякая прежняя ситуация S, будет описана в АПП после¬ довательностью символов еи ei, ...е„ поступавших по магистрали вплоть до момента /</, где t - текущий момент. РЕАЛИЗАЦИЯ АССОЦИАЦИЙ Каждый поступивший по магистрали символ, кроме его занесе¬ ния в АПП, сравнивается одновременно со всеми аналогичными сим¬ волами, уже лежащими в памяти, в результате чего происходит ассоциация, т.е. последовательное сопоставление описания текущей ситуации S, одновременно со всеми описаниями прошлых ситуаций Sj и их обобщениями. Наиболее простым из естественных типов ассоциаций последова¬ тельностей символов является жесткая ассоциация, в результате ко¬ торой выделяется максимально длинный непрерывный отрезок, явля¬ ющийся общим концом двух ассоциируемых последовательностей. Ве¬ личину ассоциации можно считать равной длине (числу символов) этого отрезка. В этом простейшем случае задача ассоциации реша¬ ется с помощью АПП следующим образом. Каждому ЭП, кроме хра¬ нящегося в нем символа е„ ставится в соответствие параметр a\ = a(Sj, S,), характеризующий в каждый текущий момент времени t величину ассоциации ситуаций S, и S,. Значения а' вычисляются по следующему рекуррентному правилу, которое с приходом каждого следующего символа е, выполняется одновременно во всех ЭП: если е, = е„ то aj = a!zj+ 1, иначе а,' = 0. Процесс последовательного вычисления а' с приходом каждого очередного символа концевого отрезка последовательности ...baacbacb... baacb можно проследить на следующей таблице: baacbacb Ы0001001 а02100200 аО1300100 С00040020 Ы0005003 Важным обобщением понятия жесткой ассоциации, без которого было бы невозможно построение сколько-нибудь сложных законов, является мягкая ассоциация, которая при установлении похожести допускает пропуски, т.е. чередование участков совпадения и несов¬ падения элементов описаний. Примерами мягкой ассоциации может служить сопоставление таких последовательностей: baaafaaaabaaf... (1) .. .baaaaf aaabaaaf 217
или ...15 + 3 = 18... (2) ....5 + 23 = 28. В основе мягкой ассоциации лежит процесс, при котором имеющий¬ ся в точке совпадения результат ассоциации, во-первых, расплыва¬ ется с уменьшением величины ассоциации на соседние справа участки памяти, а, во-вторых, имеющаяся величина ассоциации постепенно убывает во времени — забывается. При этом расплывание представляет собой хотя и быстро, но последовательно распространяющийся по памяти процесс, время пол¬ ного затухания которого до а' = 0 зависит от состояния памяти. Как видно из примера (1), разные элементы описания могут играть разную роль при вычислении величины а' мягкой ассоциации. Есть важные (контрастные) элементы (b и /), совпадение с которыми должно резко увеличивать величину ассоциации, а несовпадение — приводить к резкому ее уменьшению (забыванию), и есть неважные (фоновые) элементы, совпадение или несовпадение с которыми должно мало влиять на величину ассоциации, благодаря чему при ассоциации они могут как бы пропускаться. Алгоритм вычисления а'в случае мягкой ассоциации, позволя¬ ющий учитывать как значения контраста символов памяти и входа, так и близости длин участков несовпадения описаний, описывается следующим рекуррентным правилом: если е, = е„ то а' = А, иначе а] —В, где А = шах(Д а'~\ + о,-), В = тах(0, а]_\ — и,- а'~1 —иг д+{ —и,->, и,- —важ¬ ность (контраст) символа е, (Uj> 0). Другие алгоритмы мягкой ассоциации описываются в работе [6]. Введение в алгоритм мягкой ассоциации возможности расплы¬ вания влево позволяет учитывать при вычислении а' совпадение символов и при нарушении их упорядоченности. Как будет видно из дальнейшего, нужны и другие типы ассоциа¬ ций, в частности учитывающие при сопоставлении описаний длину несовпадающих фрагментов или наличие равных фрагментов, до¬ пускающие неупорядоченность в наборе фрагментов и пр. В общем случае процесс вычисления ассоциации представляет собой рекуррентную процедуру, в основе которой лежит операция сравнения символа, пришедшего по магистрали, одновременно со всеми символами памяти. В зависимости от результатов сравнения на местах сравнения, во-первых, происходит увеличение или умень¬ шение величин ассоциации, а во-вторых, результаты сравнения фик¬ сируются в следе ассоциации. 'Кроме того, между тактами этого сравнения протекают следующие два параллельно-последовательных процесса. Первый — расплывание всех результатов ассоциаций по памяти как вправо (в будущее), так и влево (в прошлое) с возможным, зависящим от вспомогательных параметров соответствующих элемен¬ тов памяти затуханием по мере этого расплывания величин пред- 218
настройки (расплывшихся величин ассоциации), коррекцией следа 'а«6цйаций, т.е. запоминанием в нем пути расплывания, и выбором в каждом элементе памяти следа, соответствующего максимуму из натекших в этот элемент величин преднастройки. Этот процесс реализуется с помощью связей между соседними элементами памяти. Благодаря ему появляется возможность сопоставлять как не пол¬ ностью совпадающие описания (мягкая ассоциация), так и описания с частично измененным порядком следования элементов. Этот процесс является как бы аналогом известного в психологии типа ассоциации ”по смежности”. Второй процесс полностью аналогичен первому, с той лишь раз¬ ницей, что расплывание происходит не по соседним элементам па¬ мяти, а по связям, установленным в коммутационной среде. Эти связи соединяют между собой ранее сассоциировавшиеся места па- мята. Они проводятся в момент занесения описания в память, если заносимый фрагмент описания вызывает ассоциацию с некоторым местом памяти, настолько большую, что на этот факт обращается внимание; например, если происходит ассоциация с каким-то уже сформированным понятием. Скажем, слово ’’бегущий” ассоциируется с понятием ’’движение”, в результате чего происходит осознание того, что имеет место ’’движение”. Будем считать, что осознание всегда приводит к проведению такой связи. Каждая такая связь является как бы дополнительным элементом описания, который может наряду с другими элементами участвовать в сопоставлении. В ре¬ зультате проведения связей в памяти строитсй некоторая разно¬ видность семантической сети, в которой различные вхождения тож¬ дественных понятий (отсылки к понятию) образуют связный граф. С помощью этой сети параллельно реализуются операции сулер- 'позйции ассоциаций, некоторые операции логического вывода, фор¬ мируются вторичные эмоции, оценки важности задач и пр. Процесс расплывания в такой сети аналогичен также известному в психо¬ логии типу ’’ассоциации по сходству”. Хотя процессы расплывания и протекают последовательно во времени, но быстро затухают. Поэтому в первом приближении можно считать, что время их затухания фиксировано, а потому не выводит весь процесс ассоциации за рамки течения в реальном времени. При реализации процессов ассоциации возникает целый ряд проблем, связанных с рекуррентным формированием и компактным хранением следа ассоциации, а также с возможностью затирания при расплы¬ вании одних перспективных ассоциаций другими. Перейдем к рассмотрению того, как используются ассоциации в процессах обобщения, решения задач и организации поведения. ВНУТРЕННИЙ ЯЗЫК СИСТЕМЫ Ассоциация изначально ориентирована на формирование и работу с выражениями некоторого языка, на котором описываются понятия (предикаты от ситуации), а также законы и задачи. Такой язык должен удовлетворять следующим требованиям. Ассоциация должна быть в равной мере применима как к исходным описаниям, так и 219
к сформированным выражениям этого языка. В частности, должна реализовываться возможность выяснения применимости к конкрет¬ ному описанию тех или иных обобщений. Кроме того, выражения языка должны достаточно просто формироваться в процессе ассоциации. Следует подчеркнуть, что от выбора конкретного языка и кри¬ териев формирования его выражений в значительной мере зависит эффективность обучения и работы системы. Пока в качестве та¬ кого языка рассматривается следующее расширение языка регуляр¬ ных выражений. Конкретный символ, переменный символ и пустой символ суть понятия. Если А и В — понятия, то понятиями являются: конкатенации (А В) — простая конкатенация (запись подряд) А и В, (А° В) — неупорядоченная конкатенация А к В, (А)* — циклическая конкатенация А произвольной длины, (А)л — циклическая конкатенация А длины п; логика (А, В) — А или В, (А; В) — А и В, (Л) — не А; отношения если А — конкатенация (возможно, неупорядоченная) понятий Ai, Аг, .... Ah ..., Aj, ... А„, то конструкция, полученная из А добавлением дуг, связывающих: 1) понятия Ai и Aj и указывающих, что их значения равны, или 2) звездочки при А,- и Aj, если эти понятия имеют вид (3Q*, и указы¬ вающих, что значения этих понятий содержат равные числа шагов цикла конкатенации, или 3) показатели тип, если А,- и Aj имеют соответственно вид (Х)т u(Y)n, и указывающих, что длины значений понятий А,- и Aj находятся в отноше¬ нии т/п, также есть понятие. Поскольку всякое понятие рассматривается как обобщенное описание ситуации, то каждому из них должен соответствовать некоторый класс описаний ситуаций — в нашем случае класс бесконечных по¬ следовательностей символов. На этом основании будем считать, что каждому отдельно взятому понятию справа и слева условно при¬ писаны произвольные переменные, описывающие соответственно неконкретизируемое прошлое и будущее обобщаемых ситуаций. На множестве понятий определено отношение общее—частное. По¬ нятие А является обобщением понятия В (В является частным случа¬ ем А), если множество истинности В формально содержится в мно¬ жестве истинности А. Очевидно, что при замене в понятии А неко¬ торых его подпонятий, не стоящих под знаком отрицания, на их обобщения будет получено обобщение понятия А. Если такую замену произвести для понятий, стоящих под знаком отрицания, будет по¬ лучен частный случай понятия А. Законом будем называть пару понятий {А, В), где А называется посылкой, В — следствием, и для множества реальных ситуаций 220
указана вероятность выполнения В при условии А (вероятность истин¬ ности утверждения А-*В). Задачей будем называть пару понятий (А, В), где А — характеристика исходных условий, а В — характе¬ ристика цели, т.е, свойств ситуации, соответствующих побуждению или желанию (см. ниже). Решение задачи (А, В) — это такое понятие С, которое не противоречит имеющимся законам и является конкретиза¬ цией одновременно понятий и А, и В. ФОРМИРОВАНИЕ ПОНЯТИЙ И ЗАКОНОВ Понятия и законы внутреннего языка в системе предполагается формировать рекурсивно, когда сложные понятия строятся на основе ранее построенных простых понятий. Идея состоит в том, что поня¬ тия ограниченной сложности могут строиться в процессе последо¬ вательных ассоциаций непосредственно в тех же местах памяти, где хранятся исходные описания. Заметим, что понятие, являющееся обобщением некоторого кон¬ кретного описания А, может быть представлено в виде пары (А, В), где В — задание способа ассоциации А с другими описаниями. Естественно считать, что для исходных описаний ситуаций, кото¬ рые будут потом обобщаться, эта ассоциация должна быть ’’мягкой” — должно существовать некое размытое множество возможных путей ас¬ социации, которым соответствуют различные значения величины ас¬ социации. Для уже сформированного понятия ассоциация должна стать ’’жесткой”, в результате чего на некотором множестве путей (воз¬ можно, единственном пути) ее величина будет максимальной, а для остальных — равна нулю. Будем считать, что способ ассоциации хранящегося в памяти опи¬ сания А определяется значениями параметров, приписанных каж¬ дому из элементов А. Будем также считать, что в памяти существует как бы два параллельно реализуемых этажа ассоциации: первый — конкретный, на котором значения параметров, задающих способ ассоциации Bi, неизменны, т.е. принадлежат к основному типу данных, и второй — этаж обобщения, на котором эти значения, определя¬ ющие способ ассоциации Вг и изначально совпадающие со значениями параметров первого этажа, изменяются в процессе ассоциаций и рекуррентного накопления статистики, т.е. принадлежат к вспомога¬ тельному типу данных. Это соответствует как бы наличию в памяти двух разных описа¬ ний: неизменного — конкретного (А, В\) и постоянно изменяющегося — обобщенного (А, В2). Величины ассоциации этих описаний могут между собой различаться. Это значит, что внимание по максимуму важности может быть обращено как на одно, так и на другое описа¬ ние, в результате чего соответствующая пара {{А, В\) или (A, Zfe)) вновь будет занесена в память одновременно на оба этажа. В первом случае произойдет обычное вспоминание описания А, сопровождающееся его записью на новом месте памяти, во втором — осознание его обоб¬ щения, т.е. фиксация соответствующего ему понятия на первом этаже памяти в виде данных основного типа. 221
Если построенное таким образом понятие имеет место в текущей ситуации S„ оно в результате осознания этого факта посредством отсылающей к этому понятию связи, установленной в коммутацион¬ ной среде, может быть включено в качестве элемента описания S,. При дальнейших ассоциациях этого описания может быть сделан следующий шаг обобщения и построено более сложное понятие. Здесь, пожалуй, самая сложная проблема состоит в выборе того ес¬ тественного набора обобщений, который должен строиться непосред¬ ственно в процессе ассоциаций и накопления статистики. Пока в ка¬ честве обобщений описаний, в которых отсутствуют отсылки, рас¬ сматриваются выражения описанного выше языка с одним уровнем вложенности скобок, которые могут содержать переменные и раз¬ личные виды операции конкатенации (обычную, неупорядоченную, цик¬ лическую). С появлением в описаниях отсылок появляется возмож¬ ность строить выражения с логическими связками и дугами. Ассоциативное построение понятий предполагается уложить в сле¬ дующую простую схему. ' Каждый элемент содержимого памяти, сопоставляясь с элементом входной последовательности, может интерпретироваться фиксирован¬ ным числом способов — быть отсылкой к какому-либо уже построен¬ ному понятию: быть началом, продолжением или концом конкретного слова; началом, продолжением или концом переменного слова, ко¬ торое может быть произвольным или иметь фиксированную длину; быть связанным с соседним словом упорядоченной или неупорядочен¬ ной конкатенацией и т.д. Будем считать, что каждому из этих спо¬ собов интерпретации соответствует вес, который будет служить ко¬ эффициентом при выборе одного из возможных путей ассоциации. Набор таких весов будем называть ассоциатором данного элемента памяти. В результате ассоциации в каждом из ассоциаторов, принадле¬ жащих второму этажу памяти, пропорционально энтропии распределе¬ ния его весов, величине ассоциации и надежности предсказания последующих элементов памяти происходит относительное увеличе¬ ние весов тех способов интерпретации, которые принимали участие в ассоциации, т.е. принадлежат ее следу. Последовательность значений ассоциаторов на некотором отрезке содержимого памяти представляет собой как бы текущее значение обобщенного описания ситуации — своеобразное нечеткое понятие, эквивалентное некоторому множеству предикатов от ситуации с за¬ данным на нем распределением весов. В процессе последующих ас¬ социаций на отдельных участках памяти будет происходить посте¬ пенное контрастирование распределения весов различных способов интерпретации, приводящее к выделению среди них наиболее предпоч¬ тительных. В сформированном виде, когда состояния ассоциаторов определяют лишь единственную возможную последовательность типов интерпрета¬ ции, обобщенное описание ситуации соответствует тому, что обычно называют понятием, и формально эквивалентно одиночному предика¬ тиву от ситуации. 222
Одновременно с построением понятий происходит формирование законов. Они строятся в виде утверждений, имеющих вид причинно- следственной связи (причина предшествует следствию) с соответст¬ вующими оценками надежности. Для понятия А, построенного из подпонятий Аи Аг, .... А„, связанных операциями конкатенации или конъюнкции, в процессе последовательных ассоциаций рекуррентно вычисляются надежности одновременно всех законов вида А\, Аг, .... Ai—Aj+l, ..., А„. Алгоритмы формирования простейших законов такого рода описаны в работе [6]. ОРГАНИЗАЦИЯ ПОВЕДЕНИЯ Опишем теперь основные принципы работы системы и организации ее поведения. Это описание будет вестись в терминах, которые в определенном смысле применимы и к описанию поведения человека. Существуют три уровня организации поведения: 1) безусловнорефлекторный (инстинктивный) уровень, характеризу¬ емый отсутствием использования каких-либо сведений из основной памяти; 2) условнорефлекторный (бессознательный) уровень, характеризу¬ емый тем, что при организации поведения хотя и используются све¬ дения из основной памяти, но никакие промежуточные результаты процесса этой организации не осознаются, т.е. не попадают в поле внимания и не запоминаются; 3) сознательный уровень, основанный, как правило, на много¬ кратном (циклическом) использовании памяти, когда результаты работы каждого шага цикла, попадая в поле внимания и вызывая в памяти дальнейшие ассоциации, запоминаются. Рассмотрим эти уровни более подробно. 1. Безусловнорефлекторное поведение. Пока память пуста, поведение может управляться лишь сосредоточенным в сенсорном анализаторе механизмом безусловных рефлексов. Безусловные рефлексы, частным случаем которых можно считать и спонтанную двигательную актив¬ ность, играют в процессе развития человека важную роль. Позволяя быстро формировать правильные реакции в простых, но важных для жизни ситуациях, а в менее важных ситуациях правильно реагиро¬ вать лишь с относительно большой вероятностью, они выполняют следующие функции: 1) на начальном отрезке жизни, когда благо¬ даря опеке родителей у человека (или животного) есть возможность жить в максимально упрощенном мире, они позволяют существовать при отсутствии опыта и лишь постепенно его накапливать: 2) увеличивая по сравнению с чистой случайностью вероятность правильных реак¬ ций, они ускоряют накопление положительного опыта, а тем самым и процесс обучения. '■* Сенсорный анализатор, получая информацию от органов чувств, производит ее первичную обработку, в процессе которой строится, в частности, некоторое описание наблюдаемой картины мира и вы¬ числяются начальные компоненты важностей отдельных элементов этого описания. Все это передается в кратковременную память и посредством поля внимания может быть занесено в основную память. 223
Если входная информация удовлетворяет условиям применимости безусловнорефлекторного действия, сенсорный анализатор подает через выходной буфер соответствующие команды эффекторам. Так, на¬ пример, младенец, ощущая в своей руке какой-либо предмет, сжи¬ мает пальцы, зажмуривает глаза при ярком свете, отдергивает руку от горячего и пр. Для каждой такой команды вычисляется значение важности, которое зависит от степени удовлетворения соответствующе¬ го условия. Если эта важность превышает важность аналогичных команд, посылаемых из памяти (при пустой памяти такие команды от¬ сутствуют — их важность равна нулю), эффекторы выполняют инстинк¬ тивные действия. В противном случае выполняются условнорефлектор¬ ные, или сознательные действия. К разряду инстинктивных (внутренних) действий можно отнести и формирование первичных целей — побуждений (см. ниже), осозна¬ ние которых приводит к возникновению соответствующих желаний. Каждой из таких целей соответствует определенная величина эмоции, которая будет получена при достижении цели. При выполнении инстинктивного действия не только соответст¬ вующая ему команда, но и ее контекст в виде содержимого кратко¬ временной памяти и испытываемых при этом эмоций имеют достаточно высокие важности, в результате чего то и другое попадает, как правило, в поле внимания, а оттуда — в основную память. Таким образом, механизм безусловного рефлекса осуществляет начальную загрузку основной памяти, которая, занимаясь накоплением и обоб¬ щением результатов его работы, в дальнейшем принимает на себя практически все управление поведением. Инстинктивное поведение не использует при своей организации никакие внешние механизмы мотивации. Это, однако, не имеет места для других уровней. В основе условнорефлекторного и сознательного поведения лежат ранее испытанные эмоции или сформированные на инстинктивном уровне побуждения. Эмоция — это величина, способная принимать как положительные, так и отрицательные значения и характеризующая меру получаемого в данный момент удовольствия или неудовольствия. Она является основной оценкой качества состояния организма и отношения к нему внешней среды. Посредством формирования желаний или нежеланий совершения тех или иных событий эмоции определяют цели будущего поведения, которое направлено на максимизацию некоторого их интеграла. Эмоции возникают, т.е. становятся не равными нулю, в ответ на совершение тех или иных событий. Как уже говорилось, они делятся на первичные, не зависящие от состояния памяти, и вторичные, значения которых определяются ассоциациями с содер¬ жимым памяти. Получаемое в данный момент времени удовольствие или неудовольствие определяется суммарным значением всех соответству¬ ющих этому моменту первичных и вторичных эмоций. Первичные эмоции возникают в результате изменения во времени значений жизненно важных параметров, таких, как температура тела, давление крови, количество в ней кислорода или сахара и пр. Каж¬ дому из таких параметров г соответствует значение нормы го.
По мере удаления текущего значения г от нормы или приближения к ней формируется отрицательная или соответственно положитель¬ ная аддитивная компонента эмоций Э„ которая может быть представ¬ лена в виде Э'г-(г — г0)(к — /г), где г — производная от г по времени, к и I — некоторые поло¬ жительные коэффициенты, которые в первом приближении можно счи¬ тать постоянными. Первичные эмоции согласованы с безусловнорефлекторными дейст¬ виями в том смысле, что последние часто приводят к избавлению от отрицательных или достижению положительных первичных эмоций. Это, однако, не означает, что механизм безусловных рефлексов управляется первичными эмоциями — он действует самостоятельно по принципу стимул—реакция. Безусловные рефлексы и первичные эмоции являются, по существу, различными выходами одного и того же устройства (сенсорного анализатора), различными следствиями одних и тех же условий. Вторичные эмоции зависят от состояния памяти. Им определяется эмоциональный настрой системы, т.е. одни и те же события в за¬ висимости от состояния памяти могут, вообще говоря, вызывать как положительные, так и отрицательные эмоции. Простейший тип вторичных эмоций — это эмоции, возникающие в результате ассоциации данного (реального или воображаемого) события с бывшими ранее аналогичными событиями, сопровождав¬ шимися возникновением эмоций. Эмоции этого типа пропорциональны мере неожиданности (контрасту) данного события в данной ситуации и среднему значению ассоциированных эмоций с весами, равными важ¬ ностям соответствующих им событий на данный момент времени. Тако¬ го рода эмоции возникают, когда мы слышим в свой адрес хвалебные или ругательные слова. Изначально (пока мы не знаем языка) эти слова, как и все прочие, не вызывают в нас никаких эмоций. Лишь благодаря тому, что произнесение этих слов когда-то сопровожда¬ лось приятными или неприятными для нас событиями, теперь эти слова сами вызывают соответствующие эмоции. При этом если мы с уверенностью ждем похвалы, а нас ругают, ответные отрицатель¬ ные эмоции обычно бывают значительно больше (возникает допол¬ нительное чувство обиды), чем в случае, когда мы не уверены в по¬ хвале. Другим важным типом вторичных эмоций являются эмоции, воз¬ никающие в ответ на событие, способствующее или препятствующее достижению целей, стоящих в данный момент перед системой. Эмо¬ ции такого типа определяются тем, насколько с приходом этого события упрощается или усложняется достижение этих целей, каковы в данный момент их важности и какие эмоции ожидается получить в результате их достижения. Тем самым данный тип реализует в себе некоторый интеграл эмоций, ожидаемых в будущем. Эмоции этого типа возникают, в частности, когда мы приобретаем или теряем какую-либо вещь, решаем задачу, находим закон и пр. 15. Зак. 1668 225
В общем случае испытываемая в текущей ситуации S, вторичная эмоция 3(f) представляется суммой компонент Э;', каждая из которых соответствует некоторой определяемой прошлым опытом и фиксиро¬ ванной в памяти целевой ситуацией 5, (возможно, обобщенной) и может быть представлена в виде Э' = Э ,д •(т + па) — да где а\ — величина ассоциации ситуаций 5,- и St; а\ и д'0, — соответственно реальное и ожидавшееся изменения величины ассоциации в результате выполнения текущего события; Э, — соответствующая S, величина эмоции; т, п и р — некоторые положительные константы. Таким образом, возникновение вторичных эмоций связано с опера¬ циями предсказания и интегрирования по памяти. Их вычисление — процесс бессознательный. 2. Условнорефлекториое (бессознательное) поведение включает в себя все действия, которые мы делаем автоматически, не задумываясь, но которое тем не менее использует приобретенный ранее опыт. Простейшим примером является случай, когда похожесть (наличие большой величины ассоциации) текущей ситуации S, на некоторую прошлую ситуацию 5, (возможно, обобщенную), в которой дейст¬ вие А приводило к возникновению положительных или избавлению от отрицательных эмоций, приводит к тому, что в ситуации S, также вы¬ полняется действие А. В общем случае условнорефлекторное поведение основывается на понятии побуждения. Пусть {£} — совокупность сформированных в памяти понятий, в терминах которых производится описание ситуаций. Будем считать, что в качестве £ могут фигурировать свойства ситуаций либо описания конкретных или обобщенных действий. Побуждением, отнесенным к данному Е, будем называть неосознан¬ ное стремление в текущей ситуации достичь или предотвратить достижение Е, а в случае, если р достигнуто, сохранить его или от него избавиться. Будем считать, что величина побуждения Р(Е) при стремлении достичь или сохранить Е принимает положительные зна¬ чения, а при стремлении избежать или избавиться — отрицательные и определяется тем; 1) какой вклад в эмоции ожидается получить при достижении или предотвращении £ и 2) какова сложность при¬ водящей к этому последовательности действий. \ Заметим, что формирование эмоций и побуждений, по существу, является функцией единого рекурсивного механизма, который пре¬ образует ситуации получения эмоций в цели будущего поведения, а при приближении к поставленной цели (или удалении от нее) обеспе¬ чивает возникновение эмоций. Вычисление величин побуждения Р(Е) для каждого Ее{Е} проис¬ ходит постоянно в процессе ассоциаций текущей ситуации S, с прош¬ лыми ситуациями 5, и их обобщениями. При этом предполагается, что различные вхождения в описания ситуаций одного и того же понятия Е связаны между собой каналами, проложенными в ком¬ мутационной среде, которые возникали при осознания фактов наличия 226
Е в этих ситуациях. Теперь эти каналы позволяют быстро сопоставлять соответствующую этим вхождениям информацию. При вычислении Р(Е) величины эмоций, полученных в каждой из ситуаций Sj, как бы распределяются в виде величин v(E) между их возможными причинами, т.е. теми Е, которые предшествовали возникновению эмоций в 5„ но не присутствуют в S,. Чем больше отличие S, от тем меньшее значение v(E) придется на каждое из таких Е. Если таким Е оказывается действие, то соответст¬ вующая ему величина побуждения Р(Е) может быть представлена в видецТ//(1 + 4(E)), где q(E) — сложность выполнения этого действия, определяемая, например, затратами энергии или времени. Если в качестве Е выступает свойство ситуации, то соответствующая ему величина о(Е), в свою очередь, распределяется между его причинами и т.д., пока причинами не окажутся действия. Наоборот, от действий величйны q(E) передаются следствиям, этих действий, следствиям следствий и т.д., сложность которых оценивается минимумом суммы пришедших на них величин q(E). Таким образом, вычисление ве¬ личин побуждения реализуется двумя встречными процессами расплы¬ вания значений v(E) и q(E), текущих соответственно от следствий к посылкам и от посылок к следствиям и использующих для этого, так же как процесс ассоциации, связи как между соседними элемен¬ тами памяти, так и в коммутационной среде. В общем случае условнорефлекторное поведение представляет собой автоматическое выполнение действий, имеющих достаточно высокую величину побуждения, вычисление которой происходило при ассоциации содержимого памяти лишь с информацией, получа¬ емой от сенсорного входа. Процесс организации такого поведения соответствует одному шагу ассоциации, когда, получая информацию непосредственно от сенсорного анализатора (см. рис. 1), не затра¬ гивая поля внимания, память посылает команды эффекторам. Подав¬ ляющее большинство задач, возникающих в обыденной жизни, ре¬ шается человеком именно на этом уровне. К ним относятся: орга¬ низация привычных движений (ходьба, катание на лыжах, вождение автомобиля, вязание, пение, чтение стихов наизусть, большая часть организации речи и пр.). Цель обучения в значительной мере в том и состоит, чтобы перевести решение задач с медленного многошаго¬ вого сознательного уровня на условнорефлекторный, быстрый уро¬ вень, когда задачи решаются за один шаг работы памяти. 3. Сознательное поведение. Подобно тому как в обычной вычис¬ лительной машине не любая функция может быть реализована без использования дополнительных (рабочих) полей памяти, в нашей системе не любая поведенческая задача может быть решена на условно- рефлекторном уровне. Существуют сложные задачи, решение которых требует многократного (циклического) обращения к памяти через поле внимания, что соответствует сознательному уровню органи¬ зации поведения. Это происходит, например, в случаях, когда за¬ дачу приходится разбивать на подзадачи. Примером тому может служить сложение чисел, когда каждый следующий разряд суммы последовательно проходит через сознание, требуя для своего вы¬ 227
числения новой ассоциации с таблицей сложения. На сознательном уровне решаются задачи, для которых в памяти не хранятся гото¬ вые пути решения, и их приходится искать. Узловые моменты этого поиска, проходя через сознание и вызывая дальнейшие ассоциации, запоминаются, во-первых, для того, чтобы не приходилось повто¬ рять уже сделанных ходов, а во-вторых, чтобы найденным решением можно было потом воспользоваться на условнорефлекторном уровне. В основе сознательного поведения лежит процесс возникновения желаний. Желание — это осознанное побуждение, т.е. фиксируемое в па¬ мяти, так что его можно потом, вспомнить, стремление сохранить или избавиться, достичь или избежать какого либо свойства текущей ситуации. Оно определяет некую долговременную (конечную или промежуточную) цель поведения. В отличие от побуждений, величина которых постоянно зависит от текущей ситуации и с ее изменением может резко измениться, величина желания, будучи занесена в память в виде данных основного типа, служит постоянным стимулом в по¬ ведении, т.е. влияет на процесс формирования побуждений до тех пор, пока в результате осознания некоторого побуждения, напри¬ мер, не появится новое желание, противоречащее данному. При вычислении значений v(E) соответствующее желанию свойство ситуации может быть интерпретировано для его причин как постоянный источ¬ ник эмоций, а при вычислении сложностей q(E) для следствий этого свойства — как свойство, постоянно выполненное в текущей ситуа¬ ции. В результате побуждения оказываются как бы автоматически направленными на реализацию желаний. Волевое поведение. Частным случаем сознательного поведения явля¬ ется волевое поведение, которое отличается от других видов созна¬ тельного поведения лишь тем, что непосредственно процесс выполне¬ ния действий вызывает отрицательные эмоции (ощущения боли, усталости и пр.), и лишь через некоторое время вследствие их вы¬ полнения можно ожидать получение больших положительных или избавление от больших отрицательных эмоций, так что интеграль¬ ная оценка настоящих и ожидаемых эмоций будет положительной, из-за чего, собственно, и выполняется это действие. Таким образом, ощущение волевых действий соответствует тем случаям, когда получе¬ ние положительных эмоций в будущем вступает в противоречие с по¬ лучением отрицательных эмоций в настоящем. Чтобы иметь возмож¬ ность при обобщениях дифференцировать случаи получения положи¬ тельных и отрицательных эмоций и при формировании дальнейшего поведения избегать таких противоречивых ситуаций, волевым действиям и их контексту, как правило, приписывается большая важность, благодаря чему они попадают в поле внимания и запо¬ минаются — осознаются. Казалось бы, механизм эмоций мог быть устроен так, чтобы вы¬ полнение оптимальных с точки зрения организма действий никогда не вызывало отрицательных эмоций. Это, однако, означало бы, что в случаях выполнения волевых действий опасным или вредным для организма состояниям будет приписываться положительная оценка, 228
в результате чего потом будет возникать побуждение (или желание) попадать в эти состояния вместо того, чтобы стремиться их из¬ бегать. Волевые действия, так же как все сознательные и условнореф¬ лекторные действия, формируются автоматически и являются ре¬ зультатом ассоциации описания текущей ситуации с содержимым памяти. ЛИТЕРАТУРА 1. Вайнцвайг М.Н. Система искусственного интеллекта с ассоциативной памятью /7 Вычислительные машины и искусственный интеллект. Братислава: Изд-во Словац¬ кой АН , 1982. N 2. С. 171 — 186. 2. Вайнцвайг М.Н.. Полякова М. П. Об одном подходе к проблеме создания искусствен¬ ного интеллекта // Моделирование обучения и поведения. М.: Наука, 1975. С. 209—234. 3. Файгенберг И.М. Мозг, психика, здоровье. М.: Наука, 1975. 182 с. 4. Ли. С., Паул М.С. Запоминающее устройство с распределенной логикой, дающее возможность выборки по содержанию, и его применение к извлечению информации // ТИИЭР. 1963. N 6. С. 931—940. 5. Вайнцвайг М.Н., Диментман А. М. Ассоциативное запоминающее устройство с расширенными функциональными возможностями // Вопросы кибернетики. М.: Сов. радио, 1979. Вып. 49. С. 120—126. 6. Богоцкая H-В.. Вайнцвайг М.Н., Диментман А.М., Лосев И.С. Ассоциативные алгоритмы обобщения // Изв. АН СССР. Техн. кибернетика. 1985. N 1. С. 20—28. УДК 577.3:51:62-50:57 НЕЛИНЕЙНЫЕ СИСТЕМЫ С ПАМЯТЬЮ И МОДЕЛИРОВАНИЕ ФУНКЦИЙ НЕЙРОННЫХ АНСАМБЛЕЙ А.А. Веденов, А.А. Ежов, Л.А. Книжникова, Е.Б. Левченко, Ю.Г. Чернов ВВЕДЕНИЕ Обработка информации, поступающей в мозг, осуществляется на нескольких уровнях. Элементарные процессы обработки происходят в мембранных структурах специализированных клеток — нейронов, взаимодействующих между собой и с другими клетками мозга посред¬ ством синаптических, а также других, например электрических, связей [1]. Более сложные процессы, в том числе отвечающие за выполнение таких функций мозга, как обучение, распознавание образов и др., являются результатом коллективного действия тех или иных групп ансамблей нейронов [1, 2]. Функции, выполняемые таким ансамблем (содержащим 102—104 кле¬ ток) определяются как типом участвующих нейронов, так и харак¬ тером связей между ними. ’’Средний нейрон” образует 102—104связей с другими клетками мозга, от которых получает и (или) которым передает информацию, закодированную значением частоты следования нервных импульсов. Синаптические связи могут модифицироваться в процессе обработки поступающих в мозг сигналов. Этот процесс, 229
как считается, может обеспечивать запоминание части информации, поступающей в мозг. Таким образом, ’’долговременная память” нейронной сети оказывается рассредоточенной по большому числу межнейронных связей; извлечение информации, содержащейся в ней, возможно лишь в процессах ассоциативного типа, т.е. путем предъ¬ явления стимула, который ансамбль нейронов должен распознать и сформировать в соответствии с ним определенную ответную реак¬ цию. Кроме того, процесс обработки информации мозгом носит, вероятнее всего, параллельный характер [3, 4]. Известным примером физической ситуации, в которой реализуется процесс параллельной обработки распределенной информации, явля¬ ется голография [5], по аналогии с которой был предложен ряд моделей распределенной памяти — ’’моделей голографической памяти” [6]. При имитации поведения ансамбля нейронов в таких моделях обычно используют переменные, описывающие состояние нейронов (’’вектор состояния” о), переменные, описывающие связи между нейро¬ нами (’’оператор памяти” V), и постулируются два уравнения, описы¬ вающие изменение о и V со временем. Одно из этих уравнений опи¬ сывает изменение о под действием оператора V (выработка реакции на стимул), а второе — изменение матрицы ^ квадратичное по о (за¬ поминание). Отметим, что системы уравнений, имеющие аналогичную структуру, кроме голографии, описывают также целый ряд других физических ситуаций, например явление модуляционной неустойчивости (коллапса)турбулентной плазмы [7], некоторые явления в нелинейной оптике и др. В последнее время в ряде работ [8—14] было предложено модели¬ ровать нейронные ансамбли с помощью динамических уравнений под¬ ходящей нелинейной системы. При этом вектор состояния ансамбля нейронов представляет собой вектор в фазовом пространстве ди¬ намической системы, а ’’память” реализована как система аттракто¬ ров. Запоминание новой информации осуществляется путем усложне¬ ния по определенному алгоритму структуры аттракторов. Такой под¬ ход допускает простую механическую аналогию, если представлять себе вектор состояния как положение частицы, движущейся под дейст¬ вием сил тяжести и трения по некоторому рельефу (см. ниже). В работе Андерсона и др. [8] рассматривался процесс перехода (релаксации) начального значения о к одному из углов А-мерного куба (N — число нейронов в ансамбле), а Дж. Хопфилдом [9] в задаче о такой релаксации с заданной матрицей V было введено понятие энергии, т.е. функции состояния ансамбля, которая уменьшалась в процессе релаксации. Описываемые таким образом нейронные ансамбли имеют ряд ин¬ тересных свойств, которые могут быть интерпретированы как обуче¬ ние, распознавание образов, выработка прототипа, забывание, бис¬ табильность восприятия, феномен обращения и др. 230
МОДЕЛЬ НЕЙРОННОЙ СЕТИ Рассмотрим динамическую систему, элементы которой — ’’нейро¬ ны” — взаимодействуют между собой и с ’’термостатом”. Состояние г-го нейрона в системе (/=1, N) описывается непрерывной перемен¬ ной Oj(t) (t — время), взаимодействие нейронов, которое для прос¬ тоты предполагается парным, — матрицей с элементами Vtj. Будем рас¬ сматривать величину (Х>0 — параметр) как лагранжиан взаимодействия системы, явля¬ ющийся функционалом независимых переменных о и V. Учитывая взаимодействие нейронов с термостатом, приводящее к появлению ’’сил трения” (o/yi, V/y2), из (1) получим динамические уравнения для V и о: Добавленные в эти уравнения нелинейные слагаемые (f, F) препятст¬ вуют неограниченному возрастанию абсолютных значений величин о и V; в рамках лагранжевой схемы они могут быть включены в (1) в виде потенциалов, быстро возрастающих вблизи | о,| =оо, | Vt]\ = V0. Величины t), i) в (2), (3) представляют собой ланжевеновские источники шума. В нервных сетях источниками шума являются дробовой шум, возникающий вследствие дискретного характера выделения нейро¬ медиатора в синаптических окончаниях, а также несинаптические взаимодействия нейронов между собой [13—16]. В простейшем случае шум можно охарактеризовать введением эффективной температуры термостата Т; при этом имеем где угловые скобки обозначают усреднение по времени. Рассмотрим механическую аналогию процессов, описываемых урав¬ нениями (2), (3). В механике движение частицы под действием заданных сил можно описывать уравнениями Ньютона. Пусть материальная точка движется по рельефу, изображенному на рис. 1, и будем считать, что на нее действуют силы трения и сила тяжести. При скатывании с ’’горы” в одну из ’’низин” потенциальная энергия системы умень¬ шается, и в конце концов материальная точка останавливается из-за трения. Положение частицы в конечном состоянии (т.е. та из низин, в которой она останавливается) зависит как от формы рельефа, так и от начального состояния, из которого началось скатывание. Если координаты вершин квадрата, образованного вершинами и низи¬ нами, равны (±1, ±1), то конечное состояние механической системы, изображенной на рис. 1, будет соответствовать одной определенной паре чисел, например +1, +1. Уравнения Ньютона для рассматри¬ ваемой механической системы либо уравнения (2), (3), описывающие L = -E=\\ % Vtja,aj ij (1) (2) (3) <p> = <l> = 0, <C2> - <k2> - T. 231
-/+/ +/+/ Рис. 1. Механическая модель рассматриваемого ансамбля нейронов: материальная частица на¬ чинает движение под действием силы тяжести по одному из склонов изображенного рельефа и останавливается вследствие трения в одной из ’’низин”, при этом потенциальная энергия частицы достигает минимального значения динамику двух взаимодействующих нейронов, можно в принципе решить сколь угодно точно (например, с помощью ЭВМ). Однако, для ансамбля, состоящего из нескольких десятков или сотен нейро¬ нов, или в случае многомерного движения материальной точки эта задача становится практически неразрешимой. Поэтому, опуская про¬ межуточные детали процесса движения (релаксации) рассмотрим лишь грубые изменения энергии, происходящие при изменении оконча¬ тельного положения частицы. Эти точки можно себе представлять как вершины Л^-мерного куба с координатами ±1. ±1, ..., ±1. Роль потенциальной энергии точки в этом случае играет величина Е= -L, введенная в (1), роль скатывающей силы — величина, стоящая в пра¬ вой части (2) (скатывающая сила называется также ’’молекулярным полем”). Если масса материальной точки достаточно мала, то частица будет совершать так называемое броуновское движение, которое тем более интенсивно, чем выше температура системы. Физической причиной этого движения являются случайные толчки, непрерывно испытываемые материальной точкой со стороны других частиц сис¬ темы. Среднее значение знакопеременной силы толчков равно нулю, а ее средний квадрат пропорционален температуре. В уравнениях (2), (3) эти толчки описываются слагаем^ции £Д) и \j/t). Материальная точка, скатываясь по рельефу, несколько изменяет пpoфVль склонов, например углубляет. Этот процесс является ме¬ ханической моделью пластичности связей между нейронами, описы¬ ваемой уравнением (3). Динамика системы (2), (3) существенно зависит от ее предысто¬ рии. Исследуем сначала эволюцию о и И в специальных условиях — в процессе, имеющем характер ’’обучения”. Обучение заключается в том, что в (2) включается сильное внешнее поле, действующее в течение времени /i, в результате чего вектор о принимает ста¬ ционарное значение ф‘, соответствующее ’’образу” с компонентами ±оо. В результате обучения матрица Vy в соответствии с (3) (считаем, что слагаемым в процессе обучения можно пренебречь) изменя¬ ется на величину AF,-,—уг^ср'ф/. При этом мы предполагаем, что время обучения ti значительно больше времени релаксации во внешнем поле вектора о к своему стационарному значению <р‘. Процедуру
обучения можно повторить многократно, используя образы ф’- -г — л, з0. Считая для простоты, что до начала обучения V = 0, после окон¬ чания процедуры получим Уу= (4) 5- I где коэффициенты ц* зависят от длительности обучения. Из (2)—(4) следует, что в отсутствие внешнего поля характерные времена релаксации переменных о (tos»(yiX.Nj0)"1) и V (угХ.л'о)-1) существенно различаются: т0*^ту. Динамику системы на временах порядка т„ можно интерпретировать как ’’распознавание образов”. Рассмотрим этот процесс более подробно. РАСПОЗНАВАНИЕ ОБРАЗОВ. КАТЕГОРИЗАЦИЯ Процесс распознавания состоит в том, что’ ’’исходный стимул” — вектор, выбранный в качестве начального условия, релаксирует в соответствии с (2) к одному из устойчивых состояний системы (2). В частности, такими векторами могут быть ’’образы” ф5. Эволюция системы (2), (3) может быть исследована методом диск¬ ретного стохастического моделирования: либо с помощью процедуры Метрополиса и др. [17—19] (модель системы в термостате), либо с помощью алгоритма, предложенного Дж. Хопфилдом [9]. При этом вместо непрерывных переменных о, вводятся дискретные, принимающие значения а/0 = ±1, а динамика системы задается с помощью вероят¬ ности изменения состояния нейрона на каждом шаге по времени: либо в соответствии со знаком молекулярного поля Vo [9], либо в со¬ ответствии с изменением энергии системы (1), вызванным этим ’’пере¬ воротом”, при заданной температуре термостата Т. Возможность замены непрерывных уравнений (2), (3) дискретными связана с тем, что особая точка о, = 0 уравнения (2) в случае, когда V имеет вид (4), является отталкивающей. Покажем это, считая для простоты, что все ф1, j= 1,..., Jo ортогональны друг другу. Линеаризуя (2) при lo/l^oo и полагая о^ехрГ?, из (2) получим уравнение на собст¬ венные значения ((ф*, о)=% $о,): i Го = у,Х% (ф1, о)фУ- S Этому уравнению удовлетворяют, в частности, векторы <т! = ф1 ((ф1, ф0 = §и') и собственные значения (инкременты) Г1 = yiXpWX). Поэтому изображающая точка системы (2), (3) будет удаляться от начала координат в конфигурационном пространстве (о, = 0, /= 1, ..., N) и перейдет в область, где существенно нелинейное слагаемое в (2), т.е. | сг,| == сто- Конечное состояние эволюции переменной определяется, по существу, видом силы взаимодействия, испытываемой i-м нейроном со стороны остальных, — молекулярным полем (Vo)/, где о, = ±оо (да¬ лее положим Со — 1). 'Дж. Хопфилд [9] предложил-следующий рекуррентный алгоритм анализа динамики ансамбля нейронов. Вводя дискретное время и за- 4
меняя производную (2) конечной разностью, вместо (2) полагаем | = ( о,(к), /#/ь о(к + \)= I (5) \ sign[ ZVjjo/k) — 0,], i = ik, i*j где ik^N — номер нейрона, выбираемый случайным образом на каж¬ дом шаге по Времени, о(к) — состояние /-го нейрона в момент времени tk. В (5) введен также ’’порог возбуждения” /-го нейрона 0„ учитывающий различия в условиях возбуждения различных нейронов. Вместо пере¬ менных о, = ±1 можно ввести также другие переменные 5, = (1 +о,)/2, принимающие значения 0 или 1. Из (5) получаем о/к +\)= \ , (5*) I 2sign[ %VjjOj —б,] — 1, / = ih X ж- '*j где 0, = 0,— zV/j — некоторые новые пороги возбуждения. Уравнение (5) и (5*) были предложены в [9] для описания дина¬ мики изменения состояния ансамбля нейронов во времени. Можно, однако, представить (неупорядоченную) нейронную сеть, для которой эти уравнения описывают распространение волн возбуждения нейро¬ нов во времени и в пространстве. Действительно, рассмотрим прямо¬ угольную решетку, в узлах которой расположены нейроны; столбцы решетки занумерованы индексом к=\, ..., К, а строки — индексом /= 1, ..., N. В каждом столбце имеется ’’активный” нейрон, который суммирует с весами V,j сигналы, поступающие от предыдущего столб¬ ца, и может изменять свое состояние в соответствии со знаком мо¬ лекулярного поля. Состояния же остальных нейронов данного столбца совпадают с состояниями на предыдущем шаге по времени нейронов предыдущего столбца, находящихся в тех же строках. Возбуждение волн в такой сети происходит путем предъявления стимула на ’’входе”, например в первых столбцах, а устойчивые состояния уравнений Хопфилда представляют собой уединенные волны, распространяющиеся в сторону увеличения индекса к — к ’’выходу” из сети. Пример последовательности состояний, которые проходит система нейронов при распознавании образов в модели Хопфилда, приведен на рис. 2 (показаны некоторые промежуточные состояния), на ко¬ тором "евая картинка представляет собой ’’исходный стимул”, а крайняя правая — ’’образ”, записанный в памяти системы. При такой релаксации энергия системы (1) уменьшается, достигая с течением времени одного из локальных минимумов. Покажем, что в дискретной модели, считая, что матрица связей нейронов дается выражением (4), состояние с о = ф* реализует локальный минимум энергии и устой¬ чиво, если число образов so невелико. Положим oJ = (p* + 5J и рас¬ смотрим вариацию энергии (1) (цг= 1, 0, =0): ^BE=-N((p\ 5") — Х(ФГ- <pW, 50 — \ Нф', 502. (6) r^S г 3 случае, когда различные ф* приближенно ортогональны друг другу, зторое слагаемое в (6) мало по сравнению с первым, и для вариации .. соответствующей изменению одного из символов ±1 в образе
а S в г Рис. 2. Последовательность состояний системы нейронов, возникающая в процессе релаксации исходного стимула (картинка а) в образ (картинка д), полученная пр’и моделиро¬ вании на ЭВМ уравнения (5) . О а 0 # г Рис. 3. Устойчивый ложный образ (г), возникающий при распознавании стимулов ансамблем нейронов, в матрице связей которого записаны образы а—в Ф* на противоположный, первое слагаемое равно 2N, а третье -2so. Таким образом, 5£>0 — образ устойчив — при s0<N. Эта оценка ка¬ чественно согласуется с результатами анализа ошибок распознавания с помощью матрицы (4), проведенного в [9, 20]. В процессе релаксации каждому начальному состоянию системы (’’стимулу”) сопоставляется один из векторов, являющийся устойчи¬ вым состоянием динамической системы (2), (3), т.е. осуществляется операция категоризации. Аналогичный процесс является важным эле¬ ментом деятельности нервной системы, например зрительного тракта млекопитающих [1]. Устойчивыми состояниями уравнений Хопфилда могут являться также векторы, не совпадающие с ip1 — ’’ложные образы” [20, 21]. Определенный класс таких векторов указан в [21] и может быть пос¬ троен следующим образом. Пусть so — З, положим 9?=sign ps= (ф*, Ф”). S Тогда, как легко убедиться, знак г-й компоненты молекулярного поля (Va)i совпадает со знаком ф), если ps>0 и выполнены неравенства 235
треугольника (достаточное условие): р‘<р2+р3, р2<р3+р‘,р3<р2+р1. Следовательно, ф* является устойчивой точкой алгоритма (5), не сов¬ падающей с ф\ В случае 5о = 3, как можно показать, рассмотренный класс векторов, в построении которых наряду с образами использу¬ ются также и ’’негативы”, исчерпывает все ложные образы. При большем числе образов в памяти системы число ложных образов, вообще говоря, увеличивается. Например, для любого нечетного s0 вектор ф*, определенный выше, является устойчивым ложным обра¬ зом (5), если сумма величин любых р\ содержащая к=1 +[s0/2] сла¬ гаемое, не меньше суммы остальных значений рЛ: р5‘ + р52 + ... + р5* Зг р5‘ +1 + ... +рЧ (7) где 5i, ..., sk — различные, произвольно выбранные числа (^5о). От¬ метим, что при s0<g,N появление ложных образов рассматриваемого вида может быть не связано с потерей устойчивости ф5. На рис. 3 приведен пример, показывающий возникновение ложного образа в системе из N=100 нейронов, 5о = 3. Изображенный на рис. 3, г вектор удовлетворяет условию (7). РАСПОЗНАВАНИЕ ОБРАЗОВ ПРИ КОНЕЧНОЙ ТЕМПЕРАТУРЕ ТЕРМОСТАТА Процесс синаптической передачи нервного возбуждения между двумя нейронами является стохастическим процессом пуассоновского типа [1, 15], поскольку в силу дискретного характера выделе¬ ния медиатора из синаптических пузырьков ионные токи в постсинапти- ческой мембране и падение напряжения на ней испытывают флюктуации типа дробового шума. Поэтому можно предположить, что нейроны с некоторой вероятностью могут изменять свое состояние против направления молекулярного поля — усредненной характеристики взаи¬ модействия нейронов в сети. В динамических уравнениях (2), (3) флюк¬ туации потенциала учитываются ланже'веновскими случайными силами При моделировании процесса распознавания на ЭВМ конеч¬ ную температуру термостата можно учесть методом, аналогичным [17]. В последнее время этот метод был применен для оптимизации функционалов липа энергии (1), возникающих в задаче конструи¬ рования электронных схем [18, 19]. Флюктуационная динамика системы нейронов в методе Метрополиса и др. [17] описывается следующим алгоритмом: о A), i^ib о/к+ \) = а /к), i = ik, Рк > Qk, (8) -а,(к), i = ik, Pk^Qk, где Ok = zxp(-b.Ek/T), &Ек = £[..., -aik, ...] — £[..., ajk, ...] — изменение энергии при ’’перевороте спина” с номером ik; ik и Рк — случайные числа: 1 ^ik^N, 0<;Рк^1. При эволюции системы от выбранного начального состояния соглас¬ но (8) энергия системы (1) в среднем за большое число шагов по времени уменьшается до тех пор, пока не будет достигнуто равновесное сос¬ 236
тояние, аналогичное термодинамическому (так с большей вероят¬ ностью происходят изменения состояния нейронов, при которых Д£<0). Однако на каждом отдельном шаге в отличие от алгорит¬ ма Хопфилда энергия системы может и возрастать. Моделирование эволюционного процесса (8), проведенное на пер¬ сональной ЭВМ типа ”Apple-II”, показало, что при Т= 0 результаты распознавания образов согласно (8) и (5) совпадают. В частности, в случае трех образов, изображенных на рис. 3,а—в, записанных в памяти системы, устойчивым является ложный образ, изображенный на рис. 3, г. При конечной температуре термостата процесс распоз¬ навания образов по алгоритму (8) имеет две стадии. На первой из них происходит сравнительно быстрая релаксация стимула к состоянию, близкому к одному из образов. При больших температурах скорость этой стадии близка к скорости алгоритма Хопфилда (фактическое время расчетов на ЭВМ может быть в несколько раз меньше, чем по алгоритму (5)). Вторая стадия состоит в относительно медленном процессе ’’диффузии” системы от одного образа к другому. Скорость этого процесса определяется температурой термостата, а также су¬ щественно зависит от конкретной структуры памяти. В качестве примера на рис. 4 приведена последовательность состояний, которые проходит ансамбль нейронов в процессе диффузии по образам. В ка¬ честве образов в этом примере взяты те же векторы, что и на рис. 3. При Т— 0 ’’стимул” (рис. 4, а) релаксирует к ложному образу (рис. 4, б). При нагреве до различных температур это устойчивое состояние может переходить в разные образы (рис. 4, в—з). Таким образом, конечное состояние, в которое релаксирует стимул, зависит от ’’теп¬ ловой истории” системы. Эта ситуация аналогична явлению ’’закалки” сплавов (когда вследствие быстрого охлаждения сплавы сохраняют термодинамически невыгодную, однако устойчивую структуру) и в оп¬ ределенном смысле противоположна случаю ’’отжига” (процесса дости¬ жения полного термодинамического равновесия), рассмотренного применительно к задаче минимизации функционала типа энергии в [18, 19]. Как видно из рис. 4, в—д, повышение температуры проходит к раз¬ мытию устойчивых образов системы. При нагреве до температуры Т система (в том числе и механическая) может с вероятностью w = Te~E/T находиться в состоянии с энергией Е (для материальной точки в поле тяжести приведенная формула совпадает с барометрической формулой Больцмана для газов). Величина Г = N\/(m\(N—/и)!) — число способов, которыми в ансамбле из N нейронов могут осуществляться состояния с отличием от ф1 в m позициях. Наибольшая вероятность реализуется для состояний, в которых величина F—E—ЛпГ,называемая свобод¬ ной энергией, достигает минимума. Чтобы оценить степень размытия при заданной температуре, рассмотрим случай 5о=1. Свободная энергия системы для заданного вектора о определяется выражением (Х = 1) F=-l-(N—2m)2 — TS(m), (9) где m — хеммингово расстояние между о и ф1 (число символов +1 или 237
Рис. 4. Пример последовательности изменения состояния нейронной сети при изменении температуры термостата а — исходный стимул, б —ложный образ, е, ж, з — образы, записанные в памяти -1, отличающих эти векторы), S(m) — энтропия состояния: N1 Г/ т \ N S(m) = In- >N [(■--г-) In т N — -Ь —In - т N т ] ■ (Ю) m\(N—т)\ *~\ N I N- Минимизируя (9)с у-етом (10) по т, при m<iN получим оценку т = Nexp(-2N/T), справедливую при T<4N. При 5о ~ 1 энергия системы (1) достигает минимума при совпа¬ дении о с образом, т.е. при о = ф‘, либо с его негативом при о =-ф‘. При конечных температурах возможен флюктуационный переход между состояниями, близкими к образу и его негативу. Если T<^N, то такой переход требует преодоления энергетического барьера AF~F(m=N/2) — F(m = 0) =-NTlnl + ^N2. (11) Вероятность такого перехода можно оценить из выражения, аналогично¬ го выражению для вероятности образования зародыша при фазовом переходе: w ** Nexp(-A.F/T) = 1У2^ехр(-^2/7") • (12) Из (12) видно, что при низких температурах вероятность перехода ока- 238
зывается малой, однако с повышением Т величина барьера умень¬ шается и при Тк = /^обращается в нуль. При Т^Тк происходит свободная ’’диффузия” ансамбля нейронов между различными состоя¬ ниями. С увеличением числа образов so ситуация существенно усложняется. Рассмотрим случай so = 2. Пусть векторы образов ср1 и ср2 имеют Ni со¬ впадающих компонент, N2 несовпадающих, N1 +Ni = N. Энергия произ¬ вольного состояния системы нейронов о дается выражением £ = -^[(М —2т\ + N2 — 2тг)2 + {Ni — 2mi — N2 + 2тг)2 = = _[(#!— 2mi)l + (Ni — 2тг?Ъ (13) где т\ — число отличий о и ср1 в первой группе компонент, а т2 — во второй. Энтропия такого состояния равна Ni Ni , S(m\, т2) =(Ni—/л 1)In т\\п — Ni—т i mi N2 N7 + (N2 — m2) In \-m2\n— • (14) N7 — m2 тг Из уЗ), (14) получаем выражение для свободной энергии системы в виде суммы двух независимых слагаемых: F=F(mh Ni) + F(m2, N2), F(m„ N,) = - Г( N, — 2/л,)2 + t((N, — /и,)1п „ + /лДп—\ 1. (15) L V Ni—mj m, / J Эти выражения определяют две характерные температуры: Тк, = Ni/\n2 = Тк{\+р\Тк2 = N2/\n2 = Ш1 —Р), где p=(N 1—N2)/N. Если Ni и N2 не близки друг к другу (например, N2>Nt), то при повышении температуры характер динамики системы может испытывать два резких превращения. При Т<Тк1< Тк2 ансамбль нейронов находится в состоянии, близком к одному из векторов ф1, ф2 или их негативам (и релаксирует к одному из этих состояний в про¬ цессе распознавания образов). При N^>Tk\ возникают случайные блуж¬ дания между ф1 и ф2, при этом группа из N2 компонент о близка к совпадающим компонентам векторов ф1 и ф2. Наконец, при Т> Тк2 начи¬ наются блуждания между образами и их негативами. Фазовая диа¬ грамма системы в переменных Т, р приведена на рис. 5. Низкотем¬ пературная область отвечает упорядоченному, ’’кристаллическому” состоянию, высокотемпературная — ’’жидкому”, а промежуточные области можно назвать ’’жидкокристаллическими”, поскольку для промежуточных областей имеет место ситуация, характерная для жидкокристаллического состояния, когда одна часть степеней сво¬ боды системы является заторможенной, а другая часть находится в ’’расплавленном” состоянии. На рис. *6 приведен пример пары образов, для которых при моделировании на ЭВМ в определенном 239
I Рис. 5. Фазовая диаграмма системы нейронов, в памяти которой записаны два образа, р = (ф', (p2)/jV 1—3 — области, в которых система находится в состоянии, близком к±ф' или±ф (О- система "блуж¬ дает” между образами <р’ и ф2 (2). система сводобно "блуждает” всюду (J) Рис. 6. Пример пары образов, между которыми при моделировании на ЭВМ в определен¬ ном интервале температур наблюдалось ’’блуждание” интервале температур наблюдалось ’’промежуточное” состояние — слу¬ чайные перескоки элемента М в Nh обратно. При низких температурах перескоки заторможены, а при повышении температуры диффузия по различным состояниям системы происходит свободно. ВЫРАБОТКА ПРОТОТИПА При увеличении числа образов, записываемых в память системы, минимумы энергии (1), отвечающие различным ф* могут сливаться. Рассмотрим группу образов фУ^ = 1, •••, s0), получающихся при неболь¬ ших случайных искажениях 5* некоторого вектора сро (при этом группа не содержит самого исходного вектора): ф^фо + б*. Покажем, что вариация на величину 8 вектора фо приводит к изменению энергии, соответствующей этому вектору, на величину ЬЕ = - \ 2(Ф<> + Фо + 5)2 + ^ 2(фо + 8, ф0)2 = lS V = ;2[2(ЛГ + (ф0, в'Жфо, 5) + 2(N + (ф0, 5*))(S*, 5) + S + Ы S)2 +(8J, 5)2 + 2(фо, 5) (5*, 8)]. (16) При 2т = -(фо, 8S)<N, 1 и случайном искажении исходного вектора Фо при построении группы образов может выполняться неравенство ЬЕ^О, и, следовательно, исходный вектор отвечает минимуму энер¬ гии системы. В психологии образ, аналогичный фо (т.е. являющийся в определенном смысле усреднением некоторого числа образов и остающийся в памяти человека наряду с действительно предъявля¬ емыми образами), получил название ’’прототипа” [3]. Пример образо¬ вания прототипа при предъявлении группы образов приведен на рис. 7. Вероятность появления прототипа при записи данной группы образов в матрицу V можно охарактеризовать относительной частотой по¬ явления вектора, отвечающего прототипу, в качестве устойчивой 240
4 Ж Ж ж Я!4 4 4* 4 Ж а Ж / в Рис. 7. Примеры возникновения прототипа в системе нейронов а — исходные девять образов, 6— прототип при расположении нейронов в узлах квадратной решетки, причем взаимодействуют лишь нейроны, находящиеся в соседних узлах, в — все нейроны ансамбля взаимодействуют между собой 16. За к. 1668 241
Рис. 8. Гистограммы, показывающие относительную частоту v появления ус¬ тойчивых векторов алгоритма (5*), отличающихся от прототипа в т ком¬ понентах, в зависимости от числа за¬ писанных образов So Записанные образы отличались от прото¬ типа в то = N/4 компонентах точки алгоритма (5) или (5*). На рис. 8 приведены гистограммы, пока¬ зывающие относительную частоту появления в качестве устойчивых образов векторов, отличающихся от <ро в то компонентах, в зависимости от числа записываемых образов so. Из этого рисунка видно, что от¬ носительная частота появления прототипа мала при небольшом числе образов s0 и достигает примерно 75% при so>0,2N. Вычислим вероятность того, что при записи s0 случайных векторов в матрицу V, отличающихся от <р0 в то позициях, <р0 будет реали¬ зовывать минимум энергии системы, т.е. будет выполнено условие 82:^0. Из (16) получаем, что 82:^0 при 2(5, 8s)^2,N>2m S°s=l (17) то , т0 COS. N N So У (предполагается, что N, т0> 1). Распределение вероятности величины х дается функцией распределения f(x)=<8(xl + ...xS0 — x)>= S fnz~‘qX П <е'^ >, (18) 00 _оо s=\ \ где х, = 5о‘(8, 8*), а угловые скобки означают усреднение по векторам 8s, имеющим в то позициях ±2, а в остальных позициях — нули. Вы¬ числяя среднее в предположении, что +2 и -2 встречаются в 81 равнове¬ роятно: * / то , т0 4а\50 U<e'gx’>=ll-- " j=i \ (19) и подставляя его в (18), получим f(x) = ± fdWl-—+ —cos^r 2 пХ \ N N SoJ При Jo^l можно разложить косинус в ряд Тейлора и, ограничиваясь первыми двумя членами, получить приближенное выражение _ 1 / Nso \ ^ / Nsox2 \
Веооятность того, что х^2, дается интегралом вероятности Р(х ^ 2) = Sdue~“\ z=\fNso/(%mo). (21) Из выражения (21) видно, что вероятность возникновения прототипа тем больше, чем меньше то (при заданном отношении so/N) или чем больше образов so (при заданном mo/N) использовалось для его формирования. Возможность рассмотрения явления выработки прототипа как процесса статистического усреднения по ансамблю образов, связана с видом матрицы связей между нейронами V (4), которая линейна по числу образов в памяти so- Отметим в этой связи, что матричным эле¬ ментам Vy (4) и энергии £ (1) может быть придан непосредственный вероятностный смысл, если воспользоваться понятием фрустрации (’’разочарования”) связей, впервые введенным для описания взаимо¬ действующих спинов ^неупорядоченных магнитных сплавах — спино¬ вых стеклах [22]. Действительно, согласно (4) матричный элемент Vy может быть записан в виде разности двух неотрицательных чисел: Vy=V*j-V]j=\o(p\j-»lj). Здесь V*i}.— число образов (р*, для которых <р,-=<Р/, aVy— число образов с cpf = -ф/. Поскольку Vy+Vy = so, то к* и и'у имеют смысл вероят¬ ности соответственно корреляции и антикорреляции /-го иу-го нейронов в рассматриваемом ансамбле образов памяти. По аналогии с [22] связь (ij) между /-м иу'-м нейронами в произвольном состоянии нейронной сети естественно назвать фрустрированной (’’разочарованной”), если («/,• — в7у)о,о,<0, и нефрустрированной при противоположном знаке неравенства. Тогда энергия системы (1) запишется в виде E = ^SoQf(g), где Qf(a) — разность между числами фрустрированных и нефрустриро- ванных связей. Векторы, отвечающие минимуму энергии системы, соот¬ ветствуют, таким образом, наибольшему числу нефрустрированных связей, т.е. наименьшей вероятности фрустрации нейронной сети. САМООРГАНИЗАЦИЯ НЕЙРОННЫХ СЕТЕЙ Статистические свойства ансамбля образов, которые участвуют в формировании нелинейной системой нейронов реакций на те или иные стимулы, не являются произвольными, а определяются статистикой стимулов, поступающих в систему на стадии обучения (см. раздел ’’Мо¬ дель нейронной сети”). С другой стороны, на процесс запоминания системой новых образов может оказывать существенное влияние информация, записанная в матрице V в предшествующие моменты времени. Чтобы проиллюстрировать взаимообусловленность процессов обу- 243
1 - - “ - / 1 1 - - - 1 I- П“ - I 1 1 1 - - - \ - - \ 1Г 4 1 Рис. 9. Последовательность стимулов, предъ¬ являвшихся в качестве начального условия при моделировании на ЭВМ уравнений (5), (22) В отсутствие "дообучения” (е = 0) смеиа устойчи¬ вого состояния происходит после предъявления 5-й кар¬ тинки. При достаточно большой модификации мат¬ рицы У (е = 0,025) возникает гистерезис: смеиа образов при направлении от "ящера” к "паровозу” и наобо¬ рот происходит на 8-й и 3-й картинках соответственно чения и распознавания, рассмотрим следующий пример. Пусть в Vзапи¬ саны два ортогональных образа, хеммингово расстояние между ко¬ торыми равно т, и пусть в качестве начального условия для системы (2), (3) выбираются элементы последовательности векторов (см. рис. 9), первый член которой совпадает с первым (левым) образом, а послед¬ ний — со вторым (правым) образом. При моделировании (2), (3) на ЭВМ использовались алгоритм Хопфилда (5*) и дискретный аналог (3): V„(I+\) = Vi/l) + £Ф//)Ф//Л (22) где V(l) — матрица связей между нейронами в /-м акте распознавания, Ф0) — результат /-го процесса распознавания: ф(/) = ф‘ или ф2. Как показали численные эксперименты, при определенных значениях пара¬ метра е в (22) средние стимулы предъявленной последовательности могут восприниматься либо как искаженный левый, либо как искажен¬ ный правый образы в зависимости от порядка, в котором предъяв¬ ляются стимулы, т.е. имеет место бистабильность восприятия. Оценку ширины области гистерезиса х получим, полагая, что на границе этой области энергия (1), соответствующая взаимодействию стимула с левым 244
образом, увеличенная в [1 +e(m/2+x/2)f раз, равна исходной энергии, соответствующей взаимодействию стимула с правым образом: [I + е (m/2 + x/2)][N~-2(m/2 + х/2)]2 =[N—2(m/2 — x/2)f. Отсюда при x<N\=N—т находим ширину области гистерезиса: х = /я/[(8/еЛ^)—1]. Если е^4/N\, область гистерезиса охватывает всю последовательность стимулов: х = т. В этом случае запоминание системой согласно (3) одного из образов, получившегося в результате распознавания последовательности стимулов, приводит к невозмож¬ ности получить в качестве устойчивого второй образ памяти, т.е. к эффек¬ тивному забыванию последнего. Аналогичное явление в психологии человеческой памяти получило название "проактивное забывание” [3]. Моделирование на ЭВМ показало, что уменьшение числа деталей образа приводит к уменьшению ширины области гистерезиса. Отме¬ тим, что аналогичное явление наблюдается при исследовании гисте¬ резиса зрительного восприятия [23]. Если теперь стимулы предъявляются случайным образом (с часто¬ той £2), то изменение ширины области ’’притяжения”, например левого образа, описывается уравнением х = 2гПх/т, где т — хем- мингово расстояние до ближайшего образа. Таким образом, область притяжения экспоненциально растет со временем, что приводит к вы¬ теснению одного образа другим. Ограничение на величину матричных элементов | V,J ^ V0, возника¬ ющее из-за нелинейного слагаемого в (3), приводит к тому, что вновь записываемые образы уменьшают относительный вес старых, а также частично искажают их. Аналогичное явление в психологии носит название ’’ретроактивное забывание” [3], при этом новая информация вы¬ тесняет старую. Рассмотренные примеры показывают, что процесс запоминания ансамблем нейронов новой информации существенно зависит от имею¬ щихся в V старых образов, от величины модификации матрицы связей в каждом акте распознавания, а также от той последователь¬ ности стимулов, которые предъявляются системе. В несколько отличных от рассмотренной в настоящей работе моделях самоорганизация нейронных сетей изучалась в [11, 12, 24], где обучение системы в процессе взаимодействия с внешними сти¬ мулами приводило к возникновению предельных циклов в динамике нейронов. • МОДЕЛЬ ВЫРАБОТКИ АССОЦИАЦИЙ Рассмотренная выше модель категоризации позволяет исследовать ряд процессов, аналогичных известным явлениям в психологии че¬ ловеческой памяти: обучение, распознавание, ретроактивное и про¬ активное забывание, бистабильность восприятия, выработка прототипа. Выработка прототипа, по существу, представляет собой процесс формирования ’’абстрактного понятия”, поскольку прототип не содер¬ жится среди стимулов, поступающих в систему нейронов иа стадии обучения извне, и в то же время, будучи устойчивым состоянием 245
системы, прототип может появляться в результате процесса рас¬ познавания наряду с истинными образами. Рассмотрим теперь модель выработки ассоциаций. Предположим, что различные группы компонент вектора состояния ансамбля нейронов имеют самостоятельный смысл подобно тому, как его имеют от¬ дельные слова в предложении. Обозначим эти группы А, В, ...Пусть в память системы записаны следующие ’’образы”: 1. AMNX 4. SMNT (23) 2. BMNX 5. SMNU 3. CMNX 6. SMNV Если теперь в качестве стимула предъявлен вектор SMNY, то при определенных условиях на относительный вес различных групп в процес¬ се релаксации система перейдет в устойчивое состояние, являющееся прототипом — SMNX. Этому примеру можно дать следующую на¬ глядную интерпретацию [4]. Если А, В, С, S обозначают имя (Платон, Сократ и др.), MN обозначает ’’человек”, X — ’’смертен”, Т, U, V—доб¬ рый, злой и др., то (23) можно записать в виде 1. Платон—человек—смертен 4. Сократ—человек—добрый 2. Пифагор—человек—смертен 5. Сократ—человек—злой $ 3. Зенон—человек—смертен 6. Сократ—человек—бедный, а устойчивое состояние SMNX представляет собой некоторое новое утверждение, не содержащееся среди обучающих стимулов: Сократ—человек—смертен и представляющее собой некоторую ассоциацию. Процесс ’’блуждания” системы между близкими образами (см. рис. 6), записанными в памяти системы, может моделировать известное психологическое явление построения новых ассоциаций. Действительно, после окон¬ чания процесса распознавания предъявленного стимула система пере¬ ходит в состояние, близкое к одному из образов. Однако вследствие флюктуаций (при конечной температуре термостата) возможны слу¬ чайные "перескоки” от образа к образу, причем наиболее часто происходят перескоки между близкими образами (см. выше), которые образуют набор "ассоциаций”, порожденных предъявленным стимулом. Последовательность образов, которые проходит система в про¬ цессе "блужданий”, зависит как от структуры памяти, так и от изменений температуры термостата (см. рис. 4). Действительно, если в системе записаны два приблизительно ортогональных образа, то перескоки между ними возможны только при сравнительно высокой температуре T^T^N. В то же время если образы близки, т.е. отли¬ чаются в небольшом числе компонент N\<N, то флюктуационные перескоки возможны уже при Ni^Th Поэтому при добавлении в память системы к двум ортогональным образам других, не ортого¬ нальных первым, время перехода между ортогональными образами может уменьшиться. Это явление аналогично ускорению протекания химических реакций при добавлении в реагирующую смесь катали¬ затора. При низких температурах образы, записанные в память системы, могут объединяться в группы, причем частоты перескоков 246
между элементами одной группы намного больше, чем между образами различных групп. Таким образом, рассмотренная модель нейронной сети в термостате позволяет исследовать известное психологическое явление, когда предъявленный стимул порождает целую цепочку различных ассоциаций, связанных одна с другой. ЗАКЛЮЧЕНИЕ Рассмотренная в настоящей работе модель нейронного ансамбля позволяет исследовать такие свойства системы, как распознавание образов, обучение, забывание, выработку прототипа и др., аналогич¬ ные соответствующим явлениям, хорошо известным в психологии (см., например, [3]). Важной функцией, которую осуществляют рас¬ смотренные ансамбли, является процесс категоризации, т.е. форми¬ рование в ответ на предъявленный стимул одной из ограниченного набора стереотипных реакций. Известно, что аналогичные явления происходят в нервных сетях при обработке первичной сенсорной, например зрительной, информации [1]. Применительно к ’’высшим” функциям мозга подтверждением рассматриваемой теории было бы экспериментальное обнаружение устойчивых ’’узоров” активности ней¬ ронных ансамблей, возникающих при определенных видах мыслитель¬ ной деятельности. ЛИТЕРАТУРА 1. Куффлер С., Николс Дж. От нейрона к мозгу. М.: Мир, 1979. 439 с. 2. Эделмен Дж.. Маунткасл В. Разумный мозг. М.: Мир, 1981. 133 с. 3. Клацки Р. Память человека: структуры и процессы. М.: Мир, 1978. 319 с. 4. Parallel models of associative memory /Ed. by G.E. Hinton, J.A. Anderson. N.Y. —L.: Erlbaum, 1981. 295 p. 5. Строук Дж. Введение в когерентную оптику и голографию. М.: Мир, 1967. 347 с. 6. Willshaw D. Holography, associative memory and inductive generalization. In: [4]. P. 83—104. 7. Goldman М. V. Strong turbulence of plasma waves // Rev. Mod. Phys. 1984. Vol. 56. P. 709—735. 8. Anderson J.A., Silverstein J.W., Ritz S.A., Jones R.S. Distinctive features, categorical perception and probability learning: some applications of a neural model // Psychol. Rev. 1977. Vol. 84. P. 413—447. 9. Hopfild J.J. Neural networks and physical systems with emergent collective computational abilities // Proc. Natl. Acad. Sci. USA. 1982. Vol. 79. P. 2554—2558. 10. Веденов А.А.. Левченко Е.Б. Об одном классе нелинейных систем с памятью // Письма в ЖЭТФ. 1985. Т. 41. С. 328—331. 11. Huberman В.А.. Hogg Т. Adaptation and self-repair in parallel computing structures // Phys. Rev. Lett. 1984. Vol. 52. P. 1048—1051. 12. Huberman B.A., Hogg T. Understanding biological computation: reliable learning and recognition // Proc. Natl. Acad. Sci. USA. 1984. Vol. 81. P. 6871—6875. 13. Little W.A. The existence of persistent states in the brain //Math. Biosci. 1974. Bol. 19. P. 101—120. 14. Little W.A.. Shaw G.L. A statistical theory of short and long memory // Behav. Biol. 1975. Vol. 14. P. lli—133. 15. Бернс Б. Неопределенность в нервной системе. М.: Мир, 1969. 251 с. 16Jngber L. Statistical mechanics of neocortical interactions: Dynamics of synaptic mo¬ difications //Physica. 1982. 5D. P. 83—107. 17. Metropolis S. et al. Equation of state calculations by fast computing machines // J. Chem. Phys. 1953. Vol. 21. P. 1078—1092. 247
18. Kirkpatrick S., Gellat C.D., Vechhi M.P. Optimization by simulated anneling //Science. 1983. Vol. 220. P. 671—680. 19. Siarrv P.. Dreyfus G. An application of physical methods to the computer aided desing of electronic circuits // J. de Physique—Lettres. 1984. Vol. 45. P. L-39—L-48. 20. Hopfleld J.J., Feinstein D.J., Palmer R.G. "Unlearning” has a stabilizing effect in col¬ lective memories // Nature. 1983. Vol. 304. P. 158—159. 21. CrickF.C.. Mitchison G. The function of dream sleep //Nature. 1983. Vol. 304. P. Ill—114. 22. Toulouse G. Frustration and disorder, new problems in statistical mechanics: spin glasses in a historical perspective // Heidelberg colloquium on spin glasses: Lect. Notes in physics. 1983. Vol. 192. P. 2—17. 23. Постон Т., Стюарт И. Теория катастроф и ее приложения. М.: Мир, 1980. 607 с. 24. Clark J.V., Rafelski J., Winston J.W. Brain without mind: computer simulation of neural network with modifiable neuronal interactions // Phys. Rep. 1985. Vol. 123. P. 215—273. УДК 577. 3:51:621.391 О СООТНОШЕНИИ ВОСПРИЯТИЯ И МЫШЛЕНИЯ В ЗАДАЧАХ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Ш.А. Губерман Началом работ по искусственному интеллекту можно считать ставшей классической работу Мак-Каллока и Питса 1943 г., в ко¬ торой показано, что на сети из нейроноподобных элементов можно реализовать любую логическую функцию. Появление этой публикации счастливо совпало с периодом бурного развития электроники во¬ обще и вычислительной техники в частности, что сделало воз¬ можным создание действующих моделей из нейроноподобных эле¬ ментов. Идея моделирования работы мозга базировалась не только на результатах Мак-Каллока и Питса. Она предполагала также, что принято следующее: описание нейрона как сумматора с пороговым элементом является достаточно адекватным; создание искусственного мозга возможно хотя бы в принципе, ибо такая система существует в природе. Главная трудность представлялась в том, как соединить между собой огромное количество нейронов. Казалось невероятным де¬ терминировать каждую из связей. Дл* преодоления этой трудности была выдвинута идея самоорганизации: вначале связи никак не организованы, а затем (в процессе обучения решению той или иной задачи) должна формироваться необходимая (для решения данной задачи) система связей. Отсутствие организации связей было отождествлено с наличием случайных связей. Таким образом возникла концепция обучения, сыгравшая в дальнейшем серьезную роль. Важным этапом на пути развития нейронных сетей стало соз¬ дание персептрона. Это была действующая модель, обучавшаяся распознаванию некоторых классов изображений, провозгласившая и реализовавшая принцип обучения на примерах — принцип, ко¬ торый определил во многом лицо той ветви искусственного ин¬ теллекта, которая стала называться распознаванием образов. В 248
нейронных сетях (и в персептроне в том числе) обучение необ¬ ходимо для формирования определенной системы связей между нейроноподобными элементами. Однако в дальнейшем, когда для решения задач распознавания были предложены другие схемы, имитировавшие только функциональную сторону процесса распозна¬ вания (набор арифметических функций М. М. Бонгарда, разделяющие плоскости Э.М. Бравермана и др.), обучение стало использоваться для выбора соответствующего решающего правила из множества возможных. С этого момента начинается развитие исследований по распознаванию, не связанных с моделированием нейронных струк¬ тур. Исследование нейронных сетей оказалось плодотворным и при¬ вело, в частности, к возникновению понятия возбудимой среды, а затем к открытию автоволновых процессов. Однако в области искусственного интеллекта моделирование нейронных ансамблей не привело к заметным успехам. Был подвергнут критике один из основных принципов нейронного моделирования — принцип само¬ организации. М.М. Бонгард показал, что для обучения распозна¬ ванию произвольной задачи на изображении из 32X36 элементов пришлось бы осуществить фантастическое число показов при обу¬ чении (более 103 °). Поэтому система, способная обучаться на ра¬ зумном числе примеров, обязательно должна обладать достаточно высокой начальной организацией. Для этого необходимо придумать систему, которая, ’’имея состояния, имитирующие человека, имела бы сверх того относительно мало других состояний. Именно при¬ думать, ибо надежда, что такая система организуется сама, ие бо¬ лее обоснована, чем надежда на то, что, бросив в ящик куски металла и набор инструментов, после долгой тряски мы вынем из ящика хорошо идущие часы” ([1], с. 180). Со временем накапливались новые данные о свойствах нейро¬ нов, картина функционирования нейрона стала более сложной. Преобладающим стал принцип функционального моделирования ра¬ боты мозга: в качестве цели выдвигается создание программ для ЭВМ, решаюших те или иные интеллектуальные задачи. На решение каких проблем были направлены усилия в первые годы развития исследований по искусственному интеллекту? Это распознавание образов, игры (шахматы, шашки и т.п.), доказа¬ тельство теорем, перевод с одного языка на другой. Что пре¬ допределило этот набор задач? Если оставить пока в стороне распознавание, то для остальных задач характерно следующее: исходная информация и правила преобразований представимы в символьной форме; никакой дополнительной информации о внешнем мире для ре¬ шения каждой из задач не требуется; алгоритм решения в каждой из задач казался понятным; ни одна из них не диктовалась потребностями практики (в узком смысле), т.е. это были задачи, которые математики, исходя из предыдущих предположений, сочли доступными для решения на ЭВМ; 249
все эти задачи представлялись образцами интеллектуальной дея¬ тельности. Что можно сказать об этих задачах сегодня, четверть века спустя? Удовлетворительного перевода с языка на язык нет до сих пор, однако работы в этом направлении стимулировали большое число глубоких исследований природы и функции языка. В ка¬ честве примера укажем на разработку Н. Хомским теории фор¬ мальных грамматик, получивших столь широкое признание. Работы по доказательству теорем очень скоро столкнулись с проблемой всевозрастающего перебора, он все чаще приводил к повторяющимся результатам. Некий просвет наметила работа X. Ге- лернтера в области доказательства теорек^ планиметрии. Он ввел в программу генератор гипотез, т.е. кандидатов в теоремы, которые можно пытаться доказывать. Эти гипотезы порождались в процессе ’’рассмотрения” программой конкретных чертежей, которые она сама строила. К сожалению, эта линия развития не нашла продолжения. Вместе с тем в ходе исследований по моделированию логиче¬ ского вывода выяснилось, что в тех областях, которые не от¬ носятся к чистой математике, ценность получаемых истинных выска¬ зываний не столь высока, какой, казалось, должна была бы быть. Выяснилось, что для пользователя исключительно важно, чтобы результат был правдоподобным. Правдоподобным считается резуль¬ тат или высказывание, которое согласуется с имеющимися пред¬ ставлениями или может быть получено из общепринятых теорий общепринятыми методами рассуждения. Такая ситуация наиболее типична для медицины и геологии, чем во многом объясняется отказ врачей или геологов применять возможно истинные, но не объяснимые традиционным для них способом решающие правила в медицинской диагностике или геологической разведке. Все это побудило заняться разработкой систем правдоподобных рассуждений. Хотя одна из первых и очень известных программ в этой обла¬ сти ’’Логик-теоретик” Ньюэлла, Саймона и Шоу была представ¬ лена как вариант программы для решения проблем вообще, сейчас о ’’всеобщем решателе задач” уже не говорят. В программировании игр довольно быстро были достигнуты ус¬ пехи для относительно простых игр (крестики и нолики, карточные игры). Заметим, что и эта область искусственного интеллекта об¬ ладает той же привлекательной для программиста особенностью, что и доказательство теорем — позиции и ходы описываются со¬ вершенно формально и исчерпывающим образом. Довольно неожи¬ данным (даже с сегодняшних позиций) представлялся успех, достиг¬ нутый Самюэлем в шашечной игре. Оказалось, что можно запомнить достаточное число типичных позиций и их оценок для игры хорошего уровня (и это при тех возможностях, которыми обладали ЭВМ в конце 50-х годов). Программа Самюэля не была даже по замыслу программой, имитирующей мышление человека. Поэтому ее дости¬ жения оказались чисто спортивными. Она не научила нас решать какой-нибудь класс задач и не помогла обнаружить в умственной 250
деятельности каких-либо приемов, пригодных в иных ситуациях. Этот опыт должен послужить предостережением и для тех, кто с нетерпением ждет создания сильных шахматных программ: если совершенствование шахматных программ будет идти за счет роста быстродействия и объема памяти ЭВМ, то вряд ли из этого можно будет извлечь что-нибудь поучительное. Между тем хорошей шахматной программы до сих пор нет. Нет и вдохновляющих идей в этой области. За исключением од¬ ной, но, возможно, решающей. Идея эта принадлежит М. М. Бот¬ виннику. Более 15 лет назад он обратился к программированию шахматной игры. И начал не с вопроса ’’Как написать программу, играющую в шахматы?”, а с вопроса ’’Как шахматист играет в шахматы?”. М.М. Ботвинник пришел к выводу, что в основе оценки позиции и планирования действия на шахматной доске лежат геометрические построения, т.е. для играющего существенно, что фигуры движутся по разного родй прямым линиям (горизон¬ талям, вертикалям, диагоналям). Планирование движения фигур про¬ исходит на языке траекторий, которые являются ломаными ли¬ ниями. Другими словами, любая статическая позиция для шах¬ матиста наполнена движениями фигур (бывшими и будущими). Такое рассмотрение позиции напоминает фотографию оживленной вечерней улицы, когда наряду с изображениями автомашин видны тянущиеся за ними светящиеся шлейфы — траектории их недав¬ него движения. М.М. Ботвинник предложил ввести понятие ’’уровня достижимости” — число ходов, за которое данная-фигура с данного поля может достичь заданного поля. Эта характеристика сочетает в себе как динамические особенности позиции, так и особенности данной фигуры в данной позиции, ибо скорость достижения опре¬ деленного поля на доске зависит от самой фигуры и от распо¬ ложения других фигур. Естественно, что уровень достижимости из¬ меняется в ходе партии. Можно показать, что относительная сила фигур тесно связана с этой характеристикой и поэтому изме¬ няется в ходе партии. Такой подход к программированию шахматной игры представ¬ ляется перспективным, однако пока он еще не реализован. Обратимся теперь к проблеме распознавания образов, которая играла ведущую роль в исследованиях по искусственному интел¬ лекту. В подтверждение приведем два высказывания. Одно из них принадлежит академику А.А. Дородницыну: «Информатика внесла два основных метода в решение задач прогнозирования (диагно- сцирования) явлений, изучаемых ’’описательными” науками: метод математического моделирования и метод распознавания образов...» (см. статью [2], с. 89). Другое высказывание принадлежит Э. Ханту. Касаясь содержания своей книги, он пишет: ”Я выделил два четко определенных класса научных проблем — распознавание образов и решение задач” (см. монографию [3], с 520). За прошедшие десятилетия распознавание образов проделало до¬ вольно длинный путь. Начинается он с персептрона Ф. Розен- 251
блатта. Однако довольно быстро стало ясно, что персептрон об¬ ладает весьма ограниченными возможностями в распознавании изо¬ бражений. Вскоре появился ряд новых принципов построения программ распознавания: гипотеза ’’компактности” и геометрическая интер¬ претация решающего правила, статистические концепции, принцип преобразования исходного пространства, структурно-лингвистические методы. Каждый из них был встречен с энтузиазмом и сулил решение имевшихся трудностей. Однако они не решены в удовлет- творительном виде и сегодня. Имеющиеся за рубежом устройства пред¬ назначены для чтения лишь определенного шрифта и притом далеко не каждого. Трудности чаще всего возникают из-за того, что буквы оказываются сцепленными друг с другом (вследствие расплы¬ вания печатной краски, грубой структуры бз^лаги и т.п.). Судя по публикациям, распознавание рукописного текста возможно лишь для стилизованного шрифта и раздельных букв. О создании авто¬ мата, читающего слитную скоропись, пока речь не идет. Распознавание речи пошло по пути чисто технического решения проблемы. Был ограничен словарь распознавания слов (до сотен), ограничено число дикторов (чаще до одного), и задача свелась к распознаванию нескольких сот сигналов, обладающих большим разнообразием. При этом, естественно, возникает возможность вы¬ бора словаря таким образом, чтобы уменьшить сходство сигналов. В качестве признаков для распознавания используются энергети¬ ческие, частотные и временные характеристики, мало связанные с артикуляционной основой речи. Уже в 60-е годы стали ясны причины неудач. Разработанные к тому времени методы узнавания касались решения задачи разде¬ ления объектов в заданном пространстве описания. Для решения же различных задач распознавания необходимо в каждом случае построить свое, адекватное задаче описание объектов. Идея была ясно сформулирована И. М. Гельфандом (подробнее см. статью [4]). М.М. Бонгард пытался разрешить эту проб^му, выделив в алгоритме распознавания специальный блок, конструирующий в каж¬ дой задаче свое описание. Однако решить проблему в достаточно общем виде не удалось, хотя работа М.М. Бонгарда (совместно с В.Н. Максимовым) по классификации картинок до сих пор явля¬ ется одним из высших достижений в области осмысленного распозна¬ вания изображений. Авторы статьи [4] подошли к этой проблеме более карди¬ нально. Они предположили, что выбор адекватного языка вообще вне традиционной тематики распознавания — построения решающих правил, а именно в сфере той специфической области, из ко¬ торой взята задача распознавания (медицины, геологии, фонетики и т.п.). Параллельно с исследованиями таких традиционных для распозна¬ вания проблем возникло направление, связанное с решением задач прогноза и диагноза в геологии, медицине, технике, социологии, психологии и т.д. Первая работа в этом направлении была посвя¬ щена распознаванию нефтеносных пластов по данным геофизики. 252
В дальнейшем появилось много публикаций об использовании программ распознавания в геологии и геофизике, а затем и в медицине, психологии, социологии, химии. В чем причина того, что идея разделения объектов в многомерных пространствах, ко¬ торая не привела к успеху в области распознавания изображений, оказалась плодотворной в некоторых задач технической и ме¬ дицинской диагностики? С точки зрения алгоритмов распознавания лучше всего было бы, если бы удалось так выбрать пространство характеристик и так определить метрику в этом пространстве, чтобы оказались все объекты одного класса близкими между собой, объекты другого класса также близкими, а расстояние между классами было бы велико. В случае распознавания изображений необходимо еще, чтобы такое положение имело бы место для всех интересующих нас задач, которые можно сформулировать на заданном растре. Ведь все картинки отражаются в одно и то же пространство ре¬ цепторов. Однако разные задачи предъявляют разные требования к понятию ’’близость объектов”. В одних задачах необходимо, чтобы близкими считались объекты, почти совпадающие при нало¬ жении. Для других нужно чтобы близкими оказались объекты, полученные друг из друга путем переноса или поворота. Третьи задачи требуют, что близкими считались подобные фигу¬ ры. В геологических задачах узнавания ситуация в корне отлична. В распознавании изображений пространство рецепторов фиксиро¬ вано, но мы обладаем возможностью конструировать знаки (на¬ пример, шрифт или дорожные знаки) так, чтобы их легко было различать. В геологии ситуация обратная: мы не можем (или почти не можем) конструировать объекты распознавания (ибо они выби¬ раются из экономических или научных соображений), но зато в широких пределах можем изменять пространство характеристик. Тем самым при выборе одной и той же метрики, по существу, в разных пространствах получим ’’близость” различного свойства. В одном случае это может быть близость пород по электри¬ ческому сопротивлению (полезная при разделении водоносных и нефтеносных пластов), а другом — близость объектов по поло¬ жению относительно геологических структур (что полезно при опре¬ делении сейсмичности). Более того, измеряемые характеристики геологических объектов отбирались именно с позиций их эффективности при классифи¬ цировании в различных задачах (и в первую очередь в задачах разведки полезных ископаемых), т.е. значения характеристик должны были отличаться у объектов, принадлежащих различным классам. Таким образом, пространство измеряемых характеристик складыва¬ ется в геологии (так же как и в медицине) под непрерывным давлением требования разделимости объектов по отдельным харак¬ теристикам, а тем самым (и тем более) во всем пространстве характеристик. Фактическая степень разделимости различна в разных геологических задачах. Все новые геологические, геохимические и 253
геофизические методы направлены на увеличение этой разделимости в тех или иных задачах. Задача описания объекта исследования в медицине и в гео¬ логии очень скоро привела к проблеме целостного описания. Проб¬ лема целостности была осознана как научная проблема гештальт- психологами в начале нашего века. Позднее были предприняты попытки положить понятие целостности в основание общей теории систем, но безуспешно: из всех формальных теорий понятие це¬ лостности исчезало. В физиологии понятие целостности, в част¬ ности, было введено через понятие синергии. Была также предло¬ жена трактовка целостного (системного) подхода как особого способа восприятия действительности или, другими словами, способа огруб¬ ленного описания [6]. Тем самым свойство целостности отторгается от объекта исследования и становится атрибутом исследующего субъекта. Итак, оказалось, что гипотеза разделимости образов в про¬ странстве характеристик гораздо лучше соответствует задачам узна¬ вания в геологии и медицине, чем узнаванию изображений. Вернемся теперь к задачам распознавания изображений и ре¬ чи. Как мы уже указывали, в 60-е годы в нашей стране возникло понимание того, что корнем проблемы распознавания является выбор адекватного языка описания объектов. В то время еще не было ясного понимания того, что такое адекватный язык и как его конструировать. У авторов работ [1,4] была скорее ясность того, что не является адекватным языком. С изложенной точки зрения фундаментальным становится вопрос: имеются ли регулярные спо¬ собы конструирования языка, адекватного задаче? В книге М. М. Бон- гарда предложен один из путей решения этой проблемы — принцип имитации. Согласно этому принципу задача узнавания должна быть рассмотрена как задача имитации устройства, генерирующего объек¬ ты распознавания, и описание объекта должно вестись на языке функционирования этого' устройства. Проиллюстрируем плодотвор^ ность такого подхода на нескольких примерах. Распознавание рукописного текста. Исходя из принципа имитации рукописный текст необходимо интерпретировать как след траек¬ тории пера при написании. Тем самым принимается, что содер¬ жанием понятия рукописной буквы (графемы) является не геометри¬ ческий образ, а картина движения (динамический стереотип). Та¬ кое представление находится в соответствии со многими извест¬ ными фактами из области восприятия рукописного текста. Легко убедиться, что по любому тексту можно восстановить траекторию его написания, включая участки, на которых перо не касалось бумаги. При афазиях, возникающих вследствие поражения мозга, иногда наблюдается неузнавание цифр и букв. Однако больной может опознать букву, если обведет рукой ее контур. Каждый легко узнает букву, написанную на спине пальцем (в то же время невозможно узнать букву, вырезанную из дерева и приложенную к спине). Однако переход от описания графемы на растре к ее описанию 254
в виде однопараметрической кривой (траектории пера) еще не решает задачу. Необходимо выбрать способ описания этой траектории. В качестве элементов траекторий русского рукописного курсива предлагается выбрать следующие восемь элементов: — о v хо Jt а ^ —. Каждой строчной букве русского курсива можно сопоставить код — определенную последовательность перечисленных элементов (о со¬ ответствует код о a в — код А о, и — код х ). По¬ давляющее число букв обладают различными кодами. В процессе ускорения письма траектория написания букв начи¬ нает искажаться, изменяются их коды. Однако эти искажения носят закономерный характер. Закономерность эта проявляется в том, что один элемент может перейти только в соседний элемент указан¬ ного выше ряда, т.е. при искажениях траектории А-элемент может перейти в о-элемент или Л-элемент, л -элемент может перейти только в А-элемент или А -элемент и т.д. Таким образом, выбранный алфавит элементов траектории рукописных букв является упоря¬ доченным. А с учетом того, что крайние элементы этого ряда совпадают, цепочка базовых элементов может быть свернута в кольцо, т.е. элементы упорядочены на окружности. Покажем, что выбранный алфавит элементов является конструк¬ тивным, т.е. можно указать алгори+м их нахождения в руко¬ писных знаках. Заметим, что каждый из элементов траектории содержит ровно один локальный максимум или минимум траектории (лишь о-элемент содержит два экстремума). Следовательно, задача сводится к отысканию экстремумов траектории. Для выделения и классификации элементов можно использовать контур изображения. Для элементов А и и каждому максимуму (минимуму) траектории соответствует пара близко расположенных максимумов (минимумов) контура. Для элементов Я и также имеются пары близких экстремумов контура, однако они лежат на разных контурах (один — на внешнем, другой — на внутреннем). В о-элементе два экстре¬ мума лежат на одном внутреннем контуре. Элементы Ли V имеют только по одному экстремуму контура. Предложенное описание имеет ряд важных качеств. 1. Оно позволяет распознавать рукописные буквы в довольно свободном написании (алгоритм распознавания настолько прост, что позволяет определить результаты распознавания вручную); 2. Для распознавания не требуется предварительной стандарти¬ зации изображения (по размеру, толщине букв, наклону). Таким образом, целый ряд этапов распознавания, которые считались необ¬ ходимыми при персептронном подходе, оказались излишними. 3. При данном способе описания исчезает необходимость в опе¬ рации сравнения с эталоном — одной из фундаментальных опе¬ раций, которую искусственный интеллект приписывает естествен¬ ному. Полученный код буквы и есть название класса: последо¬ вательность элементов о,Луи есть буква а. 4. По единичному каноническому изображению какой-либо буквы программа может получить его код и с помощью правил перехода между элементами описание всего класса изображений, представ¬ 255
ляющих данную букву. Тем самым мы отказываемся от способа построения описания класса (или понятия) с помощью обучения на примерах. 5. Рассмотрение возможных переходов элементов друг в друга при скорописи показывает, что сложившиеся исторически графи¬ ческие образы букв носят не произвольный характер, а удовлет¬ воряют естественным для теории кодирования принципам помехо¬ устойчивости при небольшой избыточности. Это дает основания для выявления закономерностей в историческом процессе формирования и становления русского курсива. 6. Выбранный способ описания позволяет в большой мере ре¬ шить задачу членения непрерывного текста на буквы. Этот способу основан на том, что имеются такие пары элементов, которые не соседствуют внутри букв и встречаются только при соединении букв между собой. 7. Рассмотрение рукописных знаков как траектории дает осно¬ вания для постановки проблем разборчивости почерков. Выясня¬ ется, что основным источником неразборчивости являются соеди¬ нения между буквами в тех случаях, когда место, с которого начинается написание той или иной буквы, отличается от кано¬ нического. А в результате читающий не может правильно проин¬ терпретировать видимую траекторию. Из этого следует, что для обеспечения сохранности разборчивого почерка необходимо уко¬ ренять в детях правильный способ написания букв, а не пра¬ вильный их вид. Преимущества выбранного языка описания настолько очевидны, что этот язык можно назвать адекватным задаче. Важнейшими свой¬ ствами адекватного языка можно считать конструктивность (су¬ ществование алгоритма описания конкретного объекта на данном языке), беспереборность (отсутствует этап принятия решения, ибо описание на этом языке прямо дает название класса) и широту (возможность эффективного использования во многих задачах). В контексте данной статьи важно подчеркнуть, что выбор той или иной модели восприятия существенно изменяет наши представления о работе интеллектуальных уровней: с одной стороны, целый ряд операций оказался поглощенным механизмом восприятия, с дру¬ гой — адекватный способ восприятия позволил разрешить проб¬ лемы более высоких уровней. Восприятие речи. В задаче распознавания устной речи (на фо¬ немном уровне) адекватным был признан язык артикуляций, описы¬ вающий изменяющуюся во времени геометрию генератора речевых сигналов — артикуляционного аппарата человека. Действующая в настоящее время алфавитная модель речи предполагает последо¬ вательную генерацию всех элементов речи на всех уровнях (на уровне предложений, слов, слогов и фонем). Если относительно первых трех уровней такое представление не вызывает сомнений, то относительно фонемного уровня это, очевидно, не так. В на¬ стоящее время общепринято, что слово возникает в результате последовательной генерации фонем. При этом отмечается явление, 256
называемое коартикуляцией — влияние последующих и предыдущих фонем на артикуляцию данной, а следовательно, на ее звучание. Однако этот эффект рассматривается как эффект второго порядка, да и само использование в этом определении терминов ’’после¬ дующий” и ’’предыдущий” подтверждает основополагающее значение гипотезы последовательной генерации фонем. Более адекватной представляется модель параллельной генерации гласных и согласных фонем. Основные артикуляционные параметры, по которым различаются согласные, это место образования прег¬ рады (место артикуляции), звонкость, взрывность. Для гласных такими артикуляционными параметрами являются положение языка (впреди—сзади), размеры фаринкса, огубление, т.е. параметры, оп¬ ределяющие резонансные объемы артикуляционного тракта. Приме¬ чательно, что это как раз те параметры, которые несущественны для артикуляции согласных. Первую групру артикуляционных па¬ раметров можно назвать согласными параметрами, вторую — глас¬ ными параметрами артикуляционного тракта. Каждой гласной фонеме соответствует определенный набор глас¬ ных параметров. Обратное, естественно, неверно. В процессе речи параметры гласного канала могут 'принимать значения, не соответ¬ ствующие фонемам нашего языка (например, при переходе от согласной к гласной). Но поскольку в процессе речи гласные параметры всегда принимают какие-нибудь значения, то можно сказать, что в речи всегда присутствует гласная. В отличие от гласных согласные параметры определены только тогда, когда в артикуляционном тракте имеется щель (или смыч¬ ка), что позволяет разбить речь на интервалы, где отсутствуют щель или смычка, и существует, следовательно, только гласная артикуляция, и интервалы, где определены и гласная, и согласная. Таким образом, можно считать, что встречающиеся в речи соглас¬ ные всегда произносятся на фоне какой-либо гласной, т.е. при каком-либо конкретном наборе гласных параметров. Это явление и есть параллельное фонетическое кодирование. Трудность, вызываемая неадекватностью модели последовательной генерации фонем, возникала, возникает и будет возникать перед каждым ребенком, который овладел буквами и приступает к чтению слогов. У ребенка ”м” + ”а” первоначально всегда звучит как ”мэа”, а вовсе не ”ма”, как нам (взрослым) хотелось бы. А проблема в том, что ”м” и ”а” произноситься должны не друг за другом, а одновременно, что произнося слог ”ми” или ”му” мы начинаем его с того, что растягиваем губы или вытягиваем их в трубочку в зависимости от гласной слога, а уж потом размыкаем губы, произнося ”м”. Артикуляторный язык описания фонем является традиционным для фонетики. Такой язык можно назвать адекватным для представ¬ ления речи на фонемном уровне, ибо удовлетворяются сформулиро¬ ванные выше основные требования. 1. Описание объекта на этом языке является названием клас¬ са, к которому данный объект принадлежит. Например, ’’заднеязыч¬
ный, взрывной, глухой” — это "к”, ”губной, глухой, взрывной” — это ”п”. При таком описании речевого сигнала отпадает необхо¬ димость в этапе распознавания. 2. Этот язык является конструктивным, т.е. можно указать алгоритм определения артикуляционных параметров по речевому сигналу. Определение параметров звонкости (т.е. наличия основ¬ ного тона) и взрывности (т.е. наличия скачка энергии сигнала) не создает принципиальных трудностей (хотя технически непросто). Наиболее сложный артикуляционный параметр — место артикуляции — можно определить по знакам изменения второй и третьей формант в переходной части слога. Эти изменения определяются также гласной, на фоне которой произносится данный согласный. 3. Рассмотренная модель параллельного фонетического коди¬ рования позволяет наметить путь построения программы для распозна¬ вания речи. На первом этапе проводится разделение речевого сиг¬ нала на гласные, согласные и переходные участки. Гласные уча¬ стки интерпретируются как гласные фонемы. Переходные участки от согласного к гласному определяют место артикуляции соглас¬ ного. Параметр места определяется из спектрального состава сигнала на участке согласного (с учетом гласного, на фоне ко¬ торого он произносится). На участке согласного определяются звон¬ кость и взрывность согласного. В скоплениях согласных и на концах слов согласный считается произнесенным на фоне нейтрального гласного. 4. В настоящее время в распознавании речи принято считать мягкие согласные (”ть”, ”дь”, ”сь” и т.д.) отдельными фонемами, никак не связанными с соответствующими твердыми согласными (”т”, ”д”, ”с” и т.д.) что представляется неестественным, уве¬ личивает число распознаваемых классов и тем затрудняет распозна¬ вание. Модель параллельного фонетического кодирования представ¬ ляет мягкие согласные как соответствующие твердые согласные, произнесенные на фоне гласной ”и”. Тем самым разрешаются ука¬ занные трудности — устанавливается тесная связь между твердыми и мягкими фонемами, уменьшается число фонем, подлежащих распоз¬ наванию, и облегчается распознавание. 5. В настоящее время не существует прямого определения фо¬ немы. Трактуемая как бы абстрактная смыслоразличительная еди¬ ница, фонема, неуловима в своем материальном воплощении — в речи встречаются лишь варианты фонем, зависящие от "окру¬ жения”. Действительно, если рассматривать полное артикуляционное описание речевого тракта, то разнообразие каждой фонемы чрез¬ вычайно велико, а соответственно велико и разнообразие спектраль¬ ных картин. Если же описывать гласные и согласные фонемы лишь гласными или согласными параметрами соответственно, то неод¬ нозначность описания одной и той же фонемы в разных поло¬ жениях исчезает. 6. Параллельная структура речевого потока находит свое отра¬ жение в грамматике языка. В группе семито-хамитских языков грамматический анализ слов приводит к расчленению слова на 258
параллельные составляющие: одна составляющая — это последо¬ вательность согласных, другая — координированная с ней после¬ довательность гласных. Последовательность согласных в этих язы¬ ках составляет неизменную основу (корень) слова, а последова¬ тельность гласных определяет его грамматическую форму. Напри¬ мер в египетском языке абстрактный корень Rtb (’’писать”) при¬ нимает формы Rataba ("пишет”), Ratib (’’пишущий”), Ritab (’’книга”) и ряд других. Грамматический строй хамито-семитских языков ориентирован преимущественно на ’’согласный” канал, в то время как грамматика индо-европейских языков, опирающаяся на после¬ довательное (слоговое) деление слова, дает преимущество гласному каналу, ибо гласный — основа слога. Таким образом, артикуляционный язык параллельного фонети¬ ческого кодирования удовлетворяет сформулированным выше тре¬ бованиям — конструктивность, беспереборность и широта — и поэтому может быть признан адекватным языком. Распознавание многогранников по схематическому изображению. Схематическое изображение многогранника состоит из отрезков прямых, представляющих видимые ребра многогранника. Задача состоит в том, чтобы по этому изображению определить, какой многогранник изображен. С изложенной выше точки зрения для порождения адекватного языка необходимо описать процесс, по¬ рождающий объект распознавания — многогранники. Такой подход выглядит на первый взгляд довольно неестественным. Ситуация существенно отличается от двух других задач,. описанных выше: в них, естественно, определялся генератор объектов распознавания — человек (а точнее, рука человека с пером или его артикуля¬ торный аппарат). И тем не менее доверимся теории. Начнем с простого случая — с призмы. Процесс генерации приз¬ мы можно представить себе следующим образом. Рассмотрим плос¬ кий многоугольник. При поступательном движении этого много¬ угольника вдоль некоторой прямой (не лежащей в его плоскости) он опишет призму. На условном изображении призмы изображены видимые ребра основания и боковых граней. Боковые ребра и яв¬ ляются следами движения вершин основания при генерации призмы описанным выше способом. Таким образом, приходим к следующему описанию изображения призм: система параллельных линий (ребер), опирающихся на основание. Очевидно, что такое описание является конструктивным, так как может быть получено из плоского изображения. Кроме того, это позволяет свести описание призмы к описанию ее основания, что является тривиальной задачей. Таким образом, для частной задачи распознавания призм мы получили способ описания, к ко¬ торому стремились: описание объекта (например, ’’призма с треу¬ гольным основанием”) и есть название класса, к которому он при¬ надлежит. Рассмотренный подход допускает обобщение на более широкий класс многогранников. Во-первых, для усеченных призм боковые грани на изображении 259
не обязательно должны быть параллелограммами — они могут быть четырехугольниками. Во-вторых, для распознавания пирамид необходимо рассмотреть не систему параллельных ребер, а систему ребер, исходящих из одной точки (а для усеченых пирамид продолжения ребер должны пересекаться в одной точке). Для того чтобы результаты распознавания можно было исполь¬ зовать в других задачах (например, в задачах описания слож¬ ных конструкций, их сборки и разборки), желательно провести классификацию оснований. Кроме класса правильных многоуголь¬ ников, можно ввести классы Г-, П-, Т-угольников, а также ’’почти треугольников”, ’’почти прямоугольников”, ’’почти параллелограмов” и т.п. Анализ и огрубленное описание многоугольников приложимы не только к основаниям призм и пирамид, но и к любым других^ граням. Собственно для призм и пирамид это лишено смысла, ибо боковые грани у них всегда параллелограммы и треуголь¬ ники. Такая процедура имеет смысл для ’’почти призм” и ’’почти пирамид” (см. рисунок). Анализируя изображение ’’почти призмы” алгоритм не может его идентифицировать как призму. Однако выполнив предварительно огрубление одной из граней, получим изображение, которое иден¬ тифицируется как призма. Описанный алгоритм может быть использован почти без изме¬ нений для распознавания группы многогранников, в которых одни загораживают другие. Эта возможность обусловлена тем, что удачно был выбран язык описания одиночных призм. Наконец, рассмотренный язык может служить основанием для образования понятий. Пусть имеется конструкция из трех прямоу¬ гольных призм, называемая аркой. Если определить такие характе¬ ристики многогранников, как ’’лежит”, ’’стоит”, ”на”, ’’перед” и т.п., то по изображению арки будет построено следующее опи¬ сание: ’’[(призма (основание — параллелограмм)) лежит] на { [(призма (осно¬ вание — параллелограмм)) стоит] [(призма (основание — парал¬ лелограмм)) стоит]}”. Замечательным свойством такого описания является то, что ие¬ рархия грамматических уровней совпадает с иерархией значимости признаков, используемых при описании арки. Например, вариация признака, лежащего на самом глубоком грамматическом уровне (т.е. в самых глубоких скобках), — формы основания призмы — не разрушает описания арки. Таким образом, из единичного опи¬ сания арки, приведенного выше, можно получить обобщенное опи¬ сание призмы: ’’[((призма) лежит) на] [((призма) стоит) ((призма) стоит)]”, т.е. в описании арки форма основания призмы несущественна. Если в этом описании изменить следующий уровень, например сменив призму на пирамиду, то мы получим скорее карикатуру на арку, чем арку, но все же что-то сходное с ней. Если же изменить 260
Описание многогранников а—в — Т-угольная, почти треугольная и треугольная притма соответственно еще более высокий уровень грамматической структуры, поставив ’’сто¬ ит” вместо ’’лежит”, то понятие арки будет полностью разрушено. Приведем еще один пример, в котором описание класса тоже строится по единичному образцу, но совершенно иным методом. Автоматический анализ флюорограмм грудной клетки [5]. В результате анализа каждая флюорограмма должна быть отнесена или к классу ’’нормальных” или ’’патологических”. Важнейшей частью работы является реализация автоматического описания нормальной флюорограммы. Поскольку в данной задаче целью является авто¬ матизация человеческой деятельности, то адекватным будет ’’че¬ ловеческое” описание флюорограммы. Оно состоит по меньшей мере в умении выделять значимые объекты, описывать эти объекты и определять их взаимоотношения. Основными объектами на любой флюорограмме считаются: легочные поля; ребра (отдельно их задние части и передние части); ключицы; корни легких; сосуды. Как ни тривиален такой подход, он не был использован в предшествующих работах. Поставив задачу выделения на изображении основных объектов (ключиц, ребер, корней и др.), необходимо решить вопрос о том, каким образом в программы будут заложены знания об этих объектах, без чего их выделение на таком сложном изображении как флюорограмма грудной клетки невозможно. Обычно априорные знания об объектах формулировались и закладывались в программы на языке логических утверждений (например, площадь объекта не менее такой-то, кривизна границы не более такой-то и т.п.). В этом случае знания об объектах оказываются распыленными по всем программам и настолько тесно с ними переплетаются, что в конце концов программа становится узкоспециализированной. Это делало невозможным моделирование и исследование общих прин¬ ципов обработки изображений. В качестве альтернативы было предложено хранить знания об объекте в форме изображения самого объекта [5]. Естественно, что в этом случае эталонное изображение есть конкретный пред¬ ставитель своего класса (например, класса ’’ключицы”). Соответ¬ ственно возникают две проблемы: как использовать конкретное эталонное изображение для поиска на поступившей флюорограмме аналогичного (но не идентичного) объекта; достаточно ли единичного объекта для представления знаний о всем классе.
Оба вопроса разрешаются введением промежуточного языка опи¬ сания объектов с помощью полей характеристик. Пусть имеется схематическое (черно-белое) изображение системы "задних частей ребер”, лежащей в пределах легочных полей. Этому эталону можно поставить в соответствие поле направлений границ ребер, определенное в тех же пределах. Оно задает в каждой точке легочных полей среднее направление границ ребер в не¬ которой окрестности этой точки. С учетом допустимых отклонений это поле задает допустимые направления ребер в каждом месте легочного поля для всех возможных флюорограмм, что используется для нахождения границ ребер на каждой конкретной флюорограмме. Аналогичным образом можно задать схематический эталон ’’пе¬ редних частей ребер” (которые на рентгеновском снимке секут задние части ребер примерно под прямым углом), построить по нему эталонное поле направлений граней передних частей ребер и по тем же самым алгоритмам, которые использовались для определения задних частей ребер, искать их передние части. Точно так же для поиска ключиц на любой конкретной флюорограмме достаточно сменить эталонное изображение ребер на эталонное изображение ключиц. Имея эталонное изображение объекта (например, ребер), можно по нему построить не только поля направлений границ, но и поля других характеристик, например поля размеров объектов, поля расстояний между объектами и т.п. Эти поля используются при поиске объектов на реальных флюорограммах. Таким обра¬ зом, единичное изображение объекта порождает комплект эталон¬ ных полей характеристик. Такой комплект полей представляет ин¬ формацию обо всем множестве допустимых флюорограмм грудной клетки и является описанием данного класса изображений. Язык полей характеристик является конструктивным (алгоритмы построения различных полей просты и работают как на реальном изображении, так и на эталоне). Язык этот беспереборный, ибо алгоритмы анализа изображений с помощью полей характеристик не проводят выделения объектов и сравнения их с набором эта¬ лонов, а ищут данный объект, подобный заданному эталону, иг¬ норируя все остальные объекты на изображении. Наконец, язык полей характеристик обладает широтой (в определенном выше смысле), ибо применим к различным классам изображений. Кроме того, ои позволяет по новому трактовать психологические и нейрофизио¬ логические экспериментальные данные. В частности, обнаруженные Хьюбелом и Визелем картины возбуждения в зрительной коре мле¬ копитающих при стимуляции сетчатки системой черно-белых полос можно трактовать как поле направлений гранищобъектов на изобра¬ жении. Итак, адекватный язык дает возможность по единичному об¬ разцу построить описание класса, т.е. образовать понятие. За¬ метим, что и в предыдущих примерах была такая же ситуация. По каноническому образцу буквы на основании правил трансфор¬ мации (правил перехода одних элементов в другие) строится опи¬ 262
сание всего класса. Точно так же ’’прочтение” конкретной соглас¬ ной на артикуляционном языке дает нам описание всего класса ("взрывной, глухой, заднеязычный”). Заметим, что такой подход в корне отличается от традиционного для распознавания образов обучения на примерах по совокупности отличительных признаков. Следует отметить, что подход к проблеме образования понятий как к задаче построения алгоритма распознавания получил распро¬ странение и в психологии, и даже в философии. В ’’Философском словаре” (М.: Сов. энциклопедия, 1980) ’’понятие” трактуется как "мысль, представляющая собой обобщение (и мысленное выделение) предметов некоторого класса по их специфическим (в совокуп¬ ности отличительным) признакам...” (с. 287). Собственно говоря, здесь описана суть алгоритма классификации объектов по косвен¬ ным признакам, и в искусственном интеллекте это очень часто и называлось образованием понятий. То, что такая формулировка заимствована из арсенала искус¬ ственного интеллекта, подтверждается тем, что ничего подобного не встречается в статье на эту же тему в предыдущем издании ’’Философского словаря” (1954). И все же на первом месте в ’’Фи¬ лософском словаре” (1980) стоит определение понятия как одной из ’’форм отражения мира на ступени познания, связанной с при¬ менением языка”. Такая точка зрения полностью согласуется с подходом, изложенным выше. В истории развития исследований по искусственному интеллекту обращает на себя внимание следующее. Если на начальном этапе распознавание образов составляло одну из важнейших областей искусственного интеллекта, то в дальнейшем, не справившись с моделированием восприятия, искусственный интеллект вытеснил из своей сферы задачи распознавания. Процесс этот проходил методом ”взгонки”. Не справившись с задачей распознавания фонем, переш¬ ли к распознаванию слов и слитной речи. Не справившись с рас¬ познаванием букв и цифр, принялись за распознавание сцен. Не справившись с обработкой неподвижных изображений, перешли к обработке движущихся объектов} Неудачи в обработке плоских изображений имели своим следствием переход к анализу трехмер¬ ных сцен. И так далее. Теперь все упирается в базы данных, в представление знаний. Сосредоточившись на переработке сим¬ вольной информации, искусственный интеллект тем самым отгородил себя от внешнего мира. К тому же и робототехника становится периферийной проблемой искусственного интеллекта. В связи с этими тенденциями встает вопрос о предмете искусственного интеллекта. Кардинальной задачей мышления является посредничество между восприятием и поведением, обеспечивающее адекватную реакцию на различные внешние ситуации. Понятно, что мышление должно быть в высшей степени согласовано как с организацией восприятия, так и с организацией движения. То, что организация движения является одной из основ интеллекта, показали уже в конце 50-х годов И.М. Гельфанд, B.C. Гурфинкель, M.JI. Цетлин, M.JI. Шик. В 60-е и 70-е годы в психологии укрепилось понимание того, 263
что восприятие не есть пассивный процесс обработки информа¬ ции, продвижения ее по конвейеру, а осуществляется при участии верхних уровней, что восприятие тесно связано с организацией памяти. Фактически признано, что трудно провести грань между восприятием и мышлением, между мышлением и поведением. Такая точка зрения отразилась в выражении: глаз есть выдвинутая часть мозга. Конечно, если рассматривать задачу распознавания как задачу принятия решения в условиях неопределенности по набору косвен¬ ных признаков, то распознавание следует считать интеллектуаль¬ ной проблемой, а формирование набора признаков — ’’технической” работой. Однако выше мы показали, что для решения задач рас¬ познавания вовсе не обязательно строить разделяющую поверх¬ ность в многомерном пространстве, проводить обучение на мно¬ жестве примеров из каждого класса. Использование адекватного языка делает излишними ’’интеллектуальные” этапы процесса распозна¬ вания: описание объекта становится названием класса и опреде5 ляет его содержание. Например, весь механизм нормирования изо¬ бражения букв (приведение к одному размеру, к одинаковой толщине и к одинаковому наклону) оказывается излишним при описании знаков на языке траектории пера. Таким образом, класс задач, которые необходимо решать на интеллектуальном уровне, в боль¬ шой мере зависит от способа восприятия. Список примеров, свидетельствующих о глубоком взаимном про¬ никновении того, что мы называем восприятием и мышлением, мож¬ но было бы продолжить. Из изложенного следует, что попытка изу¬ чения ’’чистого” мышления кажется по меньшей мере искусственной. В соответствии с этим, представление о том, что понятие ’’обра¬ ботка символьной информации” покрывает понятие ’’мышления”, яв¬ ляется неадекватным. Мы пытались выше показать, что многие ин¬ теллектуальные задачи не могут быть решены в изоляции от внешнего мира, от реального времени, от топологических и метрических свойств реального пространства. С такой позиции преимущественное внима¬ ние, которое уделяется в настоящее время работе с символьной информацией, представляется спорным. По нашему мнению, изуче¬ ние интеллекта, моделирование его функций должно быть тесно свя¬ зано с основной задачей, которая стоит перед всяким живым сущест¬ вом, в том числе и перед человеком, — отражением внешнего мира для построения соответствующего поведения. ЛИТЕРАТУРА 1. Бонгард М.М. Проблема узнавания. М.: Наука, 1967. 320 с. 2. Дородницын А.А. Информатика: предмет и задачи // Вестн. АН СССР. 1985. N 2. С. 85—90. 3. Хант Э. Искусственный интеллект. М.: Мир, 1978. 558 с. 4. Васильев Ю.М., Гельфанд И.М., Губерман Ш.А., Шик М.Л. Взаимодействие в био¬ логических системах // Природа. 1969. N 6. С. 13—21; N 7. С. 24—33. 5. Задачи медицинской диагностики и прогнозирования с точки зрения математики / Под ред. И.М. Гельфанда. М.: Науч. совет по комплекс, пробл. "Кибернетика” АН СССР, 1985. 195 с. (Вопр. кибернетики). 6. Губерман Ш.А. Теория гештальта и системный подход // Системные иссле¬ дования: Методологические проблемы. М.: Наука., 1984. С. 66—82. 264
УДК 621.391.192.5 ФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ ЗРИТЕЛЬНОГО ПРОЦЕССА И ПРИНЦИП ГЕШТАЛЬТА Г. М. Зенкин, А. П. Петров В настоящее время в теории и практике ’’искусственного ин¬ теллекта” назрела необходимость создания искусственной зрительной системы высокого уровня. Решению этой проблемы может помочь общая информационная теория зрительного процесса как одного из самостоятельных сенсорных процессов мозга. Она могла бы служить основой для решения как конкретных практических во¬ просов, так и, например, более общей задачи заполнения искус¬ ственного мозга через зрительный вход знаниями об окружающем мире. Ясно, что праобразом искусственной зрительной системы роботов является зрительная система человека и животных, и, казалось бы, содержательная теория искусотвенной зрительной системы должна опираться на данные экспериментальных исследований зрительной системы организмов, на существующие представления о принципах ее организации. Однако ближайшее знакомство с имеющимися в этой области концепциями показывает, что в настоящее время теории зрения, которой было бы достаточно для решения задач искусственной зрительной системы, не существует ни в физиологии сенсорных систем, ни в психологии, ни в кибернетике, ни в комп¬ лексе этих наук. В то же время попыток создания теории зрения или подходов к ней достаточно много и они весьма разнообразны [1-9]. В завершенном виде такая теория должна быть системной и объединять описания зрительной системы на функциональном, струк¬ турно-функциональном и алгоритмическом уровнях. Важнейшими из них являются функциональный и структурно-функциональный уровни теоретического описания зрительной системы. Для функцио¬ нального уровня существенно формулирование таких понятий, как ’’основная функция” и ’’конечный продукт” деятельности зрительной системы. Формулирование этих понятий позволило бы на первом этапе отделить зрительную систему от других цветем мозга и выделить зрительную функцию как самостоятельную, в частности отличную от функции мышления. Однако единое мнение по этим важным вопросам пока не выработано. Нет пока и общепри¬ нятого или достаточно удовлетворительного необщепринятого струк¬ турно-функционального описания зрительного процесса человека. В то же время накопленный обширный фактический материал и определенные достижения в теоретических разработках отдельных принципов функциональной организации зрительной системы дают возможность на базе обобщения этих данных разработать струк¬ турно-функциональную схему зрительной системы, способной осущест- йлять зрительную функцию высокого уровня. Выполнение этой 265
задачи в некоторой степени облегчается тем, что появилась более ясная цель создания такой теории как содержательной качествен¬ ной теории искусственной зрительной системы, а потому — и тре¬ бования к ее языку и структуре. В настоящей статье предлагается вариант описания структурно¬ функциональной организации зрительного процесса, опирающийся в основном на данные психологии и нейрофизиологии. В сово¬ купности предлагаемый подход можно назвать психонейрокиберне- тическим, подразумевая под этим, что на разных этапах описания используются язык и понятия соответствующих научных дисциплин и разработанные в их рамках теоретические представления. Глав¬ ная цель статьи — положения, высказанные специалистами раз¬ личных областей знания, объединить в систему единой логикой отношений, придающей каждому отдельному функциональному этапу смысл с точки зрения конечного результата функционирования всей системы в целом. Зрительная система связана с рядом самостоятельных систем мозга, которые в данном случае можно рассматривать как обслу¬ живающие (например, вестибулярная система, система проприоцеп- ции), и с общей управляющей системой мозга — системой целе- полагания, или установки. Однако, несмотря на значительную за¬ висимость зрительной функции от этих систем мозга, можно счи¬ тать зрительную систему относительно изолированной, полагая, что все необходимые информационные сигналы имеются в ее распо¬ ряжении, а управляющая система целеполагания ставит перед зри¬ тельной системой столь сложные задачи, что потенциально она должна содержать мощный арсенал средств для их решения, опи¬ сание и объяснение которых и будет составлять содержание ка¬ чественной теории зрения. В соответствии с поставленной задачей, прежде чем перейти к более детальному описанию функциональной структуры зритель¬ ной системы, сформулируем качественную теорию зрительной системы в общих положениях. Уже относительно давно были выделены такие функциональные свойства зрения, как предметность, целостность, структурность, константность. Их экспериментальным исследованиям были посвя¬ щены многочисленные работы психологов, начиная с пионерских работ психологов гештальт-школы [10,11]. На основании этих иссле¬ дований и общего методологического анализа зрительной функции мозга можно, казалось бы, сформулировать основную задачу зри¬ тельной системы или, другими словами, определить понятие ’’зри¬ тельное восприятие”. Однако до сих пор нет общепринятого ответа на вопрос о том, существует ли вообще зрительное восприятие как самостоятельный этап деятельности мозга. Сохраняющуюся здесь неопределенность можно попытаться исчерпать, если опре¬ делить понятие ’’конечный продукт” деятельности зрительной си¬ стемы и обосновать факт его существования. Выяснение свойств этого продукта и формы его существования позволит очертить и функциональное содержание процесса, реализующего этот продукт. 266
АКТУАЛЬНОЕ ЗРИТЕЛЬНОЕ ПОЛЕ Обратимся к своему зрительному опыту и используем свое созна¬ ние как экспертную систему по оценке деятельности зрительной системы. Человек совершенно свыкся с тем загадочным феноменом, кото¬ рый в психологии носит название ’’актуальное зрительное поле”. Это то самое трехмерное зрительное поле, которое возникает перед нашим сознанием (не в нем) всякий раз, когда мы откры¬ ваем глаза, даже не желая никуда смотреть и ничего видеть. Наполненное расположенными в пространстве объектами, зри¬ тельное поле находится в полном распоряжении нашего сознания и всех систем организма, обеспечивающих взаимодействие с пред¬ метным окружением, и любую зрительную задачу мы начинаем решать, обращая внимание на содержание этого актуального зри¬ тельного поля. Отчетливо выступает феномен актуального зрительного поля в опытах со зрительным последовательным образом. Каждый может это испытать на себе. Если после некоторого пребывания в темноте перед испытуемым осветить обстановку экспериментального по¬ мещения кратковременной яркой вспышкой света, то после мгно¬ венного высвечивания обстановки и кратковременного ослепления наступает фаза положительного последовательного зрительного об¬ раза, сохраняющегося 5—10 с. Испытуемый воспринимает ситуацию так, как будто все помеще¬ ние освещено неярким, медленно затухающим голубым источником света. Однако никакой реальный источник света к этому времени уже не существует, а последовательный образ формируется на ос¬ нове ’’высвечивания” фоторецепторов-палочек, запасших световую энер¬ гию во время вспышки. В таких условиях возникает совершенно реальное трехмерное актуальное зрительное поле, содержащее прост¬ ранство помещения с объектами, находившимися перед испытуемым в момент вспышки. Если глаза, голова и тело испытуемого будут неподвижны, то он сможет рассмотреть эту обстановку и описать ее во многих деталях [12]. Однако если испытуемый совершит такие движения, то неожи¬ данно для себя увидит преобразования окружающей обстановки, многие из которых в реальных условиях происходить не могут. Эти преобразования — трансформации видимого зрительного^ по¬ ля — закономерно связаны с типом движений испытуемого. Например, при движении вперед или наклоне к точке фикса¬ ции окружающее помещение вместе с находящимися там объектами будет плавно уменьшаться в размерах вплоть до ’’очень малых”, а при движении назад — плавно увеличиваться вплоть до очень больших размеров. При наклоне головы к плечу все помещение будет плавно наклоняться в ту же сторону. При всех таких трансформациях видимое окружение сохраняет свою предметно¬ пространственную организацию. Все это будет происходить вопреки тому очевидному факту, что ’’изображения” на сетчатках двух 267
глаз, являющиеся источником возникновения последовательного об¬ раза, ’’заморожены”, т.е. привязаны к слою фоторецепторов и не могут измениться при движении глаз. Здесь важно отметить то, что испытуемый видит не изображения на своих сетчатках, а то, что мы назвали актуальным зрительным полем. Как следует из опытов с последовательным образом, это поле существует во многих своих качествах независимо от сетчаточных изображений и от наших ’’знаний” о свойствах предметного окружения. Другая особенность актуального зрительного поля, принципи¬ ально отличающая его от изображений на сетчатках, это его пред¬ метная структурированность. В опытах с последовательным обра¬ зом самостоятельность ее формирования выступает особенно нагляд¬ но. Действительно, в этот момент зрительная система имеет дело не со световым потоком, несущим оптическую копию обстановки, а лишь со следовым возбуждением фоторецепторов. В опытах можно иногда замечать разрушение предметной структуры актуального зрительного поля. Подобное явление происходит при резких и необычных изменениях видимого окружения (например, при сложной трансформации последовательного образа, наступающей после бы¬ строго наклона головы с одновременным изменением положения тела и глаз). В таких случаях испытуемый теряет на время ориен¬ тацию в окружающей обстановке и интроспективно может пережи¬ вать напряженную внутреннюю деятельность по восстановлению пред¬ метной структуры зрительного поля. Из всей совокупности наблю¬ дений последовательных образов следует, что актуальное зритель^ ное поле является самостоятельным, совершенно независимым от нашего сознания продуктом, формируемым серией механизмов зри¬ тельного восприятия. Помимо предметной структуры актуального зрительного поля, можно отметить еще две основные структуры, ему присущие. Это прежде всего структура трехмерного ’’вмещающего” простран¬ ства, которую можно подразделить отдельно на топологическую^ и метрическую структуры, и, кроме того, очень интересная и важная структура освещенности, или световая структура актуаль¬ ного зрительного поля. Эта особенность отличает его от других внутренних моделей предметного окружения и, вероятнее всего, в первую очередь ответственна за субъективное переживание вйдения. Отчетливо выступает уникальность феномена актуального зри¬ тельного поля при сравнении деятельности зрительной и других сенсорных систем. Например, тактильная система тоже может осу¬ ществлять анализ предметногй окружения, однако она не распо¬ лагает возможностью формировать и поддерживать также и актуаль¬ ное тактильное поле предметного окружения по той очевидной причине, что в^ тактильной системе отсутствует параллельный ме¬ ханизм симультанного отображения внешнего окружения. А форми¬ ровать актуальное поле восприятия на основе механизма после¬ довательного отображения не имеет смысла, так как нет возмож¬ ности симультанно поддерживать такое поле. Без этого оно не будет адекватно воспроизводить в каждый момент времени пред¬ 268
метное окружение. Заметим, что у некоторых животных с просто организованной зрительной системой форма существования актуаль¬ ного зрительного поля может значительно отличаться от той, к которой привык человек. Например, у лягушки, в зрительной системе которой, видимо, отсутствуют механизмы представления неподвижных объектов, актуальное зрительное поле может содер¬ жать лишь движущиеся объекты [13, 14]. .Актуальное поле восприятия могло бы формироваться в слухо¬ вой системе, обладающёй^еханйзмами параллельного отображения звуковых событий, однако обычно у людей предметно-пространст¬ венная структура звуковых событий типа актуального зрительного поля не формируется. ~ Это связано главным образом с тем, что наша слуховая система воспринимает лишь активные звуковые объекты, что делает слуховую обстановку фрагментарной и чисто динамической, не имеющей своей ’’статической основы”. Человек не обладает столь мощными .средствами восприятия отраженных звуковых волн, чтобы поддержи¬ вать актуальное слуховое поле. Иная ситуация у животных, обладающих собственным источни¬ ком звуковых волн. В случае использования звуковых волн в системе пространственной локации возможно, видимо, формиро¬ вание чего-то похожего на актуальное зрительное поле, именно детального постоянно поддерживаемого предметно-структурирован¬ ного актуального слухового поля. Очень вероятно, что это осу¬ ществляется в какой-то мере у летучих мышей и дельфинов [15]. Итак, будем полагать, что (единственным чисто зрительным прб- (■'■дуктом деятельности зрительной системы является предметно-струк¬ турированное актуальное зрительное поле. Оно формируется и под¬ держивается в своем динамическом состоянии присущей зрению мощной системой параллельной обработки информации. Это поз-' воляет остальным системам мозга и нашему сознанию и мышле¬ нию иметь постоянно в своем распоряжении актуальную модель зрительного предметного окружения, выступающую как актуальное зрительное поле. И хотя непосредственным источником ее явля¬ ются, конечно, оптические изображения на сетчатках, содержание и форма существования актуального зрительного поля существенно отличается от содержания и формы существования оптического изо¬ бражения, или ’’сетчаточных образов”, г ч Это объясняется еще и тем, что в формировании актуального \ зрительного поля принимает участие память и механизмы зритель- I ных представлений, в результате чего актуальное зрительное поле I приобретает свою предысторию, что приводит к появлению в нем не только предметной структуры, но и "качества движения”. ’’Сет¬ чаточный образ” всегда одномоментен и бесструктурен. Поскольку предметное структурирование представляется одним из важнейших свойств актуального зрительного поля, постольку основным становится вопрос о том, как в зрительной сисДеме формируется модель физического объекта, в частности его сен¬ сорная модель, и как на ее основе организуется структура актуаль¬ 269
ного зрительного поля. Таким образом, представление . отдельного, объекта в зрительной системе является коренным вопросом теории_ зрительной функции. Впервые эту проблему сознательно и четко поставили и по^ пытались решить гештальт-психологи. На основании их исследований можно высказать предположение, что .выделение объекта и структур рирование актуального зрительного поля осуществляются в основном мёганизмом симультанно-целостного зрительного восприятия, кото¬ рый будем называть гештальт-механизмом. Структуру этого меха¬ низма, определяющего форму существования актуального зритель¬ ного поля, и требуется детализировать. В отношении к своему конечному продукту зрительная система выступает в двух аспектах. С одной стороны, она является вполне самостоятельным синтезатором актуального зрительного поля, опи¬ рающимся в своей деятельности на средства инвариантного синтеза и актуального предметного структурирования, включающие и би¬ нокулярный стереосинтез, и анализ динамики зрительных событий, и память, и систему параллельной обработки информации. С другой стороны, зрительная система выступает как проблемно- ориентированный анализатор предметного содержания и состояния актуального зрительного поля, имея в своем распоряжении мощную операционную систему его перцепторного анализа. Эта операционная система включает в себя столь большой набор операторов зри¬ тельного анализа, что может функционировать лишь под строгим контролем управляющей системы целеполагания. Без такого управ¬ ления просто невозможна никакая последовательная анализаторная зрительная деятельность. В то же время можно думать, что на уровне предметного зрительного анализа у зрительной системы есть "нулевая” задача, мало зависящая от системы целеполагания, которая определяет конечную форму существования и поддержания актуального зри¬ тельного поля и ’’нулевой уровень” предметного перцепторного анализа актуального зрительного поля, реализуемый параллель¬ ными средствами. Обсуждаемые здесь отношения схематически по¬ казаны на рис. 1. Момент взаимодействия актуального зрительного поля и ’’нуле¬ вого” перцепторного анализа субъективно отмечается, когда до момента формирования окончательного состояния зрительного поля проходит заметный период пространственно-временной дезориентации (например, при открывании глаз после сна в новой или малопри¬ вычной обстановке). При этом все элементы изображения окру¬ жающей обстановки присутствуют на сетчатке глаз, человек уже что-то видит и завершение синтеза актуального зрительного поля не сопровождается никакими изменениями этих изображений. Именно на этапе перцепторного анализа зрительная система становится зри¬ тельным анализатором предметного окружения, непосредственно об¬ служивающим уровень визуального мышления как в режиме актуаль¬ ного визуального мышления, так и в режиме работы только со зрительными представлениями [16, 17]. 270
Рис. 1 Может показаться, что по отношению к субъекту или нашему сознанию актуальное зрительное поле выступает как внешняя структу¬ ра, аналогичная трехмерному ’’телеэкрану” с изображением предмет¬ ного окружения. Такая интерпретация функции зрительной системы возвращает нас к ’’дурной бесконечности”, неоднократно подвергну¬ той критике [7]. Выход из этого парадокса состоит в том, что внутренне эта структура представляет собой не ’’изображение”, а сис¬ тему взаимодействующих, иерархически организованных сенсорных моделей объектов, частей объектов и совокупностей объектов разного уровня обобщения, являющихся рабочим материалом мгновенно начинающегося этапа перцепторного анализа и синхронно функцио¬ нирующего у человека актуального визуального мышления. Говоря об информационной емкости потока зрительной информа¬ ции, обычно приводят его количественные характеристики на уровне зрительного нерва или поля сетчатки. При этом остается неоценен¬ ным объем потока, доходящий до выхода системы. Правильнее попытаться оценить информационное содержание актуального зритель¬ ного поля как конечного продукта деятельности зрительной системы. По субъективным оценкам в актуальном зрительном поле при бо¬ гатой зрительной обстановке и неподвижной голове наблюдателя одновременно выделяется до сотни предметных единиц. Можно оце¬ нить текущее информационное содержание актуального зрительного поля как I=log2(m")k, где п — число переменных, которые можно приписать отдельной предметной единице; т — размерность каждой переменной; к — количе¬ ство предметных единиц. Если принять [18] т = п = 7, а к= 100, то /=log27700«log222000, т.е. 2000 бит. Заметим, что само предметное описание обстановки может быть реализовано лишь последовательно, но параллельно поддерживаемое актуальное зрительное поле содержит все эти единицы объекты од¬ новременно и во всех их качествах. Кроме того, надо еще иметь в виду, что каждая из предметных единиц может быть подвергнута 271
дополнительному анализу, и, следовательно, предлагаемая оценка заведомо является заниженной. Именно столь большая информационная емкость актуального зри¬ тельного поля создает субъективное впечатление того, что мы мно¬ го видим. Однако опыты показывают, что это далеко не так. Объяснить этот феномен можно тем, что в нашем субъективном понимании или переживании вйдение означает лишь потенциальную возможность обнаруживать, узнавать, сравнивать и совершать еще ряд зрительных операций с тем, что мы видим, которая далеко не всегда может быть реализована. Происходит это потому, что актуальное зрительное поле создается мощными средствами парал¬ лельно функционирующей системы синтеза, а используется нашим сознанием, функционирующим последовательно и потому в каждый данный момент времени способным выбрать из имеющегося мате¬ риала лишь очень малую его часть. Этот факт подтверждается опытами по изучению информацион¬ ной емкости зрительного анализа обстановки и зрительной памяти с применением тахистоскопической методики. Подобные же опыты, проведенные по несколько модифицированной методике, показывают, что ’’записанная” в актуальном зрительном поле зрительная инфор¬ мация действительно велика и при некоторых условиях ее можно использовать [19, 20]. Например, в случае активной физической деятельности, когда параллельно функционируют несколько систем организма, получа¬ ющих зрительную информацию, объем используемой информации значительно возрастает. Однако в этом случае он идет в основном мимо сознания, а потому субъективно не может быть оценен. Ясно, что если бы таких пользователей актуального зрительного поля в организме не было, лишена была бы функционального смысла вся работа по формированию и постоянному поддержанию актуального зрительного поля. Хорошим примером такой деятельности является игра в настольный теннис. Итак, принимаем, что основной задачей зрительной системы яв¬ ляется создание и поддержание сенсорной модели текущего предмет¬ ного окружения, которая выступает в нашем сознании как актуаль¬ ное зрительное поле. Как мы отметиди, имеется несколько аспек¬ тов отношения зрительной системы к актуальному зрительному по¬ лю. Следовательно, зрительное восприятие субъективно должно выс¬ тупать как многоплановое явление. С одной стороны, зрительное восприятие должно представлять собой единичный акт, проявляющийся в момент формирования сенсор¬ ной модели окружения. На этом этапе актуальное зрительное поле выступает как целостный образ реального окружения, возникающий после открывания глаз насоздающий субъективное переживание вйде- ния. В соответствии с ’’нулевой задачей” зрительного анализатора, которая может меняться в зависимости от общего состояния орга¬ низма (а также по мере роста и совершенствования механизмов зри¬ тельной системы), форма существования актуального зрительного по¬ ля конкретна, и в акте восприятия окружение выступает в нашем 272
сознании как структура, наполненная не только объектами вообще, а объектами определенных классов, знакомыми объектами, объектами, обладающими вполне конкретными качествами. С другой стороны, текущая задача организма формирует перед зрительной системой стратегию анализа актуальной сенсорной моде¬ ли, в результате чего зрительное восприятие тут же разворачива¬ ется как процесс активного анализа содержания актуального зритель¬ ного поля. На этом этапе зрительное восприятие может выступать как активное предметное действие. Такие же качества зрения должны проявляться при восприятии отдельного объекта. Обратимся снова к вопросу об основной функции зрительной системы. С этой целью рассмотрим качества и свойства актуального зрительного поля, как они выступают в субъективном феномене ви¬ дения. Это позволит нам перечислить еще ряд важных свойств акту¬ ального зрительного поля и определить понятие зрительного восприя¬ тия. ОСНОВНАЯ ФУНКЦИЯ ЗРИТЕЛЬНОЙ СИСТЕМЫ Из своего зрительного опыта человек знает, что в нашем физи¬ ческом макроокружении он видит все, что отражается в световом потоке: объекты, их форму, цвет, качество поверхностей и их трех¬ мерные характеристики, положение объектов относительно него и других объектов, источники освещения, их цветовые и, если возмож¬ но, пространственные характеристики. Мы видим, как объекты дви¬ жутся, меняются по своим внешним физическим характеристикам, об¬ разуются или распадаются. Но, выходя за рамки нашего личного опыта, можно также определить, чего же мы в обычных условиях не видим, хотя это тоже есть свойство объектов нашего макроокружения. Не замечаем, например, как наши глаза движутся, в частности как они совершают быстрые скачки по горизонтали, вертикали или вокруг оси взора, и не видим, что изображения окружающего нас мира беспрестанно перемещаются по сетчаткам двух глаз. Мы не воспри¬ нимаем, как меняется в широком диапазоне отраженный от поверхнос¬ тей объектов свет по своим силовым и спектральным характеристи¬ кам. Вместо всего этого мы видим окраску поверхностей объектов, стабильное предметное окружение во всех подробностях внешних предметных характеристик. Совершенно ясно, что у зрительной системы есть все возмож¬ ности, чтобы человек эти изменения воспринимал, и, более того, можно создать условия, при которых человек будет все это в той или иной мере видеть. Однако в обычных условиях этого не происходит. Следовательно, зрительная система в обычных условиях строго ориентирована на выполнение определенной задачи или круга задач и не занимается решением задач, которые не записаны в ее ’’техничес¬ кое задание”. Можно сказать, что с помощью зрения субъект должен видеть все, что касается свойств окружающих нас объектов, отраженных в свете или даже непосредственно не отраженных с помощью света (нап- 18. Зак. 1668 273
ример, шероховатость объектов), и не должен замечать все то, что не связано со свойствами или поведением объектов. Эта особенность зрительной функции и определяет основное свойство зрительного восприятия, его предметность, которому мы будем придавать важное значение. Кроме того, что человек зрительно фиксирует все изменения, происходящие с объектами, одновременно с этим и даже вопреки этому он в чрезвычайно широких условиях наблюдения умеет узна¬ вать объекты, т.е. идентифицировать их и классифицировать. Это зна¬ чит, что мы признаем отдельный объект за один и тот же, если ви¬ дели его раньше, или узнаем его как представителя определенного класса объектов. При этом зрительная система не накладывает в обычных условиях никаких видимых ограничений на изменчивость изображений объектов и самих объектов, вплоть до того, что у объектов могут измениться казалось бы все важные характеристики или же он может быть практически невидим (например, почти скрыт за другими объектами). Талсим образом, зрительная система может одновременно регист¬ рировать все вариации, происходящие с объектом и все его особен¬ ности, и в то же время отображать объект инвариантно, на основе чего узнавать его и классифицировать. Эту функцию зрительной системы принято называть зрительным восприятием. Будем полагать, что все эти задачи решаются еще до того, как к зрительному восприятию подключается интеллект, хотя ясно, что на некотором этапе зрительной деятельности границу меж¬ ду ними провести очень сложно. Таким образом, зрительное восприятие должно объединять в се¬ бе следующие операции: выделение объекта, его классификацию, уз¬ навание и ’’видение”. Вопрос о том, как эти моменты деятельности зрительного восприятия распределены во времени и в каких отноше¬ ниях находятся между собой по функциональной подчиненности, явля¬ ется важным и требует ответа. Чтобы перейти к более законченной формулировке функции зритель¬ ной системы, необходимо коснуться еще одного уровня отражения внешнего мира — уровня зрительных представлении. Йз собственно¬ го опыта человек знает, что в отсутствие актуальных зрительных стимулов можно манипулировать или взаимодействовать с вообра¬ жаемыми зрительными объектами. Причем так же, как при зрительном восприятии, это могут быть объекты самого разного уровня обобще¬ ния и даже абстракции. Мы способны эти объекты преобразовывать, перемещать и расчленять, перемещаться между ними и т.д. Ясно, что все это возможно благодаря зрительной памяти на пространствен¬ ные события, и, следовательно.^должны существовать отдельные еди¬ ницы памяти, эквивалентные в каком-то смысле единицам нашего макроокружения — объектам. Один из типов таких единиц будем назы¬ вать сенсорными моделями объектов. Конечно, следуёт^ГредпоТПтйсить, что и в присутствии реальных зрительных стимулов механизм зрительных представлений также актив¬ 274
но включен в процесс зрительного восприятия. Если бы мы отвергли эту точку зрения, то не смогли бы объяснить ни того, как человек узнает каждый конкретный объект, находящийся в зрительном поле, ии того, как удается за неуловимые отрезки времени предсказать даль¬ нейший ход зрительных событий, точно так, как мы это умеем орга¬ низовывать, оперируя с объектами зрительных представлений. Субъек¬ тивно же человек не замечает участия зрительных представлений в актуальном восприятий, видимо, потому, что поток реальных зритель¬ ных стимулов выступает в нашем сознании в процессе восприятия на “Первое место. “'Подводя итог, можно сформулировать задачу, решаемую зритель¬ ной системой, или основную функцию зрительного восприятия следу¬ ющим образом. Основная функция зрительной системы состоит в формировании и поддержании сенсорной модели предметного окружения (выступающей ^“’нашем сознании как актуальное зрительное поле), на основе кото¬ рой осуществляется представление объектов внешнего мира во всех цодробност^х их зрительных характеристик и свойств, отраженных в световом потоке, а также одновременное узнавание объектов и классов объектов в широком диапазоне меняющихся условий наблю¬ дений. Основой этой деятельности является механизм зрительных представлений, который базируется на иерархически организованной системе сенсорных моделей объектов, классов объектов, обстановок STситуаций разного уровня обобщения. Таким образом, зрительное восприятие следует рассматривать как самостоятельный “этап деятельности -входной сенсорной системы ^Ирзга. На этом этапе осуществляется организация входной зритель- ной информации в форму, оптимально пригодную для использования ge_ в дальнейшей деятельности организма в предметном мире. Резуль¬ тат функционирования зрительного восприятия фиксируется в его конеч¬ ном продукте — актуальном зрительном поле. Участвующий в создании актуального зрительного поля гештальт- , механизм имеет для деятельности зрительной системы важное значе- гние в ’’процедурном” отношении. Осуществляя структурирование ак- | туального зрительного поля, тем самым разбивая мощный параллель¬ ный поток входной зрительной информации на отдельные самостоятель¬ ные блоки — объекты, этот механизм организует работу системы целе- полагания, призванной согласовать два уровня функционирования зри¬ тельной системы: параллельного синтеза актуального зрительного по¬ ля и его последовательного перцепторного анализа. Эту функционально содержательную формулировку задачи зритель¬ ной системы будем считать основополагающей в дальнейшем и для задачи, решаемой искусственной зрительной системой высокого уров¬ ня. Отметим, что в литературе по моделированию зрительной функции на ЭВМ задача зрительной системы нередко формулируется как клас¬ сификация состояний входного растра, распознавание изображений, распознавание зрительных образов и т.п., что, по нашему мнению, создает искаженное представление о сущности зрительного процесса. 275
ФУНКЦИОНАЛЬНАЯ СТРУКТУРА ЗРИТЕЛЬНОГО ПРОЦЕССА Перейдем теперь к вопросу о функциональной структуре зритель¬ ного процесса. Рассмотрим, какие функционально значимые операции над входными изображениями на сетчатках глаз и в какой последова¬ тельности должны совершаться в зрительной системе для получения ’’конечного продукта” и его дальнейшего использования и какие ме¬ ханизмы и процедуры ответственны за проявление известных функци¬ ональных свойств зрения. Хотя предлагаемая модель зрительного процесса как совокупнос¬ ти функциональных блоков, безусловно, базируется на имеющихся экспериментальных данных, найти строгое обоснование их необходи¬ мости экспериментально вряд ли возможно: всякое такое обоснование опирается на интерпретацию фактов, а она зависит, в свою очередь, от общего представления о функциональной организации. Главное назначение предлагаемой модели — описать, каким пу¬ тем в зрительной системе формируется представление отдельного объекта или его зрительный образ и как это представление исполь¬ зуется в дальнейшей ее деятельности. Уровень описания модели достаточен для понимания лишь самых общих принципов организации зрительной системы без конкретных подробностей вычислительных операций. Этот уровень описания можно назвать функциональным, а не алгоритмическим. В нем главное — установить иерархию последовательных блоков системы и выяснить смысл результатов их деятельности, их значение в общей схеме функционирования системы. Будем выделять в зрительной системе следующие основные структурно-функциональные блоки, соответствующие качественно различным этапам зрительного процесса: рецепторный анализ изоб¬ ражения, локальный сенсорный синтез, непредметные механизмы инвариантности, гештальт-синтез сенсорных моделей объектов, пред¬ метные механизмы инвариантности, перцепторный анализ, перцептор- ный синтез (рис. 2). Зрительный процесс начинается с проецирования оптического изображения окружающей обстановки на поле фоторецепторов. Это¬ му моменту предшествует важный процесс образования оптической копии предметного окружения — возмущенного волнового оптичес¬ кого поля. В оптической копии не теряется информация о содер¬ жании физического окружения, состоящего из отражающих и прелом¬ ляющих поверхностей объектов, однако происходит исчезновение его предметной структуры. Предметная структура окружения определяется существованием квазинезависимых целостных образований — физических объектов, носителей определенных физических свойств. Целостность объектов и независимость их гарантируется тем, что энергия взаимодействия частей и элементов внутри объекта намного превосходит энергию взаимодействий объектов между собой. Это и определяет гетероген¬ ность физического окружения в разных точках, которое в оптичес¬ кой копии становится физически гомогенным. Заметим, Что механизм 276
ПРЕДМЕТНЫЙ МИР Рис^ выделения объекта позволяет зрительной системе самой синтезировать и чисто зрительный объект, несущий лишь внешние характеристики физического объекта, но таковым не являющийся. Голографическое восстановление возмущенного волнового фрон¬ та позволяет точно восстановить граничное состояние его в момент отражения от поверхности объектов, что и подтверждает вывод о сохранении в световой копии всей информации. Однако голографи¬ ческое восстановление волнового фронта не решает проблем зрения, так как при этом не происходит восстановления предметной струк¬ туры физического окружения, а следовательно, и нет возможности проводить зрительный анализ предметной обстановки. Для того чтобы процесс восстановления или, вернее, построения предметной структуры мог быть осуществлен, на поле фоторецепторов происходит разложение изображения на отдельные возбужденные точки мозаики фоторецепторов. Это разложение представляет собой предель¬ но возможный для системы точечный анализ входного изображения — рецепторный анализ. С одной стороны, он обеспечивает потенциаль¬ ную возможность последующего предметного анализа окружающей обстановки на большую глубину, ибо на следующих этапах системы более детального и подробного анализа уже невозможно осуществить. С другой — на этапе рецепторного анализа, взятом в изолированном виде, также отсутствует предметная структура, так как не установ¬ лена принадлежность двух произвольных точек изображения одному и тому же или различным объектам. Отсутствие предметной структуры в поле рецепторов приводит к необходимости использовать для ее создания определенный набор механизмов и дополнительных источников информации (таких, как структурная организация самой рецепторной поверхности, фиксаци¬ онный рефлекс, временной анализ пространственной ситуации, бино¬ 277
кулярное зрение, память, тактильная и постуральная чувствительность и праксис и др.). И вся дальнейшая деятельность зрительной систе¬ мы состоит в поэтапном восстановлении ’’утерянной” в оптической копии и рецепторном анализе предметной структуры. Зрительный процесс с этой точки зрения следует разбить на два принципиально различающихся функциональных уровня. На пер¬ вом осуществляется поэтапный синтез предметной структуры, закан¬ чивающийся формированием (возбуждением) сенсорных моделей объектов и формированием актуального зрительного поля. В предло¬ женной схеме этот функциональный уровень охватывает три следую¬ щих после рецепторного анализа блока системы (см. рис. 2). На вто¬ ром уровне происходит в определенном отношении обратный процесс. Он представляет собой новый анализ синтезированной предметной структуры зрительного потока в соответствии с решаемой задачей и ведет к переописанию предметной структуры (обстановки), уже отра¬ женной в системе в виде вписанных в сенсорную модель предмет¬ ного окружения взаимодействующих сенсорных моделей, на языке пос¬ ледовательного предметного анализа. Это этапы перцепторного анали¬ за и перцепторного синтеза. Лишь на данном уровне появляются кате¬ гории ’’часть объекта”, ’’взаимное расположение частей”, а также вычислительно-измерительные операции, определяющие такие качества объектов, как размер, ориентация и т.п. Два основных уровня зрительной системы — допредметный и предметный — имеют существенно различающиеся механизмы функ¬ ционирования. Функции и значение механизмов допредметного уровня, имеющих очень мало внешних проявлений как для исследователя, так и для сознания субъекта, не были должным образом поняты и оценены создателями искусственных систем, моделирующих зрительную функ¬ цию. В то же время экспериментальные исследования этого уровня психологами гештальт-школы достаточно глубоки и содержательны. Правда, и они считали, что механизмы допредметного уровня явля¬ ются примитивными и просто организованными сенсорными действи¬ ями [11]. Напротив, уровень перцепторного анализа и синтеза имеет много внешних проявлений, например в ’’стратегии” движений глаз. Он бази¬ руется на последовательном описании предметно-структурирован¬ ного изображения и ответствен за организацию решения всех воз¬ никших перед наблюдателем зрительных задач. С перцепторного ана-' лиза и синтеза непосредственно начинается интеллектуально-логический уровень предметного анализа обстановки, выходящий уже за преде¬ лы функциональной структуры зрительной системы. Уровень перцеп¬ торного анализа и синтеза может быть в определенной степени про¬ моделирован на основе получившего большое ргкпространение струк¬ турно-лингвистического метода [21], который самостоятельно не может решать чисто зрительные задачи распознавания образов, опи¬ сания и анализа изображений и сцен, что убедительно демонстри¬ руется неНропсихологическими данными по зрительным агнозиям [22]. Используя терминологию психологов, можно сказать, что .спе¬ циалисты по разработке искусственной зрительной системы в боль- 278
шиистве своем оказываются не гештальтистами или холистами, а интуитивными ассоцианистами. В их представлении узнавание объек¬ тов опирается на комбинирование из некоторых элементарных приз¬ наков-ощущений образа объекта и представляет собой процесс пос¬ ледовательного описания объекта. В действительности же не распоз£ навание есть процесс последовательного описания, а описание и\ анализ изображений и сцен есть последовательный процесс иерархи¬ чески организованных узнаваний объектов, их частей и совокупнос¬ тей. Само же узнавание - это оригинальный процесс, механизмы ко¬ торого являются стимультанно-целостными, не последовательными и не языковыми. Локальный сенсорный синтез. Процесс создания предметной структуры актуального зрительного поля начинается с этапа локаль¬ ного сенсорного синтеза (см. рис.2). Функция этого этапа состоит в переописании мозаики возбуждения фоторецепторов (в бинокуляр¬ ной системе двух полей) в терминах локальных инвариантов предмет¬ ного мира: локальных характеристик формы, отражающих поверхнос¬ тей, движений объектов. Принципиальной особенностью переописания является полное сохранение пространственных отношений между ло¬ кальными инвариантами, в результате чего оно остается "изоморфным” оптическому изображению предметного окружения. В результате функционирования локального сенсорного синтеза в системе на основе двух неструктурированных полей возбужденных рецепторов возникают поля локально-инвариантно^ синтеза — носи¬ тели начальных локальных предметных структур. На каждом из этих полей сохраняются ’’изображения” лишь одного класса локальных ин¬ вариантов. Вся совокупность этих полей есть "локально-синтезирован¬ ное изображение” предметной обстановки. В качестве коррелятов локальных инвариантов предметного мира выделяются такие конфигурации и характеристики, как контуры, гра¬ ницы, ребра, нормали к поверхностям, текстуры, окраски, локальные характеристики движения. В соответствии с этим полями локального синтеза могут быть, например, поля ориентированных отрезков конту¬ ра, ориентированной кривизны, окрасок, ориентированной текстуры. Важным классом полей локального синтеза являются поля локальных движений, разделяющиеся по направлению, скорости и другим харак¬ теристикам. Выделение локальных предметных инвариантов осуществляется нейронами-операторами локального синтеза, выходы которых и обра¬ зуют эти поля. Такие нейроны получили название "детекторы приз¬ наков изображения”. Множество их образует многослойную и многока¬ нальную систему первичного анализа сетчаточного изображения [23— 27]. Для формирования локальных предметных инвариантов на этом уровне зрительной системы функционируют дополнительно к опера¬ торам локального сенсорного синтеза непредметные механизмы инва¬ риантности. Они представляют собой набор разнообразных процедур обработки входных сигналов, некоторые из которых осуществляются на основе горизонтального взаимодействия между элементами экран¬ 279
ных структур — полей локального синтеза. Можно выделить из группы непредметных механизмов инвариантности такие хорошо известные зрительные механизмы, как зрительная адаптация, механизм подчер¬ кивания контуров, выделение текстур, механизм цветовой констант¬ ности. Важным классом непредметных механизмов инвариантности явля¬ ются механизмы стабилизации зрительного поля, функционирующие в случае подвижной рецепторной поверхности, как это имеет место у человека, и формирующие внутри зрительной системы коистантный зрительный экран [12]. Деятельность этого класса механизмов инвариантности с очевид¬ ностью проявляется в опытах со зрительным последовательным об¬ разом, о которых упоминалось выше. Механизмы стабилизации зри¬ тельного поля выполняют в зрительной системе компенсаторную функцию, осуществляя преобразования зрительной информации, экви¬ валентные группе проективных преобразований в трехмерном прост¬ ранстве и обратные тем оптическим преобразованиям, которые реали¬ зуются в сетчаточных изображениях при движении наблюдателя. Имен¬ но в результате такой их деятельности актуальное зрительное поле становится стабильным. Следует подчеркнуть, что все непредметные механизмы инвариантности носят экранный характер, так ка к осущест¬ вляют поточечное отображение поля возбужденных фоторецепторов, и все работают по принципу компенсации [28—30]. Заметим, что если бы актуальное зрительное поле формировалось только механизмами локального сенсорного синтеза и непредметны¬ ми механизмами инвариантности, то человек субъективно восприни¬ мал бы константно окрашенные и стабильные относительно него по¬ верхности, обладающие всеми локальными пространственными харак¬ теристиками, но не разделенные на изолированные объекты В таком случае зрительная система не обладала бы еще одной чрезвычайно важной способностью — отображать предметную сторону динамики событий, происходящих в зрительном поле в результате движений объектов. В зрительной системе человека, в которой тонкость и разнообра¬ зие локального синтеза по полю сетчатки сильно неоднородны, роль механизма стабилизации зрительного поля особенно важна в том отношении, что позволяет в процессе движения глаз и переме¬ щения центральной ямки сетчатки (фовеа), обладающей предельным рецепторным анализом и локальным сенсорным синтезом, обеспечи¬ вать актуальное зрительное поле важной дополнительной информацией, детализирующей состояние объектов. Этап локального сенсорного синтеза в той или иной форме при¬ сутствует в разных вариантах искусственных систем зрения — так называемый уровень выделения признаков изображения (feature ex¬ traction). На этом этапе, правда, не всегда выделяются лишь ло¬ кальные характеристики, в то время как с позиции обсуждаемой модели первичный этап обработки входных изображений с необходи¬ мостью должен иметь дело с локальными предметно-инвариантными характеристиками. Кроме того, поскольку в искусственных системах 280
распознавания цель этапа локального сенсорного синтеза — формиро¬ вание числовых характеристик изображения объекта в виде вектора признаков, постольку поля локального синтеза фактически являются виртуальными образованиями и в них нет необходимости на следую¬ щих уровнях системы (заменяются намного более компактным вари¬ антом описания). В большинстве случаев, как показала практика, вместе с приобретением на этом уровне компактности описания вход¬ ного изображения система теряет способность к выполнению своей ос¬ новной функции — инвариантному узнаванию или классификации дос¬ таточно широкого класса изображений, что можно объяснить поте¬ рей существенной части информации об объектах. Этап локального сенсорного синтеза в наибольшей степени оп¬ ределяет различительные возможности зрительной системы. Чем бо¬ лее разнообразен набор полей сенсорного синтеза, тем более тонкие различия между объектами или классами объектов могут быть выяв¬ лены и участвуют в узнавании, описании, классификации. С другой стороны, увеличение мощност-и локального сенсорного синтеза должно приводить на следующем этапе функционирования зрительной системы к проблеме использования этого материала для обобщения внутри класса и выбора различительных признаков для описания классов. Такие задачи решаются в блоках гештальт-синтеза и перцепторного анализа в несколько этапов. Гештальт-синтез. Этот этап функционирования зрительной систе¬ мы следует обсудить более детально, потому что он несет важн^- шую функциональную нагрузку. Внутренняя организация и механиз¬ мы гештальт-синтеза в основном определяют феноменальные свойства Зрительного восприятия, такие, как предметность, целостность, струк- <_-1урность, константность. Основная функция гештальт-синтеза состоит в формировании ин¬ формационных структур, названных сенсорными моделями объектов, и.оперировании этими структурами. Системная организация сенсор¬ ных моделей определяет, с одной стороны, феноменологию восприятия отдельного объекта, а с другой — содержание и форму существова¬ ния актуального зрительного поля. По своей внутренней организации сенсорные модели объектов (классов объектов) подобны локально-сйнтезированному изображению одного объекта или одного класса объектов. Во внутренней струк¬ туре сенсорных моделей отражены все присущие данному объекту и присутствующие на полях локального синтеза локальные инварианты изображения объекта и все пространственные отношения между ними, что достигается сохранением с нужной степенью точности ’’изображе¬ ния объекта”, на котором запечатлено взаимное расположение элемен¬ тов-инвариантов. Таким образом, хотя локальные структурные особенности объекта присутствуют в сенсорной модели в явном виде и кодируются номером канала детекторов, а пространственные отношения между структур¬ ными особенностями полностью сохранены, все записанные в сенсор¬ ной модели характеристики объекта остаются в скрытом виде, в ре¬ зультате чего сенсорная модель и является ’’изоморфной” объекту. 281
В результате сенсорная модель объекта как информационная струк¬ тура представляет собой избыточное для каждой конкретной зада¬ чи классификации или узнавания, но тем не менее необходимое для всего множества потенциально возможных зрительных задач ’’описа¬ ние” объекта. Здесь уместно еще раз коснуться вопроса о задачах, решаемых зрительной системой. Основная из них состоит не в разбиении объек¬ тов на классы, а в обнаружении и узнавании отдельного объекта на / фоне. При этом фон выступает, с одной стороны, как объект другого класса, а с другой — как шум, характеристики которого определяются его организацией и который очень редко бывает случай¬ ным. Из-за огромного разнообразия характеристик фона-шума, которые порой бывают очень близки к характеристикам объекта, обнаруже¬ ние и узнавание последнего становится задачей, намного более слож¬ ной, чем классификация выделенного из окружения узнанного или неузнанного объекта. Именно для решения этой сложной задачи требуется избыточность описания, заложенная в сенсорной модели объекта. Кроме того, фон как совокупность потенциальных объектов, каждый из которых может превратиться в актуальный, к моменту возникно¬ вения задачи выделения и узнавания объекта не может быть формализован, и потому система должна быть готова к встрече с задачей любой сложности, в частности и к тому, что объект в значительной мере закрыт фоном. При этом сам по себе объект бывает весьма прост и легко формализуем и, казалось бы, требует самого несложного описания. / К уровню гештальт-синтеза относятся чрезвычайно важные пред¬ метные механизмы инвариантности (см. рис. 2), основная функция которых — обеспечить инвариантное представление каждого отдель¬ ного объекта независимо от изменений его сетчаточных изображе¬ ний, вызванных как движениями в пространстве, так и внутренними изменениями объекта. В результате деятельности этих механизмов „сенсорные модели приобретают широкий класс инвариантностей. , Предметные механизмы инвариантности отличаются от непредмет¬ ных прежде всего огромным набором используемых средств преобра¬ зования изображения, необходимых для инвариантного отображения и определяемых большим разнообразием классов собственных внутрен¬ них движений объектов как нежестких образований. Кроме того, эти механизмы являются локально-экранными, обладающими возмож¬ ностью функционировать в ограниченных областях зрительного поля. Это осуществляется благодаря тесной связи предметных механизмов инвариантности с механизмом предметного структурирования актуаль¬ ного зрительного поля. Одно из важных назначений предметных механизмов инвариант- ноеттГ'сос’гоит в том, что они обслуживают механизм отображения нелокальных динамических событий, определяемых перемещением объектов в пространстве и их собственными внутренними движениями как событий предметно организованных. Так же как на основе 282
локального синтеза предметных инвариантов в блоке гештальт- синтеза формируются модели нелокальных предметных образований — объектов, на основе предметных механизмов инвариантности синте¬ зируются нелокальные динамические структуры предметных движений, которые можно назвать динамическими гештальтами. Поэтому в отли¬ чие от непредметных предметные механизмы не являются компенса¬ ционными и их функционирование не сопровождается исчезновением пространственно-временнбй динамики в актуальном зрительном поле. В этой связи следует особо подчеркнуть организующую роль меха¬ низма предметного структурирования в процессе отображения в зри¬ тельном восприятии локальной динамики зрительного поля. В совокуп¬ ности же эти механизмы организуют динамические сенсорные модели объектов. Экспериментально деятельность некоторого класса предметных механизмов инвариантности была выявлена в психологических опытах на испытуемых, у которых сетчаточные изображения переворачивались или другим образом преобразовывались на длительное время с по¬ мощью постоянно носимых призматических очков. В этих условиях нередко возникали ситуации, когда закономерные трансформации происходили с одним избранным объектом и не распространялись на все поле зрения [28—30]. На нейрофизиологическом языке сенсорную модель объекта можно описать в упрощенном виде как нейрон-сумматор с модифицируемым порогом, обладающий собственной оригинальной конфигурацией свя¬ зей со всеми полями локального синтеза, которая модифицируется системой предметных механизмов инвариантности. Эти связи обра¬ зуют квазилокальное, т.е. компактное и ограниченное в пространстве поле связей с каждым полем локального синтеза.; ~ Состояние связей нейронов-сумматоров формируется в процессе обучения зрительной системы (гештальт-модель конкретного объекта) или же является врожденным. Можно сказать, что то описание объекта, которое содержится в структуре связей нейрона-сумматора, представляет собой статистически взвешенную пространственную структуру локальных инвариантов изображения объекта или класса объектов. Такая статистика структуры формируется в процессе знакомства и взаимодействия с объектом и определяется как объемом и содержанием класса объектов, так и особенностями пространственной динамики локальных инвариантов изображения каждого объекта. Кроме этого, в структуре сенсорной модели объекта могут быть ’’записаны” и некоторые статистические характеристики объектов дру¬ гих классов, связанных с данным через алфавит классов, фигу¬ рирующих в текущей задаче. Поскольку возбуждение нейрона-коррелята сенсорной модели осу¬ ществляется в результате воздействия входного потока сигналов с уровня локального сенсорного синтеза на поле связей оператора параллельным образом, без дополнительного анализа система не может определить, какие признаки объекта оказались решающими для узна¬ вания входной конфигурации как данного объекта. Это становится воз¬ можным лишь на следующем уровне, в блоке перцепторного анализа 283
на основе описания состояния всей иерархии участвующих в решении текущей задачи сенсорных моделей объектов с помощью специально¬ го, механизма анализа гештальта. Эта особенность определяет сущест¬ венное отличие понятий ’’сенсорная модель объекта” и ’’описание объекта” и тем самым феноменологию узнавания объекта — целое узнается ранее своих частей. Важным свойством нейрофизиологических механизмов, обслужива¬ ющих сенсорные модели объектов, является параллельность всех ин¬ формационных процессов, происходящих на уровне гештальт-синтеза. Это является необходимым условием для адекватного взаимодействия организма в масштабе реального времени с динамически и пространс¬ твенно сложным миром, когда требуется регистрировать одномомент- ность сосуществования определенных пространственных конфигураций- гештальтов. С подобной задачей не может справиться последователь¬ ный во времени просмотр состояния входного изображения по дереву признаков или графу описания. Поскольку в сенсорных моделях сохраняются для дальнейшего анализа все пространственные отношения между всеми локальными инвариантами и поскольку в условиях динамического внешнего мира это возможно лишь при параллельности процессов обработки инфор¬ мации, постольку не может существовать эквивалентное во всех отношениях описание той же ситуации на языке последовательного предметного анализа, т.е. на уровне структурно-лингвистическом. Праобразом структурно-лингвистического подхода при разработ¬ ке систем распознавания образов, описания и анализа изображений д сцен послужила интеллектуально-логическая деятельность человека, базирующаяся на языковом описании реального окружения, не являки7 щимся ни первичным, ни самостоятельным. Языковое описание обла¬ дает особенностями, ограничивающими его применение., Первая из них состоит в том, что при таком описании требуется выполнение специального условия: разделенности во времени описа¬ ния события и самого события. ^Это достигается за счет изменения масштаба времени описания по отношению к временному масштабу события. Именно такое условие позволяет с помощью последователь¬ ного языкового механизма описывать события, которые, вообще гово¬ ря, осуществляются параллельно во времени и пространстве. И только при выполнении этого условия языковое описание становится адекват¬ ным самому событию, т.е. его моделью. Вторая особенность языкового описания заключается в том, что для адекватного функционирования языковой модели требуется нали¬ чие информационной системы (внутреннего или внешнего исполнителя или слушателя), способной дешифровать языковое описание в симультан- но-функционирующую внутреннюю модель проблемной ситуации. Совершенно иная ситуация возникает, когда требуется описание ; явления в реальном масштабе времени. Такое ’’описание” должно опи¬ раться уже на другие механизмы отображения, реализованные в дан- I ной модели в блоке гештальт-синтеза. Мы полагаем, что описанием | рационально называть именно языковое отображение с теми свойства- \ ми, которые отмечены выше. Отображение в реальном масштабе време- 1 284
ии вряд ли стоит называть описанием, вследствие чего в тексте сло- во^описание” часто берется в кавычки. ^Такое неязыковое отображение должно быть не только эквива¬ лентно событию по пространственно-временной размерности, т.е. быть (3+1)-мерным, что требует пространственной структуры и дина¬ мической организации отображения, но, что особенно важно, должно быть симультанно многомерным по отображаемым качествам явления. А при параллельном отображении в реальном масштабе времени это дрё^ует огромного объема динамической памяти, материализованной в данной модели в наборе полей локального сенсорного синтеза и во "множестве сенсорных моделей. Все эти проблемы и решаются на уров- не~гёштальт-синтеза и начальных этапов перцепторного анализа при формировании структуры актуального зрительного поля, являющегося чрезвычайно многомерным образованием: трехмерным в пространстве, ""локально-многоцветным, многотекстурным, многопредметным и ло¬ кально-динамичным. Необходимо ясно представлять, что на уровне гештальт-синтеза в арсенале зрительной системы имеется огромное количество сенсор¬ ных моделей объектов, их частей и классов самого разного объема и содержания. Среди них сосуществуют как возникшие в процессе обучения (общего и длительного или частного и кратковременного, предназначенного для решения текущей задачи со значительно огра¬ ниченным алфавитом классов) гештальт-модели совершенно конкрет¬ ных объектов, так и частично заложенные от рождения модели’’объекта вообще”, объекта данного класса, частей объектов как самостоятель¬ ных элементов мира. Следует подчеркнуть, что в своем неупрощенном виде сенсорные модели должны являться динамическими образованиями, изоморфны¬ ми трехмерным объектам с чрезвычайно сложными динамическими свя¬ зями через предметные и непредметные механизмы инвариантности с полями локального синтеза. Особый класс представляют собой сенсорные модели ’’объекта во¬ обще” — предельно обобщенный вариант сенсорной модели объекта. Этот класс сенсорных моделей базируется на синтезе самых общих локальных характеристик объектов, таких, как особенности локаль¬ ной ориентации контуров и градиентных свойств поверхностей и груп¬ пирования элементов локального сенсорного синтеза в ограниченном объеме, цветовые и интенсивностные однородности поверхности объек¬ та и т.п. []1]. Именно этот класс сенсорных моделей ответст¬ вен за первичную структурированность зрительного поля, за феномен фигура—фон. Структурирующая функция сенсорных моделей этого класса авто¬ матически приводит к тому, что любая конфигурация возбуждения на . входе разбивается на области — части, рассматриваемые как реаль¬ ные объекты. Последующее описание этих участков осуществляется в блоке перцепторного анализа (см. рис. 2) под управлением механиз¬ ма анализа сенсорных моделей. Так в зрительном восприятии форми¬ руются оперативные единицы восприятия, которые субъективно высту¬ пают как целостные физические объекты, хотя могут являться лишь 285
зрительными объектами. В этот класс попадают стая птиц, созвездия, “куча листьев, крона дерева, пятна и группы элементов графическо- го-изображения и многое, многое другое. Все такие физические образования не обладают физической целос¬ тностью, как ее определили выше, но по своим внешним зрительным характеристикам укладываются в структуру потенциального объекта. Айоскольку отображение предметного окружения проходит через ста¬ дию оптического изображения, постольку и любая чисто изобрази¬ тельная конфигурация, физически являющаяся, например, лишь рас¬ крашенным листом бумаги или освещенной цветовыми пятнами поверх¬ ностью, превращается в поле взаимодействующих объектов благода¬ ря структурирующей функции этапа гештальт-синтеза. Вся система сенсорных моделей объектов, представляющая собой память уровня гештальт-синтеза, обладает большой (даже трудно оцениваемой) информационной емкостью. Между сенсорными моде¬ лями существуют заложенные ранее или возникшие в процессе взаимо¬ действия с миром объектов иерархические отношения, закладывающие основу будущего структурно-языкового механизма зрительного ана¬ лиза внешнего окружения. На языке современной информатики можно сказать, что вся струк¬ тура' уровня гештальт-синтеза представляет собой асинхронную де¬ централизованную сеть спецпроцессоров с квазилокальной стати¬ ческой и локальной динамической иерархией. В качестве спецпроцес¬ соров здесь выступают сенсорные модели объектов со своей памятью, операционной системой предметных механизмов инвариантности и вы¬ числительным блоком обработки входных данных. Динамический компонент иерархических связей модифицируется уровнем супервизо¬ ров (в частности, ассоциативными моделями объектов и обстановок) блока перцепторного анализа, через который осуществляет свою управляющую функцию система целеполагания. В результате совместной деятельности механизмов четырех об¬ суждаемых этапов зрительного процесса в системе на уровне геш¬ тальт-синтеза возникает сенсорная модель актуального зрительного окружения. Субъективно это есть то трехмерное зрительное предмет¬ ное поле, которое человек видит, когда открывает глаза. Создание и поддержание на время, пока открыты глаза челове¬ ка, сенсорной модели зрительного окружения является единствен¬ ной чисто зрительной задачей. Существование этой модели пережи¬ вается субъектом как акт видения, в первоначальном своем состо¬ янии не дифференцированный и отличающийся от акта узнавания, классификации, описания и т.п. Именно это состояние ^видения в отсутствие какого-либо целевого перцепторного анализа соответ¬ ствует состоянию ’’смотреть рассеянным взглядом”. Таким образом, под видением можно понимать субъективное переживание факта воз¬ никновения и существования актуальной сенсорной модели зритель¬ ного окружения и потенциальной возможности ее перцепторного пред¬ метного анализа, которая в текущий момент может и не реализовываться. Требуется хоть кратко обсудить генезис сенсорных моделей объектов. Заметим, что у зрительного анализатора нет ’’учителя”, который мог бы 286
указать, где расположен объект, описать, как он выглядит, или предъявить его на чистом фоне. Если человек берет предмет в ру¬ ки и тем самым выделяет его из пространства, это не соответствует "указанию” на объект, так как, во-первых, человек умеет точно брать предмет именно благодаря способности зрительной системы его выде¬ лить. Кроме того, в этом случае по-прежнему нет никаких внешних для зрительной системы указаний, как на мозаике возбужденных фо¬ торецепторов найти границы объекта и участки мозаики фоторецеп¬ торов, относящиеся в его изображению. Никто не заботится в жизни также о правильной организации обу¬ чающей выборки. Напротив, зрительной системе ребенка сразу при¬ ходится иметь дело со всей сложностью предметного окружения, в которой предметы движутся и показывают разные свои стороны, пре¬ терпевают собственные внутренние преобразования и заслоняют друг друга. В дополнение к этому сами рецепторные поверхности переме¬ щаются в пространстве, преобразуя оптическое изображение окруже¬ ния. В таких условиях лишь внутренние, безусловно, врожденные механизмы самообучения, присущие самой зрительной системе, могут способствовать формированию сенсорных моделей отдельных объектов и всей обстановки. Эти механизмы должны использовать, в частности, сенсорные модели ’’объекта вообще” и ’’объекта данного класса”, ор¬ ганизующие фиксационный рефлекс, выделение объекта из фона и многое другое. Возникновение сенсорной модели конкретного объекта можно рассматривать как процесс заполнения подготовленной от рож¬ дения структуры сенсорной модели объекта вообще или объекта дан¬ ного класса конкретным содержанием локально-синтезированного изоб¬ ражения объекта и запоминание таким образом организованного со¬ держания в памяти блока гештальт-синтеза. Можно думать, что по мере формирования всего множества сен¬ сорных моделей конкретных объектов и классов объектов процесс обучения новым классам существенно модифицируется, что в одних случаях приводит к почти мгновенному обучению, а в других, напротив, к существенным затруднениям и замедлению этого процесса. Перцепторный анализ и синтез. На этапе перцепторного анализа (см, рис. 2) разворачивается новая деятельность зрительной сис¬ темы., назначение которой — описать уже отраженные в зритель¬ ной памяти (на основе пространственно-временной организации всей совокупности активированных в данный момент сенсорных моделей) свойства и взаимодействия объектов на языке последовательного предметного анализа. На этом этапе зрительная система и стано¬ вится зрительным анализатором — анализатором предметных отноше¬ ний, в предметном мире. Такое переописание (по существу, первое •предметное описание зрительного поля) всегда целенаправленно, так как, во-первых, Предназначено для решения конкретной задачи, и, во-вторых, осуществляется механизмом перцепторного анализа, способ¬ ным работать лишь последовательно под управлением системы це- леполагания (см. рис. 2). Этапы гештальт-синтеза и перцепторного анализа существенно отличаются друг от друга в отношении своего конечного продукта.- 287
Продукт гештальт-синтеза — одна единственная сенсорная модель окружения, формированием которой и заканчивается функционирова¬ ние этого этапа. Оно завершается за очень короткое время, в обыч¬ ных условиях — в момент открывания глаз. Перцепторный анализ беспределен по глубине и разнообразию, он последователен и целе¬ направлен' И каждый раз продукт его деятельности определяется задачей,'’ поставленной системой целеполагания, и, по существу, оформляется как продукт лишь на этапе перцепторного синтеза. На_этапе перцепторного анализа возникают все измерительные операции с предметами, появляются свойства и качества предметов, представленные в нашем сознании и описываемые языком. Именно эта цредметно-анализаторная деятельность этапа перцепторного анализа позволяет при изучении зрительного восприятия вычленять такие его стороны, как восприятие формы, восприятие движения, восприятие цвета, даже еще более частные: восприятие контуров, углов, длины, глубины и т.п. При таком членении, конечно, теряется целостный ха¬ рактер функционирования основного механизма зрительного восприя¬ тия и конкретные формы проявления перцепторного анализа приобре¬ тают как бы самостоятельный характер. Заметим также, что вся условно-рефлекторная деятельность орга¬ низма, связанная со зрительными условными стимулами, также опи¬ рается лишь на предметный уровень отображения. Никакой элемент изображений на сетчатке глаза животного не может быть стимулом — источником условно-рефлекторного сигнала хотя бы потому, что пос¬ тоянно перемещается по ней. Отсюда следует, что с помощью условно- рефлекторной методики нельзя выявить работу допредметных меха¬ низмов зрительного восприятия. Важно отметить, что функционирование механизмов перцепторно- го анализа происходит по двум параллельным путям. На первом осу- “ществляется анализ внутреннего содержания включенных в решение текущей задачи сенсорных моделей и состояния обслуживающих их предметных механизмов инвариантности, приводящий, в частности, к выделению существенного и несущественного для данной задачи в свойствах анализируемых объектов. Результатом этого является воз¬ никновение многих феноменов зрительного предсказания: способности достраивать или ’’домысливать” несуществующие или закрытые от наб¬ людателя части объектов, видеть контуры объектов там, где они час¬ тично отсутствуют, и т.п. Отметим, что и сам акт включения в процедуру решения задачи тех или иных классов сенсорных моделей объектов осуществляется не только с помощью ’’потока данных”, но также и через организую¬ щее влияние блока перцепторного анализа на систему сенсорных мо¬ делей путем активации или торможения соответствующих групп их и классов. На jrropoM пути происходит дополнительный анализ состояния полей локального синтеза, модифицируемый результатами анализа внутреннего содержания включенных в решение текущей задачи сенсор¬ ных моделей объектов и связей между ними. Следует подчеркнуть неравноправное отношение между двумя 288
путями перцепторного анализа: при решении каждой конкретной зада- чзГведущим является процесс анализа внутреннего содержания сенсор- ньпГмоделей, который выступает в качестве ’’руководителя”, под¬ сказывающего стратегию решения задачи и способы использования' наличного допредметного зрительного материала^щредставленного ' йа полях локального синтеза. Здесь сенсорные модели объектов выс¬ тупают как фреймы, как внутренняя основа познания внешнего мира, ЧЯ55 в них материализованы свойства и отношения между элементами мира вещей. Это неравноправное отношение двух путей перцептор- нбго анализа является, как мы полагаем, главной стороной принципа гештальта, который кратко выражается так: часть подчиняется цело¬ му. ’^ВЦолее парадоксальной форме этот принцип звучит следующим образом: восприятие целого опережает восприятие его частей'/ Пара¬ доксальность этого известного принципа гештальт-психологии сни- —кцьется в данной схеме следующим образом: целое, т.е. объект, вы¬ деляется благодаря функционированию его сенсорной модели, син¬ тезировавшей образ объекта на основе формальных элементов его локально-синтезированного изображения — коррелятов предметных локальных инвариантов объекта. Активация сенсорной модели объекта определяет его узнавание, что влечет за собой, с одной стороны, активацию функционально связанных с ней сенсорных моделей частей объекта и соответственно переинтерпретацию всех или важнейших элементов изображения, которые теперь становятся функциональными частями объекта. Апеллируя к личному зрительному опыту, можно привести простые примеры, отчетливо демонстрирующие связь этих двух уровней ана¬ лизаторной деятельности: рассматривание картинки-загадки со спря¬ танными, например в ветвях дерева, человеческими и другими фигура¬ ми, а также видение их в скалах и иных богато структурированных образованиях и, наконец, рассматривание известного портрета двух _женщин. С) другой стороны, за более длительные промежутки времени и с другими временными параметрами, возможно, осуществляется обрат¬ ный процесс влияния результатов решения конкретных зрительных задач на структурную организацию сенсорных моделей объектов.'»., частей объектов блока гештальт-синтеза и связей между ними. . В единстве и связанности двух анализаторных процессов на выс¬ ших уровнях зрительной системы заключается трудность научного ащлиза зрительной деятельности мозга. v Можно выделить два основных класса задач, решаемых на уровне перцепторного анализа. Первая — исследование-анализ внутреннего состояния объекта. Решение ее основывается на раскрытии и описа- , нии внутреннего содержания сенсорной модели, состояния предметз, ных механизмов инвариантности и анализе локально-сйнтезирован- . ногб изображения объекта, представленного на полях локального, ^синтеза. При этом формируются алфавит частей объектов и структур- - но-лингвистические конструкции отношений'*между частями объектов. "“Синтез результатов решения задач этого класса на следующем 19. За к. 1668 289
этапе ведет к созданию перце птор н ы хм оде л е й объектов и далее к более абстракТн^ьШ ассоциативным моделям объектов. ■ .Другая^задача_на уровне перцепторного анализа состоит в описа¬ нии пространственных отношений между объектами. В ней сенсор¬ ные модели отдельных объектов выступают в большинстве случаев какГ~цёлостные образования. | Синтез результатов этой деятельности должен вести к возникновению перцепторных и ассоциативных моде- Яей^сйт^адшь_обстановок и прочих сложных предметно-пространствен- 'тгй'х’конфигураций. - На^йейрофизиологическом языке это означает, что перцепторная модель представляет собой значительно более сложную~неиронную „систему, чем сешюрна^модель. Перцепторная модель описывает объект как совокупность предметных частей, организованных в пространствен¬ ную динамическую конфигурацию. Она включает в себя иерархически связанные нейроны (сенсорные модели объектов и частей объектов) и формально напоминает струк¬ туру, в которой представлены элементы объекта в виде их ’’изобра¬ жений” (сенсорные модели частей объекта) и указаны в явном виде связи между ними. Здесь уже возникает элемент схемности. Особен¬ ность этой структуры состоит в том, что она реализуется таким же гештальт-механизмом, как и сенсорная модель объекта т.е. в целом сохраняет изоморфность изображению объекта. Однако струк¬ тура связей актуальной возбужденной модели модифицируется зада¬ чей-установкой и другими модификаторами. Ассоциативная модель объекта является более абстрактной струк- турЪй, больше напоминающей скелет-схему объекта, и имеет тесные связке языковым уровнем описания объекта. Такую модель часто вос¬ производит ребенок, когда, желая нарисовать непосредственно располо¬ женнойперед ним конкретный объект, изображает фактически схему его строения, в которой отражены главным образом связи jijipqct- ранственные отношения между элементами объёкта71Г~шГ свойства самих элементов. . На основании нейропсихологических данных можно заключить, что сенсорные и перцептбрные модели объектов объединяются в клас¬ сы в соответствии, видимо, с классом^бслуживающих их предмет¬ ных механизмов инвариантности. Последний определяется типом внут¬ ренних движений и изменений объектов, связанным с их,функциональ- ными и структурными особенностями. Например, существуют такие классы объектов, как лица, животные, растения, твердые тела (с боль¬ шим набором подразделов), графемы, цифры, рисунки и др. [22, 31]. Для некоторых видов внутренних движений и изменений объектов су¬ ществуют языковые эквиваленты, такие, как поза, выражение, почерк, ракурс, возраст и др. Этим самым они дают название классам пред¬ метных механизмов инвариантности. Благодаря функционированию иерархии сенсорных, перцепторных .и ассоциативных моделей объектовдГхброшо развитой и обученной системе зрительного восприятия объект единовременно представлен целым спектром моделей разного уровня обобщения и методов ор¬ ганизации ’’изображения” — от сенсорной модели объекта вообще и 290
объекта данного класса до сенсорной модели конкретного уникаль- йбго объекта и далее до перцепторных иасоэщ1ашвДЬ1х моделей раз- лйЧИЗго"урОТбШ обобщенияН* абстракциц., Все это в совокупности и ’ п^^стаЬЛЖТ~собой'зрйтеЖнь1Й образ объекта, определяет много мер- ’ jrocib н о сшибания в зрительной системе и делает научный анализ пред- ’ даетности зрительного восприятия чрезвычайно сложной задачей".' ^'’'''Операционная система блока перцепторного анализа содержит ог¬ ромный арсенал средств для зрительного анализа предметного ок-' ^тужёщия, включающий в себя такие операции, как сравнение, сопос¬ тавление, расчленение, синтез, прослеживание, формализованные (ти- 'пгГдвижения в трехмерном пространстве) и неформализованные (ти- "паИзменений позы, почерк и т.п.) преобразования сенсорных моделей объектов, их совокупностей и их частей, ^ На уровне перцепторного анализа и синтеза полностью развора¬ чивается зрительная а н ализаторная де яте ль нос ть мозга. Конечным результатом ее можно считать совокупность активированных в дан¬ ный и в ряд предшествующих моментов сенсорных, перцепторных и Ассоциативных моделей объектов, их частей и совокупностей-обста- нойок, включенных в модель проблемной ситуации, сформулирован- f "ной системой целеполагания. 4Тем самым реализуется подготовка внут- / "ренних информационных структур зрительной системы, необходимых^ для организации поведения в предметном окружении и функциониро¬ вания следующего за этим этапа логического или структурно-лингвис¬ тического анализа внешнего и внутреннего состояния объектов, эта¬ па, не являющегося уже зрительным. — Здесь перцепторный анализ впрямую стыкуется с уровнем мышле- и^яГ" именно являясь этапом визуального или образного мышления^ ’ [57 16 17, 32J И они полностью объединяются в случае, когда "ЯСТуальное дрйтельное поле исчезает и блок перцепторного анали¬ за, как об этом уже говорилось, начинает оперировать с сенсорными, перцепторными и ассоциативными моделями объектов, являющимися теперь элементами зрительных представлений. jHa более высоком абстрактном уровне те же по существу операции могут происходить ~ с обт^ктами-схемами, объектами-конструкциями, что непосредствен-^ . 'So становится процедурой образного мышления. \ \ '“ Это возможно до тех пор, пока объекты абстрактных классов по- / прежнему являются пространственно-временными целостными обра¬ зованиями. Однако можно пойти и дальше и утверждать, что сами понятия пространства и времени могут быть привнесены в природу ) объектов мышления, и тогда еще более абстрактные объекты стано- / вятся элементами операционной деятельности блоков перцепторного анализа и синтеза. В этот момент уже зрительное восприятие, зри- Д£льные представления итгбралнот“Мышл"ен"ие полностью стыкуются с__интеллектуально-логическим мышлением. Не хватает только язы¬ кового переописания решенной проблемной ситуации для внешнего изложения и внутреннего компактного запоминания. 291
* * * Конечно, столь краткое и схематичное изложение модели функ¬ циональной организации зрительного процесса оставило не только не решенным, но просто не упомянутым целый комплекс функциональ¬ ных и логических проблем, касающихся как отдельных подробностей организации, так и общих методологических вопросов. Например, остается неисчерпанной проблема субъективной визуализации сос¬ тояния и содержания зрительной образной памяти или совокупности сене орты х~ моделей объектов во всех режимах работы высших отделов зрительного анализатора. Безусловно, большинство высказанных поло¬ жений требует дальнейшей более глубокой смысловой детализации, а также экспериментальных и теоретических обоснований. Подводя итог весьма сжатому изложению столь сложной и широ¬ кой проблемы, хотелось бы подчеркнуть лишь два момента из мно¬ гих, требующих пояснений. Первый касается восприятия как самосто¬ ятельной функции мозга. Ясно, что на этапе восприятия осуществля¬ ется организация входной информации в форму, необходимую для всей дальнейшей деятельности мозга. Эта организация есть ’’опредме¬ чивание” входной информации. С высказанных здесь позиций предметное структурирование и создание актуального зрительного поля представляются необходимой операцией, согласующей два уровня функционирования зрительной системы — параллельный этап приема и первичной обработки вход¬ ного потока и последовательный этап анализа предметного окружения. Даже если бы в окружающем мире не было изолированных объектов, зрительная система должна была бы ’’изобрести” предметные струк¬ туры, разбивающие мощный входной параллельный поток на отдель¬ ные части — ’’объекты”. Ясно также, что создателям искусственной зрительной системы высокого уровня вопрос о подобной процедуре необходимо будет тем или иным способом решать. Второй момент относится к детализации принципа гештальта. Введенный еще в прошлом веке и выросший из понятия ’’качество фор¬ мы”, он наполнялся содержанием по мере изучения и анализа свойств, главным образом зрения. Теперь он включает в себя большой перечень свойств гештальта [33, 34]. В контексте предлагаемой структурно-функциональной схемы зри¬ тельной системы принцип гештальта можно свести к небольшому на¬ бору принципов организации системы сенсорных и перцепторных моделей объектов уровней гештальт-синтеза и перцепторных анали¬ за и синтеза. Это следующие принципы: организации сенсорной модели объекта; взаимодействия сенсорных моделей объекта и его частей; взаимодействия между моделями одного уровня обобщения; взаимодействия между моделями разного уровня обобщений; взаимодействия всей системы сенсорных моделей с уровнем перцепторного анализа и синтеза. Некоторые из этих принципов были разъяснены достаточно под¬ робно, другие только лишь упомянуты, и требуется еще определен¬ ная работа по приведению их в удовлетворительное согласие.
ЛИТЕРАТУРА 1. Веккер Л.М. Восприятие и основы его моделирования. Л.: Изд-во ЛГУ, 1964. 194 с. 2. Велииковский Б. М. Функциональная структура перцептивных процессов // Поз¬ навательные процессы: ощущения, восприятие. М.: Педагогика, 1982. С. 219—246. 3. Глезер В.Д. Механизмы опознания зрительных образов. М.; Л.: Наука, 1966. 204 с. 4. Розенблат Ф. Принципы иейродииамики. М.: Мир, 1965. 480 с. 5. Глезер В.Д. Зрение и мышление. Л.: Наука, 1985. 246 с. 6. Allport F.H. Theories of perception and the concept of structure. N.Y.: Wiley, 1955. 709 p. 7. Gibson J.J. The senses considered as perceptual systems. Boston: Houghton Mifflin, 1966. 329 p. 8.Koffka K. Principles of Gestalt psychology. N.Y.: Harcourt: Brace, 1935. 316 p. 9.Man D. Vision. San Francisco: Freeman, 1982. 380 p. 10. Анцыферова Л.И. Гештальт-психология 11 Современная психология в капита¬ листических странах. М.: Изд-во АН СССР, 1963. С. 90—146. 11. Вудворте Р.С. Экспериментальная психология. М.: Изд-во иностр. лит., 1950. 796 с. 12.Зенкин Г. М., Петров А. П. О механизмах константности зрительного восприя¬ тия пространства // Сенсорные системы. Л.: Наука, 1979. С. 25—39. 13. Тинберген Н. Поведение животных. М.: Мир, 1969. 260 с. 14. Пигарев И.П.. Зенкин Г.М.. Гирман С.В. Активность детекторов сетчатки ля¬ гушки в условиях свободного поведения // Физиол. жури. СССР им. И. М. Сеченова. 1971. Т.42. С. 1448—1453. 15. Гриффин Д. Эхо в жизни людей и животных. М.: Физматгиз, 1961. 365 с. 16. Арнхейм Р. Визуальное мышление // Хрестоматия по общей психологии: пси¬ хология мышления. М.: Изд-во МГУ, 1981. С.97—107. П. Грегори Р.Л. Разумный глаз. М.: Мир, 1972. С. 169—175. 18. Miller G.A. The magical number seven, plus or minus two // Psychol. Rev. 1956. Vol. 63. P. 81—97. 19. Сперлинг Д. Информация, получаемая при коротких зрительных предъявле¬ ниях // Инженерная психология за рубежом. М.: Прогресс, 1967. С.7—68. 20. Зинченко В.П., Велииковский Б.М., Вучетич Г.Г. Функциональная структура зрительной памяти. М.: Изд-во МГУ, 1980. 206 с. 21. Фу К. Структурные методы в распознавании образов. М.: Мир, 1977. 320 с. 22. Кок Е.П. Зрительные агнозии. Л.: Медицина, 1967. 224 с. 23. Леттвин Д., Матурана X., Пите У., Мак-Каллох У. Два замечания по поводу зрительной системы лягушки // Теория связи в сенсорных системах. М.: Мир, 1964. С.416—432. 24. Соколов Е.Н. Нейронные механизмы памяти и обучения. М.: Наука, 1981. 283 с. 25. Hubei D.H., WieseI T.N. Receptive fields of single neurones in the cat’s striate cortex // J. Physiol. (Gr. Brit.). 1959. Vol. 148. P. 574—591. 26. Hubei D.H., Wiesel T.N. Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex // J. Physiol. (Gr. Brit.). 1962. Vol. 160, P. 106—154. ll.Maturana H.R.. Lettvin J.Y.. Me Culloch W.S.. Pitts W.H. Anatomy and physiology of vision in the frog // J. Gen. Physiol. Suppl. 1960. Vol. 43, N 6, pt 2. P. 129—160. 28. Stratton G.M. Vision without inversion of the retinal image // Psychol. Rev. 1897. Vol. 4. P. 463—481. 29. Kohler 1. The formation and transformation of the visual world // Contemporary theory and research in visual perception / Ed. R.N. Haber. N.Y.: Holt, Rinehart and Winston, 1968. P. 474—497. 30. Логвиненко А. Д. Перцептивная деятельность при инверсии сетчаточного образа II Восприятие и деятельность. М.: Изд-во МГУ, 1976. С.209—267. 31. Донорски Ю. Интегративная деятельность мозга. М.: Мир, 1970. 412 с. 32. Бом Д. Специальная теория относительности. М.: Мир, 1967. 308 с. 33. Kohler W. Gestalt psychology. 2-nd. N.Y.: Liveright, 1947. 369 p. 34.Helson H. The fundamental propositions of Gestalt psychology // Psychol. Rev. 1933. Vol. 40. P. 13—18. 293
УДК 621.391.199 О МОДЕЛИРОВАНИИ В.Е. Jleeum, B.C. Переверзев-Орлов В конце 50—х — начале 60-х годов в работах А.А. Харкевича была сформулирована общая проблема моделирования целесооб¬ разного поведения [1]. Значительная роль в постановке проблемы отводилась развитию методов распознавания образов. В качестве предметной области были выбраны зрительные задачи распознавания, в первую очередь — распознавания нестилизованных письменных знаков. Даже простейший вариант этой задачи — чте¬ ние рукописных цифр — сложнейшая проблема, несмотря на то, что в ней полностью исключается необходимость решения проблемы смысла, естественно возникающей в общем контексте автоматического восприятия языка человека. Такой выбор области исследования диктовался, помимо собственно практической значимости, интересом к построению моделей сенсор¬ ного восприятия, формирования понятий и узнавания. Результаты, полученные при решении задачи чтения нестилизо¬ ванных рукописных цифр, оказались существенными не только с точки зрения оценки предельных возможностей цифрочитающих ав¬ томатов и подходов к их конструированию, но также и пониманием определяющей роли смыслового компонента, который в этой поста¬ новке отсутствовал. Стало понятно, что моделирование целесообраз¬ ного поведения в значительной мере зависит от решения проблемы смысла [2]. Центр интересов исследований в середине 70-х годов был перенесен на смысловую сторону восприятия, определяющую целесообразное поведение. Главными оказались проблемы классификации, фор¬ мирования понятий, принятия решений и выбора тактики поведения при нечетком информационном входе (типа естественного языка). Изменение целей повлекло за собой и изменение предметной об¬ ласти. Адекватной новой цели была сочтена проблематика, возни¬ кающая в связи с деятельностью врача. Переход к задачам такого рода потребовал пересмотра большинст¬ ва устоявшихся концепций, связанных с проблемами автоматического распознавания. Стало ясно, что особую роль приобретают методы решения по неполной и недостоверной информации, что требуются методы ин¬ теграции информации, рассеянной во множестве относительно несу¬ щественных характеристик, параметров и признаков. Выяснилось, что наряду с классической полисемичностью языка существует еще и скрытая полисемия, проявляющаяся в неоднознач¬ ности трактовок терминов разными людьми, непостоянством даже индивидуальных трактовок, неустойчивостью соотнесения терминов ситуациям. Стало ясно, что необходима разработка нового взгляда на про¬ блемы восприятия в широком смысле, что определило направление исследований с конца 70-х годов [3]. 294 \
ТИПОВАЯ ЗАДАЧА В качестве типовых задач, где акцент решения связан в опреде¬ ляющей мере с собственно интеллектуальной деятельностью, рассмот¬ рим задачи, возникающие в практической деятельности врача, — выдвижение диагностических гипотез, планирование обследований, выбор терапии, прогнозирование течения заболевания и т.п. Не¬ трудно провести аналогию между ними и проблемами, составляю¬ щими существо многих других видов интеллектуальной творческой деятельности, например ученого или инженера. Основные характеристики типовых задач: не формализованы, не имеют алгоритма решения; для решения требуется обширная разнородная информация, рас¬ сеянная во множестве нечетких характеристик; рассеянность необходимой информации сопровождается ее зашум¬ ленностью, искажениями и выпадениями; применяемые критерии качества не формализованы, что, как пра¬ вило, затрудняет построение эффективных оптимизационных процедур; результатом решения может быть не отнесение данной ситуации или объекта к одному или нескольким классам в выбранном апри¬ орно их наборе, а выявление качественно нового, не рассматривав¬ шегося ранее класса ситуаций или объектов, — открытие. Сформулированные особенности можно рассматривать как базо¬ вый набор, характеризующий уровень сложности проблемы. НЕЯВНОЕ МОДЕЛИРОВАНИЕ Классическому представлению о моделировании как о методе на¬ учного познания вне зависимости от того, используются ли теории, системы дифференциальных уравнений, формулы или специальные устройства, присуща определяющая черта: моделируется основное в изучаемом явлении, причем так, чтобы в модели учитывались ос¬ новные характеристики, параметры и их взаимосвязи и чтобы все это способствовало более глубокому пониманию явления. Будем называть такой метод явным моделированием. Более адек¬ ватным изучению сложных систем является неявное моделирование — моделирование, использующее средства, позволяющие воспроизводить желаемые черты поведения изучаемой сложной системы, но образующие сами сложную систему, понимание которой может быть лишь немно¬ гим проще понимания исходной. Неявная модель будет лишена лишь одной черты явных моделей — понятности функционирования или объяснимости получаемого резуль¬ тата, но сохранит возможность экспериментирования с ней. Естественно предположить, что когда изучаемое явление отно¬ сительно просто, адекватная модель тоже проста: охватывает не¬ большое число существенных параметров. Если же изучаемое — слож¬ ная система, то адекватная модель тоже должна быть сложной систе¬ мой. Итак, моделирование интеллектуальной деятельности — область применения неявного моделирования. 295
Подчеркнем еще раз: речь идет не об идентификации ’’черного ящика”, а о создании его модели в виде другого ’’черного ящика”, но позволяющего проводить над ним необходимое для исследований множество экспериментов. СТРУКТУРЫ В основу математического аппарата неявного моделирования бы¬ ли положены идеи кластерного анализа, модифицированные так, чтобы выполнялись условия группировки объектов по специфичным при¬ знакам, создавая возможности для выявления закономерностей, орга¬ низации рассуждения и т.п. Перспективным представляется тип задач кластеризации, в кото¬ ром ищутся подмножества объектов в подпространствах описания, оптимальные по некоторому (типа удельной плотности проекций или смысловому) критерию. Развитие этой идеи легло в основу метода структур и поля дан¬ ных [3], где под структурой понимается множество ее элементов, каж¬ дый из которых задан сечением в некотором маломерном под¬ пространстве исходного пространства описаний. Для объектов, про¬ ецирующихся в сечение, выполняется условие оптимума некоторого критерия, зависящего как от подмножества признаков, так и от под¬ множества объектов. Не требуется, чтобы подмножества объектов, при¬ надлежащих различным элементам структуры, не пересекались, но метрика задается только в сечениях. Рассмотренная конструкция удовлетворяет большинству необхо¬ димых требований, позволяя в исходных данных находить органи¬ зации объектов по локальному их сходству, вести содержательный ана¬ лиз получающихся групп, исследовать закономерности в сечениях, на¬ правленно развивать систему описаний, выдвигать гипотезы по не¬ полной информации и т.п. На основе такого подхода созданы как автоматические, так и интерактивные системы анализа данных. Ограничением является то, что допустимо высказывание утверждения лишь относительно объек¬ тов, проецирующихся в какие-либо сечения. В отношении же всех других объектов утверждения не высказываются. Для создания такой возможности было введено поле структуры. ПОЛЕ Для образования поля структуры, согласованного с основными осо¬ бенностями ее, было решено использовать векторный потенциал, определяемый следующим образом. Потенциал в точке пространства описаний для структуры с к элементами определяется матрицей потенциала М размера кХк. При этом компонент потенциала М (i, j) в точке х задается относительной долей голосов, отданных решающи¬ ми правилами, построенными для разделения элементов структуры i и у, за принадлежность этой точки элементу i. Определенный таким obразом потенциал позволяет уточнять струк¬ туру, выделять изопотенциальные области, искать продолжение 296
структуры, выдвигать качественно новые гипотезы и строить объяс¬ нения. В частном случае, когда требуется выдвинуть гипотезу о принад¬ лежности выбранной точки пространства к некоторому элементу структуры, это может быть сделано следующим преобразованием матрицы потенциала для данной точки. Сначала подсчитываются сход¬ ства с элементами структуры путем суммирования компонентов по¬ тенциала в соответствующих строках матрицы потенциала М. Ана¬ логично определяются несходства матрицы М — суммированием компонентов потенциала в соответствующих ее строках. Затем прав¬ доподобия гипотез определяются как отношения соответствующих сходств к несходствам. При вычислении потенциала не требуется полного задания коор¬ динат точки — это может быть точка в некотором подпространст¬ ве. Чтобы потенциал мог формироваться в таких условиях, необхо¬ димо, чтобы правила, ’’голоса” которых затем подсчитываются для определения потенциала, сами определялись в разнообразных мало¬ мерных подпространствах и, следовательно, результаты голосования мало зависели от пропусков измерений. СИНДРОМЫ Поле структуры — способ экстраполяции свойств структуры в об¬ ласти пространства описаний вне ее. Способ формирования поля, рассмотренный выше, не является единственным. Другой — более непосредственно взаимосвязан со структурой и заключается в следующем. По своему определению элемент структуры формально соответст¬ вует принятому в медицине понятию ’’синдром”. Синдром — это ус¬ тойчивое сочетание неких характеристик-симптомов, типичное для некоторой патологии. Врачи знают и широко пользуются тем обсто¬ ятельством, что синдром может быть и неполным (включать лишь часть из присущих ему симптомов) и тем не менее соответствовать выраженности заболевания. Нестрогость синдрома, состоящая в том, что к его симптомов не выполняются, порождает образование хемминговского шара радиу¬ са к, где центр — строгий синдром. Так нестрогость размывает элемент структуры, создавая тот же эффект, что и поле, образуемое голосами элементарных решателей. Распространенность синдромного подхода в медицине и явное его присутствие, по-видимому, и во многих других типах человеческой деятельности позволяет думать об известной адекватности синдром¬ ного подхода человеческому восприятию, о синдромности мира. ПОЛЕ И СИНДРОМЫ Центральной идеей формирования поля и структуры является выделение в многомерном маломерного, где начинают проявляться устойчивые свойства данных. Однако, поскольку в силу зашумленности данных каждое из таких маломерных образований может оказаться 297
неустойчивым, следует выделять множество маломерных элементов с последующей интеграцией их свойств. Такой подход кажется естественным при исследовании медицин¬ ских задач. Действительно, обычно немногие скрытые от непосредст¬ венного наблюдения причины (часто и вообще неизвестные) вызывают отклонения от нормы в функционировании организма, проявляю¬ щиеся во множестве изменений внешних характеристик, часто мало¬ заметных, зашумленных. Индивидуалные отклонения наблюдаемых характеристик — симптомы, согласованные — синдромы. Если, не учитывать, что понятие ’’норма” в медицине строго не определено, то задача раннего обнаружения патологии будет связываться с выяв¬ лением замаскированных шумами согласованностей. Ситуация такого рода типична не только для медицины. Главное то, что некоторые изменения ненаблюдаемых параметров вырожденно проецируются под действием некоторого механизма во множество наблюдаемых параметров, изучение которых позволяет ставить за¬ дачи типа диагностических, а иногда и обратные задачи. Диагностические задачи, или задачи классификации типов ситуаций, в этом случае наиболее просты: на наборе наблюдений с известной принадлежностью к определенным классам или типам требуется найти подмножества характеристик с устойчивыми связями для на¬ блюдений в каждом из классов. Существенным здесь является допустимый вид устанавливаемых связей, поскольку наборы наблюдений обычно невелики, наборы их характеристик могут быть произвольно велики, а устойчивость обычно полагается не строгой, а наблюдаемой, типичной, статисти¬ ческой. Учитывая все изложенное, мы сочли возможным рассматривать ло¬ кальные взаимосвязи двух видов: синдромального типа, аппроксимирующие структурные закономер¬ ности на уровне элементов структуры с размытием по Хеммингу; локально аппроксимируемые кусочно-линейными функциями. В первом случае получаем множество синдромов, интегрирующих информацию, рассеянную в различных подмножествах симптомов, путем простого суммирования выполненных симптомов. А во втором — множество кусочно-линейных решателей, учитывающих закономер¬ ности признаков в целом. Оба подхода к формированию поля сочетаются в схемах их ком¬ бинированного применения: переупорядочивание шкал оценок различных характеристик (мо¬ жет оказаться полезным для повышения эффективности кусочно-ли¬ нейной аппроксимации); переход из пространства исходных описаний в пространство сходств с синдромами (где затем уже применяются кусочно-линейные аппрок¬ симации). 298
* * * Задачи, составляющие основу врачебной деятельности — формиро¬ вание решений, планирование действий и т.п., характерны для боль¬ шинства видов интуитивной и творческой деятельности не только врачей, но и специалистов иных видов деятельности. В такой ситуации доступными анализу оказываются второстепен¬ ные характеристики, косвенно связанные с ненаблюдаемыми порож¬ дающими характеристиками. Не известны ни сами эти первичные характеристики, ни их соответствие внешним проявлениям, которые к тому же многообразны и сильно зашумлены (нечеткостью проявле¬ ний и субъективизмом их оценивания). Практически единственное, что в этих ситуациях позволяет рас¬ считывать на успех (так сказать, теорема существования) — это то, что врачи лечат. Следовательно, эмпирические наблюдения, вклю¬ чая верификацию действием (в частности, эффект лечения), позво¬ ляют человеку воссоздать приемлемую модель таких явлений в своем сознании или подсознании. Объяснение этого результата можно найти в следующем: локаль¬ ное в больном может быть порождением глобального механизма, но основу для построения представления о таком механизме можно по¬ черпнуть из разрозненных и обычно немногих наблюдений, дающих в лучшем случае данные лишь для локальных же аппроксимаций, причем локальность обусловлена природой задачи и условиями ее решения. Адекватным методом интегрирования глобального по ло¬ кальному является метод неявного моделирования сложных систем на основе концепции структуры и поля данных. Заметим также, что все изложенное — основа работы по созданию консультативных медицинских систем. ЛИТЕРАТУРА 1. Харкевич А.А. Избранные труды: В 3 т. Т. 3. Теория информации. Опознание образов. М.: Наука, 1973. 524 с. 2. Переверзев-Орлов B.C. Модели и методы автоматического чтения. М.: Наука, 1976. 112 с. 3.Левит В.Е. Переверзев-Орлов B.C. Структура и поле данных при распознавании образов. М: Наука, 1984, 124 с. 299
УДК 621.391.192.5 МОДЕЛИ КОНСТАНТНОГО ЗРИТЕЛЬНОГО ВОСПРИЯТИЯ П.П. Николаев ВВЕДЕНИЕ В зрительно воспринимаемом объективном мире, в котором пере¬ мещается глаз наблюдателя и подвижны многие объекты наблюдения, где меняются от места к месту и во времени спектральные харак¬ теристики освещающего предметы света, на зрение любого визуально ориентирующегося существа возложена чрезвычайно ответственная задача — узнавание видимого предмета, что требует оперативной и по возможности безошибочной оценки его инвариантных признаков. ф Такими признаками в первую очередь являются геометрические свойства предмета (его форма) и физические (отражательные — его окраска). Ни об относительной глубине частей предмета (сетчаточ¬ ная проекция видимого двумерна), ни об его окраске (цвет отраженного света зависит от спектра освещения) глаз прямых сведений не полу¬ чает, тем не менее для наблюдателя-человека вызываемое предметом стереометрическое и цветовое ощущения константны в широком диа¬ пазоне условий наблюдения [1 —3]. Более того, анализ все тех же возбуж¬ дений фотоприемников дает наблюдателю понимание того, каковы фактура поверхности, ее локальная кривизна и характер движения, прозрачность и зеркальность, как распределены в пространстве вто¬ ричные отражения (рефлексы) и т.п. Константность окраски и формы предмета ( а также в общих чер¬ тах и константность зрительного направления и видимого положения) как математически моделируемые перцептивные феномены и будут рассмотрены в этой статье. Помимо общности цели, состоящей в отыскании инвариантных характеристик предмета, группу обсужда¬ емых здесь алгоритмов и схем объединяет и монокулярный их ха¬ рактер. В отличие от ’’контурного” подхода к обработке изображений, когда информация анализируется лишь в районах больших перепадов интенсивности сигнала, развиваемый в этой статье подход к решению статических задач константного восприятия существенной своей чертой имеет использование двумерного поля сигналов (и особенно мест с низкими пространственными частотами) для оценки окраски и формы объекта сцены. Рассматривая вопросы статической цве¬ товой обработки, под объектом будем подразумевать предмет одно¬ тонной окраски, а под спектральными функциями — кривые: испускания S(X) источника освещения; отражения Ф (X) матового объекта (описывает его окраску); чувствительности Х/Х) фотоприемника у-го типа. В части, посвященной динамическим алгоритмам и схемам зритель¬ ной обработки, непрерывный (сплошной) объект сцены представлен в перцептивной модели центральными проекциями своих контраст¬ ных фрагментов (точек или линий). 300
СТАТИЧЕСКИЕ МОДЕЛИ КОНСТАНТНОГО ВОСПРИЯТИЯ Проблема трансформации цвета и оценка окраски объекта Цвет и его восприятие. Существенная часть исследований цветного зрения, область цветовых измерений и многочисленные аспекты цве¬ торепродукционных приложений базируются на колориметрическом подходе к понятию цвета: свойство спектрального состава излуче¬ ния, общее излучениям, визуально неразличимым (метамерным) для человека или животного, и есть цвет Опыты, выясняющие, какие спектральные составы различимы для глаза между собой и какие метамерны, называются колориметри¬ ческими. Условия этих опытов предельно далеки от условий, в ко¬ торых зрительный анализатор по пришедшему излучению строит гипотезу об окраске объекта, отразившего это излучение, и тем не менее именно колориметрическими исследованиями доказана ад¬ дитивность цветового зрения и определена размерность (входного) цветового пространства ощущений. Размерность и аффинность этого пространства должны учитываться в любой модели перцепции цвета. В обиходе слова ’’цвет”, ’’окраска”, ’’желтый” и т.п. повсеместно употребляются в нескольких взаимоисключающих смыслах. Например, в описаниях: ’’желтый мяч”, ’’желтый огонь светофора”, ’’желтым выглядит белый цвет после засвета глаза синими лучами” — слово ’’желтый” имеет три разных смысла. Для однозначности понимания дадим определения некоторым наиболее важным терминам и далее будем пользоваться ими согласно определениям. Определение 1. Окраска поверхности — физическая характеристика, выражающая зависимость коэффициента отражения поверхности от длины волны (или частоты) падающего света (полностью описывает отражательные свойства объекта лишь для равномерно рассеивающих свет тел). Определение 2. Цвет излучения — колориметрическая его харак¬ теристика. Для трихромата это тройка чисел, связанных линейно с отсчетами колориметра. Для зрительной системы с известными кривыми Х/Х) абсолютный спектральный состав излучения задает его цвет (обратное неверно — один и тот же цвет могут иметь излучения с сильно различающимися спектральными составами). По локальному цветовому ощущению, выраженному в терминах "синий”, ’’желтый” и т.п., нельзя однозначно восстановить условий, вызвавших его. Ощущению ’’желтый'’ может, например, отвечать си¬ туация, когда на область спектра 570—590 нм приходится максимум коэффициента отражения (’’желтый мяч”), а может — и ситуация, когда той же области соответствует максимум распределения энергии (желтый огонь светофора). Если же перед наблюдением глаз подвер¬ гался селективной световой адаптации (после засвета глаза синими лучами), то наблюдаемое обретает для него тона искаженные, сдви¬ нутые в сторону цвета, дополнительного к тону засвета (желтым выглядит белый цвет), т.е. прямой корреляции с качествами наблю¬ даемого в этом случае не будет вовсе. 301
Многие названия цветов в равной мере применимы и к цвету излу¬ чения, и к окраске поверхности. Но есть и такие названия, которые применимы только к окраске. Всем доводилось видеть коричневые предметы, однако ’’коричневый свет” в реальном мире не наблюдается. Точно так же не существует серого, бурого света, света хаки. Само существование невоспроизводимых колориметрически цветов — довод за то, что многообразие цветовых ощущений существенно шире коло¬ риметрического [4,5], а сами они предназначены прежде всего для оценки окраски. Про цветовые ощущения человека известно, что для него наиболее естественно оценивать окраску и цвет излучения по трем независи¬ мым параметрам: цветовому тону, насыщенности и светлоте (для окраски) или яркости (для излучения). Насыщенность краски, осве¬ щенной ’’белым” светом, меняется так же, как ее цвет при разбав¬ лении или при смешении с белилами; светлота — как при смешении с черной краской; цветовой тон — подобно цвету лучей в монохро¬ маторе. Сама по себе эта классификация не содержит рецепта полу¬ чения цветовых оценок из реакций приемников глаза. Она удобна для геометрической интерпретации свойств пространства оценок окраски. Поскольку кривые Ф наиболее часто встречающихся красителей малоселективны (пологие), то один и тот же объект в разных условиях освещения может отражать свет, более варьирующий по спектраль¬ ному составу, чем свет, отражаемый одинаково освещенными разными объектами. Без аппарата константности животные и человек были бы практически лишены возможности узнавать объекты по их ок¬ раске, а цветовое зрение, вероятно, стало бы при этом лишь вырази¬ телем эстетической функции. Окраска, форма, освещение и условия наблюдения. Глаз превращает сетчаточную проекцию сцены в картину возбуждений приемников. При этом трехмерная сцена заменяется двумерной центральной проекцией, а ее проксимальные стимулы — у-мерными аффинными векторами цвета (/' — число типов приемников зрительной системы). Располагая столь вырожденной информацией о мире, зрительная система решает удивительно сложную задачу: отделяет самосветя- щиеся объекты от пассивно отражающих свет, реконструирует объем¬ ную форму тел (эффективность бинокулярного механизма и аккомо¬ дации быстро убывает с удаленностью объекта, а в интерпретации плоских изображений эти приемы оценки глубины и вовсе не могут пригодиться), распознает пространственное распределение и цвет первичных и вторичных источников освещения, бликов и т.п. Реагируя на излучение, глаз трихромата формирует трехпарамет¬ рическую оценку спектральных характеристик вида 5Ф дистального стимула из данной точки сцены. Но для того чтобы оценить Ф в этой точке, нужны верные гипотезы об углах падения и цвете излучения S, осветившего ее. Прямых сведений о пространственном распреде¬ лении освещения в сцене (а часто и о цвете источника освещения, когда он не виден) глаз не получает, тем не менее окраски узнаются, 302
и процесс — от аконстантного видения к константному — для каж¬ дой новой сцены чаще всего длится считанные мгновенья. Правильное узнавание формы (неподвижных) объектов обычно весьма затруднено, когда окраска их частей и распределение освещения (в простых случаях граница тени) не опознаваемы уверенно порознь, а в широких пределах ’’размениваются” одно на другое при интерпрета¬ ции (комуфляжи тому примером). И форма, и окраска нелегко выяв¬ ляемы в условиях разноцветного освещения. Пока не поняты форма и освещение объекта, рефлексы в его складках могут быть превратно истолкованы как вариации окраски. Все приведенные примеры гово¬ рят об одном: в мире объемных форм описанием, достаточным для простой и непротиворечивой интерпретации видимого, является опи¬ сание на языке геометрическом и цветовом окраски, формы и освещения объекта сцены. Оценки окраски, формы и освещения как цели трех различных задач узнавания обладают именно в силу этого вполне понятной особенностью: по любым двум верно решенным задачам и сетчаточной картине в принципе можно решить третью задачу. Но как решить ’’две первые” задачи и с какой оптимальнее начинать? Вся статья в целом — попытка ответа и на эти вопросы. Приведем классификацию основных типов условий наблюдения. Определение 3. Аконстантные условия соответствуют условиям, при которых одинаковые цветовые ощущения вызываются одинако¬ выми цветами излучений (в этих условиях ведутся все колориметри¬ ческие опыты). Определение 4. Константные условия наблюдения — это условия, в которых одинаковые цветовые ощущения вызываются одинаковыми окрасками, причем адекватная оценка окраски проводится в истин¬ ноконстантных условиях, а оценка с единым для сцены цветовым сдвигом — в условиях ложноконстантных (при дефиците данных о цвете доминирующего источника освещения). Определение 5. В метаконстантных условиях наблюдения одина¬ ковые окраски объектов особой сцены (назовем ее метасценой), пол¬ ноцветное отображение которой включено в основную как ее фрагмент, вызывают у наблюдателя одинаковые цветовые ощущения (условия эти обычны для картинной галереи, киносеанса, фотовыставки, т.е. всюду где наблюдают качественную репродукцию некоторой сторон¬ ней сцены со своими особенностями освещения). В метаконстантных условиях наблюдения связи между задачами узнавания усложняются добавлением этажа в схеме интерпретации сцены. Наблюдатель не вправе ограничиться распознаванием репродук¬ ции метасцены как фрагмента сцены, а должен по репродукции иден¬ тифицировать объект метасцены, отвлекаясь при этом от конкретного способа реализации репродукции.0 При разглядывании фотографииj человек абстрагируется от того, что перед ним разноокрашенная > равноосвещенная плоскость. При просмотре кинофильма ситуация обратная — кадр образован разноосвещенными точками однотипно окрашенного экрана. Подводя итоги, сформулируем априорное правило зрительной ин¬ терпретации (установочную ее эвристику, лишь по необходимости под- 303
ключающую алгоритмические модули интеллектуальной обработки): скорее всего, множество несовпадающих окрасок в сцене дискретно и невелико, одноокрашенные объекты — протяженные, источники — или один диффузный (небо), или в добавление к нему один точечный (солнце); остальные цветовые сложности порождены вторичными отра¬ жениями или наличием метасцены, которую следует интерпретировать особо, как самостоятельную сцену. Различение и узнавание. Представим себе освещенную объемную сцену. Окрашенные одинаково части тел в ней разнообразно ориенти¬ рованы и по отношению к источнику освещения, и относительно дру¬ гих тел, а потому разные точки данного объекта могут проециро¬ ваться на сетчатку как излучения, цвет которых различается и яркостью, и цветностью. Решая задачу различения объектов, попытаемся для всех видимых точек данного объекта сформировать единый код, не совпадающий с кодами тех объектов, чья окраска иная. При этом про¬ цедура такого различения с неизбежностью должна использовать спектральные и геометрические закономерности рассеяния света ве¬ ществом. Итак, если процедура различения объектов будет построена, то бу¬ дет решена задача выделения всех проекций объектов сцены огово¬ ренного типа, т.е. по входному полю цветовых векторов будет сфор¬ мирована сетка границ объектов [6]. Решение этой формально гео¬ метрической задачи — лишь первый этап в цепи усложняющихся за¬ дач предметного восприятия. Следующий шаг — узнавание окраски, когда объекты должны быть не только различены, но и иметь цве¬ товые характеристики, достаточно полно оценивающие их окраску. Например, трихроматическая система по завершении этапа цвето- различения должна, оценив цветность доминирующего источника ос¬ вещения, сделать поправку на нее для вычисления трехпараметрической оценки Ф: цветового тона, насыщенности и светлоты каждого объекта сцены. Светотень н рефлексы. Рассмотрим, как ведет себя цвет внутри границы объекта, если сцена освещена точечным и диффузным источ¬ никами освещения (например, солнце и небо). В тех местах сцены, куда не попадают прямые лучи точечного источника, освещение чисто диффузное. Под диффузным освещением подразумеваются излучения одинакового абсолютного спектрального состава, попавшие в дан¬ ную точку сцены по прямым, не пересекающим никакие объекты, кроме как в этой точке. Излучения, пришедшие в точку сцены от объек¬ тов, объединим в особую группу — группу рефлексов. Охаракте¬ ризуем тип освещения числом первичных источников, освещающих заданную часть объекта, а часть проекции объекта с единым типом освещения назовем районом (таким образом, видимая граница тени может разделить поле внутри границы объекта на два района). И поскольку процедура различения небезразлична к типу освещения, уточ¬ ним ее цель — сформировать карту границ районов (если граница тени найдена [6,7], то ясны и границы объектов). Изменения цвета (не на границе тени), не связанные с рефлексами и с изменениями окраски, назовем светотенью. Чему обязана свето¬ 304
тень своим возникновением? Внутри любого теневого района d цвет меняется оттого, что разные точки сцены, проецирующиеся в d, освеща¬ ются диффузным источником, по-разному заслоненным другими объек¬ тами (или частями того же вогнутого объекта): одни точки освещены всей полусферой неба, для других часть ее заслонена. Внутри же незатененного района светотень порождена точечным источником, вли¬ яние которого определяется ориентацией поверхности объекта по от¬ ношению к направлению его лучей. Итак, светотень — это результат проявления закономерностей, свя¬ зывающих цвет с расположением объекта относительно источника его освещения, причем в незатененных районах — с локальной геомет¬ рией объекта. В монокулярных условиях наблюдения светотень — единственный поставщик не слишком косвенной информации о форме неподвижного объекта. Поэтому естественно ожидать, что зритель¬ ная система, решающая задачи узнавания формы, делает это с исполь¬ зованием закономерностей светотени [2, 6—10]. Рефлексы, делая свой вклад в освещение, казалось бы, услож¬ няют распознавание формы, однако в незатененных районах влияние рефлексов чаще всего невелико, а в районах тени, где необходимы нелокальные приемы оценки формы, учет рефлексов даже упрощает задачу. Речь идет о закономерностях многократного отражения света в складках поверхности. Характер изменения цвета в этом случае — рост его насыщенности снаружи внутрь складок — несет информа¬ цию об окраске объекта и цвете источника и дает возможность оце¬ нить конфигурацию складки. В тех случаях, когда рефлексы сильны (например, попадают в теневую область из солнечной), они могут исказить гипотезы об окраске, создавая иллюзию ее переменного по полю характера. Цветовое тело и пространство цветовых оценок. Очертим кратко отношения, связывающие физические характеристики — окраску ф и освещение S с физиологическими (техническими для роботов) — с кривой чувствительности xj(X) фотоприемника, реакция которого а! на излучение F(k) задает /-ю компоненту вектора цвета а: d(x) = JV(^, х) xj(X)dX, о где х — сетчаточная координата приемника j-го типа. Так как основной наш интерес — человеческий интеллект в зрении, поведем дальнейшее рассмотрение, ориентируясь на особенности три- хроматической системы, и подчеркнем обстоятельство, разграничи¬ вающее биологический и технический аспекты проблемы: вектор цвета а, выражающий ответ триады приемников на свет, для зрительной системы человека и животных задает точку в аффинном (не метрическом) пространстве А основных физиологических цветов, так как х/Х.) колбочки — это спектральная характеристика, известная с точностью до коэффициента (зависящего от временнбй предыстории стимуляции в j-м цветовом канале и от сигналов соседних с точкой х ре¬ цепторов). Поэтому процедура метризации пространства А (изучение 20. За к. 1668 «пе
так называемой высшей метрики цвета [11]) вносит элемент неоднознач¬ ности интерпретации в отличие от колориметрической, исполь¬ зующей приемник только как нуль-прибор. Колориметрия имеет дело с излучениями безотносительно к при¬ чине, их трансформирующей. Причину — окрашенный объект — отобра¬ жает так называемое цветовое тело — центрально-симметричная вы¬ пуклая область пространства А, заключающая в себя цвета а всех плоских нефлюоресцирующих матовых объектов при данном освеще¬ нии (и заданном наборе х(Х)). Форму цветового тела, ограниченного цветами не встречающихся в природе (и технически не воспроиз¬ водимых) ступенчатых или ’’оптимальных” окрасок, однозначно задает спектр освещения S(k) [12, 13]. И потому понятен интерес к обратной (на сегодняшний день нерешенной) задаче: для сцены, ’’богатой” объектами высокой насыщенности, построить алгоритм не двупарамет¬ рической оценки цветности S, как диктуют аффинность и размерность цветовых входов, а оценки, более близкой к реальной кривой S(K). Не менее интересна задача вычисления трехпараметрической оценки Ф для дихроматической системы в сценах с большим разнообразием тонов у ее объектов. Посмотрим на эту проблему иначе. Если традиционное определение цветового тела не дает ключа к ее решению (в теории форму цветового тела, восстановимую по его ребру [12], определяют цвета а, порож¬ даемые окрасками, которых не может быть и в ’’богатой” сцене: например, одноступенчатыми окрасками этого ребра [13]), видо¬ изменим его, включив многообразие цветов, какие могли бы дать складчатые объекты (при диффузном освещении). В этом случае одному объекту соответствовала бы не одна точка в пространстве А, а линия — цвета некоторой траектории взгляда по объекту от плоского его участка в глубину складки. Напрашиваются два вы¬ вода: искать решение задачи на основе анализа цветов не внутренних областей цветового тела, а лежащих вблизи от его поверхности (и воспроизводимых реальными неплоскими объектами); изучить свойства цветовой траектории объекта в новом цветовом теле, т.е. описать аналитически в пространстве-А свойства внутренних рефлексов. И без аналитического рассмотрения ясно, что форма цветовой траектории исследуется непросто. Да и как изучать поверхность аффинного тела, если ничего метрически определенного, кроме бе¬ лого объекта (в новом цветовом теле задающего всю ахроматическую ось), у него вроде бы и нет? Через эту ось и каждую из координатных осей можно провести триаду плоскостей Pj. Из одних только соображе¬ ний симметрии следует, что существуют такие p-объекты, цветовые тра¬ ектории которых лежат в одном из шести плоских участков, огра¬ ниченных ахроматической осью и линией пересечения поверхности ’’тела” с одной из Pj, если класс S(X) задан. Если в сцене нет ахроматического объекта, но есть хотя бы пара p-объектов из разных Pj, зрительный анализатор может оценить цветность S (насыщенность и тон), вычислив положения каждой Pj 306
по двум любым принадлежащим ей цветовым векторам я(х), после чего — ахроматической оси как линии пересечения этих Pf. Несложно найти примеры подобных ситуаций (особенно просто для системы, три кривых ХуМ которой симметричны относительно своей максимальной ординаты, а крайние — относительно централь¬ ной). Проделанное выше рассуждение наметило контуры нового подхода к проблеме, иллюстрируя известную мысль о том, что изучение реаль¬ ных сложностей вопроса (анализ цвета внутренних рефлексов в прост¬ ранстве А) может дать упрощение его решения. Подведем итоги. К не раз обсуждавшемуся, но не ставшему три¬ виальным положению, что нелокальная цветовая обработка видимого может сформировать перцептивный выход, существенно более богатый, чем локально обеспечивают входы системы, мы рискнем добавить в виде гипотезы идею о необходимости экспериментальной перепро¬ верки границ возможного для зрительной системы в производимых ею цветовых оценках (не проявят ли, например, дихроматы в сценах со складчатыми объектами и специально подобранными характерис¬ тиками S и Ф свойств трихроматического цветовосприятия?). Алгоритмы н схемы цветоразлнчення Классификация условий освещения. В рамках проблемы, именуемой константностью цветности [3], займемся этапом цветоразличения объ¬ ектов как процедурой выделения на двумерной проекции сцены тех ее смежных областей, которым в наблюдаемой сцене соответствуют трехмерные объекты различающейся цветности. Связные области проек¬ ции, в пределах которых отражательная способность Ф(Х) проециру¬ ющегося и оцениваемого по цветности объекта, освещенного фик¬ сированным набором источников, всюду постоянна, названы районами, а излучение F{k, х), имеющее на проекции координату х, — прокси¬ мальным стимулом. Далее, если это не оговорено особо, под функцией %j(k) подразумевается абсолютная спектральная «^вствительность приемника (ориентируясь на очевидную техническую реализуемость предлагаемой процедуры, оставим в стороне вопросы цветовой адап¬ тации приемников системы). Стимул, возникший в результате отражения излучения состава Sj(k) (/=1, 2, ..., п) т-м матовым объектом окраски Ф„,(Х), представим суммой вида g,(x).S,(^)®m(^), разделив тем самым гео- метрические gt и спектральные параметры. Тогда для реакции у'-го приемника в пределах района с номером т выполняется 00 <(Х)= i g,(x)S4>JX)Sl(\)xAV<& = /_ 1 О = 2 g,(x)iijm- (i) /=) Будем считать, что среди g{x) имеется не более чем одна пара 307
линейно зависимых функций и их нет вообще среди Фт(Х), в силу чего количества слагаемых п в уравнении (1) для каждой конкретной сцены нельзя уменьшить без ущерба корректности ее описания или без утери возможности разделения геометрических и спектральных функций. Интегралы /,ут в выражении (1) являются компонентами вектора 1„„. Сложность распределения освещения по полю района охарактери¬ зуем числом г, назвав его рангом объекта: г = 2п, если в выражении (1) ни одна из gt(x) не является постоян¬ ной и не зависит линейно от любой другой; г = 2п— 1 во всех остальных случаях. Дадим примеры сцен, для которых матовый объект имеет единый ранг г.- плоскость с единым абсолютным спектральным составом осве¬ щения (r= 1); та же плоскость с близким точечным источником освещения или изолированное выпуклое тело единой окраски Ф, освещенное одним источником (г — 2); то же тело, лежащее на окрашенной плоскости и освещенное диф¬ фузным хроматическим источником (в этом случае сумма апертур рефлекса и источника — величина постоянная) (г = 3); изолированное выпуклое тело, освещенное точечным и диффузным (как солнце и небо) источниками разной цветности (г = 4). Скомпенсировав стереометрические веса g,(x) во входном поле ат, искомый инвариант района К сделаем функцией лишь интегралов I,jm; тогда, завися от цветности объектов и источников, К не будет зависеть от их геометрии. Задача и алгоритмы различения по о/(х, у). Для /-хроматической системы построим такую локальную комбинацию ее реакций на объекты ранга 2)—2 или 2.j—3, что в результате выполнения этой однородной (по полю проекции) процедуры: преобразованное поле каждого района окажется постоянным (кон¬ станту эту назовем кодом района или кодом объекта); число независимых кодов для данного объекта равно j—1; коды "двух объектов с Ф1(^)/Ф2(Х) Ф const, как правило, разные; два объекта ранга 2/—2 и 2j—3 имеют равные коды, если Ф1(Х)/Фг(Х) = const. Рассмотрим несколько вариантов решения задачи различения на примере трихроматической системы в сценах с объектами ранга 3 или 4, оперирующей реакциями вида = gl(x)Iljm + gl(x)hjm- Нетрудно убедиться, что преобразование вида W‘J(x)/fV^(x),где определитель Вронского от а(х) akm(x) a'Jx) dai(x)/dl da'„(x)/dt, , a £, — произвольное направление на проекции, удовлетворяет постав¬ ленным для задачи различения условиям [7], так как результат такого 308 Ц*](х) =
преобразования оказывается ие зависящим от параметров g(x), а по¬ тому может служить кодом Кг(т) для т-го объекта (индекс 2 = г/2): Kj(ni)—W (x)/W (х) — /21тЛзт)/(/|2т-^23т hlmhim)- Вторым линейно-независимым кодом того же объекта является, например, Kl{m)=Wx,/(x)/W]/(x). В цветовом пространстве все ят(х) инцидентны плоскости, общей векторам Решим задачу для всех объектов, преобразовав три поля а£/х) в два поля согласно преобразованию К'2=^(х)/^(х) (/= 1, 3; я = 4-/). (2) Коды К{(т) можно получить и без дифференцирования по а(х)/а(х)— ^а/х^/^ а3(хр) K* = (2-if ! 1 (3) а2(х)/а"(х) — 2 a2f.vp)/ 2 ап(хр) I I где xp — координаты точек окрестности точки (х), а само преобра¬ зование — пример изотропной процедуры кодирования объекта. В зональных моделях цветоразличения [8, 6] интеграл /,т можно заменить произведением зональных компонент 5{4#,(7 = 1, 2;) = 1, 2, 3), и потому К\(т) = Ф^Д3 - — SlSljOl Для ахроматического и-объекта Ф,' = Ф2 = Ф,3, следовательно, К'2(т)^К12(к)Ф'п,/Ф2т (i= 1,3), где Ф'т/Ф„ — компоненты зональной цветности объекта т. Таким образом, получена возможность использования выходного сигнала этапа цветоразличения для решения задачи константного вос¬ приятия цветности объекта сцены: С'т = Ф'т/Фт = К\( m)/K'i(w). Соотношение это справедливо пр* любом числе п независимых источ¬ ников освещения сцены для («+1)-хроматической системы. Итак, если w-объект найден, для каждого объекта т можно оценить зо¬ нальную цветность, полностью задаваемую триадой чисел (Схт, 1, С3) ^ т/‘ Алгоритмы различения по а/х). Рассмотрим другую группу алго¬ ритмов различения (опуская для простоты индекс принадлежности району т) в предположении, что реакция приемника прологарифми¬ рована на самом входе системы: а/х) = In (а/х)). Введем операцию Д„„ такую, что А та(х) = а/х) — а„(х). Можно показать, что для трихроматической системы (Дпа(х))'/(Д2за(х))' = а2(х)(/ц/2з — h\hi)/a x(x)(Inhi —/22/13),
откуда ln(fl‘(xXAi3fl(x))7fl2(x)(A23fl(x))') = const = 1п((/ц/2э —/21/13)/ / (/12/23 /22/13)) — lnZ/21- Совершив ряд преобразований, получаем следующую последова¬ тельность рекуррентных соотношений: Уравнение (6) описывает процедуру различения объекта (г = 1, 2) в дихроматической системе (км = const). Уравнения (5) и (6) относятся к объекту (г = 3, 4), различаемому трихроматической системой (кыи — const). Уравнение (4) после соответствующих подстановок из соотношений (5) и (6) характеризует объект (г=5, 6), различаемый тетрахроматической системой. В какой мере дублируют друг друга алгоритмы (2) и (5)? Можно прологарифмировать реакции с/ и воспользоваться для решения задачи алгоритмом (4)—(6). Однако процедура различения окажется при этом более сложной, чем по методу (2). Помимо принципиального несходст¬ ва сравниваемых алгоритмов, их независимость выявляет и целевое назначение результатов цветоразличения. В моделях константного восприятия окраски объектов, создаваемых по типу биологических систем зрения, процедурная сторона существенно упрощается за счет аппроксимации спектральных функций кривыми нормального распределения [14], при которой наиболее естественна логарифми¬ ческая форма представления входной информации. В технических же системах свойства фотоприемников может задавать конструктор (обеспечив их линейность и зональность), что, согласуясь с воз¬ можностями зональной аппроксимации, сулит преимущества простоты реализации разрабатываемых моделей. Схемы цветоразличения и единая процедура обработки изображе¬ ния. Процедура (5), включающая операции дифференцирования сиг¬ нала по направлению как и всякая иная процедура различения, строит код объекта независимо от вида спектральных функций, входящих в IiJm (и зависит лишь от степени соответствия посту¬ лируемого выражением (1) вида реакции реальной оптической ситуа¬ ции в сцене). Для некоторой аналоговой сети, однородно реализующей трихро- матический уровень алгоритма (4)—(6), опишем кратко конструкцию ее узла, в котором по трем центральным сигналам а/х) и по сум¬ марным боковым сигналам s, его окрестности с помощью инвер¬ тора знака и трех однотипных блоков ”1п,/\ логарифмирующих модуль разности Sj — Sj, вычисляются для объекта ранга 3 или 4 два его кода 1пМ (при условии, что окрестность узла не выходит за границу района, а сам объект кодируем алгоритмом (4)—(6)). Схема узла аналоговой сети приведена на рис. 1, а. Направление £, киып = In*/ = кш(х) + \n(k'hJx)/klJx)), кы/х) = kh/x) + In {k’h/x)/k'h(x)\ kh(x) = txh(x). (4) (5) (6) 310
Рис. 1. Схемы цветоразличения объекта ранга 4 для неподвижной (о), и подвижной (б) рецепторных поверхностей здесь перпендикулярно плоскости схемы, а знаки ”+” и при Sj метят, по какую сторону от этой плоскости сформирован сигнал N S:= laJ (хр). Кружки зачерненные отмечают места вхождения латераль- p=i ных сигналов s в узел, незачерненные — то же для центральных сиг¬ налов, а в кружках с точкой формируются оценки двух независи¬ мых кодов: lnA^1 и InKi- Полная схема представляет собой гексаго¬ нальную сетку узлов и шин пространственных сумматоров, в которых вес сигналов-слагаемых падает по мере удаления от узла. По поводу необходимой для организации цветокодирующей схемы полевой регу¬ лярности ее узлов и топографии связей между ними заметим, что в сетчатках ряда рыб обнаружены и изучены гексагональные мозаики групп фоторецепторов, похожие на предложенную нами. Если поле фоторецепторов движется (как это происходит с сет¬ чаткой in vivo), т.е. движется относительно координат х проекция сцены, то пространственные производные в процедурах (2) и (4)—(6) можно заменить на временные [7]. При этом для получения кодов следует совершить преобразование Ai2a + ln\dA\}a/dt\—ln| dAaa/dt\ (/=1,3), ^ не требующее специальной организации латеральных цветовых связей (формирующих Sj), как это было в схеме с пространственными про¬ изводными. Сравнительная простота реализации схемы с временнь'ши произ¬ водными может достигаться введением режима целенаправленного сканирования объектов сцены зрительной системой. Схема цвето¬ различения подобного типа приведена на рис. 1, б, где блок ”|Э/Эг|” формирует модуль временнбй производной сигнала (при этом латераль¬ ных суммаций нет). Коснемся вопросов, связанных с наличием в сцене разноранговых объектов, имея в виду желательность включения таких ситуаций в некую однородную схему цветовой обработки. В сценах с двумя источниками освещения могут встретиться объекты и невысокого (г = 1), и предельно высокого (из еще кодируемых трихроматической 311
системой) ранга (г = 4). В алгоритме (5) изменим отношение под знаком In на следующее: ((Д hua(x))' + m{b,ua(x))' + b), где 8 — близкая к нулю константа. Модифицированная таким образом процедура обеспечит одновре¬ менное формирование кодов объектов ранга от 1 до 4 (при г< 3 In (0/0) = 0 и результаты преобразований (5) и (6) совпадают). Ничуть не уникален и случай ’’разноранговости” частей проекции одного объекта, например когда он многогранник. Если дифференциальный оператор в уравнении (5) организован по правилам преобразования (3), процедура (4)—(6) превратит изображение объекта в композицию констант двух видов: на проекциях ребер объекта будут сформи¬ рованы коды (5), во внутренних же областях граней — коды (6) (r= 1), а значит, введение последующего заполнения полей А:Л/сигналом их окру¬ жения (по типу распределения потенциала двойного слоя в электро¬ статике) обеспечит единообразное кодирование по всей проекции полиэдрального объекта. Этап цветоразличения обеспечивает для системы следующие воз¬ можности: отличить проекции разных объектов; продолжить обработку изображения таким образом, чтобы по¬ лученные коды объектов как функции спектров испускания S(k) и отра¬ жения Ф(А.) преобразовать к виду, инвариантному к цветности освеще¬ ния; воспользоваться оцененным значением ранга объекта для форми¬ рования эвристических гипотез о его форме и типе источников освеще¬ ния; выделить проекцию метасцены, если она имеется (для нее необ¬ ходимы независимые цветовые оценки освещения); найти в сцене складчатые объекты, с помощью которых может быть уточнена гипотеза о цвете источника (и оценена конфигурация самих складок). Учет вклада рефлексов. Продолжим начатое выше рассмотрение свойств тех особых объектов, цвета которых в местах углублений и складок подчиняются закономерностям, не препятствующим при¬ менению методов цветоразличения и для построения искомых кодов, и для формирования гипотез о цветности освещения, несмотря на то, что полный учет внутренних рефлексов на объекте, как легко показать, имеет следствием неограниченный его ранг, так как ком¬ поненты цвета в этом случае подчиняются соотношению Добавление в сумму (7) еще одного слагаемого и=0 естественным образом обобщает особенности распределения цвета для неламберто¬ вых (глянцевых) поверхностей в выпуклых их частях, завершая фор¬ мальную классификацию геометрических и цветовых особенностей в сценах с одним источником следующими эвристиками: (7) 312
в районе блика г — 4 (в сумме (7) остаются члены и = 0, 1); на выпуклых небликующих частях г = 2 (в выражении (7) — один член п = 1); в лунках и складках г^б (конкретная их форма, как можно пока¬ зать, диктует необходимость учета не менее трех членов в соотно¬ шении (7), начиная ся=1, 2). Таким образом, неламбертовы поверхности (с их неидеализиро¬ ванными характеристиками рассеяния) включаются в общую схему цветоразличения, возвращая к вопросу об особых окрасках сцены: цвета и выпуклых, и вогнутых частей так окрашенного объекта в А принадлежат плоскости, общей для ахроматической и одной из коор¬ динатных цветовых осей. Признаком особого объекта (ранее мы назвали его р-объектом) может послужить выполнимость соотношения e'(l)Ml) = fl'(2)/e''(2), где 1, 2 — любая пара точек в углублении p-объекта (с неравными цветами); ( и j — индексы координатных осей, которые не лежат в плоскости Р. Совпадая формально с методом кодирования объекта ранга 2 (а для а/х) имея аналогом алгоритм (6)), приведенное соот¬ ношение дает способ вычисления ArJ- для p-объекта, а значение этого кода является оценкой одной из двух компонент зональной цвет¬ ности источника (вторую компоненту можно оценить, если в сцене есть другой р-объект, плоскость цветов которого не совпадает с плос¬ костью первого). И хотя цвета p-объектов в общем случае неколлинеарны, коды p-объектов получаются из алгоритма К) = (а’( \)а!(2) -а'( I )а'(2))/(а>( 1 )а'(2) -а'( 1 )а'(2)), представляющего собой конечноразностный аналог преобразования (2) для объекта 4. Учет того, что цвета p-объектов принадлежат плоскос¬ ти Р, проходящей через координатную ось, приводит к упрощению процедуры различения K'j — a'(n)/d(п). А’- = 0, Kj — О, где п = 1, 2; / — индекс оси, инцидентной Р. Если бы удалось показать, что в сценах с отсутствующими пря¬ мыми признаками цветности освещения (каковыми могут служить цвета ахроматических объектов и бликов) цвета складчатых поверх¬ ностей, не отображаемых в пространстве А ни в одну из трех ’’особых” плоскостей, но лежащих поблизости от таковых, с удовлетворяющей точностью все-таки следовали бы описанным выше закономернос¬ тям, это существенно усилило бы арсенал эвристических приемов оценки цветности освещения и послужило бы решению основной задачи правильной оценки Ф всех объектов сцены. 313
Узнавание окраски в сценах с одним источником Постулаты модели и постановка задачи. Проблема трансформации цвета и первые гипотезы о механизмах константной обработки цвето¬ вых сигналов имеют уже вековую историю [15]. Известны и современные теории, и модели подобного рода [16, 14]. Среди них наибольшей известностью пользуются зональные модели константности цвето- восприятия [17, 6]. Последним свойственна независимая ’’поправка на освещение” [15] в каждом цветовом канале, что обеспечивает действительно инвариантную оценку отражательных свойств поверх¬ ности лишь при зональном устройстве спектральных функций, т.е. при условии, что они являются трехступенчатыми функциями с фиксированной парой длин волн, разделяющих на зоны видимый спектр. Отметим, что кривые испускания естественных источников осве¬ щения (за редкими исключениями и искусственных) не имеют зональ¬ ного вида, а кривые отражения большинства природных пигментов принадлежат более чем трехпараметрическому семейству гладких функций. Известно также, что кривые чувствительности рецепторов в изученных системах зрения представляют собой колоколообразные функции, удовлетворительно аппроксимируемые функцией нормаль¬ ного распределения. Опишем одну из моделей цветовой константности, созданную с учетом упомянутых выше обстоятельств [14]. 1. СЦЕНА. Наблюдаемые объекты лежат в одной плоскости (не дающей бликов в направлении наблюдения). Объект характеризу¬ ется единой окраской, причем кривая отражения Фт(Х) каждого объекта задается функцией Z.mexp[-pm(X— Xm)2]. Здесь Lm—светлота ш-объекта (для ахроматических объектов pw = 0, при этом введенная характеристика совпадает с общепринятой); ц — насыщенность объекта или источника (число это может быть отрицательным, если окраска или освещение принадлежат ряду пурпурных); Хт — цветовой тон объек¬ та (для спектрального ряда значение Хт характеризует положение тахФт(Х), для пурпурного — пнпФт(Х)). х » 2. ОСВЕЩЕНИЕ. В сцене один источник. Его относительный спектральный состав S(X) задается функцией G'jexpf-p^X— X*)2]. Ко¬ эффициент Gs выражает в относительных единицах интенсивность светового потока. Длина волны Xs (линейный масштаб по X: 500 нм = 10 условных единиц) совпадает с точкой экстремума функции и задает цветовой тон источника освещения. Параметр определяет степень селективности кривой S(X) или насыщенность источника. 3. НАБЛЮДАТЕЛЬ. Его трихроматическую систему, реагирующую на дистальные стимулы вида Fm(X) = S(X)®m(X), в каждом цветовом канале характеризует абсолютная спектральная чувствительность приемников, задаваемая функцией ху(^)=ехР[-(^_^>)2] (параметр р выбран равным единицей Реакцией а]т приемника j на стимул F, отраженный объектом т, назовем интеграл ln(J" Fm(X)%;(X)dX) (для белого объекта wQ>w(\)=l). 0 314
4. ЗАДАЧА. Построить алгоритм, оперирующий входной инфор¬ мацией в виде реакций а1т и ajw и формирующий на выходе оценку цветовых параметров: Хт, цт, Lm любого объекта сцены; Xs и р, источника освещения (или производных от них параметров цветности qs и уД. Пространство предметного цветовосприятия. Шкала цветовых то¬ нов, задаваемая на спектральной оси положением экстремумов гаус¬ совых кривых S(X) и Ф(Х), разомкнутая. Цветовое пространство трихромата замкнуто по тонам (так называемый цветовой конус). Для стимулов максимальной насыщенности (каковыми являются мо¬ нохроматические излучения) непрерывным изменением одного лишь тона красный цвет заменить на синий удается двумя путями: через монохроматические оранжевый, желтый, зеленый, бирюзовый, а также через область пурпурных тонов, являющихся смесью красного и си¬ него. По субъективной оценке насыщенности метрика трихромата явным образом нелинейна (два гауссовых спектральных распреде¬ ления, уравненные по яркости и различающиеся значением ц5, колори¬ метрически отличимы, если, например, ц51 = 0, 1, a = 2, и неотличи¬ мы, если рл = 10, a ps2~20}. В целях сближения описываемой модели константности со свойствами трихроматического цветовосприятия вве¬ дем производный от насыщенности цт параметр чистоты qm = цт( 1 + цт + + pj), меняющийся от 0 до 1 при изменениях рт от 0 до °° и являющийся инвариантом объекта при = const, и ’’круговой тон” \|/т, задаваемый посредством соотношения VJ1/3+UJ/^)(arctg(2(Xm-X!,))-90o)+120°, (8) где значения \|/т выражены в градусной мере; A.s=10,5 соответствует тону середины видимого спектра (525 нм); причем qs = ps/(l + ps). Спектральному диапазону в выражении (8) соответствует сектор углов в 240° (от -120 до 120°). Остальная часть единичного круга цветности отображает пурпурные излучения или окраски, причем принадлежность объекта или источника первому или второму сектору регулируется знаком параметра ц (у пурпурных источников qs<0; у пурпурных объектов q,„<0, причем + -0,5). Объединение полярной системы координат q, у (цветности) с осью светлот L за¬ вершает организацию трехмерного пространства оценок окраски, при¬ чем любая гауссова окраска Ф (при данном гауссовом источнике) отображается взаимно однозначно в точку единичного цилиндра (L, q, у). Алгоритмы вычисления цветовых параметров. Найдем, как выража¬ ются реакции ят и а„. через параметры, характеризующие прием¬ ники системы (Xj), окраску объекта (Хт, \хт, Lm) и цветность источника (A-j, pf), с тем чтобы решить обратную задачу: построить такие функ¬ ции от ат и а„, чтобы они являлись точными оценками необходимых нам цветовых параметров. Для гауссовых спектральных функций реакции ау„ (п = т, w; j= 1, 2, 3) на стимул 5(>.)ФЛ(Х) имеют вид ajn = B;L„exp(-Cjn) Jехр(2BJnX — А„Х2)dX, о 315
где Aw— 1 -Ь Цр Ат Aw~\~ \im; Bjw Xj~\~ В)m BjW~\~Xmpm; Cjw = X2 + X2ps, Cjm=CJW + X2pm. Использовав известное соотношение Jexp(2BX — A X2)dX = (к/А )'л( 1 — Ф*(-B/A 'л))ехр(В2/Л), 0 (где Ф* — табулированный интеграл ошибок) и задавшись предель¬ ной погрешностью оценки в 1%, получим явное выражение для реак¬ ций dj через цветовые параметры системы и сцены. После логариф¬ мирования оно имеет вид ajn = \n(GsL„(n/A„)'A) + В2/А„ — Cj„(n = m, w; L„,= 1). Из этого уравнения и выводятся соотношения, используемые для решения задачи: (а)п — ain)/(Xj — X,) = (Bjn + В,,,)/А „ — X, — Xj, Cj = ajm — ajK = ln(Lm(A u./Aj‘A)-pm(AH.Xm — BJK,)2/A mA Алгоритмы точной (/11) и приближенной (А2) оценки цветовых параметров описаны в статье [14]. Оправдывает ли ббльшая, чем у АI, простота процедуры А 2 потерю точности производимых оценок, если прообразом модели взята зри¬ тельная система человека? Оценим эту потерю, допустив, что реальные функции х(^-)> Ф(^) и ^(Х) аппроксимированы соответствующими гауссо¬ выми кривыми в масштабе шкалы длин волн, для которого piЦ2цз= 1. Сделанное приближение для таких природных источников, как солнце, небо, зеленый полог листвы, как можно показать, не нарушает условия Pj<0,2. Условие рт<1 выполняется для объектов, восприятие которых в принципе требует учета цветности освещения (при щ<0,2 и рт>1 источник практически не влияет на цвет отраженного объектом света). При выполнении этих условий погрешности Е оценок А2 состав¬ ляют (в процентах от оценок AI): Eq< 15%, EX^EL< 10%. Оценка тона Хтс(А 2) тем менее отличается от Хт, чем ближе значения X, и Хт и чем ближе к нулю величина рг Если источник освещения равноэнергетический (ц5 = 0), qmc = qm, Xтс = Хт, Lmc = Lm, т.е. оценки по А\ и по /12 одинаковы. Для ахро¬ матических объектов (рм=0) понятие тона теряет смысл, чистота qmc = 4m — 0, а для светлоты Lmf = Lm = exp(c;), что совпадает со значением коэффициента отражения для таких объектов. Оценка lnLmr в А2 интересна тем, что представляет собой трехчлен, первое слагаемое которого дает оценку светлоты для зональной модели константности (нулевое приближение, не требующее знания qmc и Хтс), второе — вносит поправку с учетом степени селективности гауссовой окраски, третье — учитывает близость кривой к краям видимого спектра, т.е. может рассматриваться как итеративная. Для предельно бедной сцены, содержащей единственный плоский объект, ситуация похожа на колориметрическую. Зрительная система лишена в этом случае возможности оценить вклад цвета освещения 316
в цвет отраженного объектом стимула ДА.) (неясно, например, желтый ли это объект при синем освещении или наоборот), однако оценка цветности F(X) при этом вполне реальна. В А 1 параметры ц5 и Xs явля¬ ются оценками гауссова стимула (для ахроматического объекта цвет¬ ности падающего и отраженного излучений равны). В алгоритме А 1 выявляемы два режима работы: по одному цветовому вектору реакций а„, вызванных стимулом F(X) со стороны ахроматического объекта, оценивается цветность F(X); по двум векторам ат, а,, оценивается цветность объекта. Если во втором режиме корректирующий сигнал а„ включен в об¬ работку основных сигналов ат> то в первом поправка на освещение для ат не фигурирует в процедуре обработки. Константные оценки \хт и Хт для данного объекта нетрудно сделать аконстантными для стимула F(X) от этого объекта: блокирование сигнала а„ об освещении в А1 превращает константный механизм модели (второй режим) в цветностный колориметр, нормирующий стимулы по гауссову спектральному распределению (первый режим). Иными словами, для произвольного распределения R(X) такой ко¬ лориметр вычисляет цветовые параметры метамерного (колоримет¬ рически неотличимого) гауссова стимула S(X), т.е. присваивает стимулу R(X) тон A.J, насыщенность и т.п., тем самым картируя его цвет¬ ность в координатах X, ц, (или у, q). Оценки qmc и Хтс могут быть получены по формальным правилам аконстантной оценки вектора с, являющегося трехпараметрическим инвариантом в зональной модели. Алгоритм /42 сочетает достоинства гауссовой аппроксимации кри¬ вых чувствительности Xj(X) (колоколообразная, отнюдь не ступенчатая форма кривых х(А.) присуща всем изученным фотоприемникам в био¬ логии) с абсолютной устойчивостью к единым для сцены цветоадап¬ тационным изменениям (/42 инвариантен к аффинным преобразова¬ ниям в пространстве А, связанным с цветоадаптационными изме¬ нениями, так как все цветовые оценки в нем строятся из функций Cj, нечувствительных к этим изменениям). И потому сопоставление возможностей алгоритмов /41 и /42 в машинном эксперименте с за¬ данием спектральных функций, близких к реальным, выглядит априо¬ ри вполне естественным. Программная реализация алгоритмов и ее результаты. Эксперимен¬ ты с программами, написанными по алгоритмам /41, А2 и ряду их модификаций, предприняты для выяснения возможностей разрабаты¬ ваемого метода в условиях отмены ряда ограничений, предписанных теорией. Требования к спектральным функциям, позволившие выразить цветовые параметры освещения и окраски через реакции на хромати¬ ческие и ахроматический объекты, были намеренно нарушены в сле¬ дующем: для кривых х(^) учитывались индивидуальные характеристики фотопических приемников человека, при этом Ц1 = цз=1,1, а Ц2=1,35 (т.е. ц, т^ц2); кривые Ф не были гауссовыми, их задавали с пульта ЭВМ в виде 317
суперпозиции трехпараметрических субкривых восьми типов (число однотипных субкривых, аппроксимирующих некую реальную Ф, доходило до шести); кривые S(A.), кроме гауссовых, могли быть еще семи иных типов (пурпурные, линейчатые, планковские и пр.). Входной блок программ, выполнив численное интегрирование заданных оператором спектральных функций, формировал компоненты реакций dj. Основной блок вычислял необходимые параметры по всем исследуемым алгоритмам. Сервисный блок управлял плоттером (рисовавшим входные спектральные функции и выходные эпюры на проекциях единичного цилиндра L, у, q для каждой счетной серии). Серия вычислений строилась следующим образом: точка экстрему¬ ма выбранной кривой S(k) занимала на шкале длин волн ряд позиций, разделенных равными интервалами, в диапазоне 400—700 нм (для планковских источников дискретно изменялась их цветовая темпе¬ ратура от 2500 до 25000 К). Степень константности цветовых оценок для данного объекта при изменениях цветового тона источника вычислялась в каждой серии, сравнительной мерой при этом служила аконстантная оценка цветности отраженного объектом стимула (отобра¬ жавшая его колориметрические изменения). Помимо алгоритмов А1 и А 2, одновременно исследовались их аналогии по модели АППЛИКАЦИЯ [6], отличавшиеся тем, что гипотеза о цветности освещения строилась для них не по одному w-объекту, а по трем хроматическим Ь-объектам, имевшим максимумы функций Ф в красной, зеленой и синей областях спектра (заменяв¬ шим w-объект: таким образом, цветовые оценки для объекта т вы¬ числялись по 12 реакциям, а не по шести, как в А \ и А2). Для оценки эффективности исследуемых алгоритмов был выбран и вычислялся коэффициент константности Е для тона (пожалуй, важней¬ шего из цветовых параметров), равный отношению разброса по уг¬ лам для тона стимула F в счетной серии к таковому — для тона объекта по данному алгоритму (эксперименты с чисто гауссовыми спектральными функциями исключены из итоговой статистики, в виду того что теория создавалась именно для такого класса функций и коэффициент в этом случае мог в сотни раз превышать средний уровень константности тона при иных аппроксимациях спектральных функций). Кривые Ф были условно отнесены к четырем группам: колоколо¬ образные, скругленные, ломаные, ступенчатые (разброс значений Е оказался наименьшим для первой группы по А 1: Етах/Етт = 100/5 = 20 и наибольшим для четвертой по А2: 40/0,5 = 80). Основные итоги на материале 1000 серий счета этой части экспе¬ римента таковы: группы алгоритмов А\ и А2 (аналоги того и другого в модели АППЛИКАЦИЯ, продемонстрировавшие в эксперименте близкие по¬ казатели, в дальнейшем анализе объединены) обладают высокой степенью константности цветовых оценок, особенно высокой по тону (усредненные коэффициенты Еч по А\ и А2 равны соответственно 13 и 4); 318
ограничение класса допустимых в модели типов освещения семейст¬ вом планковских источников увеличивает в 1,5—2 раза степени эф¬ фективности и по тону, и по чистоте (среднее значение коэффициента Ед, определяемого сходным с образом, возростало при этом от четырех до семи для А\ к А2 соответственно). работа алгоритмов подчинялась эмпирическому правилу, справед¬ ливому для человеческого восприятия: чем более отчетлив глобаль¬ ный экстремум кривой Д(Я.), тем выше степень константности трихро¬ мата (при условии, что насыщенность источника не слишком высока), т.е. локальные нарушения монотонности и гладкости кривой отражения объекта не оказывают решающего влияния на исход процедуры цвето¬ восприятия (в модели, если выполняется условие -0,1^р5^1, при более селективном освещении степень константности, коррелируя с возможностями трихроматического зрения, резко идет на убыль); выявлена удовлетворительная устойчивость исследуемых алгоритмов к шуму квантования входных сигналов — 64 дискрет на всем диа¬ пазоне реакций в каждом цветовом канале (для данной сцены) достаточно в среднем для выполнения условий £\> 5, E^EL> 3; введение цветоадаптационных эффектов в модель снижало зна¬ чения коэффициента Е для алгоритмов группы А1, доводя их (при 20%-ных отклонениях чувствительности от уровня нормы для любой пары типов приемников в триаде) до значений таковых в алгоритме А2. Коэффициенты EL отражают инвариантность цветовых оце¬ нок, получаемых при изменениях цветности источника, однако они не дают представления о том, истинная это константность или лож¬ ная (см. определение 4). Адекватность оценок выявляется отличием их от таковых при равноэнергетическом источнике освещения (высту¬ пающем в роли эталона ахроматического освещения) В каждой счет¬ ной серии дополнительно вычислялись все необходимые эталонные оценки, отклонение от которых и характеризовало степень адекват¬ ности основных оценок. Алгоритмы и феноменология цветовосприятия. Вид спектральных функций в модели выбран по двум основным соображениям: в силу удовлетворительности самой аппроксимации природных спектральных кривых (большей в сравнении с зональными приближениями и другими ранее предлагавшимися их аппроксимациями [18]) и по соответствию свойств гауссовой кривой требованиям задачи (интегрируемость про¬ изведения кривых S, Ф, Xj в виде квадратичной функции от интере¬ сующих нас параметров цветности объекта и источника обеспечила в конечном итоге простоту разработанных алгоритмов). Избранный подход оказался обнадеживающим и в том отношении, что, помимо присущей и модели, и нормальному трихромату двойст¬ венности восприятия (наблюдатель может оценивать и окраску объекта, и — аконстантно — цвет отраженного им излучения), модель воспро¬ изводит и другие особенности человеческого восприятия: в общих чертах его цветовую метрику; итеративный характер производимых оценок (светлоты); феномен так называемого одновременного цветового контраста, 319
являющегося ’’модулем” детерминированной периферической обработ¬ ки [19], организованным для создания гипотезы о цвете освещения с помощью усреднения сигналов по полю в каждом цветовом канале и формирующим для высших отделов зрительной системы некий началь¬ ный вариант цветовой интерпретации сцены1; известные для трихромата отклонения от полной цветовой кон¬ стантности, проявляющиеся при специальной организации сцены в акон- стантном и ложноконстантном восприятии [6] (и моделируемыми по А 1 и А2 соответственно при и отсутствии w-объекта в сцене). Окраска и форма в статических моделях цветового зрения Модели с учетом вторичных отражений. Вернемся к рассмотрению особенностей восприятия трехмерных объектов в сценах, распреде¬ ление первичных и вторичных источников освещения для которых учитывается более полно, чем для плоских ламбертовых сцен, с целью очертить общий подход к статическим задачам и возможностям три- хроматических систем с позиций ’’вычислительной теории” [20], объеди¬ няющей весь арсенал средств зрительной обработки монокулярного изображения — и алгоритмы цветовой интерпретации объектов, и методы оценки его формы. И поскольку вопросам вычисления формы, или ее эвристической интерпретации, посвящена обширная и содер¬ жательная литература (см. обзор [21]), сосредоточим наше внимание на проблеме взаимосогласованности блоков оценки цветовых и стерео¬ метрических параметров сцены. Любая хроматическая поверхность (т.е. такая, кривая отражения которой O(A-)^const), имеющая вогнутые участки, из разных мест вогнутости отражает излучения, различающиеся объективной цвет¬ ностью (даже при условии, что в данной сцене нет объектов другой окраски, а источник освещения, например, равноэнергетический). Следовательно, в общем случае и тон и насыщенность оцениваемых аконстантно стимулов из разных точек складчатого объекта, следуя закономерностям многократного отражения света в складке, харак¬ терным именно для данной ее формы, могли бы оказаться источни¬ ком информации о геометрических параметрах складки, если бы зрительная система уже располагала надежными оценками цветности освещения, а в случае уверенно распознанной формы объекта послу¬ жили бы построению гипотезы о цветности первичного источника. В силу этих обстоятельств заманчивой представляется идея найти общие (быть может, приближенные) закономерности изменений цвета в лунках и складках того или иного профиля для оценки параметров профиля и цветности освещения. Для нескольких простейших конфигураций складок (конической лунки, прямолинейной двугранной складки и т.п.) была рассмотрена 1 Можно показать, что замена в А 1 сигнала о(„ усредненным по зрительному полю канала обеспечит в случае богатой набором окрасок сцены удовлетворительную цве¬ товую константность, в случае же зрительной ситуации классического контраста воспро¬ изведет его перцептивную феноменологию. 320
I картина изменений спектрального распределения отраженного света в поперечном сечении складки, иными словами, в сумме (7) для данного профиля, характеризуемого некоторым углом раскрыва у, была изучена закономерность, связывающая веса g„ рефлексов порядка п (т.е. компонент стимула вида Фт(А.)"5(7.)) с углом у и положением 90 на профиле. Оказалось, что сумма ряда 2 g/x)<bm(k)nS(k) имеет п= I для подобных конфигураций простое аналитическое выражение вида у(Х)Ф(А.)5(А.)/(1—Ф(>.)( 1— v(x)), где v(x) — некая известная функция угла у и координаты х профиля. Полученные результаты довольно естественно вписывались в задачу использования цветовых особенностей складчатых объектов, назван¬ ных выше p-объектами, для оценки угла у и цветности освещения в сценах, не содержащих ахроматических w-объектов. Одновременно с этим создавалась возможность исследовать конкурентную ситуацию, в которой параллельно сопоставлялись бы возможности модели АППЛИКАЦИЯ, реализованной в виде аналога алгоритмов А1 или А2, а также моделей РЕФЛЕКС и КОЛОР, использующих соот¬ ветственно цветовые свойства /7-объекта и возможности колориметри¬ ческого режима А\ для оценки цветности объектов по излучению максимальной насыщенности, пришедшему из глубины лунки на этом объекте. Не слишком интересен для рассмотрения случай точного выпол¬ нения требований к окраскам и освещению для создания в сцене особой ситуации, когда цветность освещения можно оценить по двум p-объектам. Более перспективно промоделировать вполне реалисти¬ ческую ситуацию с числом объектов, ббльшим трех, два из кото¬ рых и лишь очень приближенно удовлетворяли бы при данном источ¬ нике требованиям к /7-объектам. Подобную попытку с необходимостью предваряли анализ ограничений на окраску /7-объектов, накладываемых на Ф(А.) выбором вида освещения (например, зональный источник или гауссовый), а также выяснение применимости разрабатываемой процедуры для объектов, лишь приближенно следующих постулатам теории /7-объектов. Был рассмотрен класс зональных спектральных функций, для которых требования к /7-объектам оказались весьма простыми, а эффективность процедуры обнадеживающе высокой. Требования эти таковы: для шести двупараметрических семейств окрасок (красных, желтых, зеленых, лазурных, синих и пурпурных), удовлетворяющих условию Ф^Ф7’, где / и j — индексы любых двух зон (из трех), и любого зонального источника освещения в пространстве А цвета так окрашенных складчатых объектов принадлежат плоскостям, проходящим через ахроматическую и координатную оси. Соответствующий анализ для гауссовых источников освещения по¬ казал: независимо от значений параметров Gs, Lm, pm при выполнении условия (X/ + >.;)/2 = \т + (Кт — >.t)p,, связывающего параметры гауссового иЬточника и значение экстремума кривой отражения /7-объекта с ин¬ дексом / плоскости рефлексов любая окраска; функция Ф(к) 21. За к. 1668 321
которой симметрична относительно k„ удовлетворяет всем требо¬ ваниям к р-объектам. Трихроматические модели для неплоских объектов. В экспери¬ менте три трихроматические модели интерпретировали сцену из четырех объектов (/ = 14), каждый из которых имел плоский участок (точка /1) и коническую лунку (ее край — точка /2, дно — точка i3), угол раскрыва которой у, а также функции Фт,(к) и S{k) задавались с пульта ЭВМ. Модель АППЛИКАЦИЯ строила гипотезу об источнике по 12 реакциям (по три реакции из каждой точки /1), КОЛОР оцени¬ вала цветности объектов по трем реакциям (из точек /3), РЕФЛЕКС использовала 18 реакций от пары объектов, по некоторым правилам выбранных при данном источнике освещения в качестве лучших кан¬ дидатов на роль p-объектов для формирования гипотезы об источ¬ нике и по всем девяти (в другой версии по шести) реакциям от каждого объекта оценивала значение siny,. Для лунки в форме прямого кругового конуса на матовой поверх¬ ности окраски Фь освещенной диффузным источником (или далеким точечным источником, освещающим нормально плоскую часть сцены) состава S(k), реакции о, вида (7) на излучения, рассеянные разными участками конической образующей лунки, выражаются уравнением оо a/x) = ln(v(x)JW)%(b)/(l/®(b)-l +v(x)))db), (9) О причем на самом краю лунки w(2) =(1+siny)/2, а в центре (на дне) v(3) = sw2y, где у — угол между осью и образующей конуса (для точ ки х = 1 плоской части объе кта siny = 1 = и( 1) и формула (9) не про¬ тиворечит соотношению (1)). Для p-объекта с гауссовой кривой Ф(А.) его цветовой тон кт выра¬ жается весьма просто через код InЩт): (2кт — к, — kjXkj — kj) = ку = Atja(x). Это соотношение одновременно и эвристический признак р-объекта: А0-а(2) = Aija(3). Однако оценка тона только p-объекта сцены не помогает решить всех задач в модели: необходимо оценить цветность источника осве¬ щения, трансформирующего цвета каждого объекта сцены. Искомую гипотезу удается построить, использовав требование к гауссову источ¬ нику вместе с предположением, что в сцене найдутся два р-объекта (присвоим им индексы т и и). Алгоритм оценки параметров к5 и qs (по сути исчерпывающий цветовую часть модели РЕФЛЕКС, отличающуюся от аналогичной процедуры в модели АППЛИКАЦИЯ) особенно просто формулируется для системы, две крайних на оси к кривых Х;(Х.) которой симметричны относительно центральной Хг(^): qs — (Дзз ат — Ana„)/2d2, ks = ki — (Дгз ат + Д,2 а„)/4dqs, где d^=k2 — А-1 = Я.з — к2 — параметр, задающий расстояние между максимумами кривых чувствительности двух соседних приемников. 322
Из числа опробованных в машинном эксперименте алгоритмов оценки угла у конической лунки наиболее прост и одновременно достаточно устойчив и точен одноканальиый: среднее из положитель¬ ных корней Sj уравнения (1 + 2s)a!(l) = 4яЧ2) — а>(3)Л2 по каждому цветовому каналу и есть оценка значения siny = (si + si + s})/3. Алгоритм получен с учетом уточнений к выражению (8) из первых двух членов ряда (7), т.е. пренебрежением членами QO (0,5 + s/2 — s2) J* 5Ф3х/1>. + - О Критерии эффективности модели и итоги экспериментов на ЭВМ. Систематизируем наиболее существенные обстоятельства, определя¬ ющие эффективность модели константного восприятия, и рассмотрим их влияние на ее работу по итогам экспериментов с обсуждав¬ шимися в этой работе алгоритмами. Эффективность модели как интегральную оценку естественно описывать через ряд независимых критериев (относящихся и к структуре модели, и к результатам её функционирования). Сформулируем их в виде требований к модели: модель должна справляться с интерпретацией трехмерных сцен с их реальными (спектральными и стереометрическими) особенностями светорассеяния: рефлексами, бликами, неламбертовостью объектов и пр.; процедура зрительной обработки должна быть преимущественно: однородной (что обеспечивает возможность аналоговой реали¬ зации алгоритмов модели послойной структурой типа рецептивных полей), достаточно простой (что проявляется в устойчивости модели к шуму квантования ее входных сигналов, в быстрой сходи¬ мости процесса к результату и малой его зависимостью от ког¬ нитивных процессов восприятия); желательна стабильность цветовых оценок в условиях изменений спектральных свойств освещения, цветоадаптационных характеристик приемников; формируемые в модели оценки обязаны коррелировать с соответст¬ вующими объективными качествами предметов сцены (а также и источ¬ ника освещения); язык модели необходимо согласовать с особенностями решаемой ею задачи (форма представления входной информации, промежуточных и конечных результатов должна естественным образом отражать психофизиологические и физические аспекты моделируемого фено¬ мена); машинный эксперимент с моделью следует вести в два этапа: основной этап как можно более полно охватывает возможные комбинации изменяемых с пульта параметров в ’’рабочем диапа¬ зоне” модели для статистической достоверности общей оценки ее эф¬ фективности, 323
этап ’’диагностический” воспроизводит основные типы сцен и варианты условий наблюдения, при которых моделируемая задача или не решается реальной системой (аконстантные условия) или решается ею со систематической ошибкой (ложно-констант¬ ные условия); полезно объединение нескольких фрагментарных моделей (при на¬ личии в них сходных процедур, блоков) в одну гетерархическую. Нетривиальность, реалистический характер модели, а также согла¬ сованность ее языка и цели выявляются уже в самой постановке за¬ дачи, в ее структуре и постулатах. Например, переход от зональ¬ ной к гауссовой аппроксимации спектральных функций — это шаг, сближающий модель и моделируемый ею мир и к тому же дающий возможность описания результата обработки в категориях, соот¬ носимых с перцептивным опытом трихромата. Учет доминирующего рефлекса в качестве дополнительного источника освещения (см. мо¬ дели ГОФР, НАТЮРМОРТ [6]), включение в схему обработки реф¬ лексов на складчатом объекте (модели KOJ10P, РЕФЛЕКС) или анализ сцен с неплоскими объектами и двумя источниками (см. мо¬ дель ТОНИРОВАННЫЙ ГИПС [6]) отражают стремление к широте и корректности модельных постановок. Однородность предлагаемых процедур двумерной обработки изобра¬ жений или по крайней мере принципиальная сводимость алгоритма к полевой схеме — это показатели эффективности модели и по уровню параллельности и единообразия вычислений, и по степени сходства функциональных свойств модели с соответствующими электрофизиоло- гическими данными [3]. И чем короче цепь преобразований в модели (и за счет алгоритмической простоты процедуры, и в силу ее парал¬ лельного характера), тем она более устойчива в работе с сигналами, численные значения которых задаются не с машинной точностью, а намеренно квантуются некоторой шкалой дискретизации. Такому тестированию подвергались все разрабатываемые автором модели в стадии их программной реализации. Приведем результаты квантования в разных моделях: АППЛИКАЦИЯ КОЛОР РЕФЛЕКС 2 либо 3 1 4 Ад 30 20 >00 Тип объекта Двумер- Трех- Трех- ный мерный мерный Здесь Na — число объектов в сцене, Na — число дискрет интенсив¬ ности возбуждений в канале по всей сцене, в среднем достаточное для удовлетворительного уровня константности (и истинности) по всем выходным параметрам данной модели. Произвольность выбора сцен на этапе машинного исследования модели, способствующая неадекватной оценке ее эффективности, может быть преодолена накоплением статистики таких оценок при полном переборе сочетаний, связывающих допустимые в модели типы источников освещения с семейством объектов, геометрические ха¬ 324
рактеристики которых (sin у) фиксированы, а цветовые — варьируют некоторым регулярным образом. В программе MARC, реализовавшей конкуренцию алгоритмов по моделям АППЛИКАЦИЯ, РЕФЛЕКС и КОЛОР, для получения объ¬ ективной оценки их работы восемь типов источников освещения ком¬ бинировали с шестью разновидностями каждой из окрасок объекта (по числу типов субкривых, из однотипного набора которых и фор¬ мировали Ф(А.) каждого объекта). Таким образом, в итоговую суперсерию входили 912 сцеи (8X6X19) (тон освещения принимал 19 фиксированных значений — серию — в видимом диапазоне спектра), выходные параметры по которым обсчитывали при неизменных значениях sinym, х> и Ад. В супер¬ серии вычислялись для каждой сцены и усреднялись дисперсии D (относительно эталонных значений для равноэнергетического источ¬ ника): D((7s),D(<7m), D(Lm), D(Xm) для моделей АППЛИКАЦИЯ, РЕФ¬ ЛЕКС и КОЛОР (т= 1, 2, 3, 4). Формировалась и общая оценка эффективности модели — коэффициент V, характеризующий число адекватно опознаваемых объектов данного вида для всей серии из¬ менений тона освещения, для которого вычисляли и его D(F) (по каждому объекту в каждой модели свою). Сформулируем важнейшие итоги эксперимента с программой MARC. Модели дали удовлетворительные результаты со всеми испробованными типами окрасок и источников в диапазоне значений р5 от -0,03 до 0,25. В соответствии с аналогичными возможностями трихромата модели снижали свою эффективность с ростом щ. Для семейства планковских источников получены наивысшие показатели (параметр V достигал значений 105), для пурпурных и зональных источников — худшие (за исключением модели РЕФЛЕКС, работавшей с зональными источниками на среднем уровне: К» 10 ). Модель АППЛИКАЦИЯ наименее уязвима в отношении качеств источника, однако при высокой константности цветовых оценок по тону бли¬ зость их к эталонной не всегда достаточна. Среди цветовых пара¬ метров наименее стабильно оценивалась светлота Lm. Средняя ошибка по круговому тону у при ц* = 0,05 и Ад=100 в суперсериях не пре¬ вышала 10° для модели РЕФЛЕКС. Наконец, подчеркнем, что исследовались именно те наборы окра¬ сок в сцене, для которых алгоритм модели РЕФЛЕКС мог дать лучшие выходные показатели в сравнении с возможностями модели АППЛИКАЦИЯ, формирующей в отсутствие ахроматических объек¬ тов не слишком хорошую гипотезу о цветности источника. Увели¬ чение числа объектов разного тона в сцене (с четырех до шести) существенно улучшает работу обеих моделей (это направление ис¬ следований здесь не обсуждается). Тезис о кооперации частных моделей в одну, гетерархическую, сам по себе естественный, обеспечивает увеличение интеллектуаль¬ ных возможностей модели лишь в результате конструктивного объ¬ единения нескольких моделей, когда метафора ’’лоскутного одеяла” теории не усугублена издержками предпринятого шага и расширение возможностей новой модели не увеличивает существенным образом 325
ее громоздкости. Если учесть, что независимые по сути оценки цветности освещения в моделях АППЛИКАЦИЯ и РЕФЛЕКС можно использовать в модели следующего уровня как компоненты взвешен¬ ного усреднения, а сами веса получать в итоге ’’экспертной” работы алгоритма КОЛОР (по оценкам цветностей объектов с самыми узкими складками определяющего лучшую их согласованность с гипотезами о первичном источнике, построенными в этих моделях), то планы подобного синтеза моделей выглядят априори вполне реалистическими. Геометрические параметры освещения и оценка формы. Простран¬ ственная интерпретация сцены по плоской ее проекции, т.е. задача моно¬ кулярного статического восприятия формы, привлекает внимание исследователей и как перцептивная психологическая проблема, и как система теоретико-алгоритмических вопросов, развиваемых в связи с потребностями технологии (в русле идей искусственного интеллекта и робототехники). Известны и монохроматические [10, 22—25], и цветовые модели [2, 7, 9] оценки относительной глубины поверхности объекта. Первые требуют априорных знаний об отражательных свойствах наблюдаемо¬ го объекта и геометрии источника освещения (что снижает их зна¬ чимость в качестве аналогов перцептивных механизмов), вторые получают необходимую информацию в результате сопоставления входных картин по каждому из цветовых каналов системы, причем общим методическим приемом обработки в цветовых моделях явля¬ ется использование независимости полей геометрических параметров (gt(x) в выражении (1)) от номера канала. Совершив те или иные однородные преобразования над входными полями каналов, зрительная система формирует поля оценок g(x) (это могут быть поля ориентаций — косинусов углов между локальной нормалью к поверхности объекта и направлением на точечный источ¬ ник, поля апертур диффузного источника, доминирующего рефлекса и пр.). Они, в свою очередь, завися явным образом от градиента по¬ верхности, позволяют в ряде случаев провести интегрирование формы объекта. Разберем на примере матового объекта, освещенного двумя да¬ лекими точечными источниками разной цветности, метод получения независимых полей ориентаций gi(x) и gi(x). Их совместная обработка дает карту относительных глубин частей объекта. Точки объекта, нормаль в которых совпадает с бисектрисой направлений на источ¬ ники освещения, ориентирована на первый и второй источники, про¬ нумеруем соответственно как 0, 1, 2, т.е. gi(l)=g2(2)=l, gi(0) = gi(0) = cos ((p/2), где ф — угол между лучами двух источников. Для решения задачи достаточно дихроматической системы. Из с/( 1) = /„ + с1у и с/(2) = с/,у + Iv следует IiJ=(al(i) — cai(n))/(I — c2) (c = cosp; i= 1, 2;_/'= 1, 2; л = 3— /). 326
Нетрудно убедиться, что c = (d(l) + ff/(2))2/2ff'(0)2 — 1, а потому, найдя по характерным цветовым особенностям точки О, 1 и 2 (например, точка 0 лежит на линии /: al(l)/a2(l) = const ид/(0) = ^шах {d(l)}), нетрудно вычислить базовые интегралы Знание значений //,• и детерминанта системы det = (а1 (1 )а2 (2) — а2 (1) а1 (2))/( 1 — с2) позволяет получить два искомых поля gi(x)=(d(x)Inn — ап(х)1„, )/det, сводя задачу к теоретически разрешимому случаю [7]. Наконец, заметим, что блики на объекте могут использоваться в системе для формирования необходимых начальных условий в про¬ цедуре интегрирования формы объекта по одному полю g(x) [19], а внешний рефлекс опорной плоскости, подсвечивающий выпуклый объект на ней, — для оценки его формы при диффузном освещении [6]. Константность и схема статического восприятия. Завершая это довольно фрагментарное рассмотрение одной из важнейших проблем зрительного процесса — проблемы статической (монокулярной) зри¬ тельной обработки, обеспечивающей инвариантное целостное описание видимого, попытаемся систематизировать результаты и гипотезы в общей схеме предметного статического восприятия. Обычно полагают, что зрительная система для организации цвето¬ вой константности использует стандартный набор признаков освеще¬ ния, данные независимо функционирующих механизмов стереопсиса, память на окраску и форму часто встречающихся в природе объектов и т.п. Однако подобных разнородных и не слишком детализируемых постулатов явно недостаточно для построения самого приблизитель¬ ного варианта схемы константного восприятия. Да и сама идея уни¬ кальной способности зрительного интеллекта к инвариантному (спект¬ ральному и стереометрическому) описанию внешних объектов в актуальной сенсорной модели мира, так восхищавшая и активно обсуждавшаяся исследователями в начале века, свелась в основном к частным задачам трехмерной интерпретации контурных изображений, текстур, классификации стимулов по цвету и пр. К великому сожалению, ясных представлений даже по части поста¬ новки проблемы константного восприятия, за редчайшими исклю¬ чениями, нет и у специалистов в области зрения (особенно небла¬ гоприятна ситуация в цветовом зрении, где функциональная, пред¬ метная сторона восприятия искажается или вообще игнорируется). Малоутешительными тому оправданиями служат сложность проблемы и совершенство механизмов, непрерывно и без участия сознания осуществляющих требуемые преобразования. Следует добавить, что инвариантное к изменениям освещения видение предметов не есть исключительная прерогатива человечес¬ кого зрения. Поведенческими и в меньшей мере электрофизиоло- гическими исследованиями твердо установлена аналогичная способ¬ 327
ность обезьян, птиц, рыб, пчел и других представителей живот¬ ного мира. И если их способность вводить поправку на цвет осве¬ щения трактовать как проявление специализированных компенсатор¬ ных механизмов, осуществляющих преобразование цвета стимулов, обратное тому, что происходит с цветом излучений, отраженных объектами, феномен ’’трансформации цвета” получает конструктив¬ ную, функциональную нагрузку, а значит, может целенаправленно и эффективно изучаться в эксперименте [13]. Естественно предполагать, что решение цветовых задач зрения упрощается в условиях бинокулярно выявляемой формы объекта, динамического режима наблюдения с его возможностями оценки формы движущегося объекта и поиска зеркальных бликов (как призна¬ ков цветности освещения). Понятно, обе эти группы приемов непри¬ менимы к условиям восприятия неподвижной проекции сцены (напри¬ мер, цветной ее фотографии). Узнавание объектов сцены по ее репро¬ дукции не вызывает у человека больших затруднений. Именно в силу этих обстоятельств мы ограничили рассмотрение вопросов цвето- восприятия условиями монокулярного статического наблюдения в на¬ дежде, что проблема, оставаясь еще интересной и не утеряв полноты, окажется уже достаточно простой для ее моделирования и обозри¬ мой во внутренних связях и следствиях допущений и упрощений. Одним из прямых выводов из рассмотренных ранее соотношений между стимулом, освещением, окраской и формой объекта можно считать следующий тезис: без целенаправленного сопоставления частей сетчаточной проекции, в отсутствие конкретных априорных пред¬ положений о свойствах рассеяния света объектами, о типах и харак¬ теристиках источника освещения задача адекватной интерпретации трехмерных сцен по реакциям фотоприемников неразрешима в прин¬ ципе. Введение принятых ограничений и аппроксимаций позволило в конечном итоге корректно поставить задачу для модели констант¬ ности и найти эффективные алгоритмы для иерархии усложняющихся (с ростом числа выходных параметров системы) типов (.цен. Переходя к изложению схемы статического восприятия (рис. 2), сделаем ряд пояснений и замечаний. Алгоритм модели KOJIOP, локаль¬ но преобразующий входную триаду компонент цвета в перцептивную диаду (тон—чистота) а константной цветности, может исподьзоваться на тех этапах зрительной обработки, где необходим локальный цвет (еще раз подчеркнем, что двойственность цветовосприятия трихромата проявляется в его способности реагировать на один и тот же участок матового объекта и аконстантно как на самосветящийся, и инвариантно как на обладающий той же окраской, что и весь объект). Будем считать, что высокочастотная пространственная компо¬ нента входного зрительного сигнала локально детектируется перифе¬ рическими механизмами системы, и одномерные фрагменты — грани¬ цы — далее классифицируются нелокальными (полевыми) анализато¬ рами типа рецептивных полей, тогда как нульмерные — контраст¬ ные точки — передаются в блоки динамического анализа формы в виде карты опорных элементов [26]. Таким образом, рецептор¬ ный анализ расчленяем на два этапа детерминированной обработки — 328
ДИНАМИЧЕСКИЙ АНАЛИЗ ФОРМЫ ОБ’ЕКТА . ' ЦЕНТРАЛЬНОЕ УПРАВЛЕНИЕ И КОРРЕКЦИЯ -а 1 ев а X 1 КО _] 1 О X о 1 1 Ж Os 1 X S 1 л X 1 X UJ 1 н 1 ко J-1 1 CQ О 1 о 1 — х> 1 1 О 1 о X 1 н ш 1 0Q 1 X 1 1 Рис. 2. Схема статического монокулярного восприятия
локальной и полевой, включая в последнюю, помимо механизмов различения объектов, еще и таковые для границ районов (тени, блика, изломов поверхности и т.п.) [6], а также модули полевой детекции экстремума сигнала, выделяющие информативные точки изображения (по типу точек края и дна лунки, в дополнение к которым система должна уметь находить самые яркие точки — блики — и самые темные, если речь идет о константности восприя¬ тия в мутной среде). Результаты первичной обработки и само цветовое монокулярное поле подвергаются далее глобальным преобразованиям гетерархией специализированных алгоритмов (типа АППЛИКАЦИЯ, РЕФЛЕКС, ГОФР) под координирующим влиянием центральных зрительных отде¬ лов. Итогом этого этапа являются сначала формирование оценок ба¬ зовых функционалов Iijm, определяемых соотношением (1) (что позволя¬ ет оценить распределение геометрических параметров g, и сформировать исходную оценку цветности первичных источников), а затем построение итеративно уточняющейся пространственной гипотезы об освещении всей сцены. Знание полей g(x) используется блоками описания свойств объекта для вычисления относительной глубины точек оптической проекции сцены, в то время как цветовая обработка завершается в блоках созданием многопараметрического перцептивного образа объектов сцены. К уже обсуждавшимся константным оценкам окраски объекта (триада: тон—насыщенность—светлота) следует добавить воспринимаемые наблюдателем спектрально-пространственные харак¬ теристики индикатрисы рассеяния: степень зеркальности (неламбер- товости) объекта и коэффициент его прозрачности (иными словами, с учетом диады локальной цветности стимула допускается сущест¬ вование не менее чем семимерного перцептивного комплекса, харак¬ теризующего отражательные свойства объектов сцены). Информация, продуцируемая блоками СИНТЕЗ ОБЪЕКТОВ, поступает в распоря¬ жение структур ’’актуального зрительного поля” (на иконический константный экран). ДИНАМИЧЕСКИЕ МОДЕЛИ КОНСТАНТНОГО СТЕРЕОВОСПРИЯТИЯ Проективные инварианты и зрительная память а Исходная постановка задачи. Зрительная система реализует одну из главнейших (нелингвистических) функций интеллекта — функцию дистантного отображения предметного мира с его твердо установ- | ленными свойствами целостности и константности. В когнитивной, а в еще большей мере в гештальт-психологии разработаны принципы организации зрительного процесса. Современная нейрофизиология описала некоторые частные его механизмы, тем не менее ситуация в целом остается весьма неудовлетворительной: отсутствие сколь- нибудь полных концептуальных моделей восприятия является, по мнению ряда исследователей [27], самым основным препятствием на пути познания в этой области. Не имея возможности охватить даже главные из поставленных 330
сегодняшней наукой вопросов и сознательно смирившись с издерж ками фрагментарного и модельно-абстрактного подхода, ограничимо рассмотрением группы смежных проблем пространственного восприя тия, с необходимостью объединяющей такие аспекты деятельное™ зрительного интеллекта, как константность, стереопсис, иконическа) память и восприятие движения. Не претендуя на новизну трактовщ каждого из перечисленных аспектов в их независимом проявлении попытаемся выявить общую картину их взаимосвязи в рамках неко торой целевой гипотезы, состоящей из нескольких тезисов, которук сформулируем так: а) механизмы инвариантного восприятия объекта и непредмет ные механизмы константности зрительного поля родственны по форм( представления обрабатываемой в них информации; б) эта форма — результат использования группы инварианто1 оптического преобразования изображения в задаче установленш пространственной структуры объекта (и сцены в целом) по отно сительному движению наблюдателя и объектов; в) структура объекта (или видимого поля) и его константное™ актуализируются одновременно трехмерной сенсорной моделью види¬ мого; ■ь г) движение объекта регистрируется дискретно (по тактам) ико- нической.памятью, обеспечивая возможность изоморфного отображе¬ ния наблюдаемого. Оставив до заключительного раздела рассмотрение пп. а) и г) займемся разработкой языка инвариантов (п.б), 'дающих возмож¬ ность решить задачу ’’структура объекта по его движению” [26] (час¬ тично в п.в)) и сформулируем саму эту задачу. Под объектом, еслг это не оговорено особо, будем далее подразумевать совокупное™ контрастных точек поверхности некоторого твердого тела. Входно£ изображение оптическая часть системы формирует как плоскую центральную проекцию объекта. И поскольку относительное движение объекта складывается (согласно п.г)) из ряда мгновенных его пространст¬ венных положений, система благодаря наличию памяти располагает набором двумерных координат точек за несколько тактов временг (включая текущий момент). Первый из алгоритмов пространственной интерпретации движу¬ щегося объекта ориентирован на выяснение принципиальных возмож¬ ностей вводимого нами аппарата проективных инвариантов. Отсюда простота этого алгоритма как результат ограничения допустимых видов движения объектов, задания извне характера корреспонденции (соответствия) точек и исключения окклюзии. Разбор второго алго¬ ритма нацелен на обсуждение более сложных движений (непрозрач¬ ного) объекта и экстраполяции карты контрастных точек следующего такта. Нас будет интересовать решение следующей задачи: для объек¬ та неизвестной формы, совершающего заданный тип движения с неиз¬ вестными параметрами, вычислить с точностью до масштабного коэффициента трехмерные координаты всех точек данного объекта и определить характеристики движения (например, пространственной 331
ориентации оси вращения и угловой его скорости в единицах такта), если система располагает координатами точек на центральной проек¬ ции объекта за ряд тактов. Установление соответствия, инварианты и ассоциация. Установ¬ лением соответствия называют процедуру идентификации одноименных элементов объекта в группе его проекций, осуществленных в разные моменты времени (или одновременно с разных позиций, если речь идет о многоокулярном стереосинтезе). Стереопсис человека исследо¬ ван весьма подробно как в динамическом (параллакс движения), так и в статическом (бинокулярный синтез) его аспектах. Из всего обширного эмпирического и концептуального материа¬ ла, относящегося к этой сложнейшей психофизиологической проблеме, мы выберем два тезиса, доказанных весьма скрупулезно и убеди¬ тельно [26]: установление соответствия — операция нижнего уровня, не зави¬ сящая от трехмерной интерпретации сцены и оперирующая только опорными элементами (контрастными точками); в рамках процесса установления соответствия нет фундаменталь¬ ных отличий между действительным (гладким) и кажущимся (орга¬ низуемым серией дискретных предъявлений) движениями. Первое из этих положений разрывает порочный круг причинных зависимостей в цепи корреспонденция—интерпретация в пользу пер¬ вичной и жестко детерминированной природы установления соответст¬ вия. Второе важно в том методическом отношении, что дискретная (потактная) регистрация движения, исключая использование дифферен¬ циальных процедур типа прослеживания траектории точки или создания карты их скоростей, подчеркивает ассоциативный характер процесса установления соответствия (тем более монопольный, чем ббльшие сме¬ щения объекта на центральной проекции совершаются за такт). Идею потактной обработки динамической проекции сцены в биологичес¬ ких системах содержательно подтверждает и феномен скачкообраз¬ ного движения глаз с фазами саккадического подавления. Итак, ближайшая наша цель — наметить пути конструктивного использования инвариантных геометрических свойств объекта, совер¬ шающего некое регулярное движение относительно системы наблюде¬ ния при условии, что она располагает механизмом иконической памяти и способностью к зрительной ассоциации. Будем именовать двойное отношение четырех точек на прямой (являющееся фундаментальным проективным инвариантом) вурфом, уточняя порождающую его процедуру подразделением на пространст¬ венный 5-вурф (случай разных точек на проекции данного такта) и временнбй ?-вурф (из позиций одноименной точки в разные такты). Вурф на плоскости можно строить по пяти неколлинеарным ее точкам а, Ь, с, d, е таким, например, образом: прямая bd пере¬ секается прямыми ас и ес в точках а' и е\ которые вместе с b и d образуют четверку вурфа w(ba'e'd). Число w присваиваем точке с. Любой замкнутый плоский контур с более чем четырьмя точками на нем (например, вершинами многоугольника) можно охарактеризовать циклической последовательностью з-вурфов, вычис- 332
ляемых при последовательном переборе точек контура (в качестве рассмотренной выше точки с и ее двух левых и двух правых соседних точек контура), т.е. описать его циклическим набором чисел инвариантно относительно группы проективных преобразований плоскости. Аналогичным образом для объекта, вращающегося равномерно вокруг неподвижной оси, по любой его точке за ряд тактов можно вычислить цепочку совпадающих ?-вурфов. Если на проекции коор¬ динаты точек задаются с некоторой погрешностью, установление соответствия между двумя цепочками з-вурфов, принадлежащими смежным тактам, вырастает в задачу ’’мягкой ассоциации” [28] числовых последовательностей (в случае полиэдрального объекта — ассоциации вурфовв вершинах каждой видимой его грани). Итак, в дополнение к теоретическому методу минимального отображения в задаче установления соответствия [26] (как нетрудно показать, приводящему к ложной корреспонденции при больших смещениях объекта за такт) можно предложить идею метода ассо¬ циации упорядоченных наборов з-вурфов, безразличного к сдвигам, вращениям, перспективным искажениям и другим проективным преоб¬ разованиям, совершающимся с центральной проекцией сцены за такт, и устанавливающего поименованное соответствие сразу для всех пар точек в наборе. Примеры того, как выглядит переход от плоских контуров к их двумерному проективно инвариантному описанию, приведены на рис. 3. Пары проективно-инвариантных шести- и восьмиугольников (нижний ряд) отображаются в вурф- квадрат (верхний ряд). Вершины многоугольников мечены через одну. Штриховыми линиями изображены локальные изменения формы фигур и их новое инвариантное представление. Редукция задачи. Если система располагает набором полевых периферических детекторов движения, задающих начальную класте¬ ризацию точек разных объектов и классификацию направлений и типов их движения, то наличие гипотетических вурф-детекторов могло бы послужить основой для организации итеративно функционирующей структуры, согласовывающей гипотезы о динамике объектов и собст¬ венных смещениях и поворотах системы. Эта надежда основывается на формальных возможностях (пока в полной мере не изученных) использования аппарата з- и ?-вурфов для группы задач, именуемых задачами препарирования изображения динамической сцены (выявление типа движения каждого объекта: вращается, движется прямолинейно, совмещает оба типа и т.п.); оценка параметров их движения (трехмерный вектор мгновенной скорости, угловая скорость и пространственная ориентация оси вращения и пр.), и для задач автоориентирования системы. Например, для объекта, движущегося прямолинейно с постоянной скоростью, ?-вурф любой его точки (за любые четыре такта) равен 4/3, а для равномерно вращающегося объекта легко построить ?-вурф (связанный с любой точкой объекта и положением центра ее вращения на проекции), числен¬ ное значение которого выразит угловую скорость объекта. Движение проекции изолированного объекта можно приближенно 333
Рис. 3. Проективно-инвариантное представление фигур охарактеризовать двумерными глобальными параметрами усреднен¬ ного смещения всех его точек на центральной проекции, аппрок¬ симирующими проекцию траектории центра масс объекта. К числу глобальных параметров движения объекта отнесем пространственную ориентацию оси R его вращения, которук} удается оценить с помощью вычисленного набора вурфов. Знание глобальных парамет¬ ров позволяет найти углы переориентирования оптической оси систе¬ мы (пусть она совпадает с осью Z системы) в положение простран¬ ственного пересечения с осью R. Когда ось Z заняла новое положение, остается повернуть координатную сетку XY на проекции до совмещения образа R с X или Y, после чего объект займет в системе координат XYZ каноническое положение, в котором наиболее просты все дальнейшие процедуры вычисления его формы. Итак, если повороты оси Z возможны (а прецессия и бифур¬ кации объекта маловероятны), процедуру решения поставленной нами задачи предлагается разбить на два этапа: 334
оценив для данного объекта его глобальные параметры, перейти в каноническую систему координат; вычислить в этой системе координат по локальным параметрам движения его точек относительную их глубину (алгоритмически здесь возможен размен числа совместно обрабатываемых точек на число необходимых для этого тактов; алгоритм при этом упрощается, однако требования к глубине памяти возрастают). Экстраполируемость движения объекта и привлечение цветовых данных. К ранее сделанному ограничению на жесткость объекта (объект —твердое тело) добавим требование инерциальности его дви¬ жения. Точнее, желательным свойством является постоянство матрицы линейного преобразования пространственных координат объекта, связывающей два смежных такта (или какое-то простое и регулярное ее из¬ менение). Если динамические характеристики комплекса система — объект удовлетворяют такому свойству матрицы, то на центральной проекции оказывается достаточно просто реализуемой экстраполяция карты точек объекта для следующего за текущим такта, а срав¬ нение экстраполированной и входной карт дает возможность уточнить матрицу или даже экстраполировать регулярные ее изменения (что и делает программа ГЕКС, когда обрабатываемый ею объект совершает равноускоренное вращение). Жесткость и инерциальность — характеристики физические. Не¬ выполнение первого из этих условий усложняет процедуру установле¬ ния соответствия: для кооперативных алгоритмов оценки глубины (работающих в некотором проективном базисе, связанном с группой точек самого объекта) делает процедуру решения неустойчивой, расходящейся, вынуждая предусмотреть эффективное разбиение проек¬ ции объекта на жесткие подобъекты, сочлененные пластично. Не¬ выполнение второго — затрудняет экстраполяцию координат точек, вовлеченных в окклюзию (исчезновение и появление точек непрозрач¬ ного объекта при смене ракурса). Непрозрачность объекта — еще одно влияющее на процедуру обработки физическое свойство среды. К прозрачным (в смысле окклюзии) объектам следует отнести решетчатые конструкции, прово¬ лочные модели многогранников, динамическая интерпретация которых хорошо изучена у человека. И поскольку трехмерная структура предъявляемых монокулярно объектов такого рода (например, теневая проекция объекта с обилием прямолинейных пересекающихся эле¬ ментов) человеком оценивается более точно в сравнении с глад¬ кими криволинейными фигурами, а теоретически для константного восприятия формы таких объектов нет необходимости в едином трехмерном проективном базисе — достаточно вурфов на прямой (по четыре точки) и плоскости (по пять точек), то качественная эта корреляция может рассматриваться как довод в пользу активной роли аппарата инвариантов в процессах зрительного восприятия [29]. Завершая беглый обзор идей и гипотез, связанных с различиями в использовании статической и динамической зрительной инфор¬ мации, особенно для задачи установления соответствия, сформули¬ 335
руем несколько предположений о возможной роли цветовых меха¬ низмов в упрощении и ускорении процессов стереосинтеза: наличие у объекта плоских граней, выявляемых простейшими из алгоритмов цветоразличения (ранг грани равен единице), исполь¬ зуется в системе для автоматической кластеризации контрастных точек границы каждой грани с последующим вычислением для нее циклической цепочки вурфов; установление соответствия граней (входной и хранящейся) прово¬ дится на линейных ассоциативных структурах [29] после преобразо¬ вания цепочки активной полевой процедурой в набор коэффициентов разложения его как дискретной периодической по полярному углу функции (с периодом 2л); граница тени на гладком теле, а также сетка линий ’’изоориента¬ ции”, сформированная цветовыми модулями, в пересечении с глад¬ кими границами областей разной окраски образуют мозаику не¬ посредственно не обнаруживаемых ’’меток”, которую система исполь¬ зует для динамического восстановления формы (если это быстрее в сравнении со статической процедурой интегрирования поля g(x))2\ индивидуальные цветовые характеристики точек и линий объекта помогают системе начать процедуру установления соответствия (а динамический режим прослеживания объекта дает возможность уточнить его индикатрису рассеяния). Алгоритмы вычисления формы объекта по его движению Программа ВУРФ и результаты ее работы. Форма оптического преобразования в системе выбрана нами не случайно. Центральная плоская проекция сцены существенно более точно отражает свойст¬ ва входного изображения (для глаза позвоночных) в сравнении с ортогональной, чаще всего используемой в алгоритмических раз¬ работках по обсуждаемой проблеме [26]. То, что при одном подходе выглядит как пренебрежение несущественными перспектив¬ ными искажениями, при другом — непосредственно используется для решения задачи. Когда угловые размеры объекта велики, велики и отклонения ортогонального его образа от центрального. Зрительный анализатор не может не использовать способа, дающего оценки формы в соответствии с проекционной схемой органа зрения и по единому алгоритму практически для всех мыслимых вариантов динамики наблюдения (лишь бы необходимая точность представления координат не превышала разрешающей способности системы). В то же время в схеме параллельной проекции в принципе неразрешима задача оценки глубины точек для объекта, совершающего отно¬ сительно системы: произвольную трансляцию; вращение вокруг оси, параллельной оптической оси системы. Отсылая читателя, интересующегося проблемой моделирования стереосинтеза (в биологическом и техническом ее аспектах), к обзору 2 Речь идет о ситуации движения наблюдателя относительно неподвижной сцены. Сам же прием обработки некоторым образом противопоставляется тезису Ульмана [26] о неиспользовании полутоновых операций в задаче установления соответствия. 336
[30] и упомянув в качестве ориентиров теоретической и практи¬ ческой ее реализации работы [31] и [32] (в обоих этих подходах — соответственно непрерывном и дискретном — не преследовались цели психофизиологического характера), перейдем к описанию имита¬ ционной программы ВУРФ, разработанной автором для уяснения возможностей языка вурфов. Задача, предписываемая абстрактной системе, формулируется следующим образом. Единственный объект сцены представляет собой трехмерную группу точек, совершающую как жесткое целое инерциальные движения, описываемые в координат¬ ной системе оси R своего вращения: расстояниями г, до оси R, расстояниями плоскостей вращения s, от точки пересечения осей Z и R и фазовыми углами е,. Программа вычисляла пространственные и временные вурфы для определения межтактного угла поворота е и других угловых параметров, а также координат г, s, е и ошибок в них для всех точек объекта, вращаемого равномерно или транслируемого в заданном направлении прямолинейно с постоянной скоростью, ис¬ пользуя соотношения, связывающие вурфы и параметры уравнений движения. Например, 2wzwb / (1 +we)=ctgS/ctge+1, где 5 — разность фазовых углов е двух точек, а вурф Wj смешанного типа вычисляется по координатам двух точек за два такта. Уста¬ новление соответствия и экстраполяция движения программой не проводились. Глубина памяти не превышала трех тактов (т.е. обрабатывалось одновременно не более четырех карт точек). Фиксиро¬ ванная группа точек образовывала трехгранный угол, три плоских угла ф которого вычислялись на каждом такте. Для среднего (по тактам и углам ф) отклонения в 1° при оценке ф потребовалась точность вычисления координат, не меньшая 0,0005 (т.е. для объекта с угловой апертурой в 100° координаты его точек необходимо задавать с погрешностью, меньшей 3')- Эксперименты с программой, а также дополнительный анализ проблемы в целом можно резюмировать в следующих основных выводах: аппарат вурфов позволяет, ’’разменивая время на пространство”, строить смешанные по типу s- и /-инварианты (следствие жесткости и инерциальности объекта), тем самым снижая предел глубины памяти (для /-вурфов) и громоздкость пространственного базиса (для з-вурфов), что обеспечивает сравнительную простоту решения; ясные перспективы использования языка вурфов в задаче уста¬ новления соответствия не сочетаются пока со столь же оптими¬ стичными прогнозами его эксплуатации при вычислении формы объекта по его неинерциальным движениям; требует изучения вопрос о реализуемости процедур формирования инвариантов и еще шире — самого процесса решения поставлен¬ ной задачи не вычислительными (’’арифметика” в координатах), а аналоговыми построительно-измерительными процедурами (’’силовая геометрия” на специализированных носителях), т.е. забытые ныне 22. За к. 1668 337
идеи синтетической геометрии следует обдумать в их новом соот¬ несении с идеями гештальтистов [33, 34]. Трансляция и вращение многогранника. Первая часть статьи была посвящена статической интерпретации сцены. Введенное во второй части движение комплекса система—объект как суперпозиция мгновен¬ ных статических проекций сцены может показаться не вносящим ничего принципиально нового, если допустить, что любая стати¬ ческая фаза движения независимым и исчерпывающим образом характеризует форму объекта. С этим выводом нельзя согласиться по нескольким причинам. В рамках проблемы константности зри¬ тельного поля (компенсация относительного движения система—объ¬ ект) система решает задачу "3-D (трехмерное) движение по 2-D (двумерной) структуре”, где данные о форме объекта не могут помочь ее решению. Выполняемая совместно с первой задача динамической интер¬ претации формы объекта ’’3-D структура по 2-D движению” рассмат¬ ривается именно как независимая, дополняющая возможности стати¬ ческой задача. Алгоритмы ее решения выводятся из кооперативного по¬ ведения точек объекта во времени, т.е. основываются на анализе обяза¬ тельно нескольких тактов, когда любая наугад взятая проекция может вообще не содержать интерпретируемой информации о форме (например, при демонстрации ’’кинетического эффекта глубины” с теневыми проекциями фигур или точечными цилиндрами [26]). Отсюда и разница в описаниях объектов в статике и динамике. Непрерывность поверхности объекта в статических задачах — основной поставщик сведений о его окраске и форме. Пространственно-временное описание объекта в динамике, опре¬ деляемое нами как дискретное описание лишь особых (контрастных) его точек, целесообразно, по причине создания условий, достаточных для решения задачи установления соответствия (неуспех в которой лишает необходимых предпосылок решения главной задачи). Только ’’особые” (уникальные по своей заметности независимо от ракурса) точки или линии, имеющие реальный шанс оказаться регулярно (от такта к такту) выделяемыми детерминированной однородной проце¬ дурой, и образуют адекватный базис для корреспонденции точек. При таком подходе, структурирующем описание объекта с вре¬ менной утерей его непрерывности, методически полезно (по крайней мере на начальных этапах разработки проблемы в целом) ограничить¬ ся теми типами форм объекта, которые позволяли бы промоделиро¬ вать поэтапно все блоки зрительной обработки (статической и динамической с их связью). Многогранники — класс объектов, удов¬ летворяющих этому условию, так как статическая (цветовая) обработка проекции полиэдра ’’без дополнительных затрат” формирует карту его видимых ребер, концевые точки которых и есть входные точки нашей динамической задачи. Класс полиэдров был нами выбран и в связи с простотой реализации на ЭВМ идей об использовани 2-D (по точкам контура грани) и 3-D вурфов (по шесть точек из двух граней) на этапе установления соответствия. При разработке "сценического варианта” к программе ГЕКС (как 338
и ВУ РФ, она должна быть отнесена к ’’отладочным для идей”), преследо¬ валась цель по возможности простыми средствами реализовать ряд новых моментов: включение в алгоритм этапов установления соответ¬ ствия, переориентирования системы и экстраполяции с учетом окклю¬ зии и более сложных форм движения объекта. Отказ от обязатель¬ ной равномерности вращения объекта (введение ускоренного вращения), допустимость совмещения трансляционного (по прямой) и вращатель¬ ного движений и переход к другой системе координат для выход¬ ных характеристик формы радикально изменили алгоритмическую часть, особенно в отношении использования /-вурфов. Реализованная программно версия алгоритма имела объектом общего вида гексаэдр, задаваемый с пульта точками вершин и триада¬ ми точек (случайного положения) в каждой грани, совершающий вращение и трансляцию вдоль оптической оси Z. Программа ГЕКС. На этапе переориентирования системы опреде¬ лялось направление проекции R на плоскость проекции XY и совершался переход в новую систему координат (ось R в плоскости YZ), для чего при одновременном вращении и трансляции объекта обрабатывались координаты точек за четыре такта. При этом исполь¬ зовались инвариантные свойства точки пересечения некоторой грани объекта с осью R (в базисе вершин грани) и уравнение, связывающее полярные радиусы р, проекции этой точки за три такта /: 2/Pi— I = l/Pi_2 + 1/P|. Блок программы, формировавший карту входных точек в зави¬ симости от формы и положения объекта, задавал на проекции коор¬ динаты тех точек, проецирующие лучи которых не пересекали по¬ верхности гексаэдра, т.е. ’’были видимы” для системы (смена ракурса могла изменять их число от 7 до 23). На этапе установления соответствия сначала вычисляли вурфы двугранного угла (если ab — общее двум граням ребро, cd и ef — ребра, противолежащие ab, а в точках с' и f прямую ab пере¬ секают прямые cd и ef соответственно, то искомым вурфом бу¬ дет w(c'abf), каждый из которых позволял установить поименное соответствие для шести вершин объекта. Затем выявляли корреспон¬ денцию внутренних точек грани (видимой два такта) по трем па¬ рам пятиточечных вурфов (столь же прост в принципе вариант со¬ поставления однородных координат внутренних точек грани в проектив¬ ном базисе ее вершин). Для однозначного соответствия (если объект не куб) погрешность оценки значений w составляла 1%. Конструктор алгоритмов для задачи ’’структура по движению” мало ограничен в возможностях комбинирования тех или иных упрощений и допущений (связанных с выбором разрешенных типов движения, глубиной памяти, степени итеративности процедуры или кооперативности обработки точек объекта и пр.) при достижении цели за счет интуитивно оптимальных алгоритмических затрат. В принципе можно использовать то, что ребра вращающегося объекта в трехмерном пространстве задают семейство соосных однополостных гиперболоидов, или то, что любая его точка в поступательно-вращатель¬ 339
ном движении принадлежит некоторому эллиптическому ци¬ линдру. Если в оценке относительной глубины точек объекта не ограничивать зрительную обработку анализом только двух изображе¬ ний (по аналогии с бинокулярным статическим стереопсисом), а мыслить ее как итеративно-экстраполяционную процедуру, то желаемую схему вычислений (осуществленную в программе ГЕКС) можно описать следующим образом: по завершении предварительного динамического анализа (четыре такта) система переходит в канонический координатный базис; обрабатываются карты трех смежных тактов при параллельно идущем установлении соответствия, что обеспечивает потактное фор¬ мирование (или уточнение) матрицы преобразования объекта и оценок глубины его точек; экстраполируется карта точек следующего такта; пополняется описание формы объекта новыми точками; предсказывается уход за пределы видимости некоторых точек (а по прошествии достаточного числа тактов — и их появление). Если движение регулярно, подобная схема позволяет использо¬ вать эту регулярность: в режиме упреждающего слежения сопостав¬ ляются три изображения — запомненное, текущее, экстраполированное. Расхождение входной и экстраполированной карт должно возвращать систему к режиму формирования новой матрицы движения с мобили¬ зацией большей глубины иконической памяти (реализация подобного случая не вносит ничего принципиально нового в схему, так как сводима к повторному запуску программы с новыми параметрами движения). Имея в перспективе переход к методологии ’’построения решения” (в отличие от его ’’вычисления”), не будем останавливаться на раз¬ боре вычислительных особенностей разработанного алгоритма в срав¬ нении с известными по другим публикациям на ту же тему (см., на¬ пример, [32, 26]), а отметим принципиальный характер пока нере¬ шенных вопросов использования зрительной системой человека в дина¬ мическом восприятии перспективных искажений, аппарата вурфов и данных статического анализа. Сенсорная модель константного зрительного пространства в параллельном 3-D макропроцессоре, сопряженном с памятью Пространственное восприятие и непредметная инвариантность. Дальнейшее изложение можно рассматривать как попытку описания гипотетических структур и механизмов, взаимосвязь которых опреде¬ ляется рядом концептуальных положений и общей функцией ин¬ вариантного отображения ’’стимула в ощущение” или объективного в перцептивное с его качествами предметности, целостности и т.п. В основу предлагаемого подхода положены следующие концеп¬ ции: продуктом деятельности зрительного интеллекта является трех¬ мерный перцептивный образ видимого, ’’объекты” которого (в плане информационном) порождены и поддерживаются активным распре- 340
деленным процессом, 3-D локализация которого изоморфна объектам сцены, и доступны для механизмов: пространственного сенсорного анализа (3-D детекторы свойств объекта), управления анализом (выбор объекта для блоков предметной инвариантности), ассоциативной 4-D памяти; стереометрический анализ объекта (например, через локальную кривизну его поверхности) на сенсорном уровне возможен лишь благодаря деятельности механизмов инвариантности: непредметной (функционирующих в течение всего времени наблюдения), предметной (в результате целевого акта переключения внима¬ ния); отображение пространства сцены и ее объектов в перцептивной модели, опосредованно вводившееся ранее через идеи "циклопи¬ ческой сетчатки” или ’’константного экрана” [35], уточняется нами как процедура, реализующаяся на специализированных 3-D структурах (типа 3-D нейронной сети или ансамбля автоматов в коммута¬ ционной среде), ведущих скорее построительно-измерительный, чем вычислительный аналоговый процесс формирования выходного пер¬ цептивного продукта; именно в перцептивной модели функционально сходным образом объединяются: бинокулярные и монокулярные методы интерпретации формы объекта; интерокулярные и интермодальные (проприоцептивные и вести¬ булярные) механизмы, ответственные за организацию стабильности зрительного поля, образы объектов, формирующиеся благодаря наличию в пер¬ цептивной модели собственной кратковременной памяти и ассо¬ циируемые с ними образы долговременной образной памяти. Эти декларации не только и не столько постулаты некой незавершенной теории. Они и экскурс в круг подлежащих рас¬ смотрению проблем, и первые определения к частям и функциям создаваемого умозрительно ’’аппарата восприятия”. Выделив самое главное в заявленном — образы объектов и всего наблюдаемого пространства в перцептивной модели стабильны и изоморфны локализацией активного информационного процесса своим физи¬ ческим прообразам, — перейдем к обсуждению отдельных функцио¬ нальных аспектов интегративной работы зрительной системы. Упрощая сложившуюся в психологии типологию видов константности, сведем ее к двууровневой. Выделим в проблеме пространственной константно¬ сти восприятия две независимые части — стабильность зрительного поля и константное восприятие объекта — и рассмотрим первую. Подвижность наблюдателя, его глаз, головы и тела — источник постоянных изменений сетчаточной картины, тем не менее не пред¬ ставленных в восприятии, и есть причина той компенсаторной дея¬ тельности системы, которая обеспечивает стабильность зрительного 341
поля. Саккады и торзионный дрейф глазных яблок, повороты и сдвиги эгоцентра (средней точки межглазного отрезка) — все эти разнообразные движения непрерывно и радикальным образом меняют входной паттерн, однако содружественные механизмы обоих глаз обеспечивают пространственную инвариантность видимого, называе¬ мую непредметной [27]. В ситуации, когда все объекты сцены неподвижны и единствен¬ ной причиной смещений сетчаточной картины является сам наблю¬ датель, закономерности этих смещений на каждой из проекций единообразны, а потому в принципе могут быть скомпенсированы неким глобальным преобразованием, "обратным оптическому” (для каждого глаза своим). Задача, решение которой попытаемся наметить, существенно сложнее введения в процесс зрительной обработки компенсирующего преобразования, ибо должна совмещать стабили¬ зацию входной картины с пространственным синтезом сцены или объекта. И поскольку основным операциональным элементом в даль¬ нейшем изложении будут разного рода сферические проекционные схемы, начнем с самой простой, продемонстрировав с ее помощью возможность бинокулярного синтеза рбъектов. Сферическая модель бинокулярного синтеза. Воспользуемся стерео¬ графической проекцией для перехода от плоской центральной проек¬ ции к сферической, приблизив тем самым к реальной геометрии сетчатки ее модельное представление. Полюс проекции S при этом отождествим с оптическим центром системы (с центром хрусталика). В моделирующей глаз проекции пучок проходящих через S лучей свяжет точки наблюдаемого объекта с их изображениями (на сферическом дне глаза). Рассмотрим случай конвергенции оптических осей в медиальной плоскости, проходящей через эгоцентр перпендикулярно линии, соединяющей сферические центры глаз. Представив бинокулярную систему как ориентированную в пространстве пару сферических центральных проекций СЦПЛ и СЦПп, построим с их помощью "циклопическую” СЦПц. Ею в нашем случае могла бы стать касающаяся полюсов Sn и S„ сфера с центром в точке пересе¬ чения оптических осей системы. Точки любого объекта, оказавшегося внутри сферы СЦПц, проецируются на СЦПЛ и СЦПп через S„ и Sn и тем же пучком прямых — на СЦПц, где оказы¬ вается двойной набор изображений точек объекта. Каждый набор с точностью до коэффициента (подобие и инверсия) повторяет монокулярные изображения точек, а угловое разнесение наборов определяет дуга между Sn и S„. Если перейти от вспомогательной сферы, заключающей в себя объекты и связанной с пространством сцены и геометрией вергенции, к специализированному сферическому процессору, входящему отдельным блоком в гипотетическую систему, то вышеперечисленные особенности СЦПц можно использовать в следующей схеме синтеза объекта: СЦПц является "запоминающей поверхностью”, на которую с СЦПЛ и СЦПп передаются (инвертированные относительно S„ и S„ сферические карты изображений точек, ориентированные с учетом 342
угла конвергенции (задаваемого как центральный угол между Sn и Sn), а также сами точки 5Л и S„, однозначно связанные каждая со своим набором изображений (т.е. объект, включающий и биноку- лярно видимых точек, представлен двумя наборами изображений по л+1 каждый); внутренняя часть шара-процессора заполнена автоматами в пас¬ сивном состоянии, переходящими в состояние ’’предвозбуждения”, если они находятся на луче, соединяющем одну из точек S с любым изображением точки того же набора, или возбуждения, если предвозбуждены дважды. Расставаясь с бинокулярной системой (а была изложена лишь идея линейного метода для евклидовой метрики моделируемого пространства), заметим следующее: создана альтернатива для реализации функций автомата — он может вычислять свое возбуждение по координатам изображений точек, поступившим по общей ’’шине данных” (и тогда размещение точек на СЦПц не нужно), а может реагировать на геометрию фронтов волн, распространяющихся в среде от их активных источников в позициях изображений точек объекта на СЦПц; конфигурация возбужденных автоматов с точностью до масштабного коэффициента должна воспроизвести 3-D расположение точек объекта, а сам коэффициент может быть найден из расстояния между Sn и Sn (в единицах бинокулярной базы системы); эта схема не решила проблем стабильности зрительного поля и дает точное решение только для медиальной плоскости вергенции (хотя легко преобразуема в монокулярную динамическую схему синтеза—стабилизации для чистого вращения объекта), откуда следует, что для целей моделирования стабильного зрительного поля рас¬ смотренную схему придется несколько видоизменить. Неевклидова модель зрительного пространства. Дополним кон¬ фигурацию стереографической проекции сферой удвоенного (по отношению к сферической центральной проекции (СЦП)) радиуса с центром в полюсе S. Однозначное соответствие точек на плоской и сферической центральных проекциях будет распространено и на новую сферу — на СЦПо. Детерминированная связь между сетчаточ¬ ными координатами на СЦП (отсчитываемыми от начала координат в точке касания СЦП и СЦП0 и на одном диаметре с 5) и сферическими координатами на СЦПо в этом случае легко может быть установлена. Вся плоскость проекции (и вся сфера СЦП за вычетом полюса) отобразится на полусферу СЦПо, которую и станем доопределять до удобного в качестве модели пространства для моно¬ кулярной динамической системы. Если сервисные блоки установления соответствия выполняют необходимые двупараметрические движения подаваемых на СЦПо полусферических карт изображений точек (пересчитанных с полносфе¬ рических входных карт) и сканирование оптической осью системы видимого пространства не сопровождается в отсутствие сдвигов СЦП смещениями по СЦПо изображений удаленных точек, а при пренебре¬ жении параллаксом, связанным с несовпадением центров вращения 343
и оптического, — и любых изображений точек, то получившуюся систему можно охарактеризовать как инвариантную к вращениям оптической оси системы 2-D сферическую модель мира. В этом виде она лишена способности наделить полярный луч (выходящий из центра СЦП0, моделирующего положение эгоцентра) качеством протяженности, т.е. не может оценить расстояния от точки сцены, а вычисляет только два сферических угла этой точки (в эгоцентри¬ ческих координатах). Потребуем, чтобы полярный радиус р0 модели отображал в диапазоне длин от 0 до г, где г — радиус ’’устройства” СЦПо, все возможные длины полярного луча р в сцене. Это можно сделать, определяя р0, например, следующим образом: llpl=llp2+l/r2. Такая форма не обязательна для превращения бесконечного р в конечный ро, но в связи с поведением центральных поверхностей второго порядка при отображении это обещает ряд аналитических удобств в работе с полученным пространством. Если система сумеет оценить ро по всем направлениям (благодаря кратковременной иконической памяти, присущей поверхности СЦПс и выражающейся в ’’послесвечении” изображений точек, уже вышедших за входную полусферу), то всем точкам обозреваемого наблюдателем бесконечного пространства найдутся соответствующие позиции внутри сферы СЦП0. Используем собственные движения системы среди ближайших к ней объектов сцены для организации стереосинтеза группы таких объектов, а также инвариантности зрительного поля относительно сдвигов и вращений эгоцентра. Идея о среде автоматов, реагирующих на координатную инфор¬ мацию предвозбуждением (а также учитывающих свое положение относительно эгоцентра и обладающих еще рядом свойств и качеств), перенесена из бинокулярной статики в монокулярную динамику для реализации следующих этапов и уровней перцептивной обработки: начальный этап, когда вырабатывается гипотеза о дальности системы до объектов интерьера; этап динамического слежения, когда в направлении, противопо¬ ложном сдвигу системы, как целое переадресуется пространственное распределение возбуждений, моделирующее 3-D геометрию интерьера, и уточняются оценки ро; уровень перцептивного анализа сцены, когда на ”каркас” модели интерьера в точечном представлении с полных (непрерывных, полуто¬ новых) изображений на поверхности СЦП0 передаются с пространст¬ венной интерполяцией остальные детали изображения (и, если это необходимо, проводится его стереометрический анализ, а также оценка параметров движения объектов сцены). Сдвнгн системы и константность положения в перцептивной модели. В проведенной детализации процесса появились новые черты принци¬ пиального характера, которые следует подчеркнуть особо. 1. Модель интерьера (ближнего предметного окружения) на этапе динамического слежения ведет себя как почти жесткое целое (тем 344
более жесткое, чем меньший разброс значений р характеризует комплекс эгоцентр—интерьер и чем меньшие сдвиги в масштабе р0 задают движения системы). Эта целостность может не только поддерживаться с помощью разрозненных адресных привязок к автоматам в состоянии возбуждения, но и претерпеть качественную эволюцию, если допустить возможность накопления в возбужденных автоматах геометрических цветовых описаний для некоторой окрест¬ ности наблюдаемой поверхности, формирующихся перцептивной моделью (окрестности, простирающейся до такого же рода областей соседних возбужденных автоматов). Таким образом, в перцептивной модели были бы функционально объединены задачи трехмерного анализа и восстановления непрерывности и ’’поверхностности” (свойств рассеяния объектов) видимого. 2. Преобразование информации, топически связанной с рецепторной поверхностью, к виду, необходимому для организации стабильности поля, включает два уровня: локального пересчета входных коор¬ динат в полусферические и общей их динамической переадреса¬ ции, компенсирующей вращение оптической оси системы. Оба уровня меняют координатную ’’разметку” оптического потока, никак не трансформируя его двумерную связность. Сам смысл преобразова¬ ния подсказывает для СЦПо введение той же обрабатывающей структуры, что и для трехмерной перцептивной модели: поверхность СЦПо также должна мыслиться как активный 2-D комплекс автоматов (сферический слой), для успешной работы которого необходимы предварительный анализ глобальных параметров движения и этап установления соответствия, формирующий сигналы управления пе¬ реадресациями входного двумерного массива (как необходимыми движениями карт входных изображений точек). На уровне СЦПо создается непрерывный сферический экран стабилизированной опти¬ ческой информации, структурно прорабатывающий области лучшего видения в данный такт, накапливающий и хранящий облик видимого по всем направлениям сферы СЦПо. Радиальное проецирование оптического массива внутрь сферы на оболочку точечной пер¬ цептивной модели интерьера превращает 2-D экран в 3-D модель. Она и является тем интегративным уровнем отображения, осуществ¬ ляющим связь с долговременной образной памятью, механизмами переключения внимания и согласования бинокулярной и монокулярной информации в задаче инвариантного анализа того или другого объекта сцены и т.п. 3. Этап динамического слежения, когда перцептивная модель ин¬ терьера уже создана и должна только поддерживаться, пополняясь появляющимися деталями объекта, алгоритмически проще начального этапа оценки поля ро (проверить согласованность 2-D и 3-D представле¬ ний несравненно легче, чем создать само 3-D представление). Именно на начальном этапе должны проявить себя вводимые нами проекционные методы оценки глубины. Так же как и в случае бинокулярного восприятия, для осуществления обсуждаемого этапа можно предложить несколько методов — от чисто вычислительных до преимущественно силовых (активно-динамических). 345
Выразив интуитивную убежденность в технической реализуемости высказанных здесь идей вычислительного плана (трехмерная среда параллельных микропроцессоров) и содержательности аналогий изме¬ рительно-силового подхода в попытках осмысления механизмов восприятия, обрисуем два таких способа. Итак, система, совершающая прямолинейное движение, решает задачу вычисления ро по каждой из цепочек предвозбужденных (на первом такте) автоматов, лежащих на луче, связывающем эго¬ центр с изображением точки. На втором такте стабилизированная карта изображений точек изменится со сменой точки наблюдения, при этом появятся новые ”предвозбужденные” цепочки автоматов, тем более уклонившиеся от соответствующих им направлений на первом такте, чем ближе к прямому угол между пространственным на¬ правлением сдвига и полярным радиусом данного изображения точки объекта. И поскольку мы зафиксировали эгоцентр в центре СЦПо, относительно него в противоположном направлении осущест¬ вит сдвиг весь интерьер. Оценив сдвиг (в масштабе СЦПо) и его направление, что система может сделать и без интермодальных подсказок из блоков вести- буляции и моторики в результате установления соответствия двух тактов на СЦПо, 3-D процессор может решить следующую парал¬ лельную локальную задачу: перевести на втором такте в состояние возбуждения тот автомат на луче изображения точки, от которого по вектору сдвига можно попасть на луч изображения соответст¬ вующей точки на первом такте. В результате этой процедуры (с погрешностями, связанными с неевклидовостью сенсорного пространства) появляется 3-D ’’каркас” перцептивной модели интерьера, а вектор сдвига становится первым звеном пространственной ломаной, интегрирующей траекторию системы относительно интерьера в одном с ним масштабе. Идея силовой процедуры состоит в целенаправленном изменении кривизны сенсорного пространства при переходе от центрально¬ симметричной метрики на первом такте к специальным образом асимметричной (сфера со смещенным центром) на втором такте, при которой ”волна” или ”луч”, посланные нормалью с поверхности внутрь СЦПо, окажутся проходящими мимо предвозбужденного (по правилу предыдущего метода) на первом такте автомата в направ¬ лении, задаваемом ’’номограммно” вектором сдвига и позицией автомата в искривленном пространстве. Подобная номограмма могла бы формироваться в результате зрительного обучения и переопределять¬ ся в случае так называемой оптической трансформации изображений, вносимой искусственно в зрительный процесс экспериментатором (об экспериментах с трансформацией см. в книге [I]). Принцип наивного изоморфизма и преимущества трехмерной пер¬ цептивной модели. Рамки статьи не позволяют обсудить идею реализации бинокулярной модели интерьера. Заметим, что это рас¬ ширение не потребует введения новых ’’сущностей” в процессор, создающий перцептивную модель, и в процедуры его функциони¬ рования (как показал предварительный анализ, бинокулярной перцеп¬ 346
тивной модели такого рода присущи и, диплопия, и выделение особой зоны оптимального синтеза, аналогичной зоне Панума, и пр.). Введение бинокулярности в некотором смысле удваивает сложность представления и обработки информации, добавляя преиму¬ щества эффективности и точности этапу синтеза перцептивной модели, особенно в ситуациях, когда сдвиги системы малы или их нет. То же относится к идеям реализации инвариантного отображения отдельных движущихся объектов. Важнейшие из необсуждавшихся аспектов проблемы пространственной константности восприятия отразим в краткой сводке потенциальных преимуществ развитого подхода: идеи наивного изоморфизма как концептуальное ядро принципа гештальта [34, 33] в предлагаемом проекционно-полевом подходе получают начальное конструктивное разрешение, сводя в один функциональный узел механизмы перцептивной инвариантности, статики и динамики, монокулярного и бинокулярного синтеза; хранение в памяти копий перцептивной модели сцены или объекта как однослойного 3-D комплекса, упрощая способ записи, дает ввиду обратимости проекционной схемы возможность операциональ¬ ного воплощения процессов конструирования 3-D образов (механизм воображения) и ассоциативной зрительной памяти (одна 3-D запись может продуцировать необходимые 2-D ракурсные копии эталонного объекта); перенесение с плоской проекции и развитие для сферической центральной проекции аппарата вурфов должно упростить процедуру установления соответствия и сделать ее более однородной с другими этапами зрительной обработки, если формирование и использование проективных инвариантов проводить на активных 2-D структурах (нейронных сетях, слое локально взаимодействующих автоматов). ЗАКЛЮЧЕНИЕ Задержимся у истоков двойственности восприятия цвета и формы, рассмотрев ее как следствие естественной оппозиции категорий ’’свет”, ’’материя”, ’’идея”. Дуальный характер задачи видения и тел, и лучей, когда первые должны восприниматься несамосветящимися и вопреки ’’шуму”, вносимому в стимул собственным цветом луча, осветившего тело, а вторые — не восприниматься как пассивно рассеявшие свет поверхности, раскрывает недопустимую в ощущении ущербность решения в пользу только одной из сторон: монопольно предметное восприятие потребует оценки источника освещения как пигмента, отразившего лучи несуществующего ”пра- источника”; полностью аконстантное, локально-цветовое восприятие ”не заметит” тела, сочтя его созвездием источников. Этим непростыми, но все-таки поддающимися осмыслению отно¬ шениями ’’света” и ’’материи” осложнена ситуация в современной науке о цвете, с хаотичностью ее аксиом и методик, с ее вряд ли достижениями, когда измеряется ’’белизна” луча источника, когда 347
в тесные пределы трехмерного колориметрического пространства пытаются вместить "все натуральные цветовые ощущения трихро- мата”, когда предметное восприятие трактуют в терминах ’’иррадиации и ассимиляции цвета”, ’’адаптации к фону” [36] или объясняют ’’памятью на цвета”. Другой дуалитет — ’’материи” и ’’идеи”, а проще — окраски и формы — не станем подвергать столь же пристальному разбору. Ситуация в чем-то аналогичная. Источник возможных недоразумений в носителе информации и несимметричности антагонизма: форма как геометрическая идея не нуждается в материи, в окраске, а окраска, лишенная предметной локализации, уже неотличима от цветового потока. Отсюда — беспокоящая неполнота подмены перцептивно целостной формы координатами избранных точек или линий изобра¬ жения. Ведь мы не видим координат, как не видим и ансамбля контрастных точек, когда наблюдаем тело. Оно воспринимается, во-первых, как непрерывная окрашенная поверхность и уже вслед за этим (если внимание ставит такую цель) как обладающее определенной формой. Налицо трудности представления разноуров¬ невой перцептивной информации, дополнительно осложняемые неяс¬ ностью принципиального характера в вопросе о способах представле¬ ния, хранения и обработки сигналов о форме (т.е. в вопросе о языке перцептивных моделей) в структурах зрительной ассоциативной памяти. Однако наибольшую неудовлетворенность в плане идей вызывает состояние теории зрительного интеллекта — отсутствие конструк¬ тивных моделей константности зрительного поля, положения и направления как механизмов стабильного целостного восприятия. До сих пор, несмотря на убедительные доводы оппонентов ’’универ¬ сальных теорий”, таковые, часто никак не согласованные друг с другом, сосуществуют, совершенствуются, признаются. Ни Фурье- анализ изображения, ни предельно развитая детекторная концепция, ни голограммные аналогии иконической памяти, ни какой-либо другой метод, потерявший из виду сенсорную модель мира, не могут решить проблем константного экрана, гештальт-синтеза объектов, формирования иерархических представлений от стереометрического к лингвистическому в ассоциативной памяти как узловых проблем психофизиологии зрения. Но сам факт нарастающей поляризации представлений, поиск и уточнение границ нашего сегодняшнего незнания, заметный всплеск новых идей и разработок в области искусственного интеллекта — все это позволяет автору кончить разговор с читателем на опти¬ мистической ноте. ЛИТЕРАТУРА \. Логвиненко А.Д. Зрительное восприятие пространства. М.: Изд-во МГУ 1981 224 с. 2. Лосев И.С., Максимов В.В., Николаев П.П. Об узнаваннн окраски и объемной формы предметов / / Биофизика, 1975. Т. 20, N 2. С. 313. 3. Максимов В.В., Николаев П.П. Цветовая оппонентность и константность цветовосприятия // Биофизика. 1974. Т. 19, N I. С. 151—157. 348
4. Петров А П. О структуре многообразия цвета: Препр. N 4050/15. М.: Ин-т атом, энергии им. И. М. Курчатова, 1984. 19 с. 5 Щедрин В.Е О размерности многообразия цветовых ощущений человека // Сенсорные системы. Л.: Наука, 1977. С. 73—84. 6. Николаев П.П. Некоторые алгоритмы узнавания окраски поверхностей / / Моделирование обучения и поведения. М.: Наука, 1975. С. 121—151. 7.Николаев Ц.П. Полевые преобразования в моделях константности зрительного восприятия. Рукопись деп. в ВИНИТИ 07.07.87. N 4824—В87. 8. Нюберг Н.Д.. Николаев П.П., Бонгард М. М. 2.0 константности восприятия окраски // Биофизика. 1971. Т. 16, N 6. С. 1052—1063. 9. Петров А.П. Свет, цвет и форма. — Наст. сб. 10. Horn В.К.Р., Schunck B.G. Determining optical flow //Artif. Intell. 1981. Vol. 17, N 1/3. P. 185—204. 11. Соколов E.H.. Измайлов Ч.А. Цветовое зрение. М.: Изд-во МГУ. 1984. 175 с. 12.Нюберг Н.Д. Опыт построения тела цветовых ощущений при заданном осве¬ щении II Вестн. теорет. и эксперим. электротехники. 1928. Т. 1, N 6. С. 232—238; N 7. С. 248—252. 13. Максимов В.В. Трансформация цвета при изменении освещения. М.: Наука, 1984. 160 с. 14.Николаев П.П. Модель константности цветовосприятия для случая непре¬ рывных спектральных функций / / Биофизика. 1985. Т. 30, N 1. С. 112—117. 15. Гельмгольц Г.Л. О зрении // Науч. обозрение. 1896. N 3. С. 86—94. 16. Нюберг Н.Д.. Бонгард М.М., Николаев П.П. 1. О константности восприятия окраски / / Биофизика. 1971. Т. 16, N 2. С. 285—293. \l.Land Е.Н. The retinex theory of color vision // Sci. Amer. 1977. Vol. 237, N 6. P. 108—128. 18. Brill M.H. A device performing illuminant-invariant assessment of chromatic relations // J. Theor. Biol. 1978. Vol. 71. P. 473—478. 19.Николаев П.П. Различение и узнавание окраски и геометрии поверхностей в условиях монокулярного статического восприятия: Автореф. дис. ... канд. биол. наук. М.: Ин-т пробл. передачи информации АН СССР, 1975. 20 с. 20. Man D. Vision. San Francisco: Freeman. 1981. 398 p. 21. Brady J.M. The changing shape of computer vision // Artif. Intell. 1981. Vol. 17, N 1/3. P. 1 — 16. 22. Grimson W. From images to surfaces: A computational study of the human early visual system. Massach: MIT press, 1981. 274 p. 23.Koenderink J.J., van Doorn A.J. Visual perception of rigidity of solid shape // J. Math. Biol. 1976. Vol. 79, N 3. P. 79—85. 24.Prazdny K. Egomotion and relative depth from optical flow // Biol. Cybern. 1980. Vol. 36. P. 87—102. 25. Woodham R.J. Photometric method for determining surface orientation from multiple images // Opt. Eng. 1980. Vol. 19. P. 139—144. 26. Ульман III. Принципы восприятия подвижных объектов. М.: Радио и связь, 1983. 167 с. 27. Зенкин Г.М., Петров А. П. Функциональная организация зрительного процесса н принцип гештальта — Наст. сб. 28. Вайнцвайг М.Н., Полякова М.Н. Механизмы мышления н моделирование его работы в реальном времени. — Наст. сб. 29. Николаев П.П. Вычисление формы движущихся объектов с помощью проектив¬ ных инвариантов / / Всесоюз. снмпоз. "Зрение организмов н роботов”. Вильнюс, 1985: (Тез. докл.). Вильнюс: Вильнюс, гос. ун-т, 1985. С. 73—74. 30. Бонч-Осмоловский А. М., Петров А. П. Модели н алгоритмы стереосинтеза // М.: Нн-т атом, энергии им. И. М. Курчатова, 1983. 76 с. 31. Кирейтов В. Р. О задаче определения оптической поверхности по ее изобра¬ жениям // Функцнон. анализ и его прнл. 1976. Т. 10, вып. 3. С. 45—54. 32 .Смирнов С. А. Стереоперспектива в фотограмметрии // М.: Недра, 1982. 142 с. 33. Gibson J.J. The perception of the visual world. Boston: Houghton Mifflin. 1950. 230 p. 349
ЪА.КдМег W. Gestalt psychology. 2-nd. N.Y.: Liveright, 1947. 369 p. 35.Зенкин Г. М., Петров А.П. О механизмах константности зрительного восприятия пространства //Сенсорные системы. JI.: Наука, 1979. С. 25—39. 36.Пздхем Ч„ Сондерс Дж. Восприятие света и цвета. М.: Мнр, 1978. 256 с. УДК 621.391 СВЕТ, ЦВЕТ И ФОРМА А.П. Петров Эта статья является продолжением публикации [1], в которой было предложено новое определение цвета поверхности и рас¬ смотрена структура цветового многообразия для человека. Здесь мы используем иной подход к описанию освещения в сцене, не опирающийся на обычное описание свойств источников света, и при¬ ведем результаты попыток вычислить форму поверхности по данным фотометрирования реальных объектов. СТРУКТУРА СВЕТА В СЦЕНЕ Несмотря на признаваемую многими авторами [2—4] важность для теории зрения и практики компьютерного анализа сцен вопросов, относящихся к освещению, они еще не получили достойного внимания исследователей. Большинство авторов ограничиваются указанием на спектральные и пространственные свойства возможных источников и их число, те же, кто предлагает алгоритмы для анализа формы и цвета, не использующие сведения об источниках, обычно уста¬ навливают требования к допустимому освещению, не включая в задачу вычисление его параметров. Но свет в сцене является ее неотъемлемой частью, и, безусловно, его характеристики следует вычислять наряду с формой, цветом и другими свойствами предметов, наполняющих сцену. Знание законов, управляющих пространственным распределением света в сцене, очень существенно для понимания таких явлений, как визуализация. Но эта структура очень слабо изучена, и предстоит выяснить, какие именно свойства света в сцене эксплицируются зрительной системой и с помощью каких алгоритмов. Не претендуя на окончательное решение этой проблемы, предложим одно из возмож¬ ных описаний структуры света в сцене. Спектральные свойства света в сцене для задач анализа формы объектов достаточно описывать в свернутом виде, используя лишь его колориметрические характеристики, совокупность которых будем обозначать h0. У человека этот вектор содержит три компонента, системы технического зрения могут иметь другое их число — размерность цветового пространства. Для описания пространственного распределения света в сцене используем следующую процедуру. Поместим в некоторую точку Р сцены небольшую сферу с белой ламбертовой поверхностью. Тогда 350
свет, приходящий в точку Р, может быть описан векторной функцией колориметрических характеристик светового потока, отра¬ женного от этой сферы. Переходя от точки к точке, опишем пространственное распределение света в сцене в виде векторной функции Ьо(Дп), где п — вектор нормали. В некоторых простых случаях мы можем продолжить анализ структуры света в сцене и определить вид функции ho(P, п). Например, в случае чисто диффузного освещения она представима в виде произведения некоторой скалярной сферической функции у(Р,п), которую назовем апертурой неба, и постоянного вектора колориметрических характеристик h§: h0(P,n)=y(P,n)h§. Для апертуры неба с большей или меньшей уверенностью можно делать предположения о гладкости и даже медленности изменений по обоим аргументам. Принципиально другим случаем является освещение, создаваемое несколькими точечными, произвольно расположенными источниками. При таком освещении вся поверхность нашего пробного тела — белой сферы — разбивается на области, на которых все точки освещены одним и тем же набором осветителей-источников. Он меняется при переходе из одной области в другую, и количество и размер этих областей зависят от количества и расположения источников освещения: чем их больше, тем больше областей, меньших по размеру. Напишем выражение для светового потока, идущего в глаза наблюдателя от точек одной из таких областей нашей сферы: i=N i=N Ь0(Лп)= X (ho,-(nr,))=n X ho,T,-- /=I /=1 Здесь N — количество источников, освещающих эту область; hoi — колориметрические характеристики потока, идущего от белой ламбертовой площадки, нормально ориентированной к источнику с номером i и освещенной только им одним (аналог интенсив¬ ности); п — единичный вектор нормали; rj — единичный вектор в направлении на источник с номером / от точки Р. Принимая во внимание тот факт, что ho является линейной функцией от вектора нормали, можно окончательно записать эту функцию в виде ЬоСР,п)=ЯоСР,п)п, N где На= £hor. —матрица размера 3X3, постоянная для определенной I 1 ' ранее области сферы. Это равносильно замене всех точечных источни¬ ков, освещающих данную область, на три фиктивных с фикси¬ рованным положением и специально подобранными спектрами. Объединим теперь полученные формулы для того, чтобы описать структуру света в сцене в общем случае комбинации диффузного 351
и точечного освещения: h0(Р, п) = ЩЛ Ф+У(Р. п)Ь§. (1) Здесь матрица Но(Р, п) является кусочно-постоянной функцией от п, а у(Р, п) незначительно меняется на каждой области постоянства Но. Это значит, что для полного описания освещения достаточно иметь набор Но, у, h§ для каждой точки сцены. Формула (1) позволяет утверждать, что вся сцена разбивается на такие области, внутри которых освещение является многооб¬ разием трехмерного линейного пространства L{SU S2, S3}, где за Si, S2 и S3 приняты введенные ранее фиктивные источники. ЦВЕТ ПОВЕРХНОСТИ Прежде чем описывать процедуру измерения, с помощью которой мы собираемся дать определение цвета поверхности, сделаем два замечания. Во-первых, как уже было отмечено, цвет (как свойство) мы относим к поверхностям, составляющим наблюдаемую человеком сцену. Цвет поверхности, конечно, полностью определяется зависи¬ мостью индикатрисы рассеяния этой поверхности от длины волны освещения. Но цвет также определяется свойствами зрительной систе¬ мы и возможными вариантами освещения. Таким образом, будем говорить лишь о так называемых пигментных цветах, полагая, что апертурные цвета хорошо представлены в колориметрическом пространстве. Во-вторых, предположим, что возможные варианты освещения могут быть получены в виде комбинаций некоторых трех основных источников, т.е. освещение интересующей нас поверхности осуществля¬ ется тремя источниками, фиксированными по спектральному составу с произвольными интенсивностями (возможно, и отрицательными). Это допущение не находится в сильном противоречии с естественными условиями наблюдения, в которых обычно имеется весьма ограни¬ ченный набор источников света. В пользу такого предположения говорит и сделанное выше замечание о трехмерности пространства освещения. Перейдем теперь к определению цвета поверхности. Пусть имеется окрашенный образец поверхности, цвет которого предстоит измерить. Процедура измерения поясняется на рис. 1. В операции измерения используется колориметр, три основных источника: Si, S2, S3, состав¬ ляющие базис пространства освещения сцены L(S), и эталонный белый образец. Условия, которым они должны удовлетворять, выяснятся позднее. Измерение состоит из двух этапов: предварительного измерения эталонного белого образца, когда получаем три вектора: hoi, Ьог, Ьоз для источников Si, Si, S3 соответственно, и основного измере¬ ния окрашенного образца, когда находим еще три вектора: hi, Ьг, Ьз в аналогичной процедуре колориметрического опыта. Теперь, по определению, полагаем, что цвет измеряемого образца есть числовая матрица размера 3X3, связывающая результаты 352
Рнс. 1. Схема измерения цвета окрашенного образца с помощью колориметра I — осветитель; 2 — измеряемый образец; 3 — поле сравнения колориметра; Si—Si — светофильтры для создания освещения Рнс. 2. Зависимость коэффициента отражения от длины падающего света для трех окра¬ шенных образцов I — пурпурный; 2 — коричневый; 3 — сииий колориметрических опытов следующим образом: О10/=ЬД7 =1,2,3). (2) Для корректности определения следует позаботиться о том, чтобы такая матрица существовала и была единственной. Очевидно, что это зависит от свойств выбранных базисных осветителей Si—Si и от свойств 23. За к. 1668 353
I эталонного белого образца. Процедура, безусловно, будет кор¬ ректной, если матрица Но, составленная из столбцов hoi, Ь02 и Ьоз, окажется невырожденной. Это и есть те условия, которым должны удовлетворять осветители и эталонный белый образец. Цвет белого образца соответствует единичной матрице в любом базисе, а матрица цвета черного образца состоит из нулей. Матрицы цвета для окрашенных образцов будут, естественно, меняться при смене базисных излучений колориметра. При наличии данных о зависимости коэффициента отражения образца от длины волны освещения и кривых сложения стандартного наблюдателя можно вычислить цвет этого образца, не прибегая к описанной выше процедуре прямого измерения цвета. Но при этом следует помнить, что при вычислении цвета подразумевался стандартный наблюдатель. Цвет данного образца может не совпадать с полученным в измерениях для конкретного человека. Кривые отражения нескольких окрашенных бумаг и результаты подобного расчета для них приведены на рис. 2. В качестве базисных источников освещения взяты стандартные A, D65 и D250 [5]. Матрицы, соответст¬ вующие кривым 1-3 на рис. 2, имеют вид С,= Съ = 0,65 —0,44 0,16 0,006 0,05 —0,06 0,02 0,008 0,21 Сг = 0,3 —0,14 0,1 0,06 0 0 0 0 0,1 —0,03 —0,19 —0,11 0,24 0,01 0,43 0,02 0,14 0,46 Анализ показывает, что матрицы цвета всевозможных поверхностей заполняют выпуклую ограниченную область в девятимерном прост¬ ранстве. ОСНОВНОЕ УРАВНЕНИЕ Теперь можно написать уравнение, аналогичное уравнению Хорна [6], но для случая цветного сложного освещения и окрашенных поверхностей: С(р)(Ноп + уЫ)=Ь(р). (3) Здесь С — матрица цвета поверхности; п — вектор нормали; h — вектор "стимула”, или колориметрические характеристики изображения. Это уравнение получается непосредственной подстанов¬ кой выражения (1) в (2) и по своей форме близко к уравнениям для стимулов в публикациях [3, 7], но записано в психофизических переменных и без упрощающих предположений о спектральных функциях или замены непрерывных функций дискретными. Все функции, входящие в уравнение (3), определены теперь в точках изображения, причем Но (р) — кусочно-постоянная функция, а произведение yh§ меняется очень медленно. Дальнейший содержа¬ тельный анализ возможен только для случая кусочно-постоянных матриц цвета как функций точек изображения. Если не делать 354
I такого предположения, то ограничительное значение уравнения (3) становится очень малым, и с помощью камуфлирующей окраски зрительную систему всегда можно привести к ложному заключению о форме поверхности. С другой стороны, есть некоторые основания считать, что зрительная система человека решает задачу о вычислении формы в аналогичных предположениях о возможных окрасках. Несложный анализ уравнения (3), справедливого теперь уже в областях изображения, которые получаются пересечением областей постоянства для функций Но, С и у,показывает, что в общем случае это уравнение может быть однозначно разрешено относительно поля нормалей, хотя бывают случаи (обычно для фотометрических уравнений), когда решений несколько или даже целое семейство. Примером служит плоский мондриан. Однозначно разрешить уравнение (3) относительно цвета С и освещения Но (а не только поля нормалей) нельзя, так как с каждым таким решением,т.е. набором {С, Но, уЬ§, п} мы можем связать некоторое другое решение {СА, А~' Ho,yA~'h& "}» где А — произвольная невырожденная матрица. Из этого следует важный вывод о невоз¬ можности локальными процедурами определить структуру света в сцене и цвета поверхностей. Обращаясь к вопросу о константности цвета, следует сразу подчеркнуть, что в самом уравнении (3) записано требование о ней, так как в случае постоянно окрашенного, но имеющего искривлен¬ ную поверхность объекта поле h(p) будет непостоянным, а решение в силу однозначности относительно нормали должно давать постоянную матрицу СНо. Это значит, что константность цвета при изменении освещения, возникающем за счет ’’кривой” формы, обеспечена. Вопрос о том, что произойдет с вычисляемым цветом при замене источников света в сцене, остается открытым. Ясно, однако, что гарантировать, а, значит, и требовать такую константность как результат обработки изображения принципиально нельзя. АЛГОРИТМ Кратко опишем алгоритм решения уравнения (3), позволяющий показать принципиальную возможность прямого локального вычисле¬ ния формы поверхности в зрительной системе с тремя цветовыми каналами. Это не значит, что он должен быть применен в прак¬ тических системах для анализа сцен. Тем не менее некоторые ’’части” алгоритма, безусловно, лягут в основу практических разработок. Мы рассматриваем случай получения изображений путем орто¬ гонального проецирования с помощью идеальной камеры. Безуслов¬ но, на практике необходимо учитывать аппаратную функцию опти¬ ческой системы и перейти к центральной проекции. Но инте¬ ресующие нас сейчас вопросы могут быть рассмотрены и в таком приближении. Формой поверхности считаем поле нормалей п(р), заданное в некоторой области, и ’’вычисление формы поверхности” означает вычисление трех компонентов этого поля как функций от х 355
и у. Для простоты изложения предположим отсутствие диффуз¬ ного компонента освещения, т.е. йз = 0, и обозначим матрицу А = СНо, считая ее матрицу постоянной и невырожденной. Для описания формы в окрестности некоторой точки введем девять переменных: Э 2 Э 2 _ Эр р~дх'д~ду'г Эх’ _Эг Э/ г* Эх’ у Эх Только две первые из них будут вычисляться в качестве вы¬ ходных величин алгоритма, остальные участвуют в уравнениях и помогают при переходе от одной точки области к другой. Дифференцируя основное уравнение (3) по каждой из переменных и учитывая сделанные упрощающие предположения, получим систему следующих уравнений: A NDN=HDH, А ■ DDN = DDH, (4) где NDN = {n, n*, n DDN = {n**, пху, п уу}. Обе эти матрицы состоят из элементов, которые могут быть легко выписаны в виде функции от р, q, г, s, t, rx, rr tx, ty. Матрицы HDH = {h, hj, hy} и DDH = {h**, bxy, hyy} вычисляются с помощью локальных дифференциальных операторов (рецептивных полей). Исключая матрицу А из системы уравнений (4), окончательно получим DDN = NDN ■ HDH~' ■ DDH. Это матричное уравнение представляет собой алгебраическую си¬ стему из девяти уравнений с девятью неизвестными — парамет¬ рами формы, введенными выше. Для решения с помощью ЭВМ может быть применен любой метод последовательных приближений. Мы использовали в качестве начального приближения плоский фрон¬ тальный кусок поверхности: все параметры равны нулю. После получения решения для данной точки, прежде чем перейти к вы¬ числению для следующей точки, начальное приближение вычисля¬ лось в виде отрезка ряда. Такой способ дает быструю проце¬ дуру вычисления формы. О РЕЗУЛЬТАТАХ РАСЧЕТА НА ЭВМ Расчеты проводились в модельной ситуации, которая генериро¬ валась на ЭВМ с целью определения предельно возможной точ¬ ности вычисления формы описанным выше методом, и в реальной ситуации, когда в ЭМВ вводились данные фотометрирования снимков некоторой простой сцены — в данном случае сферической поверх¬ ности, освещенной пятью цветными осветителями. В модельной ситуации восстановление формы (поля нормалей Э z дд _Эг _ Э? S~dxdy’ (~ду’гУ~ду’ г*~дх’ 356
и вторых производных) проводилось очень точно — ошибка не превышала 1%. В этих исследованиях, естественно, были обнару¬ жены случаи неоднозначности, но точность определения всех суще¬ ствовавших решений высока и связана с точностью вычисления производных поля h. При переходе к реальной сцене ошибки резко увеличивались и достигали 10%. Объяснялось это качеством фотографий и погреш¬ ностями процесса фотометрирования (применяли автоматический мик¬ роденситометр АМД-1 и ЭВМ СМ-4). Вообще говоря, требования к точности измерения на этих эта¬ пах довольно высоки и определяются необходимостью использо¬ вания при обработке дифференциальных операций над изображе¬ ниями, результаты которых очень чувствительны к шуму на входе. Для снижения влияния погрешностей ввода изображений в ЭВМ на результаты обработки изображений были использованы ’’диф¬ ференцирующие маски” с площадями 25 пикселей для усреднения самого поля h, 50 пикселей для первых производных и 120 пик¬ селей для вторых производных. * * * Сформулируем основные положения рассмотренной выше теории восприятия формы системами, обладающими цветовым зрением: процедура анализа трехмерных сцен в компьютерном или ’’жи¬ вом” зрении должна включать в себя процесс вычисления ха¬ рактеристик освещения и эксплицировать их вместе с цветом и формой объектов; структура света в сцене может быть задана набором кусочно¬ постоянных функций Яо, у, h о; при наличии у системы трехканального цветового зрения имеется возможность прямого вычисления формы поверхности (поля норма¬ лей); цвета поверхностей и свет в сцене определяются совместно с помощью нелокальной процедуры; понятие о цвете как о линейном операторе в колориметрическом пространстве позволяет решить проблему цветовой константности для многообразия изменений освещения из-за вариаций нормали поверхности; алгоритмы обработки изображений и вычисления формы должны приводить к правильным результатам при масштабных искажениях входных данных (поля h), так как процессы адаптации значи¬ тельно меняют чувствительность приемников в цветовых каналах (таким свойством обладает приведенный алгоритм вычисления формы, что, вообще говоря, имеет глубокую связь с аффинностью коло¬ риметрического пространства). ЛИТЕРАТУРА 1. Петров А.П. О структуре многообразия цвета: Препр. N 4050/15. М.: Ин-т атом¬ ной энергии им. И.М. Курчатова, 1984. 19 с. 2. Peniland А.P. Finding the illuminant direction // J. Opt. Soc. Amer. 1982. Vol. 72, N 4. p. 448—455. 357
3. Николаев П.П. Некоторые алгоритмы узнавания окраски поверхностей // Мо¬ делирование обучения и поведения. М.: Наука, 1975. С. 121 —151. 4.Максимов В.В. Трансформации цвета при изменении освещения // М.: Наука, 1984. 166 с. 5. Джадд Д., Вышецки Г. Цвет в науке и технике. М.: Мир, 1978. 350 с. 6. Хорн Б. Определение формы по данным о полутонах / / Психология машин¬ ного зрения. М.: Мир, 1978. С. 137—184. 7. Николаев П.П. Модель константности цветовосприятия для случая непрерывных спектральных функций // Биофизика. 1985. Т. 30, N 1. С. 112—117. УДК 62.50:681.3 МОЛЕКУЛЯРНЫЕ ИНФОРМАЦИОННЫЕ УСТРОЙСТВА И ЗАДАЧИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Н.Г. Рамбиди, В. М. Замалин, Ю.М. Сандлер Задачи переработки информации, требующие использования мощной вычислительной техники, можно разделить на три основные кате¬ гории: строго логические, т.е. формализуемые; частично формализуемые; эффективно неформализуемые задачи. К первой относятся проблемы, допускающие формулировку в аб¬ страктной символике, дискретный счет и априорное построение алгоритма. Этому типу задач адекватно соответствуют устройства твердотельной электроники, построенные из универсальных логи¬ ческих элементов с жестко заданными функциями и программно- перестраиваемыми связями! Алгоритмы решения таких задач доста¬ точно хорошо сводятся к последовательности простейших логических и арифметических операций. К этой категории относятся проблемы расчета и проектирования физического и математического экспе¬ римента, численное решение различных типов сложных уравнений, целый ряд задач экономического прогнозирования, управления техно¬ логическими процессами и многие другие. И хотя мощность совре¬ менных вычислительных устройств часто недостаточна для решения сложных вопросов такого типа, быстрый прогресс ЭВМ традицион¬ ной архитектуры фон Неймана, направленный на увеличение быстро¬ действия элементов и объема оперативной памяти, а также появ¬ ление новых перспективных архитектур машин и языков програм¬ мирования позволяют надеяться, что будет неуклонно расти число решаемых задач этой категории, а также повышаться их слож¬ ность. Вторая категория охватывает задачи, для которых алгоритм хотя и может быть построен, но априори отсутствует строгий инфор¬ мационный критерий их разрешимости. Очевидно, что подобная ситуация возникает тогда, когда требуемый критерий априори не яв¬ ляется формальным, но может быть формализован в процессе решения. 358
Под третьей категорией будем понимать ситуацию, когда даже если и существует алгоритм решения конкретной задачи, то он существенно изменяется при ее незначительной модификации, и, таким образом, не существует единого эффективного алгоритма, пригодного для класса близких задач. Это задачи распознавания образов, обработки речевой информации, контекстно-зависимые и другие задачи искусственного интеллекта. Именно решение задач двух последних категорий на ЭВМ, построенных с использованием обычной элементной базы, оказывается затруднительным, а часто и вообще невозможным. Мы полагаем, что это связано с основными характеристиками традиционной элементной базы (которые, кстати говоря, и делают ее адекватной для решения задач первой категории), а именно: примитивность элементарных логических операций; ограниченный набор этих операций; жесткость (т.е. неизменность) операций, выполняемых данным элементом. Очевидно, что попытка моделирования на элементах, обладающих этими свойствами, контекстно-зависимых задач, в процессе решения которых неизбежна постоянная пересемантизация, чрезвычайно затруд- i нительна, если вообще возможна. То же самое проявляется и в задачах распознавания образов [1,2]. Фактически каждая элементная база ставит свои и притом дос¬ таточно жесткие ограничения как на способы решения задач, так и на сложность информационных систем. Представляется естественным, что элементы машин, используемые для реализации эффективно неформализуемых, модифицирующихся в ходе решения задач, должны выполнять не только простые логические, но и макрооперации, соответствующие командам язы¬ ков высоких уровней, и, кроме того, должны быть функционально пластичными, обучающимися и самоорганизующимися. Заметим, что под функциональной пластичностью будем понимать не только способность изменять вид операций, выполняемых элементом, но и возможность его перестройки из операционного элемента в эле¬ мент памяти1. В этой статье мы хотели бы показать возможность построения такой элементной базы молекулярных устройств, содержащих не¬ которые элементы, присущие биологическим системам, а именно: белковые рецепторы, ферменты и некоторые другие макромоле¬ кулы, иммобилизованные в специально организованной системе мем¬ бран, находящихся в растворе определенных химических веществ. При этом ввод и вывод информации может осуществляться опти¬ ческим излучением, приборами зарядовой связи (ПЗС) или локальным введением специально выбранного химического реагента. По необходимости будем пользоваться рядом биохимических и биологических терминов, которые кратко поясняются в сносках (для более подробного ознакомления рекомендуем обратиться к известным монографиям [3,4]). 1 На эти обстоятельства наше внимание обратили Я.Г. Дорфман и В.М. Сергеев [2]. 359
ХАРАКТЕРНЫЕ СВОЙСТВА БИОЛОГИЧЕСКИХ МАКРОМОЛЕКУЛ, ОБЕСПЕЧИВАЮЩИХ ПРИНЦИПИАЛЬНЫЕ ВОЗМОЖНОСТИ СОЗДАНИЯ МОЛЕКУЛЯРНЫХ ИНФОРМАЦИОННЫХ УСТРОЙСТВ Прежде всего рассмотрим несколько примеров, иллюстрирующих сходство процессов, протекающих в молекулярных системах, с вы¬ полнением логических операций. Говоря о молекулах, которые могут представлять интерес как кандидаты для использования в качестве элементной базы моле¬ кулярных информационо-логических устройств, прежде всего имеют в виду большие молекулярные системы типа белков. Они построены в виде линейной последовательности фрагментов, представляющих собой 20 канонических аминокислот (пептидов), различные соче¬ тания которых и порядок следования в цепи (первичная структура) определяют разнообразие и свойства биологических микрообъектов. Реальный белок содержит сотни аминокислот. Состоящие из них полипептидные цепи имеют достаточно сложную пространственную структуру, образуя на отдельных участках цепи спиральные и складчатые агрегаты — так называемую вторичную структуру. В свою очередь, эти агрегаты компактно укладываются друг отно¬ сительно друга в третичную пространственную структуру, отве¬ чающую минимуму потенциальной энергии (точнее, в одну из воз¬ можных структур, соответствующих локальным минимумам энергии взаимодействия фрагментов полипептидной цепи друг с другом и с окружающими молекулами, например с молекулами воды). И, наконец, отдельные белковые молекулы могут объединяться в белковые комплексы, которые называют четвертичной структурой. Наиболее интересными среди белковых молекул являются био¬ катализаторы-ферменты, во много раз ускоряющие протекание слож¬ ных химических реакций. Именно эти молекулы ферментов будут в основном рассматриваться ниже. Замечательное свойство ферментов, которое делает возможным использование их в качестве уникально селективных катализаторов, заключается в способности фермента распознать среди большой совокупности окружающих его молекул именно ту, реакцию которой он катализирует (так называемый субстрат), и присоединить к себе эту молекулу. Распознавание происходит за счет того, что в процессе свертывания полипептидной цепи фермента в третичную структуру образуется активный центр (рис. 1), обладающий гео¬ метрическим соответствием и как следствие минимумом энергии взаимодействия только с участвующей в реакции молекулой суб¬ страта. Соответствие типа ’’ключ—замок” — комплементарность, иллюстрируется на рис. 2 на простейшем примере не очень сложных органических молекул [5]. Во многих ферментах оно не является жестким и индуцируется другой молекулой — аллостерическим эффектором, который, присоединяясь к молекуле фермента, назы¬ ваемого в этом случае аллостерическим, перестраивает структуру молекулы фермента, делая возможным образование активного центра (см. рис. 1). Интересной и важной особенностью молекул ферментов является 360
£Г ис. 1. Упрощенная схема свертывания полипептидной цепи фермента в третичную груктуру а — с образованием активного центра (отмечен стрелкой); 6 — образование активного центра шостернческого фермента (шестиугольником показан субстрат) озможность их функционирования в нескольких различных со- гояниях, каждому из которых отвечает своя третичная (или чет- ертичная) структура. Более того, взаимодействие других молекул — убстрата, эффектора — с молекулой фермента нередко носит рко выраженный кооперативный характер. На рис. 3 схематически оказаны функциональные возможности димерного комплекса одного з ключевых аллостерических ферментов метаболизма нуклеиновых ислот — цитидинтрифосфат(ЦТФ)-синтетазы [6]. Каждая из субъеди- иц этого комплекса обладает четырьмя активными центрами и егуляторным центром, к которому может присоединиться моле- ула эффектора. Взаимодействие ферментного комплекса с субстра- зми и эффектором имеет кооперативный характер — присоеди- ение субстрата или эффектора к одной из субъединиц вызывает 361
Рис. 2. Простейший пример молекулярной системы типа ’’ключ—замок” — фторпроиз- водные полностью гидрированного коронена [5] а — две комплементарные молекулярные формы, в которых атомы фтора одной из форм (за¬ черненные кружки) соответствуют атомам водорода другой (черточки); 6 — проекция иижней моле¬ кулы на плоскость хОу; в — кривые потенциальной энергии £ для различных конфигураций "ключа” и "замка” перестройку комплекса и влияет на присоединение следующей мо¬ лекулы (см. рис. 3). Не менее богатыми возможностями обладает участвующий в синтезе молекулы рибонуклеиновой кислоты (РНК) в соответствии с заданной последовательностью нуклеотидов в цепи дезоксири¬ бонуклеиновой кислоты (ДНК) фермент РНК-полимераза, осущест¬ вляющий транскрипцию текста участка ДНК в текст РНК. Фер¬ мент РНК-полимераза представляет собой совокупность шести субъе- 362
П<Р АТФ а Ш Ш Ш / ис. 3. Схема аллостерической активации фермента ЦТФ-синтетазы а — схема димериого комплекса фермента с активными центрами аденазинтрифосфата (АТФ), ридиитрифосфата (УТФ), аммиака (NHj), глутамила и регуляторным центром присоединения уаниэинтрифосфата (ГТФ); 6 — блокировка активного центра глутамила одиой из субъединиц ермента при присоединении глутамила второй субъединицей; в — аналогичная случаю 6 блокировка егуляторного центра иниц, четыре из которых постоянно объединены в ферментный омплекс, а два — о-фактор и р-фактор — служит для распозна- ания начала и конца транскрипции. Она осуществляется по мере вижения комплекса вдоль цепи ДНК. После распознавания начального дреса о-фактор отделяется от комплекса, который далее после- овательно распознает тип нуклеотида ДНК (рис. 4), присоединяет себе из окружающего раствора аналогичный нуклеотид и спо- обствует встраиванию его в цепь РНК. Алгоритмы этого процесса редставляют собой достаточно сложную последовательность логи- еских операций. Число примеров сложных процессов, осуществляемых с участием >ерментов, можно было бы существенно умножить. Но, по-види- юму, в этом нет смысла, поскольку уже приведенные примеры ;емонстрируют основные особенности молекул ферментов осущест- лять физические действия, аналогичные: распознаванию конкретного объекта среди совокупности отлич- [ых от него по своим характеристикам объектов того же класса; возможности управляемо перестраиваться из одного дискретного состояния в другое или в несколько (более двух) других;
1 Рис. 4. Схематическое изображение (а) и алгоритм (6) функционирования ферментного комплекса ”ДНК—зависимая РНК—сиитетаза” (для простоты о- и р-факторы ие пока¬ заны) 1 — молекула ДНК; 2 — ферментный комплекс; 3 — молекула РНК; А, Г, Т н Ц — аденин, гуаннн, тимии и цитознн способности имитировать на базе этого достаточно сложные последовательности логичных операций. Эти особенности молекул ферментов дают возможность построить гипотетическую ферментную машину Тьюринга [7] и тем самым показать, что на их базе может быть организован достаточно сложный вычислительный или информационно-логический процесс. Предположим, что лента машины Тьюринга представляет собой длинную линейную последовательность атомов — скелетную моле¬ кулу, к которой через определенные промежутки прикреплены мо¬ лекулярные фрагменты двух типов, отвечающие символам двоичного алфавита ”0” и ”1” (рис. 5). К каждому из этих фрагментов может быть присоединена молекула А или В, определяющая по¬ зицию головки машины Тьюринга. В качестве головки служат ферменты Ем, ЕА1, Ею, ЕВ1, которые могут прикрепиться к цепи в точки сетки А или В, распознать символ, к которому присо- 364
Рис. 5. Этапы работы гипотетической ферментной машины Тьюринга [7] единена эта метка и в зависимости от заданных правил провести определенную последовательность действий. Пусть, например, задано правило: «Когда головка находится в состоянии А и считывает ”0”, заменить ”0” на ”1”, перейти к состоянию В и переме¬ ститься на одну позицию вправо». Для того чтобы выполнить это правило, головка-молекула фер¬ мента Ело должна присоединиться к ленте в точке метки А, отделить от ленты метку А и фрагмент ”0”, присоединить вместо него фрагмент ”1” и прикрепить метку В на следующий фрагмент справа. Далее процесс, имитируя машину Тьюринга, продолжается в соответствии с заданными правилами: 365
Исходное Считанный Записанный Конечное Перемещение тояние бит бит состояние головки А 0 1 В Вправо А 1 0 А Влево В 0 0 В Вправо В 1 1 А Влево Таким образом, может быть показана принципиальная осущест¬ вимость вычислительного (информационно-логического) процесса на базе химической молекулярной системы. Однако возможность практический реализации таких процессов и область их использования в существенной степени зависят от ответов на два основных вопроса: каковы конкретные конструктивные варианты построения уст¬ ройств, реализующих эти процессы; каковы ожидаемые преимущества использования молекулярных систем по сравнению с традиционными полупроводниковыми вы¬ числительными устройствами. Рассмотрим сначала первую проблему конкретных путей построе¬ ния молекулярных устройств. Сразу же следует подчеркнуть, что сегодня в литературе можно встретить целый ряд более или менее обоснованных предложений (см., например, монографию [8]), предпо¬ лагающих использование существующих в настоящее время или только разрабатываемых технологических приемов. В настоящем обзоре остановимся на варианте, основанном, как указывалось выше, на молекулярных элементах, иммобилизованных в организованной си¬ стеме мембран, который представляется и одним из наиболее реаль¬ ных с точки зрения практического осуществления. В молекулярных устройствах обрабатываемые и управляющие сигналы могут быть либо химическими (скажем, молекулы тех или других химических веществ), либо физическими (например, световое излучение определенных длин волн). Входными элемен¬ тами могут быть фото- или хеморецепторы2 или аллостерические ферменты. Выходные элементы определяются видом выходного сиг¬ нала. В частности, если желательно, чтобы выходным сигналом было световое излучение или распределение электрического потен¬ циала, можно использовать хемолюминофоры или ПЗС-структуры. Соответственно в зависимости от типа необходимого устройства мембраны будут как жесткими (типа пленок Ленгмюра—Блодже [9]), так и гибкими (например, натянутыми на каркас). 2 Рецепторами называются особые белки, иммобилизованные (т.е. прочно связанные) во внешних мембранах клетки, способные "узнавать” и связывать из раствора определенные вещества, называемые агонистами и антагонистами. Как правило, рецепторы всегда сопряжены с определенными ферментами, причем при связывании агоинста рецептор претерпевает структурную перестройку, которая активирует сопря¬ женный фермент. При связывании же аитагоииста рецептор блокируется, т.е. ста¬ новится неспособным к активации фермента. После освобождения от антагониста рецептор переходит в исходное состояние. Фоторецептор активирует фермент под действием света [3,4]. 366
ФУНКЦИОНАЛЬНО-ЖЕСТКИЕ МОЛЕКУЛЯРНЫЕ ИНФОРМАЦИОННЫЕ УСТРОЙСТВА Простейшими примерами молекулярных информационных устройств являются ферментный усилитель сигнала и ферментный преобразо¬ ватель одного вида сигнала в другой (например, светового в хи¬ мический, и наоборот, или химического ”1” в химический ”2”). В их основу может быть положен каскад реакций, катализируемых мультиферментным комплексом Е\, Ег... EN (Рис. 6). При этом в ферментном усилителе продукт г'-й реакции аллостерически акти¬ вирует (г + 1)|-й фермент Ei+l и, кроме того, выполняется условие Т/а / Я/ ^ hai где я, - концентрация активных центров фермента Ец т,0 — ха¬ рактерное время элементарной реакции, катализируемой этим фер¬ ментом (л, / т,0 — активность фермента); tia - характерное время, в течении которого фермент остается активным при действии на него молекулы активатора. Очевидно, что в таком случае имеем следующее соотношение: /вх / -^вых ‘ ' Пя, ha I ^ia / = I где/вх и FBbIX — сигнал на входе и выходе соответственно. Существенной особенностью такого усилителя (как и ряда других функционально жестких устройств) является возможность организации параллельной обработки сигналов. Для этого плоская поверхность мембраны может быть представлена как мозаичная система эле¬ ментов, каждый из которых используется в качестве элементарного усилителя. В отличие от ферментного усилителя в ферментном преобра¬ зователе сигнала продукт г-й реакции является субстратом (г + 1)-й. Примером подобных реакций является гликолиз — разрушение глю¬ козы с одновременным синтезом — энергосодержащего аденизин- трифосфата (АТФ) (рис. 7.). Возможности рассматриваемых устройств можно существенно расширить, вводя ферменты с несколькими эффекторами (в цепи гликолиза используется фосфофруктокиназа). В таком случае можно управлять усилением или преобразованием с помощью специаль¬ ного регулирующего сигнала (рис. 8). Более интересной, однако, представляется возможность комби¬ нировать такие устройства друг с другом. При этом могут быть построены молекулярные устройства, способные выполнять элемен¬ тарные логические операции (рис. 9). В таком устройстве фермент Ег активируется только при одновременном воздействии активаторов (или активатора и ко-фактора) А\ и Ап, являющихся продуктами реакций, катализируемых ферментами Е1 и Еа соответственно в первой и второй цепях3. Если субстраты для Е1 и имеются в избытке, то такое устройство будет выполнять операцию ”НЕ ИЛИ”. 1В принципе Ег может представлять собой несколько сопряженных ферментов или состоять из нескольких субстрат-продуктов связанных ферментов. 367
6ЫХ Рис. 6. Принципиальная схема одного из параллельных каналов простейшего фуик- ционально-жесткого молекулярного информационного устройства (линейная последо¬ вательность молекул типа ферментов в мембране) Штриховая лнння — мембрана; стрелки — вход и выход сигнала; Я — молекула рецептора; Е\. Ег, ... — ферменты; X — выходной элемент А Рис. 7. Упрощенная схема алгоритма гликолиза, регулируемого концентрацией АТФ в организме Ап =£> г О /■ d>/i бых Рис. 8. Принципиальная схема одного из параллельных каналов простейшего регу¬ лируемого функционально-жесткого молекулярного информационного устройства Ег —молекула с функциями, перестраиваемыми под воздействием сигнала F 368
I 0 => ! л Рис. 9, Принципиальная схема одного из параллельных каналов, функционально-жесткого молекулярного информационного устройства, работающего как элемент ”НЕ ИЛИ" I, II — первая и вторая последовательные цепочки реакции Не составляет труда продолжить примеры подобных устройств для операций ”И”, ’’ИЛИ”, ”НЕ”, ’’ЕСЛИ—ТО” и т.п. В принципе, комбинируя несколько регулируемых усилителей и преобразователей, вводя в них обратные .связи (типа имеющейся, например, в гли¬ колизе) (см. рис. 7), можно получать микропроцессоры с доста¬ точно сложными жестко заданными функциями логической, цифровой или аналоговой обработки сигналов. Перейдем теперь к функционально-пластичным устройствам с возможностью самоорганизации. Одним из способов их создания является использование так называемых диссипативных структур, возникающих при сильно неравновесных химических реакциях с диф¬ фузией. При этом, если продукт, образующий диссипативную структуру, окрашен, она может быть считана оптическим устройством. Распре¬ деление сигнала на выходе FBbIX (г) будет функционалом от его распределения на входе /вх (г): В принципе возможны и варианты реализации молекулярных устройств на автоволновых структурах [10]. Не останавливаясь на них подробно, заметим только, что в связи с пороговым характером возникновения таких структур и неизбежным их усреднением при получении FBbIX число различных видов V будет конечным и, по-видимому, весьма небольшим. Последнее обстоятельство сущест- ФУНКЦИОНАЛЬНО-ПЛАСТИЧНЫЕ МОЛЕКУЛЯРНЫЕ ИНФОРМАЦИОННЫЕ УСТРОЙСТВА Л (г) = Uf {fBX (Г) }. 24. За к. 1668 369
венно ограничивает пластичность таких устройств, которые скорее можно назвать ’’самоорганизованно-переключаемыми”. Этого недостатка лишено молекулярное устройство, схематически изображенное на рис. 10. Его основными элементами являются рецептор-ферментные комплексы, встроенные в ’’стопку” гибких би¬ слойных мембран4, причем рецептор и фермент расположены на разных сторонах мембраны. ’’Агонисты” рецепторов входной мембраны могут быть как физи¬ ческой, так и химической природы, в то время как агонистами рецепторов внутренних мембран должны быть химические вещества (например, гликопептиды), молекулы которых имеют гликолипидный ’’хвост”, с помощью которого они крепятся к липидной мембране. Агонисты рецепторов постщелевой мембраны расположены в пре- щелевой мембране (см. рис. 10). В щелях между ними находятся растворы субстратов, реакции между которыми катализируют имею¬ щиеся ферменты. При активации входных рецепторов некоторым пространственно- временным сигналом на внутренней стороне входной мембраны возни¬ кает распределение концентраций (точнее, химических потенциалов) субстратов и продуктов, определяемое их диффузией и кинетикой катализируемых реакций. Между мембраной и раствором появляется механохимическое взаимодействие [И], приводящее к ее деформации. В результате деформации в некоторых местах мембрана соприкасается с со¬ седней. Встроенные в прещелевую сторону мембраны агонисты акти¬ вируют рецепторы постщелевой стороны следующей мембраны. Подобный же процесс протекает в следующей щели и т.д. В ре¬ зультате на выходной мембране возникает структура активированных выходных элементов, в чем-то напоминающая диссипативную. Однако в отличие от предыдущего примера множество операторов Uf\fBX (r,t)} => FBM (r,t) в некотором^ смысле является практически континуальным (при этом операторы Uf будут функционально-нелинейными). На подобном принципе можно реализовать и другие режимы работы таких устройств. В частности, они могут работать в качестве обучаемых эле¬ ментов ассоциативной памяти. Это означает, что ,FBbIX будет отлично от нуля только в том случае, если /0В'Х (г, t) и /'вх (г, t) не слишком сильно отличаются друг от друга. Для перехода в такой режим работы достаточно, чтобы, помимо базовых реакций, была возможность5 с помощью специальных ре¬ гуляторных сигналов активировать производство и разрушение ан¬ тагонистов к выбранному типу постщелевых рецепторов. ‘Сходная система рассматривалась Ю.М. Сандлером и Я.Г. Дорфманом [11] при изучении проблемы связи биохимической активности с формообразованием в живых системах (см. также [2]). ’ Например, путем введения дополнительных ферментов, которые могут быть локализованы как в рабочих мембранах, так и где-нибудь в другом месте. 370
z Г- ^ v $ ^ Рис. 10. Принципиальная схема функционально-пластичного молекулярного информа¬ ционного устройства, работа которого основана на самоорганизующейся физической перестройке его структуры а — исходное состояние системы бномембран (mi. тг. тз и т.д.) со встроенными ферментами (большие замкнутые фигуры); б — та же система, перестроенная под воздействием входных сигналов Процесс запоминания происходит следующим образом. После подачи исходного сигнала /°*х (r,t) подается регуляторный сигнал, акти¬ вирующий производство антагониста. Появляющийся антагонист бло¬ кирует все рецепторы, находящиеся вне зоны контактов мембран (т.е. не связавшие к этому времени агонистов). При этом остаток 371
антагонистов, не связанных с рецепторами, каким-либо образом убирается. Если теперь на вход подать сигнал (г, t), существенно отличающийся от /°\х (г, t), то контакты между входной и соседней мембраной возникнут не в тех положениях, в которых были при /°вХ. А так как здесь рецепторы блокированы антагонистом, то базовая реакция будет практически прервана уже после нескольких первых щелей. Для того чтобы перевести устройство в режим операционной работы или перестроить на новый входной сигнал (г, t), необ¬ ходимо подать регуляторный сигнал, активирующий разрушение свя¬ занных с рецепторами антагонистов. В заключение заметим, что для реальных характеристик иммо¬ билизованных на липидных мембранах ферментов (поверхностная концентрация 104мкм”2, активность 102—10, С'1) и ширине щели 1(Г5см время срабатывания функционально-пластичного устройства лежит в диапазоне 10—10~2с. Для функционально-жестких моле¬ кулярных устройств это время, по-видимому, будет больше 10~5с. Реально малое быстродействие функционально-пластичных устройств компенсируется тем, что они выполняют не простые логические операции, а макрооперации, и за счет этого производительность устройства резко повышается. НЕКОТОРЫЕ ОСОБЕННОСТИ МОЛЕКУЛЯРНЫХ ИНФОРМАЦИОННЫХ УСТРОЙСТВ И ПЕРСПЕКТИВЫ ИХ ИСПОЛЬЗОВАНИЯ В КАЧЕСТВЕ ЭЛЕМЕНТНОЙ БАЗЫ ЗАДАЧ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Перейдем теперь к вопросу об ожидаемых преимуществах моле¬ кулярных устройств по сравнению с современными твердотельными изделиями. При рассмотрении устройств переработки информации на моле¬ кулярном уровне следует принимать во внимание два возможных пути их построения: использование отдельных молекул или же их сравнительно не¬ больших ансамблей в качестве элементной базы создания цифровых схем, сходных по своим функциям с существующими полупровод¬ никовыми устройствами; создание аналоговых молекулярных схем и в том числе построение функционально-пластичных молекулярных устройств6. Если аналоговое устройство может быть имитировано программой для цифровой ЭВМ, то и аналоговое, и цифровое устройства об¬ ладают одинаковыми возможностями решения вычислительных и ло¬ гических задач. Поэтому начнем анализ возможностей молекулярных устройств с дискретных молекулярных схем. Как известно [12], если физический процесс может быть описан моделью, которая выражается через рекурсивные функции, то эта модель является вычислимой по Тьюрингу. ‘Строго говоря, такие устройства не эквивалентны аналоговым схемам в обычном понимании этого слова. 372
Но в то же время существует понятие сложности проблемы, которое можно охарактеризовать так называемой сигнализирующей функцией /(л) = шах {?м [Р(я) ]} по всем словам Р длины п тьюринговой машины с тактом ?м. Нетрудно видеть, что чем медленнее растет /(л) при увеличении л, тем проще и эффективнее вычисления, связанные с решением проблемы на данной машине Тьюринга. Можно показать, что, если зависимость /(л) от л является степеннбй, решение проблемы оказывается достаточно эффективным [13, 14]. В случае более сильной, чем степенная, например экспоненциальной зависимости /(л), проблема может оказаться практически неразрешимой. Были рассмотрены основные принципы создания молекулярных вычислителей [15] и показано, что, казалось бы, очевидные преиму¬ щества дискретных и имитируемых цифровой ЭВМ аналоговых мо¬ лекулярных устройств (возможность распараллеливания операций, аналоговый характер вычислений и т.д.) не дают возможности преодолеть комбинаторный взрыв, обусловленный экспоненциальной зависимостью / **> еп. Следовательно, молекулярные устройства этого типа не имеют функциональных преимуществ перед полупроводни¬ ковыми схемами. Существенным остается лишь одно преимущество молек)лярной элементной базы — намного ббльшая по сравнению с полупроводниковыми схемами степень микроминиатюризации. Следует отметить, что вывод об отсутствии функциональных преимуществ аналоговых молекулярных устройств по сравнению с полупроводниковыми схемами был основан на предположении о том, что аналоговое устройство может быть имитировано компью¬ тером фон Неймана. Это положение не является общим для ана¬ логовых устройств. В том случае, если оно не имеет места, ре¬ шение экспоненциально зависящих от размера задачи проблем может быть значительно эффективнее при переходе к аналоговым методам. В сущности, в этом случае аналоговое устройство может рассматри¬ ваться как простейший исходный элемент новой элементной базы, обладающий значительными преимуществами перед базой, исполь¬ зуемой в современных полупроводниковых схемах. Более того, ана¬ логовые молекулярные устройства могут обладать гибкой струк¬ турой, перестраиваемой в процессе вычислений, за счет чего дости¬ гается максимальная вычислительная эффективность. Простейшим примером этого является рассмотренная выше перестройка структуры аллостерического фермента под действием эффектора (см. функцио¬ нальные возможности РНК полимеразы в примере транскрипции текста ДНК). При рассмотрении принципов построения молеку¬ лярных систем переработки информации (вычислительные устройства) был выдвинут общий принцип компромисса: ’’Система не может быть в одно и то же время эффективно программируемой, способной к эволюции за счет изменчивости и отбора и эффективной с вычислительной точки зрения” (см. статью [15], с. 464). 373
Аналоговые молекулярные схемы с перестраиваемой структурой должны быть ближе к живым биологическим объектам, способ¬ ным приспосабливаться к условиям окружающей среды. Поэтому они могут оказаться более эффективными, чем жестко запрограм¬ мированные устройства фон Неймана. Эти особенности молекулярных устройств переработки информации дали основание сформулировать несколько экстремистский, по-на¬ шему мнению, вывод [15] о том, что для создания компьютеров нового типа из новых материалов должно подразумеваться следующее: то, что необходимо, это не компьютер фон Неймана на базе каких-либо новых материалов, а новое по своей сущности вычи¬ слительное устройство, созданное для решения задач, не решаемых эффективно устройствами фон Неймана. В существенной степени эта точка зрения совпадает с кон¬ цепцией, заложенной в основу настоящей статьи. Тем не менее потенциальные возможности применения молекулярных устройств не исчерпываются, по-видимому, приложениями к решению эффек¬ тивно неформализуемых задач. Уже в настоящее время, например, просматривается круг проб¬ лем, требующих создания сверхминиатюрных устройств памяти боль¬ шой емкости. Такие работы с использованием молекулярных элементов активно ведутся в последние годы (см., например, публикации [16, 17]). Основное направление исследований базируется на попытках использовать эффект фотохимического выжигания провалов в полосах спектров органических соединений, т.е. на принципе дискретной за¬ писи информации. Полагают, что на этом пути можно достичь плотности записи до 10й бит/см2. Не менее важной проблемой может быть и создание цифровых вычислительных схем сверхвысокой степени интеграции на моле¬ кулярной базе. Современная твердотельная электроника близка к пределу микроминиатюризации прежде всего из-за проблемы отвода тепла. Транзисторы современных ЭВМ рассеивают порядка \Ql0kT тепла на такт [15] (к - постоянная Больцмана; Т — температура). Это не позволяет существенно уменьшить размеры элементов интеграль¬ ных схем. В то же время ферментативные реакции в биологиче¬ ских системах рассеивают 10—100 кТ на такт. Это дает основания надеяться, что может быть достигнута на молекулярной основе степень микроминиатюризации не менее чем Ю10 элементов/см2 или же 10*5 элементов /см3. Представляют значительный интерес и предложения использовать функционально-пластичные молекулярные устройства в качестве интел¬ лектуальных датчиков для жестко программируемых ЭВМ на твердо¬ тельной элементной базе ("глаз” управляющей системы робота, устройства распознавания и классификации метеорологической ин¬ формации и т.д.). Это даст возможность оптимально сочетать преи¬ мущества различных типов элементаной базы и создавать весьма эффективные устройства переработки информации, способные решать широкие классы разнообразных задач. 374
ЛИТЕРАТУРА 1. Сергеев В.М. Проблема понимания: некоторые мысленные эксперименты // Теория и модели знаний: Тр. по искусств, интеллекту. Тарту: Тартус. гос. ун-т, 1985. N 8. С. 133—147. (Учен. зап. Тартус. гос. ун-та; Вып. 714). 2. Дорфман Я.Г.. Сергеев В.М. — Наст. сб. 3. Ленинджер А. Биохимия. М.: Мир, 1976. 1055 с. 4. Bielka Н. Moleculare Biologie der Zelle. — Stutt.: Fiscer, 1973. 462 p. 5.Slillinger F.H.. Wassermar. Z. Molecular recognition and selforganization in flo- rinated hydrocarbons // J. Phys. Chem. 1978. Vol. 82, N 8. P. 929—940. 6. Koshland D.E.Jr. Protein shape and biological control // Sci. Amer. 1973. Vol. 229, N 4. P. 52—64. 7. Bennet Ch.H. The termodynamics of computation — a review // Int. J. Theor. Phys. 1982. Vol. 21, N 12. P. 905—940. 8. Molecular Electronic Devicies / Ed. F.L. Carter. N.Y.: Marcel Dekker Inc., 1982. 386 p. 9. Блинов JI M. Физические свойства и применение лэнгмюровских моно- и мульти- молекулярных структур // Успехи химии. 1983. Т. 52, N 8. С. 1263—1300. 10. Васильев В. А., Романовский Ю.М., Яхно В.Г. Автоволновые процессы в распределенных кинетических системах // Успехи физ. наук. 1979. Т. 128, вып. 4. C. 626. И.Сандлер Ю.М., Дорфман Я.Г. Физические механизмы формообразования в неравновесных гетерогенных системах: Препр. Ф—226. Красноярск: Ин-т физики СО АН СССР, 1984. 48 с. 12. Мальцев А.И. Алгоритмы и рекурсивные функции. М.: Наука, 1985. 368 с. 13. Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. М.: Мир, 1982. 416 с. 14. Нильсон Н. Принципы искусственного интеллекта. М.: Радио и связь, 1985. 376 с. 15. Conrad М. On design principles for a molecular computer // Commun. ACM. 1985. Vol. 28, N 5. P. 464—480. 16. Рамбиди Н.Г., Замалин В.М. Молекулярная микроэлектроника: истоки и надежды. М.: Знание, 1985. 63 с. 17. Pat. 4.101.976 (US). Frequency selective optical data storage system / G. Castro, D. Haarer, R. Macfarlane, H. Trommsdorff. 1978. УДК 621.391: 519.769 МАШИННОЕ ПОНИМАНИЕ ЕСТЕСТВЕННОГО ЯЗЫКА В РАМКАХ КОНЦЕПЦИИ РЕАГИРОВАНИЯ B.C. Файн ПОНИМАНИЕ И СМЫСЛ. НЕКОРРЕКТНОСТЬ ТРАДИЦИОННОЙ ПОСТАНОВКИ ЗАДАЧИ МАШИННОГО ПОНИМАНИЯ Обычная интерпретация задачи машинного понимания естественно¬ языкового текста на интуитивном уровне сводится к тому, что на вход некоторой системы — ’’понимателя” — подается текст, а на выходе должен вырабатываться смысл этого текста. Рассмотрим возможность корректной постановки такой задачи. В эту постановку необходимо включать, как известно, вполне определенные виды. А именно: должен быть полностью охарактеризован в виде совокупности исходных посылок входной объект; 375
необходимо определить класс математических средств, из ко¬ торых может строиться процедура обработки входного объекта; должен быть четко охарактеризован искомый результат. Подходя с такой точки зрения к задаче машинного понимания естественно-языковых текстов, замечаем следующее. Характеризация исходного объекта не связана с принципиальными затруднениями, так как объектом является текст с добавлением сообщения о том, на каком естественном языке он исполнен. Текст может быть формально, определен как цепочка символов и:Г некоторого дгонёчного алфавита (словаря). Нетрудно охарактеризовать и класс" математических средств, из которых может набираться процедура обработки входного объекта. Это есть совокупность всех пред¬ ставимых формально знаний о грамматике данного естественного языка — его лексике, морфологии, синтаксисе, семантике. Иначе обстоит дело с третьим элементом постановки — искомым результатом. Ознакомление с самыми разнообразными работами в области естественного языка — лингвистическими, филологиче¬ скими, психологическими, исследованиями по машинному пони¬ манию естественно-языковых текстов, машинному переводу — при¬ водит к неожиданному заключению: для центрального понятия лингвистики, так или иначе фигурирующего практически во всех исследованиях, а именно для понятия ’’смысл текста” (фраза, дис¬ курса и т.д.), нет удовлетворительного дескриптивного определения. Непосредственные обращения к испытуемым с просьбой определить понятие ’’смысл текста” обычно имеют результатом лишь тавтоло¬ гические конструкции типа ’’смысл есть мысль, выраженная в сло¬ вах” и не способствуют прояснению вопроса. Равным образом и просьбы объяснить смысл конкретного предложения приводят лишь к пересказу предложения ’’другими словами”, как правило, более многословно и менее адекватно интуитивно ощущаемому смыслу. Итак, дескриптивного определения смысла текста не существует. Впрочем, в приципе возможно пытаться строить не дескриптив¬ ные, а процедурные определения смысла. Обзор литературы пока¬ зывает, что такая попытка явно или неявно предпринимается во многих работах (см., например, публикации [1—4]). Однако анализ приводимых в них конструкций, дЬлженствующих вырабаты¬ вать на выходе смысл (обыкновенно — смысл предложения), убеж¬ дает, что в качестве процедурных определений смысла все такие конструкции страдают неполнотой, делающей образуемые ими опре¬ деления неудовлетворительными. Этот тезис можно проиллюстрировать на материале двух про¬ стейших проявлений указанной неполноты: неспособность известных процедур постоянно учитывать многозначность смысла предложения и органичность для таких процедур этапа кодирования различных слов из некоторого списка одним и тем же символом метаязыка. По поводу первого из этих проявлений следует заметить, что свойство всякого распространенного естественно-языкового предло¬ жения допускать более одной семантической интерпретации (’’иметь 376
более одного смысла”) должно считаться в настоящее время уста¬ новленным фактом (см. публикации [5], с. 8; [6]), с той или иной степенью неохоты признаваемым и самими авторами процедурных определений (см., например, монографию [2], с. 20). Относительно кодирования одним и тем же символом различных слов следует заметить, что оно делается обычно, когда разработ¬ чик считает их родственными. Например, символом ’’PTRANS” приходится кодировать все слова типа ’’идти”, ’’шагать”, ’’шество¬ вать”, "плестись”, ’’брести” и т.д. [2]. Легко заметить, что род¬ ственны такие слова лишь в одном, наиболее примитивном, ’’вещно¬ действенном” аспекте. В других аспектах значения этих слов разли¬ чаются. Вместе с тем ниоткуда не следует, что всякий раз, когда слова приведенного набора встречаются.в предложении, обстоя¬ тельства, и в частности контекст, выделяют в качестве основного именно вещно-действенный аспект. Более того, сам факт появления в языке таких слов свидетельствует о том, что тонкие аспекты их значений важнее, чем вещно-действенный аспект (для выражения которого хватило бы слова ’’идти”), и что данная ситуация достаточно типична. В таких случаях каждая замена одного из синонимов другим порождает новую модификацию смысла предложения, но этот факт никак не проявляется в упомянутых конструкциях, использующих вместо всех подобных слов один и тот же кодовый символ. Итак, для понятия ’’смысл текста” не существует удовлетвори¬ тельного определения, ни декларативного, ни процедурного. Но это значит, что проблема машинного понимания естественно¬ языковых текстов (сама по себе и как подпроблема проблемы машинного перевода) не имеет корректной интерпретации, и, сле¬ довательно, во всех известных здесь разработках делается попытка решать проблему, которая не может быть даже поставлена. Лингвистические исследования ведутся уже многие десятилетия. И если за все время существования этой области знаний не уда¬ лось выработать определения для ее главного понятия — смысла текста, то это, бесспорно, не является случайным фактом. Такой факт нельзя обходить молчанием, поскольку он затрагивает самые глубокие основы проблемы и потому должен получить фундамен¬ тальное объяснение. Рассмотрим концепцию, содержащую как возможное объяснение указанного факта, так и основу для точной постановки задачи машинного понимания естественного языка. СООТВЕТСТВИЕ "ЦЕЛЬ—РЕАКЦИЯ” (ПЕРВЫЙ ПОСТУЛАТ КОНЦЕПЦИИ РЕАГИРОВАНИЯ) В формировании концепции реагирования будем исходить из того факта, что всякое осознанное человеческое действие является, как .правило, целеподчиненным. Это тем более справедливо в отношении речевых действий и всегда имеет место в интересующих нас при¬ кладных ситуациях естественно-языкового общения с ЭВМ. В тех случаях, когда субъект может и желает достичь оче¬ 377
редной цели собственными силами, он так и поступает, не прибегая к речевому акту и просто осуществляя действие, результатом ко¬ торого должно явиться осуществление цели. Но вполне типична и такая ситуация, когда для достижения цели необходимо или желательно посредничество другого лица (лиц). Если в качестве средства для вовлечения этого лица из¬ бирается обращение к нему посредством текста (возможны и другие способы: жест, мимика, сигнал и т.д.), то промежуточной целью автора текста, преследуемой при его формировании, становится получение от ’’понимателя” адекватной реакции на этот текст, а именно реакции, которая будет состоять в действии, ведущем к выполнению основной цели автора текста. Условимся для простоты о следующем: участники диалога настроены кооперативно, т.е. автор текста хочет быть понятым, а ’’пониматель” склонен в меру своих воз¬ можностей выдать ожидаемую реакцию; диалоговая деятельность является рутинной, т.е. участники считаются сложившимися носителями языка и всех видов реагирования (этап обучения языку и реагированию не рас¬ сматривается), язык и множество возможных реакций в течение длительного времени остаются неизменными (не пополняются и не редактируются). Следует предостеречь читателя от вульгаризированного представ¬ ления о реакции как о чисто бихевиористском акте, обязательно сводящемся к какому-то наблюдаемому движению, физическому действию. Нужная автору реакция может состоять по преимуществу из ментальных событий, таких, например, как запоминание слу¬ шателем (читателем) каких-то данных, работа его пространственного воображения, выработка какого-либо эмоционального состояния, принятие во внимание тех или иных этических моментов, прояв¬ ление чувства юмора, проведение правдоподобного рассуждения, логического вывода и т.д. При этом практически всегда имеет место комбинация из многих подобных компонентов, включая, быть может, и физические действия. Таким образом, человеческое реагирование на текст является комплексным. Сложнейшая структура, которую вынужден выстроить в своем мозгу ’’пониматель” для осуществления столь сложной, тонкой и разносторонней реакции со всеми ее деловыми, эмоциональными, логическими, ассоциативными и многими другими компонентами, — это и есть в обсуждаемой концепции то, что можно назвать смыслом, вызываемым текстом (но, конечно, не содержащимся в тексте, как принято считать). Так, вопрос, адресованный зна¬ комой по курорту: ”Ты помнишь июнь?” — конечно же имеет целью не напоминание о том, что между маем и июлем те¬ кущего года имелся июнь, а побуждение собеседницы к форми¬ рованию в ее мозгу сложнейшего комплекса, включающего и зри¬ тельные образы моря, луны и т.д., и слуховые и обонятельные воспоминания, и определенное настроение, и чувство влечения к автору текста и многое другое. 378
Разумеется, все это ни в коей мере не содержится в слово¬ сочетании ”Ты помнишь июнь?”. Последнее, очевидно, является лишь кодом, запускающим у слушательницы механизм формирования указанного комплекса. В свою очередь, текст ”Да” или ’’Нет”, полученный в ответ, вызывает в мозгу автора вопроса целый мир образов и переживаний (соответственно радостных или го¬ рестных), на что такой текст и рассчитан. Разумеется, смысл, вызываемый в этой ситуации, например текстом ”Да”, не имеет ничего общего со смыслом, вызываемым тем же текстом при выяс¬ нении, например, готовности яичницы. Продолжая примеры, можно было бы напомнить, что фраза ’’Джон подбросил к Мэри книгу ногой”, скорее всего, предназна¬ чена для создания у читателя комплекса представлений об оскорби¬ тельном, унижающем отношении Джона к Мэри, о его пренебре¬ жении ею и т.д., а не для сообщения того, что в данном действии участвовала именно книга и что она таким способом переменила владельца (как утверждается в монографии [2] (с. 34)). Равным образом текст ’’Иванов шествовал по коридору с бутербродом в руках” почти наверняка предназначен для формирования у слу¬ шателя иронического отношения к Иванову вместе со зрительным образом важничающего персонажа, скорее всего, не слишком умного, а не для сообщения фактов о коридоре и бутерброде. Итак, мы приходим к первому фундаментальному постулату концепции реагирования: текст не содержит и не передает смысла, а является лишь инструментом сообщения ’’понимателю” того, какую реакцию хочет от него получить автор текста. Побуждение собеседника (включая и самого себя в этой роли) к продуцированию соответствующей реакции нормально является вообще единственной целью осмысленного текста. Попытка охарактеризовать в рамках такой концепции понятие ’’смысл” (т.е. уже не ’’смысл текста”, а ’’смысл в мозгу”) в формальных терминах приводит к представлению о структуре, самое меньшее чрезвычайно многомерной и многоуровневой, по¬ строенной на огромном количестве элементов и притом охва¬ ченной необозримым количеством внутренних связей (например, ассоциации, логические связи, back-tracking). Как известно, структуры такого типа не допускают модели¬ рования в виде замкнутой математической системы, а допускают, да и то зачастую лишь теоретически, натурное, физическое моде¬ лирование, чем, очевидно, и объясняется невозможность построения формального определения для смысла. Смысл приходится считать имманентной, неотделимой и потому ненаблюдаемой принадлеж¬ ностью мозга. Но если смысл текста ненаблюдаем, то наблюдаема, по крайней мере в ее чувственно воспринимаемой части, реакция ’’понимателя” на текст. Поэтому, примирившись с фактом невозможности опре¬ делить понятия ’’смысл текста”, ’’понимание текста”, мы вместе с тем получаем возможность, введя в рассмотрение цель автора 379
при формировании текста и реакцию на него ’’понимателя” (или хотя бы ее наблюдаемую часть), использовать критерий правиль¬ ности понимания, базирующийся на степени совпадения полученной реакции с ожидаемой. Напомним, что это есть вариант критерия Тьюринга для полноценности ’’машинного мышления”. В прикладных случаях хорошее имитирование машинной системой одной лишь наблюдаемой (и потому с определенной степенью полноты формализуемой) части человеческой реакции на тот же текст является достаточным для практики результатом. Это позво¬ ляет сформировать для таких случаев точную постановку задачи машинного понимания естественно-языковых текстов. Для этого необходимо, очевидно, рассмотреть схему, несколько отличную от упоминавшейся выше, а именно считать: входным объектом не просто текст, а текст с присоединенным к нему описанием вызвавшей его цели (всегда известной автору); выходным продуктом устройства (алгоритма)—”понимателя” не ’’смысл”, которому нельзя дать определение, а реакцию (из неко¬ торого обозримого множества реакций), адекватность которой в прикладных случаях может быть точно установлена сравнением с целью. Текст в этой схеме не является ни вместилищем, ни передат¬ чиком смысла, а играет лишь роль некоторого кода, наподобие генетического, управляющего выстраиванием в мозгу ’’понимателя” сложнейшей структуры — смысла, которого добивался автор, чтобы получить требуемую реакцию. ДВА ПРИНЦИПА ФОРМИРОВАНИЯ РЕАКЦИИ И КОНЕЧНАЯ ПРЕДМЕТНАЯ ОБЛАСТЬ (ВТОРОЙ ПОСТУЛАТ КОНЦЕПЦИИ РЕАГИРОВАНИЯ) Упоминавшееся целеполагание, т.е. разбиение возникшей задачи на последовательность частичных задач, решаемых поочередно, яв¬ ляется не только человеческой функцией. Все живые существа в процессе своей жизнедеятельности в меняющейся среде все время решают задачи по поддержанию гомеостазиса. Поэтому форму¬ лируемые ниже принципы имеют весьма обширную область при¬ менения. При их обсуждении удобно использовать некоторую сим¬ волику. Пусть М (v,) есть описание состояния внешней среды в момент V/ дискретного времени. Состояние некоего организма (или авто¬ мата) в момент г, пусть описывается объектомA(vj). Пара (Af(v,), A(v,) на¬ зывается ситуацией в момент v, и обозначается I (v,). Организм может находиться со средой в^еостояни» -баланса (гомеостазиса). Такую ситуацию будем называть удовлетворительной. Ситуацию, в которой гомеостазис не обеспечивается, будем называть конфликт¬ ной и обозначать I. Организм может обладать способностью оказывать воздействие r(v,) как на самого себя, так и на внешнюю среду. Пара ситуаций вида (Ё (v,), I (v,41)) вместе с множеством {г} всех возможных воздействий образует задачу z(: найти такое г (v,) е {г}, чтобы ситуация Е (v„i) оказалась удовлетворительной. 380
Естественно условиться считать, что удовлетворительная ситуация I (v,_i) переходит в конфликтную I (v,) всегда ”по вине” среды — за счет изменения М (v, [), организм же меняет свое состояние Л ^(v,) на'Л (v,+1) лишь в следующий такт — для разрешения конфликта. Тогда описанием среды для данного организма можно считать не только множество {М] всех ее состояний, но и множество {z} всех задач, которые она может поставить перед этим орга¬ низмом. Множества {Л/} и {z}, а вслед за ними и множество {г} в общем случае приходится считать бесконечными. Задачи обсуждаемого типа обычно являются обратными, т.е. требующими умозаключения от следствия к причине^Так, звук грома, сам по себе безопасный для животного, побуждает его искать укрытия от опасных факторов грозы, явившейся причиной грома. Обобщая, можно сказать, что и в целом в системе рецепторы— мозгц как правило, решаются обратные задачи. Но, как известно, отображение причина—следствие обычно происходит с потерей ин¬ формации, 1Г частности со снижением размерности (как, например, при рентгеносъемке), т.е. является вырожденным. Поэтому обратные задачи обычно являются некорректными. Изложенное можно отнести и к задаче понимания текста. Автор текста, отображая в него некую мысль, решает прямую задачу и при этом осуществляет огромную редукцию информации. Со¬ ответственно ’’пониматель”, восстанавливая по тексту мысль ав¬ тора, решает обратную и некорректную задачу. Такая деятельность ’’понимателя” полностью укладывается в обсуждаемую модель’’среда— субъект”. В самом деле, в состав внешней среды входит гене¬ ратор (авторы) текстов: появление очередного текста создает за¬ дачу z, так как побуждает ’’понимателя” отреагировать на него — выполнить какое-то действие по отношению к среде и/или к себе самому. Существующий подход к решению некорректных задач осно¬ вывается, как известно (см., например, монографию [7]), на их регуляризации — доопределении посредством привнесения извне дополнительных данных, недостающих в исходных посылках за¬ дачи. Однако подобный подход, обеспечивая правила использования дополнительных данных, не порождает самих данных. Твор¬ ческая функция их ’’открытия” и предварительной оценки их пригодности остается неформализованной и реализуется человеком, Этот принцип решения некорректных задач можно назвать эври¬ стическим. Для любой отдельно взятой задачи из множества {z} он яйляется пока единственным известным подходом к решению. ! Введем, однако, в рассмотрение следующий тезис: переход от представления о {z} как о совокупности индивидуальных задач к рассмотрению временнбго процесса генерирования этих задач средой открывает некоторые дополнительные возможности в решении каждой из задач при условии наличия у среды некоторого свой- ртва стационарности. Возникающей в силу таких возможностей второй принцип реше¬ ния можно назвать ’’имитационным”. Он состоит в том, чтобы ~ 381
при возникновении некоторой задачи z не приступать сразу к ее эвристическому решению, а вместо этого выяснить, не решалась ли уже однотипная задача, и в положительном случае применить к задаче z уже известный алгоритм, конечно придав его аргу- ’ ментам значения, содержащиеся в задаче г. Говоря более точно, пусть fk (а') есть алгоритм решения некоторой задачи z‘ (символ fk является обозначением для тела данного алго¬ ритма, а а' выражает вектор значений его аргументов для этой задачи). Задачи z' и г" называются однотипными, если алгоритмы их решения есть соответственно fk (а') и fk (а"), т.е. отличаются лишь значениями аргументов. Подмножество множества {z}, со¬ стоящее из всех однотипных задач, будем называть А:-м классом однотипных задач и обозначать {z}k. Легко увидеть существенные прагматические отличия между двумя указанными принципами. Данные психологии обучения и индивидуальный опыт каждого / человека убеждают, что применение имитационного принципа, т.е. распознание в новой задаче знакомой сущности и соответственно применение к этой задаче готового способа решения, требует во много раз меньших усилий, затрат времени и т.д., чем решение задачи данного типа впервые. При использовании же эвристического принципа решение всякой очередной задачи строится как решение „впервые. При использовании эвристического принципа интеллектуальный уро¬ вень решателя (т.е. состав и объем его знаний, способность к ’’озарениям”, ’’эврикам” и т.д.) должен быть априори достаточным для решения любой, в том числе самой сложной, из возможных задач. Опыт построения машинных решателей задач, доказывателей теорем и т.д. (см., например, монографию [8]) показывает, что ’’интеллектуальная мощь” таких систем не может даже отдаленно сравниваться с возможностями специалиста-человека, и такая си¬ туация в близком будущем, вероятно, сохранится. При использовании же имитационного принципа не существует ограничения сложности решаемых задач, отличного от характерного человека, так как впервые решение задачи каждого типа может быть поручено спе- циалисту-человеку высшей квалификации и найденный им алгоритм решения достаточно будет ввести в память ЭВМ в готовом виде. Из приведенных соображений следует, что для создания практи¬ ческих систем несравненно эффективнее имитационный принцип. Вместе с тем для его применения необходимо, чтобы функцио¬ нирование внешней среды, поставляющей задачи, подчинялось серьез¬ ному ограничению. Рассмотрим последовательность генерируемых средой задач z 1,..., z„,...,zN. Для оправданного применении имитационного принципа, очевидно, необходимо, чтобы при столь большом, сколь потре¬ буется, хотя и конечном N, существовало такое конечное К, что Ул€1,'Ж-,г„бД {z)k, 382
Эти условия являются выражением того простого факта, что при имитационном принципе решение каждой новой задачи основывается на распознании класса, к которому она принадлежит, а количе¬ ство К классов во всякой задаче распознавания образов, по определению, конечно. Свойство среды, описываемое условиями (1), назовем ^-стационар¬ ностью среды. Конечную совокупность алгоритмов (Л,—,/*,•••/*) назовем А-набором алгоритмов. Она является множеством корректности для некоррект¬ ной задачи. к Наконец, множество ZK = Д {г}^ назовем множеством задач из конечной предметной области (КПО). Значение К характери¬ зует ее ширину. Так, в проблеме машинного понимания естест¬ венно-языковых текстов множество {z} есть множество всех возможных текстов на данном языке (точнее, множество задач понимания каждого из этих текстов); множество же ZK есть множество текстов из КПО шириной А. Наш опыт последних лет позволил сделать следующие два наблю¬ дения. 1. А-стационарность среды {г}, обусловливающая ее разложимость на узкие предметные области ZK, отображает в идеализированном виде свойство окружающей среды, представляющее собой явление типичное, нормальное. Примерами, иллюстрирующими его распространенность в окру¬ жающей жизни, могут служить огромный объем и роль (и успеш¬ ность!) рефлекторной и инстинктивной деятельности в животном мире, выгодность массового или крупносерийного производства одних и тех же изделий в хозяйстве, профессиональная специ¬ ализация людей в обществе. 2. А-стационарность обусловливает эффективный прием решения ряда научно-технических проблем, позволяя за счет вычленения из множества {z} одной (или более) КПО, перейти от неопределенной, непоставленной или даже неразрешимой задачи к одной (или более) корректной и разрешимой задаче распознавания образов. Для краткости указанный прием будем в дальнейшем называть КПО-методом. Отмеченная выше распространенность А-стационар- ности придает этому методу наряду с силой также и общность. Иллюстрацией эффективности КПО-метода может служить его применение к задаче определения формы произвольной и произ¬ вольно освещенной поверхности по ее полутоновому (плоскому) изображению — задаче, как показано в статье [9], некорректной и не имеющей общего решения. Нами эта задача рассматривалась применительно к проблеме зрительного очувствления механосбо¬ рочных роботов. Данная прикладная направленность сразу позво¬ ляет постулировать А-стационарность среды, обусловленную тем, что робот постоянно имеет дело с деталями, которые обраба¬ тываются главным образом на металлорежущих станках. Это вы¬ деляет в качестве КПО ряд поверхностей, таких, как цилиндр, 383
конус, плоскость и т.п. Исходная задача определения формы произ¬ вольной поверхности заменяется задачей распознавания нескольких заранее известных форм, решение которой оказалось легким и изящным [10]. Резюмируя соображения о двух принципах формирования реак¬ ций, заметим, что во всех видах деятельности, где потребность в творческих актах не возникает или возникает редко, т.е. в слу¬ чаях, когда деятельность носит в основном рутинный характер, преимущество имитационного принципа перед эвристическим явля¬ ется абсолютным. Это позволяет с учетом изложенного выше о рутинном характере рассматриваемой языковой деятельности сформулировать второй фун¬ даментальный постулат концепции реагирования применительно к прикладной задаче машинного понимания естественно-языковых тек¬ стов: решение задачи адекватного реагирования на множество текстов {z} следует искать в виде разложения {z} в конечную совокуп¬ ность КПО: где t, — допустимая доля текстов, не получивших адекватной реакции. В пределах же у'-й КПО задача адекватного реагирования реша¬ ется как задача распознавания по тексту z соответствующего ему алгоритма реагирования fk из Кк заранее известных алгоритмов. Строго говоря, в соответствии с данным определением и все множество U при конечных J и всех Kj является КПО шири¬ ной K — ^Kj. Однако е конкретных разработках будем связы¬ вать с понятием КПО не только конечность Кр но и их отно¬ сительную малость (ради удобства машинной обозримости). Кроме того, практически удобно включать в одну КПО лишь в чем- либо родственные, сходные алгоритмы реагирования fk. Конечность J следует из ограниченности и стабильности предметной (профессиональной) среды прикладной области, в которой должна работать система машинного понимания. В нашей идеализации эти свойства отображаются А'-стационарностью. В заключение заметим, что общность факта превалирования имитационного принципа в рутинных ситуациях может, по-видимому, служить объяснением неоднократно делавшегося наблюдения, сво¬ дящегося к тому, что в решениях самых разнообразных проблем в различных областях сплошь и рядом обнаруживаются элементы распознавания образов. Рассмотрим проблемы, возникающие при обслуживании большого количества J КПО одной и той же системой машинного по¬ нимания. 384
ПРЕДОПОЗНАВАНИЕ КПО И ТРЕТИЙ ПОСТУЛАТ КОНЦЕПЦИИ РЕАГИРОВАНИЯ Очерченная выше роль имитационного принципа заставляет пред¬ положить, что Не только последовательности естественно-языковых реплик, адресуемых ЭВМ, но и тексты в обычных человеческих дис¬ курсах рутинного содержания должны быть /f-стационарными. Вы¬ борочный анализ связных текстов подтверждает это предположение: какой бы обширный круг тем ни затрагивал протяженный текст или диалог в целом, он всегда может быть расчленен на части, обладаю¬ щие признаками КПО. Отсюда следуют два вывода: концепция КПО имеет не только конструктивный, но и методологи¬ ческий характер, так как отражает некоторое явление природы; требование, чтобы машинная система обеспечивала адекватное реагирование на тексты из /> 1 КПО, является правомерным и естест¬ венным. Систему, вМешающую в себя J КПО (-7>1), будем называть ’’многотемной”. Требование многотемности выдвинуто практикой не только в связи с желательной многофункциональностью системы. Ситуация с J> 1 может возникнуть и в силу чисто технологических обстоятельств: разбиение КПО шириной К на несколько суб-КПО меньшей ширины может потребоваться в связи с ограниченностью оперативной памяти машины, для увеличения быстродействия и т. д. Одним из шагов к обеспечению многотемности является, конечно, ввод в систему /f-наборов алгоритмов для всех J КПО. Этого, однако, недостаточно: необходимы еще средства для обеспечения пе¬ рехода системы по мере надобности из одной КПО в другую. Простейший способ решений этой проблемы состоит в переложении ее на пользователя, который вводом с терминала надлежащего кодо¬ вого слова переводит систему в нужную ему КПО. Так сделано, в частности, в системе, разработанной в ИППИ АН СССР B.C. Медовым под руководством автора и обеспечивающей две КПО [11]. Однако требование помнить и вводить кодовые слова, будучи нетрудным по существу, все же нежелательно с точки зрения оптимизации психологического климата общения с ЭВМ для непрограм¬ мирующего пользователя, для которого, собственно, и предназначены естественно-языковые системы. Это побуждает рассмотреть проблему автоматического переключе¬ ния машины с одной КПО на другую в зависимости от получаемых ею текстов. Здесь снова сталкиваемся с задачей, конечно же, распознава¬ ния образов, что, как уже отмечалось, довольно естественно. В данном случае задача состоит в том, чтобы по тексту распознать КПО, к которой он относится. Результатом будет переключение системы в эту КПО, что в свою очередь, позволит распознать надлежащий алгоритм реагирования и осуществить "понимание”. Из изложенного следует, что многотемная задача машинного понимания является неоднородной по классификации [6, 12]; ее первый этап (распознавание КПО) называется ’’предопознавание” и должен 25. Зак. 1668 • 385
обеспечиваться качественно более простой процедурой, чем второй этап — собственно ’’понимание”. Как уже отмечалось, многотемность является нормальным, обычным свойством протяженного текста, дискурса. Это позволяет сфор¬ мулировать третий фундаментальный постулат концепции реагиро¬ вания: естественный язык обладает свойством вводить в многотемные тексты специальные элементы, обеспечивающие надежное и простое (по сравнению с алгоритмами fk собственно ’’понимания”) предопоз- навание КПО. Простейшим типом таких элементов являются обычные ключевые слова, широко используемые в информационно-поисковых системах. Наше рассмотрение позволяет уточнить их роль и при машинном, и при человеческом понимании. Более тонким и сравнительно недавно обнаруженным видом обсуж¬ даемых элементов являются так называемые ’’модальности” [12]. Они начинают работать в тех случаях, когда группирование реакций в КПО происходит по целям, стоящим за каждой единицей текста. Основанные на подобных элементах алгоритмы предпознавания просты и очевидны [6, 12]. Приведенные выше соображения о концепции реагирования позво¬ ляют сформулировать точку зрения на проблему уровня ’’интеллек¬ туальности” систем машинного понимания, рассчитанных на работу в ’’языке в целом”. В описаниях существующих систем вопрос об огра¬ ниченной проблемной области если и затрагивается, то лишь на ста¬ дии обсуждения требуемого объема памяти, а также возможных при¬ ложений системы, а не как фактор, влияющий на ее структуру. Иначе говоря, ограничение широты языкового репертуара и соответственно мощности множества {г} требуемых реакций в структуру этих систем не закладывается. По сообщаемым данным ’’понимание” в таких системах происходит на довольно примитивном уровне, хотя авторы обычно и высказывают надежду на возможность его повышения. Однако, как было отмечено, радикальное повышение уровня ин¬ теллектуальности и тем более приближение его к человеческому воз¬ можно лишь на основе имитационного принципа, а он требует работы в КПО. Отсюда следует важнейшее принципиальное положение: путь к расширению языкового (тематического) репертуара системы, претен¬ дующей на высокий интеллектуальный уровень, состоит не в изначаль¬ ном расчете на широкий или даже неограниченный репертуар, а в соз¬ дании пакетов информационного обеспечения для отдельных КПО, накоплении их и использовании механизма перестройки системы с одной КПО на другую на основе предопознавания. Из изложенных положений концепции реагирования вытекает ряд конструктивных выводов. 386
ВЫБОР АЛГОРИТМА ИЗ /Г-НАБОРА И ОЗНАЧИВАНИЕ ЕГО АРГУМЕНТОВ Задача понимания в КПО сводится, как мы видели, к распознанию по тексту требуемого алгоритма из имеющихся К алгоритмов и при¬ данию его аргументам конкретных значений. Последние извлекаются из самого текста, а также частично из контекста и из банка знаний системы, если таковые нужны и имеются. Будем обозначать текст, рассматриваемый не как носитель задачи понимания, а просто как цепочка символов, через t. Из концепции реагирования следует, что всякий такой текст содержит данные дво¬ якого рода: обеспечивающие распознавание адекватного алгоритма fk (образу¬ ют часть текста (субтекст), которую назовем кодом выбора алгоритма и обозначим г„,); представляющие собой конкретные значения аргументов (at, ...а„к)=а алгоритма fk (обеспечивают выбор конкретной реакции г' из класса однотипных реакций {г}к, которые может при варьировании аргумен¬ тов формировать алгоритм fk\ образуют субтекст, который назовем кодом выбора конкретной реакции в классе однотипных реакций и обозначим /„). Например, в тексте ”К какому врачу обращалась больная Н.П. Пет¬ рова в 1978 году по поводу кариеса?” слова ”К какому врачу обраща¬ лась” составляют субтекст tw, так как данные, содержащиеся в них, обеспечивают выбор алгоритма реагирования — одной из К функций системы справочных функций базы данных по ис’гориям болезней, а данные ”Н.П. Петрова”, ”в 1978 году” и ”по поводу кариеса” образу¬ ют субтекст указывая конкретные значения аргументов этой функ¬ ции. Тексты ’’Кто лечил в 81-м периодонтит у Цветкова?” и ”У кого был в прошлом году Евсеев со своим парадонтозом?” требуют реак¬ ций из того же класса однотипных реакций, т. е. выбора той же спра¬ вочной функции, что и ранее, но значения аргументов в этих случаях уже другие. С другой стороны, текст : ’’Сколько раз врач Федоров проводил удаление коренных зубов в период с 1975 по 1984 год?” вызывает уже другого типа реакцию и соответственно другой алгоритм. Введем обозначения: d(t) — алгоритм членения текста t на суб¬ тексты tw и t„; w(tw) — алгоритм распознавания адекватного алгоритма реагирования, т. е. определения его индекса к (кс1,К). Акт пони¬ мания текста t в рамках концепции реагирования можно предста¬ вить в виде трехэтапной процедуры: 1) d(t)=>tw&tv или Г) d(t)=>tw&tv&tmL, 2) w(tj =Ж, (2) 3)fk0,)=>r'- Заметим, что в зависимости от значения К и сложности алгорит¬ мов fk последние могут представляться в памяти ЭВМ как в готовом виде (эксплицитно), так и в виде набора отдельных блоков вместе с правилами их комбинирования для получения полных алгоритмов (имплицитно). Несколько подробнее этот вопрос рассмотрен в публи¬ 387
кации [13]. Выражения 1 и 2 в записи (2) относятся соответственно к человеческому и машинному реагированию. В последнем случае tN,L есть субтекст, состоящий из "лишних” (для машины, но не для чело¬ века!) слов. Например, в тексте ’’Ассистент, включите, пожалуйста, прибор А" слово ’’пожалуйста” необходимо при обращении к человеку для обеспечения желаемых этической и эмоциональной компонент его реакций; при обращении же к машине это слово является лишним, употребляемым ”по инерции” межчеловеческого естественно-языко¬ вого общения. Вообще при человеческом реагировании на естественно-языковый текст ни одно слово в нем нормально не является лишним: каждое слово вносит свой вклад в кодирование каких-то (в том числе и нефор- мализуемых) компонент искомой реакции. Это есть, по-видимому, одна из внутренних причин неосуществимости вполне формальной грамматики для естественного языка в целом. Но это же дает основания для следующего утверждения: привне¬ сение идеи КПО в задачу машинного понимания делает возможным построение полностью формализованных грамматик. Мотивируем это утверждение. Как видно из выражений (2), анализ текста при использовании КПО-метода сводится к распознаванию в тексте суб¬ текстов tw и г„. Ответственным за выбор алгоритма является суб¬ текст tw. Тело алгоритма реагирования олицетворяет сущность реа¬ лизуемой реакции, т. е. сущность требуемого действия, поэтому естественно, что ядром субтекста tw довольно часто служит та или иная глагольная форма, а субтекст t„ содержит имена участников действия. Это рассуждение наталкивает на то, чтобы в основу работы алгорит¬ ма d(t) положить поиск в тексте комплекса из имени действия и имен его актантов с указанием их ролей (ДА-комплекса). Адекватность подобных комплексов для организации анализа текста была замечена многими авторами (’’концептуальная зависимость” — в монографии [2], ’’глубинный падеж” — в статье [3], ’’событие” с его ядром и мо¬ делью управления — в ряде работ, например в монографии [14]). Новое качество в использовании ДА-комплекса возникает благо¬ даря привнесению эффекта определенности, обусловливаемого вводом КПО. Именно из конечности К следует, что списки имен действий, имен участников каждого действия и их ролей, а также спис¬ ки возможных структур ДА-комплексов оказываются конечными и в силу определенности каждой из R реакций, однозначно определенными (и притом строго индивидуальными) для каждой КПО или суб-КПО, чем и обусловливается формализуемость грамматики. Так, список участников и их ролей для действия ’’ставить” будет од¬ ним в КПО, отвечающей ситуации ’’ставить стул” (здесь будут, в част¬ ности, аргументы, имеющие значения ’’куда”, ’’чем” и т. д.), другим — в КПО, отвечающей ситуации ’’ставить спектакль” (где аргументы ’’куда” и ’’чем” исчезают, но появляются, например, аргумент ’’где”), третьим — для ситуации ’’ставить кастрюлю”, четвертым — для ситуации ’’ставить оценку”, пятым — для ситуации ’’ставить часы” и т. д. Очевидно, что точность и однозначность представления структуры ДА-комплекса радикально упрощают анализ текста. В самом деле, 388
если обычный (без учета КПО) анализ вынужденно исходит из посылки, что априори в тексте может содержаться "все, что угодно”, то в об¬ суждаемом случае в тексте ищутся заранее известные и заведомо там находящиеся конкретные объекты: имя алгоритма fk и значения его аргументов. В плане реализации собственно поиска этих объектов представля¬ ются более или менее равноценными как вышеперечисленные форма¬ лизмы, специально ориентированные на ДА-комплексы, так и не¬ которые формализмы общего назначения, такие, как фреймовая мо¬ дель, КС-грамматики, сетевые грамматики и т. д. Равноценны ли эти формализмы также и в плане воплощения идеи КПО, приходится пока выяснять эмпирически. В настоящее время в рамках концепции реагирования под руководством автора статьи созданы две работаю¬ щие системы естественно-языкового общения с системой управле¬ ния базами данных: одна — B.C. Медовым (на основе КС-грамматик, две темы) [11], вторая — Л.И. Рубановым (на базе ATN-модели, одна тема) [15]. Заметим в заключение, что рассмотрение множества примеров вы¬ явило два интересных факта, важных, в частности, для многотемных систем: ДА-организация, естественная для текстов, оперирующих прямы¬ ми физическими действиями (относящихся к вещно-действенному уровню), сохраняется и для текстов, относящихся к самым разнооб¬ разным ментальным действиям, абстракциям, в которых само понятие "действие” истолковывается метафорически (это позволяет сделать структуру анализа постоянной, независимой от КПО — "параметри¬ зовать” структуру); развиваясь от примитивных текстов вещио-действеииого уровня к текстам современного интеллектуального обихода, в котором мета¬ форические ситуации полностью доминируют над вещно-действенны¬ ми ситуациями, язык явно избегал ввода новых слов, придавая все новые значения уже существующему слову и возлагая функцию указа¬ ния нужного значения этого слова в каждом конкретном случае на наличествующую уже при этом КПО, раз уж она все равно присутствует (например, употребление слова "ставить” в ситуациях со стулом и те¬ атром, "побить” в случаях с ребенком и рекордом и т. д.), что яв¬ ляется еще одним подтверждением радикальной роли концепции КПО в человеческом механизме понимания естественно-языковых текстов. О ДОСТИЖИМОСТИ ПРИ МАШИННОМ ПОНИМАНИИ ЧЕЛОВЕЧЕСКОГО УРОВНЯ Понятие "смысл” в целом, будучи неформализуемым фактором, может в каких-то случаях содержать некоторую "часть”, допускаю¬ щую формальное представление. В общем случае ниоткуда не следует, что эта формализуемая часть разделима с неформализуемой, однако для упрощения рассуждения сделаем такое предположение. Анало¬ гичное допущение сделаем и о частях реакции, обусловливаемой дан¬ ным смыслом, точнее, будем считать, что формализуемая и неформали- 389
зуемая части реакции разделимы и независимо управляются соот¬ ветственно формализуемой и неформализуемой частями смысла. Не- формализуемая часть смысла не может быть воспроизведена ЭВМ по определению. Соответственно не может быть сформирована ею и не- формализуемая часть реакции. Но это означает, что полноценное машинное понимание естественно¬ языкового текста в общем случае в принципе невозможно. Такое ут¬ верждение, естественно, сразу же порождает вопрос о том, какое же машинное понимание все-таки возможно. Сформулировать ответ на этот вопрос будет легче, если предположить, что упомянутая выше комплексная реакция представима в виде совокупности отдельных компонент. Тогда можно говорить о множестве R всех возмож¬ ных компонент, таком, что каждая конкретная реакция r(t) обра¬ зуется путем выбора некоторого подмножества компонент из этого множества. Пусть имеется текст t. Полную (т. е. человеческую) комплек¬ сную реакцию на него обозначим r^t) и будем считать в соответствии с только что высказанным предположением некоторым множеством, составленным из формализуемых и неформализуемых компонент, взятых из R. Машина же на текст t в состоянии воспроизвести лишь часть Tf/t) компонент (формализуемых) из множества rH(t). Наконец, введя в рассмотрение интересы пользователя, обозначим rmin(0 и на¬ зовем минимальной допустимой реакцией наименьшее подмножество компонент из 77/г), еще способное удовлетворить пользователя в конкретном случае машинного реагирования на текст t. Тогда практическая применимость машинного понимания текста определяется следующим очевидным условием: rM(t) = rmin(,). (3) При выполнении этого условия минимальная допустимая реакция машинно воспроизводима, по крайне мере в принципе. В противном случае удовлетворительное машинное понимание текста t принци¬ пиально неосуществимо. Но с совокупностью компонент, составляющих rminft), связаны следующие факты: состав этой совокупности для каждого текста свой; оценка ее способности быть минимальной допустимой реакцией в каждом случае может быть выполнена только человеком, поскольку только он имеет представление о составе r^t) и о допустимом откло¬ нении от этого состава. Это вводит нас в порочный круг: для того, чтобы оценить до¬ пустимость машинного понимания очередного текста, необходимо знание полной (человеческой) реакции гц(1) на этот текст, т. е. необхо¬ димо ознакомление человека с каждым очередным текстом. Но тогда для чего машинное понимание этого же текста? Для задачи собственно машинного понимания выход из положения доставляется все той же КПО. Именно она, по определению, есть та¬ кая предметная область, для которой множество всех возможных реакций конечно (и машинно обозримо). Но в таком случае для каж¬ 390
' дого текста из обучающей выборки для данной КПО и для каждой из конечного набора возможных реакций можно заранее сопоставить Гц(1) и гтт(0 и выяснить выполнимость условия (3). Иначе обстоит дело с другой задачей — машинным переводом. В рамках концепции реагирования полноценный перевод естественно¬ языкового текста t, вызывающего у понимателя-носителя данного естественного языка реакцию Г[/1). определяется как текст t' (на вто¬ ром естественном языке), вызывающий у понимателя-носителя второго естественного языка такую же (или по крайней мере очень близкую) реакцию r(t'), что можно представить символически в виде r(t')**rHt. (4) Но понимателем текста t при машинном переводе является ЭВМ, и ее реакцией на t будет не r^t), а r^t), т. е. реакция, в лучшем слу¬ чае воспроизводящая только формализуемую часть от rtft). Соот¬ ветственно и подбор текста t' можно проводить исходя только из условия rftj^r^t), а не соотношения (4). Это показывает, что полно- ценый чисто машинный перевод в принципе невозможен во всех случа¬ ях, когда /7/0 содержит неформализуемую часть. Но судить о наличии или отсутствии ее в rn(t) может опять-таки только человек, причем лазейки в виде КПО в случае машинного перевода уже нет, так как переползание связного текста из одной предметной области в другую ничем не ограничено. Следовательно, в отличие от машинного пони¬ мания участие человека (постредактора) в полноценном машинном переводе принципиально неизбежно. В этом свете кажется сомнительной целесообразность достижения максимальной синтаксической и семантической ’’гладкости” машин¬ ного перевода, на что нацелены практически все известные разработки. Такая ’’гладкость” способна принести скорее серьезный вред, усып¬ ляя бдительность постредактора в тонких случаях, демобилизуя его. Как следует из проведенного рассуждения, за машинным переводом можно закрепить лишь роль подстрочника, более или менее совершен¬ ного. ’’Гладкость” же окончательного текста без каких-либо специ¬ альных мер явится неизбежным следствием интеллигентности пост¬ редактора, тем более, что его включение в процедуру обязательно. ЛИТЕРАТУРА 1. Жолковский А.К. Модель "Смысл—Текст” // Энциклопедия кибернетики. Киев: Укр. Сов. энциклопедия, 1974. Т. 2. С. 46—47. 2. Шенк Р. Обработка концептуальной информации. М.: Энергия, 1980. 360 с. 3. Филлмор Ч. Дело о падеже // Новое в зарубежной лингвистике. М.: Радуга, 1981. Вып. 10. С. 369—390. 4. Wilks У. Grammar, meaning and the machine analysis of language. L.: Routledge, 1972. 116 p. 5. Кулагина O.C. Исследования по машинному переводу. М.: Наука, 1979. 320 с. 6. Файн B.C. Новые аспекты машинного понимания сообщений // Изв. АН СССР. Техн. кибернетика. 1982, N 5. С. 100—112. 7. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1974. 223 с. 8. Попов Э.В., Фирдман Г. Р. Алгоритмические основы интеллектуальных роботов и искусственного интеллекта. М.: Наука, 1976. 455 с. 391
9. Хорн Б. Определение формы по данным о полутонах / / Психология машинного зрения. М.: Мир, 1978. С. 137—184. 10. Файн B.C. Инвариантное к освещению распознавание простых поверхностей в полутоновых изображениях по поведению градиента яркости. Рукопись деп. в ВИНИТИ. N 1924—85 Деп. 11. Медовый B.C. К проблеме перенастройки лингвистических процессоров // Изв. АН СССР. Техн. кибернетика. 1982. N 5. С. 113—120. 12. Файн В.С. Машинное понимание сообщений на естественном языке как задача опознавания образов // Диалог в автоматизированных системах. М.: МДНТП, 1981. С. 9—16. 13. Файн B.C. Содержательный аспект информационного обмена в диалоге: Препр. М.: ВИНИТИ, 1983. 35 с. 14. Попов Э.В. Общение с ЭВМ на естественном языке. М.: Наука, 1982. 360 с. 15. Страмцов Н.Н., Рубанов Л.И., Кузьменко М.А., Гинзбург М. Я.. Назаренко Б. В.. Алиев В.М., Филиппов В.А., Семин В.М.. Катин П.М.. Рубанов Л.И., Филиппов М.И., Ибрагимов Р. С. Опыт разработки и эксплуатации автоматизированной системы управления обеспечением народного хозяйства нефтепродуктами / / Материально- техническое снабжение. М.: ЦНИИ ТЭИМС, 1986, с. 3—22. (Сер. 7; Вып. 5).
XT' СОДЕРЖАНИЕ Введение Е.П. Велихов, А.А. Ведение. В.М. Сергеев, А.В. Чернавский 3 Раздел 1 БИОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ ИНТЕЛЛЕКТА Моторика и интеллект P.M. Абдусаматов, М. Б. Беркинблит. А.Г. Фельдман, А.В. Чер- павский 5 Нейроморфогенез и модели мира в сетях нейронных процессоров |Я. Г. Дорфма>Ь В. М. Сергеев 39 От инвариантов геометрий к инвариантам управления В. В. Смол.янинов 66 Искусственный интеллект: элементы и структуры Е.Н. Соколов Ill Раздел 2 МЫШЛЕНИЕ И ЯЗЫК Психологические проблемы изучения интеллекта Б.М. Величковский, М.С. Капица 120 О языке как модели мира Вяч. Be. Иванов 142 К проблеме ранних стадий речи и сознания (филогенез) Ю.И. Манин 154 Когнитивные модели в исследовании мышления: структура и онтология знания В. М. Сер¬ геев 179 Прагматика речевого общения Х.Я. Ыйм 196 Раздел 3 МЫШЛЕНИЕ И ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ Механизм мышления и моделирование его работы в реальном времени М. Н. Вайнцвайг, М П. Полякова 208 Нелинейные системы с памятью и моделирование функций нейронных ансамблей -1-1 Веденов, А.А. Ежов. Л.А. Книжникова, Е.Б. Левченко, Ю Г. Чернов 229 О соотношении восприятия и мышления в задачах искусственного интеллекта Ш.А. Гу- берман 248 Функциональная организация зрительного процесса и принцип гештальта Г. М. Зенкин, А. П. Петров 265 О моделировании В.Е. Левит, B.C. Переверзев-Орлов 294 Модели константного зрительного восприятия П.П. Николаев 300 Свет, цвет и форма А.П. Петров 350 Молекулярные информационные устройства и задачи искусственного интеллекта Н.Г. Рамбиди, В.М. Замалин, Ю.М. Сандлер 358 Машинное понимание естественного языка в рамках концепции ре¬ агирования B.C. Файн 375 393
УДК 612:153 АбдусаматовP.M., БеркинблитМ.Б.,ФельдманА.Г., ЧернавскийА.В Моторика и интеллект // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Излагаются современные представления о механизмах управления движени¬ ями и их роли в качестве физиологических предпосылок развития произволь¬ ных движений. Формулируется ряд гипотез о развитии интеллектуальных функций, надстраивающихся над механизмами построения движений. Ил. 4. Библиогр. 15 назв. УДК 681.5:612.8:611 [Дорф май Я.Г.|,Сергеев В. М. Нейроморфогеиез и модели мира в сетях ней¬ ронных процессоров // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Рассматриваются перспективные принципы построения архитектуры ЭВМ в свете последних данных нейромофологии и нейропсихологии. Предлагается многопроцессорная метафора для объяснения принципов функционирования мозга. Выдвигается гипотеза о том, что основой долговременной памяти в нервной системе являются перестройки формы дендритных нейронов и расположение нервных синаптических контактов. Библиогр. 80 назв. УДК 591.17:612. 76:621.52 Смолянинов В.В. От инвариантов геометрии к инвариантам управления // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Общим основанием совместного рассмотрения геометрических и кибернети¬ ческих проблем служит конструктивная интерпретация инвариантов как редукции избыточных свобод системной организации. Системно-конструктив¬ ный подход к задачам управления иллюстрируется анализом локомоторной хроногеометрии, которая формально определяется инвариантами целевой траек¬ тории движения шага. Обращается внимание на релятивистский характер локо¬ моторных инвариантов. Ил. 7. Библиогр. 41 назв. УДК 519.95 Соколов Е.Н. Искусственный интеллект: элементы и структуры / / Интеллекту¬ альные процессы и их моделирование. М.: Наука, 1987. Обсуждаются структуры искусственного интеллекта, основанные на нейро¬ физиологических принципах кодирования информации. Библиогр. 11 назв. УДК 15.153 Величковский Б.М., Капица М.С. Психологические проблемы изучения интеллекта // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Критически анализируются различные подходы исследования интеллекта. Особое внимание уделено изучению формирования интеллекта человека в результате усвоения фиксированных в культуре идеальных когнитивных моде¬ лей. Библиогр. 44 назв. УДК 82.3.091 Иванов Вяч. Вс. О языке как модели мира // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Рассматриваются некоторые из вопросов, возникающих при сравнении естественных и искусственных языков с точки зрения понятия "модели мира”, 394
важного и для перевода естественного языка на внутренний, машинный, н для выяснения их исторического соотношения. Библиогр. 28 назв. УДК 519.7:82.3.091 М а н и н Ю.И. К проблеме ранних стадий речи и сознания (филогенез) / / Интел¬ лектуальные процессы и их моделирование. М.: Наука, 1987. Дан обзор проблематики, связанной с построением общения с ЭВМ на естественном языке. Особое внимание уделено литературным данным по проблеме семантики человеческой речи на ранней стадии развития в сравнении с семантикой языков программирования. Библиогр. 30 назв. УДК 681.3.01:003 Сергеев В.М. Коигиитивиые модели в исследовании мышления: структура и онтология зиаиия / / Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Рассматривается различие между строением гуманитарного и математического знания с точки зрения когнитивного моделирования: Анализируются операции естественной логики, связанные с изменением онтологического статуса знания. Ил. 7. Библиогр. 4 назв. УДК 681.3.01 Ыйм Х.Я. Прагматика речевого общения // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Обсуждается взаимоотношение прагматики и семантики, механизмы влияния контекста на интерпретацию языковых выражений, модели диалогового взаи¬ модействия, информационная структура коммуникативного акта, а также значе¬ ние исследований прагматики для теории мыслительных процессов и их модели¬ рования. Библиогр. 24 назв. УДК 62-506.22 Вайнцвайг М.Н., Полякова М.П. Механизм мышления и моделирование его работы в реальном времени // Интеллектуальные процессы и их моде¬ лирование. М.: Наука, 1987. Рассматривается проект многопроцессорной системы с ассоциативной па¬ мятью, которая должна моделировать основные функции и процессы мышле- « ния в реальном времени. Ил. 2. Библиогр. 8 назв. УДК 577.3:51:62.50:57 В еде н о в А. А., Ежов А.А., Книжникова JI.A., Левченко Е.Б., Чер¬ нов Ю.Г. Нелинейные системы с памятью и моделирование функций нейронных ансамблей // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Рассматривается модель нейронного ансамбля, в которой память реализо¬ вана как система аттракторов в фазовом пространстве "изображающей” динами¬ ческой системы. Показано, что ряд свойств ансамбля может быть интерпрети¬ рован как обучение, распознавание образов, выработка прототипа, забывание, бистабильность восприятия, феномен обращения. Ил. 9. Библиогр. 24 иазв. УДК 577.3:51:621.391 Губерман Ш.А. О соотношении восприятия и мышления в задачах искусст¬ венного интеллекта / / Интеллектуальные процессы и их моделирование. М.: Нау¬ ка, 1987. 395 1
Обсуждаются некоторые пути развития исследований по искусственному интеллекту в свете опыта, приобретенного за прошедшие 30 лет. Излагаются иа нескольких примерах методы построения адекватного языка описания. Рассматриваются задачи медицинской диагностики, чтения рукописного тек¬ ста и др. Ил. 1. Библиогр. 6 назв. УДК 621.391.192.5 Зен кин Г.М., Петров А.П. Функциональная организация зрительного процес¬ са и принцип гештальта // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Предлагается вариант структурно-функциональной организации зрительного процесса, опирающийся на данные психофизики и нейрофизиологии. Зрительная система рассматривается как относительно изолированная система, имеющая в своем распоряжении все нужные информационные сигналы и мощный арсенал средств для решения сложных задач, которые ставит ей управляющая система целеполагания. Ил. 2. Библиогр. 34 назв. УДК 621.391.199. Левит В.Е., П ереверзев-Ор л о в B.C. О моделировании / / Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Излагаются соображения, положенные в основу разработки консультатив¬ ных медицинских систем. Отправной точкой для авторов служат представления о неявном моделировании, когда модель сложной системы сама является сложной системой, функционирование которой может оставаться непонятным, но которая допускает возможность экспериментирования с ней. Кратко описывается ап¬ парат такого моделирования: структура, поля и синдромы и выделение в много¬ мерном пространстве маломерного, где начинают проявляться устойчивые свой¬ ства данных. Библиогр. 3 назв. УДК 621.391.192.5 Николаев П.П. Модели коистаитиого зрительного восприятия // Интел¬ лектуальные процессы и их моделирование. М.: Наука, 1987. Описана группа математических моделей зрительного процесса, формирую¬ щих для монокулярной системы устойчивую к изменению освещения оценку окраски объектов, а при наличии зрительной памяти строящих оценку формы подвижного объекта. Основная обработка в рамках первой задачи состоит в вычислении цветовых параметров объекта и освещения. Вторая задача решается на основе формируемых проективных инвариантов. Обсуждены принципы органи¬ зации системы, перцептивный выход которой изоморфен пространству сцены. Ил. 2. Библиогр. 36 назв. УДК 621.391 Петров А.П. Свет, цвет и форма // Интеллектуальные процессы и их моде¬ лирование. М.: Наука, 1987. Рассматривается структура света в сцене и обосновывается представление освещения в виде набора кусочно-постоянных функций матрицы размера 3X3, скалярной функции и постоянного вектора. Дается определение цвета и обсуждает¬ ся "цветное” фотометрическое уравнение, связывающее свет, цвет и форму с изоб¬ ражением. Приведены результаты решения этого уравнения на ЭВМ для модельной и реальной сцен. Ил. 2. Библиогр. 7 назв. 396
УДК 62.50:681.3 Рамбиди Н.Г., Замалин В.М., Сандлер Ю.М. Молекулярные информаци¬ онные устройства и задачи искусственного интеллекта // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Обсуждаются возможности построения элементной базы для устройств искусственного интеллекта на основе молекулярных элементов, присущих биоло¬ гическим системам. Рассматриваются рецепторы, ферменты и некоторые другие макромолекулы, иммобилизованные в специально организованной системе мембран и находящиеся в растворе определенных химических веществ. Проанали¬ зированы принципы работы и характерные особенности таких молекулярных информационных устройств. Ил. 10. Библиогр. 17 назв. УДК 621.391:519.769 УДК 621.391:519.769 Фа й н B.C. Машинное понимание естественного языка в рамках концепции реагирования // Интеллектуальные процессы и их моделирование. М.: Наука, 1987. Излагается подход к проблеме взаимодействий в комплексе пользователь — компьютерная система—среда для случая стационарной среды. Устанавливается, что ряд задач искусственного интеллекта, в частности машинное понимание ес¬ тественного языка, сводится во многих случаях в подобных средах к задачам распознавания образов, что приводит к повышению эффективности решения. Библиогр. 15 назв. »
ИНТЕЛЛЕКТУАЛЬНЫЕ ПРОЦЕССЫ И ИХ МОДЕЛИРОВАНИЕ Утверждено к печати Институтом проблем передачи информации АН СССР Редакторы CJJ. Марков, Л.Г. Никольская Художник АЛ, Смеляков Художественный редактор Н.Н. Власик Технический редактор Л.Н, Богданова Корректор З.Д. Алексеева Набор выполнен в издательстве на электронной фотонаборной системе ИБ №36416 Подписано к печати 11.08.87. Т — 15755 Формат 60 X 90 1 /i е • Бумага офсетная N 1 Гарнитура Таймс. Печать офсетная Усл.печ.л. 25,0. Усл.кр.-отт. 25,4. Уч.-изд.л. 30,1 Тираж 4350 экз. Тип.зак. 1668. Цена 3 р. 20 к. Ордена трудового Красного знамени издательство ’’Наука” Москва В-485, Профсоюзная ул., д. 90 Ордена Трудового Красного Знамени 1-я типография издательства ’’Наука” 199034, Ленинград В-34, 9-я линия, 12
3 р, 20 к. Принципы, лежащие в основе интеллектуальных процессов — узнавания и понимания, обоб¬ щения и абстракции, планиро¬ вания и оптимизации и т. д., — далеко выходят за пределы за¬ дач познания психики. В прош¬ лом эти принципы часто пред¬ ставлялись в мистической или натурфилософской форме. В на¬ ше время они приобретают ес¬ тественнонаучную конкретность, становясь базой новой информа¬ ционной технологии. Теория ин¬ теллекта как общая основа изу¬ чения и конструирования ин¬ теллектуальных систем, осуще¬ ствляющих построение модели мира и на §е основе планирова¬ ние целенаправленного дейст¬ вия, стала актуальной задачей. «НАУКА»