/
Автор: Стефанюк В.Л.
Теги: математическая кибернетика искусственный интеллект математика компьютерные технологии физматлит
ISBN: 5-9221-0395-4
Год: 2004
Текст
УДК 519.711.2
ББК 32.813
С 79
Стефанюк В. Л. Локальная организация интеллектуальных
систем. - М.: ФИЗМАТЛИТ, 2004. - 328 с. - ISBN 5-9221-0395-4.
Предложен и детально исследован новый принцип организации больших
систем — локальная организация. Локальная организация, развивающая
и уточняющая принципы создания распределенных систем, представляет
собой важную альтернативу централизованным и децентрализованным си-
системам. Она позволяет предложить и проанализировать ряд новых моделей
технических систем с элементами искусственного интеллекта.
Подход обоснован рассмотрением многочисленных проблем и математи-
математических моделей, возникающих в дискретных, непрерывных, комбинаторных
и программных задачах. Большинство моделей носит оригинальный харак-
характер и может представлять также самостоятельный интерес для теории и
различных приложений.
Для специалистов в области информатики, для преподавателей, аспи-
аспирантов и студентов старших курсов соответствующих специальностей.
Научное издание
СТЕФАНЮК Вадим Львович
ЛОКАЛЬНАЯ ОРГАНИЗАЦИЯ
ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ
Редактор О. В. Салецкая
Оригинал-макет: Н.Ю. Савченко
Оформление переплета: А.Ю. Алехина
ЛР №071930 от 06.07.99. Подписано в печать 22.07.04. Формат 60x90/16.
Бумага офсетная. Печать офсетная. Усл. печ. л. 20,5. Уч.-изд. л. 22,55.
Заказ №
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997, Москва, ул. Профсоюзная, 90
E-mail: fizmat@maik.ru, fmlsale@maik.ru
http://www.fml.ru
Отпечатано с готовых диапозитивов в ПФ «Полиграфист»
160001, г. Вологда, ул. Челюскинцев, 3
Тел.: (8172) 72-55-31, 72-61-75, факс: (8172) 72-60-72
E-mail: form.pfp@votel.ru http://www.vologda/~pfpv 9 785922'103954
© ФИЗМАТЛИТ, 2004
ISBN 5-9221-0395-4 © В. Л. Стефанюк, 2004
ISBN 5-9221-0395-4
Посвящается светлой памяти моих родителей
Льва Александровича и Клавдии Ивановны
и моего учителя — Михаила Львовича Цетлина
Предисловие
Данная книга посвящена локально-организованным или распреде-
распределенным системам, которые получили широкое распространение в науке
и технике. Книга имеет прямое отношение к области искусственного
интеллекта, так как многие, если не большинство, из встречающихся
в искусственном интеллекте задач решаются именно путем исполь-
использования некоторой совокупности взаимодействующих определенным
образом отдельных устройств, преследующих свои индивидуальные
цели, т. е. с помощью локально-организованных систем.
Ориентация книги на искусственный интеллект обусловлена также
выбором тех проблем, на которых в книге иллюстрируются положения
локальной организации, которые, разумеется, могут найти и более ши-
широкое применение.
Однако автор не планировал создать еще один учебник по искус-
искусственному интеллекту. Действительно, перевод автором на русский
язык примерно двух десятков прекрасных зарубежных книг по искус-
искусственному интеллекту, написанных ведущими специалистами в этой
области, ясно показал, что практически каждая из них может быть
использована в качестве учебного пособия по этой дисциплине, и нет
смысла в создании еще одной такой книги.
Кроме того, целый ряд удачных книг учебного плана выпущен
отечественными авторами. Можно уверенно сказать, что недостатка
учебной и обзорной литературы по искусственному интеллекту у нас
нет.
В данном случае читателю предлагается материал, который фор-
формировался у автора на протяжении многих лет в параллель бурному
развитию области искусственного интеллекта за рубежом, в котором
автор также принимал определенное участие.
Более того, чем глубже автор знакомился с лучшими западными ра-
работами, тем яснее становилось, что зарубежные специалисты склонны
концентрироваться на относительно узком спектре несомненно важных
задач, игнорируя при этом множество других проблем, которые, на
взгляд автора данной книги, также следует отнести к области искус-
искусственного интеллекта как науки, ставящей своей целью создание искус-
искусственных систем, достаточно хорошо имитирующих интеллектуальную
деятельность незаурядной человеческой личности, способностям кото-
которой мы не перестаем удивляться.
Таким образом, настоящая книга ориентирована на тех, кого про-
проблематика искусственного интеллекта волнует в целом, а не только
в той своей части, которая на протяжении более тридцати лет успешно
Предисловие
развивается, составляя традиционную часть этой науки. Для ее чтения
не обязательно, чтобы читатель был знаком с традиционным, главным
направлением искусственного интеллекта, но желательно уже потому,
что автор часто использует сложившуюся там терминологию.
Автор отнюдь не одинок в своем желании пополнить то множе-
множество проблем, которое рассматривается в традиционном, или основ-
основном направлении искусственного интеллекта (main stream). Можно
назвать по крайней мере еще нескольких ученых, которые также пи-
писали «альтернативные» книги. Один из них — известный британский
специалист А. Эндрю [Эндрю, 1985], который особое внимание уделил
биологическим и биофизическим проблемам и моделям искусственного
интеллекта, другой — Д. Хофштадтер [Hofstadter, 1981], указавший на
тесную связь искусственного интеллекта с фундаментальной матема-
математикой, живописью и классической музыкой. Кроме того, потребность
в нетрадиционных книгах по искусственному интеллекту начинает все
острее ощущаться в последнее время и в устоявшемся сообществе спе-
специалистов по искусственному интеллекту. Обратим, например, внима-
внимание на недавно изданную в Нью-Йорке книгу Т. Мунаката [Munakata,
1998], в которой изучаются нейронные сети и генетические алгоритмы,
обычно рассматривающиеся в основном направлении искусственного
интеллекта лишь как вспомогательные технические средства.
Далеко не все, но многие результаты, вошедшие в предлагаемую
вам книгу, были опубликованы автором в журналах, сборниках или
трудах национальных и международных конференций. Поэтому, на
всякий случай, заранее приносим извинения за возможные в связи
с этим повторы.
Наиболее важным и новым представляется то, что весь материал
книги накрывается единым «зонтиком», который назван в ней локаль-
локальной организацией. Именно существование такого зонтика и призвано
оправдать саму публикацию подобной книги, хотя, в конечном счете,
читателю судить, насколько эта концепция является удачной.
Прежде, чем приступить к знакомству с данной книгой, отметим,
что под этим зонтиком, спрятаны, как нам кажется, несметные богат-
богатства, некоторые из которых описаны в книге в виде моделей, предла-
предлагаемых для них методов анализа и разнообразных приложений. Не все
из приводимых математических моделей уже нашли применения, но
отдельные положительные примеры, например, современная мобиль-
мобильная радиосвязь, по-своему реализовавшая нашу модель коллектива
радиостанций, показывает, что главные успехи, возможно, еще впереди.
Использование моделей дает очевидные преимущества по сравне-
сравнению с действиями над реальными объектами, которые подвергаются
моделированию:
— модели позволяют рассматривать системы, которые пока не су-
существуют, т. е. проводить перспективный анализ ситуации (на-
(например, мобильная связь);
Предисловие
— модели позволяют рассматривать роль разнообразных парамет-
параметров изучаемой системы, варьировать которые на реальных объек-
объектах было бы расточительным и даже опасным делом (например,
при создании экспертных систем, предназначенных для медици-
медицины или для управления атомными станциями);
— модели позволяют вводить и подвергать рассмотрению новые
параметры системы, первоначально отсутствующие у моделиру-
моделируемой системы;
— модели позволяют рассматривать целые классы систем, объеди-
объединяемые по некоторому признаку, делая выводы, относящиеся уже
ко всему классу;
— модели позволяют применять достаточно абстрактные матема-
математические методы вместо прямого экспериментирования {direct
experimenting) или интуитивной инженерии (intuitive engineer-
engineering), весьма распространенных в практике создания новых си-
систем.
Надо не забывать, что моделирование таит в себе и возможность
просчетов, поскольку недоучет реальных особенностей существования
системы может привести к фатальным для этой системы последствиям
или, наоборот, породить чисто виртуальные системы, практически не
реализуемые или не имеющие практического смысла, что особенно ча-
часто встречается в практике моделирования г). Именно поэтому только
испытание созданной модели в приложениях, т. е. полевое испытание
(field test) может поставить окончательную точку в оценке результатов.
Хотя и здесь следует проявлять осторожность, поскольку, прежде
всего, полевое испытание может оказаться неадекватным. Иногда же
сама целесообразность его проведения оказывается под вопросом, либо
из-за непомерно высокой ожидаемой стоимости или, как иногда это
случается, из-за позиции авторитетных оппонентов, препятствующих
внедрению нового по соображениям научной или инженерной амбиции.
Но чаще всего такое происходит потому, что новация «опережает свое
время» и просто необходимо, оказывается, выдержать какую-то паузу.
В истории науки и техники имеется множество тому примеров.
В последнее время, особенно в связи с широким распространением
вычислительных машин и духа коммерции, или как часто говорят,
«внедрением в жизнь рыночных отношений», почти единственным
видом моделирования повсеместно признается создание коммерческих
программных продуктов. При этом постепенно утрачивается интерес
) Хорошим примером являются «конфигурации райского сада», описанные
в работах Дж. фон Неймана в его теории самовоспроизводящихся автоматов
[Нейман, 1971]. Теоретически такие конфигурации возможны, но в реальном
процессе воспроизведения они никогда не возникают.
Предисловие
к математическим подходам и другим абстрактным методам моделиро-
моделирования 1). Новое поколение исследователей подчас просто оказывается
не знакомым с соответствующими методами и не пользуется ими в виду
отсутствия хороших учебных руководств и образцов для подражания.
Поэтому одной из первых задач, которую автор поставил перед
собой при написании настоящей книги, является попытка дать до-
достаточно широкую панораму современных методов математического
моделирования, показав полезность и силу таких подходов на целом
ряде достаточно ярких примеров.
Там, где это удавалось, рассматриваются и реализации некоторых
моделей на практике. К сожалению, в отдельных случаях до реали-
реализации дело еще не дошло, и хочется надеяться, что любознательные
читатели, заинтересовавшись прочитанным, доведут и другие модели,
множество которых они найдут в предлагаемой книге, до их успешной
практической реализации.
Другой нашей задачей является попытка восстановить вкус к со-
созданию математических моделей и их анализу, который, по глубокому
убеждению автора книги, постепенно утрачивается. Дело в том, что
математическое моделирование — дело не простое, и подчас гораздо
проще написать программу для компьютера и на ней сразу показать
перспективность предлагаемого подхода. К сожалению, область ис-
искусственного интеллекта, в которую автор погружен на протяжении
сорока лет, изобилует примерами эффектных машинных демонстра-
демонстраций, не получивших, тем не менее, никакого дальнейшего развития,
поскольку был обойден этап тщательной разработки модели, анализа
ее на полноту и другие полезные свойства, которые должны были бы
предшествовать предлагаемой компьютерной реализации.
В качестве примера возьмем яркую работу по созданию системы
SHRDLU проф. Т. Винограда из Лаборатории искусственного интел-
интеллекта Массачусетского технологического института, США, в которой
на компьютере была имитирована задача управления манипулятором,
переставляющим привычные детские кубики, под управлением команд,
вводимых оператором на обычном (английском) языке [Виноград,
1976].
В сущности, Т. Винограда больше всего интересовала возможность
понимания вычислительной машиной фраз естественного языка и его
работа в этом направлении считается одной из лучших.
Демонстрации системы SHRDLU всегда проходили с большим
и весьма заслуженным успехом. Однажды мне довелось присутство-
присутствовать на такой демонстрации вместе с проф. Ж.-К. Симоном, приле-
прилетевшим тогда в Массачусетский технологический институт (США) из
Парижа. Вопрос, который нас надолго сдружил с Ж.-К. Симоном,
о том, на каких корректно построенных фразах естественного языка
система SHRLDU непременно ошибется, так и не получил тогда ответа.
) Марвин Минский, один из признанных основателей искусственного ин-
интеллекта, предлагал считать языком искусственного интеллекта как научной
дисциплины язык программ (личное сообщение).
Предисловие
Поскольку на тот момент не было создано достаточно полной мо-
модели всей системы понимания естественного языка, то и ответа на
этот «каверзный вопрос» не могло быть, если только не делать пол-
полного перебора всех возможных корректных американских фраз, что,
очевидно, невозможно. Кстати, несколько позже Т. Виноград сказал
мне в частном разговоре, что такие «неудобные» фразы действительно
существуют, но как-то охарактеризовать их он пока не в состоянии.
На наш взгляд, именно это обстоятельство объясняет то, что бесчислен-
бесчисленные последующие попытки создания систем управления командами,
отдаваемыми на естественном языке, с тех пор так и не прекратились,
сопровождаясь каждый раз все более яркими машинными демонстра-
демонстрациями, следуя моде, установленной еще в 60-х годах.
Вообще, про большинство «внедренных» работ искусственного ин-
интеллекта можно было бы сказать, что это — демонстрации, показыва-
показывающие именно моменты успеха в работе системы. Кстати, в таком же
стиле строятся и многие теоретические работы, публикуемые в трудах
престижных конференций по искусственному интеллекту, в которых
показано, как вводя некоторый конкретный формализм, удается пре-
преодолеть ту или иную отдельную трудность. Складывается впечатление,
что некоторых авторов совсем не волнует то, что при этом остается не
выделенной, и следовательно, не решенной главная, принципиальная
проблема.
Так, до сих пор осталась нерешенной одна из принципиальных про-
проблем искусственного интеллекта — так называемая проблема фрейма,
которая была сформулирована отцами-основателями искусственного
интеллекта в 50-х годах прошлого века. Примечательно, что за эти годы
были предприняты самые разнообразные, иногда несколько неожидан-
неожиданные, попытки ее преодоления: не решив проблемы, некоторые авторы
попросту предлагали признать эту проблему малосущественной, по-
поскольку в демонстрациях ее обычно удавалось тем или иным образом
обойти. Действительно, например в подходе, использованном в системе
интеллектуального управления роботом «Шейки», предполагалось, что
в памяти компьютера хранится вся информация о действиях робота
и их результатах от момента зарождения системы. А поскольку объем
этой информации был относительно мал, то система с легкостью могла
пересмотреть результаты своих действий в прошлом, согласованно
и последовательно корректируя все, даже самые незначительные из-
изменения, которые вызывались подобным пересмотром.
Совершенно ясно, что ведение полного «гроссбуха» совершаемых
поступков, равно как и их прямых и побочных результатов, является,
в общем случае, делом нереальным, если говорить об искусственной
системе, которая функционирует достаточно продолжительное время,
находясь в богатой реакциями внешней среде. (Разумеется, весьма
опытные разработчики проекта «Шейки», руководимые проф. Н. Ниль-
ссоном из Станфордского исследовательского института (США), уже
в первых его версиях рассмотрели возможность внесения неким суще-
существом «в черном плаще» непредвиденных изменений в окружающую
среду, в результате которых возникало расхождение между тем, что
Предисловие
хранилось в памяти компьютера и реальной ситуацией. И в каких-то
демонстрационных случаях система вела себя вполне адекватно.)
Ясно, что требуется более общий и более тонкий анализ ситуации.
Характерно, что в самое последнее время (см. труды недавней Между-
Международной объединенной конференции по искусственному интеллекту
[IJCAI-2001]), некоторые авторы начинают снова задумываться над
сущностью проблемы фрейма, предлагая новый раунд атаки на нее,
опираясь на развитые теоретические методы формальной логики [Сте-
фанюк, 20026].
Третья задача, которую ставил перед собой автор данной книги, —
это обратить внимание современного читателя на те несомненные до-
достижения, которые получены именно в нашем, отечественном научном
сообществе. Эти достижения часто либо неизвестны за рубежом, либо
откровенно там игнорируются. Не вдаваясь в анализ причин этого,
отмечу, что влияние зарубежной науки на нашу науку, наоборот, явля-
является значительным, что отвечает самому духу российской науки. Тща-
Тщательное изучение всевозможных первоисточников — важная традиция,
обеспечивающая быстрый научно-технический прогресс и гарантиру-
гарантирующая новизну (патентную чистоту) предлагаемых нашими учеными
и специалистами оригинальных решений.
Однако беседы со студентами, аспирантами и молодыми исследова-
исследователями иногда выявляют совершенно неадекватную, негативную сторо-
сторону этого явления. Есть примеры, когда молодежь принимает западные
публикации за образец не просто некритично, но и не осознавая, что
в ряде случаев они имеют дело всего лишь с западными версиями
тех подходов и методов, которые зародились и были развиты именно
в нашей стране, подчас, на много лет раньше. В результате у та-
такой молодежи происходит то, что называется «потеря темпа». Целый
ряд отечественных работ остается вне их поля зрения и происходит
откат назад (backtracking) вместе с теми западными специалистами,
у которых не столь развиты традиции добросовестной и тщательной
проработки достижений, полученных до их собственного прихода на
научную сцену.
Одним из ярких примеров является область многоагентных систем
[Тарасов, 2002; Стефанюк, 1997], которая сформировалась в запад-
западной науке лет десять назад, вызвав к себе большой интерес ученых
и практиков всего мира. Когда речь идет о воплощении таких систем
на сети Интернет с использованием, например, технологии програм-
программирования Java, то это — безусловно новая, современная дисциплина.
Если же говорить о попытках моделирования поведения агентов, т. е.
организации их индивидуальных предпочтений и взаимодействия аген-
агентов друг с другом, то здесь получаемые результаты представляются
довольно посредственными по сравнению с глубокой теорией коллек-
коллективного поведения и игр автоматов, развитой у нас в стране в школе
М. Л. Цетлина, первые публикации которой относятся к началу 60-
х годов прошлого века. Основным отличием западных работ при этом
часто оказывается лишь новая терминология, которая может сбить
с толку любого читателя, тем более неподготовленного. Например то,
10 Предисловие
что в работах М. Л. Цетлина было в свое время названо системой штра-
штрафов и нештрафов для конечных автоматов, погруженных в случайную
среду, в западной науке получило название обучения с подкреплени-
подкреплением (reinforced learning). Этот и масса сопутствующих ему терминов
позволяют представить эту дисциплину как совершенно новое научное
направление, хотя это далеко не так.
Затронутая проблема научных приоритетов не является новой или
слишком простой и я не хотел бы здесь развивать ее дальше.
С другой стороны, невозможно переоценить тот фундаментальный
научный вклад, который внесли такие яркие представители нашей
информатики, как А. А. Ляпунов, А. А. Колмогоров, М. Л. Цетлин,
М. М. Бонгард и многие другие, о чем можно прочесть в прекрасной
обзорной книге Д. А. Поспелова и Я. И. Фета [Поспелов и Фет, 1998]
или в энциклопедическом словаре Д. А. Поспелова [Поспелов, 1994].
Как видно, один перечень замечательных имен и только некоторых их
достижений уже может составить отдельную книгу.
Большинство из моих собственных результатов, излагаемых в на-
настоящей книге, были бы просто невозможны, если бы я не обрел еще
в студенческие годы моего замечательного учителя, профессора МГУ
Михаила Львовича Цетлина.
Дальнейшая моя самостоятельная работа развивалась бы совершен-
совершенно иначе, если бы я позже не познакомился еще и с такими крупными
учеными, как А. В. Бутрименко, В. И. Варшавский, Д. А. Поспелов,
Г. С. Осипов, О. П. Кузнецов, В. Ф. Хорошевский, Т. А. Гаврилова,
Э. В. Попов, Т. А. Таран, В. В. Емельянов, В. Б. Тарасов, ставшими не
только моими коллегами, но и друзьями, и многими другими учеными,
творческий вклад которых мне иногда трудно отделить от того, что
предложено и сделано мною самим. Из зарубежных специалистов наи-
наибольшее воздействие на мои подходы оказали такие известные люди,
как Дж. Маккарти, Н. Нильсон, А. Эндрю, Р. Мизогучи, X. Уено,
А. Д. С. Холден, Э. Сандеволл, Д. Мики, Ж.-К. Симон и целый ряд
других ученых, в лабораториях которых автор обсуждал многие из
своих результатов и черпал для себя дополнительные идеи.
Всем перечисленным, а также и многим не упомянутым здесь за-
замечательным ученым и моим коллегам, я выражаю самую глубокую
благодарность за ту научную атмосферу, в создании которой они при-
приняли участие и, главное, за то плодотворное влияние, которое они
оказывали, и, я надеюсь, будут и впредь оказывать на мою собственную
деятельность.
Отчитаться перед ними — четвертая важная задача предлагаемой
вам книги.
Издание книги стало возможным благодаря финансовой поддержке
со стороны Российского фонда фундаментальных исследований, кото-
которому автор выражает особую признательность.
Москва,
17 июля 2002 г.
Введение
В экономике, промышленном производстве, информатике, политике
и многих других областях все больше внимания уделяется вопросам
организации существующих или вновь создаваемых систем, обеспечи-
обеспечивающих целесообразное, в том или ином смысле, поведение системы
в целом. Решение возникающих при этом проблем существенно зависит
от степени децентрализации управления компонентами системы в ходе
ее функционирования.
Во многих технических областях, где имеют дело со сложными
или большими системами, в определенный момент времени также
возникает особый интерес к принципам организации систем, носящим
децентрализованный, распределенный или локальный характер. В ка-
качестве примеров укажем на поток работ по коллективному поведению
автоматов в начале 60-х годов, на поток работ по децентрализован-
децентрализованному и распределенному управлению сетями связи и сетями передачи
данных в конце 60-х и в начале 70-х годов прошлого века, а в самое
последнее время — на поток подобных работ в области искусственного
интеллекта, где появились такие новые для этой науки понятия, как
многоагентность, коннекционизм, интеракционизм и др.
При этом из публикаций видно, что, как правило, многие соображе-
соображения по распределенной, локальной организации возникают у авторов,
работающих в различных предметных областях, как бы заново, без
естественного использования аналогичных результатов, полученных
в других предметных областях. Причина этого состоит в том, что в ли-
литературе отсутствуют попытки выделить и описать феномен локальной
организации как таковой, и настоящая книга направлена на то, чтобы
хотя бы отчасти ликвидировать этот пробел.
Нетрудно убедиться, что часто определенный подъем интереса к ло-
локальной организации возникает после того, как бывают исчерпаны
более привычные глобальные или централизованные подходы и поста-
постановки задач.
С другой стороны, известно, что развитие техники характеризует
не только создание новых или более совершенных методов решения
изолированных, частных задач, но и укрупнение систем путем объеди-
объединения частных «умений» с целью создания нового единого техническо-
технического организма — техноценоза: «Техноценозы, — подобно биологическим
сообществам, биоценозам — представляют собой множество различных
технических устройств, приборов, систем и приспособлений, связанных
между собой тесными и на первый взгляд непривычными связями» (см.
[Варшавский и Поспелов, 1984], с. 5).
Именно такой тип технологического прогресса характеризует со-
создание сетей связи, сетей передачи данных, многопроцессорных ком-
компьютеров, комплексных программных продуктов, гибких и безлюдных
автоматизированных производств и др. Возникающие на этом пути
системы оказываются, как правило, локально-организованными.
12 Введение
Отметим, что создание локально-организованных систем часто да-
дает возможность разрешить логическое противоречие между хорошей
степенью изученности частей системы и малой изученностью системы
в целом. Поэтому этот тип организации особенно актуален для новых,
еще создающихся и допускающих дальнейшее развитие систем.
Не будет преувеличением сказать, что в теоретических вопросах
локальной организации нашей стране (СССР) принадлежит приори-
приоритет. Наиболее важные результаты при этом были получены в школе
проф. МГУ М. Л. Цетлина, заложившей основные идеи локальной ор-
организации на примере и в терминах коллективного поведения и игр
автоматов.
Развитие теории здесь позволило предложить целый ряд моделей
систем нового типа, некоторые из которых нашли и соответствую-
соответствующее прикладное воплощение: сети связи (В. Г. Лазарев, А. В. Бутри-
менко, Б. М. Гинзбург), многопользовательские системы радиосвязи
(В. Л. Стефанюк, Т. Ковер) и др.
При изучении локально-организованных систем были также по-
поставлены многие существенные математические вопросы, разработаны
новые методы анализа, включая качественные (приближенные), выяв-
выявлена связь с вопросами эргодичности и некоторыми другими статфи-
зическими проблемами.
Работы этого направления продолжают развиваться, и в данной
книге делается попытка подвести итог этому развитию, опираясь, в ос-
основном, на собственные результаты ее автора.
Актуальность темы книги, посвященной изучению принципов ло-
локальной организации, определяется широкой распространенностью си-
систем, требующих локальной организации, отсутствием единого мето-
методического подхода и слабой разработанностью ряда теоретических ас-
аспектов такой организации. Изучение соответствующей совокупности
вопросов имеет большое научное и практическое значение, позволяя
глубже понимать организацию существующих больших систем и со-
создавать более совершенные новые системы из сложных компонент.
Актуальность темы книги подтверждается ее непосредственной свя-
связью с научными работами Института проблем передачи информации
Российской академии наук, где, в частности, велись следующие проек-
проекты.
— «Цифровые методы обработки информации в сложных человеко-
машинных системах», НТП 0.16.10 (задание 01.04.Н2), гос. per.
№01.86.0000497.
— «Центральное управление роботами», задание Координационного
плана 0.74.01 (раздел 11.01.НЗ) по постановлению ГКНТ при СМ
СССР№475от17.Х.75г.
— «Восстановление зависимости и прогнозирование при небольшом
числе наблюдений», гос. per. №77050700.
Введение 13
— «Математическое моделирование механизмов передачи и пе-
переработки информации в нейронных структурах», гос. per.
№ 72004782.
Кроме того, ряд вопросов книги был раскрыт в ходе проведения
следующих работ.
— В рамках проблемной комиссии многостороннего сотрудничества
АН социалистических стран «Научные вопросы вычислительной
техники» (КНВВТ), рабочая группа РГ-18 «Представление зна-
знаний в человеко-машинных и робототехнических системах» A980-
1985 гг.) и рабочая группа РГ-22 «Аппаратные и программные
средства искусственного интеллекта» A985—1990 гг.).
— В рамках научно-технического сотрудничества с Центральным
научно-исследовательским институтом эпидемиологии Минздра-
Минздрава СССР A986-1989 гг.) по теме «Разработка прототипа тренаже-
тренажера для специалистов и центра самодиагностики СПИДа на базе
микро-ЭВМ».
— В рамках научно-технического сотрудничества с Институтом
США и Канады АН СССР A986-1989 гг.) по теме «Разработка
информационной экспертной системы, относящейся к классу мета
экспертных систем».
— В процессе научно-технического сотрудничества с Государствен-
Государственным проектно-изыскательским и научно-исследовательским ин-
институтом морского транспорта A985-1987 гг.) по теме «Раз-
«Разработка и внедрение комплекса программ на языке Лисп для
автоматизированного контроля адекватности и непротиворечи-
непротиворечивости грузовых документов, передаваемых между портами по
каналам связи».
Большую роль сыграло участие автора книги в следующих темах,
финансирование большинства которых осуществлялось ГКНТ и РФ-
РФФИ СССР и России.
— «Проблемы теоретико-категорией формализации работы интел-
интеллектуальных компьютерных систем, основанных на знаниях»,
№ 2.4, грант Президиума РАН на 2001 г.
— «Проблемы построения персональных обучающих систем на осно-
основе интеллектуальных человеко-машинных интерфейсов», грант
РФФИ 02-01-00955 на 2002-2004 гг.
— Тема «Создание инструментального средства проектирования
интеллектуальных систем на основе технологии быстрой раз-
разработки приложений», выполненная в рамках государственной
научно-технической программы «Информатизация России» Ми-
Министерства науки, технической политики и образования, по про-
проекту 037.02.226.147/1-96 A996-1998 гг.).
14 Введение
Тема «Системы для работы с нечеткими данными в динами-
динамической базе знаний на персональном компьютере», выполнен-
выполненная по подпрограмме «Перспективные информационные техноло-
технологии» приоритетного направления «Информационные технологии
и электроника» федеральной целевой научно-технической про-
программы на 1998-2000 гг. «Исследования и разработки по прио-
приоритетным направлениям развития науки и техники гражданско-
гражданского назначения», направление: «Искусственный интеллект», про-
проект №0201.04.005 A998-1999 гг.).
«Исследование устойчивости поведения локально-организован-
локально-организованных систем искусственного интеллекта», РФФИ №96-01-00334
A996-1998 гг.).
«Разработка программных средств контроля эффективности обу-
обучения в интеллектуальных обучающих системах», часть проек-
проекта «Разработка программных средств выявления и представле-
представления знаний и их использование при создании обучающих систем
медицинской диагностики» по подпрограмме «Перспективные
информационные технологии» приоритетного направления «Ин-
«Информационные технологии и электроника» федеральной целевой
научно-технической программы «Исследования и разработки по
приоритетным направлениям развития науки и техники граждан-
гражданского назначения», конкурсное задание «Разработка программ-
программных средств выявления и представления знаний и их исполь-
использование при создании интеллектуальных и обучающих систем
(интеллектуальные тренажеры)» №0201.04.240, 1999 г.
«Проблемы построения интеллектуальных человеко-машинных
интерфейсов методами локально-организованных систем»,
РФФИ №99-01-01152 A999-2001 гг.).
Проект № 2.24 на 2002 г. по комплексной программе научных ис-
исследований Президиума РАН «Математическое моделирование,
интеллектуальные системы и управление нелинейными механи-
механическими системами».
НИР «Исследование и разработка экспертных обучающих си-
систем» (шифр «КОАЛА-АН») A991-1995 гг.).
«Исследование и разработка интеллектуальных обучающих
сред», грант Министерства науки, технической политики
и образования России, проект №1032 A993-1995 гг.).
«Advanced Man-Machine Interface for Process Control Application
(AMICA)», BRITE/EURAM Project 6126 A994-1995 гг.).
НИР «Разработка и создание исследовательского прототипа сей-
смопрогностической экспертной системы» (шифр «СЕЙСМО-
«СЕЙСМОЛОГ») по договору №01.03-21 между Институтом физики Земли
и Советской ассоциацией искусственного интеллекта A991 г.).
Введение 15
— НИР «Разработка методов использования нечетких знаний для
применения в исследовательском прототипе сейсмопрогности-
ческой экспертной системы» (шифр «СЕЙСМО-91»), договор
№ 10/91 между Институтом физики Земли и ИППИ АН СССР.
— «Развиваемая консультационная человеко-машинная система».
Государственная научно-исследовательская программа: «Пер-
«Перспективные информационные технологии», раздел: «Системы
искусственного интеллекта» (Распоряжение Президиума АН
СССР) A989-1991 гг.).
— «Анализ и моделирование технологии создания сейсмопрогности-
ческих систем на основе эвристических знаний». Договор № 16 от
29 марта 1990 г. между Институтом физики Земли и ИППИ АН
СССР.
Цель книги — дать единую методологическую основу анализа ло-
локально-организованных систем и показать, что локальная организа-
организация технических систем является новым перспективным направлением
в теории и практике создания больших систем в технике и информати-
информатике. В частности, в ней рассмотрены следующие положения:
— путем рассмотрения представительной совокупности моделей,
возникающих в разнообразных предметных областях, показана
широкая применимость локальной организации;
— показана применимость и полезность предложенной в книге ме-
методики исследования локально-организованных систем, позволя-
позволяющей, как правило, строить иерархии локально-организованных
систем;
— дан достаточно полный пакет методов математического анализа
моделей локально-организованных дискретных и непрерывных
систем в области информатики и программирования;
— указан широкий набор критериев целесообразности, которым
в состоянии удовлетворить работа локально-организованных си-
систем, предназначенных для различных предметных областей;
— на принципах локальной организации построен целый ряд новых
моделей технических систем, проявляющих целесообразное пове-
поведение;
— показано, что принципы локальной организации позволяют эф-
эффективно создавать сложные пакеты программ.
Научная новизна темы книги обусловлена тем, что ее автору при-
принадлежит приоритет в формулировке основных положений теории ло-
локальной организации систем и вытекающих из нее результатов, по-
полученных на всех этапах развития этого подхода. Им предложены
16 Введение
и реализованы оригинальные методы исследования вопросов локаль-
локальной организации в разнообразных предметных областях, предложен
и изучен ряд новых математических моделей систем и разработан ряд
программных комплексов.
Оригинальные результаты получены в таких областях, как коллек-
коллективное поведение конечных автоматов, локальное управление, интер-
интерактивные программные системы, динамические экспертные системы,
прикладные экспертные системы, системы представления задач, пред-
представления знаний, обучающиеся и обучающие системы.
В первой главе книги «Общие принципы локальной организации
систем» сделан обзор основных подходов к математическому модели-
моделированию больших (или сложных) систем, помогающий уяснить место
моделей с локальной организацией среди известных вариантов моделей
систем, дается определение локально-организованных систем и форму-
формулируется методика их анализа.
В частности, проанализировано состояние общей теории систем,
теории иерархических систем, исследования операций и игровых спосо-
способов децентрализованного управления. Выделены те проблемы, которые
возникают при создании в рамках этих научных направлений систем
с централизованным и децентрализованным управлением.
Для строгого определения понятия локально-организованной систе-
системы потребовалось уточнить, что понимается под системой, под крите-
критерием ее работы, под целью ее функционирования, под целью системы
в целом.
При глобальной организации конструктор располагает всей
необходимой информацией, позволяющей выбрать «оптимальный
вариант системы». Причем нетрудно видеть, что в класс глобально-
организованных систем попадают как централизованные, так и
децентрализованные системы.
Из приводимой формулировки глобальной организации видно, что
она невозможна, если выполняется хотя бы одно из следующих условий:
1) не задана цель системы;
2) ни одна из подсистем системы не располагает достаточно полной
информацией о других подсистемах.
Естественной альтернативой глобальной организации является ло-
локальная организация, при которой система S представляется состоя-
состоящей из ряда подсистем Si, каждая из которых является глобально-
организованной, т. е. для Si конструктором определена ее цель Gi, но
цель системы S либо не задана в объеме, необходимом для создания
глобально-организованной системы, либо каждая подсистема Si рас-
располагает лишь ограниченной локальной информацией /^ о результа-
результатах действий других систем и получаемых ими входных значениях,
что, само по себе, не позволяет создать децентрализованный вари-
вариант глобально-организованной системы. Система считается локально
организованной по определению, если хотя бы одна из ее подсистем
является локально-организованной системой.
Введение 17
Далее в гл. 1 упомянуты два примера (сеть связи и интеллек-
интеллектуальная операционная система), моделирующие реальные техниче-
технические ситуации, в которых локальная организация возникает с неиз-
неизбежностью. Отмечено, что в книге в качестве моделей локально-ор-
локально-организованных систем обсуждаются коллективное поведение автоматов
(конечных и стохастических), локальное управление, интерактивные
программные системы, экспертные системы, системы представления
задач, знаний, обучающие и обучающиеся системы.
Рассмотрение столь широкого спектра моделей обусловлено тем,
что каждый из перечисленных классов моделей порожден своей пред-
предметной областью, создающей, как правило, специфические трудности
в постановочном, методологическом и математическом отношении.
Объединяющим началом в изучении этих разных моделей является
описанная в гл. 1 методология исследования локально-организованной
системы. Эта методология, обобщающая опыт анализа подобных си-
систем, с одной стороны, позволяет строить иерархии моделей в каждом
классе задач, а с другой — характеризует локальную организацию как
целостное научное направление.
В этой части главы отмечается, что хотя общесистемная цель в ло-
локально-организованной системе отсутствует в том смысле, в каком
она требуется в общей теории систем, исследовании операций или
игровых децентрализованных схемах для осуществления глобальной
организации, указанная методология изучения локально-организован-
локально-организованной системы опирается, тем не менее, на использование некоторого
критерия выбора приемлемого варианта системы в целом. В качестве
последнего могут выступать целесообразность, живучесть, открытость,
устойчивость, эластичность и т. д. (см. табл. 1.4).
Подчеркивается, что критерий выбора варианта при локальной ор-
организации системы не является критерием качества функционирования
системы, характерным для централизованных и децентрализованных
систем. Задача такого критерия более «скромная» — обеспечить нор-
нормальное функционирование подсистем, составляющих систему, в соот-
соответствии с их локальными критериями качества.
Критерии выбора приемлемого варианта меняются от одной группы
задач к другой, их формулировка и применимость, как правило, опреде-
определяются предметной областью, что иллюстрируется данной книгой. Тем
не менее, удается выделить некоторые классы математических моде-
моделей, в пределах которых конкретизация элементов моделей локально-
организованных систем является более или менее устоявшейся. Это,
прежде всего:
— конечные, детерминированные и вероятностные автоматы (кол-
(коллективное поведение автоматов, игры автоматов);
— автоматы с непрерывным множеством действий (системы связи
с многими пользователями, экономико-математические модели);
— системы с нечетким (по Л. Заде) взаимодействием (человеко-
машинные, экспертные системы);
18 Введение
— взаимодействующие модули программы (интерактивные языки
программирования высокого уровня, системы искусственного ин-
интеллекта) ;
— системы представления задач и знаний, обучающиеся системы.
Соответствующий материал первой главы позволяет очертить
основной круг задач, которые призвана решить настоящая книга.
Первую главу заключает относительно подробный обзор истории
развития идей, имеющих отношение к методам локальной организации
целесообразного поведения систем. Задача этого обзора — подтвердить
актуальность такого подхода и показать вклад автора книги в станов-
становление и развитие этого направления.
Дальнейшая структура книги выбрана так, чтобы максимально
упростить получение ответов на поставленные в гл. 1 вопросы.
Так, в главах 2—4 собран материал по локально-организованным
системам, относящимся к дискретным, непрерывным и комбинатор-
комбинаторным моделям соответственно, что отражает особенности используемого
в этих главах математического аппарата.
Главы 2—4 носят в основном теоретический характер, конкретизируя
высказанные в гл. 1 положения, касающиеся локальных принципов
организации целесообразного поведения технических систем. Но не все
исследуемые в них модели носят чисто иллюстративный, служебный ха-
характер. В тех случаях, когда это уместно, ведется углубленное изучение
самой модели, проводится ее сравнение с уже известными из литерату-
литературы моделями, а если это модель оригинальная, то рассматриваются ее
познавательные достоинства и возможные приложения.
В заключительной гл. 5 собраны те случаи, когда на основе ло-
локальной организации удается построить пакет программ, решающий
определенный круг задач. Однако эта глава, в свою очередь, не яв-
является строго «прикладной», так как здесь каждая предметная об-
область рождает свои специфические теоретические проблемы, которые
преодолеваются в этой главе на пути создания конкретной локально-
организованной системы в виде компьютерной программы.
В гл. 2 «Методы исследования локальной организации в дискрет-
дискретных моделях» предполагается, что подсистемами S{ системы S служат
стохастические или детерминированные конечные автоматы, имеющие
конечное число возможных действий. При этом внутренние состояния
автоматов и совершаемые ими действия могут изменяться в дискрет-
дискретные моменты времени под влиянием получаемых данной подсистемой
эффектов (штрафов), зависящих, в частности, от действий всех осталь-
остальных подсистем.
Показано, что в этих предположениях для анализа возникающих
локально-организованных систем в соответствии с методологией, опи-
описанной в гл. 1, применимы следующие методы:
— моделирование представительной совокупности вариантов;
— асимптотический (с ростом глубины памяти) анализ;
Введение 19
— анализ точных уравнений для финальных вероятностей;
— анализ потоков вероятностей;
— приближенные методы (при числе агентов п —> оо);
— комбинированные методы.
В частности, в разд. 2.1 для исследования коллектива ^-автоматов
используются два приема: исчерпывающее машинное моделирование
и асимптотический (при е —> 0) анализ.
Использование первого приема стало возможным потому, что все
игры 2x2 двух ^-автоматов удалось разбить на небольшое число клас-
классов, в каждом из которых достаточно было проанализировать на ком-
компьютере один представительный пример игры. В результате с примене-
применением компьютера «доказано», что во всех таких играх с единственной
партией Нэша эта партия разыгрывается автоматами с подавляющей
вероятностью.
Второй прием позволил аналитически доказать справедливость бо-
более общего результата: в произвольной игре ^-автоматов суммарная
финальная вероятность всех партий игры, не входящих в существенные
классы некоторой вспомогательной цепи Маркова, при е —>• 0 стремится
к нулю. Если же вспомогательная цепь Маркова содержит ровно один
существенный класс, то финальные вероятности в игре при этом стре-
стремятся к финальным вероятностям соответствующих состояний вспомо-
вспомогательной цепи Маркова.
Указанная вспомогательная цепь Маркова легко строится по ис-
исходным матрицам игры, что, в конечном итоге, позволило убедиться
в целесообразном поведении коллектива ^-автоматов в таких известных
из литературы играх, как игра с нулевой суммой, игра в размещения,
игра Гура и т. д.
В разд. 2.2 лемма о равенстве стационарных потоков вероятно-
вероятности между двумя подгруппами состояний, составляющих единую цепь
Маркова, и некоторые соображения о достаточных условиях в теореме
М. Л. Цетлина об асимптотической оптимальности, используются для
иллюстрации очень простых приемов анализа целесообразности пове-
поведения «глубоких» автоматов. В случае коллективного поведения двух
автоматов с линейной тактикой этот прием позволяет при исследова-
исследовании целесообразности избежать использования каких-либо громоздких
выкладок.
В разд. 2.3 рассматривается модель формирования мнения в кол-
коллективе простейших стохастических автоматов в результате «обмена
мнениями»: коллектив разбивается на тройки и внутри каждой тройки
производится голосование по большинству (возможно, с ошибкой). Эта
модель служит для иллюстрации метода анализа, состоящего в при-
приближенной замене случайной величины на ее среднее значение, что,
в конечном счете, приводит к рассмотрению неэргодической модели
системы (хотя исходная локально-организованная система заведомо
эргодическая).
20 Введение
С содержательной стороны, модель этого раздела иллюстрирует то,
что коллективная память оказывается существенно прочнее индивиду-
индивидуальной, что в данном случае наводит на мысль об аналогии с работой
Дж. фон Неймана по созданию надежных систем из ненадежных ком-
компонент.
Возникшая в результате приближения неэргодическая система хо-
хорошо моделирует исходную ситуацию при п —>• оо, что подтверждается
приведенным в этом разделе машинным моделированием. Это явление
отражает часто наблюдаемое свойство в локально-организованных си-
системах — сосредоточение вероятностной меры на некотором подклассе
состояний исходной системы.
Во многих смыслах аналогичная модель обсуждается в разд. 2.4,
где строится модель памяти со случайной выборкой элементов из па-
памяти, в которой хранится множество копий каждого элемента: «наугад»
выбирается некий элемент и сопоставляется с образцом. Если сопостав-
сопоставление успешно, то поиск закончен; в противном случае выбранный эле-
элемент возвращается в память (или выбрасывается), выбирается какой-то
другой элемент и процесс повторяется.
В предположении, что существуют априорные, но, быть может,
неизвестные вероятности pi, . . . , рп, с которыми осуществляется поиск
в памяти элемента данного типа, считая, что ni — количество копий
элементов типа г, г = 1,. . . , п, естественно принять за критерий целе-
целесообразности системы среднюю продолжительность поиска элементов
в такой памяти.
Подсистемой Si в такой локально-организованной системе является
«автомат», формирующий число П{. В этом разделе рассматривается
иерархия моделей автоматов, обеспечивающих «оптимальные» числа
копий, зависящая от доступной информации: вероятности pi известны;
вероятности pi неизвестны, но известны числа П{\ ничего не известно.
В анализе используется приближенная замена случайных величин
их средними значениями, ведущая теперь к рассмотрению эргодиче-
ских моделей (не смотря на то, что исходная система является неэр-
годической), поэтому в этом разделе даны результаты компьютерного
моделирования, которые подтверждают теоретические выводы.
В приложении П.1 приводится сопоставление такой памяти со
«стопкой книг» М. Л. Цетлина, для которой за прошедшие годы были
получены некоторые новые данные. Результаты гл. 2 используются
также в гл. 4 при анализе экспериментов по автоматическому форми-
формированию фреймов.
В гл. 3 «Локальная организация целесообразного поведения в непре-
непрерывных моделях» в качестве подсистем Si системы S выступают
автоматы с непрерывным множеством действий, взаимодействующие
в непрерывной шкале времени по некоторому детерминированному
закону.
Если взаимодействие автоматов в предыдущей главе носило доста-
достаточно простой и фиксированный характер, то в локально-организован-
локально-организованной системе с непрерывными автоматами открываются дополнитель-
Введение 21
ные возможности для анализа взаимодействия в широком диапазоне
его изменения.
В гл. 3 взаимодействие подсистем описывается совокупностью
непрерывных функций Vi(t) = Vi(ei(t), . . . , en(t)), i = 1, . . . , n, где
ei(t) — действие подсистемы i в момент ?, a Vi(i) — получаемый ею
эффект (a,i ^ ei ^ bi).
Нетрудно видеть, что, как правило, существует некоторая область
]\j(n) такая, что достижимыми в локально-организованной системе S
являются лишь векторы v E N^n\ Поэтому первый вопрос, с кото-
которым сталкивается исследователь, является вопрос устойчивости. Во-
первых, если v° ф N(n\ то работа любой системы, в которой це-
целью подсистемы Si является достижение j/?, г = 1, . . . ,гг, окажется
неустойчивой. Но даже если выполняется и° Е N'n), то возникновение
неустойчивости возможно в силу независимости действий подсистем Si
по достижению цели i/? и локальности информации, которой распола-
располагает подсистема (она обычно сводится к паре величин е^(?), Vi{t)).
В разд. 3.1 рассматривается локально-организованная система, в ко-
которой отсутствует взаимодействие в том смысле, что в ней нет замкну-
замкнутых цепочек воздействий подсистем друг на друга. В такой системе
воздействия подсистем друг на друга образуют некоторую иерархиче-
иерархическую схему, что позволяет при достаточно общих условиях доказать,
что при i/° E N^n) поведение простых дифференциальных алгоритмов
выбора j/? подсистемами Si является глобально устойчивым.
Устойчивость в общем случае можно рассчитывать получить, если
в качестве цели подсистемы Si будет использоваться критерий вида
Ci(ei,Vi,<x.i), где oli является параметром, априорно выбираемым г-й
подсистемой.
В этой главе показано, что такие понятия, как «глубина памяти»
и «партия Нэша», имеют свои аналогии в области автоматов с непре-
непрерывным множеством действий, играя, как и в случае ^-автоматов
и других стохастических или детерминированных конечных автоматов,
фундаментальную роль. Так устойчивость поведения в значительной
степени определяется свойствами положения равновесия вида
ел о2
— Ci(ei, щ, щ) = 0, —2 Ci(ei,i/i, оц) > 0, г = 1, . . . , п,
которые являются дифференциальным выражением партий Нэша
в обычном смысле слова.
В разд. 3.1 доказано, что все положения равновесия такого типа
приводят к неэластичному поведению, выражающемуся в отсутствии
разумного перехода от случая сильного взаимодействия в коллекти-
коллективе подсистем Si к случаю без взаимодействия: требование наличия
равновесия в произвольном коллективе оказывается несовместимым
с возможностью получить любое j/? при отсутствии взаимодействия.
Эластичное поведение можно получить, рассматривая равновесные
точки Нэша «с рефлексией», где малые вариации критерия С{ берут-
берутся по получаемым эффектам, а не по производимым подсистемами
22 Введение
действиям. (Примеры можно найти в разд. 3.4, где приведены ре-
результаты по достижимости, устойчивости и эластичности для частного
случая дробно-линейной зависимости эффекта от действий в системе
автоматов с непрерывным множеством действий. К такому простому
взаимодействию приводят некоторые модели распределенных систем
радиосвязи коллективного доступа.)
В разд. 3.2 рассматриваются содержательные условия устойчивости
локального управления при и° ? N^n\ которые также формулируются
в «рефлексивных» терминах: когда некоторая подсистема выбирает
действие, то она должна быть уверена в соответствующем результиру-
результирующем изменении получаемого ею эффекта, по крайней мере в случае,
когда остальные подсистемы не стремятся «улучшить» свое положение.
В книге доказывается устойчивость в малом при выполнении содержа-
содержательных условий устойчивости и формулируется теорема о глобальной
устойчивости, доказанная А. М. Микийчуком в его дипломной работе.
С формальной стороны, устойчивость в малом локально-органи-
локально-организованной системы в антагонистической ситуации определяется свой-
свойствами соответствующей матрицы Метцлера, у которой все недиа-
недиагональные элементы неположительны. Специальное внимание таким
матрицам уделено в разд. 3.3, где получены новые необходимые и доста-
достаточные условия, при которых матрица Метцлера является М-матрицей,
т. е. матрицей Метцлера, все главные миноры которой положительны.
В заключении раздела приведено несколько примеров использования
этого результата для анализа локально-организованной системы.
Глава 3 заканчивается рассмотрением конкретного примера из об-
области робототехники — многозвенного манипулятора, управляемого на
локальных принципах. При отсутствии инерционных сил такой мани-
манипулятор представлял бы собой разновидность описанной в разд. 3.1
системы без взаимодействия, но учет масс элементов манипулятора по-
потребовал применения двухуровневой обучающейся системы, которую,
по аналогии с биомеханикой, мы назвали системой выработки навыка.
Детали разработанной системы даны в П.2.
В гл. 4 «Локальный подход к решению фундаментальных задач
искусственного интеллекта» делается попытка рассмотреть поиск аде-
адекватного представления задач и знаний, а также процесс обучения, яв-
являющиеся особо важными проблемами для искусственного интеллекта,
как работу некоторой локально-организованной системы.
В разд. 4.1, где рассматриваются вопросы эвристического поиска
«удобного» представления комбинаторной задачи, проводится парал-
параллель между внешне весьма далекими проблемами, а именно между
задачей покрытия плоского массива, используя для этого полимино
определенной формы, и задачей управления транспортными потоками
(или потоками данных в вычислительных сетях).
В задаче покрытия подсистемами Si являются отдельные полимино,
их возможные действия — любые допустимые расположения на масси-
массиве. Взаимодействие подсистем происходит тогда, когда несколько поли-
полимино «пытаются» покрыть пересекающиеся подмножества элементов
Введение 23
массива. На этом языке задача состоит в том, чтобы полимино «выбира-
«выбирали» (с учетом взаимодействия) свои действия так, чтобы образовалось
совершенное (полное, без просветов) покрытие массива.
При таком подходе, как показано, естественное применение находит
новый принцип — принцип семиотической интроспекции, который
позволяет упростить задачу перебора путем уменьшения числа ис-
используемых имен, опираясь на учет нескольких видов однородности
в покрываемом массиве, выделяющихся «в силу возможных действий
подсистемы Si». Следует отметить, что разработанное правильное по-
именование элементов массива преобразует систему покрытия в систе-
систему без взаимодействия, поэтому успех, достигаемый благодаря предло-
предложенной системе имен, не удивителен.
В разд. 4.2 адаптивные запоминающие системы типа описанных
в разд. 2.4 используются в компьютерном эксперименте по автома-
автоматическому формированию фреймоподобных структур, целью которого
была проверка нескольких простых алгоритмов дальнейшего ускоре-
ускорения извлечения сведений из памяти при условии, что эти сведения
не являются независимыми, как в гл. 2, а образуют иерархически
упорядоченные структуры. Эксперимент показал, что целесообразным
является как использование памяти со свойствами «стопки книг», так
и применение некоторой формальной процедуры обобщения строк сим-
символов. Последняя идея получила самостоятельное развитие в разд. 4.3,
где для описания процедур представления знаний и обучения в самом
общем виде была привлечена теория категорий. Часть относящегося
к разд. 4.3 материала вынесена в приложение (см. прил. П.З), в котором
приводятся иллюстрации построения соответствующих морфизмов для
известных процедур сопоставления с образцом. Другая иллюстрация —
применение общей теории обучения в случае простых цепочек симво-
символов — может быть найдена в разд. 5.4 книги.
Раздел 4.4 посвящен рассмотрению задачи объединения нечетких
свидетельств в экспертных системах как примере локально-организо-
локально-организованной системы обработки свидетельств. Развитый подход позволил
ввести в рассмотрение принцип максимального доверия, выливающий-
выливающийся в некоторую экстремальную задачу, аналогичную задачам, возника-
возникающим при использовании принципа максимальной энтропии, хорошо
зарекомендовавшего себя при описании физических систем с неполной
информацией. Заметим, что в данном случае в качестве критерия выбо-
выбора варианта локально-организованной системы S выступает некоторый
экстремальный принцип.
В завершающей гл. 5 «Использование локальной организации при
разработке прикладных программных и человеко-машинных систем»
собраны примеры, когда на основе локальной организации удалось по-
построить пакет программ, решающий полезную для приложений задачу
(или группу задач).
Применение принципа локальной организации в этой главе ведется
с учетом того, что при всяком конкретном «внедрении» в практику
приходится делать весьма обстоятельный анализ самой предметной
24 Введение
области, который и составил дополнительную теоретическую часть
в разделах данной главы.
Раздел 5.1 посвящен задачам программирования. В нем делает-
делается важный вывод о том, что в программировании можно наблюдать
постепенный переход от централизованных методов к децентрализо-
децентрализованным, а от последних — к локально-организованным. По-видимому,
именно благодаря локальной организации самого процесса составления
программы, широкое распространение в свое время получило програм-
программирование на языке Лисп. При этом отдельные функции Лиспа (или
составленные из них модули) представляют собой подсистемы Si, при-
причем индивидуальная отладка модуля соответствует этапу III методики
изучения локально-организованной системы, а отладка взаимодействия
модулей — этапам IV и V этой методики (см. рис. 1.3 в гл. 1).
В этом разделе локальная организация программы и процесса про-
программирования используется для создания интерактивной системы
программирования ЭКЛИСП, системы снятия рекурсии с учетом по-
побочных эффектов и метода рекурсивного вычисления арифметических
(несимвольных) функций в языке Лисп (и других языках, допускающих
рекурсию). Последний пример интересен как иллюстрация рекурсив-
рекурсивной локально-организованной системы, в которой подсистема Si всту-
вступает во взаимодействие со своей собственной копией.
В разд. 5.2 обсуждаются общие принципы создания интеллекту-
интеллектуальной операционной системы, которую предполагается строить на
основе локальной организации. Локальными подсистемами в данном
случае служат фреймы, каждый из которых способен охватить какую-
то одну особенность, присущую данному пользователю-программисту,
что позволяет создать весьма гибкую систему индивидуализированной
реакции на действия программиста. Эта концепция подробно разраба-
разрабатывается в разд. 5.3 при создании системы FLEX гибкого обслужива-
обслуживания программиста на языке Лисп, которую, учитывая интерактивный
характер программирования на этом языке, можно рассматривать как
прототип интеллектуальной операционной системы.
В разд. 5.4 описана реализованная с применением формализма
представления знаний гл. 4 обучающаяся система поддержки ввода
данных в компьютер — PROMPTER. Эта система, как и интеллекту-
интеллектуальная операционная система, обладает способностью, обучаясь, «под-
«подстраиваться» под решаемую пользователем задачу. В этом разделе
также показано, что обучающуюся диалоговую систему нельзя описать
как конечный автомат (вопреки некоторым утверждениям в литера-
литературе), так как при обучении происходит реорганизация и множества
действий, и множества состояний, и функции переходов между этими
состояниями.
При создании системы PROMPTER пришлось принять во внимание
целый ряд конкретных факторов, характеризующих задачу: характе-
характеристики компьютера, свойства дисплея, психофизиологические особен-
особенности оператора и особенности области применения — формирование
на компьютере погрузочной документации в морском порту.
Введение 25
В разд. 5.5 рассмотрена задача автоматизации выявления после-
последовательности оснований ДНК, которой посвящено достаточно много
исследований. Показано, что из многих способов обработки возникаю-
возникающих данных предпочтение следует отдавать методам, опирающимся на
использование знаний экспертов.
Наконец в разд. 5.6 речь идет о профилактической фильтрации,
позволяющей снизить вероятность заражения вирусом по электронной
почте или вероятность получения нежелательных сообщений, извест-
известных как СПАМ.
Каждая глава книги завершается выводами, а общий итог работы
кратко суммирован в разделе «Общие выводы», основной тезис которо-
которого состоит в том, что локальная организация систем представляет собой
важную альтернативу централизованной и децентрализованной орга-
организациям, позволяя сформулировать и исследовать ряд новых классов
задач, имеющих непосредственное научное и прикладное значение:
— коллективное поведение;
— локальное управление;
— локальное программирование;
— локально-организованные системы искусственного интеллекта;
— локально-организованные человеко-машинные (экспертные) си-
системы.
Выдвинутая в книге методология исследования локально-органи-
локально-организованных систем последовательно реализована в этих классах задач
с применением предложенных в книге математических методов и кри-
критериев, построены примеры прикладных систем. В целом, изложенный
в книге подход, по мнению автора, составляет новое перспективное
направление в теории и практике создания больших систем в технике
и информатике.
Глава 1
ОБЩИЕ ПРИНЦИПЫ ЛОКАЛЬНОЙ
ОРГАНИЗАЦИИ СИСТЕМ
В технике, информатике, экономике, социологии, биологии и многих
других областях большую роль играют вопросы организации управле-
управления существующими или вновь создаваемыми системами, обеспечива-
обеспечивающего целесообразность в том или ином смысле поведения системы
в целом.
В настоящей главе показано, что решение возникающих при этом
проблем во многом определяется степенью централизации управле-
управления компонентами системы в ходе ее функционирования. Поскольку
целью книги является предложение и исследование наименее центра-
централизованного варианта организации систем — локальной организации,
то естественная задача этой главы состоит в том, чтобы показать то
место, которое занимают модели локальной организации в иерархии
других подходов к математическому описанию моделей систем, таких,
например, как общая теория систем или теория игр и исследование
операций (см. разд. 1.1).
С другой стороны, в разд. 1.2 приводятся выборочные примеры
реальных технических систем, в которых локальная организация явля-
является более естественной, чем централизованная или децентрализован-
децентрализованная, — это системы связи и так называемые интеллектуальные операци-
операционные системы, учитывая, что в следующих главах книги представлено
большое число моделей других локально-организованных систем, име-
имеющих под собой реальную основу.
Как самостоятельный подход к организации систем и их мате-
математическому моделированию локальную организацию характеризует
своя собственная методология анализа и синтеза моделей и систем,
которая изложена в разд. 1.3 и которой неуклонно следуют все части
настоящей работы. Эта методология является результатом обобщения
значительного опыта исследований локально-организованных систем,
накопленного разными авторами в этой области, начиная с 1961 г.,
что оправдывает включение в главу разд. 1.4, посвященного истории
возникновения и становления методов локальной организации.
1.1. Математическое моделирование систем
В настоящем разделе предпринята попытка сделать общий обзор
подходов к моделированию больших (или сложных) систем, который
помогает уяснить место моделей с локальной организацией среди мно-
многих других математических моделей систем.
1.1] Математическое моделирование систем 27
1.1.1. Общая теория систем. Под системой S в общей теории си-
систем понимается формальная связь между наблюдаемыми признаками
и свойствами системы. В этой теории развивается чисто математиче-
математический и предельно общий подход [Месарович и Такахара, 1978, с. 10],
ведущий к изучению таких общих понятий, как статические и дина-
динамические системы, системы без памяти, общая теория реализации,
предопределенности, управляемости и т. п., обобщающие многие пред-
представления, выработанные ранее в кибернетике и теории автоматов.
Поскольку в общей теории систем речь идет об общих свойствах
формальных отношений между интересующими объектами, то обычно
ее языком является теория категорий. Авторы теории систем М. Ме-
Месарович и Я. Такахара осознают, насколько далеко предлагаемый ими
подход уводит в сторону от тех реальных больших систем, которые
подвергаются моделированию в общей теории систем. Так, они про-
противопоставляют свой подход (см. там же, с. 287) идеям, развиваемым
Г. Саймоном, отмечая «его глубокое понимание того, как «действитель-
«действительно» работают сложные системы (в противовес известным идеализаци-
ям, часто связанным с идеями оптимизации), будь они социальными,
политическими или «искусственными»».
В книге [Вунт, 1978] подробно рассматривается теория линейных
систем (как детерминированных, так и стохастических) с дискретным
и непрерывным временем. Особенно подчеркивается роль, которую
играют различные алгебраические структуры (поля, кольца, группы,
изоморфизмы) при описании линейных систем с точки зрения про-
пространства состояний.
Многие авторы отмечали, что принятый в теории систем уровень
абстракции хотя и позволяет создать математический аппарат, при-
пригодный для описания таких систем, и разработать некоторые методы
«декомпозиции» больших систем на более удобные в рассмотрении
«небольшие» элементы, не приводит к развитию действенных методов
управления системами (см. [Вентцель, 1988, с. 51]). Наиболее ощутимые
результаты здесь получены, главным образом, в области линейных
систем.
Можно сказать, что общая теория систем — это крайнее выражение
централизованного подхода к организации системы: «система есть от-
отношение S С X х Y над абстрактными множествами X, У, где X, Y —
множества входов и выходов».
В этом смысле работа [Месарович и Такахара, 1978] иллюстрирует
переход к большей степени централизации по сравнению с развитой
М. Месаровичем, Д. Мако и И. Такахара теорией иерархических систем
с многими уровнями (см. [Месарович, Мако, Такахара, 1973], оригинал
книги вышел в свет в 1970 г.). В этой книге авторы отмечают, что иерар-
иерархическое упорядочение часто связано с процессом изменения структу-
структуры уже существующей системы в целях повышения ее эффективности
([Месарович, Мако, Такахара, 1973, с. 85]).
Центральное место в указанной книге Месаровича, Мако и Така-
Такахара занимает проблема координации действий (принятия решений)
в двухуровневой системе, содержащей п подсистем нижнего уровня,
28
Общие принципы локальной организации систем
[Гл. 1
ответственных за управление п подпроцессами некоторого общего про-
процесса и подчиненных единственной высшей системе управления. Общая
теория строится в ней на основе трех конкретных примеров систем,
возникающих в сталелитейном производстве, нефтехимическом произ-
производстве и энергетике, которые характеризуются, по мнению авторов,
тремя видами целей, а именно:
— цели органов нижнего уровня;
— цели вышестоящего органа (координатора);
— цель всей системы.
На рис. 1.1 приведен пример такой двухуровневой системы. На нем
через Р обозначена управляемая система (управляемый процесс), на
которую поступает внешнее возмущение uj Е Л, а на ее выходе возни-
возникает значение у Е У. Если гп{ — суть управляющие сигналы mi Е М,
то можно записать соотношение Р : М х Л —» У.
Вышестоящая
управляющая
система
Нижестоящие
управляющие
системы
Рис. 1.1. Двухуровневая система с п нижестоящими управляющими систе-
системами [Месарович, Мако, Такахара, 1973]
Далее, на этом рисунке через 7г обозначены координирующие сиг-
сигналы, поступающие из координатора S на п подсистем Si, г = 1, ...
... , п. Каждая из подсистем получает также сигналы обратной связи,
говорящие о состоянии процесса Р [Афанасьев, 1979; Афанасьев, Кол-
мановский, Носов, 1989].
На основе такой схемы в книге [Месарович, Мако, Такахара, 1973]
изучаются вопросы координируемости и согласуемости работы всей
системы в свете решения оптимизационных задач при заданной гло-
глобальной функции качества G, по которой определяются локальные
функции качества G^, г = 1,...,гг (см. с. 166). Таким образом, си-
система на рис. 1.1 представляет собой несомненный шаг в направлении
1.1] Математическое моделирование систем 29
децентрализации систем, изучаемых в рамках общей теории систем.
Однако и такие системы оказываются настолько сложными, что до
конца удается рассмотреть лишь некоторые их линейные варианты.
1.1.2. Исследование операций и теория игр. Исследование опера-
операций как применение математических количественных методов для об-
обоснования решений во всех областях человеческой деятельности [Вент-
цель, 1988, с. 9] возникло в годы второй мировой войны. В самом общем
виде [Вентцель, 1988; Гермейер, 1971] речь в нем идет о каком-то меро-
мероприятии, преследующем определенную цель. При заданных условиях,
характеризующих обстановку, требуется принять такое решение, чтобы
задуманное мероприятие было бы в каком-то смысле наиболее выгод-
выгодным, т. е. необходимо задать показатель эффективности (или целевую
функцию).
В рамках исследования операций, в которое обычно включают ли-
линейное программирование, динамическое программирование, теорию
массового обслуживания, стохастические системы и теорию игр, также
возникает представление об иерархически организованных системах.
Такие системы являются децентрализованными, что видно из следую-
следующей цитаты ([Вентцель, 1988, с. 51]): «Разумное управление сложной
иерархической системой состоит в том, чтобы каждое вышестоящее
звено давало задание нижестоящим не жестко регламентировано *),
а «в общих чертах», предоставляя им известную инициативу, но так
ставя перед ними цели, чтобы каждое звено, стремясь к своей цели,
работало вместе с тем в согласии с интересами вышестоящего звена
и системы в целом».
Надо отметить, что пример в [Вентцель, 1988] «какая-то отрасль
народного хозяйства включает относительно самостоятельные специ-
специализированные управления, которые, в свою очередь, имеют в сво-
своем подчинении предприятия (фабрики, заводы); каждое предприятие
включает подразделения, цеха и проч. ...» (см. с. 50), не вполне со-
соответствует современным представлениям об эффективной экономике,
где более уместны такие понятия, как «хозрасчет, самоокупаемость, са-
самофинансирование», играющие центральную роль в ходе перестройки
(reengineering [Попов, 1996]) предприятий. Вместе с тем, Е. С. Вент-
Вентцель, разумеется, ясно осознавала трудность построения такой иде-
идеализированной схемы сложной иерархической системы. Так, там же
отмечается, что выбор показателя эффективности — что очень важно
для работы децентрализованной системы — на практике оказывает-
оказывается отнюдь не простым делом: «В этом читатель может убедиться,
попытавшись, например, выбрать показатель эффективности работы
городского транспорта. Что взять в качестве такого показателя? Сред-
Среднюю скорость передвижения пассажиров по городу? Или среднее число
перевезенных пассажиров? Или среднее количество километров, кото-
которое придется пройти пешком человеку, которого транспорт не может
х) Тогда это была бы централизованная система — прим. авт.
30
Общие принципы локальной организации систем
[Гл. 1
доставить к нужному месту? Тут есть над чем поразмыслить!» (там
же, с. 20).
Общая среда функционирования
Рис. 1.2. Локально-организованная система S из п подсистем. (Здесь а —
действие подсистемы, связанное с достижением локальной цели Gi\ U —
локальная информация, доступная г-й подсистеме, г = 1, . . . , п.)
Если к трудности выбора показателя эффективности добавить так-
также, что «само принятие решений выходит за рамки исследования
операций и относится к компетенции ответственного лица, чаще —
группы лиц, которым предоставлено право окончательного выбора
и на которых возложена ответственность за этот выбор. Делая вы-
выбор, они могут учитывать, наряду с рекомендациями, вытекающими
из математического расчета, еще ряд соображений (количественного
и качественного характера) которые этим расчетом не были учтены»
(см. [Вентцель, 1988, с. 16]), нетрудно прийти к изучаемой в данной
книге схеме локальной организации, изображенной на рис. 1.2.
1.1.3. Игровое децентрализованное управление. Децентрализация
при игровом управлении достигается за счет согласования действий
подсистем через объект управления (среду, в которой функционируют
подсистемы), что позволяет всей системе достигать поставленной перед
ней цели в результате действий подсистем, направленных на достиже-
достижение своих локальных целей ([Бернштейн, 1966, с. 24]).
Игровое децентрализованное управление, которое весьма подробно
описано в книге [Варшавский и Поспелов, 1984], отличает от локальной
организации наличие общей цели, хотя многие математические модели
оказываются весьма близкими. Собственно, локально-организованные
системы попали в цитируемую книгу под рубрикой «системы, которые
в полном объеме никто не создавал»: «В отличие от радиоприемника
или телевизора, самолета или автомобиля мировая сеть телефонной
связи не имеет единого проектировщика, который бы воплотил свой
замысел в имеющуюся сеть. Та система, которая существует, возникла
из более простых эволюционным путем, путем постепенного объедине-
объединения более простых систем и усложнения функционирования в процессе
их объединения» (там же с. 9). Однако эти системы остались в этой
1.2] Примеры систем, требующих локальной организации 31
книге неизученными, если не считать описания модели голосования на
с. 144-151, заимствованной из наших работ [Стефанюк и Котляр, 1971]
и [Котляр и Стефанюк, 1972].
Во многих предметных областях можно наблюдать тенденцию пе-
перехода от централизации к децентрализации. Однако логика развития
технических, экономических и им подобных больших систем требует
рассмотрения распределенных или локально-организованных систем,
что мы и попытаемся показать в следующем разделе.
1.2. Примеры систем, требующих локальной
организации
Для строгого определения понятия локально-организованной систе-
системы необходимо уточнить, что понимается под системой, под критерием
ее работы, под целью ее функционирования.
Техническая система S в наиболее абстрактной форме задается
в виде отношения S ^ X х Y над множествами X (вход) и Y (выход)
[Месарович и Такахара, 1978], но в реальных системах более естествен-
естественным является использование отображения S : X —> У.
Рассмотрим совокупность подобных технических систем Sp : X —>
—>• У, зависящих от параметра /3, с одними и теми же множествами
X и Y и запишем работу каждой системы этой совокупности в виде
функции у = Sp(x) или у = S(x, /3).
Варьируя /3, конструктор выбирает необходимую систему сообразно
некоторому критерию или оценке качества функционирования G(x,y)
и некоторой функции-идеала Goal(;r), отыскивая, например, следую-
следующий минимум целевой функции [Афанасьев, 1979; Афанасьев, Колма-
новский, Носов, 1989]:
min [ {Goal{x)-G{x,S(x,P))}W(x)dx, A.2.1)
где {о} — выбранная метрика, a W(a?) — весовая функция.
Здесь приведена одна из возможных форм задания цели, которую
в данной работе мы отождествляем с целью конструирования или
просто с целью функционирования системы, для краткости обозначая
ее символом G.
При глобальной организации системы конструктор располагает ис-
исчерпывающим описанием класса возможных систем, критерием каче-
качества функционирования, описанием работы идеальной системы, опти-
оптимизируемым функционалом, набором дополнительных ограничений.
Легко убедиться, что в класс глобально-организованных систем по-
попадают как централизованные системы, оптимальные в смысле A.2.1),
так и децентрализованные системы (см. пример на рис. 1.1).
В последнем случае считается, что система S с заданными выше ха-
характеристиками разбита на ряд подсистем Si и для каждого г указаны
32 Общие принципы локальной организации систем [Гл. 1
^), Gi(x, у) и целевая функция
min [ {Goali(x)-Gi(x,Si(x,l3i))}Wi(x)dx A.2.2)
такие, что если минимум A.2.2) достигается для всех г, то S в целом
будет оптимальной в указанном выше смысле A.2.1).
Естественной альтернативой глобальной организации является ло-
локальная организация, при которой система S состоит из ряда подсистем
Si, каждая из которых, в простейшем случае, является глобально-
организованной, т.е. для Si конструктором определена ее цель Gi,
но либо цель системы S не задана в том объеме, который необ-
необходим для создания глобально-организованной системы, либо каж-
каждая подсистема работает на основе ограниченной локальной инфор-
информации Ii о действиях других подсистем и получаемых ими входных
значениях, что не позволяет создать децентрализованный вариант
глобально-организованной системы. (Система считается локально-ор-
ганизован-ной по определению, если хотя бы одна ее подсистема явля-
является локально-организованной.)
Перечислим ситуации особого интереса к локальной организации:
1. К локальной организации ведет, как правило, укрупнение систем
путем объединения частных «умений» при создании техноценоза
[Варшавский и Поспелов, 1984].
2. Во многих случаях отсутствуют достаточные основания для фор-
формулировки четкой единой общесистемной цели [Вентцель, 1988].
3. С ростом количественного состава централизованной или децен-
децентрализованной системы недопустимо растет объем необходимой
служебной информации [Варшавский и Поспелов, 1984].
4. Естественная с общенаучной точки зрения парадигма глобальной
организации достаточно быстро исчерпывает себя в приложениях,
в силу развитости соответствующих математических методов.
5. Наконец, создание локально-организованных систем часто раз-
разрешает противоречие между хорошей степенью изученности от-
отдельных частей и малой изученностью системы в целом в еще
создающихся или допускающих дальнейшее развитие системах.
Ниже разбираются два примера, моделирующие реальные техниче-
технические задачи, в которых локальная организация возникает с неизбежно-
неизбежностью.
Первым примером, на котором мы остановимся подробнее, явля-
являются распределенные системы связи: телефонные сети [Бутрименко
и Лазарев, 1965; Бутрименко, 1966], сети передачи данных [Гинзбург
и Стефанюк, 1979; Лазарев и Саввин, 1973], радиосети коллектив-
коллективного доступа [Стефанюк и Цетлин, 1967; Abramson, 1970; Цыбаков
1.2] Примеры систем, требующих локальной организации 33
и Лиханов, 1985]. В таких системах приходится решать задачу пере-
передачи сообщений или данных, поставляемых абонентами независимо
друг от друга. Кроме того, дальнейший маршрут сообщения в узлах
коммутации распределенной сети выбирается на основе ограниченных
локальных сведений о занятости выходных соединений данного узла
[Ченцов, 1980].
В принципе, на так работающей сети создаются условия для раз-
различных конфликтных ситуаций (занятость линии в телефонной сети,
заторы в сетях ЭВМ, неустойчивость в радиосетях коллективного до-
доступа, наложение сигналов в системе Алоха и т. д.). Однако примене-
применение централизованных или децентрализованных методов оптимального
указания маршрутов или режима работы абонентов практически невоз-
невозможно, так как для этого потребовалась бы сеть связи, дублирующая
основную, предназначенная исключительно для передачи управляю-
управляющей информации. Кроме того, управляющий центр должен был бы
исходить из некоторой общесетевой цели, которую совсем непросто вы-
выбрать и обосновать. И наконец, наличие такого центра сильно повысило
бы уязвимость системы.
Поэтому реальные распределенные сети являются локально органи-
организованными, причем многолетний опыт подтвердил их достаточно высо-
высокие эксплуатационные качества. Не удивительно, что распределенные
сети явились одним из самых первых объектов приложения теории
коллективного поведения автоматов [Бутрименко и Лазарев, 1965].
Другим примером из практики, где локальная организация систе-
системы является столь же естественной, может служить так называемая
интеллектуальная операционная система [Стефанюк, 1982а].
Как известно, задачей операционной системы (ОС) вычислительной
машины является весь комплекс обслуживания пользователей ЭВМ,
включающий контроль и согласование всех процессов вычисления или
пересылки данных *). Нет нужды говорить здесь о том, что современ-
современные ОС являются сложным и дорогостоящим программным продук-
продуктом, требующим длительной и тщательной разработки. Кроме обыч-
обычных требований к ОС в интеллектуальных операционных системах вы-
выделено требование индивидуального обслуживания пользователя ЭВМ,
когда реакция ЭВМ на действия пользователя не носит универсально-
универсального, априорно заданного характера, а зависит от предыдущих действий
данного пользователя, по которым ЭВМ в состоянии судить об уровне
знаний пользователя, его подготовке, быть может, его психической
организации и т. д.
В работе [Стефанюк, 1982а] не только выдвинута идея такой ин-
интеллектуальной операционной системы, но и предложен метод ее ре-
реализации, состоящий в создании локально-организованной системы
фреймов 5, каждый из которых в состоянии распознать лишь доста-
достаточно узкую ситуацию и предпринять некоторое действие, адекватное
именно этой ситуации. Таким образом, «цель» G{ каждого фрейма
Si задается создателем системы (экспертом-программистом) довольно
х) Кейлингерт П. Элементы операционных систем. — М.: Мир, 1985.
2 Стефанюк
34 Общие принципы локальной организации систем [Гл. 1
легко; несложно организовать непротиворечивую совместную работу
некоторого числа таких фреймов, но общесистемную цель G интеллек-
интеллектуальной операционной системы задать было бы весьма трудным (да
и не нужным!) делом. Точно также мы затрудняемся, если нас просят
кратко и содержательно описать «личность» некоторого человека, хотя
множество его отдельных свойств, проявляющихся в достаточно узких
подклассах ситуаций, могут быть легко названы. (Подробнее об интел-
интеллектуальных операционных системах написано в гл. 5 этой книги.)
Заключая раздел, отметим, что одной из задач настоящей работы
автор видел в том, чтобы проиллюстрировать широкое распростра-
распространение систем, в которых локальная организация является более есте-
естественной, чем централизованная или децентрализованная организации.
В частности, в качестве моделей таких систем в книге фигурируют
коллективное поведение конечных и стохастических автоматов [Стефа-
нюк, 1963; Гинзбург и Стефанюк, 1970; Стефанюк, 1971а, 19896], ло-
локальное управление [Стефанюк В. Л., Цетлин, 1967; Стефанюк, 1968а,
1989в], интерактивные программные системы [Стефанюк, 1982а; Сте-
Стефанюк и Алексеева, 1986], «неглубокие» экспертные системы [Алексе-
[Алексеева и др., 1984; Алексеева и Стефанюк, 1984; Стефанюк, 19876, 1987г,
1988а], некоторые системы представления задач, знаний и обучения
[Stefanuk, 1973; Стефанюк, 1975; Жожикашвили, Стефанюк, 1986а,
19866] и ряд других (см. табл. 1.3).
Рассмотрение столь широкого спектра моделей обусловлено тем, что
каждый из указанных классов моделей порожден своей предметной
областью, создающей, как правило, оригинальные трудности в постано-
постановочном, методологическом и математическом планах. Объединяющим
началом в изучении этих моделей, которые обычно исследуются в книге
«до конца», является методология исследования локально-организован-
локально-организованных систем, описанная в следующем разделе.
1.3. Методика изучения локально-организованной
системы
Задачей исследователя локально-организованной системы может
быть либо изучение поведения существующей системы (анализ), либо
выбор наиболее адекватной системы из имеющегося набора вариантов
(при синтезе).
Каждая компонента в локально-организованной системе S стре-
стремится достичь своей цели G{, i = 1, . . . , п, независимо от действий
остальных компонент (или, по крайней мере, в максимально возможной
степени к ней приблизиться [Стефанюк, 1969]). Целью всей системы
при локальной организации является обеспечение нормального функ-
функционирования ее подсистем Si, а не достижение некоторой априорной
общесистемной цели г), поэтому критериями выбора варианта при син-
) Может быть, именно отсутствие общесистемной цели в традиционном
смысле дало повод авторам [Варшавский и Поспелов, 1984] отнести локально-
организованные системы в разряд систем, «которые никто не создавал».
1.3] Методика изучения локально-организованной системы 35
тезе системы могут быть такие соображения, как целесообразность,
живучесть, открытость, устойчивость, эластичность и др., изучению
которых в различных проявлениях и в различных предметных областях
посвящены многие разделы книги г).
Указанные критерии выбора модели локально-организованной си-
системы варьируются от одной группы задач к другой, их формулировка
и применимость при этом, как правило, определяются предметной
областью, каждая из которых требует достаточно глубокого исследо-
исследования. Приведем некоторые примеры.
— Понятие целесообразности коллективного поведения возникло
как непосредственное обобщение выдвинутого М. Л. Цетлиным
представления о целесообразном поведении одиночного автомата,
помещенного в случайную среду.
— Близким способом М. Л. Цетлин определил также свойство це-
целесообразности стековой памяти в своей модели «стопка книг»,
которое мы использовали в памяти со случайной выборкой эле-
элементов.
— Свойство живучести («война до последнего солдата») было отме-
отмечено рядом авторов в играх коллективов конечных автоматов.
— Свойство эластичности было введено в коллективах автоматов
с непрерывным множеством действий как добавочный критерий
качества работы устойчивой локально-организованной системы.
— Представление о выработке навыка возникло при локальном под-
подходе к решению механо-двигательной задачи управления манипу-
манипулятором в робототехнике.
— Другие примеры можно видеть в табл. 1.4.
Для того чтобы выделить полезные для практики критерии поведе-
поведения локально-организованной системы, необходимо было накопление
достаточного опыта применения локальной организации. В соответ-
соответствии с этим в книге представлена попытка максимально разнообра-
разнообразить изучаемые предметные области с тем, чтобы, с одной стороны,
убедиться в широкой распространенности и применимости принципов
локальной организации, а с другой — придать, где это возможно, кон-
конкретный вид обсуждаемым критериям и достигнутым результатам.
Чтобы дать формальное описание методики изучения локально-ор-
локально-организованной системы, введем следующие обозначения.
х) Здесь уместно воспользоваться следующей метафорой ([Моисеев, 1987,
с. 61]): «...у всех участников, помимо их индивидуальных и порой про-
противоречивых целей, есть какая-то общая цель, имеющая приоритет перед
остальными, как у тех путешественников, которых судьба свела в одной
лодке, плывущей по морю, и которым необходимо, чтобы лодка доплыла до
берега».
36 Общие принципы локальной организации систем [Гл. 1
Пусть {е^} — множество возможных действий подсистемы Si, i =
= 1,.. . , п,и пусть, как в [Стефанюк, 1973а], взаимодействие подсистем
в системе S описывается совокупностью функций fi(t) = ^(ei(t), . . .
... , en(?), ?), г = 1, . . . , п, где Vi(t) — эффект, получаемый подсистемой
Si, в момент времени t. Тогда изучение локально-организованной си-
системы S сводится к следующим основным этапам (см. также рис. 1.3
ниже):
I. Указание для каждого г локальной информации 1{ о системе S
в целом, доступной подсистеме Si в момент времени t. Обычно U
сводится к совокупности V{,ei в различные моменты времени, но
может содержать и некоторые дополнительные сведения, напри-
например, о числе подсистем п.
II. Указание для каждого г целевой функции G{(yi, e^).
III. Анализ для каждого г достижимости Gi в «стационарных усло-
условиях», т. е. когда остальные подсистемы не изменяют во времени
своих действий. Построение для стационарного случая подходя-
подходящего алгоритма функционирования подсистемы — правила выбо-
выбора действия е^(?), исходя из Gi и /^.
IV. Указание характера взаимодействия подсистем в рамках системы
S, например, путем задания функций щ(о),{ = 1, . . . ,п.
V. Анализ функционирования системы S как совокупного резуль-
результата действий ее подсистем Si, i = l,...,n по алгоритмам,
построенным на этапе III.
VI. Возврат к этапу I и пересмотр выборов, произведенных на каждом
из этапов, если функционирование системы в целом оказывается
в каком-то смысле неприемлемым либо для ее разработчика, либо
для составляющих систему подсистем (см. табл. 1.4).
На рис. 1.3 показано прохождение перечисленных этапов в случае
«итерации» системы по циклу анализа максимальной длины. Однако
на практике такая итерация обычно ведется по какому-либо внутрен-
внутреннему циклу, составленному из части указанных этапов (см. табл. 1.1).
Конкретизация понятий, использованных нами для описания ло-
локально-организованных систем, зависит от изучаемой предметной об-
области. Тем не менее, можно указать некоторые классы математических
моделей, в пределах которых такая конкретизация является более или
менее устоявшейся.
— Подсистемами являются детерминированные или вероятностные
конечные автоматы, причем взаимодействие в системе носит де-
детерминированный или вероятностный характер (коллективное
поведение, коллективное поведение автоматов, игры автоматов).
— Подсистемами являются автоматы с непрерывным множеством
действий, взаимодействие носит детерминированный характер
1.3] Методика изучения локально-организованной системы 37
III
IV
V
VI
Начало анализа
Указание доступной
локальной информации
Указание локальной
целевой функции Gl(vl,el)
Выбор алгоритма
функционирования
и анализ достижимости
в "стационарной среде"
Указание доступной
локальной информации 1п
Указание локальной
целевой функции Gn(vn,en)
Выбор алгоритма
функционирования
и анализ достижимости Gn
в "стационарной среде"
Указание характера
взаимодействия подсистем
системы S
"Нет" в Начало
Анализ функционирования
Внешние требования
к целесообразности S
Рис. 1.3. Последовательность этапов исследования локально-организованной
системы S
38
Общие принципы локальной организации
систем
[Гл. 1
Таблица 1.1. Основной итерируемый этап анализа
по схеме рис. 1.3
Дискретные
модели, гл. 2
Раздел
2.1
2.2
2.3
2.4
Этап
III
IV; V
I
Непрерывные
модели, гл. 3
Раздел
3.1
3.2
3.3
3.4
Этап
IV
IV
II
Искусственный
интеллект, гл. 4
Раздел
4.1
4.2
4.3
4.4
Этап
IV
II
II; III; V
V
Программирование,
гл. 5
Раздел
5.1
5.2
5.3
5.4
5.5
5.6
Этап
IV
III
IV; V
I; и
IV; V
Таблица 1.2. Основные методы исследования
локально-организованной системы, рассмотренные в книге
Дискретные мо-
модели, гл. 2
Непрерывные
модели, гл. 3
Искусственный
интеллект, гл. 4
Программирование,
гл. 5
Асимптотичес-
Асимптотический анализ с
ростом памяти;
приближенный
анализ с ростом
числа подсис-
подсистем;
исчерпывающее
моделирование;
комбинирован-
комбинированные методы
Устойчивость
в малом;
глобальная
устойчивость;
исследование
равновесных
точек;
анализ матри-
матрицы взаимодей-
взаимодействия;
имитационное
моделирова-
моделирование
Комбинаторные
методы;
эвристические
методы и прин-
принципы;
машинный экс-
эксперимент;
теория нечетких
множеств;
теория катего-
категорий;
теория обучения
Интерактивное про-
программирование;
символьное
рекурсивное
программирование;
локально-органи-
локально-организованные системы
знаний;
методы экспертных
систем;
интерактивные обу-
обучающиеся системы
(системы связи с многими пользователями, экономико-
математические модели).
Подсистемами являются конечные автоматы, но взаимодействие
носит «нечеткий» характер (экспертные системы).
Подсистемами являются фирмы или индивиды, вступаю-
вступающие в сложные товарно-денежные отношения (экономико-
математические модели).
Неоднородные технические системы, в которых участвуют люди
(человеко-машинные системы) или биосистемы [Крейн, 1986].
131
Методика изучения локально-организованной системы
39
— Подсистемами являются модули программы, вступающие во вза-
взаимодействие (интерактивные языки программирования высокого
уровня, системы искусственного интеллекта).
Таблица 1.3. Основные модели, предложенные и изученные
в книге
Дискретные мо-
модели, гл. 2
Коллектив ?-ав-
томатов;
модель сохране-
сохранения мнения при
голосовнии;
память со слу-
случайной выбор-
выборкой
Непрерывные
модели, гл. 3
Невзаимодей-
Невзаимодействующий кол-
коллектив;
коллективы с
устойчивос-
устойчивостью и эластич-
эластичностью;
содержатель-
содержательный критерий
устойчивого
взаимодей-
взаимодействия;
коллектив со
взаимопо-
взаимопомощью;
модель выра-
выработки навыка
Искусственный
интеллект, гл. 4
Построение инва-
инвариантных рас-
раскрасок;
локальное уп-
управление такси;
изоаритмическое
управление се-
сетью ЭВМ;
локальное созда-
создание новых пред-
представлений;
формирование
фреймов;
формальная схе-
схема представле-
представления знаний и
обучения;
объединение сви-
свидетельств;
принцип макси-
максимального дове-
доверия и принцип
максимума энт-
энтропии
Программирование,
гл. 5
Снятие рекурсии
при побочных эф-
эффектах;
рекурсивное вычис-
вычисление числовых
функций;
интерактивная сис-
система ЭКЛИСП;
интеллектуальная
операционная сис-
система;
система гибкого об-
обслуживания FLEX;
обучающаяся систе-
система поддержки вво-
ввода информации
PROMPTER;
выявление последо-
последовательности основа-
оснований ДНК;
активный фильтр
для Интернет
В рамках таких классов, определивших структуру данной книги,
используются разные модели (см. табл. 1.3) и приемы исследования
(см. табл. 1.2). Однако сформулированная выше методика изучения
локально-организованной системы остается неизменной.
Следует отметить также, что само различие таких классов обу-
обусловлено, главным образом, различием применяемого математического
аппарата, тогда как на содержательном уровне многие понятия, харак-
характеризующие целесообразность системы или ее элементов, оказываются
вполне аналогичными, а ряд результатов и методов — переносимыми
из класса в класс.
40
Общие принципы локальной организации систем
[Гл. 1
Таблица 1.4. Критерии целесообразности поведения систем,
использованные в книге
Раздел
книги
Критерий работы системы в целом
2.1
2.2
2.3
2.4
3.1
3.2
3.3
3.4
4.1
4.2
4.3
4.4
5.1
5.2
5.3
5.4
5.5
5.6
Максимум выигрыша
Асимптотическая оптимальность
Надежность сохранения «мнений»
Минимум среднего времени доступа
Глобальная устойчивость
Устойчивость в малом и глобальная устойчивость
Устойчивость и эластичность положений равновесия
Выработка навыка в механо-двигательной задаче
Упрощение представлений для решаемой задачи
Уменьшение времени выборки сложно организованных данных
Уменьшение времени узнавания ситуации за счет обучения
Максимальное доверие поступающим свидетельствам
Учет побочных эффектов, наглядность программирования
Интеллектуальность операционной системы
Гибкость обслуживания в системе Лисп
Ускорение и облегчение ввода информации оператором
Выявление последовательности оснований в ДНК
Снижение уровня вирусов и спама
1.4. Исторические предпосылки и краткая
библиография
Толчком к созданию моделей локально-организованных систем по-
послужила формулировка М.Л. Цетлиным в 1961 г. понятия целесооб-
целесообразного поведения автомата, помещенного в случайную среду. По су-
существу, она знаменовала отказ от традиционного отношения к техниче-
техническим и биологическим системам, принятому в теории систем. Прежние
постановки вопросов об оптимальной организации систем слишком
сильно сужали класс систем, поддающихся математическому моде-
моделированию и исследованию, и не позволяли изучать многие реально
полезные системы.
Первой широкой публикацией по локальной организации систем
явилась статья [Стефанюк, 1963]. В ней дана постановка задачи о кол-
коллективном поведении системы конечных автоматов и приведен резуль-
результат, полученный ранее в дипломной работе [Стефанюк, 1961], выпол-
выполненной под руководством М.Л. Цетлина *).
) В отзыве руководителя М. Л. Цетлин тогда отмечал:«... В. Л. Стефаню-
ком изучался интересный и совершенно неизученный вопрос о коллективном
поведении автоматов. Преодолев значительные математические трудности,
141
Исторические предпосылки и краткая библиография
41
Исследованная в [Стефанюк, 1961] и повторенная в [Стефанюк,
1963] математическая модель коллективного поведения пары автома-
автоматов возникла у автора при попытке осмыслить условия целесообразного
функционирования электронного макета «обучающейся машины» (см.
фото на рис. 1.4), изготовленного на кафедре физики колебаний физи-
физического факультета МГУ в 1957—1961 гг. в ходе выполнения дипломной
темы. (Подробности можно найти в публикации [Стефанюк, 1995].)
«г*
Рис. 1.4. Действующий макет обучающейся машины A957-1961)
В этой модели коллективное поведение автоматов определялось
как прямое обобщение понятия целесообразного поведения одиночного
автомата, предложенного М. Л. Цетлиным. Такое представление о кол-
коллективном поведении несколько отличалось, как отмечалось М. Л. Цет-
Цетлиным, от созданной позже теории игр автоматов [Крылов и Цетлин,
1963; Цетлин, 1963; Гельфанд и др., 1963], построенной первоначально
[Крылов и Цетлин, 1963] также, как и у нас [Стефанюк, 1963], на
примере двух автоматов с линейной тактикой х).
Действительно, в теории игр автоматов возможности коллективов
автоматов сравниваются с игрой матричного типа традиционной тео-
теории игр, для которой хорошо известны оптимальные стратегии и со-
соответствующие оптимальные значения выигрышей. Будучи матема-
ему удалось построить оригинальный пример асимптотически оптимального
поведения пары автоматов. Эти автоматы, взаимодействуя лишь через среду,
ведут себя (в пределе) не хуже, чем многие другие как угодно взаимодейству-
взаимодействующие между собой устройства. .. ».
) «К январю 1963 г. был сделан крупный шаг в развитии тематики — были
сформулированы основные положения игр автоматов и изучены простейшие
игровые модели» ([Варшавский, 1973, с. 21]).
42 Общие принципы локальной организации систем [Гл. 1
тически стройной, постановка задачи о поведении автоматов в игре
привлекла целый ряд исследователей, включая автора данной книги.
Дальнейший прогресс в области игр автоматов нашел отражение
в книгах [Варшавский, 1973] и [Варшавский и Поспелов, 1984]. С неко-
некоторых пор в области игр автоматов стало традицией использовать
приближенные методы анализа, опирающиеся на некоторые правдопо-
правдоподобные статистические гипотезы ([Волконский, 1965; Кринский, 1966]),
касающиеся «глубоких автоматов» ([Варшавский, 1973]). Нам показа-
показалось важным попытаться найти асимптотически точные методы ана-
анализа поведения коллектива автоматов, не прибегающие к подобным
гипотезам.
Соответствующий результат был получен на примере игр
^-автоматов: [Гинзбург и Стефанюк, 1970; Стефанюк, 1971а].
В работе [Плетнев, 1985] аналогичный развитому нами метод был
использован для получения асимптотически точных результатов для
игр асимптотически оптимальных последовательностей автоматов
типа автомата с линейной тактикой.
С другой стороны, в отечественной литературе шло накопление со-
содержательных постановок задач коллективного поведения автоматов,
связанных, главным образом, с попыткой его приложения в разнооб-
разнообразных реальных ситуациях. В этом плане нами были предложены
и изучены две модели коллективной памяти, связанные с моделиро-
моделированием надежного запоминания за счет коллективного функциониро-
функционирования многих элементов в рамках локальной организации системы:
[Стефанюк и Котляр, 1971; Котляр и Стефанюк, 1972], [Стефанюк,
1974; 1999].
Несомненно, что игра автоматов и коллективное поведение автома-
автоматов весьма близки и формально и по своей сути. Эта близость особенно
заметна в тех работах, в которых авторы, не ограничиваясь пробле-
проблемой получения оптимальных решений в теоретико-игровом смысле,
приводили детальное исследование поведения и в тех случаях, когда
указанный оптимум не достигался.
Для нас важно отметить, что коллективное поведение в исходной
его формулировке, данной в работе [Стефанюк, 1963], вообще говоря,
охватывает более широкий класс систем с локальной организацией,
чем игры автоматов, позволяя анализировать прикладные ситуации,
в которых игровая формулировка не является естественной.
Среди таких «прикладных» ситуаций можно указать реальную си-
ситуацию противоборства при обучении в каждой из четырех пар авто-
автоматов, составляющих сконструированную в [Стефанюк, 1961] «обуча-
«обучающуюся машину», моделью которой явилась задача о коллективном
поведении пары автоматов [Стефанюк, 1961, 1963] ]. Другим примером
явилась работа асинхронно-адресной системы связи, при моделирова-
моделировании которой нами рассматривалось коллективное поведение автоматов
с непрерывным множеством действий в детерминированной постановке
и непрерывным временем.
Первой публикацией по локальной организации систем с непре-
непрерывным временем и непрерывным множеством действий компонент
1.4] Исторические предпосылки и краткая библиография 43
явилась статья [Стефанюк, Цетлин, 1967] по локальному управлению
в коллективе радиостанций, написанная после трагической гибели Ми-
Михаила Львовича Цетлина в 1966 г. Эта работа положила начало серии
статей, приведших к защищенной в 1969 г. кандидатской диссертации
[Стефанюк, 1968в] г).
Говоря о локальной организации систем с непрерывным множеством
действий, следует отметить, что возникающие в этой постановке задачи
весьма близки к задачам теории управления, поэтому мы назвали этот
класс проблем коллективного поведения локальным управлением.
Развитие этих работ протекало следующим образом. После публи-
публикации [Стефанюк и Цетлин, 1967], содержащей исходную постановку
задачи, последовали наши публикации [Стефанюк, 1967, 1968а, 19686]
и [Стефанюк, 1968в, 1969], где на примере дробно-линейной зависи-
зависимости подсистем в локально-организованной системе, моделирующей
коллектив радиостанций, были поставлены и частично исследованы во-
вопросы устойчивости, вопросы выбора локального критерия и вопросы
эластичности.
Однако изложенные в [Стефанюк, 1969] результаты, полученные
для интересной, но частной модели взаимодействия и показавшие ак-
актуальность подхода, отнюдь не исчерпали проблематику коллективного
поведения систем с непрерывным множеством действий. Так, в работе
[Микийчук и Стефанюк, 1971] нами был поставлен и изучен вопрос
о «содержательных критериях» устойчивости локально-организован-
локально-организованной системы, в работе [Стефанюк, 19716] исследовались системы свя-
связи «с взаимопомощью», в работе [Стефанюк, 1973а] — системы без
взаимодействия, позволившие дать общую формулировку требованию
эластичности A973 г.), в статье [Стефанюк, 19736] исследовались свой-
свойства М-матриц, существенные для работы локально-организованной
системы.
Надо отметить, что за это время были получены также и некоторые
новые результаты [Стефанюк, 1989в; Stefanuk, 1993] для указанной вы-
выше модели с дробно-линейным взаимодействием, некоторые из которых
включены в данную книгу.
Близкие задачи решались и другими авторами. В 1969 г. В. И. Вар-
Варшавский сформулировал задачу о децентрализованном управлении при
распределении ограниченного ресурса [Варшавский и др. 1969], вклю-
включенную, наряду с некоторыми нашими результатами по локальному
управлению, в его книгу [Варшавский, 1973]. В связи с некоторыми эко-
экономическими моделями А. В. Малишевский, Ю. Д. Тенисберг в 1969 г.
выполнили работу по играм автоматов с непрерывным множеством
х) Между прочим, авторы обзора [Гельфанд и Прелов, 1978], отметив, что
относящиеся к началу 70-х годов работы Ковера, Слепяна и Вульфа (США)
знаменуют этап интенсивного развития работ по исследованию систем со мно-
многими пользователями, указали (см. [Гельфанд и Прелов, 1978, с. 145]):
«Многокомпонентные каналы с непрерывным временем рассматривались, по
существу, еще в работах В. Л. Стефанюка и М. Л. Цетлина [Стефанюк, 19716;
Стефанюк и Цетлин, 1967]».
44 Общие принципы локальной организации систем [Гл. 1
действий [Малишевский и Тенисберг, 1969]. Будучи еще участником
нашего семинара по теории автоматов в МГУ, А. В. Малишевский
в 1972 г. выполнил работу по глобальной устойчивости локально ор-
организованной системы [Малишевский, 1972], сведя требования устой-
устойчивости к наличию некоего единого ресурса для системы в целом —
некоторая альтернатива нашим «содержательным критериям».
Отталкиваясь от этих результатов, В. И. Опойцев написал в 1974—
1975 гг. серию статей [Опойцев, 1974—1975] о достижении равновесия
при коллективном поведении, где особое внимание было уделено авто-
автоматам с непрерывным множеством действий и с «недетерминирован-
«недетерминированным» алгоритмом поведения, а в 1977 г. — книгу на эту тему [Опойцев,
1977]. В. В. Андрусевич A981 г.) изучал поведение подобных автоматов
в системах с векторными элементами [Андрусевич, 1981].
Из зарубежных работ по коллективному поведению конечных ав-
автоматов можно отметить статью Т. Ковера и М. Хеллмана [Хеллман
и Ковер, 1970], где упоминается наша работа [Стефанюк, 1963], работу
Б. Чандрасекарана и Д. Шена [Chandrasekaran and Shen, 1969
стохастических автоматов, а из более поздних — работу
по играм
Takeushi,
Kitahashi, 1973], касающуюся игр автоматов с нулевой суммой. Аналоги
некоторых постановок задач локальной организации поведения систем
с непрерывным множеством действий можно встретить в зарубежной
математико-экономической литературе, например [Гейл, 1963; Карлин,
1964; Hicks, 1946], откуда нами были заимствованы отдельные методы
исследования.
Следует отметить, что некоторые задачи локальной организации
под различными названиями встречаются в исследовании операций
[Гермейер, 1971; Вентцель, 1988], теории игр, теории «целенаправлен-
«целенаправленных систем» [Месарович и Такахара, 1978], теории «активных систем»
[Цыганов, 1987] и др. Соответствующие публикации регулярно появля-
появляются на страницах таких журиалов, как «Автоматика и телемеханика»,
«Техническая кибернетика (Теория и проблемы управления)», «Кибер-
«Кибернетика», «Проблемы передачи информации» и др.
Начиная с 1973 г. нами были предприняты попытки перенести неко-
некоторые представления о локальной организации в область программиро-
программирования и искусственного интеллекта. Так, используя локальные свойства
языка программирования Лисп, мы построили на локальных принци-
принципах систему снятия рекурсии [Stefanuk, 1979], являющуюся обобще-
обобщением системы Т. Риша [Rish, 1973] на случай присутствия побочных
эффектов. Наша система, а также рекурсивный способ оценивания
несимвольных функций в языке Лисп изложены в гл. 5. Свойства
локальности программ были изучены также в работе [Back, Mannila,
1984].
Надо отметить, что особо сложные вопросы локальной организации
возникают в ЭВМ с параллельной архитектурой, примерами которых
могут служить так называемая коннекшн-машина, описанная в [Hillis,
1985] и [Фельдман, 1987], система транспьютеров [Хинтон, 1987], мно-
многопроцессорные вычислительные комплексы [Прангишвили, 1987] и др.
Однако к настоящему моменту эти вопросы еще недостаточно изучены
1.5] Выводы по главе 1 45
и поэтому не нашли отражения в данной книге, хотя в таких системах
локальной организации предстоит сыграть особо важную роль.
Результаты, собранные в гл. 4, с другой стороны, призваны пока-
показать, что рассмотрение систем как локально-организованных оказыва-
оказывается полезным при решении ряда фундаментальных задач искусствен-
искусственного интеллекта: выбор представления задач, максимально облегчаю-
облегчающего их решение, построение теории обучения и представления знаний,
построение рассуждений в достаточно простых экспертных системах.
Эти результаты были получены нами в работах, начиная с 1975 г.
В частности, вопрос представления задач исследовался на примере
проблемы «крепкий орешек», выдвинутой Дж. Маккарти [McCarthy,
1964]. Применение теории категорий в гл. 4 для описания обучения
в системах искусственного интеллекта было обусловлено вниматель-
внимательным исследованием вопроса о том, как построить достаточно общую
теорию комбинирования знаний в человеко-машинной системе (см. ра-
работы А. В. Жожикашвили, В. Л. Стефанюк, 1984-2002 гг.). Локальная
организация экспертной системы позволила сформулировать проблему
объединения нечетких свидетельств в виде некоторой экстремальной
задачи — максимизации степени доверия свидетельствам [Стефанюк,
19876].
К области программирования и искусственного интеллекта отно-
относятся также результаты, включенные в гл. 5. В ней описаны локально-
организованные системы, которые реализованы в виде замкнутых па-
пакетов программ и находят (или могут найти) практическое применение
в реальных ситуациях.
В частности, в этой главе кратко описана система ЭКЛИСП —
разработанная нами для мини-ЭВМ ЭКЛИПС операционная систе-
система Лисп. Описана система FLEX, обеспечивающая гибкую поддерж-
поддержку программисту на языке Лисп. Последнюю можно рассматривать
также как модель интеллектуальной операционной системы, которую
мы предложили в 1982 г. и которая дополняет совокупность идей,
обычно относимых к так называемому интеллектуальному интерфейсу.
Система PROMPTER, обеспечивающая подсказкой оператора, вводя-
вводящего в ЭВМ повторяющуюся информацию, была принята к внедрению
в морском порту при вводе грузовых документов. Эта система является
частным случаем системы обучения на языке теории категорий, опи-
описанной в предыдущей главе, напоминая по своим свойствам «систему
завершения» (completion), впервые использованную в машинном ре-
редакторе GNU Emacs [Stallman, 1986].
Приведенные в гл. 5 системы созданы с учетом целого ряда реаль-
реальных требований, характеризующих специфику приложения, и поэтому
в ней нет теоретических результатов общего характера, которые типич-
типичны для глав 2-4 книги.
1.5. Выводы по главе 1
1. Сделан обзор работ по теории систем, исследованию операций
и игровым децентрализованным методам, показывающий, что локаль-
локально-организованные системы представляют собой важную и естественно
46 Общие принципы локальной организации систем [Гл. 1
возникающую альтернативу централизованным и децентрализованным
системам. Показано место локально-организованных систем среди дру-
других математических моделей больших систем.
2. Показано, что локально-организованные модели позволяют эф-
эффективно расширить класс моделируемых реальных систем, включив
в анализ ряд современных распределенных систем связи с многими
пользователями, интеллектуальные операционные системы и др.
3. Изложена принятая в книге общая методика исследования ло-
локально-организованных систем, позволяющая с единых позиций рас-
рассматривать различные иерархии моделей локально-организованных си-
систем.
4. Приведенный краткий обзор литературы показывает, что научное
направление, развиваемое в книге, а именно локальная организация
технических систем, является актуальным, привлекает большое внима-
внимание многих исследователей и что автору книги принадлежат основные
работы, относящиеся к зарождению и становлению этого направления.
Глава 2
МЕТОДЫ ИССЛЕДОВАНИЯ ЛОКАЛЬНОЙ
ОРГАНИЗАЦИИ ПОВЕДЕНИЯ СИСТЕМ
В ДИСКРЕТНЫХ МОДЕЛЯХ
Данная глава посвящена разработке и иллюстрации методов, реко-
рекомендуемых для анализа локально-организованной системы S по схеме
рис. 1.3 в предположении конечности (или счетности) числа возмож-
возможных действий подсистем Si, i = 1, . . . ,п, системы S и дискретности
моментов времени, в которые допускаются изменения этих действий,
t = 0,1, ... Кроме того, предполагается, что каждая подсистема Si
представляет собой стохастический или конечный автомат, внутреннее
состояние которого может также изменяться в эти моменты времени
под влиянием получаемых данной подсистемой эффектов (штрафов),
связанных с действиями других подсистем.
В рамках перечисленных предположений могут быть использованы
следующие методы анализа поведения системы:
— анализ точных уравнений для финальных вероятностей;
— моделирование на ЭВМ представительной совокупности вариан-
вариантов;
— асимптотический анализ (с ростом глубины памяти);
— анализ потоков вероятности;
— приближенные методы (например, в предположении п —>• оо);
— комбинированные методы.
В исходных работах по коллективному поведению и играм авто-
автоматов, таких как [Стефанюк, 1963; Крылов и Цетлин, 1963; Цетлин,
1963], обычно использовался первый метод, но вскоре выяснились
его ограниченные возможности [Волконский, 1965; Кринский, 1966].
В настоящей главе на примере задач коллективного поведения будут
проиллюстрированы, главным образом, последние пять из названных
приемов.
Кроме того в этой главе будут описаны несколько новых задач кол-
коллективного поведения, выступающих в качестве характерных случаев
локально-организованных систем.
Особое внимание в этой главе уделено разработке и использованию
простых методов анализа, пригодных для широкого класса локально-
организованных систем, но не опирающихся на трудно проверяемые
статистические гипотезы, использованные в работах [Волконский, 1965;
48 Методы исследования локальной организации поведения систем [Гл. 2
Кринский, 1966] и др., посвященных «глубоким автоматам» [Варшав-
[Варшавский, 1973].
В разд. 2.1 изучается широкий класс задач коллективного поведе-
поведения стохастических автоматов, допускающих интерпретацию на языке
игр автоматов. В качестве Si здесь выступают ^-автоматы, конструк-
конструкция которых предложена еще М.Л. Цетлиным [Цетлин и Гинзбург,
1968], ожидавшим, что они будут более удобным математическим объ-
объектом, чем конструкции с линейно организованной внутренней памя-
памятью.
Этот автомат воспринимает на своем входе любые действительные
числа, а не только «штраф»/«нештраф», так что можно обойтись без
искусственной нормировки элементов матриц игры. (На самом деле,
на его вход могут подаваться «элементы» частично упорядоченной
совокупности любой природы.)
М.Л. Цетлин, к сожалению, не имел возможности до конца ис-
исследовать ^-автоматы. В работе [Цетлин и Гинзбург, 1968] проанали-
проанализировано свойство асимптотической оптимальности одного автомата
в стационарной и составной средах и на ЭВМ просмотрены некоторые
примеры игровых ситуаций. Полученные позже в работе [Гинзбург
и Стефанюк, 1970] и в работе [Стефанюк, 1971а] результаты говорят
о справедливости тех ожиданий, которые М.Л. Цетлин вкладывал
в конструкцию: асимптотическое (при е —>• 0) исследование игр таких
автоматов удается провести относительно просто, и, что самое главное,
не прибегая к статистическим гипотезам, характерным для работ [Вол-
[Волконский, 1965; Кринский, 1966] и др.
Еще М.Л. Цетлин и С.Л. Гинзбург показали [Цетлин и Гинзбург,
1968], что величина 1/е является аналогом глубины автоматов типа ав-
автомата с линейной тактикой. Поэтому проведенный в работе А. И. Плет-
Плетнева [Плетнев, 1985] анализ поведения автоматов с бесконечной памя-
памятью вполне аналогичен нашему изучению так называемых 0-автоматов
[Стефанюк, 1971а], (см. также п. 2.1.3 ниже).
Результаты, собранные в разд. 2.2, показывают, что во многих
случаях асимптотические свойства одиночных «глубоких» автоматов,
а иногда и их коллективов, могут быть просто проанализированы, при-
привлекая представление о потоках вероятности. Здесь же рассмотрены
важные соображения о достаточных условиях теоремы М.Л. Цетлина
об асимптотической оптимальности [Цетлин, 1963], позволяющие три-
тривиально оценить область асимптотической оптимальности в несколь-
нескольких интересных случаях.
Анализ имеющих важную практическую интерпретацию содержа-
содержательных задач, представленных в разд. 2.3 и 2.4, проводится с исполь-
использованием приближенных методов, получающих эвристическое оправ-
оправдание при п —} оо. Как и в разд. 2.1, основную роль в анализе играет
обнаруженная существенная разность времен формирования финаль-
финального состояния системы в целом и финального состояния некоторой
приближенной модели системы. Благодаря такому свойству заведомо
2.1] Асимптотический (с ростом глубины памяти) анализ 49
эргодическую систему S оказывается полезным моделировать с помо-
помощью неэргодической (разд. 2.3) и наоборот (разд. 2.4).
Другим обстоятельством в пользу приближенного анализа является
то, что в обеих рассматриваемых в разделах 2.3 и 2.4 задачах вероят-
вероятностный (случайный) фактор играет большую роль, делая естествен-
естественным предположение о «хорошем перемешивании». Во всяком случае,
проведенное в обоих случаях контрольное машинное моделирование
целиком подтверждает результаты, полученные приближенным мето-
методом.
Основные результаты были опубликованы нами в работах [Гинзбург
и Стефанюк, 1970; Стефанюк, 1971а; Стефанюк и Меерков, 1971; Сте-
фанюк и Котляр, 1971; Котляр и Стефанюк, 1972; Стефанюк, 1974;
Стефанюк и др., 1977; Стефанюк, 1979; Стефанюк и др., 1980; Стефа-
Стефанюк, 19896; Stefanuk, 1974]. Автору книги принадлежат постановки всех
задач, рассматриваемых в этой главе, и все использованные методы
исследования. Однако математические результаты пп.2.1.2и2.1.3 были
получены совместно С. Л. Гинзбург ([Гинзбург и Стефанюк, 1970]),
а вычисления на компьютере, использованные в разд. 2.3, были про-
проделаны совместно с СБ. Котляр [1971, 1972]. Опубликованная вместе
с С. Меерковым статья [1971] содержит два раздела, первый из которых
написан целиком С. Меерковым, а второй — автором.
В целом, настоящая глава показывает, что, наряду с методами ана-
анализа «глубоких» автоматов [Варшавский, 1973], перечисленные в ней
методы образуют достаточно полный пакет, позволяющий совершить
необходимое число циклов анализа системы S по схеме рис. 1.3. С дру-
другой стороны, приведенные в ней содержательные задачи показывают
широкую применимость локальной организации при построении слож-
сложных адаптивных систем из дискретных компонент Si.
2.1. Асимптотический (с ростом глубины памяти)
анализ
Хотя идеи коллективного поведения автоматов уже нашли обшир-
обширные применения, особенно в распределенных системах связи [Бутри-
менко и Лазарев, 1965; Лазарев и Саввин, 1973], теоретический анализ
этой области до конца не доведен: лишь в отдельных частных случаях
получены точные решения для финальных вероятностей состояний
системы. В остальных случаях авторы либо ограничиваются выбороч-
выборочным машинным экспериментом, либо прибегают к использованию при
анализе коллективного поведения некоторых гипотез статистическо-
статистического характера, которые выглядят достаточно правдоподобными, но их
справедливость пока не доказана [Волконский, 1965; Кринский, 1966].
Изучаемый в настоящем разделе ^-автомат является одним из
немногих примеров конструкций, для которых удается получить точ-
точные (асимптотически) результаты.
50 Методы исследования локальной организации поведения систем [Гл. 2
На примере игр ^-автоматов здесь рассмотрены два способа анализа
игровых ситуаций, характерные для локально-организованных дис-
дискретных систем: «исчерпывающее» машинное моделирование и асимп-
асимптотический (с ростом глубины памяти) анализ. Если первый, очевидно,
имеет ограниченную применимость, то второй, как показано, позволяет
изучить практически все важные игровые ситуации в коллективах е-
автоматов. Отметим, что в работе [Плетнев, 1985] ее автор в каком-то
смысле повторяет описываемую ниже методику в случае коллективов
автоматов типа автоматов с линейной тактикой [Цетлин, 1961].
2.1.1. Формулировка игры s-автоматов. Определим произвольную
игру п автоматов А\, . . . , Ап с числом действий (стратегий) соответ-
соответственно fti, . . . , пп. В каждый момент времени t = 0,1, . . . автоматы
независимо выбирают некоторые стратегии f^\t), . . . , f^n\t). Если
f(t) = (/^(t), . . . , f(n\t)) — партия, разыгранная автоматами в мо-
момент ?, то игра автоматов Г = F(v4i,. . . , Ап) считается заданной,
если каждой возможной партии f(t) сопоставлен вектор выигрышей
(a^(i), . . . , а(п)(?)), получаемых каждым автоматом в момент t. Пред-
Предполагается, что aSl\t) зависит только от партии f(t).
Игре автоматов Г можно сопоставить игру п лиц. Однако здесь
предполагается, что в каждый момент времени t = 0,1, . . . участникам
сообщается лишь их собственный выигрыш и неизвестны ни стратегии,
ни число партнеров, ни платежные матрицы участников этой игры.
Партией Нэша в игре автоматов Г называется такая партия /j* , . . .
... , /•* , в которой выигрыши автоматов удовлетворяют условию *)
Я ' ' ' ' ' Jjt-i ' h* ' JjUi ' ' ' ' ' h
Я
jt-i ' hi ' hUi ' • • • ' hi
выполненному для любого г и всех /j* , ji = 1, . . . , K{,i = 1, . . . , п.
В пп. 2.1.2, 2.1.3 будет предполагаться, что партия Нэша в игре Г
существует, единственная и что при /•* ф /• все эти неравенства —
строгие.
Нас будет интересовать финальная (при t —> oo) частота выбора
автоматами партии Нэша.
В качестве автомата — участника игры Г — рассмотрим ^-автомат,
имеющий к действий /i, . . . , fK. Автомат обладает способностью хра-
хранить в памяти величину выигрыша за действия, выбранные в после-
последовательные моменты времени t — 1 и t. Пусть эти действия — суть
f(t — 1) и f(t) и соответствующие им выигрыши суть a(t — 1) и a{t).
С вероятностью 1 — е @ < е < 1) автомат в момент t + 1 совершает то
) Партии Нэша суть точки Нэша в чистых стратегиях в классической
теории игр.
2.1] Асимптотический (с ростом глубины памяти) анализ 51
из действий f(t — 1) и /(?), выигрыш за которое был больше (если же
выигрыши были равны, то с вероятностью 1-е автомат совершает дей-
действие /(?)), а с вероятностью е — любое из к возможных действий 1).
Функционирование такого автомата в различных средах подробно
рассмотрено в [Цетлин и Гинзбург, 1968]. Там, в частности, установле-
установлено, что в стационарной среде эти автоматы образуют асимптотически
оптимальную последовательность при е —>• 0, т. е. параметр автомата
е играет роль величины, обратной глубине памяти конечного автомата
с целесообразным поведением.
Обозначим через </>i1,...,in]j1,...jn такое состояние коллектива из
п ^-автоматов, объединенных в игру Г, когда в момент t — 1 ими
была разыграна партия (/^ , . . . ,/^ ), а в момент t — партия
(fjl\. • • >/]Г})' **> 3k = 1, ...,Acfc, k = 1,. .. ,n. Легко видеть, что
эти состояния сменяют друг друга по закону простой цепи Маркова,
эргодической при е Ф 0. Следовательно, существует финальная ве-
вероятность ^ii,...,in;ji,...,jn состояний <l>i1,...,in]j1,...,jn, не зависящая от
начального состояния, а вместе с ней и финальная вероятность o"j1}...,jn
/ лA) хЫ\
партии (//! ,.-.,/)„)> где
*ii,..,i»= Е ••• Е гн,...,^,..^- B.1.1)
гх=1 in=i
При применении идеологии коллективного поведения автоматов
к задачам управления системами, состоящими из большого числа взаи-
взаимодействующих элементов, в ряде случаев удается исследовать задачу,
не слишком конкретизируя внутреннее устройство (скажем, матрицу
переходов) автоматов, участвующих в игре: достаточно указать, какие
действия может совершать каждый автомат, и предположить целесо-
целесообразность [Цетлин, 1961] его поведения, причем эту игру естествен-
естественно определить так, чтобы партии Нэша игры (которые выявляются,
как только указаны действия автоматов и закон их взаимодействия)
реализовали требуемые состояния управляемой системы. Например,
в работе [Бутрименко, 1966] показано, что одна из точек Нэша игры
в размещения автоматов с различной активностью и является точкой
максимального выигрыша — точкой Мора, в работе же [Стефанюк,
19686] удалось показать, что точка Нэша, выбор который решает по-
поставленную там задачу, всегда существует и единственна.
Возникает естественный для теории и важный для приложений во-
вопрос. Существуют ли конструкции автоматов, которые в рамках игры
автоматов (когда матрицы игры и действия партнеров ни одному из
автоматов не сообщаются, см. [Цетлин, 1963]) в достаточно широком
классе игр с наибольшей вероятностью разыгрывают партии Нэша?
) Будем говорить, что в последнем случае е-автомат «выбирает действие
по случайному закону». Таким образом, вероятность выбора действия по
случайному закону равна е.
52 Методы исследования локальной организации поведения систем [Гл. 2
Определенный интерес представляет существование конструкций ав-
автоматов, коллективы которых образуют асимптотически оптимальные
последовательности в том смысле, что вероятность партии Нэша стре-
стремится к 1, если эта партия в игре единственна.
В следующем п. 2.1.2 показано, что в игре двух лиц с единственной
партией Нэша с матрицами 2x2 ^-автоматы разыгрывают партию Нэ-
Нэша финально с вероятностью, близкой единице. Этот результат получен
несколько необычным образом — путем исчерпывающего моделирова-
моделирования (перебора) на ЭВМ всех игр такого типа, так что результат носит
«теоремный» характер,
В п. 2.1.3 показано, что при подсчете финальных вероятностей
различных партий в игре ^-автоматов [Цетлин и Гинзбург, 1968] веро-
вероятность одновременной смены действий двумя или более автоматами
можно с учетом особенностей конструкции таких автоматов считать
малой величиной при е —>• 0. Поэтому существенная информация
о финальном поведении игры содержится в так называемой вспомо-
вспомогательной цепи Маркова, состояниями которой являются партии игры,
причем допускаются лишь переходы, связанные с изменением действия
не более чем одним автоматом,
Часто эта вспомогательная цепь Маркова (которая легко строится
по платежным функциям игры) содержит все интересующие нас све-
сведения о финальном поведении автоматов в игре. Например, в случае
ациклической игры с одной партией Нэша [Гинзбург и Стефанюк,
1970] (см. п. 2.1.3) такая цепь Маркова не имеет других существенных
классов, кроме партии Нэша, откуда следует, что финально партия
Нэша (при е —ь 0) будет разыгрываться с вероятностью, стремящейся
к единице.
В п. 2.1.4 показывается, что исследование некоторых финальных
свойств игры с нулевой суммой, игр Гура и игры в размещения для
коллективов ^-автоматов также может быть проведено (при ? —)> 0),
с использованием упрощенного описания игры, даваемого вспомога-
вспомогательной цепью Маркова. В п. 2.1.5 приводится анализ вспомогательных
Марковских цепей, соответствующих этим играм, и делаются выводы.
2.1.2. Полный анализ на ЭВМ игры двух автоматов путем модели-
моделирования. Из описания конструкции ^-автомата следует, что все игры
^-автоматов с одной партией Нэша распадаются на конечное число
непересекающихся классов с фиксированным внутри класса отноше-
отношением упорядоченности элементов матриц выигрышей автоматов. Все
игры одного класса неразличимы в том смысле, что поведение авто-
автоматов в них будет одним и тем же. Это соображение позволило путем
моделирования на ЭВМ убедиться в том, что ^-автоматы при малых е
с наибольшей вероятностью разыгрывают партию Нэша во всех играх
двух автоматов с матрицами 2x2.
Не ограничивая общности, можно считать, что партией Нэша явля-
является партия A,1). Обозначим через aij выигрыш автомата Л, а через
bij — выигрыш автомата В в партии (г, j). Тогда из условия единствен-
единственности партии Нэша в игре получаем, что все такие игры ^-автоматов
могут быть разбиты на 5 групп:
2.1] Асимптотический (с ростом глубины памяти) анализ 53
I. CLu > a2l, «12 < «22, Ьц > 6i2, &21 > ^225
II. аи > а2Ь а12 = а22, Ьц > bi2, b2i > Ь22;
III. аи > а21, «12 > «22, Ьц > bi2, Ь21 < Ь225
IV. «и > «21, «12 > «22, Ьц > bi2, Ь21 = Ь22;
V. «и > «2i, «i2 > «22, Ьц > bi2, b2i > Ь22.
Мы допустили некоторый произвол, считая игрока А первым, т. е.
выбирающим строки своей матрицы, а игрока В — вторым, т. е. выби-
выбирающим столбцы. Если же сделать игрока В первым, а Л — вторым, то,
чтобы игра осталась прежней, нужно транспонировать матрицы игры.
При этом группа неравенств I перейдет в III. Это означает, что I и III
дают множества игр, отличающихся лишь нумерацией игроков. То же
самое справедливо для групп II и IV. Поэтому достаточно исследовать
лишь игры, удовлетворяющие соотношениям III, IV, V.
Если мы сумеем убедиться, что во всех играх из групп III, V пар-
партия Нэша разыгрывается с вероятностью, большей вероятностей всех
других партий, то это будет говорить о том, что характер соотноше-
соотношения между элементами b2i и Ь22 качественно не влияет на поведение
автоматов в игре. Следовательно, в этом случае нет необходимости
исследовать группу IV: здесь вероятность партии Нэша также будет
наибольшей.
Начнем рассмотрение с игр группы III. Перебирая всевозможные
матрицы игрока Л, можно заметить, что каждому соотношению нестро-
нестрогой упорядоченности ее элементов соответствуют два соотношения
строгого порядка, в одном из которых знак равенства между выде-
выделенными совпадающими элементами заменен на знак «больше», а в
другом — на знак «меньше», а упорядоченность остальных элементов
совпадает. Например, кроме неравенства ai2 > a22 = ац > a2i,
условиям группы III удовлетворяют строгие неравенства
«12 > «22 > «11 > «21, «12 > «11 > «22 > «21-
Во всех трех случаях
«12 > «11 > «21, «12 > «22 > «21-
Ниже будет показано, что во всех играх, матрицы которых удов-
удовлетворяют выписанным строгим неравенствам, партия Нэша разыг-
разыгрывается с наибольшей вероятностью, что означает, что соотношение
между элементами ац и а22 качественно не влияет на поведение авто-
автоматов и случай равенства этих элементов отдельного рассмотрения не
требует.
Таким образом, можно ограничиться рассмотрением лишь таких
игр, для которых элементы матрицы А (аналогично, конечно, и для В)
между собой строго упорядочены. Тогда имеем
«11 > «21 > «12 > «22, Ьц > bi2 > Ь22 > Ь21, Ьц > bi2 > Ь21 > Ь;
22,
54 Методы исследования локальной организации поведения систем [Гл. 2
«п > а12
«22,
«11 > «12 > «22 > «21,
«12 > «22 > «11 > «21,
«12 > «11 > «22 > «21,
«12 > «11 > «21 > «22,
> &11 > ^22 > &12,
> ^11 > ^12 > ^22
(каж:дое неравенство из первой колонки может сочетаться с любым
неравенством из второй и третьей колонок).
Это число игр можно еще сократить, учитывая следующее: а) если
первое действие одного из игроков дает ему больший выигрыш незави-
независимо от действия второго игрока, то второй игрок практически попа-
попадает в стационарную среду и в силу асимптотической оптимальности
^-автоматов [Цетлин и Гинзбург, 1968] при малых е выбирает действие
1; б) два соотношения вида 622 > 62i > 6ц > b\2 и ^22 > ^и > ^21 >
> Ь\2 заведомо дадут совпадающие матрицы переходных вероятностей
(это следует из тактики поведения ^-автомата *)) и, следовательно,
совпадающие результаты. После этих сокращений для матрицы игрока
А получаем два варианта:
2 4
1 3
и АB) =
4 2
3 1
и для матрицы В — шесть вариантов:
ВD) =
2
3
3
1
1
4
2
4
4 3
1 2
2 1
4 3
5C) =
5F) =
4
2
4
2
1
3
3
1
Итого 12 вариантов игр. Если в этих играх ^-автоматы образуют
асимптотически оптимальные последовательности, то из приведенных
рассуждений следует, что ^-автоматы образуют асимптотически оп-
оптимальные последовательности и во всех играх с матрицами 2x2
с единственной партией Нэша, определенной строгими неравенствами.
Все эти варианты были промоделированы на ЭВМ при е = 0,01, при
этом получены результаты, приведенные в табл. 2.1, где г означает
процент партий Нэша по отношению к общему числу в 100 000 партий.
Игра с платежными матрицами ^4A) и ВA) просчитывалась так-
также при различных значениях е: полученные результаты приведены
в табл. 2.2. На основании этих результатов при моделировании игры
) Для е-автомата имеет значение лишь то, что партия A,2) «хуже», а пар-
партия B,2) «лучше» любой из партий, в которых второй автомат совершает
действие 1, а соотношение между выигрышами в партиях, где автомат со-
совершает одно и то же действие, в силу его конструкции, роли не играет.
2-11
Асимптотический (с ростом глубины памяти) анализ
55
и было выбрано значение е = 0,01. (В программе использовался ге-
генератор псевдослучайных чисел, описанный в [Соболь, 1964].) Таким
образом, путем перебора на ЭВМ практически всех игр показано сле-
следующее.
Утверждение 1. Во всех играх двух лиц с матрицами 2x2
коллектив из двух ^-автоматов при достаточно малом е разыгрывает
единственную партию Нэша с вероятностью, близкой к единице.
Таблица 2.1. Результаты моделирования 12 вариантов игры при
? = 0,01
Вариант
игры
А{\)
А{\)
А{1)
ЛA)
ВA)
В{1)
ВC)
ВD)
г(%)
95,8
94,7
95,8
94,7
Вариант
игры
А{\)
А{\)
А{2)
А{2)
В E)
В F)
ВA)
В B)
г(%)
96,3
95,9
95,5
95,2
Вариант
игры
АB)
АB)
А{2)
А{2)
ВC)
ВD)
ВE)
ВF)
г(%)
96,1
94,6
96,0
96,2
Таблица 2.2. Моделирование одного варианта игры при
различных е
е
г{%)
0,5
36,1
0,25
52,6
0,1
76,6
0,01
95,8
Описанные результаты были получены в предположении, что пар-
партия Нэша (см. п. 2.1.1) определяется строгими неравенствами. В случае,
если точка Нэша единственна, но задается нестрогими неравенствами,
предыдущее утверждение, вообще говоря, уже неверно. В качестве
примера рассмотрим игру двух автоматов с такими платежными мат-
матрицами:
А =
В =
Решая в этом случае систему уравнений для финальных вероятно-
вероятностей, получаем, что при е —>• 0 выполняется ац —> 2/5, cri2, <72i, ^22 —>
-> 1/5.
2.1.3. Асимптотическая оптимальность последовательности кол-
коллективов s-автоматов в игре с одной партией Нэша. Ниже будем
считать, что каждый участник игры Г представляет собой ^-автомат,
причем е имеет одно и то же значение для всех автоматов, участвующих
в данной игре.
Тогда финальная вероятность crjlj...jn партии (/]х , • • • , /j™ ) (если
она существует) есть функция этого е. Обозначим через 7 некоторый
класс игр с единственной партией Нэша (/j* , . . . , /j* ).
Будем говорить, что коллектив из п ^-автоматов образует асимп-
асимптотически оптимальную последовательность в классе 7 ИГР Ц если
56 Методы исследования локальной организации поведения систем [Гл. 2
lim crj*,...,j* = 1 для всех игр этого класса. В дальнейшем будет
указан такой класс игр 7- Принятый метод исследования поведения
коллектива автоматов навеян, в определенном смысле, некоторыми
соображениями работ [Волконский, 1965; Кринский, 1966]. Пусть кол-
коллектив автоматов в момент t находится в произвольном состоянии
(Pi1,...,in]ju...jn- Рассмотрим сначала предельный случай е = 0. Тогда
можно говорить об игре 0-автоматов, каждый из которых может совер-
совершать одно из двух действий im, jm, т = 1, . . . , п. Если выигрыш при
выборе действия jm в момент t не меньше, чем выигрыш при выборе
действия im в момент t — 1, то т-й 0-автомат совершает в момент t + 1
действие jm; в противном случае его действием в момент ? + 1 является
im-
Нам потребуется следующая лемма.
Лемма 2.1. В произвольной игре 0-автоматов из любого началь-
начального состояния коллектив из п 0-автоматов не более чем за п +
+ 1 шаг обязательно перейдет в некоторое стационарное состояние,
в котором он будет находиться неограниченно долго.
Доказательство леммы приводится ниже в п. 2.1.6. Вернемся теперь
к игре ^-автоматов. Будем говорить, что в момент s произошел сбой,
если по крайней мере у одного из играющих автоматов выбор действия
происходит по случайному закону. Вероятность такого события равна,
очевидно, 1 — A — е)п. Средний интервал Т между сбоями равен Т =
= [i-(i-?)T-
Следующие определения тесно связаны с утверждением леммы.
Одиночным сбоем в момент s называется событие, состоящее в том,
что в этот момент ровно один автомат выбирает действие по слу-
случайному закону, а на отрезке времени от s - п — 1 до s - 1 сбои
отсутствуют. Вероятность одиночного сбоя pi = пе A — е)п +2п-15
средний интервал между сбоями Т\ = \пе A — е)п +2п~1] . Если е —>-
—» 0, то Т « 7\ & l/(rae), т. е. при достаточно малых е сбои происходят
достаточно редко и почти все (асимптотически) являются одиночными.
Кратным сбоем в момент s называется событие, состоящее в том,
что в этот момент происходит сбой, не являющийся одиночным. Веро-
Вероятность кратного сбоя, очевидно, равна
Поскольку р2 ~ s2n Bn2 + 3n —1)/2 при е —> 0, то средний интервал
между кратными сбоями (асимптотически) равен величине
т 2 1
п Bп2 + Зп - 1) е2 '
Отсюда следует, что выбором достаточно малого е можно добиться
того, чтобы выполнялись условия
Т2 > Ti « Т > п.
2-11
Асимптотический (с ростом глубины памяти) анализ
57
В этом случае в течение начальной части интервала между двумя
последовательными одиночными сбоями, согласно лемме *), почти все-
всегда будет успевать сформироваться одно из стационарных состояний
вида ^ii,...,in;ii,...,in? которое уже не будет меняться на последующей
(большей) части этого интервала, т. е. при достаточно малых е авто-
автоматы почти весь интервал между последовательными сбоями будут
разыгрывать одну и ту же партию.
Отсюда следует, что при малых е в интервале между двумя после-
последовательными кратными сбоями игра ^-автоматов может быть описа-
описана вспомогательной цепью Маркова, состояниями которой являются
лишь стационарные (см. лемму 2.1) состояния игры, имеющие вид
Состояния цепи, отвечающие партиям Нэша, при каждом одиноч-
одиночном сбое переходят в себя, и в стохастической матрице вспомогательной
цепи Маркова в соответствующей строке стоит 1 (по предположению,
точка Нэша задается строгими неравенствами). Таким образом, в этой
цепи партия Нэша — поглощающее состояние.
Если состояние не отвечает партии Нэша, то найдется такой оди-
одиночный сбой, при котором это состояние изменится на другое.
Если е достаточно мало, так что на интервале между последова-
последовательными кратными сбоями происходит достаточно много одиночных
сбоев, то приближенно можно говорить о финальном поведении вспо-
вспомогательной цепи Маркова на этом отрезке времени. Ясно, что если
ее поглощающее состояние достижимо из любого другого состояния,
то вероятность поглощающего состояния стремится к 1 на каждом
из интервалов между соседними кратными сбоями и, следовательно,
в этом случае финальная вероятность партии Нэша в игре коллектива
из п ^-автоматов близка к 1, если е достаточно мало.
Такие игры, для которых вспомогательная цепь Маркова содержит
ровно один существенный класс из одного элемента (партия Нэша),
назовем ациклическими играми с единственной партией Нэша. Тогда,
давая строгую формулировку приведенным выше соображениям, мож-
можно получить следующую теорему (схема ее доказательства содержится
в п. 2.1.6).
Теорема 2.1. Коллектив из п е-автоматов образует асимпто-
асимптотически оптимальную последовательность во всех ациклических иг-
играх с единственной партией Нэша.
Приведем платежные матрицы игры двух лиц, которая не является
ациклической, имея единственную партию Нэша:
А =
9 5 3
1 6 8
2 7 4
В =
9
3
5
1
8
6
2
4
7
В табл. 2.3 дана построенная по ним стохастическая матрица вспо-
вспомогательной цепи Маркова для этой игры.
) Очевидно, что на интервале между двумя последовательными сбоями
коллектив ^-автоматов ведет себя в точности так, как коллектив 0-автоматов.
58 Методы
исследования локальной
Таблица 2.3.
AД)
A,2)
A,3)
BД)
B,2)
B,3)
(ЗД)
C,2)
C,3)
(М)
1
1/6
1/6
1/6
0
0
1/6
0
0
организации
поведения систем
[Гл.2
Матрица переходов для вспомогательной цепи
Маркова
A,2)
0
1/3
0
0
0
0
0
0
0
A,3)
0
1/6
1/2
0
0
0
0
0
0
BД)
0
0
0
1/3
0
0
0
0
0
B,2)
0
1/6
0
1/6
5/6
1/6
0
0
0
B,3)
0
0
1/6
1/6
0
5/6
0
0
1/6
(ЗД)
0
0
0
1/6
0
0
1/2
0
0
C,2)
0
1/6
0
0
1/6
0
1/6
5/6
0
C,3)
0
0
1/6
0
0
0
1/6
1/6
5/6
Видно, что из множества партий B,2), B,3), C,2), C,3) партия Нэша
A,1) не может быть достигнута, т. е. если автоматы разыгрывают одну
из этих партий, то только кратный сбой может вывести игру из этого
множества.
Такое множество в известном смысле эквивалентно партии Нэша.
В дальнейшем каждое множество нескольких партий, обладающее тем
свойством, что игра, однажды попавшая в это множество, не может
быть выведена из него никакой последовательностью одиночных сбоев
(точнее, каждый класс из нескольких сообщающихся существенных
состояний вспомогательной цепи Маркова), будем называть циклом
(множеством) Нэша.
Поскольку матрица вспомогательной цепи Маркова строится по
платежным функциям игры, то естественным является вопрос, можно
ли прямо по платежным функциям установить, является игра ацикли-
ациклической или нет.
Рассмотрим этот вопрос для случая игры двух лиц (А и В) с произ-
произвольными платежными матрицами. Заметим, что если в игре имеется
цикл (множество) Нэша и (г, j) — партия, входящая в это множество,
то в него входит также и партия (гтах, j), где гтах — действие, которое
приносит игроку А наибольший доход при условии, что В выбрал дей-
действие j (т. е. партии (imax, j) отвечает элемент a^max j, максимальный
в j-м столбце матрицы игрока А).
Это связано с тем, что всегда найдется одиночный сбой, который
переведет партию (г, j) в партию (гтах, j). Точно так же в этот цикл
входит партия (г, jmax) (т. е. партия, которой отвечает элемент б^тах,
максимальный в г-й строке матрицы игрока В).
Поэтому можно указать, например, такое достаточное условие ацик-
ацикличности. Выделим в матрицах Л, В элементы, отвечающие наиболь-
наибольшему выигрышу игрока для каждого действия партнера. Соответству-
Соответствующие таким элементам партии будем для краткости называть макси-
максимальными. (В рассмотренном выше примере это партии B,2), B,3),
2.1] Асимптотический (с ростом глубины памяти) анализ 59
C,2), C,3), а также партия Нэша A,1).) Начиная с какой-либо из «мак-
«максимальных» партий, будем последовательно перебирать максимальные
партии, двигаясь по очереди по столбцам матрицы Л и по строкам В.
При этом пройденные строки и столбцы будем отмечать. Если на неко-
некотором этапе будет обнаружено, что одна из «максимальных» партий
повторяется подряд, то это и есть партия Нэша. В этом случае проце-
процедуру перебора следует повторить, начиная с какой-либо неотмеченной
«максимальной» партии и т. д., пока не будут отмечены все строки
и столбцы обеих матриц и во всех случаях перебор приведет в партию
Нэша 1). В последнем случае игра заведомо является ациклической
и для нее справедливо утверждение теоремы 2.1.
2.1.4. Асимптотическое описание произвольных игр е-автоматов.
В данном разделе рассматриваются другие примеры, когда для изуче-
изучения игры автоматов достаточно выписать и исследовать вспомогатель-
вспомогательную марковскую цепь. Это случаи, в которых вспомогательная цепь
либо содержит всего один существенный класс (игра с нулевой сум-
суммой), либо когда достаточно знать суммарную финальную вероятность
партий, входящих во все существенные классы этой цепи (игра Гура,
игра в размещения). С этой точки зрения рассматриваемые ниже игры
являются играми того же типа, что и ациклическая игра с единственной
партией Нэша.
Заметим, что в общем случае также можно построить упрощенное
описание игры ^-автоматов, позволяющее получить точные значения
(при е —> 0) финальных вероятностей различных партий. Такое упро-
упрощение будет связано с выписыванием по платежным функциям еще
одной стохастической матрицы (содержащей закон смены существен-
существенных классов вспомогательной цепи Маркова). Однако оказывается,
что ответ на ряд важных вопросов, возникающих при исследовании
традиционных примеров игр автоматов, удается получить без такого
детального описания.
В этом разделе будет приведена сводка необходимых теорем о со-
соотношении финальных вероятностей состояний вспомогательной цепи
Маркова и финальных вероятностей (при е —>• 0) различных партий
в игре ^-автоматов.
В п. 2.1.5 изучается структура существенных классов вспомогатель-
вспомогательных цепей Маркова, построенных для различных хорошо известных
примеров игр автоматов. Формально материал п. 2.1.5 не зависит от
содержания данного пункта. В конце п. 2.1.5 приведены краткие выво-
выводы, вытекающие из сопоставления результатов пп. 2.1.4 и 2.1.5.
Результаты этих двух разделов обсуждаются в небольшом заключи-
заключительном разделе, где сделаны основные выводы, касавшиеся рассмот-
рассмотренных игр ^-автоматов.
) Если в некоторой строке (столбце) имеется несколько элементов, мак-
максимальных в указанном выше смысле, то процедура перебора «ветвится»
и должна быть повторена для каждого из них в отдельности.
60 Методы исследования локальной организации поведения систем [Гл. 2
Заметим, что, вследствие специфического способа задания тактики
работы ^-автомата, даже задача записи системы уравнений для фи-
финальных вероятностей состояний B.1.1) в общем случае оказывается
весьма трудной. Однако вместо такого полного описания игры при е —>
—>• 0 можно пользоваться упрощенным описанием, которое в простей-
простейшем случае сводится к выписыванию вспомогательной цепи Маркова.
Состояниями этой вспомогательной цепи являются всевозможные пар-
/ ?A) лМ\
тии (/^ , • • • , JjJ) игры, причем переходная вероятность pij отлична
от нуля лишь для таких двух состояний (партий) цепи (/^ , . . . , f\ )
и (/jx , • • • , /j™ )> которые отличаются стратегией не более чем одного
игрока (например, /с-го), и для этого игрока выполняется соотношение
B12)
(т. е. для k-ro участника «^»-я партия по крайней мере не менее выгод-
выгодна, чем «г»-я).
Недиагональные элементы вспомогательной цепи Маркова для пе-
перехода между партиями, удовлетворяющими B.1.2), равны 1/(пп^)^
а диагональные элементы определяются из условия стохастичности.
Связь между игрой ^-автоматов и ее вспомогательной марковской
цепью устанавливают следующие теоремы (они доказываются анало-
аналогично теореме 2.1).
Теорем а 2.2. В произвольной игре е-автоматов суммарная фи-
финальная вероятность всех партий игры, не входящих в существенные
классы вспомогательной цепи Маркова, при е —> 0 стремится к нулю.
Теорем а 2.3. В игре е-автоматов, вспомогательная цепь Мар-
Маркова которой содержит ровно один существенный класс, финальные
вероятности партий при е —> 0 стремятся к финальным вероятно-
вероятностям соответствующих состояний этой вспомогательной марков-
марковской цепи.
Следующая теорема, по существу, ограничивает область приме-
применения упрощенного описания, основанного на вспомогательной цепи
Маркова.
Теорем а 2.4. Суммарная финальная вероятность партий, вхо-
входящих в каждый из существенных классов вспомогательной цепи
Маркова, не стремится к нулю при е —>• 0.
2.1.5. Свойства вспомогательных цепей Маркова, построенных для
некоторых примеров игр.
Теорема 2.5. Вспомогательная цепь Маркова для игры двух лиц
с нулевой суммой содержит ровно один существенный класс.
Доказательство. Вспомогательная цепь Маркова всегда содер-
содержит по крайней мере один существенный класс I. Предположим теперь,
что имеется еще один существенный класс I7, отличный от I (т. е. I и V
не имеют общих элементов).
2.1] Асимптотический (с ростом глубины памяти) анализ 61
Обозначим через aij выигрыш первого участника в партии (г, j). Из
определения вспомогательной цепи Маркова и существенного класса
марковской цепи вытекают следующие неравенства:
если (г, j) G I, (г*, j) ^ I, то a{j > a{*j, B.1.3)
если (г, j) G I, (г, j*) ^ I, то a{j < a{j*. B-1.4)
Аналогичные неравенства выполняются и для I'.
По предположению I, I' не пусты, а их пересечение пусто. Возьмем
(г, j) G I, (&,/) G I'. Партии (/с, j) и (г,/) могут оказаться в том или
ином классе I, V (причем каждая только в одном из классов), либо ни
в том, ни в другом. Покажем, что любое такое расположение партий
(k, j), (г, /) приводит к противоречию.
Во-первых, ни одна из партий (/с, j), (г, /) не может оказаться в I или
V. Действительно, пусть, например, (&, j) G I, тогда из B.1.4) получаем:
так как (k,l) G I', {k,j) ? I', то аы < akj,
B.1.5)
а так как (к, j) G I, (&, /) ^ I, то a/,j < a/./.
Остается рассмотреть лишь случай, когда (к, j) ^ I, V и (г, /) ^ I, I'.
Но тогда из B.1.3). B.1.4) имеем:
так как (к, 1) G I', (к, j) ? I', то aki < akj,
так как (к, I) G I', (г, /) ^ I', то аы > ац\
B.1.6)
так как (г, j) G I, (/г, j) ? I, то ai<7- > akj,
так как (г, j) G I, (г, /) ^ I, то а^- < а^/.
Отсюда получаем а^- < сц/ < a/,j < aij.
Таким образом, предположение о том, что найдется два существен-
существенных класса I, V привело к противоречию, т. е. вспомогательная цепь
Маркова имеет ровно один существенный класс. Теорема доказана.
Заметим, что, поскольку соотношения B.1.3), B.1.4) выполняются
и для игр двух лиц с постоянной суммой, утверждение теоремы 2.5
остается верным и для игр этого класса.
Теорема 2.6. Каждый существенный класс вспомогательной це-
цепи Маркова для игры в размещения (или игры Гура), все партии Нэша
которой задаются системой строгих неравенств, содержит ровно
один элемент, причем множество существенных классов цепи сов-
совпадает с множеством партий Нэша этой игры.
Доказательство для игры в размещения.
Для доказательства удобно построить некоторую однозначную пару
функций от партии, напоминающую по своим свойствам функцию
Ляпунова. Рассмотрим произвольную партию игры т = (mi, . . . , тк).
62 Методы исследования локальной организации поведения систем [Гл. 2
где га — число автоматов, совершающих 1-е действие. Пусть s,k —
номера таких действий (номера «кормушек»), что выполняется
±-= min ^, B.1.7)
ms z=i,...,k mi
^—- = max l—— = Л(га).
mk + 1 /=!,...,« m/ + 1
Число различных значений /, при которых величина а//(га/ + 1)
в B.1.8) равна Л(га), назовем кратностью величины Л(га) и будем
обозначать символом А (га). Рассмотрим теперь партию га/ = (rai, . . .
... , ms — 1, . . . , га/, + 1, . . . , гак), которая возникает в случае, если
один из игроков, совершавших s-e действие в партии т (получавший,
согласно B.1.7) наименьший доход), меняет его на действие к (дающее
ему наибольший доход при условии, что ни один другой игрок действия
не меняет).
Возникают два различных случая в зависимости от того, является
исходная партия га партией Нэша (случай А) или нет (случай Б):
А. Из определения партии Нэша и условия, что все партии Нэша
игры удовлетворяют строгим неравенствам, следует, что из пар-
партии Нэша нельзя перейти по вспомогательной цепи Маркова ни
в какую другую партию, т. е. каждая партия Нэша является суще-
существенным классом этой цепи (содержащим ровно один элемент).
Б. Если партия т не является партией Нэша, то верно неравенство
^- < -^—=А{т). B.1.9)
ms mk + l v ; у J
Таким образом, выигрыш игрока, сменившего действие при перехо-
переходе от партии га к партии га', возрос и, следовательно, такой переход
допускается вспомогательной цепью Маркова. Учитывая B.1.9), имеем
неравенство
Л(га) = max
/=!,...,« mi + 1
= max <^ —^ , — , max —^— } ^ A(ra), B.1.10)
I mk + 2 ?ns l=i,...,n;l^s,k mi + 1 I
причем, если Л(га') = Л(га), то, очевидно, Л(га) = max и,
согласно B.1.8), имеем
Л(га') = Л(га) - 1 < Л(га). B.1.11)
Итак, либо партия га является партией Нэша, либо можно указать
такую партию га', переход к которой допускается вспомогательной
2.1] Асимптотический (с ростом глубины памяти) анализ 63
цепью Маркова. При этом партии га и га/ в силу B.1.10), B.1.11) не
могут совпадать.
Аналогично, либо партия га/ является партией Нэша, либо по пар-
партии га/ можно построить партию т" (так же как по га была построена
партия га'), переход к которой допускается вспомогательной цепью
Маркова. Поскольку в последнем случае снова либо Л(га") < Л(га/),
либо выполняется Л(га") = Л(га/) и \{т") < А(га/), то партия т" не
совпадает с га/ и, очевидно, с партией га.
Рассуждая аналогично, можно построить цепочку не совпадающих
между собой партий га, га/, т", . . ., переходы вдоль которой допуска-
допускаются вспомогательной цепью Маркова. Но в силу конечности полного
числа различных партий в игре в размещения эта цепочка имеет ко-
конечную длину, причем последняя партия в этой цепочке непременно
является партией Нэша (в противном случае цепочку можно было бы
продолжить). Таким образом, показано, что для произвольной партии
га имеется цепочка переходов, допускаемых вспомогательной марков-
марковской цепью, ведущая в одну из партий Нэша, тогда как дальнейшие
переходы из партии Нэша невозможны. Отсюда множество существен-
существенных классов вспомогательной цепи Маркова для игры в размещения
совпадает с множеством партий Нэша. Теорема доказана.
Доказательство для игры Гура.
Пусть га — произвольная партия игры Гура, где га обозначает число
игроков, совершающих в этой партии первое действие. Если партия га
является партией Нэша, то для нее выполняется
а(т) > а(т + 1), а(т) > а(т - 1) B.1.12)
(здесь через а (га) обозначен выигрыш каждого из игроков в партии
га).
Партией Нэша является также партия п, если для нее верно
а(п) > а(п- 1) B.1.13)
и партия 0, если для нее верно
а@) > аA). B.1.14)
Соотношения B.1.12) (равно как B.1.13) или B.1.14)) показывают,
что каждая партия Нэша игры Гура является отдельным существен-
существенным классом вспомогательной цепи Маркова. Если же га не является
партией Нэша, то верно, по крайней мере, одно из следующих нера-
неравенств:
а(т) < а(га + 1), B.1.15)
а(га) < а(га-1). B.1.16)
Если, например, справедливо неравенство B.1.15), то либо партия
га + 1 является партией Нэша, либо выполняется а (га + 1) < а (га + 2).
В последнем случае либо партия га + 2 является партией Нэша, либо
для нее верно а (га + 2) < а (га + 3) и т. д. Таким образом, если для
64 Методы исследования локальной организации поведения систем [Гл. 2
партии га выполняется B.1.15), то можно построить цепочку партий
r7i,r7i + l,77i + 2,..., допускаемую вспомогательной цепью Маркова,
так как выигрыш игрока, меняющего действие, вдоль такой цепочки
строго возрастает. Эта цепочка имеет, очевидно, конечную длину. За-
Заканчивается она партией Нэша вида B.1.12), либо партией Нэша вида
B.1.13).
Заметим, что если выполняется неравенство B.1.16), то можно было
бы построить цепочку га, га — 1, га — 2, . . . партий, переходы между ко-
которыми допускаются вспомогательной цепью Маркова. Такая цепочка
заканчивается партией Нэша вида B.1.12) либо вида B.1.14). Отсюда
все партии, отличные от партий Нэша, являются несущественными
состояниями вспомогательной цепи Маркова. Теорема доказана.
Несимметричная игра Гура [Шнейдерман, 1984] отличается от
обычной игры Гура [Цетлин и Гинзбург, 1968] тем, что выигрыш,
получаемый игроком в данной партии ттг, зависит от номера соверша-
совершаемого им действия. При этом предполагается, что выигрыш аУ~'(т)
(см. кривую 1 на рис. 2.1) в партии га игрока, совершающего первое
действие, и выигрыш а^2\т) (кривая 2) игрока, совершающего второе
действие, являются соответственно монотонно возрастающей и моно-
монотонно убывающей функцией га, графики которых пересекаются в точке
ган (см. рисунок).
Теорема 2.7. Каждый существенный класс вспомогательной це-
цепи Маркова несимметричной игры Гура содержит ровно один эле-
элемент, причем множество существенных классов совпадает с мно-
множеством партий Нэша этой игры.
Доказательство вытекает из того соображения, что если га > ган,
то, согласно рис. 2.1, можно указать цепочку партий га, га — 1, ттг — 2,
выигрыш вдоль которой возрастает для игрока, меняющего действие,
т. е. такая цепочка переходов допускается вспомогательной цепью Мар-
Маркова. Кончается эта цепочка партией ган. Аналогично в случае га <
< ган. Заметим в заключение, что не для всех симметрических игр
[Цетлин, 1969] вспомогательная цепь Маркова обладает такой простой
структурой, как в случае игры в размещения и игр Гура. Ниже приве-
приведена пара платежных матриц, отвечающая примеру симметрической
игры двух лиц, вспомогательная цепь Маркова которой содержит два
существенных класса по четыре партии в каждом и один существенный
класс из одного элемента — партии Нэша:
9 5 3 0 0
0 0 0 8 6
0 0 0 4 7
16 8 0 0
2 7 4 0 0
9 0 0 12
5 0 0 6 7
3 0 0 8 4
0 8 4 0 0
0 6 7 0 0
Таким образом, из приведенных теорем вытекает, что финальные
вероятности различных партий в игре с нулевой суммой асимптоти-
2-11
Асимптотический (с ростом глубины памяти) анализ
65
а(\т)
О
Рис. 2.1. Выигрыши за первое A) и
за второе B) действия в несиммет-
несимметричной игре Гура
чески (при е —>• 0) совпадают
с финальными вероятностями этих
партий, вычисляемыми по вспомо-
вспомогательной цепи Маркова, переход-
переходные вероятности которой уже срав-
сравнительно просто выписываются по
платежной матрице. Заметим, что
прямое исследование игры с нуле-
нулевой суммой даже в случае двух ав-
автоматов с произвольной матрицей
2x2 наталкивается на значитель-
значительные трудности.
В случае игры в размещения
и игр Гура получаем, что суммар-
суммарная финальная вероятность множе-
множества всех партий Нэша стремится
к единице, если е —>• 0. В частности, если функция выигрыша в игре
Гура, как это обычно и предполагается, имеет на отрезке [0, п] един-
единственный максимум в точке тн, то финальная вероятность партии
(точнее, инвариантного множества партий ган [Цетлин, 1969]) для
коллектива ^-автоматов при е —>• 0 стремится к единице.
2.1.6. Доказательство леммы и теоремы 2.1.
1. Доказательство леммы 2.1. Заметим, что из тактики смены
действий 0-автомата следует, что если в два последовательных момента
времени некоторый 0-автомат совершает одно и то же действие, то он
будет совершать это действие и во все последующие моменты времени,
независимо от действий партнеров.
Пусть в начальный момент времени коллектив 0-автоматов нахо-
находится в произвольном состоянии (Pi1,...,in;j1,...jn- Если игра такова, что
действия, совершенные автоматами в момент ?, оказались «выгодны-
«выгодными» (т. е. выигрыш не уменьшился) для всех автоматов по сравнению
с действиями, предпринятыми в момент t — 1, то уже в момент t + 1
установится стационарное состояние.
С другой стороны, если действия, совершенные автоматами в мо-
момент ?, оказались невыгодными для всех автоматов, то состоянием
в момент t-\-l будет (Pj1,...jn-,i1,...,in, которое в момент t + 2 обязательно
перейдет В СОСТОЯНИе ^г1,...,гта;г1,...,гта-
В промежуточном случае, когда в момент t + 1 т автоматов будут
вынуждены сменить действие, а остальные п — т автоматов свои
действия сохраняют, мы получаем редуцированную игру т ^ п — 1
автоматов.
Поскольку с каждым шагом либо происходит редукция к игре
с меньшим числом участников, либо формируется «стационарное» со-
состояние (либо формируется состояние, которое непременно в следую-
следующий момент перейдет в стационарное), то очевидно, что число шагов,
гарантирующее переход в такое состояние, когда автоматы перестают
менять свои действия, не больше п + 1. Лемма доказана.
3 Стефанюк
66 Методы исследования локальной организации поведения систем [Гл. 2
2. Доказательство теоремы2.1
Пусть Г — ациклическая игра и пусть Pe{<Pi1,...,in-jli...jn{t)} — ве~
роятность определенного состояния коллектива ^-автоматов в момент
t. Покажем, что для любого 5 > 0 найдется такое е > О, что
I. Элементами матрицы вспомогательной цепи Маркова являются
числа, не зависящие от ?, а сама цепь, в случае ациклической игры
с единственной точкой Нэша, содержит ровно один существенный класс
из одного элемента. Поэтому для любого 5i > 0 найдется такое N(Si),
что независимо от начального состояния этой цепи средняя доля време-
времени, в течение которого цепь будет находиться в состоянии, отвечающем
партии Нэша, по истечении N(Si) шагов будет не меньше A — Si).
II. Для любого малого #2 > 0 найдется такое 772, что при е ^ г/2
с вероятностью не меньше A — 82) в интервале между двумя последо-
последовательными кратными сбоями произойдет не менее N(Si) одиночных
сбоев. Это вытекает из двух положений.
а) Для любого 52 найдется такое rj2, что с вероятностью не меньше
A — S'2) интервал времени между последовательными кратными сбоями
при всех s ^ rjf2 окажется не меньше величины N(Si)/ (пе3'2). Действи-
Действительно, пусть кратный сбой произошел в момент t = 0 и пусть q2(t),
P2(t) — соответственно вероятность того, что кратный сбой произошел
в следующий раз (после t = 0) в момент ?, и вероятность кратного сбоя
в момент t. Очевидно, P2{t) = Р2 при t ^ п + 2 и р2{Ь) = 1 — A — е)п
при 1 ^ t $J n + 1. Поэтому имеем цепочку соотношений, приводящих
к нашему утверждению:
t=l t=l
7Х?
+ A - п))р2 ^0 при е -»¦ 0
(здесь верхний предел суммирования а = —^-^ + 1).
б) Для любого 62 найдется такое 77^, что при е ^ 7727 вероятность
того, что в течение N(Si)/(ns^'2) моментов времени произойдет не
меньше N(Si) одиночных сбоев, будет не меньше A — E2/)- Действи-
Действительно, можно показать, что дисперсия интервала между одиночными
сбоями а2 равна а2 = A - Bп + 3)pi)/pl и а2 « Т при е —>> 0.
Тогда, согласно неравенству Чебышева, вероятность того, что интервал
между соседними одиночными сбоями превзойдет 1/(п?3/2), становит-
становится сколь угодной малой при е —>• 0. Отсюда вероятность того, что
конечное число сбоев N(Si) займет время большее, чем NEi)/(n?3/2),
становится сколь угодно малой при е —>• 0. Остается в качестве щ
выбрать min G72,772M а в качестве ^2 — сумму д2 + 82.
2.2] Анализ потоков вероятности 67
III. Пусть QH(M),T2(M) — число партий Нэша и длина интер-
интервала между кратными сбоями соответственно, усредненные по всем
интервалам между соседними кратными сбоями, содержащими ровно
М одиночных сбоев. Пусть Р(М) — распределение таких интервалов.
Теперь достаточно показать, что при е —>• 0 выполняется
оо
? {T2(M)-QH(M)}P(M)
Т2(М)Р(М)
М=0
т. е. что относительная доля партий, не являющихся партией Нэша,
мала при е —ь 0.
Согласно I и II имеем
? ^(М) E [T2(M)-QH(M)}P(M)
г М=0 , M=W(<5
02-55 1
М=0 , M=W(<5i) _ г >/ , >//
1<Ы + ?
Е Е Т2(М)Р(М)
М=0 M=7V(<5i)
Малость ?' (при 5^0) вытекает из того, что Т<± ~ 1/^2, а числитель
здесь имеет порядок const 8\/e.
Малость ?"можно показать, рассматривая условное среднее чис-
число партий Нэша при фиксированных М, моментах одиночных сбоев
и фиксированном стационарном состоянии, которое имеется к моменту
первого одиночного сбоя. Тогда, учитывая I и усредняя по всем интер-
интервалам между сбоями, можно получить, что ?" —> 0 при е —> 0. Отсюда
вытекает утверждение теоремы.
2.2. Анализ потоков вероятности
При определении понятия целесообразного поведения одного ав-
автомата в случайной среде и игр (коллективного поведения) автома-
автоматов обычно исследуется финальное (при t —>• оо) поведение системы.
При этом прежде всего доказывается эргодичность изучаемого веро-
вероятностного процесса, что позволяет выписать, как это было сделано
в самых первых работах в этой области [Цетлин, 1961; Стефанюк, 1961],
для финальных вероятностей соответствующую систему алгебраиче-
алгебраических уравнений. Из последней сначала определяют финальные вероят-
вероятности отдельных состояний элементов системы, а затем — суммарные
финальные вероятности их действий.
Хотя системы алгебраических уравнений для финальных вероят-
вероятностей в случае типичных примеров автоматов, обладающих целесо-
целесообразным поведением, решаются достаточно легко, в настоящем па-
параграфе будет показано, что исходные уравнения принимают особо
простую форму, если воспользоваться условиями равенства «потоков
вероятности», что позволяет сосредоточиться на этапе III рис. 1.3.
68 Методы исследования локальной организации поведения систем [Гл. 2
Прежде чем формулировать наше утверждение и приводить приме-
примеры, отметим, что наш результат уточняет принцип «детального равно-
равновесия», высказанный Ю. И. Шмуклер в докладе «Методы статистиче-
статистической физики в задачах коллективного поведения» B-я школа-семинар
«Вероятностные автоматы и их приложения», г. Львов, 1971 г.). Крат-
Краткое изложение этого доклада и развернувшейся по нему дискуссии
имеется в [Стефанюк, 1971в].
Рассмотрим произвольную простую эргодическую цепь Маркова,
имеющую п состояний и матрицу переходов ||pij||™- Пусть ri, . . . , гп —
финальные вероятности этой цепи, которые существуют в силу указан-
указанной эргодичности.
Пусть множество всех состояний цепи {п} разбито произвольным
образом на два непересекающихся подмножества таким образом, что
{n} = {ni} U {п2\. Определим через R\2 и ^2,1 суммарные финаль-
финальные «потоки вероятности» из первого множества во второе и обратно
следующим образом (см. [Cover and Helman, 1970], где приводится
формулировка идущей ниже леммы без доказательства):
Лемм а 2.2. Потоки вероятности сбалансированы, т.е. R\^ —
— #2,1-
Доказательство. Не уменьшая общности, перенумеруем все со-
состояния Марковской цепи при выбранном разбиении на подмножества
{ni}, {^2} таким образом, чтобы все состояния, входящие в подмно-
подмножество {гм}, получили номера 1, . . . , /с, где к — число элементов этого
подмножества. При этом остальные элементы исходного множества {п}
получают номера к + 1, . . . , п.
Как известно, финальные вероятности всей цепи г\, . . . , гп удовле-
удовлетворяют соотношению
п
ri = YsrjPji (г = l,...,n).
i=i
Выделим отсюда состояние г:
п
^ji =0 (г = 1,...,тг).
Учитывая стохастичность матрицы ||Pij||^\ т-е- X Pij =
(г = 1, . . . , гг), раскроем A — ри) в предыдущем соотношении:
п п
= ° (г = 1, . . . , гг).
2.2] Анализ потоков вероятности 69
Далее, чтобы перейти к потокам вероятности, просуммируем пер-
первые к из предыдущих уравнений. Получаем
к к к п к к к п
-ЕЕ ^рц ~ЕЕ rjPij + Е Е rwji + Е Е гзри = °-
i=l j = i i=lj = k + l г = 1 з = 1 i = lj = k + l
j?i 3&
Покажем, что первый член по модулю равен третьему (это — «внут-
«внутренние» потоки вероятности):
к к к к к
Е Е riPiJ = Е Е ГЗРЦ ~ Е riPH =
г = 1 э = 1 г=1 j = l г = 1
З'Ф*
к к к к к
= Е Е riPii - Е riPa = Е Е riPi*-
7 = 1 г = 1 г = 1 г=1 J = 1
(Здесь сделана эквивалентная замена индексов суммирования i <-)- j
и изменен порядок суммирования.) В силу этого имеем из предыдущего
уравнения, что
к п к п
~ЕЕ гзРл + Е Е гзРл = °-
г=1 j = fe + l г = 1 j = fe + l
Лемма доказана.
Лемма 2.2 позволяет значительно упростить вычисления финаль-
финальных вероятностей и их сумм для хорошо известных автоматов, сни-
снижая на порядок степень соответствующего разностного уравнения. Ее
полезность вызвана тем, что внутренняя структура этих автоматов
является почти всюду однородной, и фактическое число состояний,
участвующих в уравнении баланса потоков вероятности, мало.
Возможность снижения порядка уравнения была чисто эмпириче-
эмпирически отмечена в [Цетлин, 1961] при оценивании автомата с линейной
тактикой. Однако лемма 2.2 позволяет получать упрощения на регу-
регулярной основе, работая вполне определенным образом с диаграммой
переходов.
2.2.1. Примеры вычисления финальных вероятностей.
I. Автомат М. Л. Цетлина (с линейной тактикой) Ьт^-
Напомним, что автомат меняет свое внутреннее состояние как по-
показано на рис. 2.2 а.
На рис. 2.2 б показана совместная диаграмма смены состояний ав-
автомата при штрафе и нештрафе (наказании и поощрении), а также
«граница», разделяющая состояния автоматов на две группы.
Последовательно перемещая эту «границу» по диаграмме слева
направо и применяя лемму 2.2 (учитывая, что ра, qa — соответственно,
70 Методы исследования локальной организации поведения систем [Гл. 2
В случае поощрения
< о^-
V?
¦>о >¦
В случае наказания
о —>о —>о —¦
—о< —о< —о
Рис. 2.2. Смена состояний для автомата с линейной тактикой (а) и совмест-
совместный граф переходов между состояниями автомата Lmj2 (б)
вероятность штрафа и нештрафа при выполнении действия с номером
а), получаем
Pl =Qlr
B)
B)
Решение этой системы и подсчет финальных вероятностей совершения
первого и второго действия
= > Г)
делаются тривиально.
Далее, легко приходим к известному выражению для математиче-
математического ожидания наказания Wp = &1P1 + (У2Р21 получаемого автоматом
2.2]
Анализ потоков вероятности
71
с линейной тактикой:
где
II.
Л?-1 , AJ-
Af-1
i — — и А2 — —
Pi P2
Б. И. Кринского
Рис. 2.3. Совместный граф переходов между состояниями автомата Dm,2
Последовательно перемещая слева направо показанную на рис. 2.3
«границу», снова непосредственно из леммы 2.2 получаем
r i •>
) V
lPl =91 X)
г=1
A) B)
B) П^ B)
Гп VI = 92 X Г» "
г=1
Подставляя второе уравнение в первое, затем третье во второе и т. д.
(и учитывая, что ра + qa = 1), получаем
A) B)
72 Методы исследования локальной организации поведения систем [Гл. 2
Дальнейший анализ этой системы носит тривиальный характер. Дей-
Действительно, из последней цепочки уравнений имеем
Ла) — n-j (а) _ -1 о п — Л г}
rj — Ра гп ? a —i,z, j — i,...,n.
Подставляя результат в «среднее уравнение», сразу получаем, что
гB) _ A) VL
Тогда
1>5а) = ?
что тут же ведет к известной формуле для математического ожидания
проигрыша автомата В. Кринского.
Приведенные примеры показывают, что лемма 2.2 позволяет регу-
регулярным образом учитывать геометрическую однородность диаграммы
перехода между состояниями путем простой регистрации дуг, пересе-
пересекающих «границу» слева направо и справа налево.
В заключение раздела приведем другое соображение, связанное
с учетом вида конкретных диаграмм смены состояний.
2.2.2. Теорема М. Л. Цетлина о глубоком состоянии автомата (необ-
(необходимое условие). Пусть ip — некоторое состояние детерминированного
автомата Л, в котором он выполняет действие а. Глубиной этого состоя-
состояния d (ip) называется минимальная длина последовательности входных
сигналов (наказаний), приводящая автомат к смене действия. Глубиной
автомата d (А) называется максимальная из глубин его состояний.
Оказывается [Цетлин, 1961], для того чтобы некоторая последова-
последовательность детерминированных автоматов А\, . . . , Ат, . . . была асимп-
асимптотически оптимальной (чтобы с ростом п выигрыш автомата стре-
стремился к максимально возможному в данной среде), необходимо, чтобы
dn = d (An) —>• оо при п —>• оо.
Эта замечательная теорема М.Л. Цетлина не полна в двух от-
отношениях. Во-первых, она доказана только для детерминированного
автомата, и действительно, в случае стохастического автомата мож-
можно обучаться за счет изменения самой вероятности переходов. В ли-
литературе показано, что в некоторых примерах такой автомат будет
относиться к классу асимптотически оптимальных, хотя у него мо-
может не быть глубокого состояния. Однако, похоже, что приведенное
доказательство нетрудно модифицировать для случая стохастических
автоматов с ограниченными вероятностями переходов (при наличии
жестких фиксированных границ — точной верхней и нижней грани
G,g^0, 1).
Второй недостаток состоит в том, что теорема содержит лишь необ-
необходимые условия асимптотической оптимальности, тогда как достаточ-
достаточные условия представляли бы очень важное значение для практики. На-
Напомним, что автомат с линейной тактикой, который заведомо содержит
2.2] Анализ потоков вероятности 73
необходимое по теореме глубокое состояние, не во всех средах образует
асимптотически оптимальную последовательность. «Плохой» средой
для этого автомата является случай, когда вероятности наказаний за
оба действия хотя и разные, но обе превосходят 1/2.
Последним обстоятельством объясняется то, что различные авторы
стали предлагать свои модели автоматов, обходящие этот недостаток
автоматов с линейной тактикой.
Хотя достаточные условия асимптотической оптимальности оста-
остаются невыясненными, сама формулировка необходимого условия на-
наводит на мысль о том, что еще одним требованием должно быть то,
что суммарные финальные вероятности множества наиболее глубоких
состояний обязаны монотонно расти с ростом п, по крайней мере,
в пределе п —>• оо.
Мы ограничимся несколькими примерами, иллюстрирующими не
только важность этого требования, но и часто возникающую возмож-
возможность из общевероятностных требований предсказать, когда оно не вы-
выполняется и, следовательно автомат, удовлетворяющий необходимому
условию из теоремы М.Л. Цетлина, не может быть использован для
построения асимптотически оптимальной последовательности автома-
автоматов.
I. Достаточное условие асимптотической оптимальности авто-
автомата с линейной тактикой LmjK.
В этом случае, как и в следующем примере, изменение состояния
автомата за единицу времени (переход на шаг влево или вправо) можно
рассматривать как задачу случайного блуждания на луче а с вероят-
вероятностями ра, qa = 1 — ра по точкам 1, 2, . . . , п с отражающим правым
концом. Ясно, что Гп не будет монотонно расти при п —>• оо по сравне-
сравнению с другими состояниями того же луча, если выполнено ра ^ 1—ра.
Таким образом, практически без вычислений мы получили известное
из литературы необходимое условие асимптотической оптимальности
автомата с линейной тактикой в виде minpa < 1/2.
a
Иными словами, при несоблюдении указанного условия, глубокое
состояние, которое формально существует, не «используется» в том
смысле, что предельная вероятность его посещения падает при п —ь
—>• оо. Отсюда следует, что можно говорить об «эффективной глубине»
автомата, которая не совпадает, вообще говоря, с его формальной
глубиной.
Кстати, отсюда видно, и это подтверждается практикой, что для
достижения асимптотической оптимальности надо любым способом
повысить финальную вероятность глубоких состояний по сравнению
с другими состояниями Ьшк. С этой точки зрения полезно рассмот-
рассмотреть все последовавшие за Ьтк автоматы, но мы ограничимся авто-
автоматом В. Ю. Крылова (рис. 2.4) или его обобщением — конструкцией
Г. Н. Церцвадзе (рис. 2.5) [Церцвадзе, 1968].
74 Методы исследования локальной организации поведения систем [Гл. 2
При поощрении
< «I о< о о >о >о >¦
При наказании
1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2
1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1/2
Рис. 2.4. Графы переходов между состояниями автомата В. Ю. Крылова
II. Автомат Г. Н. Церцвадзе.
Переходы осуществляются как показано на рис. 2.5.
При поощрении
1 /у 1 /у 1 /-у 1 /-у /у ^ /"у ^ /"V ^ /"у ^ /"у
/-у /-у /-у /-у л/ л/ /-у л/ /-у
При наказании
CCCCCC/3C/3
1-/3 1-C 1-/3 1-/3 1-/3 1-/3 1-/3 1-/3 1-/3
Рис. 2.5. Графы переходов между состояниями автомата Г. Н. Церцвадзе
Заметим, что при 7 = /3 = 0 автомат Г. Н. Церцвадзе превращается
в автомат Lm2, а при 7 = 0> /3 = 1/2 — в автомат В. Ю. Крылова.
Аналогично предыдущему, условием асимптотической оптималь-
оптимальности будет перемещение в среднем состояния автомата в сторону
больших г, т. е.
<7аA - 7) + РаР > Чос! + раA - /3)-
Иными словами,
2раA-7-0)<1-27.
Таким образом, практически без выкладок мы получили выражение
для условия асимптотической оптимальности, из которого, в частности,
следует, что это условие для автомата В. Ю. Крылова G = 0, /3 = 1/2)
всегда выполнено.
III. Условие целесообразного поведения пары автоматов с линейной
тактикой Lm,2, ^n,2-
Поведение пары схематически изображено на рис. 2.6.
2.2]
Анализ потоков вероятности
75
При поощрении
B) B) B) B)
о >о >о >
B) B) B)
m-2 4>\n-l Ч>™
При наказании
< о^г
о >о >о
(Рт 9^3 4^1 ^Р\ *Pl 4^1 9^3 ^Рт
Рис. 2.6. Графы переходов между состояниями пары автоматов
Такая пара была изучена в работах [Стефанюк, 1961, 1963], где
с помощью громоздких выкладок удалось доказать, что в случае, когда
т = га+1 и пара автоматов штрафуется за действие F\\ с вероятностью
Ро, а за остальные действия — с вероятностью р, причем при р0 < р,
достаточным условием асимптотической оптимальности является р0 +
Рассматривая «блуждание» первого автомата по своим состояниям,
отвечающим 1-му (выгодному) действию, следует учесть, что второй
автомат в самом худшем случае (в виду его целесообразности в стацио-
стационарных условиях) равновероятно выбирает свое действие. Тогда усло-
условие перемещения изображающей точки состояния первого автомата
в сторону глубокого состояния будет, подобно предыдущему примеру,
таким:
(ро + р) . (яо + я) .^1
2 < 2 , т.е. ро+Р<1.
В свое время это неравенство было получено нами как результат
анализа громоздкого выражения, которое, в свою очередь, было выве-
выведено в результате сложных выкладок по решению двумерной системы
разностных уравнений. Сами эти выкладки не были опубликованы
ввиду их плохой обозримости. Поэтому описанная выше цепочка эле-
элементарных рассуждений, ведущая к тому же результату, что и тра-
традиционный аналитический метод, лишний раз доказывает, что так
76 Методы исследования локальной организации поведения систем [Гл. 2
расширенная теорема М. Л. Цетлина является полезным дополнением
к традиционным методам анализа поведения автоматов.
С другой стороны, приведенные в разделах 2.2 и 2.3 примеры
показывают, что сами диаграммы смен состояний автоматов (графы)
служат не только иллюстративным целям, но и могут быть эффективно
использованы при анализе свойств автоматов, существенно упрощая
такой анализ.
2.3. Приближенный анализ коллективного
поведения при большом числе участников
Для многих задач технического, биологического, социологического
характера существенным является обмен информацией или наличие
взаимодействий между частями системы S и наличие процесса, приво-
приводящего к некоторому равновесному состоянию.
2.3.1. Модель формирования мнения. Ниже рассматривается про-
простейшая модель процесса формирования «мнения коллектива» *) по-
после поступления в коллектив определенной «начальной» информации.
Это «мнение» формируется в результате обмена информацией внутри
некоторого множества автоматов, которые обладают, в определенном
смысле, целесообразным поведением. Предполагается, что в течение
ряда последовательных тактов весь коллектив автоматов разбивается
на группы и такой обмен информацией протекает независимо в каждой
из групп. Заметим, что подобная ситуация итеративного формирова-
формирования мнения на основе знания мнений остальных участков характерна,
в частности, для метода Дельфи, применяемого для получения экс-
экспертных оценок [Глушков, 1969].
Будем рассматривать случай, когда каждый член коллектива пред-
представляет собой простейший автомат, выходная величина которого (или
состояние) (p(t) может принимать одно из двух значений: 0 или 1.
Поведение автомата во времени задается уравнением
<p{t + 1) = F (<p(t), s(t),?(t)) , t = 0, 1, 2,. . . ,
где s(t) — входная переменная, которая принимает два значения: 0 —
поощрение, 1 — штраф (наказание); ?(t) — последовательность слу-
случайных независимых величин, также принимающих два значения 0, 1
с вероятностью 1 — е, ? соответственно. Предполагается, что функция
F задана следующим образом:
F (<?(*), О, 0) = F (<?(*), 1,1) =
F (<p(t), 1,O) = F Mt), 0, 1) = 1 - <p(t) = <p(t).
) Термин «мнение коллектива» понимается как, в некотором смысле, ста-
стационарное состояние всего коллектива. В случае коллектива людей — это был
бы набор мнений, которых придерживается каждый из членов коллектива.
2.3] Приближенный анализ коллективного поведения 77
При ?(?) = 0 автомат меняет выходную величину только при штра-
штрафе, поэтому ?(?) = 1 можно понимать как проявление «упрямства»
автомата (с вероятностью е).
По-другому можно представлять ?(?) как «ошибку» или «сбой»
автомата.
Будем рассматривать коллектив из п таких автоматов, считая, что
?^(?), г = 1, ... ,п, являются независимыми случайными величинами
для всех членов коллектива. Ниже мы будем считать, что в каждый мо-
момент времени t = 0, 1, 2, ... автоматы разбиваются на группы, причем
величина входной переменной s(t) для каждого автомата в состоянии
ip{t) зависит от средней доли X(t) автоматов в этой группе, выбравших
выходную величину, равную ip(t) (иными словами, находящихся в том
же состоянии): если X(t) > 1/2, то s(i) = 1, если X(i) ^ 1/2, то s(i) =
= 0.
Таким образом, в каждой группе происходит «голосование» по боль-
большинству.
Можно также рассматривать случай, когда таким образом «голосу-
«голосует» лишь один случайно выбранный автомат группы (т. е. все входные
переменные всех остальных автоматов полагаются равными 0). Ниже
всюду мы будем придерживаться второго способа голосования, когда
случайно выделяется один автомат. Кроме того, везде в настоящем
пункте считается, что в группе имеется ровно три автомата (п кратно
3). Разбиение на группы коллектива автоматов происходит случайным
образом. Предполагаем также, что величина е для всех автоматов
одна и та же (в дальнейшем последнее предположение будет несколько
ослаблено).
Сделанные ограничения упрощают рассмотрение, но не являются
обязательными. Из сказанного видно, что взаимодействие элементов
имеет много общего с задачей «голосования с ошибкой», рассмотренной
в ряде работ, например [Васильев и др., 1969], в которых, однако,
предполагалось, что все автоматы расположены на неограниченной
прямой (или плоскости), соседи фиксировались раз и навсегда, и где
целью исследования являлось обнаружение случаев неэргодичности
системы *).
На самом деле, легко показать, что при описанном выше груп-
групповом взаимодействии коллектив оказывается заведомо эргодической
системой, но ниже мы будем рассматривать систему на достаточно
малом отрезке времени, на котором состояние всей системы с большой
вероятностью определяется начальными условиями.
х) Постоянный участник нашего семинара по теории автоматов в МГУ,
а впоследствии — сотрудник ИППИ РАН, Г. Л. Курдюмов совершенно неожи-
неожиданно для всех доказал, что вопрос о том, является ли эргодической беско-
бесконечная однородная система типа рассматриваемых в [Васильев и др., 1969],
вообще говоря, алгоритмически неразрешим! («Теоретико-алгоритмический
метод исследования однородных случайных сред», ДАН, 1978. — №5. — С.
1047-1050).
78 Методы исследования локальной организации поведения систем [Гл. 2
Рассмотрим функцию fi(t) — долю автоматов находящихся в момент
времени t в состоянии 1.
Можно получить приближенное уравнение, описывающее процесс
(см. п. 2.3.2):
// (* + 1) = -§ A - 2s) /i3(t) + A - 2s) /i2(t) + | ii(t) + | . B.3.1)
Стационарные точки \i удовлетворяют уравнению
2 A - 2s) /i3 - 3 A - 2s) /i2 + fj, - s.
При s < 1/6 здесь имеется три стационарные точки
А*2 = 1/2.
Как легко видеть, при s < 1/6 точки /ii и /^з являются устойчи-
устойчивыми, причем область устойчивости корня /ii есть [0,1/2), а область
устойчивости корня /^з есть A/2,1].
Такой результат противоречит тому, что исходная система являет-
является эргодической. Это противоречие означает, что полученное прибли-
приближенное описание может быть верным только на достаточно «малом»
промежутке времени.
На некотором «малом» интервале времени происходит формирова-
формирование и сохранение средней доли «I» в коллективе, выбор которой зависит
от начальных условий, а значение — нет.
Для оценки времени пребывания в стационарных состояниях и во-
вообще правомочности такого приближенного анализа было проведено
моделирование описанного процесса на ЭВМ. Моделирование проводи-
проводилось для п = 1024, 510 и 225 автоматов. Моделирование на компьютере
показало, что приближенный анализ является достаточно точным.
Пример. Для п = 510, s = 0,05, начального состояния /i@) =
= Mq = 200 (т. е. 200 автоматов в начальный момент времени находятся
в состоянии (р@) = 1) система приходит в стационарную точку за
26 тактов. Система наблюдалась в течение 40 тыс. тактов и все это
время находилась в окрестности стационарной точки. Таким образом,
«малый» отрезок времени, на котором справедливо наше описание, на
самом деле может быть достаточно большим.
При s = 0,1 эта окрестность шире. Время же формирования ста-
стационарной средней доли «1» системы примерно такое же. Интересно,
что полученный результат значительно отличается от результатов, по-
полученных в работе [Васильев и др., 1969], где соседи фиксировались.
Можно говорить, что при малых величинах s такая система облада-
обладает памятью, так как состояние коллектива с достаточно большой веро-
вероятностью определено начальными условиями. (Память системы здесь
понимаем в том же смысле, что и память каждого члена коллектива,
который в интервале времени порядка 1/е сохраняет свое состояние,
если на его индивидуальный вход не поступает «штраф».)
2.3]
Приближенный анализ коллективного поведения
79
Тогда оказывается, что коллектив в целом «помнит» свое состояние
гораздо дольше, чем каждый член этого коллектива. Фактически речь
идет о повышении надежности работы системы из ненадежных элемен-
элементов способом, близким к тому, что использован в работе [Нейман, 1956].
С другой стороны, можно было бы говорить также и о надежно-
надежности операции «голосования» в такой системе. Формирование мнения
в таком коллективе достаточно хорошо моделирует социальные про-
процессы различного рода, в которых большую роль играют как процессы
создания, так и процессы «разрушения» определенных общественных
представлений.
Теперь, основываясь на том же приближенном описании, рассмот-
рассмотрим случай, когда коллектив п автоматов неоднороден.
Взаимодействие в этом коллективе носит такой же характер, но
пусть коллектив распадается на га подколлективов с численностью
соответственно ni, П2, . . . , nm, причем каждый такой педколлектив ха-
характеризуется своим параметром е — вероятностью «ошибки» и пред-
предполагается, ЧТО 7li, 712, • • • , пт ^ 1-
Рассмотрим, как свойства отдельных частей сказываются на пове-
поведении целого. Пусть щ = щ/п, i = 1, . . . , га, тогда в уравнении для
т
\i следует заменить параметр е на s = ^2 ai?ii гДе ei ~ вероятность
«ошибки» для г-го педколлектива с численностью П{.
Тогда очевидно, что условием существования трех стационарных
точек является уже Е < 1/6.
500
1000 1500
Рис. 2.7. Формирование мнения
коллектива исходя из начального
состояния /io = 0,4 при е = 0,05 и
п = 510
500
1000 1500
Рис. 2.8. Другой пример формиро-
формирования мнения коллектива исходя из
начального состояния /io = 0,5 при
е = 0,05 и п = 1024
Из этого условия вытекает, что если, например, таких подколлекти-
подколлективов два и «1 = 7/8 (т. е. 1-й педколлектив существенно больше 2-го),
80 Методы исследования локальной организации поведения систем [Гл. 2
а е\ = 1/7, то для выполнения условия е < 1/6 достаточно, чтобы
ВЫПОЛНЯЛОСЬ ?2 < 1/3.
На рисунках 2.7—2.11 показаны некоторые характерные реальные
(не приближенные!) траектории ii(t) — доли единиц в коллективе из
автоматов, в котором происходит процесс формирования «мнения» 1).
Приведены значения /i(t), усредненные по 100 предыдущим тактам
времени (t = 100,200,...). На рисунках 2.7-2.9 и 2.10, 2.11 приведе-
приведены траектории /i(t) для соответственно однородных и неоднородных
коллективов автоматов.
0,4
0,3'
0,2
0,1-
500 1000 15001
Рис. 2.9. Формирование мнения
коллектива при jiq = 0,3 при
е = 0,1 и п = 1024
Рис. 2.10. Пример формирования
мнения в смешанном коллективе
при /i0 = 0,3 при а = 0,7, е\ =
= 0,05, ?2 = 0,5 и п = 1024
fi(t)
0,4-
0,3-
0,2-
ОД-
о
500 1000 1500 t
Рис. 2.11. Еще один пример формирования мнения в смешанном коллективе
для 1ю = 0,3 при а = 0,7, ег = 0,05, е2 = 0,2 и п = 1024
2.3.2. Вывод уравнения процесса формирования мнения и его ана-
анализ. Ниже предполагается, что коллектив из п автоматов в каждый
) Имитационное моделирование системы было осуществлено совместно
с С. Б. Котляр.
2.3] Приближенный анализ коллективного поведения 81
момент времени t случайным образом разбивается на группы из к
автоматов {п кратно к) и в каждой группе «голосует» один случайно
выбранный автомат.
Пусть в начальный момент времени t = 0 доля автоматов, нахо-
находящихся в состоянии 1, задана и равна /i@) = /io- Вычислим среднее
значение доли автоматов /i(l), находящихся в состоянии 1 в следующий
момент времени t = 1. Заметим, что после разбиения на группы
вероятность того, что данная группа из к автоматов содержит ровно
s автоматов в состоянии 1, равна С^/1^A — /io)fc~s- Выбирая теперь
случайно «голосующий» автомат и производя выбор мнения «по боль-
большинству», получаем следующее выражение:
к
' Е
s>k/2
к
( |) |
s^k/2 s<k/2
-e E ^o(l-Mo)fe-sf]. B.3.2)
s^k/2
Положительные члены в квадратных скобках дают среднюю сум-
суммарную долю автоматов, которые в силу процесса голосования перехо-
переходят из состояния 0 в состояние 1.
Множитель 1/к отражает тот факт, что в группе меняет мнение
лишь один случайно выбранный автомат.
Рассмотрим теперь рекуррентное соотношение
/х(* + 1) = Ф(/х(*)), д@) = Мо- B-3.3)
Предположение, которого мы придерживаемся в настоящей работе,
состоит в том, что: 1) средняя доля автоматов в состоянии 1 в каждый
момент времени является представительной величиной; 2) эта средняя
доля в момент t равна /i(t), вычисляемой по соотношению B.3.2).
При к = 3 из B.3.3) получаем уравнение B.3.1).
2.3.3. Исследование приближенного уравнения процесса при
нечетных к = 21 + 1. Покажем, что при условии
у уравнения B.3.2), как и в случае к = 3, имеются три стационарные
точки: /ii,/i2 = 1/2, /Лз> причем /ii,/i3 расположены симметрично
относительно точки 1/2.
Из B.3.4) видно, что при / —> оо величина, ограничивающая е,
стремится к 1/2. Получим условие B.3.4). В стационарном случае,
согласно B.3.3), получаем
/i = Ф(ц). B.3.5)
82 Методы исследования локальной организации поведения систем [Гл. 2
Обозначив v = /i/(l — /i) и учитывая к = 2/ + 1 из B.3.3), B.3.5),
получаем следующее уравнение для и\
екик + С\(ек - 1) i/* + СЦек - 2) ик~2 + ... + C?(efc - /) vl+1 -
- Clk(ek -I) и1 - Clk-\ek - I + 1) is1'1 - ...
... - СЦек -1)и-ек = Ъ(и) = О. B.3.6)
Нетрудно видеть, что это уравнение имеет решение v = 1 и, кроме
того, если оно имеет положительное решение г/*, то \/v* также явля-
является его решением.
Используя правило Декарта о числе перемен знака в ряду коэф-
коэффициентов, нетрудно заключить, что число положительных решений
B.3.6) при всех е не более трех. Поскольку Ф(^) —>• оо при v —» оо,
то условие Ф'A) < 0 является необходимым и достаточным для того,
чтобы B.3.6) имело три различных положительных корня (при Ф7A) =
= 0 уравнение B.3.6) имеет корень v = 1 кратности 3).
Вычисляя Ф'A), получаем, что для этого необходимо и достаточно,
чтобы выполнялось
B.3.7)
B/ + 1)
Остается упростить B.3.7), чтобы получить B.3.4), использовав для
этого очевидные соотношения
i-i i-i Л
Eril + s _ o2/-2 l
2.4. Комбинированное исследование модели памяти
В большом числе случаев использования вычислительной техни-
техники, построения моделей работы живой клетки, организации торговли,
складирования, пользования Интернетом и т. п. важнейшим является
этап поиска в памяти системы элемента, удовлетворяющего заданному
набору свойств, т. е. некоторому образцу. Обращение в систему и само
сопоставление с образцом являются, как правило, дорогостоящими
процедурами, поэтому желательно, чтобы искомый элемент извлекался
за минимальное число обращений.
Ниже описывается математическая модель системы со случайной
выборкой из памяти. Рассмотрен ряд алгоритмов адаптивной оптими-
оптимизации поиска. Приведены результаты моделирования и даны примеры
реальных ситуаций, к которым применимы полученные результаты.
2.4] Комбинированное исследование модели памяти 83
Будет показано, что при случайном характере расположения эле-
элементов в памяти системы число их копий (дублей) следует выбирать
пропорциональным y/pi, где pi — вероятность поиска элемента, удо-
удовлетворяющего г-му образцу, г = 1, . . . , п. Свойства такой случайной
памяти, впервые описанной нами в [Stefanuk, 1974; Стефанюк, 1979],
естественно сравнить со свойствами модели «стопки книг» М. Л. Цетли-
на [Цетлин, 1963], в которой наблюдался эффект обучения стопки книг
в соответствии с поступающими заявками. Такое сравнение удается
провести точными методами (см. П.1).
Однако в нашей модели появляется новая «степень свободы» — чис-
число копий одного и того же элемента памяти Ni. На примере нескольких
алгоритмов, обеспечивающих получение оптимальных чисел Ni ~ y/pli
мы рассмотрим многократное прохождение этапов анализа системы
(рис. 1.3) (этап I) и убедимся в полезности использования комбинации
приближенных методов и машинного моделирования.
2.4.1. Качественное описание памяти со случайной выборкой и при-
примеры ее применения. Значительные успехи в технологии производства
вычислительных машин привели к тому, что резко возросли объемы
оперативной памяти и быстродействие ЭВМ при общем снижении
удельных затрат.
Эти количественные изменения дали возможность хранить в опе-
оперативной памяти ЭВМ большие запасы знаний, относящихся к кругу
решаемых задач, а также значительное число заранее запрограммиро-
запрограммированных процедур обработки данных. Этим, главным образом, и объ-
объясняется успех ряда крупных проектов по искусственному интеллек-
интеллекту [IJCAI-1985], экспертным системам [Алексеева и Стефанюк, 1984;
IJCAI-1979; Стефанюк, 1987г] и роботам с элементами искусственного
интеллекта [Стефанюк и др., 1977; 1980].
Основным способом извлечения необходимой «ассоциативной» ин-
информации в программах ИИ (и аналогичных им) является сопостав-
сопоставление с образцом (pattern matching). Подбор по образцу впервые был
использован в языках программирования COMIT, COBOL, чтобы вы-
выделять подстроки по их содержанию, а не по их адресам. Он оказался
чрезвычайно полезным в задачах ИИ, где требуется хранить большие
запасы символьных данных, поэтому некоторые виды подбора по об-
образцу были включены во все языки высокого уровня, используемые
в искусственном интеллекте: SAIL, PLANNER, QA4, QLISP, POPLER,
PROLOG.
Ниже мы принимаем, что поиск по образцу в памяти осуществля-
осуществляется так. Случайно, т. е. «наугад», из памяти выбирается элемент (сло-
(слово, подпрограмма) и сопоставляется с образцом. Если сопоставление
успешно, то поиск закончен; в противном случае выбранный элемент
возвращается в память (или выбрасывается), выбирается другой, про-
производится сопоставление и т. д. Сама процедура сопоставления с об-
84 Методы исследования локальной организации поведения систем [Гл. 2
разцом является достаточно сложной х), поэтому желательно, чтобы
первый же выбранный из памяти элемент с максимальной вероятно-
вероятностью оказался бы тем, который отыскивается, или, чтобы среднее число
операций сопоставления с образцом до достижения успеха было бы
минимальным.
Будем предполагать, что существуют априорные, но нам, быть
может, неизвестные вероятности pi,...,pn, с которыми происходит
поиск соответствующего элемента из памяти. (Впредь все элементы —
триплеты, слова, программы — мы будем называть «словами».)
В настоящей книге приводятся оценки и делаются выводы относи-
относительно оптимизации в указанном смысле процедуры хранения и поиска
по образцу в случайной памяти. Описывается математическая модель
системы со случайной выборкой из памяти. Рассмотрен ряд алгоритмов
адаптивной оптимизации поиска и приведены результаты моделирова-
моделирования.
Для конкретности приведем примеры содержательных задач, к ко-
которым относятся полученные результаты.
I. Случайный поиск по образцу в памяти компьютера. Здесь пред-
предполагается, что все слова расположены в неизвестном для пользова-
пользователя порядке, поэтому наугад выбирается адрес и просматривается
соответствующая ячейка. Сюда же относится и ситуация, когда поиск
данного слова ведется последовательным просмотром ячеек памяти,
но местоположение искомого слова оказывается практически случай-
случайным 2). Сколько копий каждого слова должно храниться в памяти,
чтобы среднее число обращений к словам было бы минимальным?
II. Молекулярная вычислительная машина. Случайная память
представляет собой хорошую модель для гипотетической «молеку-
«молекулярной машины» [Либерман, 1972], в которой отдельные копии слов
мыслятся авторами идеи в виде молекул, совершающих случайные
тепловые блуждания в объеме живой клетки. Из наших результатов
вытекают определенные предположения относительно некоторых
свойств элементов такой модели.
III. Магазин самообслуживания. Сколько экземпляров товаров ка-
каждого типа нужно иметь в магазине, чтобы покупатель, даже если
он случайно выбирает очередность просмотра полок, за минимальное
время находил интересующий его товар? (Вряд ли такая «случайная»
схема совершения покупки приемлема для магазина в целом. Однако
она может оказаться применимой к его отделам, содержащим большой
х) Или же интервал между последовательными извлечениями элементов из
памяти не может быть сделан меньше некоторой константы (и тогда речь
идет о быстродействии).
2) Такая модель естественна для систем искусственного интеллекта, где
в памяти содержится большой объем сведений, собранных при решении
самых разных задач и в разное время (также обстоит дело и, например, в сети
Интернет).
2.4] Комбинированное исследование модели памяти 85
выбор по существу однотипных товаров, таким как «Моющие средства»
и др.)
IV. Сеть Интернет. Дублирование способов доступа к информа-
информации в Интернете весьма распространено. Исходно это было вызвано
желанием обеспечить надежный и быстрый доступ для географически
разбросанных пользователей сети. В результате сегодня практически
каждый пользователь может получить одну и ту же (или близкую
по содержанию) информацию, обратившись к любому из нескольких
сайтов. Наиболее «откровенное» дублирование наблюдается в так на-
называемых зеркалках (mirrors), но и серверы другого назначения, такие,
как gofer, proxy или archi, также предусматривают высокую степень
дублирования. Например, сообщалось, что броузер Netscape можно
«скачать» с любого из 19 сайтов, имеющих следующие URL-адреса:
ftp://ftpX.netscape.com/, где X е [2, 20]. В книге [Eager, 1974] отмеча-
отмечается, что имеется около 40 arc/гге-серверов, обслуживающих примерно
1500 компьютеров.
Дублирование информации при поиске по образцу может суще-
существенно повысить скорость поиска необходимых сведений. Время по-
поиска становится минимальным, если число агентов, несущих одну и ту
же (или эквивалентную) информацию выбрать оптимальным (см. [Сте-
фанюк, 1989]).
2.4.2. «Закон квадратного корня». Обозначим через \{ среднее чи-
число обращений в память при поиске г-го слова. Тогда полное среднее
число обращений равно
? = ?>'<. B-4Л)
где pi — вероятность поиска г-го слова, г = 1, . . . , п, У^ pj = 1.
г = 1
(Предполагается, что после поступления «заказа» на поиск г-го
слова, обращения в память осуществляются до тех пор, пока это слово
не будет найдено. После успешного извлечения искомого слова, с со-
соответствующей вероятностью поступает «заказ» на поиск очередного
слова, и т. д.)
Пусть 7V^ — число копий г-го слова, хранящихся в памяти, причем
п
^2 Ni = N, где N — полное число слов в памяти. Тогда, считая, что при
i=i
обращении в память со случайной выборкой равновероятно извлекается
одно из N слов и неподходящие слова возвращаются обратно в память,
при N{ ^ 1 справедливо следующее выражение (бесконечная сумма):
где через pi обозначена вероятность выбрать слово г при первом же
обращении в память, т. е. относительная доля слов типа г.
86 Методы исследования локальной организации поведения систем [Гл. 2
Отсюда возникает такое выражение для полного среднего числа
обращений в память при поиске по образцу:
|- B-4.3)
Видно, в частности, что если число копий каждого слова в памяти
пропорционально вероятности поиска соответствующих слов, то сред-
среднее число обращений не зависит от этих вероятностей и равно п, т. е.
полному числу различных слов, хранящихся в памяти! (При поиске без
возвращения и малом N в работе [Стефанюк, 1974] найдена оценка (п +
)/)
)/
К сожалению, именно такую прямую пропорциональную зависи-
зависимость дает естественный алгоритм «размножения» числа копий слов,
рассматриваемый в п. 2.4.3.
Чтобы выяснить, какие значения р\, . . . , рп являются оптималь-
оптимальными в смысле минимизации критерия B.4.3), покажем, что верно
неравенство
) B.4.4)
Действительно, для нахождения минимального значения выраже-
выражения B.4.3), считая в нем pi, . . . ,рп фиксированными, a pi, . . . , рп —
п
переменными величинами, с учетом условия нормировки ^2 Pi — 1?
г=1
построим обычным образом функционал
Необходимые условия экстремума Ф имеют вид
!^ = -§ + А = 0, г = 1,...,п, B.4.5)
opi P
а соотношения
02Ф 2Pi 02Ф
=>0
показывают, что в точке экстремума — минимум. Отсюда вытекает
справедливость B.4.4).
Таким образом, минимальное значение для среднего числа обраще-
обращений при поиске по образцу, равное
=1
2.4] Комбинированное исследование модели памяти 87
достигается при учете B.4.5) и нормировки для pi при
, г = 1,...,п. B.4.7)
Итак, при оптимальном поиске по образцу необходимо, чтобы вы-
выполнялся «закон квадратного корня»: оптимальное число копий ка-
каждого слова должно быть пропорциональным корню квадратному из
вероятности поиска соответствующего слова.
В п. 2.4.6 даются аналогичные выкладки для поиска по образцу
без возвращения, естественного, скажем в ситуации упорядоченного
поиска в памяти компьютера со случайным порядком слов (пример I
из п. 2.4.1) и в задачах типа III. Полученные там выражения B.4.19)-
B.4.22) показывают большое сходство со случаем с возвращениями,
а при N —> оо результаты асимптотически совпадают.
2.4.3. «Естественный» алгоритм образования и уничтожения ко-
копий слов. Изучаемую нами память со случайной выборкой можно
трактовать как мультиагентную систему, состоящую из коллектива п
автоматов, причем число N{ является «состоянием» г-го автомата.
Рассмотрим алгоритм, в котором при каждом успешном извлечении
слова из памяти в нее добавляется ровно а копий этого слова. Тогда
заранее очевидно, что в памяти будет тем больше копий данного слова,
чем выше вероятность поиска именно этого слова. (Чтобы предупре-
предупредить неограниченное нарастание общего числа слов в памяти, в алго-
алгоритме предусмотрен определенный механизм уничтожения копий.)
Пусть t = 0,1, 2, ... представляют собой моменты успешного из-
извлечения искомого слова из памяти. Рассмотрим следующий алгоритм
работы г-го агента:
Nt(t + 1) = Ni(t) + Ш - rn(t). B.4.8)
Здесь ?i(i) = 0, если Ni(i) = 0. При Ni(t) Ф 0 величины ?i(t) —
суть независимые случайные величины, принимающие значения <т, 0
с вероятностями Pi,(l — Pi) соответственно; величины rji(t) — зави-
зависящие только от Ni(t) случайные величины, принимающие значения
т*,0 ^ m* ^ Ni(t), с вероятностями С™*(Ь)аш*A - a)Ni^~mi.
Иными словами, в каждый момент t успешного извлечения г-го
слова (вероятность этого равна Pi) в память добавляется а копий слова,
удовлетворяющего образцу. При этом все остальные слова независимо
друг от друга с вероятностью а «гибнут».
Обозначив чертой сверху среднее значение случайной величины при
условии, что ни одно N{(t) не обращается в нуль, получаем следующее
уравнение для средних этого случайного процесса:
Д^(? + 1) = ~Ni(t) + api - <*Ni(t), i = 1,. . . , п. B.4.9)
88 Методы исследования локальной организации поведения систем [Гл. 2
Стационарным решением B.4.9) будет
~Ni = ^Pi, i = l,...,n. B.4.10)
Как уже было отмечено, такие значения величин копий не только не
являются оптимальными или близкими к ним, но обеспечивают в сред-
среднем глубину поиска равную п, т. е. полному числу различных слов,
хранящихся в памяти. Однако сам вид зависимости B.4.7) наводит на
мысль о том, что работу алгоритма B.4.8) можно скорректировать,
если ввести метрику в пространство слов, хранящихся в памяти.
2.4.4. Использование «геометрических» соображений. Представим
себе, что все слова в памяти находятся на ограниченном куске плос-
плоскости и все копии одного слова имеют тенденцию «держаться вместе»,
образуя скопления круглой формы, перемещение которых на плоскости
как целого носит случайный характер. Пусть теперь механизм выбора
слов из памяти устроен так, что при каждом обращении в память
происходит выбор слова лишь с границ этих скоплений, тогда как
добавление новых копий и их уничтожение происходит «равномерно»
по всему объему по алгоритму B.4.8). Тогда, очевидно, доля копий слов,
среди которых фактически будет осуществляться поиск по образцу, бу-
будет прямо пропорциональной квадратному корню из соответствующей
вероятности.
Такая схема непосредственно применима в торговле (см. пример
III из п. 2.4.1), когда покупатель осуществляет свой выбор среди тех
экземпляров товара, которые непосредственно видны на полках мага-
магазина. При этом невидимая покупателю основная масса товара может
обновляться и пополняться по алгоритму B.4.8), а способ выбора га-
гарантирует необходимую оптимизацию.
Описанная схема может дать ответ на некоторые вопросы, касаю-
касающиеся работы живой клетки (см. пример II из п. 2.4.1). В этой связи
хотелось бы обратить внимание на следующее замечание из книги [Леви
и Сикевиц, 1971, с. 92], относящееся к мельчайшим образованиям внут-
внутри клетки — микротельцам, пероксисомам и др.: «недавно в них были
найдены некоторые ферменты; однако функция этих телец фактически
не выяснена. Их обнаруживают далеко не во всех клетках; тем не менее
распространены они очень широко. Вероятно, лизосомы и микротельца
служат в клетке местом хранения больших количеств ферментов; при
такой форме хранения большая часть этих ферментов изымается из
обращения... »
Хотя это высказывание явно наводит на мысль об аналогии с нашей
моделью случайной памяти, объясняя причины существования описан-
описанных депо ферментов и то, почему большая часть их «изымается из
обращения», все же фактического материала пока еще слишком мало,
чтобы проводить серьезные параллели. См. также работу [Де Дюв,
1983].
Учтем также, что при моделировании живой клетки необходимо
рассматривать 3-мерную, а не плоскую геометрию. В этом случае до-
достаточно эффективным (хотя и не оптимальным) будет использование
2.4] Комбинированное исследование модели памяти 89
сферических образований. Тогда, при условии, что число слов в объеме
скопления пропорционально pi, а считывание осуществляется только
с поверхности скоплений, получаем, что среднее число обращений при
поиске по образцу будет равно
п п
Р V^ 1/3 v-^ 2/3
г=1 г = 1
Это выражение так же, как и B.4.6), обладает многими достоинствами
оптимальной памяти, например, тем свойством, что при р\ —» 1 имеем
Lr ->> 1.
2.4.5. «Явные» алгоритмы оптимизации. Ясно, что решение задачи
создания оптимального числа копий слов в памяти со случайной выбор-
выборкой зависит от имеющейся априорной информации. Так, если р\, . . . , рп
заранее известны, то формула B.4.7) для поиска с возвращениями (или
формула B.4.22) для поиска без возвращений) дает ее непосредственное
решение.
Далее, если pi, . . . , рп неизвестны, но известны текущие числа слов
каждого типа Ni(i) (такая постановка задачи естественна для некото-
некоторых вариантов задачи III из п. 2.4.1), то можно поступить так. Пусть
уничтожение копий происходит так же, как в алгоритме B.4.8), а с
вероятностью pi в момент t в память добавляется уже не а копий слов
г-го типа, а а / Ni(t). Назовем этот алгоритм алгоритмом с известным
числом копий. Тогда аналогично уравнению B.4.9) можно написать
следующее уравнение для средних значений, пренебрегая дисперсией
величин Ni(t):
Щь + 1)=Щь) + =?-гРг-аЩь), i = l,...,n. B.4.11)
Очевидно, что в стационарной точке здесь выполняется «закон
квадратного корня».
Наконец, если отсутствует и такая информация, то при Л^ —> оо
хорошо работает, как показывает идущий ниже приближенный анализ,
следующий алгоритм, основанный на поиске без возвращения: после
каждого успешного извлечения искомого элемента из памяти подсчи-
тывается, сколько было просмотрено «неподходящих элементов» и все
они удаляются из памяти, а затем в память добавляется ровно такое
же число копий элемента, удовлетворяющего образцу. Назовем этот
алгоритм алгоритмом с адекватной заменой.
Пусть t = 1,2,... — моменты успешного извлечения искомого
сведения из памяти (когда удовлетворяется соответствующий образец).
В обозначениях п. 2.4.3 для средних величин этого процесса полу-
получаем следующее выражение (вычисляем сначала условные средние при
фиксированных значениях Ni(i), i = 1, . . . , п):
N(t)
PiN-N(t)(lM-V- BA12)
90 Методы исследования локальной организации поведения систем [Гл. 2
Здесь величина ——г\Т ,.\ 0-jif) ~ 1) представляет собой условное сред-
нее доли числа сведений г-го типа, попавших в выборку, предшеству-
предшествующую моменту успешного окончания поиска сведения типа j (этому
моменту предшествовало в среднем lj(t) — 1 обращений в память).
Используя выражение B.4.19) для /^ в процессе выборки слов из памяти
без возвращения и приближенно заменяя среднее значение отношения
величин на отношение средних, получаем следующие выражения:
N - Nj(t) ^"' ^ " Nj(t) + 1 7V,(t) + 1 ' v-—;
Отсюда стационарная точка (TVi, . . . , Nn) процесса B.4.12) удовлетво-
удовлетворяет уравнению
Ni -\-1 < J Nj + 1
Представив B.4.15) в виде
PiN _ уу.^ = Q B.4.16)
где
разрешим B.4.16) относительно Nf.
1
Отсюда видно, что при N —>- оо асимптотически выполняется
- Ni Jpi . л
Pi = ~п = -^ , г = 1,...,п,
т. е. в описанном алгоритме действительно происходит формирование
оптимальных значений для дубликатов сведений, несмотря на отсут-
отсутствие какой-либо априорной или текущей информации о составе памя-
памя2.4] Комбинированное исследование модели памяти 91
В работе [Стефанюк, 1989] описаны особенности использования
этого алгоритма в задачах типа IV из п. 2.4.1.
Заметим, что приведенный анализ является приближенным: мы
ограничились рассмотрением уравнений для средних значений вели-
величин, считая их представительными в каждый момент времени и неявно
пренебрегая более высокими моментами. Мы пренебрегали также нену-
ненулевой вероятностью полного уничтожения всех копий некоторых слов,
полагаясь на то, что эта вероятность настолько мала, что стационарное
распределение «успеет» сформироваться.
Поэтому этот анализ был дополнен машинным моделированием
реального процесса, которое подтвердило работоспособность предло-
предложенных алгоритмов.
Моделирование производилось в предположении, что в памяти хра-
хранится всего три типа слов и что вероятности обращения за каждым,
типом слова равны 0,1; 0,3; 0,6, так что оптимальные относительные
доли копий слов в памяти, пропорциональные квадратному корню из
этих вероятностей, равны соответственно 0,193; 0,334; 0,473. Они пока-
показаны на приводимых рисунках в виде тонких горизонтальных линий
GVi(t)/yV(t))opt = 0,47; (N2(t)/N(t))opt = 0,33; GV3(t)/7V(t))opt = 0,19.
0,5-г
§ >s 0,4 ¦
I I 0,3-
Число циклов работы алгоритма
Рис. 2.12. Алгоритм с известным числом копий слов (добавляется — 1000
копий, фактор гибели — 0,01)
На рис. 2.12 изображен график формирования относительной доли
копий слов каждого из типов по алгоритму с известным числом копий
при следующих параметрах:
добавляется а = 1000 копий;
фактор уничтожения копий а = 0,01;
начальные числа копий слов: 200, 150, 100;
число обращений к памяти — 1000;
интервал интерполяции при выводе графика — 10.
Из моделирования вытекает, что «финальные» числа копий слов
каждого типа равны соответственно 96, 191, 233.
На рис. 2.13 показаны расчеты работы того же алгоритма, но при
иных параметрах:
добавляется а = 20 000 копий;
92 Методы исследования локальной организации поведения систем [Гл. 2
11
9
s о
О О
О
0,6
0,5
0,4
0,3
0,2-
ОД-
N2{t)/N(i)
Число циклов работы алгоритма
Рис. 2.13. Алгоритм с известным числом копий (добавляется — 20 000 копий,
фактор гибели — 0,01)
фактор уничтожения копий а = 0,01;
начальные числа копий слов: 2000, 1500, 1000;
число обращений к памяти — 3000;
интервал интерполяции — 50.
Моделирование показало, что «финальные» числа копий слов равны
соответственно 337, 754, 1150.
На рис. 2.14 а изображен график формирования относительной до-
доли копий слов по алгоритму с адекватной заменой при следующих
параметрах:
начальные числа копий слов: 2000, 1500, 1000;
число обращений к памяти — 3000;
интервал интерполяции при выводе графика — 50.
Из моделирования вытекает, что «финальные» числа копий слов
каждого типа равны соответственно 693, 1400, 2117.
Наконец, на рис. 2.14 б изображен график формирования относи-
относительной доли копий слов также по алгоритму с адекватной заменой, но
при несколько других параметрах:
начальные числа копий слов те же, что и в предыдущем случае:
число обращений к памяти — 10000;
интервал интерполяции при выводе графика — 200.
Здесь моделирование показало, что «финальные» числа копий слов
каждого типа равны соответственно 604, 1562, 2134.
Из перечисленных графиков можно заключить, что при выбранных
здесь параметрах, использованные в нашем приближенном анализе
предположения вполне оправданы.
Приведенные графики, как и ряд других, наводят на мысль о боль-
большом сходстве этих двух «явных» алгоритмов оптимизации числа копий
при соответствующем выборе параметров сг, а: можно показать, что это
сходство не является случайным и имеет определенное основание.
2-41
Комбинированное исследование модели памяти
93
0,5-г
Число циклов работы алгоритма
Число циклов работы алгоритма
Рис. 2.14. Алгоритм с адекватной заменой слов
2.4.6. Поиск без возвращения. (В данном пункте символы того же
смысла, что и в п. 2.4.2, снабдим значком^ если речь идет о поиске без
возвращения.)
Для поиска без возвращения при Ni ^ 1 имеем для вычисления \{
следующую конечную сумму:
N-Ni + 1 nNi-l
Здесь мы использовали равенство
Е-
J
B.4.19a)
94 Методы исследования локальной организации поведения систем [Гл. 2
Чтобы проверить последнее соотношение, применим несколько раз
к его правой части элементарное тождество CJ+1 = CJ + Сг-~г. Тогда
получаем
справедливое, очевидно, пока выполняется N — k ^ Ni + 1. После под-
подстановки этого выражения в указанное выше соотношение (учитывая
приведенное ограничение на &), остается доказать, что
Последнее равенство доказывается непосредственным вычислени-
вычислением. Таким образом, B.4.19а) доказано окончательно.
Итак, для поиска без возвращения получаем
<2«»>
г=1 г=1
где N ^ 1 (и соответственно pi
Выкладки, аналогичные приведенным в п. 2.4.2, дают следующее
выражение для минимально возможного среднего числа обращений
в память:
2
причем это значение достигается, если выполнено
-j-, t = l,...,n. B.4.22)
EVp7
г=1
Если pi > 0, г = 1, . . . , п, и фиксированы, то при N —>• оо, п < оо
формулы B.4.19), B.4.21) и B.4.22) переходят в B.4.2), B.4.6) и B.4.7),
т. е. различие случаев с возвращениями и без них, как и следовало
ожидать, исчезает.
2.4.7. Другие характеристики модели памяти со случайной выбор-
выборкой. В прил. П.1 вынесены исследования некоторых других свойств
описываемой памяти.
В П. 1.1 вычислена дисперсия времени поиска, которая оказалась
весьма большой.
В П.1.2 эта память сравнивается со «стопкой книг» М. Л. Цетлина,
для которой были получены новые результаты. Показано, что в худшем
для использования адаптивной памяти случае (когда все pi равны)
наша модель в среднем проигрывает стопке книг вдвое.
2.5] Выводы по главе 2 95
Наконец в П. 1.3 показано, что в случае зависимых цепочек заявок
поведение случайной памяти оказывается предпочтительным, так как
легко видеть, что в стопке книг требуемые книги из многотомного
издания будут располагаться в обратном порядке (!).
Напомним, однако, что эти две модели отвечают двум разным клас-
классам встречающихся на практике ситуаций, из которых лишь в некото-
некоторых конструктору предоставляется выбор, какой из моделей следует
воспользоваться (см. например, п. 4.4.3 гл. 4).
В то же время подчеркнем: складывается впечатление, что объем
памяти машины (емкость складов, число молекул в живой клетке) мож-
можно наращивать практически неограниченно и достаточно «дешево»,
тогда как время, затрачиваемое на выбор и сопоставление с образцом
каждого слова (товара, молекулы), по-видимому, не может быть сдела-
сделано сколь угодно малым, поэтому рано или поздно во всех указанных
областях возникает потребность в адаптивных схемах памяти типа
«стопки книг» или случайной памяти, позволяющих свести к минимуму
(в среднем) время, затрачиваемое на получение нужного сведения.
При этом с ростом числа элементов локально-организованные си-
системы типа случайной памяти получают преимущество перед другими
способами хранения и извлечения информации, даже перед таким мощ-
мощным средством, как хеширование, которое приводит к недостаточно
эффективному использованию памяти [Тильчин и Шор, 1985], требует
определенных декларативных сведений о формате хранимых элемен-
элементов и т. п.
Одним из важных достоинств локально-организованных систем яв-
является то, что их легко пополнять или модифицировать и они обладают
эластичностью (см. также гл. 3), состоящей в том, что их свойства
плавно ухудшаются с заполнением памяти, обладают высокой надеж-
надежностью и т. д.
2.5. Выводы по главе 2
1. Предложен новый метод получения асимптотически точных ре-
результатов для игры ^-автоматов путем рассмотрения «предельных» 0-
автоматов (т. е. автоматов с бесконечной памятью). Даны методы ана-
анализа вспомогательной цепи Маркова (описывающей асимптотические
свойства) для практически всех игр известных из литературы.
2. Показано, что в некоторых случаях доказательные результаты
для коллективного поведения автоматов могут быть получены путем
исчерпывающего моделирования на ЭВМ представительной совокуп-
совокупности вариантов.
3. Показано, что введенные в этой главе представления о «потоках
вероятности» и «блуждании изображающей точки» позволяют чрез-
чрезвычайно простым образом использовать граф, иллюстрирующий пе-
переходы состояний автомата, для выяснения условий асимптотической
оптимальности.
4. Показано, что при анализе систем со случайными параметрами,
состоящих из большого числа компонент, весьма эффективны прибли-
приближенные методы, подкрепляемые машинным моделированием.
96 Методы исследования локальной организации поведения систем [Гл. 2
5. Показано, что фактически во всех случаях анализа данной главы
наличие «малого параметра» позволяет моделировать сложную эрго-
дическую систему с помощью неэргодической и использовать то, что на
практике финальные состояния неэргодической системы формируются
за достаточно малый промежуток времени по сравнению с общим
временем существования системы.
6. Предложенная и изученная в разд. 2.3 модель голосования ука-
указывает пути разработки высоконадежных систем на новых принципах
(химическом, биологическом и т. п.), выявляя одно из преимуществ
локально-организованной системы с локальным взаимодействием —
надежность.
7. Предложенная и изученная коллективная память со случайной
выборкой является локально-организованной системой элементов, хо-
хорошо описывающей адаптивные возможности некоторых систем, встре-
встречающихся в вычислительной технике, торговле, складировании и био-
биологии.
В целом, эта глава книги дает достаточно полный пакет методов
анализа локально-организованной системы в дискретном случае и по-
показывает, что принципы локальной организации позволяют как форму-
формулировать новые задачи для дискретных систем, так и достаточно легко
анализировать возникающие при этом разнообразные модели.
Глава 3
ЛОКАЛЬНАЯ ОРГАНИЗАЦИЯ
ЦЕЛЕСООБРАЗНОГО ПОВЕДЕНИЯ
В НЕПРЕРЫВНЫХ МОДЕЛЯХ
Анализ системы S по схеме рис. 1.3 в предположении непрерывного
множества действий — состояний подсистем Si, г = 1,. . . , п, взаимо-
взаимодействующих по некоторому детерминированному закону в непрерыв-
непрерывной шкале времени, имеет свою специфику.
Возникающие при этом формулировки задач напоминают задачи
из области управляемых динамических систем, поэтому в первой ра-
работе на эту тему [Стефанюк и Цетлин, 1967] был использован термин
«локальное управление». Однако начиная, с этой же работы, мы по-
постоянно подчеркиваем, что возникающие здесь формальные модели
лишь внешне отличаются от формулировок коллективного поведения
конечных автоматов, работающих в дискретном времени (см. гл. 2),
и что, по существу, у этих моделей много общего. Например, в непре-
непрерывном случае также можно говорить о памяти автомата, асимптотиче-
асимптотически оптимальной последовательности автоматов в стационарной среде,
партии Нэша в игре и т. п.
В отличие от работы [Варшавский и Гершт, 1966], где рассматри-
рассматривалась непрерывная аппроксимация конечного автомата с линейной
тактикой, работы [Гершт, 1967], изучавшей непрерывную модель игр
автоматов, и непрерывной модели конечного автомата, обеспечиваю-
обеспечивающего байесовское различие двух сигналов ([Гершт и Стефанюк, 1967]),
в работах [Стефанюк и Цетлин, 1967; Стефанюк, 1967; 1968а; 19686],
приведших к диссертации [Стефанюк, 1968в], введенные нами в рас-
рассмотрение автоматы с непрерывным множеством действий, или непре-
непрерывные автоматы, выступили как исходные конструкции, предназна-
предназначенные для описания детерминированного взаимодействия в реальном
времени, а не как аппроксимирующие модели для дискретных систем
с конечным числом действий, помещенных в вероятностную среду.
В дальнейшем такие непрерывные автоматы рассматривались
А. В. Малишевским, Ю. Д. Тенисбергом [Малишевский и Тенисберг,
1969], В. И. Варшавским и др. [Варшавский и др. 1969], которые решали
задачи децентрализованного распределения (см. гл. 1) некоего единого
ресурса — вполне естественная постановка для рассматриваемого ими
игрового управления в задачах экономического характера.
В рамках локальной организации в работе [Микийчук и Стефанюк,
1971] была сформулирована и в некоторых предположениях решена
задача выявления в общем виде условий взаимодействия элементов
S, обеспечивающих устойчивость работы такой системы. Эта задача
была исследована также А. В. Малишевским [Малишевский, 1972],
4 Стефанюк
98 Локальная организация целесообразного поведения [Гл. 3
В. И. Опойцевым [Опойцев, 1974-1975] и другими авторами. Значитель-
Значительный поток публикаций по этому вопросу, по-видимому, объясняется
тем, что математически задачи устойчивости при локальном управле-
управлении весьма близки к задачам исследования устойчивости динамических
систем, что позволяет воспользоваться имеющимися там математиче-
математическими методами.
Однако нас интересовала не столько формально-математическая,
как в работах этих авторов, сколько «содержательная» формулировка
условий устойчивости. Так в работе [Стефанюк и Цетлин, 1967] мы
показали, что требование устойчивости может быть адекватно истол-
истолковано в терминах устойчивости работы всех подколлективов данного
коллектива. В этой работе, как и в дипломной работе А. М. Микийчука
(кафедра общих проблем управления мехмата МГУ, 1970), в кото-
которой была доказана сформулированная нами теорема (см. [Микийчук
и Стефанюк, 1971]), основное внимание уделялось именно таким содер-
содержательным условиям взаимодействия, гарантирующим устойчивость
локального управления.
Развитый нами подход позволил прийти к важному представлению
об области достижимых векторов N^n^ в коллективе непрерывных
автоматов и построить серию критериев G^, «расширяющих» область
устойчивого поведения системы. Эти представления, обобщающие на-
наши наблюдения, сделанные в случае дробно-линейной зависимости
[Стефанюк, 1968в], наряду с исходными представлениями об устойчи-
устойчивости работы таких систем, мы и сейчас считаем наиболее важными
своими результатами. Они, в сущности, являются следствием локаль-
локальной организации системы, при которой создание системы ведется ме-
методом «снизу-вверх», т. е. от свойств элементов, свойств их локального
взаимодействия к свойствам системы в целом.
С другой стороны, как нам кажется, к таким представлениям не
могли подойти те авторы, которые рассматривали задачу коллектив-
коллективного поведения как задачу распределения некоего общего ресурса, т. е.
как задачу децентрализации, а не локальной организации (см. гл. 1).
В разд. 3.1 будет рассмотрена система из п непрерывных автоматов
без взаимодействия, которая, как показано, является системой с иерар-
иерархической организацией. С одной стороны, такие системы часто встре-
встречаются на практике. С другой — оказалось возможным использовать
этот пример для формулировки важного для нас понятия эластичности
в общем виде, которое впервые было описано в работе [Стефанюк,
19686] на примере коллектива с дробно-линейным взаимодействием его
членов.
Показано, что для достижения эластичности устойчивого пове-
поведения локально-организованной системы необходимо привлекать ре-
рефлексивные соображения о том, каков будет результат для данной
подсистемы после «ответной» реакции остальных подсистем. Однако
и само свойство устойчивости, которое анализируется для коллектива
автоматов с непрерывным множеством действий в разд. 3.2, также
связано с подобными рефлексивными соображениями. Изложенные
Локальная организация целесообразного поведения 99
в этом разделе «содержательные условия устойчивости» впервые были
изучены в работах [Микийчук и Стефанюк, 1971; Стефанюк, 1973а].
Раздел 3.3 посвящен, в основном, изучению поведения непрерывных
автоматов в задаче о регулировки мощности в коллективе радиостан-
радиостанций, создающих при своей работе взаимные помехи. Такие помехи
возникает в современных системах мобильной связи при применении,
например, протокола CDMA. В книге построена математическая мо-
модель коллектива радиостанций, предложены и исследованы алгорит-
алгоритмы регулировки мощности. Изучены условия устойчивости работы
такой локально-организованной системы при наличии запаздывания.
Показано, в частности, что ограничения на величину запаздывания,
вытекающие из требования устойчивости, не растут, как можно было
бы ожидать, с ростом числа радиостанций. Последнее обстоятельство
говорит за то, что и при наличии запаздывания коллектив радиостан-
радиостанций можно продолжать рассматривать как локально-организованную
систему.
Многие факты говорят за то, что для исследования поведения ло-
локально-организованных систем необходима определенная совокупность
результатов, относящихся к теории М-матриц. В разд. 3.4 получены
оригинальные условия того, чтобы матрица Метцлера была бы М-
матрицей. Кстати, оно ведет к новым условиям невырожденности про-
произвольной матрицы, напоминающим по форме условия Адамара, но
являющимся специальной аналитической формой условий Фидлера.
Изучаемые в этом разделе условия являются попыткой в явной форме
отразить возможное «взаимодействие» элементов матрицы между со-
собой.
Раздел 3.5 посвящен обсуждению применения некоторых результа-
результатов гл. 3 к прикладной задаче — локальному управлению многозвенным
манипулятором. Хотя нам принадлежит исходная постановка задачи
локального управления как альтернатива распространенному центра-
централизованному способу, эта работа выполнялась совместно с С. В. Фоми-
Фоминым и Ю. И. Крюковым [Крюков и др., 1974; Крюков и Стефанюк,
1981].
Несколько позднее [Беркинблит, Гельфанд, Фельдман, 1986] при-
пришли к аналогичной локальной формулировке задачи управления мно-
многозвенной конечностью. Особенно интересным (и для нас новым) в ра-
работе этих авторов является экспериментальный материал, касающийся
наблюдений за тем, как лабораторная лягушка сбрасывает лапкой кусо-
кусочек бумажки с химическим раздражителем. (Хотя мы в начале нашего
пути также отталкивались от работ физиолога Н. А. Бернштейна [1966],
но все же основной своей задачей видели не моделирование живого
организма, а разработку управления техническими устройствами на
локальных принципах, дающих, как нами показано, ряд преимуществ
по сравнению с традиционными централизованными методами управ-
управления, опираясь при этом лишь на некоторые аналогии с живой при-
природой.)
100 Локальная организация целесообразного поведения [Гл. 3
Весьма близкий подход развивается также М. Хиросэ [Исия и др,
1988], который большое внимание уделяет надежности работы механи-
механической системы.
Автору книги принадлежит постановка всех задач, рассматривае-
рассматриваемых в данной главе. Однако глобальный вариант теоремы, сформу-
сформулированной нами в разд. 3.2, был доказан А. М. Микийчуком; в окон-
окончательной формулировке задачи локального управления манипулято-
манипулятором значительное участие принял С. Ф. Фомин [Крюков и др., 1974],
а Ю.И. Крюкову [Крюков и др., 1974; Крюков и Стефанюк, 1981]
принадлежит конкретизация математической модели двухуровневого
управления (см. приложение П.2).
Основные результаты главы были опубликованы в [Крюков и др.,
1974; Крюков и Стефанюк, 1981; Микийчук и Стефанюк, 1971; Стефа-
Стефанюк, 19716; 1973а; 19736; 1989в; Stefanuk, 1970; 1971; 1993].
В целом настоящая глава призвана показать, что локальная ор-
организация систем с непрерывным временем и непрерывным множе-
множеством состояний-действий является эффективным средством решения
многих прикладных задач, среди которых многодоступные системы
связи, системы связи с ретрансляторами, конвейерные и другие иерар-
иерархические системы, а также сложные робототехнические управляемые
системы.
3.1. Исследование роли взаимодействия при
локальном управлении
Здесь доказывается устойчивость локального, т. е. основанного на
ограниченной информации, управления в невзаимодействующем (стро-
(строго иерархическом) коллективе. Показывается принципиальная невоз-
невозможность при использовании естественно строящихся локальных кри-
критериев управления получить при локальном управлении «плавный» пе-
переход от случая взаимодействия в коллективе к случаю его полного от-
отсутствия. Этим обосновывается вывод о целесообразности дальнейшего
изучения существенно более сложных алгоритмов индивидуального по-
поведения (управления) в коллективе из взаимодействующих элементов.
Рассмотрим систему из п элементов, описывающуюся функциями
г = 1,. . . , п,
где ei(t) имеет смысл действия г-го элемента, a Vi(t) — величины
получаемого им эффекта в момент ?, причем всюду предполагается
выполненным неравенство dv{j'дв{ > 0.
При локальной организации каждый элемент выбирает свое дей-
действие независимо от других, располагая лишь локальной информацией,
сводящейся к двум величинам Vi{t) и ei(t).
Далее мы хотим показать, какие ограничения на возможность ло-
локального управления возникают в такого рода коллективах элементов.
3.1] Исследование роли взаимодействия при локальном управлении 101
В п. 3.1.1 вводится более широкое по сравнению с обычно подра-
подразумеваемым понятие отсутствия взаимодействия, при котором до-
допускается иерархичность структуры воздействий в коллективе, и пока-
показывается, что естественные дифференциальные алгоритмы локального
выбора действия с целью получения заданного (достижимого) эффекта
дают устойчивую систему во всей рассматриваемой области.
В п. 3.1.2 показывается, что в коллективе без взаимодействия
с неограниченной областью выбора величины действия достижим лю-
любой положительный вектор и. Затем доказывается неэластичность
устойчивого управления в произвольном коллективе на основе кри-
критерия d = Ci{ei,Vi,dvijде{, . . . ,dkVilde\,ai), связанная с отсут-
отсутствием естественного перехода от случая взаимодействия в коллективе
к случаю, когда взаимодействие отсутствует — свойство, обнаружен-
обнаруженное ранее на примере одной модели взаимодействия, названной нами
«дробно-линейной» моделью.
3.1.1. Устойчивость локального управления в невзаимодейству-
невзаимодействующем (иерархическом) коллективе. Приводимые здесь результаты
оправдывают введение идущего ниже определения отсутствия взаи-
взаимодействия в коллективе, несколько более широкого, чем самое про-
простейшее: взаимодействие отсутствует, если любые изменения действий
элементов никак не сказываются на величинах эффектов, наблюдае-
наблюдаемых у всех остальных элементов коллектива.
Пусть X — область определения функций
"i(t) = i/i(ei(*), . . . , en(t)), i = 1, . . . , п. C.1.1)
Рассмотрим в окрестности некоторой точки (ei,...,en) G X замк-
замкнутую цепочку воздействий следующего вида: бесконечно малое (б. м.)
изменение е\ вызывает, при постоянных прочих ej, j ф г, изменение v\x
(точнее, dv^/dei ф 0), б. м. изменение е^ вызывает, при постоянных
прочих ej, j ф ii, изменение z^2 (точнее, ди^/де^ ф 0),..., б. м.
изменение eik вызывает, при постоянных прочих ej, j ф ik-> изменение
щ (точнее, dvi/deik ф 0).
Определение. Если в каждой точке некоторого подмножества из
X не найдется ни одной такой замкнутой цепочки, то будем говорить,
что в этом подмножестве взаимодействие отсутствует.
Если взаимодействие отсутствует в некоторой точке (ei, . . . , еп) Е
Е X, то в этой точке можно так выбрать нумерацию элементов коллек-
коллектива, что если не указывать явно те переменные е/~ в функциях C.1.1),
для которых частные производные BiSi/de^ заведомо равны нулю, то
все функции расположатся в «треугольном» порядке:
= 1/2(еье2), C.1.2)
*Vi(ei,. • • , е„).
102 Локальная организация целесообразного поведения [Гл. 3
(На самом деле, в каждой г-й строке аргументы ej, j < г, также мо-
могут отсутствовать, но, в силу изначального предположения dvij'dei > 0
в число аргументов обязательно входит е^.)
Систему типа C.1.2) можно назвать строго иерархической в точке
(ei, . . . , еп). Возможность такого представления вытекает из следую-
следующего простого утверждения.
ЛеммаЗ.1. В невзаимодействующем коллективе величина эффек-
эффекта по крайней мере одного элемента не зависит от действий парт-
партнеров.
Доказательство. Предположим противное: для каждого эле-
элемента i найдется хотя бы один элемент ii, i\ ф г, такой, что dv^jде{х >
>0.
Это значит, что можно выписать бесконечный ряд номеров эле-
элементов г, ii, г2, • • • , г8,. . ., в котором dvi/de^ ф 0, ди^/де^ ф
Ф 0, . . . , dvisl/ deis ф 0, . . . Так как число различных номеров в этом
ряду не больше гг, то некоторые номера в нем повторяются, а это,
по определению, означает наличие взаимодействия в коллективе. Это
противоречие с условием леммы доказывает справедливость последней.
Последовательное применение этой леммы и приводит к C.1.2) (см.
идущий ниже п. 3.1.3, где даются точные формулировки и приводятся
примеры).
Если взаимодействие отсутствует в некоторой области из X, то для
каждой точки этой области возможна, вообще говоря, существенно своя
нумерация элементов, дающая представление C.1.2). Нам показалось,
однако, естественным ограничиться рассмотрением систем таких, что
если взаимодействие отсутствует в некоторой области D ? X, то
существует единая для всей области D нумерация элементов систе-
системы, приводящая к C.1.2). В технике известно большое число систем
такого типа — системы подачи воды на орошаемые поля, газопроводы,
конвейеры промышленных предприятий и др.
Целесообразность выделения класса коллективов без взаимодей-
взаимодействия видна на примере приводимой ниже теоремы, показывающей,
что при весьма общих ограничениях локальное управление в таких
системах всегда будет успешным.
Пусть коллектив является невзаимодействующим в области (быть
может, неограниченной)
ai^ei^bi, г = 1,...,п, C.1.3)
определения функций C.1.1), которые предполагаются непрерывными
и имеющими частные производные первого порядка.
Пусть и° является достижимым вектором, т. е. существует вектор
е° такой, что
Vi{t) = Vi[e\,...,e°n), i = l,...,n, C.1.4)
и е° — внутренняя точка (или точки) области D.
3.1] Исследование роли взаимодействия при локальном управлении 103
Рассмотрим такой алгоритм «движения к цели»:
{0, если а = аь v\ - щ(ег, . . . , е„) < 0,
0, если е{ = аь v\ - ^(еь . . . , еп) > 0, (*)
v\ — Vi(ei, . . . , еп) в остальных случаях,
выполняющийся для всех г = 1, . . . , п.
Тогда имеет место следующая теорема (ее доказательство вынесено
в п. 3.1.3).
Теорема 3.1. Если в области D выполняется
•mf^i = Aii>0, г = 1,. . . , щ C.1.5)
sup
D
= Aij < ос, гфз, г, j = 1,. . . , п, C.1.6)
то (9лл любой траектории e(t) системы (*) в интервале 0 ^ t ^ оо
верно fi(t) —> is° при t —> счэ; г = 1, . . . , п.
3.1.2. Неэластичность поведения для широкого класса критери-
критериев в локально-организованной системе. Настоящий раздел относится
к некоторому специальному подклассу коллективов. Предполагается,
что коллектив задается с помощью п непрерывных положительных
функций
Vi = щ{в1, . . . , еп), г = 1, . . . , п, C.1.7)
определенных на множестве
0 < а < оо, г = 1,. . . ,п. C.1.8)
Причем всюду в области определения выполняется
^>0, г = 1,...,п, C.1.9)
и, кроме того, для любого номера г = 1, . . . , п
lim i/i(ei,...,en) = oo, г = 1,...,п, C.1.10)
>oo
lim i/»(ei, . . . , е„) = 0, г = 1, . . . , га, C.1.11)
при любых, но фиксированных значениях переменных е^, j Ф г.
Самым существенным здесь является неограниченная «мощность»
каждого элемента. Действительно, свойства C.1.8)—C.1.10) дают воз-
возможность «скомпенсировать» влияние всех других членов коллектива
(если только последние не препятствуют этому, «наращивая» в ответ
величины своих действий).
104 Локальная организация целесообразного поведения [Гл. 3
Дальнейшие результаты поэтому легко переносятся на случай, ког-
когда вместо C.1.8) выполняется
a,i < е{ < оо, г = 1,...,п, C.1.12)
где а,{ — любое действительное число (или — оо), а вместо C.1.11)
выполняется
lim щ(еъ . . . , еп) = О, г = 1, . . . , п. C.1.13)
Рассмотрение такого подкласса коллективов из элементов с «неогра-
«неограниченными возможностями» позволяет выделить те специфические
требования к локальному управлению, которые обусловлены исключи-
исключительно процессами взаимодействия в коллективе (см. также разд. 3.2
настоящей книги).
Примерами задач вида C.1.7)—C.1.11), требующих локального
управления, являются некоторые задачи математической экономики
[Варшавский и др., 1969; Малишевский и Тенисберг, 1969], задача
о регулировке мощности в коллективе радиостанции [Стефанюк
и Цетлин, 1967] и др.
Упомянутые «неограниченные возможности» хорошо иллюстриру-
иллюстрируются следующим результатом.
Лемм а 3.2. При отсутствии взаимодействия в коллективе
C.1.7)—C.1.11) достижим любой наперед заданный положительный
вектор (*/?, . . . , v^)i m- e- множество достижимых векторов
является прямым произведением промежутков @, оо) возможных
значений vi, i = 1, . . . , п.
В работах [Стефанюк и Цетлин, 1967; Стефанюк, 1967] показано,
что область достижимых векторов в произвольном коллективе типа
C.1.7)—C.1.11), вообще говоря, строго «меньше» всего неотрицатель-
неотрицательного ортанта. Поэтому, если выбор действия (локальное управление)
с целью обеспечения наперед заданного v\ производится по алгоритму
типа описанного в предыдущем параграфе, то в случае, когда вектор
априорно выбранных значений эффектов (*/?, ...,*/?) недостижим,
в коллективе будут неизбежно возникать неустойчивые режимы.
Заметим, что по локальной информации Vi(i), ei{t) нельзя заранее
установить, достижим ли данный вектор или нет.
Всегда устойчивый выбор действия при той же информации можно
надеяться получить с помощью следующих алгоритмов:
ei = -— Ci{eu vu OLi), i = 1, . . . , n, C.1.14)
где Ci(e{, Vi,OL{) — локальный критерий выбора действия. Подчеркнем,
что С{ зависит от ej, j ф г, лишь постольку, поскольку от них зависит
V{, а величина ol{ — некоторый фиксированный параметр, априорно
выбираемый г-м элементом.
Переход к такого рода минимизации величины некоторого локаль-
локального критерия Ci(ei, v^, a^) будет оправдан при этом только в случае,
3.1] Исследование роли взаимодействия при локальном управлении 105
если параметры ai, . . . , ап можно действительно выбирать независимо
и для каждого такого выбора алгоритмы C.1.14) обеспечат устойчи-
устойчивость.
Теперь сформулируем и докажем теорему, являющуюся обобщени-
обобщением одной теоремы из работы [Стефанюк, 19686] на коллективы вида
C.1.7)-C.1.11), и обсудим ее.
Для ряда задач локального управления естественным является та-
такой подход, при котором требуется построить устойчивое локальное
управление системой, условия взаимодействия в которой не полностью
известны. Известна лишь принадлежность системы к определенному
классу (пример см. в [Малишевский и Тенисберг, 1969]). При этом, в си-
силу ограничения локальной информацией, тактика поведения элементов
должна быть единой для всех возможных систем из указанного класса.
В таких задачах представляется естественным потребовать, чтобы,
скажем, при уменьшении «степени взаимодействия» в коллективе кри-
критерий Ci(ei,Vi,a,i) обеспечивал бы все большую степень произвола
в выборе равновесного в смысле C.1.14) вектора эффектов и (путем
соответствующего выбора а^), а в пределе — в невзаимодействующем
коллективе — он позволял бы выбирать любое наперед заданное поло-
положительное V{ членами коллектива.
Такое свойство в работе [Стефанюк, 19686] было названо эластич-
эластичностью. Оказывается, что выбор действия по алгоритму C.1.14) эла-
эластичности не обеспечивает, т. е. не получается естественного перехода
от случая взаимодействия к его отсутствию.
Пусть К — определенный коллектив со взаимодействием и не все
положительные векторы в нем достижимы. Тогда имеет место такое
утверждение (его доказательство приведено в п. 3.1.3).
Теорем а 3.2. При любом критерии Ci{ei,Vi,ai) не могут одно-
одновременно выполняться два положения а) и б), где:
а) в коллективе К каждому набору а = (c^i, . . . , ап), где а,{ Е Pi,
Pi — фиксированная область выбора параметра ai, соответствует
единственное положительное решение е° системы
— Ci(ei, щ, аг) = 0, г = 1, . . . , щ C.1.15)
б) в произвольном невзаимодействующем коллективе в соответ-
соответствии с этим уравнением всегда имеется «равновесное» положитель-
положительное is°, г = 1, . . . , п, причем величина */? зависит только от величины
ai (и вида функции Ci), так что априорным выбором ai из Pi величине
v° может быть придано любое заранее указанное положительное
значение.
Замечание 1. Доказательство теоремы останется в силе, если в С{
включить частные производные Vi по е^ любых порядков, что приведет
к рассмотрению вместо C.1.15) положений равновесия вида
C.1.16)
106 Локальная организация целесообразного поведения [Гл. 3
Замечание 2. Качественно утверждение теоремы можно пояс-
пояснить так. Производные вида d/dei не позволяют отличить случай
невзаимодействия от случая коллективного взаимодействия, поскольку
при вычислении таких производных (например, с привлечением мето-
методов экстремального регулирования) предполагается, что действия всех
остальных участков коллектива остаются неизменными и нет возмож-
возможности «догадаться», могут ли они дать «ответную реакцию».
Замечание 3. Оставаясь в рамках локального управления, одна-
однако, все же можно добиться указанной эластичности, правда, путем зна-
значительного усложнения тактики поведения каждого элемента системы.
В частности, теорема теряет, вообще говоря, смысл, если рассматривать
положения равновесия с рефлексией:
0, i = l,...,п. C.1.17)
Критерий такого типа был построен для одного класса взаимо-
взаимодействующих коллективов вида C.1.7)—C.1.11) в работах [Стефанюк,
1969; 19686], где показано, что для него положения а) и б) могут быть
выполнены одновременно. Там же обсуждаются некоторые вопросы
реализации управления по критерию C.1.17) (см. также [Стефанюк,
1989в]).
3.1.3. Доказательство теорем 3.1 и 3.2. I. Полная иерархическая
схема невзаимодействующего коллектива.
Обозначим через Qi совокупность номеров тех элементов коллек-
коллектива C.1.1) г^ , . . . , iqi , на каждый из которых никто не воздействует.
Согласно лемме 3.1, эта совокупность не пуста. Рассматривая под кол-
коллектив из всех остальных элементов, выделим Q2 — совокупность номе-
.B) .B)
ров тех элементов г\ , . . . ,iq2 педколлектива, на каждый из которых
не воздействует ни один из элементов этого подколлектива. Согласно
лемме 3.1, совокупность Q2 также не пуста, если только в Qi не пе-
перечислены все элементы коллектива. (По данному выше определению
невзаимодействия в точке очевидно, что в невзаимодействующем кол-
коллективе не взаимодействуют и любые педколлективы по тем перемен-
переменным, которые относятся к рассматриваемому подколлективу.)
Рассмотрим далее педколлектив, возникающий после удаления из
коллектива элементов с номерами из Q\ и Q2, и аналогичным постро-
построением выделим (Зз и т. д. В результате совершения конечного числа
т ^ п таких шагов мы приходим единственным образом к полной
иерархической схеме данного невзаимодействущего коллектива (в точ-
точке!), представляющей собой таблицу
Q2:i{*\...,iq22\ C.1.18)
ft . Am) Am)
Ч/7П • L\ 1 • • • 1 ЬЦт 1
3.1] Исследование роли взаимодействия при локальном управлении 107
(i^s) е {1,. • • ,гс}, j = l,...,<7s, s = l,...,m, ra^n).
Естественно трактовать индекс s как
ранг данного иерархического уровня Qs.
Из приведенного построения видны два
общих свойства любой полной иерархиче-
иерархической схемы: все элементы одного иерархи-
иерархического уровня (т. е. имеющие один ранг)
не воздействуют друг на друга; на каждый
элемент ранга s ^ 2 воздействует по край-
крайней мере один элемент ранга 5 — 1.
Упорядочив произвольным образом
элементы данного ранга и перенумеро-
перенумеровав натуральными числами все элемен-
элементы, начиная с первого ранга, мы при-
приходим к представлению C.1.2), которое
уже не является единственным. Однако
эта неоднозначность несущественна, если
фиксирована полная иерархическая схема
C.1.18).
В качестве примера рассмотрим невза-
невзаимодействующий коллектив
Рис. 3.1. Пример графа воз-
воздействий в невзаимодейст-
невзаимодействующем коллективе
= i/i(еь 0, 0, 0, 0,0),
= ^3@,е2,е3,0,0,0),
= ^4(ei,0,0,e4,0,0),
C.1.19)
Щ = ^6@,0,0,0,e5,e
Его полная иерархическая схема имеет вид
: 3,4,5,
C.1.20)
Для сравнения на рис. 3.1 приведен граф воздействий в коллек-
коллективе C.1.19), где направленные дуги означают наличие воздействия
(с указанием направления), а число концентрических окружностей
соответствует рангу охватываемой ими точки.
Ясно, что нескольким различным невзаимодействующим коллек-
коллективам, имеющим различные представления в виде графа или в виде
C.1.18), может соответствовать одна и та же иерархическая схема
108 Локальная организация целесообразного поведения [Гл. 3
C.1.2) и наоборот. Приведем пример, когда два коллектива
= i/2(ei,e2,0), ^2 = ^i@,e2,0), C.1.21)
2, e3), i/3 = ^i(eb e2, e3),
имеют внешне схожую структуру, и одно и то же представление C.1.2),
но различные полные иерархические схемы.
Для всех утверждений настоящей работы важным является пред-
пол ожение о том, что в каждой точке области D Е X имеется одна и та
же полная иерархическая схема. Тогда переход к представлению C.1.2)
для всей этой области правомерен.
II. Доказательство теоремы 3.1.
Заметим, что в коллективе без взаимодействия при выполнении
C.1.5) равновесный вектор е°, обеспечивающий заданные значения
*/?,..., */°, является, очевидно, единственным. Этот факт легко следу-
следует по индукции из представления C.1.2). Пользуясь этим представле-
представлением, будем доказывать теперь, что система (*) асимптотически устой-
устойчива, т. е. что для любой траектории e(t) этой системы, определенной
на полубесконечном промежутке, выполняется соотношение e(t) —>• е°
при t —ь оо.
На самом деле, избранный путь доказательства позволяет отметить
также некоторые особенности «динамики» этой системы.
Рассмотрим траекторию e(t) и покажем, что, начиная с некоторого
конечного фиксированного для этой траектории момента времени ?п,
выполняется
k° - »i(t)\ ^ Pi(*), г = 1, . . . , n, t^tn, C.1.22)
где (p(t) — определенные при t ^ tn неотрицательные, непрерывные
и невозрастащие функции, строго убывающие при тех ?, где ifi(t) ф 0,
причем (pi(i) —> 0 при t —>• оо. (Ниже для краткости назовем такую
совокупность свойств (^-свойством.)
Доказательство поведем по индукции, начиная с первого в нумера-
нумерации C.1.2) элемента.
Если в момент t наблюдается \и^ — v\(i)\ = 0, то, в силу алгоритма
(*), это соотношение будет выполняться во все последующие моменты
времени.
Если же верно \и± — v\(t)\ ф 0, то имеем, очевидно, из (*) соотно-
соотношение
= " К -
К " "il < 0. C-1.23)
ибо случаи
ei=ob vZ-vi{ei)<0,
ei =6i, ^i-^i(ei) >0
3.1] Исследование роли взаимодействия при локальном управлении 109
исключаются, поскольку при выполнении любого из условий C.1.24) не
могла бы существовать такая величина ej, что v\ = v\{e°^).
Соотношение C.1.23) показывает, что \v\ — v\{f)\ монотонно убыва-
убывает, стремясь при t —} оо к нулю, и, таким образом, эта величина может
быть выбрана в качестве <p(t), причем соотношение
K-«/i(*)|<^i(t) C.1.25)
выполняется при t ^ 0.
Следуя далее индуктивному рассуждению, предположим теперь,
что, начиная с некоторого момента t^-i выполняется
К-^(г)К^(г), * = i л-1. C.1.26)
Покажем, что тогда существует момент времени ?/,, tk ^ ?/c-i такой,
что при t ^ tk верно соотношение
(буквой ip с индексами мы всюду в этом доказательстве обозначаем
функции, обладающие (^-свойством).
А. Существует такой момент ?/,, tk ^ ^/c-i, что при t ^ tk не может
выполняться ни одно из соотношений
< 0 при
> 0 при
< 0 ПРИ ^(t) = a2,
> 0 при e2(t) = 62, C.1.28)
< 0 при ek(t) = a*,
> 0 ПРИ
(В этой цепочке не указываются те соотношения, для которых либо
(ц = —оо, либо bi = +оо, г = 1, 2, . . . , к.)
Действительно, в силу C.1.5), для существования е° такого, чтобы
выполнялось vl = z/i(e°), причем е° — внутренняя точка области D,
необходимо соблюдение неравенств
v°i-vi(e\,...,e\_1,ai) > 0,
^-^(е^...,ег°_1,М<0, C.1.29)
г = 1,. . . ,п.
Поскольку, с учетом C.1.5), выполнение соотношения C.1.26) возможно
лишь если при t —> оо верно ei(t) —> е°, г = 1, . . . , к — 1, то из C.1.29)
110 Локальная организация целесообразного поведения [Гл. 3
получаем
lim К-!/*(*)) >0,
lim (v°-isi(t)) < 0, C.1.30)
г = 1, . . . , п.
Теперь легко видеть, что найдется такой момент ?&,?& ^ ?/с-ъ
что при t ^ tk невозможно выполнение ни одного из соотношений
C.1.28). Действительно, предположение, что для каждого t найдется
такой момент t' = t'(t), что верно хотя бы одно из соотношений C.1.28),
например г-е, ведет к противоречию, так как в этом случае мы имели
бы, скажем,
lim (i/°-!/.(*)) <0, C.1.31)
а это неравенство невозможно согласовать с C.1.30).
В. Рассмотрим при t ^ tk следующую функцию
которая обладает (^-свойством как сумма с положительными коэф-
коэффициентами конечного числа функций, обладающих при t ^ tk ip-
свойством.
Для рассматриваемой нами траектории e(t) на полуоси времени
t ^ tk могут быть выделены чередующиеся отрезки времени (замкну-
(замкнутые интервалы), на которых верно
C.1.33)
и открытые интервалы между ними, где верно обратное:
C-1-34)
Заметим, что из последнего неравенства, с учетом определения
функции Ф/g^), вытекает (принимая во внимание, что при t ^ tk не
может выполняться ни одно из соотношений C.1.28) и, следовательно,
алгоритм (*) «упрощается»), что
к-1
3.1] Исследование роли взаимодействия при локальном управлении 111
Таким образом, величина \i/% — Vk{t)\ монотонно убывает, причем
в течение открытого интервала C.1.34) производная ~r\uk~ uk(t)\
может стремиться к нулю лишь вдоль траектории ^(?), стремящейся
()
к z/?, так как lim (fi(t) = 0. Построим теперь такую непрерывную
t—>-оо
функцию
), при t из замкнутых интервалов вида C.1.33),
Wk ~ vk(t)\ при t из замкнутых интервалов вида C.1.34).
Эта «склеенная» функция, очевидно, обладает (^-свойством и при всех
t ^ tk для нее выполняется C.1.27). Отсюда по принципу полной
математической индукции будет выполнено и соотношение C.1.22).
Теорема доказана.
III. Доказательство теоремы 3.2.
Допущение, что пункты а) и б) выполнимы одновременно, ведет
к противоречию. Действительно, пусть в коллективе К недостижим
вектор */?, . . . , v°n.
Построим для каждого а Е Р, где Р : Р\ х . . . х Рп, положитель-
положительное решение е°(а) уравнения C.1.15), которое согласно а) существует,
единственно и удовлетворяет системе уравнений
д
де.
= 0,
C.1.36)
г = 1, . . . ,п.
Для каждого вектора а рассмотрим теперь невзаимодействующий
коллектив вида
щ = »i (ef (а),..., е?.», еи е?+1(а),..., е° (а)), ^
г = 1, . . . , п.
Далее, пользуясь положением б), выберем а^, . . . , а^ так, чтобы
получить в г-м элементе невзаимодействующего коллектива величину
эффекта, равную г/°, г = 1, . . . , п. Обозначив соответствующее реше-
решение C.1.15) для этого случая через ei, . . . , ёп, имеем тождества
е° (а)), аг°
= 0,
г = 1,...,гг. C.1.38)
Согласно б), однако, в невзаимодействующем коллективе C.1.37)
выбранное j/? целиком определяется величиной с^° (и видом G^, т. е.
112 Локальная организация целесообразного поведения [Гл. 3
наравне с C.1.38) мы могли бы записать также и
U УЧ I / О / Г) \ О/Г>\ Г) / О \ Г) / О \ \ Г>\ /-л
— U)
г = 1,...,п. C.1.39)
(Равновесное ё^, вообще говоря, заменится на какое-то другое ё^.)
Сравнивая C.1.39) с C.1.36) для а = а°, мы видим, что решением
C.1.39) будет ё^ = е°(а°), причем по условию теоремы это решение
единственно. Но поскольку C.1.39) относится к невзаимодействующему
коллективу C.1.37), соответствующему а = а°, тоиз C.1.37) получаем
и° = щ{е\{ао),...,е°п{а°)), i = 1,..., п. C.1.40)
Чисто формально это соотношение означает, что вектор v\, . . . , v^
достижим в исходном коллективе К. Полученное противоречие дока-
доказывает справедливость утверждения теоремы 3.2.
3.2. Содержательные условия устойчивости
локального управления
Для систем S с антагонистическим характером взаимодействия
компонент ниже получены необходимые и достаточные условия устой-
устойчивости в малом для естественных алгоритмов выбора действия Si
в рамках ограниченной, локальной информации. Они являются диф-
дифференциальным выражением условий, сформулированных нами ранее
в [Стефанюк и Цетлин, 1967]: когда некоторая компонента выбира-
выбирает новое действие, то она должна быть уверена в соответствующем
результирующем изменении получаемого эффекта, по крайней мере
в случае, когда остальные компоненты не стремятся «улучшить» свое
положение. Примеры систем с взаимодействием такого типа можно
найти в [Стефанюк, 1968в; Hicks, 1946]. Далее приводится формули-
формулировка соответствующей теоремы о глобальной устойчивости подобных
систем [Микийчук и Стефанюк, 1971].
Отличительной особенностью исследуемых условий является их
естественная интерпретация в терминах взаимодействия компонент
системы S между собой (см. рис. 1.3). Этим они отличаются от нес-
несколько более формальных условий устойчивости, изученных другими
авторами ([Малишевский, 1972; Опойцев, 1974-1975; Андрусевич, 1981]
и др.)-
Итак, пусть взаимодействие подсистем Si в системе S задается
с помощью следующих непрерывных (вместе со своими частными про-
производными) функций
... _ 1,.{Рл р \ П. < Р. < а. 7 — 1 п (Ч 9 1}
Предполагается, что, в силу этих соотношений, при увеличении
(уменьшении) е^ величина эффекта Vi увеличивается (уменьшается)
3.2] Содержательные условия устойчивости локального управления 113
при выполнении ej = const, j = 1, . . . , n, j ф i. Наоборот: если увели-
увеличивается (уменьшается) какое-то действие е^, j ф г, а другие действия
остаются неизменными, то эффект V{ не возрастает (не убывает).
Пусть и° = (г/J, . . . , z/°) — вектор требуемых величин эффектов
такой, что в области D допустимых изменений е^, i = 1, . . . , п, суще-
существует единственный вектор е° = (ej, . . . , е°), удовлетворяющий
i/? = i/?(ej,...,e°), t = l,...,n, C.2.2)
т. е. вектор v° является достижимым.
Настоящий раздел посвящен выяснению того, в каких случаях
независимый выбор действия компонентами системы в соответствии
с алгоритмами
ei = v°{ - щ(ег, . . . , еп), г = 1, . . . , п, C.2.3)
будет устойчивым, т.е. при t —>• оо будет выполняться ei(t) —)¦ е° и,
следовательно, ^(t) —>- i/?, г = 1, . . . , n -1).
3.2.1. «Обобщенная локальная устойчивость». Описанный выше
характер зависимости эффекта щ от «своего» е^, не гарантирует устой-
устойчивости C.2.3) из-за реакции остальных S компонент на изменение
величин их эффектов. В такой системе, как было отмечено в работе
[Стефанюк и Цетлин, 1967], в принципе, возможны неустойчивые ре-
режимы. Поэтому в качестве необходимого условия устойчивости алго-
алгоритмов типа C.2.3) в работе [Стефанюк и Цетлин, 1967] выдвигалось
следующее: увеличение (уменьшение) е^ должно приводить к увели-
увеличению (уменьшению) V{, даже если остальные компоненты изменят
действия, но лишь так, чтобы не увеличить (не уменьшить) получаемые
ими эффекты по сравнению с тем, что было раньше.
Сформулируем более точно [Микийчук и Стефанюк, 1971]: пусть
в момент t в системе были выбраны действия ej, . . . , е°, которым
отвечали */?,...,*/?. Пусть теперь г-я компонента устанавливает новое
действие е* = fte°, где п ф 1, и пусть после этого остальные компоненты
устанавливают новые действия ej, . . . , е*.
Естественным необходимым условием устойчивости локально-ор-
локально-организованной системы C.1.23) в работе [Стефанюк и Цетлин, 1967]
считалось, что для любого выбора «начального» номера г должно
выполняться неравенство
6* е° 0 C.2.4)
^t(ei, . . . ,еп) - i/*(ei, . . . , еп)
для всех таких ej, j ф г, для которых при к > 1 справедливо
х) Основные утверждения этого раздела легко обобщаются на случай, когда
вместо C.2.3) используются алгоритмы ё» = /г (^г° — ^(ei, . . . , еп)), где /г —
монотонно растущая функция своего аргумента, причем /г@) = 0, г = 1, . . .
... , п.
114 Локальная организация целесообразного поведения [Гл. 3
v) = Vi{e\,..., e*n) ^Vi{e\,..., e°n), C.2.4а)
а при п < 1 справедливо
v] = vjiel, ...,е*п)^^(е1,..., е°п). C.2.46)
(Выполнение условий C.2.4), C.2.4а), C.2.46) для любой точки
(ej, . . . , е^) из D и для любого г было исследовано в [Стефанюк и Цет-
лин, 1967] для случая дробно-линейного взаимодействия и названо там
«обобщенной локальной устойчивостью».)
3.2.2. Дифференциальная форма содержательных условий устой-
устойчивости. Здесь мы будем изучать устойчивость в малом системы
C.2.3), поэтому будем рассматривать условия C.2.4), C.2.4а), C.2.46)
в малой окрестности е°(*/°), предполагая, что е° — внутренняя точка
множества D, являющегося прямым произведением интервалов изме-
изменения е^, г = 1, . . . , п.
При некоторых условиях (см. ниже), можно говорить о пределах
при k —> 1 выражения C.2.4) при различных ej, j ф г, удовлетворя-
удовлетворяющих C.2.4а), C.2.46). Следствием C.2.4), C.2.4а), C.2.46) является
следующее требование:
lim
l, . . . ,e*) - i/i(ej, . . . ,e
(Этот предел, согласно предположенным свойствам системы, суще-
существует.) Будем пока предполагать (обоснование дается ниже) справед-
справедливость предельных переходов при других реализациях ограничений
C.2.4а, 3.2.46). Так, при к ->> 1 следствием C.2.4, 3.2.4а, 3.2.46) являет-
является, в частности, условие
hm
* *ч /О
i, . . . ,en) - ^i(el5 . . . , e
> 0. C.2.6)
Оно означает, что v\ должно возрастать (убывать) при возрастании
(убывании) ei в случае, если часть компонент коллектива фиксирует
свои действия, а остальные меняют их так, чтобы сохранить, если это
возможно, величины эффектов.
Перепишем выражение C.2.6), принимая в нем за независимые
переменные */]_, . . . , г/8, es+i, . . . , еп (предполагая, что это можно сде-
сделать). Поскольку предельный переход в C.2.6) совершается при усло-
условии, что все эти переменные, кроме v\, не изменяются, то е\ в этих
3.2] Содержательные условия устойчивости локального управления 115
переменных изменяется только благодаря изменению величины v\ и
поэтому е\ —>• е\ эквивалентно v\ —>• v\. Тогда вместо C.2.6) получаем
(* О ОО О \ / О О ОО О \
г/х,г/2, . . . ,г/5,в!, . . . ,еп) - еЦг/х,^, . . . ,г/5,в!, . . . ,еп) _
11II1 * о —
- ^ > U, [6.2.7)
где частная производная вычисляется в точке (VJ, i/| ? • • • ? ^s ? ei> • • •
...,е°).
И вообще, следствием C.2.4, 3.2.4а, 3.2.46) является требование
положительности всевозможных частных производных (если они, ко-
конечно, существуют) вида
g*(fr,---,/W«,/W--,/b)>0) i = 1)...)n> C.2.8)
где /3/г равно либо г//,, либо е&, /с = 1, . . . , гг, /и ф г.
Легко видеть, что необходимым и достаточным условием суще-
существования всех частных производных указанного вида в окрестности
(/??, . . . , /3?_i, Vi, Pi+n • • • ^ /^п) является условие неособенности всех
главных миноров матрицы Якоби D{y\, . . . , isn)/D(ei, . . . , en).
Действительно, по предположению, ^(ei, . . . , еп) представляют со-
собой непрерывные функции и имеют непрерывные частные производ-
производные, поэтому функции, участвующие в следующей системе
{<l>i(z/i, . . . , i/n, еь . . . , е„) = i/i - i/i(ei, . . . , е„) = О,
C.2.9)
Фп(г/Ь . . . , i/n, еь . . . , е„) = i/n - i/n(ei, . . . , en) = О
также определены и непрерывны вместе со своими частными производ-
производными по всем аргументам в точке (j/f, i/|? • • • ? ^s ? ei^ • • • ? en)^ которая
является решением этой системы уравнений. Тогда условие, что ранг
якобиана
равен п, является необходимым и достаточным, чтобы в некоторой
окрестности точки (/3i, . . . , /Зп), где /3& равно либо i/д., либо е^, перемен-
переменные определялись из системы C.2.9) как однозначные, непрерывные
вместе со всеми своими частными производными функции остальных
п переменных. Этот якобиан отличается от якобиана
(п) _
тем, что в столбце, где производная берется по /3^ = и^ диагональный
элемент равен 1, а остальные элементы столбца равны нулю. Отсюда,
116 Локальная организация целесообразного поведения [Гл. 3
если zi, . . . , г8 — значения индекса &, для которых /3& = v^, то C.2.10)
в точности равен
причем, если все /3 k равны г//,, то C.2.10) равен единице. Поскольку
якобиан C.2.12) представляет собой главный минор якобиана C.2.11),
то утверждение доказано.
Заметим, что C.2.12) соответствует подсистеме исходной системы,
которая выделяется тем, что компоненты с номерами, отличными от
ii, . . . , г8ч фиксируют действия. Если ни один из якобианов C.2.12) не
обращается в нуль, то можно рассмотреть матрицу Якоби, обратную
C.2.12), т.е.
D(eix, ...,eis
C.2.13)
Ее диагональными элементами и будут интересующие нас частные
производные
*«<* — *»>, C.2.14)
где г = г*1, . . . , г5, /3^ = и^, . . . , Cis = ^в, а остальные (Зт заменяются
на ет.
Каждая такая производная равна отношению величин некоторых,
двух главных миноров якобиана C.2.11). В частности, обозначая через
jl1) ? jB), . . . , j(n> цепочку «верхнеугловых» окаймляющих главных
миноров C.2.11), имеем очевидные соотношения
де\(и\,е2, • • • , en) JA) _ ^62(^1,^2,62, • • • , еп)
C.2.15)
3.2.3. Устойчивость в малом. Проделанные выкладки позволяют
легко установить основной результат разд. 3.2:
Теорема 3.3. Пусть V{ = г^(еъ • • • ? еп)> г = 1, . . . , п, — непрерыв-
непрерывные вместе со своими частными производными в окрестности (ej, . . .
... , е°) функции от (ei, . . . , еп), удовлетворяющие
|g>0, |^<0, i^j, i,j = l,...,n. C.2.16)
Тогда необходимым и достаточным условием устойчивости в ма-
малом системы
ё{ = v°{ - ^(еь...,еп), г = 1,...,тг,
3.2] Содержательные условия устойчивости локального управления 117
в окрестности точки (ej, . . . , е° ), удовлетворяющей C.2.2), является
условие существования и положительности всевозможных частных
производных вида
где /3/, равно либо v^, либо e^, k = 1, . . . , n, & 7^ г.
Доказательство. Рассмотрим систему первого приближения
для C.2.3). Ее устойчивость определяется якобианом C.2.11) (со знаком
« — »). В силу C.2.16) этот якобиан является матрицей Метцлера, поэто-
поэтому для того, чтобы полученная линейная система была бы устойчивой,
необходимо и достаточно, чтобы все главные миноры C.2.11) были бы
положительны [Карлин, 1964]. Определитель C.2.11) отличен от нуля
согласно C.2.2).
Теперь необходимость вытекает из того, что если все главные мино-
миноры C.2.11) положительны, т. е. эта матрица является М-матрицей, то
существуют все частные производные, упоминаемые в формулировке
теоремы, и, в силу абзаца, идущего после формулы C.2.14), удовлетво-
удовлетворяется C.2.8).
Достаточность вытекает из C.2.15), поскольку из положительности
цепочки угловых окаймляющих главных миноров матрицы Метцлера
следует положительность всех главных миноров [Гантмахер, 1966].
Замечание 1. Из доказательства видно, что требование C.2.8)
можно было бы заменить на условие положительности только тех
частных производных, которые входят в C.2.15).
С другой стороны, легко показать, что нельзя ограничиться требо-
требованием, чтобы выполнялись только неравенства
> 0, г = 1,...,п, C.2.17)
так как при этом некоторые производные C.2.8) могут оказаться непо-
неположительными.
Замечание 2. Утверждение теоремы остается, очевидно, в силе,
если условие C.2.16) заменить условием симметричности матрицы вза-
взаимодействия компонент системы
о о о
A -L А Л А — Л ry, (Q О 1Я"!
l7^3i г1 3 — *-ч • • • ini {6.Z.1O)
да ' "' dej да ' ^J' 'J -,.-.,-,
что позволяет несколько расширить класс рассматриваемых систем.
Замечание 3. Высказанная нами гипотеза о глобальной устой-
устойчивости локально-управляемой системы C.2.3) с неограниченной мощ-
мощностью (свойства 3.1.8—3.1.11) при выполнении условий C.2.4), C.2.4а),
C.2.46) была предложена А. М. Микийчуку в качестве темы дипломной
работы на кафедре общих проблем управления мехмата МГУ, которому
удалось доказать справедливость этой гипотезы в достаточно общих
предположениях [Микийчук и Стефанюк, 1971].
118 Локальная организация целесообразного поведения [Гл. 3
3.3. Поведение коллектива автоматов в задаче
о регулировке мощности
Работа современной системы связи (в частности, сети радиосвязи)
является по существу функционированием совокупности взаимодей-
взаимодействующих устройств, выполняющих своеобразные задачи перераспре-
перераспределения информации. Для этих систем типичны нестационарность об-
обстановки, отсутствие априорных сведений и необходимость (для каж-
каждого устройства) выбора характеристик в зависимости от действий
остальных.
Эти особенности сближают работу системы связи с поведением (иг-
(играми) автоматов и, по-видимому, позволяют использовать имеющиеся
там методы и результаты. При этом опыт показывает, что технические
средства, обеспечивающие целесообразное поведение системы, отно-
относительно просты (малая память, однородность конструкций и т. д.)
и допускают естественные технические реализации г).
3.3.1. Моделирование систем связи. Среди всевозможных коллек-
коллективов автоматов особый интерес представляет специальный класс кол-
коллективов, однородных по своему составу (все автоматы коллектива оди-
одинаковые по конструкции) и состоящих из автоматов, которые «обща-
«общаются» только через среду, т. е. каждый автомат получает на вход лишь
некоторый суммарный результат своих действий и действий партнеров.
Изучению поведения (игр) таких автоматов посвящены работы
[Гельфанд и др., 1963; Стефанюк, 1963] и некоторые другие. Основной
результат этих исследований — выяснение принципиальной возмож-
возможности решения достаточно сложных коллективных задач коллекти-
коллективом автоматов, которые получают минимальные сведения о структуре
коллектива и характере задачи в форме «штрафов» и «нештрафов»,
зависящих от поведения всех членов коллектива. В однородных кол-
коллективах автоматов каждый участник ведет себя так, как если бы он
«не знал» о существовании других членов коллектива, тем не менее
коллектив как целое обнаруживает в ряде случаев целесообразное по-
поведение.
Однородные коллективы автоматов представляют, по-видимому,
наиболее естественное средство решения задач, возникающих в совре-
современных системах связи, где природа задач не позволяет автоматам
знать друг о друге «слишком много», а все элементы встречающихся
там коллективов a priori равноправны.
Одна из них — задача о регулировке мощности в коллективе радио-
радиостанций, создающих взаимные помехи.
В работе [Стефанюк и Цетлин, 1967] сформулирована матема-
математическая модель, описывающая коллектив радиостанций в терминах
мощностей и отношений шум/сигнал для каждой пары радиостанций,
) Напомним, что мобильная связь стала внедряться в жизнь лишь в сере-
середине 1980-х годов.
3.3] Коллектив автоматов в задаче о регулировке мощности 119
и исследованы ограничения на возможные в этом коллективе сово-
совокупности отношений шум/сигнал, вытекающие из принятой модели.
Чтобы сделать настоящую работу замкнутой, в п. 3.3.2 будут приведе-
приведены некоторые результаты статьи [Стефанюк и Цетлин, 1967].
В п. 3.3.3 рассматривается конструкция автоматов регулировки
мощности, составляющих коллектив, т. е. указывается тактика смены
состояний такого автомата под воздействием среды. В следующем
п. 3.3.4 изучается поведение коллектива из таких автоматов, перед
которым ставится задача выбора некоторого фиксированного векто-
вектора отношений шум/сигнал. Основное внимание обращено на вопросы
устойчивости.
В п. 3.3.5 содержится попытка учесть статистическую природу сиг-
сигналов и шумов, что приводит к изучению работы коллектива автома-
автоматов при наличии запаздывания. Пункт 3.3.6 содержит некоторые со-
соображения о соотношении коллектива радиостанций, моделирующего
асинхронно-адресную коммуникацию, и современной мобильной связи
[Невдяев, 2002].
3.3.2. Математическая модель коллектива радиостанций. Ниже бу-
будут изложены некоторые результаты работы [Стефанюк и Цетлин,
1967] и их следствия.
При современной плотности радиостанций частотно-временных воз-
возможностей эфира явно недостаточно для обеспечения полностью неза-
независимой работы различных радиоканалов [Эйдус, Марков, Венедиктов,
1965; Невдяев, 2002]. Поэтому качество связи в значительной мере
зависит от уровня перекрестных помех, возникающих между этими
парами.
Пусть п пар приемник—передатчик поддерживают попарную связь.
Рассмотрим случай, когда передатчик каждой пары при своей работе
создает шум на входах приемников других пар этого коллектива. Тогда
отношение шум/сигнал А^ на входе г-го приемника равно
C.3.1)
где ?^? = 1,2,...,n, — мощность г-го передатчика, N^ — аддитивный
шум на входе г-го приемника, aij ?j — эквивалентная шумовая мощ-
мощность, поступающая на вход г-го приемника от j-ro («чужого») пере-
передатчика — по модельному предположению она связана с мощностью ? j
коэффициентом пропорциональности aij ^ 0, г ф j, г, j = 1, 2, . . . , п.
Аналогично ац ?^ есть полезная мощность.
При произвольных a^j ^ 0 такая модель включает в себя как
частные следующие случаи. Например «чужой» сигнал воспринима-
воспринимается г'-м приемником как неорганизованный, не несущий информации.
Тогда коэффициенты а^- связаны с ослаблением сигнала с расстоянием,
направленностью антенн и т. д. Другой случай: сигнал j-ro передатчика
воспринимается г-м приемником как осмысленный, но «неинтересный»
для этого приемника, тогда мешающее действие j-ro передатчика резко
120 Локальная организация целесообразного поведения [Гл. 3
возрастает (а^- велико), оставаясь пропорциональным полной мощно-
мощности, излучаемой j-м передатчиком.
В работе [Стефанюк и Цетлин, 1967] показано, что в схему C.3.1)
укладывается работа п пар радиостанций, использующих для связи
некоторое число ретрансляторов с фиксированными коэффициентами
усиления по мощности.
В настоящей работе везде предполагается, что величины коэффи-
коэффициентов dij во времени не меняются.
Из формулы C.3.1) видно, что в таком коллективе радиостанций
теряет смысл раз навсегда выбирать мощность передатчика, так как
качество связи в данном канале зависит от степени взаимодействия
радиостанций (от величин а^). Поэтому ниже мы будем рассматривать
коллектив радиостанций, в котором мощности передатчиков можно
менять (регулировать).
Если выбор мощности осуществляется независимо каждой радио-
радиостанцией, то возможны неустойчивые, лавинные режимы. Например,
если первый передатчик увеличит излучаемую им мощность с целью
добиться уменьшения А^, то реакция остальных пар на увеличение
шумов на входах их приемников может оказаться такой, что А^ не
только не упадет, но даже возрастет.
Мы будем придерживаться идеи именно такого, локального выбо-
выбора мощности, осуществляемого независимо на каждой радиостанции,
не предполагая существования некоего единого центра, устанавлива-
устанавливающего мощность на каждом передатчике в отдельности для каждой
конфигурации коллектива (т.е. для каждой совокупности а^-, i Ф J,
г, j = 1,2,. . . , n и каждого п), тем более, что измерение величин а^-,
которые носят даже «семантический» характер, не всегда представля-
представляется возможным.
При таком подходе вопросы устойчивости выбора мощности, осу-
осуществляемого независимо каждым передатчиком, приобретают боль-
большое значение.
Прежде чем переходить к перечислению свойств модели, вытекаю-
вытекающих из C.3.1), заметим, что произвольный коллективный канал связи
всегда можно представить в виде совокупности нескольких каналов,
в которых связи считаются попарными и односторонними.
Чисто коллективные свойства модели проявляются, в частности,
в том, что в пространстве всевозможных векторов Л = (Ai, A2, . . . , Ап)
существует, как показано в [Стефанюк и Цетлин, 1967], фиксированная
при заданных п, а^-, г Ф j, г, j = 1, 2, ... , п область Лп, обладающая
тем свойством, что точки (векторы) этой области и только они дости-
достижимы при конечных мощностях ?1? ?2, . . . , ?п. Если для некоторого А
выполнено условие А ^ Лп, то такой вектор недостижим, т. е. нельзя
указать такой вектор мощностей ? = (?]_, ?2, . • . , ?n)? который обеспе-
обеспечил бы существование в коллективе А.
3.3] Коллектив автоматов в задаче о регулировке мощности 121
Показано, что в область Лп входят те и только те векторы Л, для
которых все главные миноры матрицы
(Ai an -ai2 . . . -al
-a21 A2a22 ... -a2n
—ani —an2 ... An ann
строго положительны (для этого необходима и достаточна строгая по-
положительность последовательности угловых главных миноров). Мат-
Матрица Мп относится к специальному классу действительных матриц
с неположительными недиагональными элементами (их называют мат-
матрицами Метцлера, изучению которых мы посвятили раздел 3.4).
Далее будет использовано следующее свойство характеристических
чисел этой матрицы. Если все главные миноры Мп строго положи-
положительны, то действительные части всех характеристических чисел мат-
матрицы — Мп строго отрицательны [Гантмахер, 1966]. Следуя работе
[Карлин, 1964], такие матрицы будем называть устойчивыми.
Пусть задан вектор А°. Можно ли указать такие алгоритмы изме-
изменения мощности в отдельности на каждом передатчике, в результате
действия которых отношение шум/сигнал на входе г-го приемника
окажется равным А°, г = 1, 2, . . . , п?
Отчасти ответ на этот вопрос содержится в результатах работы
[Стефанюк и Цетлин, 1967]: если А° ^ Лп, то таких алгоритмов не
существует. При Л° Е Лп вопрос о существовании таких алгоритмов
оставался открытым, было лишь показано свойство так называемой
локальной устойчивости регулировки мощности.
В следующем параграфе будет изучен конкретный алгоритм регу-
регулировки мощности. Основной результат состоит в том, что при Л° Е
Е Лп регулировка мощности предлагаемыми автоматами устойчива.
При этом предполагается, что г'-му автомату, связанному с г'-м пере-
передатчиком, известны величины ?j, А^, А°, т. е. подразумевается наличие
канала обратной связи между приемником и передатчиком (см. по
этом поводу [Стефанюк и Цетлин, 1967]). В пп. 3.3.3, 3.3.4 этот канал
считается безошибочным и поэтому реальное отношение А^, имеющееся
на входе приемника в каждый момент, точно известно передатчику.
В п. 3.3.5 принимается во внимание статистическая природа этой вели-
величины, которую предлагается учитывать через соответствующее запаз-
запаздывание.
Легко видеть, что все результаты [Стефанюк и Цетлин, 1967] отно-
относительно существования области и ее связности сохранятся, если экви-
эквивалентную мешающую мощность, поступающую на вход г-го приемни-
приемника от j-ro передатчика, записывать в виде bij fj (?j), а «полезную» мощ-
мощность в виде Ьц /г(?г)- Здесь bij, i,j = 1, 2,. . . , n, — положительные
константы, а /^ — произвольные положительные функции мощности
?^ i = 1,2,..., гг. При таком учете нелинейных эффектов заранее
предполагается, что вид нелинейности (с точностью до множителя)
определяется передатчиком (нелинейность одна и та же для «своего»
и «чужого» приемника).
122 Локальная организация целесообразного поведения [Гл. 3
Впрочем, в настоящей работе мы будем полагать, что /j(?j) = ?j,
т. е. основываться на формуле C.3.1).
3.3.3. Конструкция автоматов регулировки мощности. Пусть &i(t)
есть мгновенная мощность г-го передатчика в момент t. Тогда в каждый
момент времени определена величина
C.3.3)
Полагая, что г-й паре приемник—передатчик в каждый момент
времени t известны «текущие» величины А^(?), ?$(?), зададимся для
каждого г числом А° > О — тем отношением шум/сигнал, которое
надлежит обеспечит в г-й паре. Подчеркнем, что г'-му передатчику
неизвестны величины гг, а^-, i,j = l,2,...,n, ?j(?), Aj(?), A?, j ф
фг.
Свяжем с каждым передатчиком автомат Ui, состояние которого
в момент t для простоты будем отождествлять со значением мощности
&i(t) г-го передатчика, 0 < &i(t) < счэ. Каждому состоянию &i(t)
автомата Ui отвечает некоторое значение Xi(t), величина которого
зависит от состояний всех автоматов ^,г = 1,2,...,пи определяется
выраж:ением C.3.3).
Чтобы оправдать рассмотрение вводимых ниже дифференциаль-
дифференциальных тактик поведения автоматов регулировки мощности, рассмотрим
вначале простейшую тактику изменения состояния автомата Ui, кото-
которая определяется лишь величинами &i(t), A^(t), A°. Выберем дискрет-
дискретную шкалу времени с малым шагом Д?; тогда состояние автомата Ui
в момент t + At определяется его состоянием в момент t и значением
Xi(t) в соответствии с формулой
e»
, если a ' < 1,
J Aj
ti[t) в противоположном случае,
C.3.4)
где в{ — некоторая константа, на выборе которой мы еще остановимся.
Из C.3.4) следует, что изменение состояния автомата по абсолютной
величине тем больше, чем больше рассогласование
Выберем величину е^ пропорциональной времени At, т. е. е^ =
= К{ At. Это значит, что при фиксированном рассогласовании при-
приращение энергии тем больше, чем реже производится регулировка.
Теперь ясно, что тактике C.3.4) при At —> 0 соответствует следую-
следующая дифференциальная тактика:
ло Ot>i\t) р / ч г, / ч л о] • -(л /о о ^
г ~?Ь4- — г ъ\ ) I i\ J i\ 1 — ' 1 ' ' ' 1 yo.o.oj
3.3] Коллектив автоматов в задаче о регулировке мощности 123
Как легко видеть, величина 1/ki играет роль памяти автомата U{.
В дальнейшем будут изучены условия существования устойчивых
режимов работы в коллективе радиостанций, снабженных автоматами
Ui, которые непрерывно и независимо управляют выходной мощностью
каждого передатчика.
Отметим, что мы неявно предполагаем, что приборы, которыми
измеряются величины 8>i(i), А^(?), обладают достаточной инерционно-
инерционностью, так что на этих величинах не сказываются быстрые изменения,
связанные с передачей сигнала, несущего информацию от передатчика
к приемнику. К этому вопросу мы вернемся несколько позднее.
3.3.4. Устойчивость регулировки мощности. Объединяя выраже-
выражения C.3.3) и C.3.5), получим систему линейных дифференциальных
уравнений первого порядка, которая описывает изменение во време-
времени мощностей в коллективе радиостанций, использующих автоматы
Ui,i = 1, 2,. . . , п,
— A? ?i(*) + XI а,ц ?i - ai2 ?г - • • • - aln ?n = Nb
^ \°2t2(t) - о21 ?i + Л>22 ?2 - ... - а2п ?„ = Л2, C.3.6)
~^ А^?п(^) — ani ?i — ап2 ?2 — • • • + А° апп ?п = 3\ГП.
Определим диагональную матрицу
Бп = ||^.||, du = ^^-, dij=O, 1ф], i,j = 1,2,...,п.
Hi
C.3.7)
Тогда система уравнений C.3.6) примет вид
D" ±- ? + М"? = Л. C.3.7)
Стационарное решение C.3.7) будет устойчивым, если устойчиво
нулевое решение однородной системы уравнений. Общее решение од-
однородной системы С еаг устойчиво, если Re а < 0, где а — корень
уравнения
(aDn+Mn)C = 0, C.3.8)
где С — произвольный вектор. Для нахождения а имеем уравнение
det \(Т>п)-гМп + аЦ = 0. C.3.9)
Здесь Е — единичная матрица.
Отсюда следует, что регулировка мощности устойчива (асимпто-
(асимптотически) тогда и только тогда, когда спектр матрицы G =
124 Локальная организация целесообразного поведения [Гл. 3
расположен в правой полуплоскости комплексной плоскости. Для мат-
матрицы G = \\g\j || имеем
ац
= 1,2, ...,гс, C.3.10)
т. е. G есть снова матрица Метцлера. В работе [Карлин, 1964] дока-
доказана теорема, что положительность элементов диагональной матрицы
является необходимой и достаточной, чтобы устойчивая матрица Мп,
умноженная на эту диагональную матрицу, дала бы устойчивую мат-
матрицу.
Таким образом, регулировка мощности по алгоритму C.3.5) в кол-
коллективе радиостанций устойчива тогда и только тогда, когда А° Е Лп.
Это утверждение верно при любых к\ > 0, так что коллектив несвя-
несвязанных между собой автоматов U\ может решить задачу регулировки
мощности — выбор Л° — если только Л° Е Лп.
3.3.5. Регулировка мощности с запаздыванием. Как отмечалось,
мы предполагаем, что величины ?$(?), входящие в систему уравнений
C.3.6), измеряются приборами, которые сглаживают флуктуации этих
величин, связанные с прохождением сигналов. В противном случае
автоматы Ui, как легко видеть, препятствовали бы передаче полезной
информации от передатчика к приемнику. Далее считается, что величи-
величина отношения шум/сигнал определяется точно. А это возможно лишь
при наличии фильтра с достаточно большой постоянной времени.
Поэтому, хотя статистическая природа сигналов и шумов непосред-
непосредственно не сказывается на работе автоматов из-за указанных усредне-
усреднений, остается эффект, которым пренебрегать нельзя, — это запаздыва-
запаздывание.
Ниже будет рассмотрен случай, когда величина \{(t) становится
известной точно, но с некоторым запаздыванием Т{ > 0, i = 1, 2, . . . , п,
связанным с неизбежным «интегрированием» отношения шум/сигнал
на входе приемника.
Тогда дифференциальную тактику C.3.5) автомата Ui следует за-
записать в виде формулы
А?^^ = к<?<(*)[А<(«-тО-А?], г = 1,2,..., п. C.3.11)
Для простоты положим Т{ = т, г = 1,2,...,гг, а тактику C.3.11)
заменим на
A?^^ = Ki?i(t-T)[Ai(*-T)-A?], i = 1,2,..., п. C.3.12)
Ясно, что тактика C.3.12) описывает автомат, отличный от Ui. Это-
Этому автомату для работы требуется точное знание величины т. Однако
физические соображения и вид выражений C.3.11), C.3.12) наводят на
мысль, что вблизи стационарного режима (если он, конечно, существу-
существует) автоматы C.3.11) и C.3.12) ведут себя, грубо говоря, одинаково.
3.3] Коллектив автоматов в задаче о регулировке мощности 125
Математический же анализ автомата, обладающего дифференциаль-
дифференциальной тактикой C.3.12), много проще.
Объединяя C.3.12) и C.3.3), получим систему линейных дифферен-
дифференциальных уравнений с запаздывающим аргументом
Dn ^ ?(*) + Mn?(t - г) = N. C.3.13)
Асимптотическая устойчивость стационарного режима определяет-
определяется устойчивостью нулевого решения однородного уравнения
Dn -J ?(*) + Mn?{t - г) = 0. C.3.14)
Решением C.3.14) является экспонента С е@\ причем для определе-
определения /3 имеем трансцендентное уравнение
det (/3 Dn + е~РТ Mn) = 0. C.3.15)
Решение асимптотически устойчиво, если для всех /3, являющихся
корнями этого уравнения, выполняется условие Re /3 < 0 [Цыпкин,
1946].
Примеры.
а) п = 1; тогда получаем
/З + Асе"^ = 0. C.3.16)
Введем следующие обозначения
v = - , г = кт, г > 0; C.3.17)
Hi
тогда C.3.16) примет вид
v + e~vr = 0. C.3.18)
Полагая v = х + ioj и приравнивая нулю мнимую и действительную
части, получим систему уравнений
х + e~rx cos ruo = 0,
C.3.19)
uj — е rx smrco = 0.
Покажем, что при условии
г < | C.3.20)
корни уравнения C.3.18) расположены в левой полуплоскости на ком-
комплексной плоскости. Для этого покажем, что при условии C.3.20)
ижH система уравнений C.3.19) решений не имеет.
126
Локальная организация целесообразного поведения
[Гл. 3
В силу х ^ 0 решения первого уравнения возможны лишь при
к = 0,±1,...
Оказывается, при выполнении C.3.20) второе уравнение системы
C.3.19) в этой области решений не имеет. Действительно, у этого урав-
уравнения всегда есть решение со = 0; далее из рис. 3.2 видно, что если
тангенс угла наклона прямой ? = со егх к оси со меньше единицы, то
решения возможны лишь в интервале
7Г
2
7Г
2
C.3.22)
Рис. 3.2. К доказательству отсутствия решений у системы C.3.19)
Условием этого является неравенство
tga<l, C.3.23)
или
7Г
2r
C.3.24)
Но так как х ^ 0, то благодаря C.3.20) это неравенство выполнено.
Итак, все корни уравнения C.3.16) расположены в левой полуплос-
полуплоскости.
б) п = 2, полагая для простоты Ki = k<i = к, получаем
а22 - е^ о12 а21 = 0,
или, используя C.3.17),
= e
A.
C.3.25)
C.3.26)
3.3] Коллектив автоматов в задаче о регулировке мощности 127
Здесь введена величина Л, определяемая выражением
А= а12а" ¦ C.3.27)
flll «22 Ai А2
Если (AJ, А2) G Л2, то, как легко отсюда видеть, для А имеется нера-
неравенство
О < А < 1, C.3.28)
где правая граница соответствует наибольшему взаимодействию между
станциями, при котором еще возможна их совместная работа, левая —
наименьшему.
Извлекая корень и приравнивая мнимую и действительные части
C.3.26) нулю, получаем систему уравнений
х + e~rx(l ± у/А) coscjr = 0,
V J C.3.29)
со - e~rx(l ± у/А) sinur = 0.
Повторяя рассуждения предыдущего примера, можно прийти к выво-
выводу, что совместные решения этой системы уравнений невозможны, если
выполнено неравенство
(l±y/A)e~rx < J. C.3.30)
Тогда, учитывая C.3.28), для х ^ 0 имеем
A ± у/А) e~rx ^ max max (l ± у/А) е~гх < 2. C.3.31)
Если на величину г наложить требование
2г < |, C.3.32)
то неравенство C.3.30) соблюдается и, следовательно, при этом условии
все корни уравнения C.3.26) лежат строго в левой полуплоскости.
Из рассмотренных примеров видно, что при наличии запаздывания
скорость регулировки мощности к следует выбирать не слишком боль-
большой — ограничения даются выражениями C.3.20), C.3.32). Чем больше
запаздывание, тем больше должна быть величина памяти автомата для
того, чтобы при Л G Лп сохранилась устойчивость.
Эти примеры наводят на мысль, что ограничения на скорость ре-
регулировки, связанные с запаздыванием, должны зависеть от полного
числа пар радиостанций. Такой результат противоречил бы локальному
подходу к задаче регулировки мощности, принятому в настоящей кни-
книге. Действительно, в этом случае пришлось бы каждому передатчику
сообщать дополнительно число п.
128
Локальная организация целесообразного поведения
[Гл. 3
К счастью, это не так: существует фиксированное не зависящее от
п число для заданного т — максимально допустимая скорость регу-
регулирования, при которой сохраняется асимптотическая устойчивость
регулировки мощности.
Чтобы изучить случай произвольного числа радиостанций, распи-
распишем подробно уравнение C.3.15), полагая Ki = к2 = . . . = кп = к
(далее будем писать Л вместо Л°, так как путаница невозможна):
-а1
-а2п e
= 0.
ап\ е и —а>п2 е • • • \ ~ т & ¦ )'\п ^пп
C.3.33)
Матрица, стоящая под знаком определителя, не есть матрица Метц-
лера, так как все ее элементы, вообще говоря, комплексные. Умножив
г-ю строку определителя C.3.33) на е@т /(ац А^), получим
«12
\i «и
«22
CLnl
Ai an
«2n
= 0.
C.3.34)
Таким образом, получено уравнение для собственных значений матри-
матрицы
/ -, «12 din \
в =
1
«21
A2 «2
Ai «n
1
«nl
\ \п
Ai an
«2тг
1
C.3.35)
Каждый главный минор этой матрицы связан с соответствующим глав-
главным минором Мп из C.3.2) положительным множителем, поэтому при
Л G Лп матрица Метцлера В устойчива. С каждым характеристиче-
характеристическим числом 7г матрицы В соотношением
Ъ =
prf3k
е г •>
_ 1 о
— ±, Z, . . . , П,
— 1 О
— ±, Z, . . .
C.3.36)
связано некоторое число корней /3^ уравнения C.3.33)
Будет доказано следующее утверждение. При выполнении условия
2кг < 1
C.3.37)
3.3] Коллектив автоматов в задаче о регулировке мощности 129
действительные части всех корней трансцендентного уравнения
C.3.33) лежат в левой полуплоскости, если A G Лп, w, следовательно,
регулировка мощности с запаздыванием асимптотически устойчива.
В обозначениях C.3.17) уравнение C.3.33) эквивалентно уравнению
\B + vevrE\ =0, C.3.38)
а условие C.3.37) примет вид
2г < 1. C.3.39)
Докажем, что корни уравнения C.3.38) при условии C.3.39) распо-
расположены в левой полуплоскости, для чего рассмотрим величину
, = -,е^ = -(ж + 1Ш) ег{*+™\ C.3.40)
Покажем, что эти точки расположены на комплексной плоскости
так, что при выполнении C.3.39), ж Hи любых uj ни одна из них не
совпадает ни с одним характеристическим корнем матрицы C.3.35).
Дальнейшие рассуждения станут прозрачными, если отдельно рас-
рассмотреть случай чисто мнимых корней C.3.38). Тогда имеем
z{iuj) = -iuje~iujr, C.3.41)
или
z(iuj) = uj cos( ujr — — J + iuj sin( ujr — — J, uj > 0, C.3.42)
z(iuj) = — uj cos( ujr + — J — iuj sin( cor + — J, uj < 0. C.3.43)
На рис. 3.3 на комплексной плоскости изображена кривая z(iuj) при
некоторых фиксированных значениях г = тг/4, тг/6, тг/8. Видно, что
при о;, меняющемся от —оо до +оо, кривая сначала спирально «на-
«наматывается» на начало координат, а затем «разматывается», проходя
через начало координат при uj = 0. Если при этом кривая z{iuj)
проходит через точку, изображающую на комплексной плоскости какое-
либо характеристическое число матрицы В, то у уравнения C.3.38) по-
появляется чисто мнимое решение. (Напомним, что при Л Е Лп матрица
В устойчива и все ее характеристические числа находятся в правой
полуплоскости.)
Из рисунка также видно, что если все характеристические числа
заключены в области, образованной двумя первыми от начала ко-
координат четверть-витками спирали, то чисто мнимые корни C.3.38)
невозможны.
В силу действительности матрицы В и зеркальной симметрии z(iuj)
относительно действительной оси, достаточно рассмотреть область
между действительной осью и первым четверть-витком спирали при
uj > 0, как это изображено в другом масштабе на рис. 3.4.
5 Стефанюк
130
Локальная организация целесообразного поведения
[Гл. 3
Рис. 3.3. Поведение z(iui) при некоторых фиксированных значениях г
V т
Рис. 3.4. Поведение z(iu), показанное в другом масштабе
Оказывается, если заранее известно, что характеристические числа
матрицы Метцлера расположены в правой полуплоскости, то они ло-
локализованы в некоторой конечной области этой полуплоскости.
Теорема. Пусть Bn = | b^j 11 — есть матрица Метцлера порядка
п такая, что Ьц = 1, bij $J 0, i ф j, i,j = l,2,...,n, и пусть
действительные части Re V{ всех ее характеристических чисел Vi
строго положительны, г = 1,2,...,п. Тогда все характеристические
3.3] Коллектив автоматов в задаче о регулировке мощности 131
числа этой матрицы лежат внутри единичного круга на комплексной
плоскости, центр которого помещен в точку 1.
Доказательство. Рассмотрим неотрицательную матрицу (Е —
— Вп). По теореме Перрона-Фробениуса для неотрицательных матриц
(см. [Гантмахер, 1966, с. 365]) она имеет неотрицательное характери-
характеристическое число р такое, что модули всех характеристических чисел \±{
матрицы (Е — Вп) не превосходят р, т. е.
р> |/xi|, г = 1,2,..., п. C.3.44)
Характеристические числа матриц (Е — Вп) и Вп связаны очевидным
соотношением
/i- = 1-г/., г = 1,2,..., п. C.3.45)
Заметим, что при р < 1 все характеристические числа матрицы —Вп
по условию теоремы расположены в левой полуплоскости и от прибав-
прибавления к ней Е сдвигаются вдоль действительной оси на 1. Учитывая
это, из C.3.44), C.3.45) имеем
1>р^\1-щ\, г = 1,2,..., п, C.3.46)
что и требовалось доказать.
Следствие. Характеристические числа произвольной матрицы
Метцлера Hn = \\h^ \\ порядка п, все характеристические числа ко-
которой имеют положительные действительные части, расположены
в круге радиуса а с центром в точке <т, где
а = max/i^- C.3.47)
i
На рис. 3.4 штриховой линией изображена окружность единичного
радиуса, внутри которой заключены все характеристические числа
матрицы В. Видно, что спиральная кривая z{iuj) при любом фиксиро-
фиксированном г < 1/2 не пересекает эту окружность, следовательно, при этом
условии чисто мнимых корней у уравнения C.3.33) не будет. Но так как
при г = 0 (г = 0) по доказанному в предыдущем параграфе все корни
C.3.33) находятся в левой полуплоскости, то при выполнении условия
г < 1/2 они не выйдут за ее пределы. Это можно показать аналити-
аналитически строго. Рассмотрим комплексную величину C.3.40) и покажем,
что при выполнении C.3.39) точки z находятся вне единичного круга
без границы с центром в точке 1, т. е.
z-l|^l, C.3.48)
и, следовательно, никакое C в силу доказанной теоремы не является
корнем C.3.33).
Так как указанный круг находится в правой полуплоскости, то
достаточно рассмотреть случай х ^ 0. Имеем
\z-l\ = ^l + erx F(x,w), C.3.49)
132 Локальная организация целесообразного поведения [Гл. 3
где
F(x,w) = co(-2smcor + coerx) + xBcoscor + x егх). C.3.50)
Вследствие четности этой функции по со достаточно рассмотреть со ^ 0.
a) со = 0, тогда
\z - 1| = \Л + 2ж е™ + х2 e2rx ^ 1. C.3.51)
б) cj > 0, тогда заметим, что F(x, со) при любом фиксированном со
монотонно растет с ростом х ^ 0. Рассмотрим ж = 0, имеем
F@,co) = co(-2smcor + w). C.3.52)
Легко видеть, что при выполнении условия 2г < 1 при любом со > 0
соблюдается неравенство
F@,o;) > 0. C.3.53)
Из монотонности F(x,uj) вытекает
F(x,co) ^ F@,co) > 0. C.3.54)
Следовательно, всегда выполнено неравенство C.3.48), что и требова-
требовалось доказать.
Окончательно получаем следующее. Регулировка мощности, осу-
осуществляемая однородным коллективом автоматов, заведомо асимпто-
асимптотически устойчива, если только «память» автомата Ui выбрана так,
чтобы выполнялось условие
Таким образом, увеличение размеров коллектива (увеличение п)
не приводит к увеличению «трудности» решения задачи регулировки
мощности. Сравнение C.3.37) с C.3.32) и C.3.20) показывает, что каж-
каждому автомату Ui при п > 3 уже не важно, сколько членов в коллек-
коллективе.
3.3.6. Заключительные замечания. Выше показано, что при реше-
решении одной задачи регулировки мощности — выбора заранее заданного
вектора А° путем локального и независимого изменения мощности ка-
каждым передатчиком — обеспечена асимптотическая устойчивость, если
до ^ дп и память автомата достаточно велика, чтобы не реагировать
на «шумы». Эта память рассчитана, грубо говоря, на коллектив из
трех членов и не растет с дальнейшим увеличением числа партнеров
по коллективу.
Задачу с успехом решает коллектив автоматов, каждому из которых
известны лишь локальные сведения — отношение шум/сигнал в месте
приема.
3.3] Коллектив автоматов в задаче о регулировке мощности 133
Техническая реализация каждого из автоматов, описываемых
конечно-разностной C.3.4) или дифференциальной C.3.5) тактикой,
очевидно, весьма проста, и на ней мы останавливаться не будем.
Предложенная нами в 1967 г. модель коллектива радиостанций
[Стефанюк и Цетлин, 1967] явилась предтечей современной мобильной
связи, возникновение которой относят к середине 80-х годов. Надо
подчеркнуть, что мобильная связь сразу возникла как коммерческая,
полностью оставив без внимания общественный сектор, на который
прежде всего ориентирована модель коллектива радиостанций.
Вовлечение бизнеса в область мобильной связи сыграло позитивную
роль. Действительно, автором модели коллектива радиостанций были
опубликованы десятки статей и прочитаны в свое время десятки докла-
докладов в крупнейших научных центрах России, США, Швеции, Англии и
др., но это отнюдь не привело к реализации предложенной математи-
математической модели в виде инженерных конструкций. Именно соображения
коммерческого успеха и сделали возможным появление современной
мобильной связи. Но то, что было достигнуто на этом пути, это не
совсем то, что ожидалось от «коллектива радиостанций».
Например, при построении коллектива радиостанций большая роль
отводилась ретрансляторам [Стефанюк и Цетлин, 1967; Стефанюк,
19716], позволявшим увеличить расстояние, на котором возможна на-
надежная радиосвязь. Но введение такого характерного элемента совре-
современной мобильной связи, как базовая станция, основными задачами
которой являются, прежде всего, контроль за установлением связи,
регистрация абонентов, учет нагрузки, выставление счетов и т. п.,
полностью противоречило бы всем исходным принципам нашей мо-
модели коллектива радиостанций со свободным доступом как локально-
организованной системы.
Поэтому естественно возникает мысль о необходимости создания
также и некоммерческих систем [Стефанюк, 2003], обеспечивающих
население основными коммуникационными возможностями. Описан-
Описанная здесь модель коллектива радиостанций с локальной организацией
может быть непосредственно положена в основу такой системы г).
В этой книге не рассматривался очень важный вопрос о выборе
критерия, по которому указывается вектор А° (см [Стефанюк, 1969]),
однако, каков бы ни был этот критерий, на некотором этапе всегда воз-
возникает задача поддержания фиксированного отношения шум/сигнал
А° на входе г-го приемника с помощью автомата, управляющего лишь
мощностью г-го передатчика, т. е. изученная здесь задача. Нужно от-
отметить, что задача о регулировке мощности интересна как объект
для изучения общих особенностей поведения однородных коллективов
х) Разумеется, осуществление права человека на свободную мобильную
связь требует средств, но соответствующие расходы должны компенсиро-
компенсироваться на принципиально иной, некоммерческой основе, например, через
налоговые поступления, государственный бюджет и обычную абонентскую
плату.
134 Локальная организация целесообразного поведения [Гл. 3
автоматов тем, что в ней отчетливо проявляется «антагонизм» парт-
партнеров по коллективу. Здесь физическая сущность задачи подсказывает
правильное решение, подчеркивает главные проблемы, которые все же
достаточно общи и, возможно, приложимы к решению аналогичных
вопросов в других задачах коллективного поведения автоматов.
3.4. Одна теорема об М-матрицах и ее применения
В предыдущем разделе было видно, что устойчивость локально-
организованной системы автоматов о непрерывным множеством дей-
действий определяется свойствами матрицы Метцлера. Ниже получены
новые необходимые и достаточные условия положительности главных
миноров такой матрицы, которые находят целый ряд приложений.
Напомним, что матрицей Метцлера называют всякую матрицу
с действительными элементами, у которой все недиагональные элемен-
элементы неположительны. Особый интерес для приложений — математиче-
математической экономики, задач коллективного поведения в антагонистических
ситуациях и т. п. — представляют М-матрицы, т. е. матрицы Метцлера,
все главные миноры которых положительны. М-матрица обладает тем
важным свойством, что обратная ей матрица переводит всякий вектор
с положительными компонентами в вектор, компоненты которого так-
также положительны.
В этом разделе сформулировано удобное необходимое и достаточное
условие того, чтобы матрица Метцлера была М-матрицей, из которого,
в частности, вытекает, что введенное в [Стефанюк и Цетлин, 1967]
множество Л(п), которое может быть определено для каждой матрицы
Метцлера, является выпуклым. (В работе [Стефанюк и Цетлин, 1967]
множество Л(п) имеет смысл области «достижимых» векторов отно-
отношений шум/сигнал в коллективе радиостанций, создающих при своей
работе взаимные помехи. См. также разд. 3.3 выше.) Из этого условия
вытекает также одно условие невырожденности произвольной матрицы
(с комплексными элементами), эквивалентное условию Фидлера, но по
форме подобное условию Адамара (см. [Гантмахер, 1966], с. 408, 412-
414). В п. 3.4.3 это условие используется при получении необходимых
условий полезности «взаимопомощи» в таком локально-организован-
локально-организованном коллективе.
Теорема о матрицах Метцлера. Зафиксируем некоторое
натуральное п. Замкнутой цепочкой длины г будем называть произ-
произведение из г положительных чисел m^j, г, j = 1, . . . , гг, имеющее вид
т3132 mJ2J3 • • • mjr-ljr mjrjl J C.4.1)
где (ji,-.-,Jr) — некоторая перестановка из любых г, чисел 1,...
... , п, г ^ п. В дальнейшем мы будем иметь дело с такими цепочками
C.4.1), которые удовлетворяют свойству
¦¦mjr_ljrmjrh>\, C.4.2)
3.4] Одна теорема об М-матрицах и ее применения 135
ТеоремаЗ.З. Для того чтобы все главные миноры матрицы с дей-
действительными элементами А^п\ все недиагональные элементы ко-
которой aij отрицательны или равны нулю (т. е. матрицы Метцлера),
были бы строго положительны, необходимо и достаточно, чтобы
выполнялись следующие неравенства
аи - ^2 mij ctij > 0, i = 1, . . . , гс, (*)
где rriij, г, j = 1,...,гс — некоторая совокупность положительных
чисел таких, что любая составленная из них замкнутая цепочка вида
C.4.1) обладает свойством C.4.2).
Если А^ — неразложимая матрица Метцлера, то неравенства
(*) можно заменить на неравенства
п
It / J IJ IJ s^ 1 1 1 1 \ J
причем, по крайней мере, в одном из них имеет место знак >.
Достаточность. Воспользуемся индукцией по порядку гс матри-
матрицы А(п\ Утверждение верно для гс = 2. Действительно, если выполнено
(*), то отсюда получаем
ац > 0, а22 > 0, аи a<ii > «12 «21 ^12 ^21- C.4.3)
Если же матрица А^ неразложима, то верно
«12 > 0, «21 > 0, C.4.4)
и, теперь уже в силу (**), получаем C.4.3).
Так как по предположению теоремы ГП12ГП21 ^ 1, то из C.4.3)
вытекает положительность всех главных миноров А^2\ т. е.
«11 > 0> «22 > 0> «11 «22 ~~ «12 «21 > 0- C.4.5)
Предположим теперь, что утверждения теоремы верны для матриц
Метцлера порядка гс — 1. Докажем, что тогда они сохраняют свою силу
и для матриц порядка гс. Не ограничивая общности, будем считать, что
в случае (**) «строгим» является неравенство при г = 1, т. е.
C-4-6)
136
Локальная организация целесообразного поведения
[Гл. 3
Применим к определителю матрицы А^ преобразование Гаусса
[Гантмахер, 1966]. Тогда получим
det Л(п) =
«11 -
О а
-«In
—а
О -а
A)
п2
2n
A)
C.4.7)
причем элементы выделившейся при этом преобразовании матрицы
I A) Мп -1 л (п}
\ ij \\2 п0РяДка п ~ 1 связаны с элементами матрицы Ак ' такими
соотношениями:
= ass -
an
a<A> =
Qlfc Qal
an
C.4i
Таким образом, в силу C.4.5) ||«ij |2 есть матрица Метцлера. По-
Покажем сначала, что если выбрать числа msf: согласно соотношению
m^jj = min {msk; msl mlk}, s, к = 2, . . . , га,
II (l)lln r
то для матрицы ||gQ. ||2 будут выполнены соотношения
О 5 = 2 п
_ A) _
— ass
sk ask
C.4.9)
C.4.10)
в случае, если для А^ выполняется (*), или неравенства
п
A) V > A) A) ^^ г\ г» /О А 1 Л \
~-asJ- Ъ mskask^°i s = 2, ...,ra C.4.11)
(и хотя бы одно неравенство здесь строгое) в случае, если А^ нераз-
неразложима и для нее выполняется (**).
Действительно, из C.4.8) имеем
= { «11 «ss - «Is «si -
an I
Е
- E
S = 2,. . . ,71.
C.4.12)
Далее, если выполнено (*), то, используя s-e неравенство, из (*)
получаем, учитывая также, что по предположению ац > 0,
msl als.
C.4.13 а)
3.4] Одна теорема об М-матрицах и ее применения 137
Неравенство в (*) для г = 1 затем дает
п
msXaslax\^ Yl msl asl alkmlk + alsmlsmsl asl. C.4.136)
Объединяя эти неравенства и учитывая mis msi ^ 1, получаем
п п
a11ass>a11 ^ msk а*к + J2 msl asl а1кт1к + als asl. C.4.14)
Отсюда, в силу C.4.9), фигурная скобка в C.4.12) строго положи-
положительна для всех s = 2, . . . , п, т. е. верно C.4.10).
Если же матрица А^ неразложима и выполнено (**), то неравен-
неравенство C.4.13 а) становится, вообще говоря, нестрогим, но теперь, уже
в силу C.4.6), неравенство C.4.13 6) становится строгим хотя бы для
одного s. (Противное означало бы, что as\ = 0, s = 2, . . . , п, т. е. что
матрица А^ разложима.)
Отсюда неравенства в C.4.14) становятся, вообще говоря, нестроги-
нестрогими, причем, по крайней мере, одно из них — строгое. Поэтому с помо-
помощью C.4.9) приходим теперь к C.4.11).
Далее, легко видеть, что всякая замкнутая цепочка из элементов
m\j , удовлетворяющих соотношению C.4.9), представляется в виде
произведения того или иного числа замкнутых цепочек из элементов
т\ ¦ . Так как, по предположению теоремы, замкнутые цепочки из
элементов т\- удовлетворяют свойству C.4.2), то и все замкнутые
цепочки из элементов т\ • также обладают свойством C.4.2).
тт II (!)lln
Наконец, принимая во внимание, что матрица \\a\j ||2 неразложи-
неразложима, если неразложима матрица А^ (см. ниже лемму 3.4), получаем,
что для матрицы Метцлера \\a\j ||^ выполнены условия теоремы 3.3.
тт II A) 1П
Но тогда, по предположению индукции, все главные миноры Ца}/ \2
строго положительны.
Заметим, что из выражения C.4.7) легко заключить, что верхнеуг-
верхнеугловой главный минор порядка р (р ^ 2) матрицы А^ равен верхнеуг-
1 I A)мп
ловому главному минору порядкар — 1 матрицы | а\- , умноженному
на величину аи, которая, в силу C.4.5), строго положительна. Отсюда
следует, что в матрице А^ имеется цепочка положительных угловых
главных миноров. По лемме Котелянского [Гантмахер, 1966] и все
остальные главные миноры матрицы А^ при этом положительны.
Необходимость. Справедлива следующая лемма.
Лемм а 3.3. Если все главные миноры матрицы Метцлера А^
положительны, то матричное уравнение
Л(п)х = К, C.4.15)
138 Локальная организация целесообразного поведения [Гл. 3
где Л есть вектор с положительными компонентами, имеет реше-
решение, все компоненты которого строго положительны.
Если, кроме того, матрица А^ является неразложимой, то су-
существует таксисе положительное решение матричного уравнения
C.4.15), в котором предполагается, что К есть вектор с неотри-
неотрицательными компонентами, причем хотя бы одна его компонента
строго больше нуля.
Эта лемма хорошо известна (см., например, в [Беллман, 1968, с. 338]
формулировку ее первой части). Для удобства чтения, однако, мы
приведем ниже для нее достаточно простое доказательство.
Доказательство леммы. Воспользуемся индукцией по поряд-
порядку п системы уравнений C.4.15). Решая ее при п = 2, получаем
Ni а22 + N2 a12 N2 аи + Ni a2i /о л tc\
x х2 = , C.4.16)
ац а22 — о12 а21
flu a22 — ai2 a2i an a22 — ai2 a2i
откуда видно, что при Ni, Ъ$2 > 0, в силу ац > 0, а22 > О, выполняется
xi,x2 > 0. Если же матрица А^ неразложима, т.е. а\2,а2\ ф 0, то
Ж1>0,Ж2>0, если хотя бы одна из компонент У\\, Л2 строго больше
нуля.
Предположим теперь, что утверждение леммы верно для матриц
Метцлера порядка п — 1. Докажем, что тогда оно верно и для матриц
порядка п. Не ограничивая общности, будем считать, что 3\Ti > 0
и в случае, если А^ неразложима.
Воспользуемся преобразованием Гаусса, учитывая, что ац > 0
по условию леммы. Тогда получим (см. C.4.7)) следующую систему
уравнений, эквивалентную системе C.4.15):
ац х\— а\2 х2 - - - —оь\п xn = Ni,
(!) | (!) _ Tvr _|_ -N a21
а22х2--- a2nxn - 2 ail ' C.4.17)
A) . A) ^г . Niani
ац
Легко видеть (см. выше), что при этом выделяется матрица Метц-
лера \а\- ||2, главные миноры которой строго положительны в силу
положительности главных миноров матрицы А^п\
Если все ЭД > 0, то по предположению индукции, выделившаяся
подсистема имеет положительное решение х% > 0, . . . , х°п > 0. Тогда,
найдя из первого уравнения C.4.17) х\ > 0, убедимся, что х\, . . . , х^
является положительным решением C.4.15).
Если же А^ неразложима, то все правые части этой подсистемы
неотрицательны, причем не все обращаются в нуль (противное озна-
означало бы, в силу aij > 0 и Ni > 0, что a2i = . . . = ап\ = 0, т. е. что
А^ разложима). Далее, согласно лемме 3.4, матрица \\a\j Ц^ является
3.4] Одна теорема об М-матрицах и ее применения 139
неразложимой и, по предположению индукции, выделившаяся подси-
подсистема снова имеет положительное решение х\, . . . , х°п и т. д. Лемма
доказана.
Продолжим теперь доказательство теоремы 3.3. Поскольку все глав-
главные миноры матрицы Метцлера А^п' положительны, то по лемме 3.3
имеется положительное решение х матричного уравнения C.4.15), от-
откуда
jr П
ац = — + Y^ dij — , г = 1,. . . , п, C.4.18)
X % ' ™ X %
3 = 1
3?i
где следует считать вектор 3\Г строго положительным, если матрица
А(п) произвольная, либо полагать, что все компоненты вектора Л
неотрицательны, и хотя бы одна строго больше нуля, если А^ —
неразложимая матрица. Обозначив теперь
mij = ^-, г = 1,...,п, C.4.19)
Xi
получаем из C.4.18) в случае произвольной матрицы А^п\ что верны
условия (*), а в случае неразложимой матрицы А^ — условия (**).
Теорема доказана.
Лемм а 3.4. Матрица \\a\j ||™, возникающая после применения
к неразложимой матрице А^ преобразования Гаусса [Гантмахер,
1966], неразложима.
Доказательство. Предположим противное, т.е. что в условиях
леммы матрица \\a\j ||^ разложима. Это означает (см. там же с. 352),
что множество индексов 2, 3, . . . , п можно разбить на две дополнитель-
дополнительные системы (без общих индексов) i\, . . . , гд; к\, . . . , kv (fi + v = п — 1)
такие, что a\Jk = 0 для всех а = 1, . . . , /i; C = 1, . . . , v.
Заметим, что в силу C.4.8) равенство а\ак = 0 означает
aiak, = 0 C.4.20)
и, кроме того, aikp сц^х = 0, а = 1, . . . , /i, /3 = 1, . . . , и. Поскольку
«iifei = «г2/с1 = . . . = a^/d = 0, то из предыдущего соотношения
следует, что неравенство alki ф 0 заведомо предполагает, что
«ni = «г21 = • • • = ai/xl = 0. C.4.21)
Точно так же ясно, что соотношение C.4.21) будет справедливым,
если хотя бы для одного /г^, /3 = 1, . . . , п, выполнено ац^ ф 0. Из
C.4.20), C.4.21) в этом случае следует, что матрица А^> разложима,
так как множество индексов разбивается при этом на две дополни-
дополнительные системы zi, . . . , г^, 1, &i, . . . , ки, такие что все матричные
140 Локальная организация целесообразного поведения [Гл. 3
элементы А^ с индексами соответственно из первой и второй системы
равны нулю.
В случае же, если а^ = 0 для всех C = 1, . . . , г/, то аналогич-
аналогичным свойством будет обладать разбиение 1, ii, . . . , гм, &!,...,&„, т. е.
и в этом случае матрица А^ разложима.
Полученное противоречие доказывает лемму.
Замечание к теореме 3.3. Поскольку все замкнутые цепочки
элементов C.4.19) в точности равны единице, то в этой теореме можно
было бы заменить условие C.4.2) на условие
mjij2 mJ2h • • • mJr-ijr m3rh = !> C.4.22)
где (ji, . . . , jr) — любая перестановка из г чисел 1, . . . , п.
Для приложений теоремы, тем не менее, удобно сохранить в этой
теореме условие C.4.2), так как в общем случае неясно, как явным
образом по элементам, замкнутые цепочки которых удовлетворяют
условию C.4.2), построить элементы, цепочки которых удовлетворяют
C.4.22), и чтобы при этом сохранились условия (*), (**).
3.4.1. Выпуклость множества А^п\ Назовем множеством Л(п) мно-
множество векторов Л = (Ai, . . . , Лп), удовлетворяющих условию
C.4.23)
CLii
где 3\f — фиксированный положительный вектор (все N^ > 0), |
фиксированная матрица неотрицательных величин, ац ф 0, г = 1, . . .
... , п, а вектор е = (ei, . . . , еп) пробегает все значения из положитель-
положительного ортанта Р.
Обозначив через М^П^(Л) матрицу с диагональными элементами
C.4.24)
и недиагональными элементами — а^-, получаем, что C.4.23) эквива-
эквивалентно уравнению
M<n>(A)?=>f. C.4.25)
Все главные миноры матрицы Метцлера М^(Х) строго положи-
положительны, так как, согласно C.4.24), выполняются условия теоремы 3.3.
Наоборот, из леммы 3.3 вытекает, что если все главные миноры М^ (А)
положительны, то уравнение C.4.25) имеет положительное решение.
Отсюда множество Л^п^ есть совокупность, тех и только тех векторов
Л = (Ai, . . . , Ап), для которых все главные миноры М^п\\) строго
положительны [Стефанюк и Цетлин, 1967].
3.4] Одна теорема об М-матрицах и ее применения 141
Множество А(п\ очевидно, открыто. Множество точек границы Г
множества Л^п^ составаляют те точки, в которых все главные мино-
миноры Af(n)(A) неотрицательны и хотя бы один равен нулю. С другой,
стороны, из выражения C.4.23) следует, что все точки *у границы
множества Л(п) в пространстве векторов Л, и только они, могут быть
заданы (предполагается, что ЭД > 0, г = 1,...,гг, и матрица \\o>ij\\
неразложима) соотношением
7; = Е— Г' * = !.•••.». C-4-26)
Зфг
где t = (^i, . . . , tn) — произвольный вектор из Р.
Ниже нас будут интересовать вопросы выпуклости названных мно-
множеств.
Рассмотрим множество ЭД1 всех произведений, составленных из г по-
положительных чисел, таких, что каждое такое произведение не меньше
единицы.
Л е м м а 3.5. Множество ЭД? выпукло и соотношение
[ащ + A-а)у^ = 1, а €@,1), C.4.27)
1 = 1
при условии, что
г
\\vi^l, Ui,Vi>0, г = 1,...,г, C.4.28)
г=1 г=1
может быть выполнено тогда и только тогда, когда
Ui = Vi, г = 1,...,г, C.4.29)
Доказательство. Согласно неравенству Минковского ([Беккен-
бах, Беллман, 1965, с. 42]) при любых Х{, yi > 0 выполняется
C-431)
Л=1
причем здесь равенство возмож;но лишь в случае, если существует такое
k ^ 0, что выполняется
Xi = kyi, г = 1,...,гг. C.4.32)
142 Локальная организация целесообразного поведения [Гл. 3
Подставляя в C.4.31) вместо Х{ и yi соответственно aui и A — a) vi,
получаем, если соблюдается C.4.28), что
/ г \1Л / г \1/г
U=i
C.4.33)
Таким образом, множество ЯЯ выпуклое.
Если же выполнено C.4.27), то в C.4.33) все неравенства должны
быть заменены на равенства, но тогда существует к > 0 такое, что
выполнено
aui = k(l-a)vi, i = l,...,n. C.4.34)
Подставляя C.4.34) в C.4.27), получаем, с одной стороны,
vi = l, C.4.35)
г=1
а с другой —
Отсюда, в силу C.4.28), должны выполняться неравенства
1,
C.4.37)
Эта система уравнений имеет решение к тогда и только тогда, когда
в ней оба неравенства заменены равенствами, причем в этом случае
решение единственно и имеет вид к = ск/A — а). Отсюда сразу же
получаем C.4.29), C.4.30). Лемма доказана.
Следствие 1. Множество Л^п^ выпукло.
Действительно, если А'1', А^2^ Е Л'п', то имеются наборы положи-
положительных чисел Uij, Vij, замкнутые цепочки которых обладают свойст-
свойством C.4.2), и выполняется
п п
ЛA) ^ V > л (.2) ^ V > • -| / с% л ОО\
i aii > 2_^ aiJ UiJi *i aii > 2^ ui3 ViJi * = 1, • • • , ^, [SA.So)
3=1 3=1
отсюда следует
n
(a \\ + A — a) X\ ) an > ^ a^- (a Uij + A — a) Vij) , a E [0,1].
C.4.39)
3.4] Одна теорема об М-матрицах и ее применения 143
Согласно лемме 3.5 замкнутые цепочки положительных чисел
rriij = a Uij + A — a) Vij C.4.40)
также обладает свойством C.4.2) и, следовательно, по теореме 3.3 все
главные миноры М^ (а А^1) + A — а) А^2)) строго положительны, т. е.
Следствие 2. Если матрица ||а^-||™ неразложима, то замыкание
множества Л'п) строго выпукло.
Действительно, покажем, что если 7^,7^ ? Г, 7^ Ф 7^2\ т0
(с^7A) + A-аOB)) ? к{п\ ol е @,1).
Условие 7 ^ 7 ^ Г означает, что имеются такие наборы чисел i^j
и i^j, что любые их замкнутые цепочки в точности равны единице (см.
C.4.26)) и выполняется
A) ^ > A) ^ ^ (о л л л \
I i %ъ / j %2 ij I i i ъ% / j %2 %2 ' \ ' ' )
Так как 7 Ф 7 •> т0-> очевидно, найдется такая пара индексов
(го, Jo), что будет выполнено
Из C.4.41) имеем
(а7A) + A - ск) 7B)) = Y^aijmij, C.4.43)
где числа гтг^' определяются соотношением
т^ = агл^ + (l-a)vij, a e @,1). C.4.44)
По лемме 3.5 все замкнутые цепочки из этих чисел, содержащие
элемент T7i^ojo, строго больше единицы. Ясно, что мы можем тогда пе-
перейти к набору величин гп[ •, цепочки которых удовлетворяют свойству
C.4.2), и выполняется неравенство
<ojo<mioio, т\,=тц C.4.45)
для остальных (i,j). В силу C.4.42), имеем, что
(a7(D + A - а) 7f)) > ? aijm'tj, C.4.46)
причем в этой системе неравенств хотя бы одно неравенство — строгое
(а именно го-е). Так как матрицы М^п\\) и ||а^||™ неразложимы од-
одновременно, то все главные миноры М^ (а Х^1* + A — а) А^2^) строго
положительны, что и требовалось показать.
144 Локальная организация целесообразного поведения [Гл. 3
3.4.2. Об одном условии невырожденности произвольной матрицы.
Объединяя теорему 3.3 и теорему М. Пароди ([Пароди, 1960, с. 50]),
получаем следующее утверждение (его можно доказывать и непосред-
непосредственно, применяя метод полной индукции):
Теорема 3.4. Пусть А = ||а^||™ — произвольная п х п матрица
с комплексными элементами, для которой выполняются п неравенств
где {rriij} — совокупность положительных чисел, любая замкнутая
цепочка которых C.4.1) обладает свойством C.4.2). Тогда матрица А
является невырожденной.
Если А — неразложимая матрица и выполняются п неравенств
ац\ -
причем, по крайней мере, в одном из этих условий имеет место знак
>, то матрица А — невырожденная.
Мы здесь не приводим тривиального обобщения теоремы 3.4 на
случай матриц, представленных в блочной форме, вытекающего из
теоремы Фидлера ([Гантмахер, 1966, с. 414]), которая является соот-
соответствующим обобщением теоремы Пароди ([Пароди, 1960, с. 50]).
Таким образом, приведенное условие невырожденности является
специальной формой условия Фидлера. Отсюда, кстати, следует, что
условия Адамара (и ослабленные условия Адамара, соответствующие
rriij = 1 (см. [Гантмахер, 1966, с. 408, 412])), являются частным случаем
условия Фидлера (там же, с. 414).
3.4.3. О взаимопомощи в коллективе автоматов. В локально-ор-
локально-организованных системах при очевидной независимости элементов есте-
естественно возникает вопрос о возможности неявной кооперации членов
коллектива за счет действий, носящих альтруистический характер типа
взаимопомощи.
В качестве такого примера рассмотрим модель коллектива радио-
радиостанций, в которой часть мощности каждого передатчика идет на ре-
ретрансляцию сигналов «чужих» передатчиков [Стефанюк, 19716]. Ниже
выписаны необходимые и достаточные условия и получены простые
необходимые условия оправданности такой ретрансляции.
Будем предполагать, что передатчик и ретранслятор объединены
в одно устройство, так что излучаемая энергия всего устройства де-
делится между непосредственно ретранслирующей и передающей его
частями. Пусть е"ер, е^етр — соответственно мощности, развиваемые
j'-M передатчиком и j-m ретранслятором. Тогда если ej — мощность,
развиваемая j-м устройством, то
ajej, е";ер = A-^)е,-, t = l,...,n, C.4.47)
3.4] Одна теорема об М-матрицах и ее применения 145
где olj — параметр, показывающий, какая доля мощности идет на
ретранслирование, 0 ^ olj < 1.
Величина еретр — выходная мощность j-ro ретранслятора. Полную
мощность, поступающую на вход j-ro ретранслятора, будем записывать
в виде
еТ = ^ + Е (! - «*) bJk ek, г = 1,..., п. C.4.48)
Здесь Nj — мощность аддитивного шума на входе j-ro ретранслятора,
bjk(l — (%k)ek — часть мощности к-ro передатчика, которая попадает на
вход j-ro ретранслятора (т. е. bjk ^ 0 есть коэффициент «ослабления»
единицы мощности на пути от к-го передатчика к j-му ретранслятору).
Фактически все основные предположения, относящиеся к рассмат-
рассматриваемой математической модели, содержатся в выражении C.4.48).
Во-первых, считается, что на вход ретранслирующей части j-ro
устройства не проходит сигнал от передающей части этого же устрой-
устройства. Не учитывается дополнительный шум от ретрансляторов.
Другое, более существенное предположение, состоит в том, что на
вход ретранслятора поступают лишь сигналы, идущие непосредственно
от передающих частей, т. е. сигналы, не подвергавшиеся ретрансляции.
(Ниже естественно будет предполагаться, что приемники коллектива
радиостанций регистрируют суммарный сигнал, идущий и от переда-
передающих частей, и от ретранслирующих.) Такую модель удобнее всего
представлять себе в виде двухчастотной схемы, когда все ретранслято-
ретрансляторы принимают сигналы в одном частотном диапазоне, а излучают —
в другом.
Заметим, что несоблюдение этого требования привело бы к тому,
что один и тот же сигнал многократно ретранслировался и возвра-
возвращался бы на вход данного ретранслятора и в результате, по крайней
мере, в рамках линейной модели, могла бы возникнуть интерференция.
(Поскольку при многократной ретрансляции доля мощности, отвечаю-
отвечающая определенному исходному сигналу, все время падает (при малых
a^j), то выражение C.4.48) можно, по-видимому, считать приближенно
верным даже и в случае, когда нет упомянутого выше разделения
диапазонов частот.)
Учитывая C.4.47), C.4.48), выпишем коэффициент усиления по
мощности kj для ретранслирующей части j-ro устройства:
ретр
kj = -L^- = _oj_ej ^ j = l,...,n. C.4.49)
- OLk)bjkek
Полезный сигнал, поступающий на вход приемника г-й пары, в на-
настоящей модели складывается из полезного сигнала, идущего непосред-
непосредственно от «своего» передатчика (ац A — щ) е^), и полезного сигнала,
146 Локальная организация целесообразного поведения [Гл. 3
п
прошедшего через все ретрансляторы: ^2 kj bji aij A ~~ aj) ei- Если
aj = 0, j = 1, . . . , n, т. е. ретрансляций нет, то верна формула C.4.23).
Поставим такой вопрос: можно ли выбрать ai, . . . , ап так, чтобы каче-
качество связи в каждом из п каналов приемник-передатчик улучшилось
по сравнению с качеством, даваемым формулой C.4.23)?
Введение ретрансляции оправдано в этом смысле, когда часть мощ-
мощности, которая г-м устройством расходуется на ретрансляцию и поэтому
не поступает в г-й приемник (с^ ац е^), «компенсируется» той полезной
мощностью, которая приходит в г-й приемник через все ретрансляторы.
Отсюда получаем, что ретрансляции могут быть полезными одновре-
одновременно для всех участников коллектива радиостанций, если при некото-
некоторых а1? . . . , ап (О $J ai $J 1, г = 1, . . . , п) удовлетворяются следующие
п неравенств:
п
^2 kj bji aij A - а^ > ai ац, г = 1, . . . , п. C.4.50)
Пример, п = 2.
Для этого случая из C.4.49) и C.4.50) получаем при ai, oti ^0
ац е2 а2 V A - а г) 62i ei J '
(о.4.51)
«2i е2 <*2
«22 ei ai V
,
A —
т. е. ретрансляция может оказаться полезной, если отношения
Q>i\l&Tii достаточно велики, т. е. высок уровень взаимных помех в ис-
исходном коллективе, до введения ретрансляции.
Кроме того, из выражения C.4.51) видно, что ретрансляция ока-
окажется полезной «скорее всего» при больших мощностях устройств
ei, e2, при малых ослаблениях сигналов на пути от одного передатчика
к другому F12,621 велики) и малых аддитивных шумах на входах
ретрансляторов.
Следствием C.4.51) является неравенство
^^ > 1, C.4.52)
ац а22
которое означает, что вектор отношений шум/сигнал A,1) в таком
коллективе радиостанций при отсутствии ретрансляций недостижим.
Действительно, если вектор (Ai,A2) достижим в коллективе из двух
пар радиостанций, то должно выполняться условие (см. п. 3.4.1 и [Сте-
фанюк и Цетлин, 1967])
Ai А2 ац а22 — «12 «21 > 0. C.4.53)
3.4] Одна теорема об М-матрицах и ее применения 147
Сопоставляя C.4.52) и C.4.53), получаем, что A,1) ^ Л' К Таким
образом, условие A,1) ^ Л^2) является необходимым условием целесо-
целесообразности введения ретрансляций в коллектив радиостанций. Далее
аналогичный результат будет получен для произвольного п.
Отметим, что при п = 2 ценность приведенных результатов невысо-
невысока в случае, если применяется «двухчастотная схема»: разнесение двух
каналов связи по двум частотным диапазонам полностью устранило бы
взаимные помехи. Однако рассматриваемая в настоящей работе схема
предназначена для использования в условиях локальной организации,
когда радиостанциям, входящим в коллектив, становится известной
лишь локальная, ограниченная информация, сводящаяся к е^, Л^. По-
Поэтому будем придерживаться такой организации связи в коллективе,
которая не зависит от п.
Случай произвольного числа участников.
Расписав C.4.50) с учетом C.4.49), имеем
п
Eej ei (I — OLi) bji
a3 atJ e_ n x> аг агг, i — ±, . . . , n.
^.=J l Nj + 5Z ek A — ak) bjk ek
C.4.54)
Так как
:iA"aiNji < 1, C.4.55),
fc = l
то следствием C.4.50) является система неравенств
п
У2 aj dij ej > ai пц e^, i = 1, . . . , п. C.4.56)
Таким образом, необходимым условием полезности ретрансляций
является выполнение системы неравенств C.4.56) при каких-то неот-
неотрицательных а1? . . . , ап (ввиду однородности C.4.56) условие aj < 1
оговаривать не нужно). Или, если произвести изменение «масштаба»
и ввести новые переменные
г1 = а{е{, г = 1,...,п, C.4.57)
то таким необходимым условием является выполнение системы нера-
неравенств
п
^2 zj aij > zi аа-> г = 1,. . . ,п C.4.58)
при каких-либо неотрицательных zi, . . . , zn.
Смысл последнего соотношения становится ясным из следующей
теоремы.
148 Локальная организация целесообразного поведения [Гл. 3
Теорем а 3.6. Пусть М^п\\) есть квадратная действительная
матрица порядка п, элементы которой суть числа Л^ ац, —a,ij, г, j =
= 1, . . . , п. Соотношение
M(n)(A)z^0 C.4.59)
выполняется для некоторого полуположительного вектора z тогда
и только тогда, когда вектор А = (Ai, . . . , Ai) является недостижи-
недостижимым в коллективе радиостанций, определяемом матрицей величин
\aij\\l, т.е.Х^А^.
Доказательство. Обратимся вновь к п. 3.4.1.
Если A G А^п\ то неравенство
М(п)(А)е > 0 C.4.60)
имеет положительное решение е, причем А Е Л'п) выполняется тогда
и только тогда, когда все главные миноры М^п\Х) положительны (что
выводится в п. 3.4.1 из теоремы 3.3 и леммы 3.3).
Пусть теперь А Е Л^п^ и рассмотрим неравенство
М<")(А)у>0, C.4.61)
где M^n)(A) — транспонированная матрица по отношению к М()
Поскольку при транспонировании матрицы знаки ее главных мино-
миноров остаются неизменными, то это неравенство также имеет неотрица-
неотрицательное решение, если и только если А Е А^п\
Применим теперь теорему 2.10 из книги [Гейл, 1963]. Согласно этой
теореме, имеет место ровно одна из двух возможностей: либо имеется
неотрицательное решение у системы неравенств C.4.61) (т. е. А Е Л^п^),
либо имеется полуположительное решение неравенства C.4.59) (и тогда
А ^ Л(п)). Теорема доказана.
Замечание. Исследуя уравнение границы множества в случае,
когда матрица Ца^-Ц., неразложима, можно показать, что все неравен-
неравенства в C.4.59) можно сделать строгими, если А ф [Л^п^], где [Л^п^] —
замыкание области А^п\ Доказательство этого факта мы опускаем.
Таким образом, из сказанного вытекает, что условие C.4.58) может
быть выполнено только тогда, когда выполняется
A,...,1)?Л<"), C.4.62)
т. е. когда единичный вектор отношений шум/сигнал недостижим
в коллективе радиостанций, который возникает при а^ = 0, г = 1, . . . , п
(т. е. при отсутствии ретрансляций). Можно показать также, что для
неразложимой матрицы ||а^-| ™ условие C.4.58) заведомо может быть
выполнено, если
(!,...,!) 0[Л(">]. C.4.63)
3.5] Управление многозвенным манипулятором 149
Итак, использование части мощности передатчика для ретрансля-
ретрансляции сигналов «чужих» передатчиков может привести к улучшению
качества связи в предположении, что подобным же образом поступят
и другие (см., например, C.4.51)). Такая «взаимопомощь» может ока-
оказаться целесообразной для всех передатчиков лишь при условии, что
без нее уровень взаимных помех был столь высок, что одновременно во
всех парах приемник-передатчик нельзя было достигнуть единичного
отношения сигнала к шуму. Иными словами, ретрансляции могут при-
принести пользу, если без них достижимое «качество связи» оказывается
(в среднем) достаточно плохим.
3.5. Локально-организованное управление
многозвенным манипулятором
Хотя локальное управление и коллективное поведение первоначаль-
первоначально возникли при анализе технических моделей, многие авторы, следуя
М. Л. Цетлину, отмечали близкие биологические аналоги. М. Л. Цет-
лин, И. М. Гельфанд и др., которые непосредственно занимались вопро-
вопросами организации управления в биологических системах, предложили
иерархическую многоуровневую схему, где каждый уровень устанавли-
устанавливает для нижеследующего определенную цель, или автономную задачу
[Гельфанд и др., 1986].
Под влиянием этих важных работ, опиравшихся на доказательный
экспериментальный материал, мы пытались выявить случаи примене-
применения в биосистемах не децентрализованной, а локальной организации
(см. Введение и разд. 1.2, 1.3).
Эти попытки обсуждались нами с проф. С. В. Фоминым, что нашло
отражение в его книге [Фомин, Беркинблит, 1973]. В ней СВ. Фомин,
на протяжении многих лет занимавшийся математическим моделиро-
моделированием в биологии, привел локальное управление и свойство живучести
как альтернативные возможности организации биосистем.
Мы не будем здесь обсуждать вопросов живучести, которую мы
понимаем как принцип организации сложной системы, а не просто
как ее свойство. (На этом принципе нами был разработан «живучий»
радиоприемник, действующий макет которого был реализован в ИППИ
АН СССР Д. А. Беловым.)
Что же касается локального управления, то нами было предложено
попытаться применить его к управлению многозвенным манипулято-
манипулятором с тем, чтобы приблизить работу технического устройства к работе
такого совершенного «манипулятора», как рука человека. В 1974 г. нами
совместно с Ю. И. Крюковым и СВ. Фоминым были опубликованы
тезисы [Крюков и др., 1974], в которых речь шла об алгоритмах выра-
выработки навыка в действиях манипулятора.
Ниже мы опишем результаты, полученные и подробно изложенные
в нашей публикации [Крюков и Стефанюк, 1981]. Отметим, что, с одной
стороны, в настоящее время это направление продолжает развиваться
Ю. И. Крюковым, а с другой стороны, группа исследователей, воз-
возглавляемая И. М. Гельфандом, какое-то время назад вновь обратила
150 Локальная организация целесообразного поведения [Гл. 3
внимание на возможность рассматривать многозвенную управляемую
систему как коллектив автоматов [Интел, процессы, 1987, с. 5-38;
Беркинблит, Гельфанд, Фельдман, 1986]. Новым в развиваемых этой
группой исследованиях, является хорошая экспериментальная база
(эксперименты проводились на лягушке).
Мы опирались в основном на работы по робототехническим устрой-
устройствам и исследования крупнейшего советского физиолога Н. А. Берн-
штейна, высказавшего в своих работах [Бернштейн, 1947; 1966] ряд
блестящих идей организации управления движениями у человека и жи-
животных. Ему, в частности, принадлежит важное для нас наблюдение:
«Диалектика развития навыка состоит в том, что там, где есть разви-
развитие — там каждое следующее исполнение лучше предыдущего, т. е. не
повторяет его; поэтому упражнение есть, в частности, «повторение без
повторения» [Бернштейн, 1947].
В искусственном интеллекте общепринят способ управления ма-
манипулятором, когда все кинематические и динамические параметры
манипулятора, исходное и целевое состояния, возможные ограничения
вводятся в ЭВМ, целиком рассчитывающую траекторию и необходимое
управление. Исследуется иной подход: сначала решение принимается
с помощью простого итеративного алгоритма, который хотя и приво-
приводит к цели, но может оказаться неудовлетворительным в отношении
энергетических затрат, перегрузок и т. п. «Шлифовка» движения мани-
манипулятора от раза к разу достигается за счет второго уровня, вносящего
свои коррективы [Крюков и др., 1974].
Таким образом, движение манипулятора организуется подобно то-
тому, как это происходит при обучении новичка удару по мячу в теннисе:
сначала грубо определяется «примерно правильное» решение, а затем
оно корректируется с приобретением опыта. Действительно, если одна
и та же (или примерно одна и та же) задача повторяется несколько раз,
то естественно попытаться ввести в алгоритм обучение.
В при л. П. 2 содержится изложение некоторых результатов по реа-
реализации на компьютере одного из таких адаптивных алгоритмов реше-
решения задачи управления манипулятором, описанного в работе [Крюков
и Стефанюк, 1981].
3.5.1. Модель манипулятора. Для простоты рассматривается плос-
плоская цепь из п шарнирно соединенных тонких стержней массы rrii и дли-
длины 1{ каждый, г = 1, . . . , п (см. рис. 3.5). Соседние стержни связаны
парами мышц «сгибатель-разгибатель», которые по модельному пред-
предложению могут развивать произвольные (контролируемые) усилия из
некоторого диапазона («мышцы» всегда натянуты). Первое звено с по-
помощью шарнира и аналогичной пары мышц связано с неподвижной
опорой. Трением и силой тяжести в данном случае пренебрегаем, хотя
эти факторы также могут быть учтены [Стефанюк и др., 1980].
Перед этой цепью (в дальнейшем будем условно называть ее «ру-
«рукой») ставится двигательная задача в простой, но достаточно общей
форме, допускающей разнообразную конкретизацию: такая рука долж-
должна научиться попадать свободным концом манипулятора А в заданную
3.5]
Управление многозвенным манипулятором
151
А0
Рис. 3.5. Модель манипулятора
окрестность некоторой фиксированной точки Л°, лежащей в плоскости
манипулятора.
Наложив определенные ограничения на величину и направление
скорости подхода к целевой точке, а также добавив ряд дополнитель-
дополнительных условий — периодичность движения, специальное распределение
масс (например, наличие дополнительного массивного тела на конце
руки) и т. п., можно решение такой общей задачи использовать для
целого ряда частных двигательных задач: касание (например, для
последующего захвата детали), переноска груза, нанесение ударов за-
заданной силы в заданном направлении — одиночных или серией — как
например, при забивании гвоздей, бросании в цель и т. д.
Предполагается, что у такого манипулятора имеется система на-
навигации на основе какого-либо зрительного устройства или другой
системы ориентировки цепи в плоскости, позволяющей установить рас-
расстояние от А до А°.
3.5.2. Двухуровневая система управления. Как уже говорилось,
в задаче используется два уровня управления. Первый включает ло-
локальную оценку углов, на которые нужно повернуть звенья цепи, и вы-
выбор усилий каждой мышцы исходя из этой оценки, величин и направ-
направлений текущих скоростей вращения звеньев и расстояния кисти руки
до целевой точки. Если бы можно было пренебречь инерционными
свойствами звеньев манипулятора, то мы фактически получили бы
систему без взаимодействия в смысле п. 3.1.1 и, согласно теореме 3.1,
такое управление было бы глобально устойчивым, приводя финально
к минимизации расстояния от конца манипулятора до цели. Одна-
Однако заметим, что возникающие силы взаимодействия между звеньями
в шарнирах-суставах практически непредсказуемым образом изменяют
картину движения, на что указывал еще Н. А. Бернштейн [Бернштейн,
152 Локальная организация целесообразного поведения [Гл. 3
1966], поэтому управление такой рукой должно вестись непрерывно:
выбор углов поворотов и усилий производится на каждом такте до
достижения цели. На втором уровне осуществляется обучение, в ходе
которого система постепенно находит динамически улучшенную устой-
устойчивую траекторию и запоминает ее. Одновременно может производить-
производиться непосредственная коррекция и использование реакций в суставах
с целью сглаживания траектории и приближения ее к требуемой, что
может оказаться выгодным с кинематической и динамической точки
зрения.
Подробное описание алгоритмов работы уровней вынесено в прило-
приложение П.2, где приводятся также результаты имитационного модели-
моделирования работы такой руки на компьютере.
3.6. Выводы по главе 3
1. Показано, что целесообразность поведения в моделях локально-
организованных систем с непрерывным множеством действий связана,
прежде всего, с вопросом устойчивости системы. При этом неустой-
неустойчивость может возникать по двум причинам. Во-первых, вектор тре-
требований компонент системы может оказаться недостижимым, и тог-
тогда неустойчивость является неизбежной. Во-вторых, при достижимом
векторе требований неустойчивость может возникать из-за взаимных
конфликтов в поведении подсистем.
Показано, как следует анализировать оба эти обстоятельства в до-
достаточно произвольном классе моделей.
2. Для достижения устойчивости в общем случае предложено ис-
использовать локальные критерии, опирающиеся исключительно на до-
доступную локально каждой подсистеме информацию.
3. Введено представление о системе без взаимодействия, соответ-
соответствующее важному для практики классу локально-организованных
иерархических по взаимодействию систем. Показана глобальная устой-
устойчивость поведения такой системы при достаточно общих ограничениях.
4. Сформулированы и исследованы содержательные условия устой-
устойчивости локально-организованной системы в общем случае, использу-
использующие рефлексивные соображения о том, каков будет результат для
данной подсистемы после ответной реакции остальных подсистем,
5. Введенное автором понятие эластичности перенесено на доста-
достаточно общий случай системы с локальной организацией. Показано,
что эластичность не может быть обеспечена во всем классе критери-
критериев и алгоритмов поведения подсистем, опирающихся на вариации по
действиям подсистем, т. е. где равновесные точки — суть партии Нэша
в обычном смысле.
6. Исследование поведения локально-организованных систем потре-
потребовало дополнительных результатов, относящихся к теории матриц.
Получено оригинальное условие того, чтобы матрица Метцлера бы-
была бы М-матрицей. Как следствие этого результата доказана выпук-
выпуклость области достижимых векторов в системе с антагонистическим
взаимодействием, а также получено новое условие невырожденности
3.6] Выводы по главе 3 153
произвольной матрицы, являющееся специальной («аналитической»)
формой условия Фидлера.
7. В рамках локально-организованных систем сформулирована и ис-
исследована новая модель связи многих пользователей, в которой часть
мощности передатчика используется для ретрансляции. Получены
необходимые условия полезности введения ретрансляции в такой си-
системе.
8. Показано, что принципы локальной организации системы позво-
позволяют предложить новый подход к проблеме управления многозвенным
манипулятором, однако необходимое сглаживание траектории (выра-
(выработка навыка) потребовало введения дополнительного взаимодействия
между подсистемами, компенсирующего естественное, в силу инерци-
инерционности, взаимодействие подсистем.
9. В целом показано, что при локальной организации важным явля-
является и характер взаимодействия подсистем, и вид локальных критериев
индивидуального поведения подсистем. Оба эти фактора достаточно
подробно исследованы.
Глава 4
ЛОКАЛЬНЫЙ ПОДХОД К РЕШЕНИЮ
ФУНДАМЕНТАЛЬНЫХ ЗАДАЧ
ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
В области программирования в конце 50-х годов зародилось новое
направление — искусственный интеллект [Стефанюк, 1987в]. Ведущие
представители этого направления с самого начала пытались как-то
отделить его от традиционной кибернетики, т. е. от теории управле-
управления, теории автоматов и т. д. Поэтому в обиход стали вводить новые
парадигмы, новые постановки задач, новые методы и новые критерии,
опираясь, главным образом, на успехи молодой вычислительной науки.
(Одно время с термином «искусственный интеллект» успешно конку-
конкурировал термин «машинный разум».)
В настоящей главе мы проанализируем возможности локального
подхода в некоторых фундаментальных проблемах искусственного ин-
интеллекта. В разд. 5.1 гл. 5 будет предпринята попытка показать место
локального подхода, характер получаемых результатов и их практиче-
практическую полезность в области собственно программирования. В настоящей
же главе будет показана продуктивность использования локальной
организации в области искусственного интеллекта при решении таких
проблем, как представление задач и знаний, обучение и формирование
систем знаний, объединение свидетельств, поступающих из разных
источников.
В разд. 4.1 рассматриваются вопросы эвристического локального
поиска представления задач в проблеме плотного покрытия некоторого
плоского множества заранее определенными фигурками. В основу под-
подхода положен так называемый принцип семиотической интроспекции,
который нам представляется одним из «слабых», в силу его универсаль-
универсальности и широкой употребимости, методов упрощения описания задач,
содержащих большое количество в сущности однотипных элементов.
В разд. 4.2 описаны многочисленные варианты и обобщения задач,
так или иначе прямо напоминающих «крепкий орешек», описанный
Маккарти, показывающие широкие возможности использования семио-
семиотической интроспекции. Приведены математические исследования, пе-
переводящие проблему из области эвристики в область строгого анализа.
Проводится параллель между двумя внешне весьма далекими про-
проблемами, а именно между задачей плотного покрытия некоторого плос-
плоского множества и задачей управления потоками такси в городе.
В разд. 4.3 изучаются возможности локального подхода при
эволюционном конструировании достаточно сложных технических
устройств, таких, как карбюратор автомобиля. Начато обсуждение
вопросов использования аргументации в противовес чисто логическому
4.1] Локальный подход к выбору представления задач 155
анализу. К этому вопросу мы еще раз обратимся в следующих разделах
книги.
В разд. 4.4 описан эксперимент по автоматическому формирова-
формированию фреймо-подобных структур, который, в конечном счете, позволил
сформулировать теоретико-категорную модель представления знаний
и обучения в разд. 4.5. Показано, что формирование простых фреймов
может быть прямо связано с минимизацией времени выборки данных.
Формальная теория представления знаний и локального обучения,
изложенная в разд. 4.5, опирается не интенсивное использование эле-
элементов теории категорий, которые позволяют описывать разнообраз-
разнообразные эффекты обобщения и специализации знаний на самом абстракт-
абстрактном уровне и поэтому охватывающих большое число конкретных слу-
случаев.
Раздел 4.6. посвящен вопросам построения теории экспертных
(человеко-машинных) систем — области, традиционно считающейся
чисто прикладной. Показано, что и здесь локальные представления
играют важнейшую роль, позволяя строить большой программный
комплекс и базу знаний локальным образом.
В этом разделе предложен и применен аксиоматический подход
к суммированию свидетельств с учетом их возможной зависимости
друг от друга.
Основные результаты главы опубликованы в работах [Стефанюк,
1973; 1975; 1982; 19876, 1966; 1985; 1987в; 1987г; 1988а; 19886; Жожика-
швили и Стефанюк, 1984а; 19846; 1985; 1986а; 19866], в работе [Гинзбург
и Стефанюк, 1979], в работах [Алексеева и др., 1984; Алексеева и Сте-
Стефанюк, 1984] и в работе [Гершт и Стефанюк, 1968].
Программа на языке Лисп, необходимая для экспериментов из раз-
раздела 4.4, написана А. В. Жожикашвили с использованием созданной
автором книги системы ЭКЛИСП (см. следующую главу).
А. В. Жожикашвили, как специалист по теории категорий, сыграл
решающую роль при конкретизации формальной модели представле-
представления знаний и обучения, описанной в разд. 4.5. (По этим материалам им
защищена кандидатская диссертация.) Здесь, автору настоящей книги
принадлежат исходная постановка проблемы, выбор направления ис-
исследования, общее руководство и фактическое участие на всех этапах
развития темы.
4.1. Локальный подход к выбору представления
задач
В этом разделе будут рассмотрены некоторые задачи, характери-
характеризующиеся тем, что в их исходной формулировке содержится большое
количество различных между собой элементов, имеющих, как мы будем
говорить, различные имена. Указанное обстоятельство затрудняет
156 Локальный подход к решению фундаментальных задач [Гл. 4
решение таких задач на ЭВМ: требуемый объем перебора невозмож-
невозможно осуществить даже на современных супер-ЭВМ [Time-life, 1987],
поскольку он экспоненциально растет с ростом числа разноименных
элементов.
Однако будет показано, что уже первые попытки начать решение
поставленной перед исследователем задачи дают необходимую эвристи-
эвристическую информацию для упрощения исходного описания задачи путем
уменьшения числа используемых для элементов задачи «имен».
Можно сказать, что требование уменьшить общее количество имен
является здесь «глобальным», однако его реализация сводится к ло-
локальным процедурам. Возникающие при этом новые представления для
задачи не обязательно будут полезными для ее решения в силу локаль-
локальности используемых соображений, но в некоторых нередких примерах,
которые будут описаны ниже, такие представления оказываются чрез-
чрезвычайно полезными, т. е. поведение локально-организованной системы
S в целом оказывается целесообразным.
Когда формулируется некоторая эвристика (например, желатель-
желательность занятия «центра» в игре в шахматы), она формулируется не по-
потому, что стало известно, как решить всю задачу в целом, т. е. выиграть
партию в шахматы, а как результат попытки решить некоторую част-
частную подзадачу. В этом смысле использование совокупности эвристик —
это разновидность локального подхода к решению задачи.
В подразделе 4.1.1 речь идет не столько об использовании подобных
эвристик, сколько о том, как строить такие эвристики, опираясь на
некоторые важные соображения семиотического характера.
Если обратиться к схеме, представленной на рис. 1.3, то в разделах
4.1, 4.2 под S следует понимать метод решения всей задачи, а под
Si — отдельные соображения (эвристики) по ее решению. Здесь об-
общим требованием является возможность построить решение, которое
обеспечивается, как известно, выбором удобного представления для
решаемой задачи.
Это удобство в идущих далее примерах обеспечивается малым
числом имен, используемых для элементов, характеризующих задачу.
В разделах 4.1, 4.2 будет показано, что, действительно, такое упроще-
упрощение представления позволяет решить и задачу в целом.
4.1.1. Принцип семиотической интроспекции. Семиотика — это
наука о знаковых системах. Ее можно применять к задачам, носящим
символьный характер. Что касается несимвольных задач, в которых
описание дается в терминах слабоструктурированных данных, то к ним
идеи семиотики могут быть применены лишь после преобразования
в символьную форму. Методы такого рода преобразований можно най-
найти в монографии [Загоруйко, 1999].
Остановимся на одной идее, связанной с использованием семиотики
при выборе адекватной формулировки, или выборе представления
4.1] Локальный подход к выбору представления задач 157
задачи, а именно, на семиотической интроспекции, являющейся разви-
развитием наших прежних исследований в этом направлении.
Принцип семиотической интроспекции в несколько вольной фор-
формулировке звучит следующим образом: «подобное — отождествить,
различие — подчеркнуть» [Стефанюк, 2000г; е; з].
Приведенная нарочито расплывчатая формулировка (напоминаю-
(напоминающая по форме принцип гомеопатии в медицине: «лечить подобное по-
подобным») подчеркивает сущностное свойство данного принципа. Это —
не алгоритм, не прямой рецепт, а лишь подсказка для направления ин-
интуиции. В некотором смысле, указанный принцип определяется вполне
аналогично формулировке GPS (General Problem Solver), т. е. универ-
универсального решателя задач, который описан как «метод устранения раз-
различий при достижении цели» (предложенный Ньювеллом, Саймоном
и Шоу). Что понимать под «различием» и как его «устранять» —
зависит от конкретной проблемной области. В формулировке GPS не
содержится рекомендаций, как раскрывать эти понятия в каждом от-
отдельном случае. Поэтому метод GPS, который нашел многочисленные
практические применения, — например, в системе STRIPS Нильсона
для прокладки маршрута интеллектуальным роботом при наличии
препятствий — следует считать принципом решения задач, а не непо-
непосредственной рекомендацией к ее решению.
Предлагаемый нами принцип семиотической интроспекции, отли-
отличает от GPS одно очень важное обстоятельство: применение GPS воз-
возможно лишь с того момента, когда задано описание начального состо-
состояния и поставлена цель решения задачи. SIP (Semiotic Introspection
Principle), т. е. принцип семиотической интроспекции, взятый сам по
себе, не решает задачу, но он может применяться для продвижения
к подобной цели во всех тех случаях, когда задана начальная форму-
формулировка задачи, например, начальная позиция и допустимые ходы. Его
применение может позволить переформулировать задачу некоторым
иным образом (т. е., представить задачу по-иному [Stefanuk, 1973]).
Иногда при этом новое представление задачи оказывается настолько
эффективным, что достижение многих поставленных целей становится
тривиальным. Обычно люди в таких случаях говорили бы об «откры-
«открытии» или «озарении».
Сама формулировка принципа семиотической интроспекции «по-
«подобное — отождествить, различие — подчеркнуть» предполагает, что
в исходной задаче должен быть механизм (или еще один принцип) для
определения аналогичности или подобия. Ниже будет показано, что
в ряде случаев основания для этого содержатся в самой прагматике
решаемой задачи. Кстати, мы используем слово интроспекция, чтобы
подчеркнуть, что указанные действия осуществляются на этапе «раз-
«размышления над задачей».
Практически, отождествление обычно сводится к присваиванию
соответствующим элементам задачи одного и того же имени; подчер-
подчеркивание различия, наоборот, осуществляется путем введения строго
158 Локальный подход к решению фундаментальных задач [Гл. 4
различных имен. Эти имена могут носить как содержательный, так
и абстрактный характер. В абстрактном случае для различных имен
имеет смысл использовать натуральный ряд чисел, или же функцию
(подпрограмму) GENSYM языка ЛИСП, которая гарантирует выдачу
совершенно нового имени при каждом обращении к ней.
Можно убедиться, что указанный принцип работает в ряде задач
(см. ниже), позволяя построить для этих задач новые представления,
полезные с некоторой прикладной точки зрения. Есть все основания
предполагать, что этот принцип может быть использован и во многих
других областях.
4.1.2. Семиотическая интроспекция в задаче «крепкий орешек».
Хорошо известно, что удачное описание задачи может самым суще-
существенным образом облегчить ее решение. Без тщательного исследова-
исследования проблемы адекватного представления задачи искусственный ин-
интеллект рискует навсегда остаться совокупностью нескольких удачных
технических находок и приемов, привлекательность которых падает
сразу же после их выделения и изучения [Нильсон, 1973]. Обнаружение
механизмов самостоятельного открытия системой того, что не было
сообщено ей извне, могут придать новый импульс этому научному
направлению.
В данном разделе вопрос представления исследован на примере
иерархической последовательности задач, порожденной одной извест-
известной математической головоломкой — доказательством невозможности
покрыть косточками домино шахматную доску с удаленными угловыми
клетками. Задачи в этой иерархии упорядочены по степени абстракции
и, соответственно, требуют представлений возрастающей степени слож-
сложности.
Часто полагают, что удачные представления могут возникнуть
лишь как результат озарения. В работах [Stefanuk, 1973; Стефанюк,
1975] мы показали, что во многих случаях такие представления могут
быть построены путем уменьшения числа используемых имен для эле-
элементов задачи и их адекватного присваивания. Основная мысль состоит
в том, что многие из задач, с которыми мы сталкиваемся, оказываются
трудными, потому что в своей исходной формулировке они содержат
слишком большое число различных элементов, т. е. элементов, име-
имеющих различные имена. Когда таких элементов немного, то задачу
решает простой перебор. Но при большом числе имен пространство
поиска становится слишком большим и задача предстает как трудно
разрешимая.
В работах [Stefanuk, 1973; Стефанюк, 1975; Stefanuk, 1996] мы пока-
показали, что обычно сама исходная задача содержит определенную эври-
эвристическую информацию, необходимую для ее упрощения. Эта эвристи-
эвристическая информация может быть выделена на стадии первых попыток
решить задачу. В этом месте наш подход существенно отличается от
мысли, изложенной в работе [Simon, 1995], где предполагается, что
«поиск начинается с новой точки и с новым направлением внимания,
а это делает предыдущие попытки покрыть доску несущественными».
4.1] Локальный подход к выбору представления задач 159
Задача о покрытии усеченной шахматной доски использовалась
во многих учебниках по искусственному интеллекту [Нильсон, 1973;
Kowalski, 1979] (рис. 4.1) для иллюстрации важной роли адекватного
описания задачи. На самом деле, проф. Дж. Маккарти первым обратил
внимание на этот интересный пример [McCarthy, 1964]. В своей заметке
он тогда показал, что если представить задачу в виде совокупности
формально-логических выражений, описывающих свойства доски, рас-
расположение ее клеток и характер покрытия доски каждой косточкой
домино, то возникает задача на доказательство теорем, которая не под
силу ни одному из имеющихся компьютеров. Именно тогда он назвал
эту задачу крепким орешком для искусственного интеллекта.
Парадоксально то, что для этой задачи существует очень простое
решение. Действительно, если клетки доски окрашены в чередующиеся
черные и белые цвета, то легко видеть, что каждое домино накрывает
одну черную и одну белую клетку. Отсюда следует, что покрытие
доски невозможно, поскольку числа черных и белых полей у доски
с удаленными клетками не равны друг другу.
Какое-то время казалось, что родившаяся отсюда идея «инвариан-
«инварианта» позволит решить не только эту, но и многие близкие задачи. Но до
работы [Stefanuk, 1973] никто не поднимал вопроса о том, каким об-
образом может быть открыто столь удачное шахматное описание доски
(рис. 4.2), которое приводит к блестящему решению поставленной за-
задачи. В нашей же работе для этого предложена эвристика уменьшения
числа используемых имен и их адекватного приписывания, работоспо-
работоспособность которой была продемонстрирована на множестве примеров
[Stefanuk, 1973; Стефанюк, 1975; Stefanuk, 1996].
Проблема адекватной раскраски элементов некоторых множеств
возникает во многих случаях. Например, в [McCarthy, 1990; Kempe,
1979] она обсуждается в контексте раскраски географической карты.
Рис. 4.1. Раскрашенный массив Рис. 4.2. Нераскрашенный массив
160 Локальный подход к решению фундаментальных задач [Гл. 4
В замечательной работе [Зенкин, 1991] по когнитивной графике
показано, как удачная раскраска числовых массивов помогает решить
многие исключительно трудные задачи из области теории чисел. Боль-
Большое количество примеров покрытия и замощения разнообразных мас-
массивов содержится в книге [Голомб, 1975]. К сожалению, как правило,
в ней приводятся лишь решения задач, но не объясняется, каким обра-
образом автор пришел к таким решениям. В этом и следующих разделах мы
покажем, как можно использовать для этого принцип семиотической
интроспекции «подобное — отождествить, различие — подчеркнуть.»
Настоящее изложение во многом стимулировано выступлением
Г. Саймона на IJCAI-95 [Simon, 1995], который экспериментально изу-
изучил проблему озарения и открытия, используя в качестве примера все
ту же задачу «о покрытии усеченной шахматной доски.»
Однако авторы редко объясняют то, как они пришли к используе-
используемым представлениям задачи, тогда как вскрытие механизмов возникно-
возникновения таких представлений [Stefanuk, 1973; Стефанюк, 1975] является
центральной темой данной главы.
4.2. Вариации на тему задачи «крепкий орешек»
Итак, первоначальная задача, вкратце, состоит в том, чтобы до-
доказать невозможность совершенного покрытия квадратного массива
клеток 8 х 8, из которого выброшены две максимально удаленные друг
от друга клетки [Голомб, 1975; Нильсон, 1973]. Как известно, доказа-
доказательство невозможности совершенного покрытия (нет пропущенных
клеток, и домино не выступают за край доски) следует легко из того,
что число черных и число белых клеток на доске не равны друг другу.
Формулировка же этой задачи как обычной задачи логического до-
доказательства приводит к громоздкой комбинаторной проблеме, решить
которую за обозримое время не представляется возможным [McCarthy,
1964]. Однако, если клетки массива раскрашены в шахматном порядке
(см. рис. 4.1), то сразу видно, что каждое домино накрывает одну
черную и одну белую клетку. Поскольку число черных клеток в таком
усеченном массиве не равно числу белых, то совершенное покрытие
очевидно невозможно.
В ходе решения любой задачи приходится совершать множество от-
открытий различной степени трудности и важности. В случае «крепкого
орешка» (см. [McCarthy, 1964]) самой важной нам показалась догадка
об использовании шахматной раскраски. Имея такую раскраску, уже
нетрудно догадаться об инварианте [Simon and Siklossy, 1972; Stefanuk,
1973; Simon, 1995], ведущем к решению задачи: каждая косточка доми-
домино накрывает ровно одну черную и одну белую клетку.
В работе [Stefanuk, 1973] мы обратили внимание на другое обстоя-
обстоятельство, связанное с этой задачей: а каким же образом человек пришел
к мысли о раскраске массива из 62 клеток на манер шахматной доски.
В этом случае обычно говорят об «озарении» (см. множество примеров
4.2] Вариации на тему задачи «крепкий орешек» 161
таких «озарений» в книге о полимино [Голомб, 1975]) и делается утвер-
утверждение, что искусственный интеллект невозможен, так как программы
не способны к открытиям.
Таким образом, в работе [Stefanuk, 1973] мы начали тему автома-
автоматических методов поиска представления задачи и, в частности, авто-
автоматических методов создания окрасок при решении задачи покрытия.
Прежде чем переходить к раскрытию темы, заметим, что эта работа
была опубликована в тот период, когда в искусственном интеллекте
большую роль начали отводить вопросам представления знаний. Од-
Однако правильнее было бы говорить о представлении задач и знаний,
что нашло отражение в научной программе 4-й международной объ-
объединенной конференции по искусственному интеллекту (IJCAI-1975,
Тбилиси).
Заметим, что «открытие» соответствующей раскраски остается
весьма трудным делом, даже если заранее задаться поиском инвариант-
инвариантных свойств [Simon and Siklossy, 1972]. Это наблюдение подтверждается
также и экспериментальными результатами работы [Simon, 1995].
Эвристика, позволяющая естественным путем прийти к необходи-
необходимой раскраске, была предложена и изучена в [Stefanuk, 1973; Стефа-
нюк, 1975]. Ниже мы показываем, что и остальные этапы решения зада-
задачи точно также могут быть пройдены без привлечения так называемого
озарения.
4.2.1. Иерархия проблем. Приводимые ниже формулировки задач,
прямо порожденных задачей «крепкий орешек», обладают тем свойст-
свойством, что каждая последующая задача является обобщением предыду-
предыдущей:
A. Массив раскрашен на шахматный манер, и объяснено понятие
инварианта (рис. 4.1).
B. Массив раскрашен, но никаких подсказок к решению задачи не
дается (рис. 4.1).
C. Предъявлен нераскрашенный массив (рис. 4.2 и рис. 4.3).
D. Предъявлена фигура — ортогон (рис. 4.13).
Эксперименты с вариантами А, В, С [Simon, 1995] показали, что
для людей трудность решения задачи соответственно последовательно
возрастает.
4.2.1.1. Случай В. В работах [Stefanuk, 1973; Стефанюк, 1975] пока-
показано, что трудность исходной задачи обусловлена тем, что все клетки
исходно имеют различные имена (рис. 4.3), и любая процедура перебора
оказывается слишком громоздкой.
При попытках покрыть этот массив полностью в ходе перебора
возможностей строится следующее множество покрытий:
pat]^ = [ai2, ai3], [ai4, ai5], [ai6, ai7],. . . , [a85, a86], [a87, -], [a76, -],
6 Стефанюк
162 Локальный подход к решению фундаментальных задач [Гл. 4
%1
Зп
%1
%1
а71
981
%2
%2
%2
%2
%2
%2
%2
982
%3
а2з
%з
^43
%3
%3
а73
983
а14
а24
%4
Э44
%4
%4
а74
984
9i5
%5
%5
945
%5
%5
975
385
9i6
а-26
%е
946
%б
%б
97б
986
а17
а27
%7
Э47
%7
%7
а77
987
%8
а28
%8
348
%8
%8
з78
Рис. 4.3. Исходный массив с показанными именами
path2 =
], • • • , [а77,а87], [а78, -], [а87, -],
],. . . , [a84, а8б], [a85, —], [a76, —].
Здесь в квадратных скобках показана неупорядоченная пара сим-
символов. Через [у, —] показано, что для у не нашлось пары. Порядок
элементов в этих цепочках несуществен, и мы помещаем такие непар-
непарные элементы в конец, где они и окажутся, вероятно, при реальной
попытке покрыть доску косточками домино, как это было в описанных
экспериментах [Simon, 1995].
Содержащиеся здесь пары удовлетворяют следующим условиям:
aij ф dki и либо J=/, / = /с=Ь1, либо г = А^, j=/=bl.
Если же воспользоваться именами (¦ и ?), приписанными массиву
рис. 4.1 в шахматном порядке, то получим:
ctij = ¦, если г + j = 2/г, к = 1, 2, . . . ,
dij = П, в противном случае.
Из предыдущего получаем, например,
path! = [¦, ?], [¦, ?],[¦,?],..., [¦, ?], [¦, ?], [¦, -], [¦, -];
впрочем, аналогично будут выглядеть и все другие ветви перебора.
Рассмотрим теперь, например, path/g. В принципе, он либо содержит
непокрытые клетки, либо нет. Предположим, что все клетки покрыты.
4.2] Вариации на тему задачи «крепкий орешек» 163
Покажем, что такое предположение ведет к противоречию, Действи-
Действительно, пусть П{ будет общим числом покрытых пар клеток. Тогда
в именах I и ? должно выполняться следующее соотношение баланса:
щ(Ш + П) = 32И + 30П.
Однако последнее соотношение не может выполняться ни для какого
целого п^, в чем можно убедиться формальными методами, или путем
проверки на компьютере для П{ = 1, 2, . . . , 31. Иными словами, показа-
показано, причем, что очень важно, не прибегая к понятию инварианта, что
совершенное покрытие невозможно.
4.2.1.2. Случай А. В приведенных рассуждениях мы не прибегали
к понятию инварианта. Мы просто подсчитывали число клеток того
и другого цвета, и не видно, почему идею инварианта следует считать
базовой эвристикой [Simon and Siklossy, 1972; Stefanuk, 1973; Simon,
1995]. Здесь она нам не потребовалась. Тем не менее, ряд ученых стали
принимать эту эвристику за исходную. И действительно, в ряде случаев
такая эвристика оказывается чрезвычайно полезной. Соответствующие
примеры идут ниже, позволяя сделать мысль о правильном назначении
(присваивании) имен более выпуклой и увидеть ограничения, присущие
нашему подходу.
I. Возьмем тримино, т. е. домино, покрывающее ровно три клетки
(в одном столбце или ряду). Тогда, ограничиваясь двумя именами 0,1,
получаем инвариантную «раскраску», представленную на рис. 4.4 а,
с помощью которой можно, например, доказать невозможность со-
совершенного покрытия такими тримино массива, представленного на
рис. 4.4 б.
II. Взяв три имени, получим «раскраску», показанную на рис. 4.5 а,
которая позволяет доказать невозможность покрытия массива
рис. 4.5 б.
III. Обратившись к гексагональным элементам рис. 4.6 а, увидим,
что из них нельзя построить массив, показанный на рис. 4.6 б (слева —
используя два имени, справа — используя три имени).
IV. В работе [Simon and Siklossy, 1972] доказано, что куб размером
6x6x6 нельзя построить из одинаковых кирпичей размером 1x2x4.
(Приведенное там доказательство дается на 2-х книжных страницах.
Оно опирается на введение понятия «карандаша» и подсчете всех воз-
возможностей, аналогично тому, как решаются сходные задачи в [Голомб,
1975], см. ниже.)
Чтобы свести эту задачу к нашей проблеме покрытия или исполь-
использования имен, заметим, что такие кирпичи во всяком случае должны
были бы располагаться параллельно сторонам куба, находясь от его
сторон на расстояниях, кратных 1. Тогда можно высказать утвержде-
утверждение, эквивалентное исходному: «Куб размером 6x6x6, составленный
из кубиков размером 1x1x1, нельзя представить в виде блоков из
таких кубиков, имеющих размер 1 х 2 х 4».
Используя два имени («черный» и «белый»), нетрудно прийти к ин-
инвариантной раскраске куба, показанной слева на рис. 4.7. Полученное
164
Локальный подход к решению фундаментальных задач
[Гл.4
0 0 10 0 10 0 1
10 0 10 0 10 0
0 10 0 10 0 10
0 0 10 0 10 0 1
10 0 10 0 10 0
0 10 0 10 0 10
а
0
1
2
0
1
2
1
2
0
1
CNI
0
CNI
0
1
2
0
1
0
1
2
0
1
2
1
2
0
1
2
0
2
0
1
2
0
1
0
1
2
0
1
2
1
2
0
1
CNI
0
2
0
1
2
0
1
Рис. 4.4. Инвариантная «раскрас- Рис. 4.5. Другая инвариантная
ка» (а), показывающая невозмож- «раскраска» (а), показывающая
ность покрытия массива {б) с по- невозможность покрытия массива
мощью тримино
{б) с помощью тримино
Рис. 4.6. Инвариантные раскраски в случае гексагональных элементов
4.21
Вариации на тему задачи «крепкий орешек»
165
Рис. 4.7. Примеры инвариантных раскрасок куба
а
Рис. 4.8. Пример массивов E), которые нельзя покрыть квадрамино (а)
1
1
h
1
1
2
1
2
1
1
ч
1
1
3
h
2
3
3
2
1
CNI
3
'1
2
3
3
Рис. 4.9. Подобие клеток при
использовании двух имен
Рис. 4.10. Подобие клеток при
использовании нескольких имен
166 Локальный подход к решению фундаментальных задач [Гл. 4
описание легко доказывает требуемое утверждение, так как согласно
рисунку, общее число черных кубиков не равно общему числу белых,
тогда как всякий кирпич содержит ровно 4 белых и 4 черных кубика.
Для сравнения на рис. 4.7 справа показана и другая черно-белая рас-
раскраска, которая является инвариантной, но поставленную задачу не
решает.
(Работа [Simon and Siklossy, 1972] как раз опирается здесь на некое
«озарение». В самом деле, решение задачи у них начинается фразой
«Вообразите, что этот куб состоит из кубиков размером 2x2x2.
Введем обычным образом для них координаты г, j, k (I $J г, j, к $J 3).
Покрасим черным те кубики, у которых сумма координат нечетна;
остальные кубики покрасим в белый цвет» и т. д.)
V. Легко видеть, что в случае тримино в виде уголка вообще не
существует нетривиального инвариантного описания. Однако в случае
квадрамино, изображенного на рис. 4.8 а, шахматная раскраска даст
инвариантное расположение «имен», показывающее, что такими фи-
фигурками нельзя покрыть ни один из массивов на рис. 4.8 б.
4.2.1.3. Случай С. Этот случай подробно описан в наших публи-
публикациях [Stefanuk, 1973; Стефанюк, 1975; Stefanuk, 1996], где показано,
что приписывание имен диктуется самой задачей. По крайней мере,
в задаче «крепкий орешек» и некоторых схожих задачах для этого не
требуется озарения. Вполне достаточно элементарного учета сходства
клеток в процессе попыток их покрытия (см. рис. 4.10), т. е. применение
изложенного выше принципа семиотической интроспекции.
В предельном случае для всех клеток можно использовать одно имя.
Тогда получаем в высокой степени однородное описание, поскольку раз-
различные действия (расположения косточек) отличаются лишь числом
покрытых клеток. Такое назначение имен, очевидно, позволяет решить
только самые простые задачи: например, доказать, что косточками
домино нельзя покрыть любой массив с нечетным числом клеток.
Два имени дают не столь тривиальное, но все же весьма однородное
описание следующего факта «косточка домино положена где-то на
доску».
Покажем, что принцип семиотической интроспекции можно исполь-
использовать для того, чтобы получить совершенно другое представление для
задачи «крепкий орешек», и даже целое множество таких представле-
представлений, применив этот принцип с большим количеством допустимых имен.
Обратимся для этого к рис. 4.10.
В разделах 4.2.1, 4.2.2 процедура переименования была ограничена,
в случае «крепкого орешка» и схожих задач, конкретным планом ре-
решения задачи, основанным на понятии инвариантного представления.
Это ограничение, однако, не является обязательным. Так, используя
эвристику переименования, можно прийти и к новому классу представ-
представлений для «крепкого орешка», типичные примеры которых показаны
на рис. 4.11а. При построении таких описаний рассуждение ведется
аналогично разделам 4.2.1, 4.2.2.
Припишем имя «1» некоторой клетке (клеткам). Припишем имя
«2» всем ее соседям на основании следующей общности этих клеток —
4.21
Вариации на тему задачи «крепкий орешек»
167
6
5
4
3
2
3
4
2
3
4
5
6
7
8
7
6
5
4
3
2
1
6
5
4
3
2
1
2
3
2
1
2
3
4
5
6
7
7
6
5
4
3
2
1
2
7
6
5
4
3
2
3
4
3
2
1
2
3
4
5
6
6
5
4
3
2
1
2
3
8
7
6
5
4
3
4
5
4
3
2
1
2
3
4
5
5
4
3
2
1
2
3
4
9
8
7
6
5
4
5
6
5
4
3
2
1
2
3
4
4
3
2
1
2
3
4
5
10
9
8
7
6
5
6
7
6
5
4
3
2
1
2
3
3
2
1
2
3
4
5
6
11
10
9
8
7
6
7
8
7
6
5
4
3
2
1
2
2
1
2
3
4
5
6
7
12
11
10
9
8
7
8
8
7
6
5
4
3
2
1
2
3
4
5
6
7
/с
1
2
3
4
5
6
7
8
9
10
11
12
gk
1
4
7
8
8
9
8
7
4
3
2
1
к
1
2
3
4
5
6
7
8
6
14
12
10
8
6
4
2
1
2
3
4
5
6
7
8
14
12
10
8
6
4
3
4
4
4
5
3
4
0
3
-1
Afc
7
5
5
3
3
Рис. 4.11 а. Примеры новых представлений для задачи «крепкий орешек»
168 Локальный подход к решению фундаментальных задач [Гл. 4
1
4
4
Рис. 4.11 б. Пример массива, покрытие которого невозможно
косточка домино, покрывающая клетку «1», обязательно покрывает
одну из этих клеток. По тем же соображениям припишем имя «3» всем
соседям клеток «2» в силу их подобия и т. д. (см. рис. 4.11)
Каждое из представлений рис. 4.11 а может быть использовано для
доказательства невозможности полного покрытия косточками домино
показанного там массива. Чтобы в этом убедиться, обратимся к табли-
таблицам под каждым из рисунков, в которых показано, что предположение
о возможности совершенного покрытия приводит к противоречию, если
последовательно учитывать «расход» имен, начиная с имени «1».
Видно, что либо имен не хватает, либо они в избытке.
4.2.1.4. Случай D. Несколько лет назад Д. А. Поспелов и я оказались
одновременно в Японии, но в разных университетах (Д. А. Поспелов
был в международном университете города Айзу, расположенном в се-
северной части Японии, а я — в университете города Осака). Дмитрий
Александрович пригласил меня выступить у него на семинаре. Зная
особый интерес Дмитрия Александровича к японской культуре, я под-
подготовил специальный пример «на местном материале». Дело в том,
что я долгое время жил в настоящей японской комнате, устланной
соломенными матами — татами (рис. 4.12).
Комната имела почти квадратную форму, но в ней был выделен спе-
специальный угол, который, как оказалось, предназначался для Доброго
Духа.
В следующей таблице приведены типичные размеры татами, ши-
широко используемых в Японии. Заметим, что сама конструкция татами
не позволяет их разрезать на куски, поэтому задача «замощения» пола
татами с фиксированными размерами является достаточно актуальной.
Таблица 4.1. Традиционные размеры японских татами в см
KYOU-MA
EDO-MA
HON-MA
160 х 80
140 х 70
180 х 90
Поскольку наиболее распространенным, как мне сказали, является
размер KYOU-MA, то задача, которую я использовал в своем докладе,
была сформулирована следующим образом.
4.21
Вариации на тему задачи «крепкий орешек»
169
Рис. 4.12. Татами в японском помещении
Пусть имеется комната указанной формы и татами типа показанных
на рис. 4.13.
Назовем ортогоном [Stefanuk, 1996] плоский многоугольник, в ко-
котором любые две стороны либо ортогональны, либо коллинеарны.
±
640см
560см
160см
80см
Рис. 4.13. Задача «крепкий орешек», сформулированная на фигурах
170
Локальный подход к решению фундаментальных задач
[Гл.4
Фигура на плоскости, являющаяся объединением двух ортогонов
с частично или полностью совпадающими сторонами, также есть орто-
ортогон. Мы будем называть результирующую фигуру объединением или
суммой. Обе фигуры, показанные на рис. 4.14, являются ортогонами.
В нашем примере ортогоны соизмеримы и позволяют сформулиро-
сформулировать следующую задачу. Будем говорить, что данный ортогон может
быть замощен другими ортогонами, когда он представим как объеди-
объединение этих ортогонов, компланарное исходному ортогону.
Теорема 4.1. Левый ортогон на рис. 4-IS нельзя замостить «та-
«татами», образец которых показан справа.
Лемм а 4.1. Левый ортогон (целевой) не может быть замощен
такими «татами», если хотя бы одно из них расположено не парал-
параллельно его сторонам, как показано на рис. 4-14-
Эта лемма очевидно вытекает из свойств ортогонов и их объедине-
объединений.
Кроме того, геометрическое место всех границ татами, которые
могли бы дать совершенное замощение левой фигуры при всех воз-
возможных положениях татами внутри целевого ортогона, представляет
собой совокупность линий, изоб-
изображенных на рис. 4.2, что следу-
следует из сопоставления физических
размеров ортогонов и приведен-
приведенной выше леммы.
Далее, при попытке доказать
(или опровергнуть) утверждение
теоремы путем перебора, для кон-
контроля хода перебора нельзя ис-
использовать сами эти линии, по-
поскольку каждая линия принадле-
принадлежит, по крайней мере, паре ор-
ортогонов. В то же время единич-
единичные поля (или ячейки), образуе-
образуемые этими линиями, принадлежат
только одному домино (при дан-
данном конкретном покрытии). Их
имена могут быть использованы
для представления различных по-
положений домино и прослеживания
хода процесса замощения (см. рис. 4.3).
Иными словами, случай D сводится к хорошо изученному нами
случаю С.
4.2.1.5. Шахматная раскраска в шахматах. Прежде чем двигаться
дальше, сделаем небольшое «лирическое отступление».
Почему шахматная доска раскрашена на шахматный манер (см.
рис. 4.15), зачем там это нужно?
Сразу же отметим, что для того, чтобы следить за тем, как ходит
«белопольный» и «чернопольный слон», раскраска доски несуществен-
несущественна.
1
Рис. 4.14. К
доказательству
4.1
4.21
Вариации на тему задачи «крепкий орешек»
171
Можно много фантазировать
на тему раскраски. Вот од-
одна из таких фантазий: шахмат-
шахматная раскраска связана с тем,
что начальное положение фигур
в шахматах по некоторым причи-
причинам не является полностью сим-
симметричным, а лишь зеркально-
симметричным.
Вызвано это, по нашему мне-
мнению, тем, что иначе преимуще-
преимущества первого хода сделают игру
просто неинтересной: вниматель-
внимательный партнер, играющий белыми,
будет всегда выигрывать. (Мне
приходилось обсуждать эту «про-
«проблему» с несколькими крупными
шахматистами, которые в целом
подтвердили эту гипотезу.)
Но при такого рода симметрии
шахматная раскраска, видимо, призвана помочь игрокам при началь-
начальной расстановке фигур, в которой ферзь стоит напротив ферзя против-
противника, а король — напротив короля противника.
Приведенное соображение в какой-то мере подтверждают некото-
некоторые древние варианты шахмат, в которых начальное положение носит
центрально-симметричный характер. Рассмотрим, например, показан-
показанные на рисунках 4.16, 4.17 две старинные игры, предшественницы со-
современных шахмат.
Рис. 4.15. Пример шахматной пози-
позиции
*
м
if
1*
1»
1»
1*
? :.
"t
4-
•н
•Н
•4
*
щи
Рис. 4.16. Китайские шахматы
Сянци
Рис. 4.17. Индийские шахматы чату-
ранга
172 Локальный подход к решению фундаментальных задач [Гл. 4
В примерах рисунков 4.16, 4.17 черно-белая раскраска не использу-
используется. (Проф. Маккарти как-то заметил, что японские шахматы также
являются в этом смысле центрально-симметричными. Видимо поэтому
там также нет «шахматной» раскраски.)
4.2.2. Работа с произвольным массивом клеток. Хотя задачи типа
крепкого орешка не представляют сами по себе никакого практиче-
практического интереса (если не считать задачи плотного покрытия пола та-
татами, описанного в предыдущем разделе), нам показалось интересным
проследить, насколько далеко позволяет уйти применение принципа
семиотической интроспекции в задачах такого класса *).
На рис. 4.10 показано, как из подобия элементов массива клеток
шахматной доски следует возможность приписывания более, чем двух
имен.
Выбор хорошего представления для задачи часто определяет ее
решение. Задача «крепкий орешек» (п. 4.1.2) является тому блестящим
примером.
Ниже с использованием локальной эвристики переименования по-
построен класс представлений для задачи покрытия массива квадратных
клеток косточками домино. Показано, что эти представления глубоко
связаны с самой задачей, так как они дают необходимые и достаточные
условия возможности совершенного покрытия.
Полученные новые представления позволяют ответить на суще-
существенно более серьезный вопрос: при каких условиях возможно по-
покрытие произвольного массива квадратных клеток, а не только того,
который использован в оригинальной формулировке задачи «крепкий
орешек» [Стефанюк, 1975, Stefanuk, 1996a]. Чтобы в этом убедиться,
введем некоторые определения.
Определение. Для односвязного массива квадратных клеток
определим систему наименований Р путем приписывания имени 1
некоторому непустому множеству клеток массива g\ и имена 2, 3, . . .,
остальным клеткам таким образом, что имена любых двух соседних
клеток отличались на 1.
Пусть gk есть множество всех клеток с именем /с, и пусть \gk\ обо-
обозначает мощность этого множества. Система наименований называется
корректной тогда и только тогда, когда выполняется
А2 = \g2 - \gi\ ^ 0
А3 = \g3 - А2 ^ 0
D.2.1)
где s — «наибольшее» имя, использованное в Р.
Следующая теорема составляет главный результат настоящего раз-
раздела.
) Обсуждаемые результаты были во многом стимулированы беседами
с проф. Дж. Маккарти (США).
4.2] Вариации на тему задачи «крепкий орешек» 173
Теорема4.2. Двумерный односвязный конечный массив из п квад-
квадратных клеток может быть полностью покрыт (замощен) двух-
клеточными косточками домино тогда и только тогда, когда любая
возможная для этого массива система наименований Р является
корректной.
Замечание 1. Нет необходимости отдельно выяснять, четно ли п.
Замечание 2. Раскраска шахматной доски является одной из
правильных систем имен Р.
Необходимость. Покрытие невозможно, если некоторая Р не
является правильной.
Докажем эквивалентное утверждение: если полное покрытие воз-
возможно, то корректна любая система имен. Действительно, предполо-
предположив существование покрытия, рассмотрим какое-то одно конкретное
покрытие. По определению Р каждая косточка домино перекрывает
две клетки, одну из gk и одну из gk+ъ где /с = 1, . . . , 5 - 1.
Отсюда A/c+i является числом клеток gk+ii «неиспользованных»
косточками домино, перекрывающими gk и gk+i- Очевидно, что для
рассматриваемого конкретного покрытия Ад. ^ О, As = 0, какова бы
ни была система наименований Р.
Примеры. На рис. 4.11а справа от представлений для задачи
«крепкий орешек» приведены таблицы, содержащие величины gk, Д&
для всех используемых имен. Для каждого из этих представлений
соответствующая ему система наименований не является корректной,
поскольку либо некоторое Д& становится отрицательным, либо As ф О,
а отсюда полное покрытие невозможно.
Доказательство достаточности условия теоремы 4.2 вытекает из сле-
следующей теоремы, связанной с возможностью корректного разбиения
некоторого множества на пары. [Стефанюк, 1975; Stefanuk, 1996a].
Предположим, что для любых двух элементов г, j некоторого мно-
множества N, содержащего п элементов, задано отношение партнерства.
Это означает, что известно допустимо ли их объединение в одну па-
пару. Обозначим через VK(i) множество всех партнеров для элемента
г. Для любого подмножества g Е G Е N обозначим через Wc(g)
множество всех различных партнеров для элементов г Е g, не входящих
вС
Будем говорить, что существует совершенное разбиение множества
N на пары, если в нем можно образовать в точности [п/2] пар его парт-
партнеров. (Через [х] мы обозначаем наибольшее целое, не превосходящее
х )
X .)
Теорема4.3. Множество N из п элементов допускает совершен-
совершенное разбиение, если и только если существует множество G С N
такое, что \G\ ^ [ть/2] и для каждого его подмножества g С G, верно
неравенство \g\ ^ |VVg(^г)|-
Если совершенное разбиение возможно, то существует и такое
совершенное разбиение, что один элемент каждой его пары принадле-
принадлежит G. (Доказательство теоремы дается ниже.)
Замечание 3. Если в множестве N имеются множества элемен-
элементов, не являющихся партнерами друг друга, то, очевидно, следует
174 Локальный подход к решению фундаментальных задач [Гл. 4
потребовать также, чтобы в G содержалось, по крайней мере, одно из
таких множеств «не-партнеров».
Достаточность. Если все системы Р правильны, то совершен-
совершенное покрытие существует.
Для доказательства этого нам потребуются еще две леммы.
Заметим, что любой плоский массив N квадратных клеток может
быть представлен в виде объединения двух множеств не-партнеров Gb
и Gw, соответствующих черно-белой раскраске массива в шахматном
порядке.
Лемм а 4.2. Каждому выбору g\ С Gb {а таксисе g\ С Gw)
соответствует некоторая система имен Р, которая может быть
построена следующим образом: всем элементам g\ приписывается
имя «1», затем всем не получившим имя соседям каждого элемента
«1» приписывается имя «2», затем всем не получившим имя соседям
каждого элемента «2» приписывается имя «3» и т. д.
Действительно, в этом процессе «волны наименований» распростра-
распространяются по массиву, причем каждый фронт несет одно и то же имя клет-
клеткам. Отсюда результирующее наименование обладает тем свойством,
что имена двух соседствующих клеток либо отличаются на единицу,
либо, как может показаться, совпадают (в тех точках, где встречаются
фронты этих волн). Последнее, однако, на самом деле не происходит,
поскольку в таком процессе распространения, очевидно, имеем, если
g\ С Gb, то g2 С Gw, gs С Gb,..., что означает, что соседние
клетки не могут получить одно имя. Таким образом, в этом процессе,
действительно, строится система имен Р. Лемма доказана.
Л е м м а 4.3. Для любой системы имен Р справедливо либо
Gb = Ugk |jfe=l,3,..., Gw = Ugk |jfe=2,4,...
либо
Gw = Ugk U=i,3,..., Gb = Ugk U=2,4,...
Действительно, по определению Р имена двух соседних клеток от-
отличаются на единицу, а отсюда каждый «прямоугольный» путь, соеди-
соединяющий две клетки «г», «j», содержит нечетное число промежуточных
клеток, если оба числа г, j одновременно либо четны, либо нечетны. Это
означает, что в таком случае клетки «г», «j» имеют один «цвет». Лемма
доказана.
Леммы 4.2 и 4.3 вместе показывают, что все возможные системы
имен для плоского массива обладают тем свойством, что либо g\ E Gb,
либо g\ E Gw, и могут быть построены в ходе процесса, указанного
в лемме 4.2.
Теперь можно провести доказательство достаточности условия тео-
теоремы 4.2, завершив тем самым доказательство этой теоремы.
Во-первых, из правильности хотя бы одной системы Р следует, что
п четно. В самом деле, для нечетных п очевидно \Gb\ ф \GW\ и для
любой системы имен
4.21
Вариации на тему задачи «крепкий орешек»
175
что говорило бы о неправильности этой Р.
Во-вторых, из правильности любой Р из указанных лемм вытекает,
в частности, что для любого множества g\ С Gb выполняется следую-
следующее неравенство:
\g2\ = \WGb{gl)\>\gl\,
a As = 0 дает при этом
\Gb\ = \GW\ = — .
Отсюда Gb удовлетворяет всем требованиям, сформулированным
в теореме 4.3 для множества 6г, совершенное разбиение на пары воз-
возможно, и, следовательно, исходный массив из п клеток может быть
полностью покрыт косточками домино.
Теорема 4.2 теперь полностью доказана.
Пример. На рис. 4.11 #изображен массив, в котором \Gb\ = \GW\,
но покрытие все же невозможно. Последнее вытекает из существования
неправильной системы имен Р для этого массива, которая показана на
этом массиве.
Замечание 4. Из приведенного доказательства следует, что при
установлении возможности покрытия более экономно было бы сначала
«раскрасить» массив в шахматном порядке, а затем рассматривать те
и только те Р, которые основаны на g*i, содержащие только, скажем,
черные клетки.
Замечание 5. Для доказательства достаточности были использо-
использованы только первое и последнее соотношение из D.2.1). Однако и про-
промежуточные неравенства несут полезную информацию. Например, из
А2Г ^ 0 следует, что для любого множества g\ С Gb верно следующее
неравенство:
<Gb
2г-1
U
2r-l
D.2.2)
Это неравенство показывает, что требования, предъявляемые к Gb,
как к G в теореме 4.3, проверяются не только для g*i, но и для g\ U g3,
g3g5,,b
Неравенство D.2.2) вытекает из двух соотношений. Во-первых, име-
имеем
Br-?>
U gi
U ft
г=1
отсюда
= gi U gs U • • • U g2r_1.
176 Локальный подход к решению фундаментальных задач [Гл. 4
А во-вторых, из Д2г ^ 0 вытекает, что
(Ы + \g*\ + • • • + |g2r|) > (\gl\ + |gs| + • • • + \g2r-l\) •
Заключение. Задачи типа «крепкий орешек» оказались хорошим
примером, поскольку они допускают полное математическое исследо-
исследование и позволяют доказать что эвристика уменьшения числа имен
оказывается достаточно сильной, по крайней мере в этом случае, поз-
позволяя построить целую серию новых представлений.
Доказательство теоремы 4.3. Необходимость условий теоремы оче-
очевидна.
Доказательство достаточности: Если для данного мно-
множества N из п элементов существует такое множество 6г, что \G\ =
= т = [га/2] и для каждого его подмножества g С G справедливо
неравенство |g*| $J |VKg(#)|> т0 существует совершенное разбиение,
такое, что один элемент каждой его пары принадлежит множеству G.
Доказательство будет носить «конструктивный» характер в том
смысле, что будет доказано существование алгоритма построения та-
такого рода разбиения. Этот алгоритм включает в себя две процедуры:
прямое образование пар (ПОП) и образование пар с перестроениями
(ОПП). Процедура ПОП, когда она приложима, образует новую па-
пару в дополнение к уже построенным, а процедура ОПП применяется
только тогда, когда ПОП не приложима. В этом случае ОПП также
приводит к увеличению числа образованных пар к на единицу. (Разу-
(Разумеется, обе процедуры применяются, лишь если к < т .)
Ниже мы покажем существование процедур ПОП и ОПП с такими
свойствами, из чего с очевидностью последует существование искомого
разбиения TV, учитывая, что, к тому же, в обеих процедурах в каждую
создаваемую пару включается один элемент из G.
Ниже символы х и у (возможно с индексами) будут использоваться
для обозначения элементов из G и из его дополнения до TV, соответ-
соответственно. Строка (#1, . . . , Xk) обозначает множество элементов a?i, . . .
... ,хк.
Описание процедуры ПОП. Отправляясь от множества TV,
в котором еще не образовано ни одной пары, процедура ПОП выбирает
один элемент из G (обозначим его через х\) и строит пару [a?i, г/i],
взяв одного из партнеров жх, не входящих в множество 6г, (его мы обо-
обозначили через yi), который существует, поскольку по условию теоремы
I Wg(#i)| ^ 1- Затем ПОП берет любой другой элемент из G (обозначим
его через жг) и любого его партнера из дополнения G до N (его мы
обозначим через г/2), если таковой найдется, и образует пару [#2,2/2]-
(Если же такого элемента не найдется, то мы говорим, что ПОП не
приложима и, если все еще к < т, то следует применять ОПП.) Затем
ПОП берет любой третий элемент из G и образует новую пару и т. д.
Не исключено, что совершенное разбиение для N будет построено
просто в результате последовательного применения процедуры ПОП,
но обычно после того, как будет построено к пар
[хиуг] [ж2, у2] , • • • , [хк,Ук], D.2.3)
4.2] Вариации на тему задачи «крепкий орешек» YJ7
k < т, D.2.4)
процедура ПОП окажется более неприложимой, поскольку
, • • • , хт) С (гуь . . . , 2/fc). D.2.5)
Последнее означает, что без перестроения новая пара не может быть
создана. В этом случае, пользуясь процедурой ОПП (см. ниже), мы
увеличиваем число построенных пар до к + 1, и вновь обращаемся
к ПОП и т. д.
Описание процедуры ОПП. Если верно D.2.3)-D.2.5), то
для любого элемента ж, х Е G, причем
Ж^(Ж1,...,^), D.2.6)
процедура ОПП найдет элемент у, у Е Сг,
У<?(У1,---,Ук), D.2.7)
такой, что существует следующая цепочка партнеров:
L(aj, у) = [х, у[] [х'^уЯ ,..., [<_!, у;] [х'г, у]. D.2.8)
Здесь х\ и 2/^, г = 1, . . . , г, совпадают с некоторыми ж^ и у^ из
D.2.3), соответственно. Таким образом,
(ж;,...,4) с (жь...,ж*),
(i) Я ()
Так как эта цепочка разрушает в точности г пар из к построенных
ранее и указанных в D.2.3), а содержит г + 1 пару, то общее число пар
становится равным к + 1.
Ниже мы докажем существование такой цепочки L(x, у), что и бу-
будет означать завершение доказательства теоремы 4.3.
Докажем, что при выполнении условий B.2.3)-D.2.5) для любого
ж,жЕС, удовлетворяющего D.2.6), найдется такой у,у $: G, удовле-
удовлетворяющий D.2.7), что существует цепочка партнеров D.2.8).
Обозначим Y1 = Wg{x). Из D.2.5) имеем, что У\ С (г/1? . . . , ук).
Для каждого yi E У\ возьмем однозначно определенного посредством
D.2.3) партнера Х{ = Xi(yi) и построим множество У{ по правилу
i(yi)). D.2.10)
Пусть У2 = У\ U У2'• Имеются две возможности:
1. Y2 <jL (i/i, . . . , г//е). Это означает существование следующей цепоч-
цепоч178 Локальный подход к решению фундаментальных задач [Гл. 4
2- Y2 Q (ух, - - - , 2/л)- Тогда мы построим У3' = U WG {xi{yi)),
Уг?У2
обозначим Y3 = Y2U У% и т. д.
Очевидно, что в нашей процедуре полного перебора, где рассматри-
рассматриваются все возможные партнеры для каждого из ж, входящего в рас-
рассмотрение, мы имеем
Y1CY2QY3... D.2.11)
По аналогии с предыдущим, в общем случае также имеем две воз-
возможности:
\.Ys(jL (i/i, • • • , у и) для некоторого s, что означает существование
требуемой цепочки D.1.8).
2. Для любого s верно
YsC(yi,...,yk). D.2.12)
Однако в условиях теоремы 4.3 последняя возможность не может
реализоваться. Действительно, из D.2.11) и D.2.12) следует, что суще-
существует предел
\imYe = (yil,...,yiT), r^k. D.2.13)
Процедура построения множеств Ys гарантирует, что вместе с каж-
каждым у соответствующее по D.2.3) х также принимается во внимание,
а это по D.2.13) означает, что все партнеры (ж, ж^, . . . , Х{г), не входя-
входящие в G, находятся среди (г/^, . . . , yir), т. е.
<
Полученное противоречие со свойствами множества G доказывает
существование цепочки L(x,y) и, следовательно, ведет к доказатель-
доказательству утверждения теоремы 4.3.
4.2.3. Локальное управление потоками такси. Обратимся к пробле-
проблеме представления задачи совершенно другого рода, а именно к задаче
о такси в городе. Мы увидим, однако, что и здесь применимо сооб-
соображение об использовании небольшого числа имен, характеризующих
данную задачу, и что конкретное присваивание или назначение имен
также следует из локальных попыток решить задачу (наподобие поме-
помещения на массив косточки домино) и желания получить однородное
описание таких действий.
В следующем подразделе мы попытаемся дать таблицу соответствий
между этими двумя классами проблем.
Задача о такси состоит в следующем. В городе имеется определен-
определенный поток машин, часть из них — такси. Заказное такси, т. е. машину,
которая едет в определенное место и, следовательно, не ищет заказчика,
мы не будем относить здесь к такси, также, впрочем, как и автомашины
другого назначения, считая их просто «не-такси». В соответствии с этим
свободное такси всегда занято поиском пассажира, причем считается,
что местоположение источников возможных заявок такому такси зара-
заранее неизвестно.
4.21
Вариации на тему задачи «крепкий орешек»
179
Такое описание такси несколько идеализировано, но вполне годит-
годится для наших иллюстративных целей использования локальной орга-
организации управления такси в городе, пример которого изображен на
рис. 4.18.
Denny Way
ь у
3
\
\
\
\
\ \
Marion
S. Washington
Рис. 4.18. План центра города Сиэтла, США. Числа у перекрестков — на-
начальные заявки на такси
Наиболее детальное описание для этой задачи, как и в случае задачи
«крепкий орешек», возникает, если все автомашины города (такси и не-
нетакси) имеют различные имена (например, регистрационные номера).
Другая предельная возможность — все автомашины неразличимы
между собой. Ограничиваясь двумя или тремя именами, разработаем
процедуру их назначения (присваивания). Действием системы S{ в дан-
данной задаче естественно считать выбор направления движения свобод-
свободного такси, находящегося на перекрестке. (Для простоты считаем, что
такси не может развернуться вне пределов перекрестка).
Достаточно очевидно из локальных соображений, что для водите-
водителя свободного такси полезно отметить, что встреченная им машина
является такси и что эта машина занята. Тогда водитель может пред-
пол ожить, что ему также следует двигаться в том направлении, откуда
пришло занятое такси.
Из подобных соображений видно, что для адекватного выбора дей-
действия (т. е. направления движения) полезно ввести в рассмотрение
следующие имена:
* — не-такси,
О — свободное такси,
180
Локальный подход к решению фундаментальных задач
[Гл.4
1 — занятое такси.
Используя эти имена, можно надеяться на то, что свободное такси
быстрее найдет пассажира, чем в случае слепого поиска. На самом
деле, приведенные соображения носят эвристический характер и без
дополнительной проверки нельзя, быть уверенным в их полезности,
если учесть все особенности движения такси.
4.2.4. Имитационное моделирование. Задача о такси была под-
подвергнута прямому моделированию на компьютере Sigma 5. В качестве
реального примера был использован центр города Сиэтла (США), где
были выбраны достаточно реалистичные числа скоплений заявок на
такси (показаны у перекрестков улиц на рис. 4.18, где сами улицы
изображены тонкими линиями).
Вычислялось полное время, которое потребуется для удовлетворе-
удовлетворения всех заявок (новые заявки не поступают). Изначально все такси
сосредоточивались в парке, отмеченном на рис. 4.18 знаком «+».
В проведенном моделировании полное время удовлетворения всех
заявок вычислялось для следующих четырех случаев:
A. Все автомашины города имеют одно имя (*), так что каждое
свободное такси движется совершенно случайным образом.
Б. Имеются такси и не-такси (*), причем каждое такси движется
в направлении, с которого их водители видят минимальное число такси.
B. Используется два имени: различаются автомашины (*) и неза-
незанятые такси @), причем свободное такси движется в том направлении,
с которого поступает минимальное число свободных такси.
Г. Используется три имени: *, 0 и 1. Свободное такси движется как
в случае В, но в случае совпадения потоков выбирается направление,
с которого поступает максимальное число занятых такси.
В таблице показаны времена полного обслуживания (в условных
единицах) для различных значений к — общего числа такси:
Таблица 4.2. Полное время удовлетворения заявок на такси
к
25
50
100
200
А
16,8
11,70
9,38
5,73
Б
12,8
6,95
4,45
2,67
В
14,3
6,61
5,25
3,25
Г
12,0
6,54
4,02
2,70
Из этой таблицы видно, что использование имен, назначение ко-
которых производилось из чисто локальных соображений, оказывается
целесообразным и с точки зрения глобальной оценки времени полного
обслуживания всех заявок.
Кстати, проведенное моделирование показывает, что, прежде всего,
необходимо ввести заметное для водителей отличие такси от не-такси
(важное и для пассажиров, ожидающих такси). Следует отметить, что
в то время, когда осуществлялось данное имитационное моделирование,
такое отличие для такси, например в г. Москве, отсутствовало. Однако
4.21
Вариации на тему задачи «крепкий орешек»
181
позже на всех московских такси был установлен на крыше специаль-
специальный знак. (Известно, что такси в Лондоне весьма приметны из-за их
нарочито архаичной формы, тогда как в Нью-Йорке такси окрашены
в заметный ярко-желтый цвет).
На сегодняшний день в г. Москве положение с такси снова изме-
изменилось, так как появилось множество никак не выделенных такси на
кооперативной и личной основе, некоторые из которых используют
специальные знаки.
4.2.4.1. Сходство задач покрытия массивов и локального управле-
управления такси. Различие между проблемами, рассмотренными в разделах
4.2.1—4.2.4, достаточно очевидно — это различие между математиче-
математической задачей комбинаторного характера и «реальной» задачей управ-
управления.
Попробуем, однако, рассмотреть их сходство (табл. 4.3.).
Таблица 4.3. Сопоставление задачи покрытия и задачи о такси
в городе
Элементы проблемы
Клетки массива
Автомашины
Элементарные действия
Наложение косточки домино
Выбор направления движения на пе-
перекрестке
Простейшее описание — одно имя
Представляет интерес лишь для
простейших задач, где важно, на-
например, общее число элементов
Единственная возможность — слу-
случайный выбор направления движе-
движения (это случай А — наибольшее вре-
время обслуживания)
Два или больше имен
Локальные соображения о нало-
наложении домино используются для
правильного назначения имен.
Цель — построение инвариантного
представления
Правильное назначение имен дает ин-
инвариантное описание: в эквивалент-
эквивалентных «по смыслу» ситуациях соверша-
совершаются одни и те же действия
4.2.4.2. Изоаритмическое управление сетью ЭВМ с локальным вза-
взаимодействием разрешений. Заканчивая обсуждение принципа семио-
семиотической интроспекции, хотелось бы остановится на примерах, доста-
достаточно далеких от исходной задачи «крепкий орешек».
Так можно показать, что задача о такси, может быть непосредствен-
непосредственно использована при решении проблемы заторов на вычислительных
сетях.
Эту возможность должен прояснить данный раздел, где мы дадим
лишь постановку задачи, изложенной в работе [Гинзбург и Стефанюк,
1979].
Заторы, возникающие в сетях ЭВМ, отличаются от обычной блоки-
блокировки сообщений тем, что они являются поглощающими состояниями
182 Локальный подход к решению фундаментальных задач [Гл. 4
сети: возникшие заторы не могут быть ликвидированы просто путем
снижения вновь поступающей нагрузки. Хорошо известны, например,
два «классических» затора, с которыми столкнулись еще конструкторы
сети АРПА в США. Это затор компоновки, связанный с пакетным
характером передачи сообщений по сети, и затор при передаче с на-
накоплением.
Оба затора имеют чисто логическую основу, и условия для них
могут создаваться лишь после того, как в одном или нескольких СПС
(сопрягающих процессоров сообщений) произошло заполнение соответ-
соответствующего буфера.
Отсюда простая стратегия предотвращения заторов — не допускать
критического заполнения буферов СПС. На это и направлено изоарит-
мическое управление, при котором сообщение допускается в сеть из
ГВМ (главная вычислительная машина или HOST) лишь при наличии
свободного разрешения. По Дэвису [Devis, 1972] предполагается, что
общее число разрешений (занятых и свободных) в сети постоянно,
а освободившиеся разрешения случайным (равновероятным) образом
движутся по ребрам сети.
Поскольку со многих точек зрения целесообразно как можно быст-
быстрее переправить свободные разрешения в те точки, где имеются заявки
на отправку сообщений, то естественно рассмотреть некоторые усо-
усовершенствованные по сравнению со случайным механизмы управления
движением свободных разрешений. При этом нежелательно прибегать
к централизованным или децентрализованным методам уже, напри-
например, потому, что они ведут к необходимости большого потока служеб-
служебной информации на сети (см. гл. 1).
В работе [Гинзбург и Стефанюк, 1979] мы предложили определен-
определенную схему перераспределения разрешений в такой сети, когда разреше-
разрешения двигались к тому месту, где возникала заявка на передачу пакета,
ориентируясь по встречным занятым и свободным разрешениям.
Насколько эффективно локальное взаимодействие разрешений при
выборе направления движения свободных разрешений по сети показы-
показывает моделирование, проделанное в п. 4.2.4 для задачи о такси.
Проведенное в [Гинзбург и Стефанюк, 1979] (см. также выше) мо-
моделирование подтвердило, что принцип семиотической интроспекции
вполне работоспособен и в этой сугубо практической задаче.
4.3. Локальный подход при эволюционном
конструировании
Все больше исследователей начинают волновать эзотерические во-
вопросы о том, с чего все начинается, как происходит открытие новых,
прежде неизвестных сущностей, явлений, взглядов и т. п. А как люди
справляются с творческими задачами? В предыдущих разделах мы
занимались исследованием этого вопроса на примере задачи «крепкий
орешек» и других задач, так или иначе навеянных этим простым во-
вопросом.
4.3]
Локальный подход при эволюционном конструировании 183
20 2122 23 24 25 26 27 28 29 30 3132 33 34 35
36 37 38
10
59 58 57 56 55 54 53 52 5150 4948 47
Рис. 4.19. Схема карбюратора автомобиля
В этом разделе мы рассмотрим как человек решает внешне очень
сложную задачу конструирования, обращаясь к примеру, показанному
на рис. 4.19.
Ясно, что никакой инженер не мог бы «с нуля» придумать карбю-
карбюратор, изображенный в разрезе на рис. 4.19, особенно учитывая явное
повторение некоторых элементов и довольно сложное взаимодействие
частей, осуществляемое с помощью не показанных на этом рисунке тяг
и рычагов.
Однако можно представить себе, как просто создается подобное
устройство локально, если применить разумные соображения (аргумен-
(аргументы) и эволюционный подход.
Действительно, исходно задача карбюратора в автомашине доволь-
довольно проста: смешать бензин с воздухом, чтобы образовалась легко вос-
воспламеняемая горючая смесь.
Видимо, в начале это и было сделано с помощью весьма нехитрого
однокамерного смесителя, но потом, когда автомобиль начал ездить,
стало ясно, что, например, при большой скорости движения необходи-
необходимо увеличить процентное содержание бензина. Тогда была добавлена
вторая камера подготовки смеси и с помощью тяг и внутренних каналов
организована передача информации о скорости вращения двигателя,
которая позволяла своевременно увеличить качество смеси.
Когда это было сделано, возникла совершенно противоположная
трудность: на малых оборотах двигателя необходимо было подавать
более бедную смесь. В результате появилась новая система тяг-рычагов
и регулировочных винтов. Такой «эволюционный подход» вполне объ-
объясняет показанную на рисунке схему карбюратора. Важно отметить,
что эти соображения, которые возникали у конструкторов последова-
последовательно, в течение некоторого времени, могли бы быть построены и с
184 Локальный подход к решению фундаментальных задач [Гл. 4
помощью, скажем, генетического алгоритма, если бы он сразу был
включен в состав системы контроля питания автомобиля.
Конечно, сегодня такие конструкторские соображения общеизвест-
общеизвестны и поэтому могут быть прямо реализованы на электронном карбю-
карбюраторе, представляющем собой пьезопластинку, на которую поступает
какое-то количество бензина. Характер колебаний пластинки дикту-
диктуется управляющим компьютером, который учитывает ровно такие же
разумные соображения, но уже в виде программы, а не в «железном»
исполнении, как это происходит в рассмотренном нами карбюраторе
для автомобиля «Москвич М-412».
Отчасти по этой причине инжекторные двигатели постепенно начи-
начинают вытеснять карбюраторные, допуская более простое управление
качеством горючей смеси.
Разумеется показанное «эволюционное конструирование» встреча-
встречается и во многих других случаях. Например, оно отражает ходя разви-
развития некоторых идей или теоретических построений, которые являясь
достаточно разработанными, представляют собой лишь результат по-
постепенного локального усовершенствования некоторой первоначальной
мысли.
4.3.1. Аргументы в сравнении со знаниями. На примере вышеупо-
вышеупомянутых разумных соображений выпукло проявляется разница между
фактами (знаниями) и аргументами. Пока знания являются строго
обоснованными утверждениями, эта разница не бросается в глаза, если
не считать возможности взаимодействия между аргументами, которые
вполне могли бы относиться, на наш взгляд, и к самим знаниям. Однако
эта разница сразу бросается в глаза, если знания и аргументы являются
в какой-то мере ненадежными, т. е. не полностью обоснованными.
Так, если в цепочке вывода
кик2,...,кп\-в
утверждения К\, K<i, . . . , Кп не являются надежными на 100%, то
сразу видно, что надежность вывода В определяется произведени-
произведением надежностей посылок (конечно, если посылки не зависят друг от
друга). В результате при 7 даже довольно надежных посылках (при
надежности каждой посылки 90 %) результирующий вывод будет иметь
уже только 50 %-ю надежность. Более того, надежность вывода будет,
грубо говоря, определяться надежностью посылки, имеющей самую
низкую надежность.
Другое дело — аргументы. Если надежности элементов знаний
перемножаются при выводе, то надежности аргументов складывают-
складываются. О закономерностях такого сложения см. ниже в разд. 4.6. Даже
если аргументы А\, Ач, • • • , Ат в пользу утверждения В имеют низ-
низкую надежность, но они независимы, и их много, то вывод В может
получиться высоконадежным. На эту существенную разницу знаний
и аргументов неоднократно указывал Д. А. Поспелов в своих докладах.
Но не все так уж очевидно. Определенно нужна некоторая «ариф-
«арифметика» для аргументов, пример которой нами был дан в публика-
публикации [Стефанюк, 19876]. Там описан один из обоснованных способов
4.3] Локальный подход при эволюционном конструировании 185
суммирования свидетельств, или аргументов, в пользу некоторого об-
обстоятельства. Проиллюстрируем этот способ на примере двух таких
аргументов. Пусть в пользу соображения В говорят два свидетельства-
аргумента, уверенности в которых, а и /3, определены на шкале [0,1],
т. е. являются нечеткими величинами в смысле Л. Заде. Ясно, что
в качестве суммарной уверенности /(а,/3) в В нельзя принять просто
сумму (а + /3), поскольку значения функции /(а,/3) также должны
принадлежать отрезку [0,1].
В нашей работе [Стефанюк, 19876] для поиска вида функции f(a,/3)
был предложен аксиоматический подход. Основная его мысль — сфор-
сформулировать обязательные требования к характеру функции и искать
максимум этой функции, достигаемый равномерно для всех а и C при
выполнении следующих требований:
1. /(а, /3) — симметрическая функция;
2. (/,а,/3)Е[0,1];
3. /A,1) = 1;
4. /(а,0) = а;
5. /(а, /3) — разложена в ряд Тейлора с пренебрежением производ-
производными выше второго порядка.
Максимум ищется потому, что в случае компьютера последний
просто обязан относиться с максимальным доверием к поступающим
свидетельствам в пользу некоторого обстоятельства, если только у него
нет другой информации (подробное обоснование можно найти в [Сте-
[Стефанюк, 19886], а также в п. 4.6.5).
Вычисления, приведенные в п. 4.6.3, показывают, что максимум до-
доверия обеспечивает достаточно хорошо известная в области экспертных
систем формула Шортлиффа
Варьируя перечень условий поиска экстремума, можно получить
более сложные выражения, позволяющие учесть зависимость свиде-
свидетельств друг от друга и их взаимозависимость (см. [Стефанюк, 19876]
и п. 4.6.4 ниже.)
Описанный аксиоматический подход нашел признание у других
авторов (см. [Johnson and Kotz, 1989]). Интересно, что Джонсон и Котц
не только высоко оценили достоинства предложенного автором данной
книги подхода х), но и применили его для получения формулы сум-
суммирования свидетельств, несколько уточняющей приведенную выше.
) Приведенную выше совокупность аксиом они назвали «аксиоматикой
Стефанюка», а полученную формулу — «формулой Стефанюка». Такая лест-
лестная оценка и полученное одобрительное письмо от авторов работы [Johnson
and Kotz, 1989], в свое время явились большой поддержкой для автора книги.
186 Локальный подход к решению фундаментальных задач [Гл. 4
Так, оставляя четвертый порядок производных в разложении функции
f(a,C) (см. подробности в п. 4.6.3), они получили следующее выраже-
выражение:
В заключение отметим, что аксиоматический принцип, предложен-
предложенный нами выше, напоминает по своему характеру принцип максимума
энтропии, успешно использованный рядом авторов в прошлом (см.
соответствующие примеры в п. 4.6.5).
4.4. Локальное формирование простых фреймов
Эффективность вычислительных систем, работающих с большим
объемом данных, в значительной степени зависит от того, насколько
быстро происходит извлечение из памяти ЭВМ данных, необходимых
в заданной ситуации. Известны системы, обеспечивающие уменьше-
уменьшение среднего времени выборки информации из памяти за счет про-
простых локально-организованных механизмов обучения, основанных на
накоплении фактов обращения к памяти. Примерами могут служить
магазинная память или «стопка книг» (см. прил. П. 1.2) и адаптивная
память со случайной выборкой (см. гл. 2, раздел 2.4).
С другой стороны, в системах искусственного интеллекта задачу
ускорения выборки знаний решают, как правило, посредством примене-
применения фреймов (блоков, сценариев и т. д.). Такая система, встретившись
с определенной ситуацией, извлекает из памяти соответствующий ей
фрейм и затем поступает согласно содержащимся в нем рекомендаци-
рекомендациям.
Может сложиться впечатление, что фрейм — это целостное логи-
логическое образование, во всех случаях привносимое человеком извне.
Показательна, например, известная работа Чарняка [Charniak, 1978],
в которой создается «фрейм ситуации покраски», где описываются
мельчайшие подробности, характеризующие такую ситуацию. О том
же говорят и интенсивно ведущиеся работы по изучению структур для
фреймов, которые человеку остается только заполнить (языки типа
FRL, системы А-фреймов).
4.4.1. Суть проведенных экспериментов. Настоящая работа была
выполнена в надежде на то, что достаточно простые и естественные
локальные механизмы обучения способны в процессе своей работы
автоматически порождать структуры, типа простых фреймов и сетей
из них. Изложим кратко результаты модельных экспериментов в этой
области, в частности, опишем элементарную систему, формирующую
сеть фреймов.
Ситуации, с которыми работает система, описываются множеством
признаков. Фреймы, используемые системой, имеют вид (Q,T), где
Q — множество признаков, Т — множество элементов вида (?, s), где
t — задача, типичная для данной ситуации, a s — ее решение. Множе-
Множество фреймов упорядочено: фрейм (Qi,Ti) называется подфреймом
фрейма (фг?^)? если Qi С Q\. При необходимости решить задачу
4.4] Локальное формирование простых фреймов 187
to, в ситуации Qo система ищет наиболее общий фрейм (Q,T), для
которого Q С Qo. Если при этом (to, so) G Т для некоторого so, то so
считается ответом, если же такого so нет, система переходит к иссле-
исследованию подфреймов найденного фрейма. В случае когда, исследовав
все имеющиеся фреймы, система не находит ответа, она обращается
к оператору-человеку, который должен сообщить ответ so, после чего
создается новый фрейм (Qo(to, so)).
Всякий раз, когда в система возникают два фрейма вида (Q U
U {<7i}, Ti) и (Q U {gi}, T2), строится новый фрейм (Q, 7\ П Т2), обоб-
обобщающий оба исходных. Если в результате работы фрейм (Q, Т) дает на
задачу ? неверный ответ s, пара (?, s) удаляется из множества Т; если
при этом множество Т оказывается пустым, то весь фрейм удаляется из
сети. Все множества хранятся в памяти в виде списков. Для ускорения
выборки сведений всякий раз, когда обращение к элементу списка
приводит к успеху, этот элемент перемещается в начало списка.
Система, таким образом, обеспечивает автоматическое создание на
локальной основе сети фреймов, адекватной заданному классу задач.
Хотя ясно, что обучением путем накопления не исчерпываются все
формы обучения (среди которых, разумеется, и обучение по подсказке
учителя), но, будучи выделены, такие механизмы были бы полезны на
практике как генераторы элементарных фреймов. В теории же их мож-
можно было бы использовать при экспериментальной проверке различных
формальных предположений, касающихся операций над фреймами, и,
быть может, для создания адекватной «алгебры» фреймов.
И в самом деле, проведенные с помощью системы программирова-
программирования ЭКЛИСП эксперименты, изложенные в отчете [Стефанюк, 1985,
с. 42—55], позволили в дальнейшем построить такую алгебру на языке
теории категорий, которая приводится в разд. 4.5 ниже.
4.4.2. Эксперименты с программой формирования фреймов. Во-
Вопросы представления знаний являются центральными в современном
искусственном интеллекте. Для того, чтобы успешно решать любую
сколько-нибудь сложную задачу из области искусственного интеллекта,
компьютер должен быстро ориентироваться в большом объеме дан-
данных. Одним из путей достижения этого является создание определен-
определенных структур, связывающих объекты в базе данных. Примером таких
структур являются фреймы. Эксперименты с системами, хранящими
знания в виде фреймов, показали, что, с одной стороны, такие си-
системы могут успешно решать задачи, требующие работы с большим
объемом знаний, с другой стороны, сеть фреймов, необходимая для
решения даже сравнительно простых с точки зрения человека задач,
устроена довольно сложно и составление такой сети связано с серьезной
и трудоемкой работой. По-видимому, составление адекватной системы
фреймов [Минский, 1978] станет главным «узким местом» при реше-
решении достаточно сложных задач. В свете этого естественным является
желание переложить работу по созданию фреймов, сетей фреймов
и подобных структур для представления знаний на сам компьютер.
Рассмотрим пример, который явился исходной точкой для дальней-
дальнейшей работы. Пусть на вход системы поступают ситуации, которые она
188 Локальный подход к решению фундаментальных задач [Гл. 4
должна обработать определенным образом. Система хранит в памяти
список всех возникавших прежде ситуаций, и, для того чтобы пра-
правильно отреагировать на ситуацию, поступившую на вход, она ищет
ее в этом списке, просматривая его от начала до конца. Очевидно, что
для минимизации времени поиска ситуации в памяти, следует распо-
расположить эти ситуации в списке в порядке убывания вероятностей их
возникновения. Однако такой нелокальный подход не всегда является
приемлемым. Во-первых, вероятности возникновения ситуаций могут
быть неизвестными до начала работы системы, более того, может быть
неизвестным само множество возможных ситуаций. Во-вторых, при
всяком изменении этих вероятностей и, тем более, при возникновении
новых ситуаций, пришлось бы перестраивать систему. Между тем су-
существуют локально-организованные простые адаптивные алгоритмы,
позволяющие системе самой расставлять ситуации в нужном порядке,
используя статистику фактов обращения к памяти, (см. гл. 2, разд. 2.4).
Одним из самых простых таких алгоритмов является алгоритм «стопки
книг» [Цетлин, 1963], согласно которому всякий раз, когда система
находит в списке нужную ситуацию, она автоматически переставляется
в начало списка х). Можно показать [Цетлин, 1961], см. также П.1, что
в процессе работы ситуации будут расставлены в порядке, близком
к «оптимальному».
Для того чтобы сделать следующий шаг, будем рассматривать опи-
описание ситуации как множество признаков, по которым можно узнать
эту ситуацию. Список ситуаций будет, следовательно, представлять со-
собой список множеств признаков. Основная идея, которая будет развита
ниже, следующая: если большая группа ситуаций имеет общую часть
в виде некоторого множества признаков, входящих в описание каждой
из этих ситуаций, то, хотя каждая конкретная ситуация из группы
может встречаться сравнительно редко и, соответственно, занимать
«далекое» место в списке, их общая часть, будучи выделенной, может
появляться часто. При этом хотелось бы, чтобы это как-то было отмече-
отмечено самой системой, т. е. автоматически. Общая часть группы ситуаций
может рассматриваться тогда как обобщенное описание класса сход-
сходных, но различающихся в деталях ситуаций, и, хотя каждая конкретная
ситуация из класса может возникать редко, появление любой ситуации
из этого класса может быть явлением существенно более частым.
Для реализации сформулированной идеи в список, кроме множе-
множества признаков, являющихся описаниями конкретных ситуаций, вклю-
включены множества признаков, не являющиеся описаниями каких-то кон-
конкретных ситуаций. Назовем эти множества обобщенными ситуациями.
Всякий раз, когда искомая ситуация Р обнаружена в списке ситуа-
ситуаций и должна, следовательно, быть перенесена в его начало, будем
перемещать в начало списка также все подмножества множества Р.
(Здесь и в дальнейшем мы для краткости отождествляем ситуацию
) В системе ЭК ЛИСП, на которой велось моделирование, не было преду-
предусмотрено использование дробных чисел, что исключало применение в экспе-
эксперименте модели памяти со случайной выборкой, изученной нами в гл. 2.
4.4] Локальное формирование простых фреймов 189
и описывающее ее множество признаков.) Такой алгоритм приведет
к тому, что если некоторое множество Q, входит в описание большого
числа ситуаций, то каждая из этих ситуаций, встречаясь редко, «уйдет»
в глубину, списка, в то время как само множество Q, будет «держаться»
на поверхности.
Dноги)
(хвост)
(плавает)
Bноги)
Dноги хвост)
Bноги крылья)
(хищник)
Bноги перья)
Bноги крылья перья)
Dноги хвост хищник)
Dноги копыта травоядное)
Dноги травоядное)
Dноги рога копыта травоядное)
(хвост плавники плавает)
Bноги крылья перья летает)
(хвост плавники чешуя плавает)
(хвост плавники (питается рыбой) плавает)
Dноги хвост рыжий хищник)
Bноги крылья перья летает черный)
(хвост плавники чешуя плавает соленая)
Dноги горб (обитает в~пустыне))
Bноги крылья плавает)
Bноги крылья перья летает плавает)
Dноги уши травоядное)
Bноги крылья перья хищник)
Bноги крылья перья летает поет)
Dноги хвост хищник серый)
Dноги рога копыта травоядное)
Dноги хобот)
Dноги хвост хищник (ловит мышей))
Dноги рога копыта травоядное (дает молоко))
(хвост плавники чешуя плавает (питается рыбой))
((пятится назад) плавает)
Bноги хвост крылья перья (несет яйца))
Dноги хвост копыта травоядное)
Рис. 4.20. Начальная часть списка обобщенных ситуаций, сформированного
без учета весов
Эксперименты с описанным алгоритмом (см. рис. 4.20) показали,
что, чем меньше элементов содержало множество, тем ближе, как
правило, оказалось оно к началу списка всех возможных ситуаций,
что вполне естественно. Множества с меньшим числом элементов нахо-
находятся, следовательно, в более «выгодном» положении, поскольку они
190 Локальный подход к решению фундаментальных задач [Гл. 4
перемещаются в начало списка и сами по себе, и как подмножества
некоторых других множеств ситуаций. Такая работа системы не всегда
оправдана. Рассмотрим, например, следующее множество ситуаций:
{(р, Я, П), (р, <7, r2), ...,(p,q, rn)}.
Все они содержат общую часть — множество {р, д}, что позволяет
рассматривать это множество как описание важного класса ситуаций.
Все они содержат так же и множество {р}, однако предположим, что
этот факт имеет меньшую значимость, являясь просто следствием
предыдущего. Было бы естественно потребовать тогда, чтобы мно-
множество {р, q} заняло бы в списке более «высокое» положение, чем
множество {р}.
Одним из способов отразить большую значимость более информа-
информативных обобщенных ситуаций является введение весовых коэффици-
коэффициентов, характеризующих эти ситуации. Вопрос о том, каким образом
вычислять эти коэффициенты, требует дальнейшего исследования.
Более того, в настоящий момент отсутствует ясность в том, функци-
функцией каких параметров должен быть вес обобщенной ситуации. Было бы
естественным считать вес обобщенной ситуации монотонной функцией
от количества входящих в ее описание признаков. Эксперименты, одна-
однако, показали, что лучших результатов можно достичь, если учитывать
не только число признаков обобщенной ситуации, но и то, насколько
эта ситуация близка к реальной ситуации, вызвавшей ее перемещение
в списке. Так, если на вход системы поступила ситуация, описываемая
множеством признаков Р, что вызвало перемещение в списке всех
подмножеств этого множества в начало списка, то вес подмножества
Q множества Р должен быть тем больше, чем меньше разность P\Qr
Смысл такого подхода ясен: в привилегированное положение ставятся
такие описания классов сходных ситуаций, которые содержат значи-
значительную часть информации о ситуациях класса.
Мало определить, как считать вес, следует еще понять, как учи-
учитывать его при движении ситуаций «вверх» по списку. Обязательное
перемещение найденной ситуации в начало списка не дает возможности
учесть ее вес. Одним из путей решения проблемы было бы переме-
перемещение ситуации в начало списка с некоторой вероятностью, значение
которой определялось бы весом ситуации. Несмотря на то, что этот
путь обладает рядом достоинств, он не был использован, поскольку
замедлял процесс формирования списка: если вероятности перемеще-
перемещения ситуаций малы, то в значительной части случаев в списке ничего
не будет перемещаться. Для экспериментов был выбран другой путь,
сущность которого заключается в том, что ситуация перемещается не
в самое начало списка, а двигается на несколько шагов вперед, на
сколько именно — определяется ее весом *). Такой способ дал к тому
же более наглядную картину (см. рис. 4.21), ибо у редко встречающихся
ситуаций практически не было возможности подняться в начало списка
) Практически все эксперименты п. 4.4.2 были спланированы и осуществ-
осуществлены А. В. Жожикашвили.
4.4] Локальное формирование простых фреймов 191
и поэтому первая часть списка всегда содержала наиболее часто встре-
встречающиеся ситуации. При небольшом количестве ситуаций и коротком
времени эксперимента это было особенно важно.
Dноги)
Dноги хвост хищник)
Dноги рога копыта травоядное)
Dноги копыта травоядное)
(хвост плавники плавает)
Bноги крылья перья)
Bноги крылья перья летает)
(хвост)
Bноги перья)
(хвост плавники чешуя плавает)
Dноги травоядное)
(хвост плавники (питается рыбой) плавает)
Bноги крылья)
Dноги хвост)
(плавает)
Dноги хвост рыжий хищник)
Bноги крылья перья летает черный)
(хвост плавники чешуя плавает соленая)
Dноги горб (обитает в~пустыне))
Bноги крылья перья летает плавает)
Dноги уши травоядное)
Bноги крылья перья хищник)
Bноги крылья перья летает поет)
Dноги хвост хищник серый)
Bноги крылья плавает)
Dноги рога копыта травоядное)
Dноги хобот)
Dноги хвост хищник (ловит мышей))
Dноги рога копыта травоядное (дает молоко))
(хвост плавники чешуя плавает (питается рыбой))
((пятится назад) плавает)
Bноги хвост крылья перья (несет яйца))
Dноги хвост копыта травоядное)
(хищник)
Bноги)
Рис. 4.21. Начальная часть списка обобщенных ситуаций, сформированного
с учетом весов
Использование сложных формул для подсчета весов ситуаций, поз-
позволяя получить достаточно разумное с точки зрения человека распре-
распределение ситуаций в списке, делает в то же время алгоритм значительно
менее привлекательным, чем простые алгоритмы типа «стопки книг».
Стремление уйти от необходимости использования весов привело к нес-
несколько иному подходу к созданию обобщенных ситуаций. Суть этого
подхода сводится к следующему: при поступлении на вход ситуации,
192 Локальный подход к решению фундаментальных задач [Гл. 4
описываемой множеством признаков Р, в список заносятся не все под-
подмножества множества Р, а только те из них, которые являются пе-
пересечением множества Р с другими множествами, уже находящимися
в списке. Выбор такого алгоритма связан с тем фактом, что если Р
и Q — две ситуации, то обобщенная ситуация PC\Q представляет собой
наименее общее обобщение этих ситуаций, т. е. содержит ту и только ту
информацию, которая относится и к Р, и к Q. Так, в рассмотренном
выше примере с ситуациями {(р, g, ri), (р, д, Г2), . • . , (р, q, rn)} множе-
множество {р, q} будет занесено в список как пересечение всех приведенных
ситуаций, в то время как множество {р} в список не попадает.
Эксперименты показали, что такой метод дает разумное распреде-
распределение ситуаций в списке без использования весов (см. рис. 4.22). Отсюда
следует, что процедура локального обобщения, т. е. построения по двум
ситуациям наименее общего описания, под которое подходит каждая из
этих ситуаций, может с успехом быть использована для формирования
новых понятий в процессе обучения (см. п. 4.4.3).
Основным недостатком методики упомянутых выше экспериментов
является то, что единственным критерием оценки работы системы яв-
являлась «разумность» создаваемого ею списка. При всей важности этого
критерия, он, очевидно, не является удовлетворительным. В частности,
такой критерий не дает возможности количественной оценки качества
различных алгоритмов перемещения ситуаций в списке и, следователь-
следовательно, выбора оптимального варианта, не говоря уже о теоретических
исследованиях.
Поскольку исходной идеей для выработки описанных выше алго-
алгоритмов послужила идея быстрого поиска ситуации в памяти, естествен-
естественно было бы взять в качестве количественного критерия работы системы
ускорение такого поиска. В связи с этим выскажем следующие два
соображения.
Во-первых, если наша задача — найти поступившую на вход си-
ситуацию в списке, просматривая его с начала до конца, то добавление
обобщенных описаний не только не сокращает время поиска, а наобо-
наоборот, увеличивает его, поскольку элементов в списке становится больше.
Тот факт, что, разыскивая ситуацию Р, которая находится далеко от
начала, мы можем встретить значительно ближе к началу ситуацию Q,
обобщающую Р, т. е. такую, что Q С Р, не дает ничего для нахождения
самой ситуации Р. Другое дело, если, найдя такую ситуацию Q, мы
могли бы просматривать дальше не весь оставшийся список, а только
те входящие в него ситуации, которые содержат множество Q. Попытка
перестроить систему таким образом приводит к замене списка ситуа-
ситуаций деревом, каждая вершина которого представляет собой ситуацию,
а ветви ведут от более общих ситуаций к их частным случаям. В этом
случае введение обобщенных ситуаций могло бы дать ускорение поиска.
(Подробнее это анализируется в следующем п. 4.4.3.)
Во-вторых, поиск поступившей на вход ситуации в списке, как
правило, не является самоцелью. Обычно это делается для того, чтобы
каким-то образом обработать поступившую ситуацию, например, от-
4.4] Локальное формирование простых фреймов 193
Bноги крылья перья)
Bноги крылья перья летает)
Dноги хвост хищник)
Dноги копыта травоядное)
Bноги крылья)
Bноги перья)
Dноги рога копыта травоядное)
Dноги)
(крылья перья летает)
Bноги перья летает)
Bноги крылья летает)
(хвост плавники плавает)
Dноги хвост)
(крылья перья)
Dноги травоядное)
(хвост)
Dноги хищник)
(хвост хищник)
(травоядное 4ноги рога копыта)
(травоядное 4ноги копыта)
Dноги рога копыта)
Dноги рога травоядное)
(рога копыта травоядное)
Dноги копыта)
(копыта травоядное)
(хвост плавники чешуя плавает)
(плавает хвост плавники)
(перья летает)
(крылья летает)
Bноги летает)
((травоядное) 4ноги)
(плавники плавает)
(хвост плавает)
(хвост плавники)
Bноги)
(травоядное рога копыта)
(травоядное 4ноги рога)
(плавники чешуя плавает)
(хвост чешуя плавает)
(хвост плавники чешуя)
(крылья)
(перья)
(травоядное копыта)
Dноги рога)
(рога копыта)
(рога травоядное)
(плавает хвост плавники чешуя)
(плавает хвост)
(плавает плавники)
Рис. 4.22. Часть списка обобщенных ситуаций, полученного
с использованием наименьших обобщений
7 Стефанюк
194 Локальный подход к решению фундаментальных задач [Гл. 4
ветить на определенный касающийся ее вопрос. Однако для того, чтобы
ответить на некоторые вопросы, может быть не обязательным установ-
установление всех признаков ситуации. Пусть, например, наличие у ситуации
признаков р и q однозначно определяет ответ на некоторый вопрос.
В этом случае мы можем хранить ответ на этот вопрос не отдельно
для каждой из ситуаций (р, g, ri), (р, g, Г2), . . . , (р, g, rn), а только для
обобщенной ситуации {р, д}, сформулированной в процессе работы
системы (нечто подобное представляет собой процедура наследования
во фреймовых языках представления знаний). Это не только сделает
информацию более компактной, но и позволит ускорить время, требуе-
требуемое для ответа на вопрос, поскольку ситуация {р, q\ может находиться
в списке (или дереве) «выше», чем ситуации (р, g, ri), (p, g, Г2), • • •
••• ,(р,9,г„).
С целью реализовать эти соображения было проведено несколько
дальнейших экспериментов на ЭВМ. Описание одной из программ,
развивающей некоторые идеи, включенные нами в [Stefanuk, 1974],
дано в [Стефанюк, 1985, с. 45—47]. Здесь ограничимся только кратким
изложением ее особенностей по сравнению с вышеприведенными алго-
алгоритмами.
Вместо задачи найти ситуацию перед системой ставилась задача
ответить на некоторый вопрос об этой ситуации. Поиск прекращался,
как только ситуация оказывалась конкретизированной достаточно для
ответа на этот вопрос.
Список ситуаций был заменен деревом. Каждая обобщенная ситуа-
ситуация имела ссылку на список ситуаций (возможно, тоже обобщенных),
являющихся ее частными случаями. Все перемещения по типу «стопка
книг» происходили независимо в каждом таком списке. Для создания
новых обобщенных ситуаций был выбран метод наименьшего обобще-
обобщения. Наименьшее обобщение пары ситуаций становилось новой верши-
вершиной дерева, а каждая из исходных ситуаций включалась в список ее
частных случаев.
Система решала не только задачу структурирования знаний, но
и задачу накопления знаний. В начале работы система не знала ответов
ни на один вопрос. В процессе работы она, под руководством оператора,
записывала возникающие ситуации и ответы на возникающие вопросы,
одновременно создавая для их хранения древовидную структуру. (Сей-
(Сейчас, по прошествии некоторого времени, такой подход представляется
не вполне правильным. Реальные обучающиеся системы должны, по-
видимому, работать именно так, однако на стадии эксперимента для
ясности следовало бы разделить процесс накопления знаний и процесс
создания структур для представления этих знаний.)
Работа с системой показала, что при количестве возможных ситуа-
ситуаций порядка 30, система находила ответ на вопрос, делая 2-3 проверки
(для поиска в списке со случайным распределением это число было бы
равно 15).
Мы не останавливаемся здесь на детальном описании этой системы,
поскольку процедурам усвоения знаний при обучении посвящен следу-
4.4] Локальное формирование простых фреймов 195
ющий раздел 4.3 книги, который явился результатом обобщения части
материала, полученного в ходе описанных экспериментов.
4.4.3. Оценка целесообразности обобщения ситуаций. Как уже от-
отмечалось, описанный выше эксперимент носил качественный характер.
Однако можно попытаться дать и количественную оценку условиям,
при которых полезно введение обобщения и организация дерева ситуа-
ситуаций. В частности, используя выражения для средней глубины памяти
типа стопки книг (см. П.1) или памяти со случайной выборкой (см.
раздел 2.4), можно получить условия, при которых «близкие» ситуации
полезно заменить на их обобщение в исходном «стеке» с последующим
поиском ситуации во втором стеке, где хранятся ситуации, подверг-
подвергнутые обобщению. (На самом деле, в последующем анализе никак не
учитывается «близость» обобщаемых ситуаций.)
Пусть pi, . . . , рп — априорные вероятности поиска ситуаций ai, . . .
... , ап, причем
?> = 1, D.4.1)
1 = 1
и пусть li — среднее время поиска ситуации с^, зависящее, очевидно,
от способа хранения ситуаций в «стеке». Тогда среднее время выборки
произвольной ситуации определяется выражением
I/("i»---»"n) = EPi*i, D.4.2)
г=1
где штрих означает, что поиск ведется в одиночном стеке, в котором
хранятся все ситуации.
Пусть теперь ситуации c^i, . . . , am, m < п, заменены обобщенной
ситуацией а^, среднее время выборки которой обозначим символом
/A) г
/^ , а сами ситуации ai, . . . , аш собраны во второй «стек» со средним
B)
временем выборки, равным /г- , г = 1, . . . , т. Тогда среднее время вы-
выборки произвольной ситуации в такой двухступенчатой системе опре-
определяется выражением
i = l k=m-\-l
n m
i(lj . ^ > ]\ ) I ^ ^ 1\ ) (Л Л Q\
k=m + l i=l
где
m
i=l
Из выражения D.4.3) видно, что
L" (a1?. . . , ап) = L' (am+i,. . . , an, a^)-\-p^Lf (ai,. . . , am) , D.4.5)
7*
196 Локальный подход к решению фундаментальных задач [Гл. 4
поскольку
г=1
где
D.4.6)
г=1
Очевидно, что введение обобщения и второго «стека» оправдано
и приводит к уменьшению среднего времени поиска, если выполнено
D.4.7)
т. е. если
L"(ab...,an),
'(ai,...,am). D.4.8)
Дальнейший анализ этого неравенства проведем для памяти типа
«стопки книг», где L'B задается выражением (см. [Burville and Kingman,
1973] и приложение П.1)
L'B = ±
D.4.9)
и памяти со случайной выборкой, где L'r задается выражением (см.
гл. 2)
/ п \2
D.4.10)
Подставляя D.4.10) в D.4.8). имеем
(п — т
У2 VPrn+i + у/РЪ +
г=1 )
откуда для памяти со случайной выборкой получаем условие
* l^y/Pm+i\l^y/P3- к
Подставляя D.4.9) в D.4.8), имеем
D.4.11)
D.4.12)
П
2 ?"
JPiPj
2 ?"Vi+Pi) 2
П+1
1
2
^
4.5] Формальная теория представления знаний и локального обучения 197
Здесь левая часть неравенства, очевидно, равна
т т п п
i,j = l г=1 j=ra + l i,j=m + l
Аналогично, справа имеем
1
2+
+2 A +
^-^ Pi + Pj *~^ PS + Pj * * *-^ Pi + Pj
ij=m + l j=m+l i, j = l
Поэтому из D.4.13) для «стопки книг» (стека) получаем условие
т п /
1 1 ' D.4.16)
Выражения D.4.12), D.4.16), учитывая D.4.4), формально решают
поставленную задачу — они определяют требования к вероятностям
запросов ситуаций, при выполнении которых двухступенчатая орга-
организация памяти приводит к уменьшению среднего времени поиска
произвольной ситуации. Однако в общем случае не удается дать более
простую интерпретацию приведенным выражениям. Ясно, что, вообще
говоря, соотношения D.4.12) и D.4.16) не выполняются, поскольку
переход к двухступенчатой памяти добавляет «лишний» этап поиска:
сначала отыскивается обобщение, а потом ищется конкретная ситуация
из числа обобщенных.
Приведем численный пример, когда эти неравенства оказываются
выполненными и введение второго «стека» оправдано.
Пусть п = 41, т = 20, р\ = 0,9, Р2, • • • ,Р41 = V и> следовательно,
р = 0,0025, р^ = 0,9475. Тогда в случае стопки книг в одноступенчатой
памяти средняя глубина поиска равна ~ 3,15, а при двухступенчатой —
~ 3,10. (Соответствующие цифры для памяти со случайной выборкой
равны 8,69 и 7,70.)
4.5. Формальная теория представления знаний
и локального обучения
В этом разделе будет продемонстрирована достаточно абстрактная
локально-организованная система, подсистемами которой служат так
называемые образцы (или фреймы, или продукции), взаимодействие
которых определяется, как и в случае экспертных систем (см. разд.
4.6), поступившей извне информацией. Такую систему, которая в силу
локальности используемых процедур обучения строится довольно про-
просто, можно рассматривать как способ компактной записи поступивших
знаний, позволяющий достаточно эффективно опознавать очередную
ситуацию и предпринимать соответствующее действие.
Развитая в настоящем разделе теория в значительной степени про-
продиктована соображениями, возникшими в ходе экспериментов на ЭВМ,
198 Локальный подход к решению фундаментальных задач [Гл. 4
описанных в предыдущем разделе. Вторым фактором, стимулировав-
стимулировавшим ее создание, были наши интенсивные работы по разработке ло-
локально-организованной системы перевода с английского на русский (см.
рис 29 в работе [Жожикашвили и Стефанюк, 1986а]).
Методы, используемые для представления знаний в различных за-
задачах искусственного интеллекта, имеют много общего, несмотря на
различие предметных областей, с которыми связаны задачи [Плесне-
вич, 1982].
В настоящем разделе предлагается математический аппарат, поз-
позволяющий изложить ряд концепций, используемых в представлении
знаний на языке, не зависящем от предметной области.
Дадим сначала неформальное описание понятий, с которыми мы
будем иметь дело в дальнейшем.
Рассмотрим систему, хранящую в памяти обобщенные описания си-
ситуаций, которые могут встретиться ей в процессе работы. Обобщенное
описание может быть пригодным для работы с целым рядом сходных
ситуаций, и в дальнейшем будем называть его образцом.
Операцию, служащую для проверки того, подходит ли данный
образец для описания данной ситуации, будем называть операцией
сопоставления с образцом [Уинстон, 1980]. Она, как минимум, должна
дать утвердительный или отрицательный ответ. Однако в большинстве
случаев этого недостаточно, и от операции сопоставления ожидается
«побочный эффект» — означивание переменных, заполнение слотов
фрейма и т. д.
Образцы могут различаться по степени общности. Один образец
может быть частным случаем другого, если каждая ситуация, сопо-
сопоставимая с первым образцом, сопоставима и со вторым. Это позволяет
естественным образом ввести на множестве образцов частичный по-
порядок и рассматривать такие понятия, как наиболее общий частный
случай двух образцов и наименьшее обобщение двух образцов, соот-
соответствующие нижней и верхней грани в теории структур.
Еще одним понятием, широко используемым в различных зада-
задачах искусственного интеллекта, является продукционное правило, или
продукция. Продукцию можно представлять себе состоящей из двух
частей: условия применимости, т. е. условия, которому должна удовле-
удовлетворять ситуация для того, чтобы к ней можно было бы применить
данную продукцию, и указания на то, как следует преобразовать те-
текущую ситуацию. Во многих случаях условие применимости можно
задать в виде образца, считая продукцию применимой к ситуации, если
ситуация сопоставима с этим образцом. Побочный эффект, возникаю-
возникающий при этом сопоставлении, может быть использован второй частью
продукции. Такой подход позволяет использовать для описания про-
продукций тот же теоретический аппарат, что и для работы с образцами.
4.5.1. Основные определения. Пусть задана произвольная подка-
подкатегория С категории множеств. Выделим в ней объект Е, который
будем называть базовым. Образцом назовем пару (X, у>), где X —
некоторый объект категории С, <р G Нот (X, Е) — морфизм из X
в Е. Выделим также объект / категории, который будем называть
4.5] Формальная теория представления знаний и локального обучения 199
исходным. Ситуацией будем называть образец (/, а), где а — морфизм
из / в Е.
Будем говорить, что ситуация (/, а) сопоставима с образцом (X, (р),
если существует хотя бы один морфизм ф ? Нот (I, X) такой, что
диаграмма на рис. 4.23 коммутативна. Заметим, что морфизм ф опре-
определяется, вообще говоря, неоднозначно.
Из двух образцов (X, (р) и (У, ф) будем считать первый частным
случаем второго, если существует морфизм х ? Нот (X, К), делаю-
ф
Рис. 4.23. Сопоставление Рис. 4.24. Сопоставление
ситуации с образцом двух образцов
щий диаграмму рис. 4.24 коммутативной. Отметим, что и здесь мор-
морфизм х определяется из условия коммутативности диаграммы неод-
неоднозначно. Таким образом, утверждения «ситуация сопоставима с об-
образцом» и «ситуация является частным случаем образца» имеют одно
и то же значение. Очевидно, что если один образец является частным
случаем другого, то всякая ситуация, сопоставимая с первым образцом,
сопоставима и со вторым, однако обратное утверждение в общем случае
неверно.
Легко показать, что отношение «быть частным случаем» задает на
множестве образцов квазипорядок, который не обязательно является
порядком. Будем называть два образца эквивалентными, если каждый
из них является частным случаем другого. Ясно, что с эквивалентными
образцами сопоставимы одни и те же ситуации 1).
Пусть заданы два образца: (Х,<р) и (У,ф). Образец (Z,x) вместе
с морфизмами X: Z^-Xmfi: Z^Y назовем наибольшим частным
случаем пары образцов (Х,<р) и (У, ф), если диаграмма рис. 4.25 а
коммутативна и для любого другого образца (Z^x7), для которого
диаграмма рис. 4.25 б коммутативна, найдется морфизм v : Z1 —>• Z
такой, что коммутативна диаграмма рис. 4.25 в.
Полезность этого понятия раскрывается в следующем утверждении.
Ситуация сопоставима с каждым из образцов (X, (р) и (У, ф) в том
и только в том случае, когда она сопоставима с их наибольшим частным
случаем (Z, %), если последний существует.
Действительно, пусть ситуация (/, а) сопоставима с образцом
(Z, х). Согласно определению, это означает, что существует морфизм
/3 : I —> Z, для которого имеем равенство а = /3%.
) Иногда нам будет, удобнее записывать ситуацию в виде а : / —>> Е
и говорить о ситуации со значением в Е. При этом для краткости будем
говорить «ситуация а», если это не ведет к недоразумениям.
200 Локальный подход к решению фундаментальных задач [Гл. 4
Е Е
X
>
V х
ф
X
Z'
а б в
Рис. 4.25. К определению наибольшего частного случая двух образцов
Полагая 7 = /ЗА и 6 = /З/i и используя то, что х = А^ = /х^,
находим, что а = /3% = убАу? = 7^ и а — Рх — Р/лф = Sip, т. е.
ситуация а сопоставима с каждым из образцов [X, if) и (У,ф).
Обратно, пусть ситуация а сопоставима с каждым из образцов
(X, (р) и (У, ф). Это означает, что существуют морфизмы 7 : I —* Хи
S : / —>• У, удовлетворяющие условию а = 7^ = ^^- Тогда, согласно
определению наибольшего частного случая, должен существовать мор-
физм /3 : I —> Z такой, что а = /3%, что и означает сопоставимость
ситуации с образцом (Z,x)-
Заметим, что наибольший частный случай отличается от конструк-
конструкций, принятых в теории категорий тем, что отсутствует требование
единственности морфизма v. Нельзя утверждать, что наибольший
частный случай единственен, хотя бы даже с точностью до изомор-
изоморфизма. Легко впрочем показать, что все наибольшие частные случаи
пары образцов являются эквивалентными. (Разумеется, пара образцов
может вообще не иметь наибольшего частного случая.)
Рис. 4.26. К определению наименьшего обобщения пары образцов
Наряду с наибольшим частным случаем, можно рассмотреть наи-
наименьшее обобщение пары образцов. Пусть заданы два образца (X, <р)и
(У, ф). Образец (Z, х) с морфизмами X: X^Zn/i: Y^Z назовем
их наименьшим обобщением, если диаграмма рис. 4.26 а коммутатив-
коммутативна и для любого другого образца (Zf,xf)-> Для которого диаграмма
рис. 4.26 б коммутативна, найдется морфизм v : Z —> Атакой, что
диаграмма рис. 4.26 в является коммутативной. (Как и в предыдущем
определении, мы не требуем единственности морфизма is.) Пара образ-
4.5] Формальная теория представления знаний и локального обучения 201
цов может не иметь наименьшего обобщения; если она имеет несколько
наименьших обобщений, то все они эквивалентны.
Аналогично предыдущему, если ситуация сопоставима с одним из
образцов (X, ф) и (У, ф), то она сопоставима и с их наименьшим обоб-
обобщением (Z, х), если последнее существует.
Действительно, пусть ситуация (/, а) сопоставима с образцом
(X, (р). Это означает, что существует морфизм /3 : I —> X такой, что
а = /3(р. Тогда, полагая j = /ЗА, получаем а = C(р = /3\х = 7Х? откуда
видно, что ситуация (/, а) сопоставима с образцом (Z, %).
Заметим, что обратное утверждение неверно: ситуация, сопостави-
сопоставимая с наименьшим обобщением двух образцов, не обязательно должна
быть сопоставимой с одним из них.
Аппарат теории категорий может быть использован также для опи-
описания систем продукций. Дадим соответствующие определения.
Выделим в категории С два базовых объекта Е и R и будем говорить
об образцах и ситуациях со значениями в Е и R. Продукцией из Е в R
назовем тройку (X, (р,ф), где X — объект категории, (р ? Нот (X, Е),
ф G Нот (X, R). Продукцию, следовательно, можно рассматривать как
пару образцов (X, (р) и (X, ф). Пусть (/, а), а Е Нот (/', Е) — произ-
произвольная ситуация со значением в Е. Будем говорить, что продукция
(X, <р, ф) применима к ситуации (/, а), если эта ситуация сопоставима
с образцом (X, у>), т.е. если существует морфизм /3 : I —> X такой,
что а = C(р. В этом случае будем называть ситуацию /Зф : / —>• R
результатом применения продукции (Х,(р,ф) к ситуации а. Таким
образом, результатом применения продукции из Е в R к ситуации со
значением в Е будет ситуация со значением в R. Наиболее интересен
случай R = Е, однако в некоторых случаях удобно различать Е
и Я, считая ситуации со значениями в Е условиями некоторой задачи,
а ситуации со значениями в R — решением этой задачи.
Отметим одну существенную деталь. Морфизм /3 может опреде-
определяться условием а = /3(р неоднозначно. Если /3' : I —> X — другой
морфизм, для которого выполнено равенство а = /3fip, то возможно,
что (З'ф ф /Зф. Это означает, что результат применения продукции
к ситуации не определяется однозначно. Продукция, следовательно, не
является функцией.
4.5.2. Примеры конкретизации теории в приложениях. В прило-
приложении П.З рассмотрен ряд примеров, проясняющих применение пред-
предложенного аппарата в типичных задачах искусственного интеллекта.
В этом приложении придается явный вид категориям (т. е. ука-
указываются объекты категории и задаются морфизмы), описывающим
наиболее широко распространенные процедуры работы со знаниями.
Среди рассмотренных задач — «классическое» сопоставление с об-
образцом, допускающее замену переменной константой (см. рис. 4.27),
обобщенное сопоставление с образцом, допускающее замену перемен-
переменной строкой символов (см. рис. 4.28), алгебраические преобразования
и дедуктивный вывод (в простейших случаях), узнавание и обобщение
описаний и теоретико-категорное описание системы фреймов.
202 Локальный подход к решению фундаментальных задач [Гл. 4
A* L
Oibabcy/^ ^Ч^ аЬаЪУ^ \f7Ti X €2 СКа X 7Г2 X 7Ti) <74
т ^ л Т ^ т 2
/ р А 1 > L
OLbc (%Ъ X (У.0
Рис. 4.27. Пример на тра- Рис. 4.28. Пример на обобщенное сопо-
диционное сопоставление ставление с образцом
с образцом
Замечание. Поскольку основные предлагаемые здесь операции —
взятие наиболее общего частного случая и наименее общего обобще-
обобщения, — представляют собой аналоги верхней и нижней грани в теории
частично упорядоченных множеств, возникает естественный вопрос:
не является ли предлагаемый теоретико-категорный аппарат чрезмер-
чрезмерно общим и нельзя ли было получить те же результаты, используя
теорию упорядоченных множеств [Епифанов, 1974]. Действительно,
многие понятия, введенные в работе, могут быть переформулирова-
переформулированы на язык частичного порядка. Мы можем, например, рассмотреть
некоторое упорядоченное множество Р, называемое множеством об-
образцов, минимальные элементы этого множества назвать ситуациями
и считать ситуацию s Е Р сопоставимой с образцом р Е Р, если
выполнено неравенство s $J p. На этот язык можно даже перевести
понятие продукции, определив продукцию как пару образцов (p,q),
р, q E Р. В этом случае все, что мы можем сказать о продукции —
это то, что она применима к ситуации s, если s ^ р, и что результат
ее применения г должен удовлетворять условию г ^ д, однако здесь
нет информации о том, какую именно ситуацию из удовлетворяющих
этому условию следует выбрать. Интуитивно ясно, что ситуация г
должна быть частным случаем образца q в таком же смысле, в котором
s является частным случаем р, однако частичный порядок, будучи
отношением, дает только положительный или отрицательный ответ
на вопрос, выполнено ли условие s $J p, и нет никакой информации
относительно того, как именно из р получается s. Это делает аппарат
упорядоченных множеств непригодным для описания сколько-нибудь
сложных систем продукций.
Таким образом, использование частичного порядка оправдано в за-
задачах, в которых операция сопоставления является заключительным
шагом, если же после сопоставления требуется дальнейшая обработка
ситуаций с учетом результатов этого сопоставления, то использование
частичного порядка, как правило, является недостаточным. Здесь име-
имеется, определенная аналогия с обсуждением необходимости символьно-
символьного оценивания ситуаций в процессе поиска решений [Минский, 1978].)
4.5.3. Сети образцов. Для описания процесса обучения систем, т. е.
процедур усвоения нового знания, в общем случае недостаточно по-
понятий изолированных образцов, продукций или фреймов, описанных
в предыдущих разделах. Исходным при построении обучающихся си-
4.5] Формальная теория представления знаний и локального обучения203
стем являются сети образцов, формальное определение которых дается
в настоящем разделе.
Здесь дается также описание процедур модификации этой сети с ис-
использованием таких операций, как обобщение, отождествление узлов
и разложение в произведение.
Сеть образцов позволяет обеспечить узнавание ситуаций из некото-
некоторого их множества. Таким образом, сеть образцов — это обобщение по-
понятия образца. В п. 4.5.4 рассматривается р-сеть, которую можно счи-
считать обобщением продукции. По распознанной ситуации р-сеть строит
новую ситуацию, которую можно использовать различным образом.
Будем говорить, что задана сеть образцов, если: 1) задано некоторое
множество {Ai, г ? М} объектов категории С (не обязательно различ-
различных); 2) для каждой пары z,j Е М задано множество морфизмов
A{j С Нот (Ai,Aj) категории; 3) выделено множество Мо С М
(объекты Ai, г Е Мо, будем называть выходными объектами сети).
Дадим рекурсивное определение сопоставимости ситуации с сетью.
Пусть а : / —>• А{ — произвольная ситуация. Будем говорить, что она
сопоставима с сетью М в одном из следующих случаев: 1) если г Е Мо,
т. е. объект является выходным; 2) для некоторой ситуации /3 : I —>
—>• Aj, сопоставимой с сетью, существует морфизм (р Е Aij такой, что
а = /3(р. Простейшим примером сети является один образец ip : X —>
—> Е: если положить М = {0,1}, Ао = Е, А± = X, Мо = {1}, А10 =
= {(^}, Aij = 0 для остальных г, j, то условие сопоставимости ситуации
с построенной сетью есть не что иное, как условие сопоставимости
ситуации с образцом (X, (р).
Чуть более сложный пример изображен на рис. 4.29. Здесь L и / —
объекты категории, рассмотренной в примере 2 (см. рис 4.28 и П.З),
фах, <РЪх и т. д. — морфизмы, соответствующие образцам ах, Ьх и т. д.,
например, (рах = (s\ot,a x tti) g<i- Выходные вершины отмечены круж-
кружками. Ситуация сопоставима с такой сетью, если она представляет собой
либо последовательность, начинающуюся с 6, либо последовательность,
начинающуюся с а, в последнем случае оставшаяся ее часть должна
либо оканчиваться буквой 6, либо быть равной с.
Рис. 4.29. Пример сети Рис. 4.30. Другой пример сети
образцов образцов
Сеть может иметь петли. Например, с сетью, изображенной на
рис. 4.30, сопоставимы последовательности 6, аб, aab и т. д.
204 Локальный подход к решению фундаментальных задач [Гл. 4
Сеть образцов может использоваться для описания некоторого мно-
множества ситуаций: система определяет, входит ли конкретная ситуация
в это множество, судя по тому, сопоставима ли эта ситуация с сетью.
Обобщение в сети образцов. Сеть образцов может
иметь весьма сложную структуру и описывать нетривиальное
множество, однако локально она устроена просто: процедура сопостав-
сопоставления с образцом применяется в каждом узле сети независимо. Это
позволяет построить сравнительно простые локально-организованные
алгоритмы, дающие возможность системе самостоятельно строить сеть
на основе обработки примеров ситуаций из того множества, которое
эта сеть должна описывать.
Изложим основную идею работы одного такого алгоритма. Исходно
сеть состоит из одного объекта Aq и не содержит морфизмов. Пусть
к некоторому моменту уже сформирована сеть Мина вход поступила
очередная ситуация а : / —> Aq. Будем действовать следующим обра-
образом.
1) Если ситуация сопоставима с М, это означает, что система узнала
ситуацию а и нет оснований что-либо менять;
2) если для некоторого г Е М существуют морфизмы (р Е Aiq и /3 Е
Е Нот (I, А{) такие, что а = /3<р, то заменить а на /3, Ао на А{ и
применить снова описываемую процедуру;
3) в остальных случаях проделать следующие действия:
3.1) добавить к множеству М новый элемент га, положить Ат = /,
положить Ат0 = {а} и Ат{ = 0 для всех г ф 0, Aim ф 0;
3.2) исследовать все морфизмы (р Е AiQ,i Е М, и если для одного
из таких морфизмов (р : А{ —>• Aq и морфизма а : Ат —>• Aq существует
нетривиальное х) обобщение — объект X с морфизмами Л : Ат —» X,
\i : Ai —» X и х '• X —» Ло, то добавить к сети объект Ап = X, полагая
-4по = {%}, ^mn = {A}, Ain = {//}; других морфизмов, входящих в Лп
или выходящих из Ап нет.
Несложно убедиться, что полученная сеть описывает те и только те
ситуации, которые использовались для ее построения. В этом смысле
использование сети не дает ничего нового по сравнению с хранением
в памяти списка всех поступивших ранее ситуаций; однако сеть может
иметь преимущество перед списком, связанное с тем, что время сопо-
сопоставления ситуации с сетью будет меньше, чем время поиска ее в списке
(см. [Stefanuk, 1974]).
Отметим, что здесь и в дальнейшем мы рассматриваем обучение
на примерах, т. е. на вход системы подаются конкретные ситуации.
Но ничто, однако, не запрещает подать на вход системы готовый обра-
образец, что будет означать сообщение системе правила для распознавания
х) Обычно в системах образцов существует «наибольший» образец, с ко-
которым сопоставлены все ситуации и который является обобщением любого
другого образца. Если наименьшее обобщение равно такому «наибольшему»
образцу, то оно считается тривиальным; по сути дела, это означает, что
обобщаемые образцы не имеют ничего общего.
4.5] Формальная теория представления знаний и локального обучения 205
ситуаций; возможность восприятия таких правил не требует никаких
дополнительных изменений в алгоритме.
Отождествление узлов. По существу, мы рассматривали
две операции, используемые для построения сети — добавление си-
ситуаций и обобщение. Введем в рассмотрение еще одну операцию —
отождествление узлов сети. Пусть г, j Е М, г ф j, A\ = Aj. Заменим
узлы Ai и Aj на один узел А &, полагая А\~ = А{ = Aj, Akm = Aim U
U Ajm, Лт/е = Лт* U Amj для всех те М.
Система будет отождествлять узлы г и j сети при условии Ат{ =
= Amj для всех m Е М. Например, сеть рис. 4.31 а будет преобразована
к виду 4.31 б.
L L L
4>ах/ \Ч>Ъх (faxl \фЪх (faxl Wbx
L L L L
I I I I II III
а б в
Рис. 4.31. Процедура отождествления узлов
Отождествление узлов позволяет хранить информацию в более
компактной форме. Однако введение этой операции влечет и более
серьезные изменения. Дело в том, что теперь так построенная сеть уже
может описывать ситуации, которые ни разу не встречались в процессе
обучения. В самом деле, если на вход сети, изображенной на рис. 4.31 б,
подать ситуацию ае, сеть примет вид, изображенный на рис. 4.31 в; это
приведет к тому, что система будет рассматривать ситуацию be как
допустимую, хотя эта ситуация ни разу не встречалась и может, вообще
говоря, не являться допустимой.
Свойство системы узнавать не возникавшие прежде ситуации может
являться мощным методом обучения, позволяющим системе обраба-
обрабатывать новые ситуации по аналогии со старыми, однако как и всякое
рассуждение по аналогии, такой метод может привести к ошибкам
в работе системы.
Во многих случаях следует проводить отождествление вершин,
заменив условие Ami = Amj на более слабое: Ami близко к Amj.
Что значит «близко», должно быть задано для каждой конкретной
предметной области.
При таких условиях отождествление вершин с большей вероят-
вероятностью может привести к ошибкам, однако во многих случаях это
единственный способ получить достаточно богатую сеть. Например,
отождествление близких вершин является единственным способом по-
получения рекурсивных сетей, содержащих петли. Так, например, после
отождествления вершин на рис. 4.32 а, система построит сеть, изобра-
206
Локальный подход к решению фундаментальных задач
[Гл.4
<Рь
I
фая
женную на рис. 4.32 б. Во многих задачах
(например, в лингвистических) использо-
использование таких рекурсивных сетей является
необходимым.
Разложение в произведение.
Введем некоторое дополнение к опре-
определению сети образцов. Рассмотрим
множество Р, элементами которого
являются некоторые конечные после-
последовательности (го, «1, . . . , in) элементов
множества М, для которых имеет место
п
равенство Л^о = П
где знаком
Рис. 4.32. Построение ре-
рекурсивной сети при отож-
отождествлении узлов
с сетью (здесь символом
Y\ обозначено теоретико-категорное
произведение. Если (г'о, г'х, . . . , гп) Е
Е Р, будем говорить, что объект сети
разложен в произведение объектов А^, . . .
... , Ain. К двум условиям сопоставимости
с сетью добавим третье: ситуация
а : / —>• Л о сопоставима с сетью М,
если @, г'х, . . . , гп) Е Р и каждая из
ситуаций anj : / —> Aij сопоставима
ttj обозначена проекция объекта Aq =
п
на
Рассмотрим, например, сеть, изображенную на
рис. 4.33. Знак 0 и линии, соединяющие его
с объектами сети, служат для изображения то-
того, что объект Lo разложен в произведение объ-
объектов L\ и L2, т. е. что @, 1,2) Е Р. Ситуация,
входящая в Lo, сопоставима с такой сетью, ес-
если она представляет собой слово, первая буква
которого есть а или 6, а вторая — с или d.
Разложение в произведение позволяет хра-
хранить приобретенные системой знания в более
компактном виде, кроме того, оно ускоряет про-
процесс обучения за счет того, что некоторые со-
сомножители могут отождествиться с другими
узлами сети, и получение новых знаний об этих
узлах будет автоматически добавлять знания
о произведении.
Для того, чтобы использовать разложение
в произведение в процессе обучения, нужно, чтобы система могла сама
создавать такие разложения.
Рассмотрим пример. Допустим, на некотором этапе обучения бы-
была сформирована сеть, фрагмент которой изображен на рис. 4.34 а.
С помощью операции обобщения может быть построен фрагмент сети,
изображенный на рис. 4.34 б (указаны только те морфизмы, которые
Рис. 4.33. Пример раз-
разложения в произведе-
произведение
4.5] Формальная теория представления знаний и локального обучения 207
Lo <P*c/\<pad ф
\ / \
L\ Li
Рис. 4.34. Использование разложения в произведение в процессе обучения
используются в дальнейшем построении). Отождествляя узлы L\ и L2,
система получает сеть, приведенную на рис. 4.34 в. Теперь можно раз-
разложить объект Lq в произведение, в результате чего сеть примет вид,
изображенный выше на рис. 4.33. Во-
Вообще, всякий раз, когда система встре-
встречается с сетью, изображенной на
рис. 4.35 а, она ищет возможность за-
заменить ее сетью рис. 4.35 б. Вопрос
о том, как это сделать, должен решать-
решаться для каждой конкретной задачи (так
же, как и выработка алгоритмов для
построения наиболее общего частно- а б
го случая, для сопоставления и т. д.).
Для разложения в произведение иног- Рис. 4.35. Пример замены сетей
да можно использовать те же методы, системой
что и для нахождения наименьшего
обобщения.
4.5.4. Сети продукций (р-сети). Сеть образцов, которая рассмат-
рассматривалась выше, представляет собой как бы более сложный вариант
образца в том смысле, что ее можно использовать для сопоставления
с ситуациями и ответа на вопрос, входит ли некоторая ситуация в за-
заданное множество или нет. Теперь мы рассмотрим сеть, являющуюся
обобщением понятия продукции, которую, подобно одиночной продук-
продукции, можно будет использовать для преобразования ситуации, замене
ее новой ситуацией. Такую сеть будем называть р-сетью.
Дадим формальное определение. Будем говорить, что задана р-
сеть, если заданы две сети образцов {Л^ i ? М} и {Bi, г G М}, имею-
имеющие взаимно однозначное соответствие между множествами Aij и Bij
для любых г и j. Потребуем, кроме того, чтобы выполнялось равенство
Ai = Bi для любого г из множества Mq. Если сети образцов содержат
разложения в произведение, потребуем, чтобы множество Р было бы
одним и тем же для обеих сетей.
Пусть задана ситуация а : / —>• А{. Будем говорить, что р-сеть
переводит ее в ситуацию /3 : / —>• Bi в одном из следующих случаев:
1) если г G Mq (следовательно, А{ = Bi) и а = /3;
208 Локальный подход к решению фундаментальных задач [Гл. 4
2) если для некоторого морфизма (р Е А^ и соответствующего ему
морфизма ф Е Bij найдутся такие ситуации j : / —>• Aj и ё : / —>• i?j,
что а = <у(р, /3 = ёф и ситуация 7 переводится р-сетью в ситуацию 5;
3) если (г, ji, . . . , jn) Е Р и для каждого /с = 1, . . . , п ситуация атг&
переводится в ситуацию bq^ (здесь тг/- обозначает проекцию А{ на Ajk,
a qk — проекцию В{ на Bjk).
Как и сеть образцов, р-сеть может быть построена в процессе обу-
обучения. Система, использующая такую сеть для обработки ситуаций,
работает под контролем оператора, который может вмешиваться в ее
работу. Всякий раз, когда на вход системы поступает очередная си-
ситуация, система пытается применить к ней р-сеть. Результаты этой
попытки могут быть следующими: 1) система правильно строит новую
ситуацию; 2) система неправильно строит новую ситуацию; 3) система
не может применить сеть, ибо ситуация с ней не сопоставима.
В первом случае система не меняет сети, считая, что сеть при-
пригодна для обработки данной ситуации. (На самом деле, информацию
о правильной работе сети имеет смысл хранить и использовать для
ускорения поиска [Жожикашвили и Стефанюк, 1984а; 19846].)
Во втором случае оператор сообщает системе, что ситуация обрабо-
обработана неверно, в этом случае система удаляет те элементы сети, которые
привели к неверному ответу. Мы не будем касаться этих операций
и сосредоточимся на третьем случае.
В том случае, когда ситуация не сопоставима с сетью, оператор со-
сообщает системе ситуацию, которая должна была получиться на выходе.
Эту информацию система использует для наращивания сети. Опишем
алгоритм, используемый для этого.
Пусть на вход системы поступила ситуация а : / —>• А{, а под-
подсказкой оператора является ситуация /3 : I —> В{. Если существуют
соответствующие друг другу морфизмы if E Aij, ф Е Bij и существуют
морфизмы 7 : I ^ Aj и ё : I —> Bj, такие, что а = 7^> $ =
= ёф и ситуация 7 переводится сетью в ситуацию E, то применяем
описываемый алгоритм к ситуациям 7 и ё. В противном случае следует
проделать следующее: 1) добавить к множеству М новый элемент т,
положить Ат = Вт = /, Ami = {a}, Bmi = {/3}; 2) если для некото-
некоторого морфизма if : Aj —» Ai и морфизма а существует нетривиальное
обобщение — объект X с морфизмами х '• X —» А^ Л : Aj —» X
и \i : Ат —> X, а для соответствующего морфизма ф : Bj —» Bi и
морфизма /3 — нетривиальное обобщение Y с морфизмами rj : Y —>• В{,
? : Bj —> У и С : Вш —» У, то добавляем к множеству М элемент п,
полагая
Ап = X, Вп = У, Ani = {х} , Ajn = {Л} , Атп =
Bni = {rj} , Bjn = {?} , Bmn = {(} .
В результате обучения система сформирует сеть, которая позволит
ей с некоторого момента перейти в автономный режим работы, без
контроля со стороны оператора.
Можно перенести на р-сети остальные операции, сформулирован-
сформулированные для сетей, образцов — отождествление вершин и разложение
4.6] Некоторые аспекты теории локально-организованных систем 209
в произведение, причем теперь эти операции должны выполняться
одновременно в каждой из двух сетей, составляющих р-сеть.
Отметим, что, как и в случае сети образцов, оператор может со-
сообщить системе не только пару ситуаций (обучение на примерах), но
и готовую продукцию (Х,(р,ф), (р : X —> А^ ф : X —> Bi (обуче-
(обучение посредством сообщения правила). В этом случае к множеству
добавляется элемент га, Аш = Вш = X, Ami = {у?}, Bmi = {
а в дальнейшем алгоритм работает, как изложено выше.
В заключение отметим, что рассмотренный в настоящем разделе
подход является весьма общим. На этом уровне абстракции, тем не
менее, представляется, что следующей важной и интересной задачей
является выделение содержательных классов морфизмов, которые при
разумном компромиссе между абстрактностью и конкретностью позво-
позволили бы эффективно применить методы теории категорий к решению
содержательных классов задач.
Хочется надеяться, что изложенное облегчит работу в этом направ-
направлении.
4.6. Некоторые аспекты теории
локально-организованных человеко-машинных
(экспертных) систем
Возникшее в начале 80-х годов направление экспертных систем
(ЭС) к настоящему времени оформилось в самостоятельную науч-
научную дисциплину, в основе которой лежит создание прикладных про-
программных систем [Алексеева и др., 1984; Алексеева и Стефанюк, 1984;
Антонюк, 1985; Микулич, 1985; Попов, 1987; Поспелов и Поспелов,
1965]. Поскольку эта дисциплина зародилась в недрах искусственного
интеллекта (ИИ), то многие теоретические аспекты, такие как выбор
способа представления знаний, схемы логического вывода и индуктив-
индуктивного накопления знаний, являются в областях ИИ и ЭС общими.
С другой стороны, имеется достаточное число открытых теорети-
теоретических проблем, которые относятся, по-видимому, только к области
ЭС. В настоящем разделе уделяется внимание двум таким вопросам.
Условно их можно назвать «Мета ЭС» и «Объединение свидетельств».
Обращение к первому из этих вопросов позволяет с единых позиций
взглянуть на область ЭС. Второй вопрос имеет особую важность на
этапе построения подсистем работы со знаниями в реальных ЭС.
4.6.1. Экспертные системы метауровня. Метапонятия часто ис-
используются в ИИ и ЭС. Обычно подразумевается, что высказывание
«мета X» означает «X об X»: метазнания — это знания о знаниях,
метаязык — это язык для описания языка и т. п. Но такое толкование
следует воспринимать всего лишь как мнемоническое правило, которое,
к тому же, не всегда применимо. Например, метауровень — это просто
следующий по отношению к исходному уровень, и вообще, «мета»
(греч.) означает «после», «через».
Полезно напомнить, что, например, в теории поведения автоматов
в случайной среде [Цетлин и Крылов, 1963] часто говорилось об ав-
210 Локальный подход к решению фундаментальных задач [Гл. 4
томатах второго уровня, задача которых состояла в подборе парамет-
параметров автоматов первого уровня, непосредственно выбиравших действия
в случайной среде. Так с полным правом можно было бы назвать
метаавтоматом автомат, использованный в [Гершт и Стефанюк, 1968]
для поиска оптимального объема памяти автомата нижнего уровня,
помещенного в марковски переключаемую среду. Итак, здесь метаав-
томат — это автомат, управляющий работой другого автомата.
Столь подробное объяснение смысла метапонятий приведено для
того, чтобы было видно, что вводимое понятие «мета-ЭС» отличается
от таких понятий, как «пустая ЭС», «скелетная ЭС» или «оболочка
ЭС». Мета-ЭС — это «ЭС об ЭС», т. е. экспертная система, способная
решать задачи из некоторого достаточно узкого класса (см. ниже)
задач, касающихся прикладных экспертных систем.
Таким образом, предметной областью мета-ЭС являются всевоз-
всевозможные прикладные экспертные системы. Опыт работы, с приклад-
прикладными ЭС показал [Хейес-Рот, Уотерман, Ленат, 1987], что не только
предметная область должна быть в определенном смысле узкой, но
и класс решаемых задач тоже не слишком широкий.
Заимствовав из [Хейес-Рот, Уотерман, Ленат, 1987] перечень ре-
решаемых ЭС задач, а именно, интерпретация, прогноз, диагностика,
проектирование, планирование, управление, наблюдение, исправление,
отладка, ремонт и обучение, можно попытаться создать мета-ЭС для
решения каждой из них. Разработка таких мета-ЭС, очевидно, эквива-
эквивалентна созданию некоторой теории ЭС, отсутствие которой в настоящее
время сдерживает прогресс в области экспертных систем.
Для конкретности дадим примеры задач, решаемые гипотетически-
гипотетическими мета-ЭС в соответствии с приведенным выше списком.
1. По наблюдаемому поведению данной прикладной ЭС или ее
описанию дать ее интерпретацию, т. е. указать класс, к которому она
может быть отнесена.
2. Дать прогноз направления развития ЭС, скажем, данного класса
[Стефанюк, 1987г].
3. В сложно устроенной ЭС диагностировать использование
какого-то основного подхода (например «доски объявлений» или
семантической сети и т. п.).
В частности, легко видеть, что в подавляющем большинстве су-
существующих ЭС используются правила Ri, каждое из которых вно-
вносится в систему экспертом практически независимо от других пра-
правил. Поэтому такая экспертная система представляет собой локально-
организованную систему (в смысле разд. 1.2) правил Ri, характер
взаимодействия которых жестко регламентирован и зависит лишь от
поступающих в систему данных извне.
4. Мета-ЭС в задаче проектирования ЭС может помочь при выборе
необходимых ее составляющих. Такая постановка очень близка задаче,
решаемой системой XI (см. [Алексеева и Стефанюк, 1984]). Другим
примером может служить вопрос объединения свидетельств, которому
посвящены следующие пункты данного раздела.
4.6] Некоторые аспекты теории локально-организованных систем 211
Сами свидетельства также образуют локально-организованную си-
систему. Каждое свидетельство е^ поставляется из опыта совершенно
независимо от других, и вопрос их объединения, который разбирается
далее, — это вопрос указания характера взаимодействия подсистем
некой локально-организованной системы, что соответствует этапу IV
на рис. 1.3.
5. Мета-ЭС — весьма полезная концепция при планировании этапа
разработки ЭС или планировании создания последовательности посте-
постепенно усложняющихся ЭС.
6. Мета-ЭС может быть использована при выборе характера управ-
управления потоками информации внутри ЭС.
7. Концепция мета-ЭС может быть использована при ведении на-
наблюдения за работой ЭС, позволяющего обнаружить, например, когда
ЭС перестает справляться с решаемой задачей.
8. Мета-ЭС может помочь при отладке ЭС и ее ремонте (например,
при корректировке знаний). Именно это имеется в виду в [Хейес-Рот,
Уотерман, Ленат, 1987] при описании эволюционного процесса создания
ЭС.
9. Наконец, мета-ЭС может быть особенно полезна для обучения
специалистов, в частности, в процессе подготовки инженеров знаний,
что сегодня является весьма актуальной задачей.
Приведенные нами примеры не исчерпывают всех возможностей
теоретического осмысления области прикладных ЭС, которые откры-
открываются благодаря введению концепции мета-ЭС. В заключении раздела
приведем список тех трудностей или проблем, которые имеются на
сегодня в области прикладных ЭС [Стефанюк, 1987г]: малоразвитый
процесс приобретения знаний, узкая предметная область, неглубокие
рассуждения, разные способы представления знаний, разные дедук-
дедуктивные машины, практическое отсутствие самообучения. Кроме того,
на современном этапе отсутствуют способы сравнения ЭС между со-
собой, в существующих ЭС не всегда ведется адекватный учет свойств
пользователя и т. п.
Эти проблемы также могут рассматриваться как задачи для мета-
ЭС. Таким образом, сама концепция мета-ЭС может оказаться полезной
и, по-видимому, заслуживает самостоятельного изучения *). В следу-
следующих разделах, однако, мы ограничиваемся рассмотрением одного из
вопросов, заслуживающих изучения на метауровне — вопроса исполь-
использования в прикладных ЭС неточных знаний.
4.6.2. Использование нечеткой логики. Одним из главных досто-
достоинств прикладных ЭС, обеспечившим им особенно широкое распро-
распространение, является возможность работы с неточными (неполными,
ненадежными, ошибочными) знаниями [Алексеева и Стефанюк, 1984].
Причинами возникновения неточных знаний могут быть ошибки в дан-
) Мета-ЭС была нами реализована на Лиспе и успешно демонстрировалась
на нескольких выставках (см. например [Стефанюк и ^Кожикашвили, 1990а;
19906]).
212 Локальный подход к решению фундаментальных задач [Гл. 4
ных, в правилах вывода, а также использование неточных моделей или
нехватка данных.
Из существующих способов работы с неточными знаниями мы
остановимся на одном из двух наиболее распространенных методах —
применении нечеткой логики.
В [Zadeh, 1965] было предложено понятие нечеткого множества,
характеристическая функция которого может принимать произволь-
произвольное значение из интервала [0,1], позволяя отобразить разнообразные
нечеткие понятия, такие как «высокий», «старый», «широкий» и т. п.
Развитые в дальнейшем методы были использованы во многих работах,
но, пожалуй, трудно указать для них наиболее яркое применение, чем
то, которое они нашли в прикладных ЭС.
Согласно [Zadeh, 1965], истинность \± некоторого утверждения X
(например, «этот человек — высокий») является числом /J>(X) E [0,1],
причем выполняется
ц(Х V Y) =
ц (X Л Y) = min {p(X
По этим формулам производится комбинирование истинностей от-
отдельных утверждений, но возникает вопрос, а как комбинировать меж-
между собой различные свидетельства в пользу некоторого одного утвер-
утверждения?
Опишем кратко схему, используемую для этого в системе MYCIN,
в которой Шортлифф [Shortliff, 1976] предложил использовать коэф-
коэффициенты уверенности (КУ) для оценки степени доверия данному
заключению, являющегося результатом собранных свидетельств:
КУ(Н|е) = а(Н|е)-а(Н|е).
Здесь КУ(Н|е) — коэффициент уверенности в гипотезе Н при на-
наличии свидетельства е, а — мера доверия этой гипотезе, а а — мера
недоверия этой гипотезе.
Меры а и а могут изменяться в интервале [0,1], а КУ, следова-
следовательно, — в интервале [—1, +1]. Далее Шортлифф предлагает работать
с а и о; по отдельности. В частности, он опирается на следующую
простую формулу, позволяющую вычислить новую степень доверия
при поступлении двух свидетельств ei, е2 в пользу гипотезы Н:
а(Н|еь е2) = a(H|ei) + a(H|e2)(l - a(H|ei)).
Например, если одна цепочка правил в экспертной системе приводит
к степени доверия некоторому факту Ф, равной 0,5, а другая — к сте-
степени доверия тому же факту, равной 0,6, то итоговая степень доверия
факту Ф будет равна 0,8.
В следующих разделах мы сделаем попытку разобраться, насколько
оправдано применение такого рода формул.
4.6] Некоторые аспекты теории локально-организованных систем 213
4.6.3. Получение закона объединения свидетельств — аксиоматиче-
аксиоматический подход. В настоящем разделе показано, как используемая Шорт-
лиффом формула может быть получена в результате решения неко-
некоторой вариационной задачи, обоснованию которой посвящен п. 4.6.5.
Для этого слегка изменим обозначения. Пусть имеются два свидетель-
свидетельства ei, в2 в пользу некоторой гипотезы Н и пусть соответствующие
степени доверия в отношении Н равны а, /3, причем 0 ^ а, /3 $J 1. Нас
будет интересовать «суммарная» степень доверия ж(а,/3) гипотезе Н
при поступлении в систему обоих указанных свидетельств.
Рассматривая ж(а, /3) как функцию а и /3, можно предложить сле-
следующий естественный набор требований к этой функции:
1) х(а, /3) — непрерывная действительная функция своих аргумен-
аргументов, имеющая производные любого порядка;
2) х(а, /3) — симметрическая функция;
)[]
)(,) ;
5) ж(а,0) = а;
6) ж(а,/3) при заданных а,/3 достигает максимума в классе функ-
функций, удовлетворяющих условиям 1)-5). Однако нетрудно видеть, что
эта функция х(а, /3) не имеет максимума при перечисленных требова-
требованиях, поэтому наложим на нее дополнительное условие, отбросив члены
высшего порядка в ее разложении в ряд Тейлора.
Разложим функцию ж(а,/3) в ряд Тейлора в окрестности точки
[0,0]:
х(а, /3) = ж@, 0) + ах'а@, 0) + /Зх'^О, 0) +
+ \ K<Q@,0) + 2а/Зх'^@,0) + /32х^@,0)} + О(а,C).
Пренебрегая членами со степенями а и /3 выше второй, что упро-
упрощает анализ, и учитывая условия 2) и 5), имеем
х(а, /3) = В{а + /3) + С(а2 + /З2) + Da/3,
где В, С', D — некоторые действительные константы. Для определения
значения последних из условия 4) получаем 2 В + 2G + D = 1, а из
условия 5) (при а = 1) получаем В + С = 1. Из двух последних
соотношений имеем С = 1 — В, D = — 1 и, следовательно, получаем
х(а, /3) = В {а + /3) - а/3 + A - В){а2 + /З2).
Можно показать (см. ниже лемму), что В ^ 1. Учитывая это,
нетрудно видеть, что максимум ж(а,/3) достигается при 5 = 1. Это
следует из того, что неравенство (а + /3) — а/3 ^ В (а + /3) — af3 +
+ A — В)(а2 + /З2) эквивалентно преобразуется в неравенство A —
— В)(а + /3) ^ A — В)(а2 +/32), которое при В ^ 1 выполняется в силу
условия 3).
214 Локальный подход к решению фундаментальных задач [Гл. 4
Таким образом, решение поставленной экстремальной задачи в пе-
перечисленных условиях единственно и дает выражение совпадающее
с формулой, примененной Шортлиффом.
В заключение докажем использованную выше лемму.
Лемма4.3. В ^ 1.
Доказательство. Запишем ж(а,/3) в следующей форме
ж(а,/3) = [(а - /ЗJ + а/3] + В[аA-а)+ /3A-/3)]. При фиксированных
а,/3 прямая х = х(В), очевидно, проходит так, что существует
значение В = ??+(су,/3), при котором она пересекает горизонтальную
прямую х = 1 на соответствующем графике.
Имеем
2
B <а'^=аA-а)+ /9A-/9)' афР'
Легко видеть, что В+(а,/3) ^ 1. Действительно, это утверждение
эквивалентно неравенству 1 — [(а — /ЗJ + а/3] ^ аA — а) + /3A — /3)
или (а + /3) — а/3 ^ 1, что выполняется, поскольку верно тождество
(а + /3) - af3 = 1 - A - а)A - /3).
Далее заметим, что для выполнения условия 3) необходимо, чтобы
при любых а, /3 выполнялось неравенство В ^ 5+(а,/3). Чтобы пока-
показать, что
достаточно убедиться, что Б+(а,/3) = 1. Таким образом, константа
Б, которая не должна превосходить значение В+(а,/3) при любых
а, /3, ограничена сверху значением этого предела, т. е. В $J 1, что
и требовалось доказать.
В заключение отметим, что аналогичным путем можно получить
формулу объединения любого конечного числа свидетельств (или ар-
аргументов по терминологии п. 4.3.1), но проще всего здесь потребовать,
чтобы операция объединения свидетельств была ассоциативной. Тогда
имеем при п ^ 2
( ) J2Yl + J2 (-l)n-1ai • • • an.
4.6.4. Взаимозависимость свидетельств. Вывод формулы Шорт-
лиффа для объединения двух свидетельств не является единственной
целью предлагаемого аксиоматического подхода. Другая наша зада-
задача — учет случаев зависимости и взаимозависимости свидетельств (или
аргументов).
Вернется еще раз к выражению для ж(а,/3). Ясно, что использо-
использованные при его выводе требования предыдущего раздела по смыслу
эквивалентны предположению о независимости свидетельств в поль-
пользу одной и той же гипотезы Н. Однако на практике свидетельства
(будучи вполне равноправными) часто оказываются зависимыми друг
от друга. Так, если указана степень г, в которой свидетельства ei,
4.6] Некоторые аспекты теории локально-организованных систем 215
и в2 взаимозависимы, причем 0 ^ г $J 1, то при г = 1 достаточно
наблюдения одного из свидетельств, причем все равно какого. Поэтому
при г = 1 из теории нечетких множеств (см. п. 4.6.2) следует, что
ж(а, /3) = max (а, /3).
Для вывода общей формулы объединения свидетельств при нали-
наличии взаимозависимости можно воспользоваться некоторыми резуль-
результатами предыдущего раздела. Действительно, при каждом фиксиро-
фиксированном г мы, по существу, имеем ту же самую экстремальную задачу,
которая теперь закончится получением выражения ж(а,/3) = [(а —
— /ЗJ + а/3] + В(г)[аA — а) + /3A — /3)], где коэффициент В теперь
явным образом зависит от г.
Поскольку, согласно доказанной лемме, выполняется В (г) ^ 1, то
теперь у нас есть основания для того, чтобы разложить В (г) ^ 1 в ряд
Тейлора: В (г) = Б@) + гВ'г@) + О (г).
В дополнение к шести условиям, перечисленным в предыдущем
разделе, мы имеем теперь еще такие два:
7) При г —> 1 имеем х(а, C) —> max (a, /3);
8) При г = 0 имеем В (г) = 1.
Не ограничивая общности, предположим пока, что а > C. Тогда,
оставляя два члена в указанном выше разложении, т. е. считая, В (г) =
= 1 + г В при г = 1 получаем а = [(а - /ЗJ + а/3] + A + В)[аA - а) +
+ /3A — /3)]. Отсюда можно найти В и получить следующее выражение:
ж(а, /3) = A — г)[а + /3 — а/3] + га, а > /3, или в общем виде
ж(а, /3) = A - г)[а + /3 - а/3] + г • тах(а, /3).
Рассмотренный нами путь получения формул комбинирования сви-
свидетельств может быть использован и в других ситуациях. Так, можно
было бы отказаться от требования симметричности функции ж(а,/3),
что приведет к более сложным выражениям. Иногда это оказывается
необходимым. Например, в работе [Khan and Jain, 1985] в одной экс-
экспертной системе предлагается учитывать второе свидетельство с боль-
большим весом, чтобы отразить особую важность вновь поступившего сви-
свидетельства.
Можно рассмотреть случай, когда влияние свидетельств друг на
друга носит несимметричный характер. Например, если свидетельство
в2, возникает исключительно под влиянием свидетельств ei, то, заме-
заменив условие 7 в этом случае на требование, чтобы при г —>• 1 выпол-
выполнялось ж(а,/3) = а, аналогично предыдущему, получаем следующую
формулу объединения свидетельств:
х(а, /3) = A - г)[а + /3 - а/3] + га.
Сравнивая ее с формулой, используемой Шортлиффом, можно за-
заключить, что при таком однонаправленном влиянии фактически про-
происходит замена степени доверия гипотезе Н, связанной со вторым
свидетельством, на величину /3 = /3A — г), что представляется нам
достаточно естественным.
216 Локальный подход к решению фундаментальных задач [Гл. 4
4.6.5. Принцип максимального доверия свидетельствам. Челове-
Человеко-машинная система обычно с доверием относится к свидетельствам
(т. е. к данным или знаниям), поступающим в систему извне. Однако
такие свидетельства могут вызывать и недоверие, если они прямо или
косвенно противоречат фактам, уже известным системе.
Так, например, в хороших экспертных системах вводимое инже-
инженером по знаниям правило сопоставляется с уже накопленными, и,
если не все в порядке, инженера просят как-то модифицировать это
правило. Если же новое правило не противоречит накопленным систе-
системой знаниям, то оно принимается за истинное (с тем коэффициентом
уверенности, который указан автором правила) и включается в «опор-
«опорную» совокупность правил. Таким образом, локально-организованная
система правил каждый раз анализируется в соответствии с рис. 1.3.
(Заметим, что в естественном интеллекте встречаются самые раз-
разнообразные реакции «системы» на свидетельства, так что смоделиро-
смоделированные нами в экспертных системах полное доверие им или полное
недоверие — всего лишь два полярно противоположных случая из всего
набора возможных реакций.)
Мы предлагаем придать этому явлению явную форму в виде следу-
следующего принципа «максимального доверия»:
Система искусственного интеллекта относится к поступаю-
поступающим свидетельствам с максимально возможным доверием, сов-
совместимым с уже имеющимися у нее знаниями.
Выше было показано, что этот естественный для локально-органи-
локально-организованной искусственной системы принцип является конструктивным,
напоминая в этом отношении принцип «максимальной энтропии», при-
применяемый в физике, теории связи и т. п.
Дело в том, что такие принципы, уверенность в которых вытекает
из общетеоретических соображений, дают возможность доопределить
исследуемую систему до степени, позволяющей применить к ее анализу
развитый математический аппарат.
Чтобы не быть голословным, остановимся на нескольких примерах
использования принципа максимальной энтропии [Стефанюк, 1966].
А. При анализе вопросов передачи одномерного сигнала по каналу
с шумами необходимо знать плотность вероятности ps(z) того, что на
выходе канала будет наблюдаться значение z при том условии, что на
его вход был подан сигнал s.
Можно показать [Стефанюк, 1966], что ps(z) удается найти как
решение следующей экстремальной задачи:
Пусть Ё(Л)(г,?) — оператор напряженности электрического поля
в точке (г,?), создаваемой осциллятором Л, ШЛ) — оператор энергии
последнего, а р^Л^ — оператор плотности.
4.6] Некоторые аспекты теории локально-организованных систем 217
Найти ps{z), обеспечивающую максимум энтропии
W = - J p8(z) logps{z)dz
— оо
при условиях
+ оо
1. ps(z) dz = 1 (нормировка);
— оо
+ ОО
2. zp8(z) dz = s (аддитивность средних значений);
— оо
+ ОО
3. z2ps(z) dz = s2 + а2 (аддитивность энергий).
— оо
Решением такой задачи, как и следует ожидать, является
1 (z - sJ
e*P- „ 2
Б. При анализе передачи информации по квантовому каналу с ад-
аддитивным тепловым шумом соответствующая экстремальная задача
несколько усложняется, поскольку квантовая совокупность сигнала
и шума характеризуется матрицей плотности frx\ где Л — номер
осциллятора соответствующего квантовомеханического поля.
Пусть Е(Л)(г,?) — оператор напряженности электрического поля
в точке (г,?), создаваемой осциллятором Л, ШЛ) — оператор энергии
последнего, а /5^Л) — оператор плотности. Требуется найти оператор
\ обеспечивающий максимум энтропии
W = -k Sp p<A) In p<A)
при условиях
1. Spp<A> = 1;
2. E
Здесь Ё(Л)(г,?) — среднее значение напряженности поля сигнала,
-(А) 1
Пс — среднее значение числа фотон
значение числа фотонов шума, причем
(,) р р
-(А) 1 -(Л)
П — среднее значение числа фотонов в сигнале, Пш — среднее
кТ
Можно показать [Стефанюк, 1966], что решением такой задачи
является матрица плотности р^х^, которая в ^-представлении имеет вид
Рк = 1 +- \1 + п ) 1
218 Локальный подход к решению фундаментальных задач [Гл. 4
и найти унитарное преобразование U8t, связывающее энергетическое
представление с /^-представлением, которое мы здесь не приводим из-
за его громоздкости.
(Опираясь на эти величины удается найти важную формулу для
минимально возможной вероятности ошибки при передаче по кванто-
вомеханическому каналу связи бинарного сигнала, включающую как
классические, так и квантовые эффекты [Стефанюк, 1966]:
Пш
где Ф — интеграл вероятности.)
Таким образом, налицо несомненная параллель в применениях
принципа максимальной энтропии и принципа максимального доверия.
Но если первый из них наиболее полезен в задачах физической приро-
природы, то принцип максимального доверия особенно привлекателен для
систем искусственного интеллекта, переводя их из плоскости чистой
эмпирики в область строгих научных методов.
4.7. Выводы по главе 4
1. Материал главы показывает, что локальная организация — ти-
типичный подход к основным проблемам, возникающим в области искус-
искусственного интеллекта, среди которых:
— представление задач;
— представление знаний;
— формирование знаний и обучение;
— организация экспертных систем;
— объединение свидетельств (или аргументов) в экспертных систе-
системах.
2. Показано, что локальный подход позволяет с успехом строить
подходящее представление в некотором классе комбинаторных задач
(задачи покрытия множеств).
В целом ряде случаев «озарение» удается заменить на систематиче-
систематическую процедуру уменьшения числа используемых имен и их адекват-
адекватного приписывания элементам задачи, реализуя две стороны принципа
семиотической интроспекции «подобное — отождествить, различие —
подчеркнуть».
3. Имеется большое число родственных задач, например гексаго-
гексагональные массивы, тримино вместо косточек домино, наконец, трехмер-
трехмерные проблемы, в которых интуиция помогает достаточно мало и где
предложенный принцип семиотической интроспекции оказывается до-
достаточно полезным.
4.7] Выводы по главе 4 219
Имеются и примеры использования принципа семиотической интро-
интроспекции для действительно полезных задач, например: покрытие пола
татами (задача замощения), изоритмическое управление в сети пакет-
пакетной передачи информации, децентрализованное управление потоком
такси в городе.
Использование принципа семиотической интроспекции является до-
достаточно очевидным. В то же время доказательство положительных
свойств полученного представления может оказаться весьма сложной,
с математической точки зрения, задачей.
4. Показано, что эволюционное конструирование представляет со-
собой мощный механизм построения сложных систем, работающий в при-
природе и в инженерной практике человека. Эволюционное конструирова-
конструирование позволяет объяснить парадокс, связанный с тем, каким образом
происходит открытие сложных устройств, для создания которых тре-
требуется большой запас твердо установленных знаний. Основная идея —
использование дополнительных соображений (или аргументов) при по-
последовательном усовершенствовании конструкции, исходя из условий
практического её использования.
Существенная разница между знаниями и аргументами продемон-
продемонстрирована также и на теоретических схемах. Грубо говоря, знания
перемножаются, а аргументы — складываются. Показан оригинальный
аксиоматический подход, который позволяет систематическим образом
строить процедуру суммирования надежностей аргументов в искус-
искусственных интеллектуальных системах.
5. В экспериментах на компьютере показано, что в локально-орга-
локально-организованной системе с использованием моделей памяти, обсуждаемых
в гл. 2, естественно возникают фреймо-подобные представления как
средство ускорения выборки информации.
6. С применением теории категорий построена достаточно общая
теория представления знаний и обучения в системах искусственного
интеллекта, охватывающая широкий спектр систем, организованных
на локальных принципах.
6. Высказан принцип максимального доверия свидетельствам, поз-
позволяющий на регулярной основе получать выражения для объединения
свидетельств в локально-организованной экспертной системе. Показана
определенная параллель в использовании этого принципа и принципа
максимальной энтропии.
7. Таким образом, с использованием принципов создания локально-
организованных систем сформулирован и исследован ряд новых при-
прикладных задач и решен ряд новых теоретических проблем.
Глава 5
ИСПОЛЬЗОВАНИЕ ЛОКАЛЬНОЙ ОРГАНИЗАЦИИ
ПРИ РАЗРАБОТКЕ ПРИКЛАДНЫХ
ПРОГРАММНЫХ И ЧЕЛОВЕКО-МАШИННЫХ
СИСТЕМ
На протяжении всей книги, изучая принципы локальной организа-
организации, мы старались, чтобы приводимые примеры и модели отражали
те или иные проблемы, присущие техническим системам, как суще-
существующим, так и гипотетическим. В настоящую главу вынесены те
случаи, когда с использованием локальных подходов удалось построить
замкнутые, целостные системы. При «внедрении», разумеется, дело не
сводится только к той теме, которой посвящена данная книга: прихо-
приходится привлекать и множество других соображений, характеризующих
реальную ситуацию. Эти вторичные по отношению к основной теме
книги соображения могут быть найдены в публикациях автора и будут
упомянуты здесь лишь кратко.
Задача данной главы — убедиться, что локальная организация поз-
позволяет расширить класс практически полезных систем за пределы того
класса систем, которые удается создать, ограничиваясь централизован-
централизованными или децентрализованными схемами.
В области программирования на ЭВМ естественно выделяются
различные способы организации программ и процесса их составления,
отличающиеся степенью централизации. Можно сказать, что в исто-
историческом плане программирование развивалось от централизованных
методов к методам децентрализованным и, наконец, локальным, что
происходило по мере роста сложности составляемой программы, все
большей «логической нагрузкой» программы и, как результат, посте-
постепенной потерей контроля программиста над свойствами создаваемой
программы.
Централизованные методы были характерны, прежде всего, для
первых этапов освоения ЭВМ, когда программирование относительно
несложных вычислительных задач велось на уровне машинных кодов,
а в дальнейшем — с применением ассемблера, языков типа Алгол
и Фортран.
Идеи структурного программирования [Dijkstra, 1970] были вызва-
вызваны повышением сложности программы, необходимостью работы над ее
созданием целого коллектива авторов, высокими требованиями к на-
надежности программы и т. п. Структурное программирование, дающее
определенные рекомендации по разбиению программы на отдельные
блоки, вполне естественно отнести к методам децентрализации.
Использование локальной организации 221
Ярким примером языка, допускающего реализацию программы на
локальных принципах, является язык Лисп в его наиболее распростра-
распространенном интерпретируемом варианте [Weissman, 1967; Лавров и Сила-
гадзе, 1978]. В этом языке *) программа состоит из отдельных модулей,
причем каждый такой модуль пишется и отлаживается в интерактив-
интерактивном (или диалоговом) режиме совершенно независимо от других, что
соответствует этапу III анализа подсистем рис. 1.3., так как отладка
алгоритма ведется в стационарных условиях.
Отлаженные модули в ходе работы «вызывают» друг друга, т. е.
вступают во взаимодействие. Сразу отметим, что обычно программа на
языке Лисп характеризуется интенсивным взаимодействием ее блоков,
чем ситуация существенно отличается от использования подпрограмм
в более традиционных языках программирования, где обычно обраще-
обращение к подпрограммам идет в иерархическом порядке, т. е. взаимодей-
взаимодействие в смысле раздела 3.1 отсутствует.
Локальные методы в программировании имеют свою специфику,
поэтому методы анализа, развитые в гл. 2-4, требуют некоторого по-
пополнения. К числу особенностей следует отнести детерминированный
характер отдельных подсистем Si и последовательный характер их вза-
взаимодействия. Последний обусловлен фон-Неймановской организацией
компьютера. (Заметим, что использование других методов организации
вычислений, а именно систем с однородной перестраиваемой структу-
структурой [Прангишвили, 1987], сетевых [Hillis, 1985], параллельных [Хинтон,
1987] и им подобных, в еще большей степени связано с децентрализо-
децентрализованными и локальными методами программирования).
Практика программирования на языке Лисп все в большей степени
приводила к идее локальной организации программ. Так программисты
постепенно перестали пользоваться прямой (или косвенной) адресацией
к данным, хранящимся в компьютере, предпочитая поиск по образцу.
Для программиста вообще перестало играть роль, в каком физическом
разделе памяти хранятся данные и структуры. Широкое применение
получили «демоны» — структуры, которые срабатывают в программе
при возникновении определенных условий [Уинстон, 1980].
То же можно сказать и об организации современных экспертных си-
систем [Хейес-Рот, Уотерман, Ленат, 1987; Форсайт, 1984; Алексеева и др.,
1984; Алексеева и Стефанюк, 1984; Микулич, 1985; Стефанюк, 19876;
1987г; 1988а]: правила, обуславливающие работу экспертной системы,
вносятся в нее независимо друг от друга, и лишь в ходе их взаимодей-
взаимодействия на этапе функционирования системы выясняется их коллектив-
коллективное свойство. (Аналогичная картина наблюдается и при использовании
семантических сетей, классной доски и т. д. По-видимому, иначе дело
обстоит в случае глубоких экспертных систем [Майклсен и др., 1987],
) После появления языка Лисп 1.5 [Weissman, 1967] и многих его модифи-
модификаций, вплоть до последней его версии — Common Lisp [Steele, 1984], было
создано целое множество языков с аналогичными свойствами.
222 Использование локальной организации [Гл.5
которые должны будут строиться на нелокальных принципах, а точнее,
не только на локальных принципах.)
Состав этой главы следующий.
В разд. 5.1 рассматривается несколько реализованных программ-
программных систем, в которых изучается и используется локальный подход:
взаимодействие подпрограмм с учетом возникающих побочных эф-
эффектов, вычисление несимвольных функций в символьных и других
языках программирования, допускающих рекурсию, комментирующая
система программирования, облегчающая работу программиста.
В разделах 5.2 и 5.3 описывается концепция интеллектуальной опе-
операционной системы на локальных принципах [Стефанюк, 1982; Сте-
фанюк и Алексеева, 1986] и приводится реализованная модель такой
системы — интерактивная система FLEX программирования на языке
Лисп, обеспечивающая программиста дополнительным сервисом.
В разд. 5.4 описаны различные аспекты реализованной и внедрен-
внедренной системы PROMPTER поддержки ввода информации в компьютер.
При создании этой системы были использованы некоторые принципы
обучения путем «минимального» обобщения [Жожикашвили и Стефа-
Стефанюк, 1986а; 19866], описанные в книге ранее.
В разд. 5.5 рассматривается вопрос использования знаний экспер-
экспертов при решении одной из важнейших современных задач — задачи
автоматического восстановления последовательности оснований ДНК
по результатам хроматографического анализа [Stefanuk, 2000b; 2000c;
Стефанюк, 2000ж].
Наконец, в разд. 5.6 для борьбы с вирусами и спамом, поступающи-
поступающими по всемирной компьютерной сети (WWW) предлагается использо-
использовать активный фильтр. В отличие от привычного пассивного фильтра,
обычно поставляемого в составе почтового пакета, активный фильтр
предполагает проведение встречных, предупредительных действий, на-
направленных на выяснение истинного характера полученного письма
при отсутствии у пользователя соответствующей априорной информа-
информации. Предложенный нами ранее активный фильтр [Стефанюк, 2000д]
уже доказал свою работоспособность в режиме защиты компьютера от
поступления вирусов.
5.1. Локальный подход в программировании
В данном разделе рассматриваются задачи использования локаль-
локального подхода, возникающие в программировании. В п. 5.1.1 решена
важная задача сведения рекурсивных кодов к итеративным с уче-
учетом дополнительного взаимодействия функций языка Лисп, вызванно-
вызванного наличием побочных эффектов. Описанная здесь система является
обобщением и развитием системы Т. Риша [Rish, 1973], названной им
REMREC, на случай побочных эффектов.
В п. 5.1.2 показано, что, благодаря локальности организации
программы, можно в интерактивном режиме рекурсивно вычислять
«арифметические» функции такие, как sin, log и т. д. Предлагаемый
нами прием отличается от привычного обращения к подпрограмме
5.1] Локальный подход в программировании 223
из основной программы и дает ряд преимуществ методологического
и вычислительного характера.
В этих разделах в качестве параметра, дающего глобальную оценку
локально-организованной системы (гл. 1), выступает сходимость вы-
вычислений, в частности, отсутствие циклов и т. п. (Заметим, что для
экспертных систем, построенных на локальных принципах, создаются
специальные программы обнаружения циклов.)
В п. 5.1.3 результаты предыдущего пункта переносятся на случай
алголо-подобных и фортрано-подобных языков программирования.
В п. 5.1.4 содержится краткое описание системы ЭКЛИСП, разра-
разработанной автором книги для компьютера Эклипс в ИППИ АН СССР.
Эта система в течение ряда лет была единственной доступной нам на
регулярной основе системой Лисп, и на ней были реализованы програм-
программы, упомянутые в разд. 4.4. (Позднее некоторые усовершенствования
в нее были добавлены Е. Ф. Алексеевой и А. В. Жожикашвили.)
В разд. 5.2 описаны принципы организации интеллектуальной опе-
операционной системы, которые были сформулированы нами в [Стефа-
нюк, 1982]. Описанная в следующем разд. 5.3 система гибкого обслужи-
обслуживания программиста на языке Лисп была первоначально задумана как
модель интеллектуальной операционной системы, создаваемой на ло-
локальных принципах. Но она представляет и самостоятельный интерес.
Программирование этой системы выполнено, в основном, Е. Ф. Алексе-
Алексеевой, которой принадлежат также выбор ряда конкретных элементов
реализации системы. Однако общая структура системы FLEX и ее
модификаций принадлежит автору книги.
В разд. 5.4 описана система, которая основана на результатах,
полученных в гл. 4. (разд. 4.3). Эта работа на всех этапах велась
совместно с А. В. Жожикашвили, но ответственность за постановку
задачи и конкретный метод организации диалога с пользователем несет
автор книги.
Основной материал этой главы опубликован в работах [Стефанюк,
1982; 1981а; 19816; 1979; 1987а; Stefanuk, 1976; 1979; Жожикашвили и
Стефанюк, 1988а; Алексеева и др., 1984; Алексеева и Стефанюк, 1984;
Стефанюк и Алексеева, 1986; 1987].
Если в гл. 2. книги подсистемами Si системы S являются довольно
простые конечные и стохастические автоматы, в гл. 3 — непрерывные
автоматические устройства, то в разд. 5.1 подсистемы представляют
собой рекурсивные программы произвольной сложности, в качестве
которых, в частном случае, могут выступать автоматные структуры,
изученные в гл. 2. С этой главой разд. 5.1 сближает также использо-
использование графовых представлений, которые здесь, однако, характеризуют
не отдельные подсистемы, а их взаимодействие.
Приведенные здесь постановки задачи и полученные результаты
принадлежат автору и высказаны на языке программ. Новым явля-
является подход к программе, как локально-организованной системе, одна-
однако авторы [Back and Mannila, 1984] несколько позже, и по-видимому
независимо, пришли к подобной точке зрения на программы, имеющие
модульную структуру.
224 Использование локальной организации [Гл.5
5.1.1. Проблема взаимодействия подпрограмм в локально-органи-
локально-организованной программе. Вводимое в подп. 5.1.1.1 каноническое представ-
представление направленного графа, типа графа, рассмотренного в гл. 3 для
систем из невзаимодействующих компонент, оказывается полезным для
упрощения процедуры перебора (поиска).
Это представление используется в задаче оптимизации порядка оце-
оценивания аргументов рекурсивного кода, возникающей в свете снятия
рекурсии. В подп. 5.1.1.2 описана программа, минимизирующая число
промежуточных состояний. В подпунктах 5.1.1.3, 5.1.1.4 показана орга-
организация всей программной системы при наличии побочных эффектов,
которые достаточно строго определены в приложении П.4.1. В П.4.2
описаны принципы, положенные в основу программы. В П.4.3 описана
реализованная автором на языке BBNLISP программа, а в подп. 5.1.1.5
приведены примеры ее работы.
5.1.1.1. Каноническое представление направленного графа. Пусть
Г — направленный граф без петель. Для ряда приложений оказываются
полезными следующие два представления такого графа. Представление
TD («сверху-вниз») [Stefanuk, 1979] является перечнем списков элемен-
элементов и строится в ходе следующего процесса, применяемого к Г и обо-
обозначаемого нами символом canon (Г), который аналогичен процессу,
использованному ранее в гл. 3 для выявления структуры коллектива
без взаимодействия.
Пусть sf — множество всех «неподчиненных» вершин Г, на которые
не указывают никакие стрелки. Если такое sf — пусто, то пусть sf
будет множеством всех «неподчиненных» пар вершин Г и т. д. (Группа
вершин называется неподчиненной, если отсутствуют стрелки, идущие
к этой группе от остальной части графа .)
Для непустого подмножества s' графа Г обозначим через Г' мно-
множество оставшихся вершин графа, из стрелок которого удалены все
стрелки, ведущие к sf. Тогда в обозначениях языка Лисп имеем оче-
очевидное рекурсивное отношение
canon (Г) = append (sr canon (Г));
append (LI L2) выдает список, составленный из последовательно взя-
взятых элементов списков L1 и L2. TD-представление для графа, показан-
показанного на рис. 5.1., имеет такой вид:
По аналогии можно построить BU-представление («снизу-вверх»),
если в sf отнести вершины или их группы, которые «не воздействуют»
на остальную часть графа. Такое представление для графа на рис. 5.1
выглядит следующим образом:
Представление TD интересно потому, что оно позволяет последова-
последовательно выделять наименее зависимые части системы, работать с ними,
5.1] Локальный подход в программировании 225
а затем переходить к остальной части системы.
В работе [Стефанюк, 1973а] (см. гл. 3) фактиче-
фактически оно было использовано для доказательства
теоремы об устойчивости локального управле-
управления в коллективе без взаимодействия.
Представление BU имеет особый интерес
для рассматриваемой ниже проблемы оптими-
оптимизации порядка оценивания функций в языке Е •
Лисп с учетом возможных побочных эффектов.
Перечислим некоторые свойства приведен- ((E)(B))((A))((CD))
ных представлений:
1. Для заданного графа Г представление TD рИс. 5.1. Простой граф
и представление BU единственны с точностью и его представление
до порядка элементов в выделенных группах «сверху-вниз»
и подгруппах.
2. TD(F) совпадает с BU(T+), где Г+ — обратный по отношению к Г
граф (множества вершин и стрелок в Г и Г+ совпадают, но направление
всех стрелок — противоположное).
3. Если Г — ациклический граф, то TD(F) представляет собой
список, который является «обратным» по отношению к BU(F).
4. Каждая подгруппа sf имеет хотя бы один простой цикл порядка
/и, где к — число элементов в этой подгруппе.
Свойство 2 показывает, что алгоритмы построения BU и TD по
существу идентичны.
Свойство 4 наводит на мысль о более «подробном» алгоритме сорти-
сортировки вершин Г, когда, при отсутствии неподчиненных вершин, ищутся
вершины, на которые указывает не более одной стрелки и т. п.
Приведем взятую из работы [Stefanuk, 1979] программу на диалекте
INTERLISP языка Лисп [Teitelman, 1971], позволяющую построить
такое более подробное TD-представление, которое мы обозначим TD*.
(CANONC
[LAMBDA (G V)
(COND
((NULL G) NIL)
(T (CONS (SETQ V (CANONB G 0))
(CANONC (REMOVE V G])
(CANONB
[LAMBDA (G S)
(COND
((NULL G) NIL)
((CANONA G G S))
(T (CANONA G G (ADD1 S])
(CANONA
[LAMBDA (G U S)
(COND
((NULL G) NIL)
8 Стефанюк
226 Использование локальной организации [Гл.5
((EQ S (TEST (LIST (CAR G))
(REMOVE (CAR G) U))) (CAR G))
(T (CANONA (CDR G) US])
На рис. 5.2 показан пример более сложного направленного графа
и соответствующие ему представления TD, BU, TD*, BU*. Ниже, од-
однако, нам потребуется лишь алгоритм для создания представления,
которое позволит работать по очереди над подгруппами элементов,
будучи уверенным, что это не скажется на остальной части элементов
графа. Внутри же группы мы будем прибегать к полному перебору,
считая, что на практике число элементов в группе будет небольшим.
Bu* :
Рис. 5.2. Пример более сложного графа и некоторые его представления
5.1.1.2. Замена переменных в рекурсивных кодах. Предположим,
что нам задан список функций вида
L: F1(X1,... ,XN) F2(X1,... ,XN)... FN(X1,... ,XN)
и соответствующий список «новых переменных» (XI Х2 ... XN) такой,
что переменной XI должно быть присвоено значение Fl, X2 — значение
F2 и т. д.
В общем случае при вычислении этих функций (предполагая, на-
например, что функции из L оцениваются в порядке слева направо) они
будут интерферировать друг с другом в том смысле, что уже оцененные
значения и присвоенные некоторым переменным могут повлиять на
значение других функций. Чтобы избежать недоразумений, необхо-
необходимо ввести какое-то число временных промежуточных переменных
и некоторое дополнительное число операций присваивания типа SETQ.
Задача состоит в том, чтобы найти оптимальный порядок оценива-
оценивания L с тем, чтобы минимизировать число дополнительных перемен-
5.1] Локальный подход в программировании 227
В дальнейшем через Fl, F2,. . . мы будем обозначать произвольные
функциональные формы, в частности функции, имеющие некоторое
число Л-переменных.
Такая проблема оптимизации наиболее отчетливо возникает при ре-
решении вопроса снятия рекурсии, т. е. перехода от рекурсии к итерации.
Рассмотрим следующий довольно искусственный пример:
(F00
[LAMBDA (X Y Z)
(COND
((NULL(AND X Y Z)) NIL)
(T (CONS(qUOTE *)
(F00(CDR X)
(CONS(CAR X)(CDR У))
(CONS(CAR X)
(CONS(CAR Y)(CDR Z]),
где
Fl — это (CDR X),
F2 —это (CONS (CAR X)(CDR Y)),
F3 — это (CONS(CAR X)(CONS(CAR Y)(CDR Z))).
Пытаясь оценить FOO итеративно, мы увидим, что было бы нера-
неразумно оценивать аргументы при обращении к FOO в их естественном
порядке, т. е. в порядке Fl, F2, F3, поскольку, чтобы не помешать
верной оценке F3, придется ввести две временные (промежуточные)
переменные. Правильно было бы оценивать переменные в порядке F3,
F2, F1, когда необходимость в промежуточных переменных не возни-
возникает.
Такого рода оптимизация предусмотрена в программе REMREC
[Rish, 1973], по крайней мере для тех семи типов рекурсии, на снятие
которых она рассчитана, при условии, однако, что сами Fl, F2, ... не
создают дополнительных побочных эффектов. (Такими же свойствами
характеризуются и другие системы устранения рекурсии, предшество-
предшествовавшие программе REMREC.)
Наш план состоит в том, чтобы перед программой «снятия рекурсии
«запустить» программу оптимизации (назовем ее REMMEM), которая
позволила бы системе учесть некоторые дополнительные связи между
оцениваемыми функциями, в частности, возникающие побочные эф-
эффекты.
5.1.1.3. Организация программы. Программа REMMEM обеспечи-
обеспечивает следующее. Для заданного порядка оценивания форм она должна
быть в состоянии построить оценку необходимого числа временных
(промежуточных) переменных; на основании ее найти оптимальный
порядок оценивания и при необходимости реорганизовать код соответ-
соответствующим этому образом. Ниже мы дадим краткое описание функций,
обеспечивающих работу (они первоначально были написаны на языке
Interlisp [Teitelman, 1974] на компьютере PDP-10, а затем перенесены
228 Использование локальной организации [Гл.5
на диалект BBNLISP на компьютере DEC-20, установленном в Линче-
пингском университете, Швеция.
Функция exprisl (Fl, F2, . . ., FN) возвращает список, CAR которого
есть оптимальная оценка, a CDR — соответствующий оптимальный
порядок оценивания форм. Например, для совокупности функций (F1
X) (F2 X Y) (F3 X Y Z) и списка новых переменных (X Y Z) указанная
функция строит список (О (F3 F2 F1)). (Здесь предполагается, что
побочные эффекты отсутствуют.)
Функция semprog (Fl, F2, . . ., FN) дает так называемую семантиче-
семантическую программу оценивания; в нашем примере результатом ее работы
будет последовательность кодов
((SAVE Fl X)(SAVE F2 Y) F3 (RETURN X Fl X)(RETURN X F2 X))
Последняя, в рамках программы REMMEM, преобразуется в
((SETQ T_l (F1 X))
(SETQ T_2 (F2 X))
(SETQ Z F3)
(setq x t_i)
(SETQ Y Т_2)).
5.1.1.4. Учет побочных эффектов. Насколько нам известно по ли-
литературе [Rish, 1973] прежде не предпринимались попытки включить
знания о побочных эффектах в процесс оптимизации порядка оцени-
оценивания. (Под влиянием наших исследований Я. Урми, Линчепингский
университет, Швеция, предложил отдать учету побочных эффектов
приоритетную роль уже на уровне интерпретатора.) С другой стороны,
мы не нашли подходящей классификации побочных эффектов в систе-
системах Лисп. Поэтому в Приложениях (см. П.4.) мы обсудим ряд приме-
примеров, позволяющих прийти к строгому определению понятий побочных
эффектов и относительных побочных эффектов.
В приложении П.4.2 описаны предложенные принципы действий
пакетов снятия рекурсии при учете побочных эффектов и некоторые
подробности их реализации (прил. П.4.3).
5.1.1.5. Примеры реальной работы программ. Приведем результа-
результаты некоторых экспериментов на симулированной системе Interlisp для
PDP-10 (эта Лисп-система была создана П. Эмануэлссоном, Швеция).
(EXPRIS '(Fl F2 F3 F4)) -> B (F3 F4 F2 F1))
Процессорное время: 21,52 с.
(CANON '(Fl F2 F3 F4)) ->> B (F3 F2 F1))((F4))
Процессорное время: 10,52 с.
(CANON '(Fl F2 F3 F4 F5 F6 F7)) ->>
((F5))((F6))((F7))B(F3F2F1))((F4))
Процессорное время: 18,24 с.
Однако, если для сравнения запустить EXPRIS без функции CANON,
5-11
Локальный подход в программировании
229
то
(EXPRIS '(Fl F2 F3 F4 F5)) -> B (F5 F3 F4 F2 F1))
Процессорное время 3 м. 54 с!
Выше предполагается, что формы имеют побочные эффекты, пока-
показанные в табл. 5.1.
Таблица 5.1.
Тестовый пример
Форма
F1
F2
F3
F4
F5
F6
F7
Новая
переменная
X
Y
Z
и
NIL
NIL
NIL
Ламбда-
переменная
(X)
(XY)
(XYZ)
NIL
NIL
NIL
NIL
Побочный
эффект
(XY)
(Z)
(U)
NIL
NIL
NIL
NIL
Здесь последовательно показаны: результат работы функции
CANON, оптимальная цена и оптимальный порядок оценивания,
а затем итеративная программа, вводящая необходимое число
промежуточных ячеек.
Приведенные примеры ясно показывают полезность создания BU-
представления перед процедурой перебора, если граф побочных эф-
эффектов достаточно хорошо структурирован.
Далее мы приводим реальные распечатки системы DIMANP, ра-
работающей в режиме запросов. Вначале система запрашивает поль-
пользователя относительно характера форм, а затем о структуре списка
PSEPLIST, описывающего характер побочных эффектов. (Программа
PROMPT была написана с демонстрационной целью, позволяя про-
просмотреть разные варианты оформления списка PSEFLIST.)
(PROMPT '(Fl F2 F3 F4]
Type the list of new variables for the forms in (Fl F2 F3 F4),
please (X Y Z T)
Type the list of LAMBDA variables of the form Fl, please: (Z)
Type the list of LAMBDA variables of the form F2, please: (X Y)
Type the list of LAMBDA variables of the form F3, please: (X Y Z)
Type the list of LAMBDA variables of the form F4, please: (X У Z T)
Type PSEPLIST or NIL: NIL
((F4)(F3)(F2)(F1))
(F4)
(SETQ T F4))
(F3)
(SETQ Z F3))
(F2)
230 Использование локальной организации [Гл.5
(SETQ Y F2))
(F1)
(SETQ X F1))
NIL
Type PSEPLIST or NIL: ((Fl F2) (F3 F4))
((F3 F4) (Fl F2))
A F3 F4)
((SETQ A0001 F3) (SETQ T F4) (SETQ Z A0001))
A Fl F2)
((SETQ A0001 Fl) (SETQ Y F2) (SETQ X AOOO1))
NIL
Type PSEFLIST or NIL: ((Fl F2 Y) (F3 F4))
((F3 F4) (Fl F2))
A F3 F4)
((SETQ A0001 F3) (SETQ T F4) (SETQ Z AOOO1))
A Fl F2)
((SETQ A0001 Fl) (SETQ Y F2) (SETQ X AOOO1))
NIL
Type PSEFLIST or NIL: ((Fl F2) (F3 F4 T))
((F3 F4) (Fl F2))
A F3 F4)
((SETQ A0001 F3) (SETQ T F4) (SETQ Z AOOO1))
A Fl F2)
((SETQ A0001 Fl) (SETQ Y F2) (SETQ X AOOO1))
NIL
Type PSEFLIST or NIL: ((Fl F2 Y) (Fl F3 Z))
((F4) (Fl F2 F3))
(F4)
(SETQ T F4)
B Fl F2 F3)
((SETQ AOOO1 Fl) (SETQ A0002 Y) (SETQ Y F2) (SETQ Z F3)
(SETQ X AOOOD)
NIL
Type PSEPLIST or NIL: ((Fl F2 Y) (Fl F3 Z) (Fl F4 T))
((Fl F2 F3 F4))
C Fl F2 F3 F4)
((SETQ AOOO1 Fl) (SETQ A0002 Z) (SETQ A0003 Y) (SETQ Y F2)
(SETQ Z F3) (SETQ T F4) (SETQ X AOOO1))
NIL
5.1.2. Рекурсивное взаимодействие при вычислении арифметиче-
арифметических функций. Здесь приводятся соображения в пользу «явного» вы-
вычисления элементарных функций в системах Лисп. Даются примеры
простых рекурсивных кодов для вычисления sin, exp и In, иллюстри-
иллюстрирующие общий подход.
5.1.2.1. Традиционные методы вычислений в языке Лисп. Язык
Лисп и его различные диалекты заняли прочное место при решении
задач, прежде всего, неарифметической природы [IJCAI-1979]. Этот
язык программирования становится все более популярным в нашей
стране, благодаря появлению, в свое время, его реализации на ЕС
ЭВМ [Семенова, 1977] и других вычислительных машинах (например,
[Nordstrom and Sandewall, 1970]) в дополнение к известной реализации
5.1] Локальный подход в программировании 231
Лисп 1.5 для БЭСМ-6 [Лавров и Силагадзе, 1978]. В последние годы
появилось также несколько новых реализаций, работающих под кон-
контролем операционной системы Windows.
Наша цель состоит в том, чтобы указать на один распространен-
распространенный недостаток методологического плана, связанный с использованием
систем Лисп, и дать элементарный рецепт для его устранения. Дело
в том, что, хотя в любой реализации языка Лисп предусматривается
известный набор арифметических операций и «библиотечных» функ-
функций типа SIN, SQR и т. п., широко распространено представление, что
Лисп не предназначен для арифметики. Например, в описании одной
из наиболее развитых реализаций [Teitelman, 1974], предшествовавших
Common Lisp, прямо отмечено, что программы для вычисления элемен-
элементарных функций включены в систему, лишь чтобы не ограничивать ее
общности. В этой реализации такие программы оказались скрытыми от
пользователя, поскольку в их основу положены взятые без изменения
стандартные программы на Фортране.
Пока эти функции были фактически не нужны, такой подход ка-
казался целесообразным, хотя он и в самом начале привел к ненужному
усложнению описания системы ИНТЕРЛИСП.
Ситуация в настоящее время значительно изменилась в связи
с появлением высокоэффективных систем Лисп, в частности Лисп-
машин [IJCAI-1979] и современных реализаций Common Lisp и в связи
с тем, что для значительного контингента пользователей Лисп является
основным языком программирования (см. [Уинстон, 1980]). Благодаря
этим обстоятельствам, на языке Лисп стал решаться более широкий
круг задач, включая, например, задачи управления робототехниче-
скими системами. Здесь можно указать на успешное моделирование
на Лисп-машине Массачусетского технологического института (США)
механического робота с учетом конкретной физики происходящих про-
процессов: инерции, трения, изгиба металлических компонент и т. д. х)
Сложившийся способ введения и использования элементарных
функций неприемлем потому, что: 1) программы оказываются
машинно-зависимыми; 2) погрешность вычислений фиксирована
раз и навсегда; 3) неясно, как при необходимости пополнять запас
библиотечных функций.
В следующем разделе показано, что совсем нетрудно, а часто
и очень естественно, писать программы для вычисления «арифмети-
«арифметических» функций непосредственно на языке Лисп. При этом такие
параметры, как быстродействие и погрешность, могут контролировать-
контролироваться непосредственно. (Заметим, что описываемый ниже прием выгодно
отличается от приема, использованного в учебнике [Weissman, 1967]
при написании на языке Лисп программ вычисления SIN с помощью
сходящегося ряда с заранее оцененными коэффициентами, своей на-
наглядностью и большей универсальностью.)
х) Сообщение проф. Э. Фредкина (США).
232 Использование локальной организации [Гл.5
5.1.2.2. Использование простых функциональных соотношений.
Задачей данного раздела, ориентированного на пользователя систе-
системой Лисп, является демонстрация примеров рекурсивного вычисления
элементарных математических функций на языке Лисп, при котором
основную роль играют не сходящиеся ряды, а используемые для рекур-
рекурсии функциональные соотношения. При этом применение эффективно
организованных Лисп-машин, систем снятия рекурсии [Rish, 1973; Ste-
fanuk, 1979] (см. также весь предыдущий раздел 5.1) и компилятора поз-
позволяет рассчитывать на достаточно высокое быстродействие и малый
занимаемый объем в памяти. Такая рекурсивная форма вычисления
является естественной для пользователя, позволяя применять обыч-
обычные интерактивные отладочные средства для контроля погрешности
и скорости сходимости в рамках не арифметических, а символьных
представлений, типичных для языка Лисп.
Пример 1: Вычисление sin ж, 0 ^ х $J тг/2, можно произвести по
следующей программе
(SIN
[LAMBDA (X)
(COND
((LESSP X DELTA) X)
(T (RAT(SIN(FqUOIIENT X 3.]),
где
(RAT
[LAMBDA (X)
(FDIFFERENCE (FTIMES 3. X)
(FTIMES 4. XXX]).
Для организации рекурсии здесь использовано соотношение
sin Зж = 3 sin х — 4 sin3 x
и то, что при х —} 0 выполняется sin x ~ х.
Поскольку достигаемая точность лишь отчасти определяется усло-
условием остановки рекурсии (LESSP X DELTA) и соответствующей асимп-
асимптотикой для функции sin и в действительности будет меньше из-за про-
промежуточных арифметических операций в ходе рекурсии (логические
операции, разумеется, погрешности не вносят), то глубина рекурсии
является важным параметром. Например, при вычислении по этой
программе sin, при DELTA равном 1,2 • 10~4, требуется 10 итераций
и производится A + 4 + 1I0 = 60 сложений /умножений/ делений.
Отметим в заключение, что для sin Ъх = 20 sin5 x — 20 sin3 x + 5 sin x
указанное соотношение хуже: хотя итераций меньше, но суммарное
число арифметических операций оказывается большим G итераций,
98 промежуточных операций).
Пример 2: Вычисление ехрж, х > 0, можно произвести по сле-
следующей программе
5.1] Локальный подход в программировании 233
(ЕХР
[LAMBDA (X)
(COND
((LESSP X DELTA) (ADD1 X))
(Т (FTIMES(EXP(FqUOTIENT X 2.))
(EXP(FqUOTIEHT X 2.]).
(x \2
exp — j
и то, что при ж —>• 0 верно ехр ж ~ 1 + ж. Кстати, для повышения
скорости вычисления здесь можно ввести обычным образом промежу-
промежуточную переменную для хранения (EXP(FQUOTIENT x 2)).
Пример 3: Вычисление In ж, ж > 0, может быть основано на
использовании функции SQR (вычисление арифметического значе-
значения квадратного корня), которая может быть реализована, например,
с применением алгоритма Герона. Тогда, опираясь на соотношение
In ж = 21пд/ж и то, что при ж —>• 0 верно In ж « 2 -, получаем
следующую программу:
(LOG
[LAMBDA (X)
(COND
((LESSP(EXP(SUB1 X)) DELTA)
(FTIMES 2.
(PqUOTIENT(SUBl X)(ADD1 X))))
(T (FTIMES 2. (LOG(SqR X]).
Таким образом, для организации рекурсии для некоторой непре-
непрерывной функции /(ж) годится любая асимптотика этой функции и под-
подходящее функциональное соотношение. При этом, конечно, величина
DELTA должна быть выбрана настолько малой, чтобы используе-
используемая асимптотика давала бы для /(DELTA) приемлемую погрешность
с некоторым «запасом» на арифметические ошибки в ходе такой «ариф-
«арифметической» рекурсии.
Важно отметить, что, используя стандартную отладочную програм-
программу языка Лисп типа TRACE [Teitelman, 1974; Nordstrom and Sandewall,
1970], за дисплеем легко устанавливается глубина рекурсии для данно-
данного значения аргумента, строится оценка погрешности, даваемой про-
промежуточными выкладками [Демидович и Марон, 1966]. Этих данных
достаточно для выбора константы DELTA, гарантирующей требуемую
точность. (В некоторых случаях достаточно будет проведения тестов
с различным значением константы DELTA, добиваясь повторяемости
результата с требуемой точностью.)
Заметим в заключение, что в вычислительной практике исполь-
используется рекурсивный способ оценки функции, но, как правило, цело-
целочисленного аргумента и в комбинации с более полными сходящимися
234 Использование локальной организации [Гл.5
рядами. Настоящий раздел, однако, ориентирован на системы Лисп,
где подобный подход не встречается.
5.1.3. Наглядное программирование вычислений. С какой-то точки
зрения все методы облегчения контакта с компьютером, т. е. органи-
организации взаимопонятного полезного диалога, расширяют штат програм-
программистов. Современное программирование ведется на так называемых
языках высокого уровня, так что от программиста в идеале не требуется
ничего знать об устройстве конкретного компьютера, скажем, о том,
какие там регистры, в каких разрядах машинного слова помещаются
коды команды, а в каких — адреса операндов и тому подобное.
Программирование становится все более наглядным и доступным
ученому, решающему с помощью компьютера некоторую задачу. И хотя
системное программирование требует четкого априорного анализа за-
задачи — вычленения ее подчастей и точного описания их работы и их бу-
будущего взаимодействия, на практике такое программирование ведется
в той или иной степени локальными методами в диалоге с компьютером,
в котором отлаживается не только написанная программа, но и уточня-
уточняется сама постановка решаемой задачи. При этом вполне естественно,
программисту необходимо, как правило, держать под контролем все
аспекты составляемой им программы.
Именно по этой причине все большее распространение находят, на-
например, лиспоподобные языки высокого уровня, которые обеспечивают
указанный контроль, ввиду обозримости этого языка и подконтрольно-
подконтрольности его структур.
Наглядность программирования определяется двумя факторами:
возможностью воспользоваться теми знаниями, которыми априори рас-
располагает составитель программы, и тем, чтобы в минимальной степени
требовалось приобретать какие-то специальные знания, которые не
слишком нужны вне области программирования.
Рассмотрим пример. Одним из путей облегчения программиро-
программирования, несомненно, является создание библиотеки подпрограмм. Это
высокоэффективное средство упрощения программирования делает,
однако, какую-то часть программы «скрытой»; действительно, при
обращении, например, к sin в программе на Фортране обычно нелегко
выяснить точность, с которой вычисляется эта функция. А ведь подчас
точность может быть и излишней и тогда мы просто оставляем несколь-
несколько знаков после запятой, огрубляя полученный результат!
Совсем плохо обстоит дело с вычислением «редких» или новых
функций, не перечисленных в библиотеке. В этом случае приходится
прерывать основную линию своих рассуждений, связанных с реша-
решаемой задачей, отвлекаясь на поиск соответствующей подпрограммы
или пытаясь написать свою собственную подпрограмму. Требование
наглядности становится в этом случае очень важным.
Мы предлагаем здесь метод наглядного программирования вы-
вычислений функций путем организации рекурсий (итераций), который
опирается, главным образом, на знание общих асимптотических за-
закономерностей для рассматриваемой функции и на знание аналити-
аналитических формул-соотношений для функций при различных значениях
5.1] Локальный подход в программировании 235
аргумента. Это, по-видимому, тот запас знаний, которым программист-
исследователь заведомо располагает.
Приведем примеры трех итеративных программ для вычисления
sin, log и ехр на Фортране, а также рекурсивную программу вычисления
sin на Алголе. (Аналогичные примеры рекурсивных программ на Лиспе
показаны в предыдущем разделе.)
ACCEPT "TYPE IN THE PRECISION: ", XO
ACCEPT "TYPE IN X: ",X
X1=X
K=O
1 IF(ABS(X).LE.XO) GO TO 2
X=X/3
K=K+1
GO TO 1
2 IF(K.EQ.O) GO TO 4
DO 3 1=1,К
X=3*X - 4*X**3
3 CONTINUE
4 TYPE " SIN ", XI ," =", X
END
ACCEPT "TYPE IN THE PRECISION: ", XO
ACCEPT "TYPE IN X: ", X
X1=X
K=O
1 IF(ABS(X-1).LE.XO) GO TO 2
X=SQRT(X)
K=K+1
GO TO 1
2 X=2*(X-1)/(X+1)
IF(K.EQ.O) GO TO 4
DO 3 1=1,К
X=2*X
3 CONTINUE
4 TYPE " LOG ", XI ," =", X
END
ACCEPT "TYPE IN THE PRECISION: ", XO
ACCEPT "TYPE IN X: ",X
X1=X
K=O
1 IF(ABS(X).LE.XO) GO TO 2
X=X/2
K=K+1
GO TO 1
X=l+X
2 IF(K.EQ.O) GO TO 4
DO 3 1=1,К
X=X*X
3 CONTINUE
236 Использование локальной организации [Гл.5
4 TYPE " ЕХР ", XI ," =", X
END
BEGIN REAL XO, X
REAL PROCEDURE MSIN(X);
BEGIN IF ABS(X)<XO THEN MSIN:=X
ELSE MSIN:=3*MSIN(X/3) - 4*SGNA,MSIN(X/3))*
ABS(MSIN(X/3))~3;
END;
OPEN(O,"@INPUT");
OPENA,"@OUTPUT");
WRITEA,"<NL>TYPE IN THE PRECOSION: M);READ(O, XO);
WRITEA,"TYPE ON X: ");READ(O,X);
WRITEA,"SIN ",X,"=",MSIN(X));
END;
5.1.4. Интерактивная система программирования ЭКЛИСП.
В основу системы был положен LISP-F1 или «Лисп на Фортране»,
разработанный М. Нордстрёмом в Уппсальском университете, Швеция.
Однако, не могло быть речи о прямом переносе этой системы
[Nordstrom and Sandewall, 1970] на мини-компьютер ECCLIPS,
поскольку для нее требовалось 85 кбайт оперативной памяти
(создатели LISP-F1 имели в виду реализацию системы на компьютере
типа IBM 360/40).
В системе LISP-F1 применялась традиционная схема интерпрета-
интерпретатора и было решено ее сохранить. В то же время программная реа-
реализация на Фортране была нами основательно пересмотрена с целью
максимальной экономии оперативной памяти.
Необходимая экономия памяти была достигнута за счет замены
4-байтовых переменных, в тех случаях, когда это возможно, на 2-
байтовые и перехода к оптимизирующему компилятору Fortran-5 вме-
вместо Fortran-IV, предусмотренного М. Нордстрёмом, а также за счет
использования ассемблера.
В окончательный вариант системы ЭКЛИСП удалось добавить ряд
свойств, отсутствующих в LISP-F1. В частности в нее встроены:
1) система «редактирования на экране»,
2) система прерывания цикла интерпретации,
3) развитая файловая система,
4) информационная система HELP (см п. 5.1.5),
5) система «виртуальной памяти».
Кроме того пересмотрена система хранения атомов, чтобы позво-
позволить использование имен неограниченной длины, и добавлена «оди-
«одиночная кавычка» — эквивалент оператора QUOTE.
5.1.5. Комментирующая система для языка Лисп. Здесь рассмат-
рассматриваются особенности построения достаточно эффективной и простой
базы данных HELP для языка Лисп с ассоциативной выборкой инфор-
информации и с возможностью переработки статей на языке Лисп. Управля-
Управляющая часть системы реализована в двух вариантах, отличающихся по
ряду параметров.
5.1] Локальный подход в программировании 237
Характерной особенностью языка Лисп является единообразие ти-
типов данных (числа, атомы, списки) и методов работы с ними. С другой
стороны, различные версии языка Лисп отличаются друг от друга
имеющимися вспомогательными средствами (редактор, трассировка,
BREAK, DWIM и т. д.) и запасом библиотечных функций [Teitelman,
1974]. При этом, хотя общая структура языка Лисп для программиста
достаточно очевидна, знание указанных особенностей при практиче-
практическом программировании остается чрезвычайно важным.
Поэтому благодаря разнообразию конкретных реализации и легкой
возможности пополнения системы как вспомогательными средствами,
так и новыми библиотечными функциями в случае языка Лисп, со-
создание на ЭВМ информационно-комментирующей системы является
необходимым.
При построении на практике информационно-комментирующих си-
систем приходится учитывать следующие факторы: объем памяти, зани-
занимаемый этой вспомогательной системой; ее «прозрачность» для дан-
данных, с которыми работает пользователь; удобство восприятия поль-
пользователем; удобство исправления и пополнения; транспортабельность
системы.
Метод реализации системы. Прежде всего отметим,
что созданная система ориентирована главным образом на реализацию
языка Лисп, названную нами ЭКЛИСП, для мини компьютера Ecclips
С/330, в основе которой лежит программа «Лисп на Фортране» (см.
выше). В этой существенно интерактивной реализации к настоящему
времени имеются такие элементы, как BREAK — прерывание, сохра-
сохраняющее определенные пользователем атомы и списки, структурный
редактор и редактирование на экране, которые делают диалоговый
режим особенно удобным.
Основным недостатком системы является небольшой объем опе-
оперативного рабочего пространства Лисп. Указанные особенности учи-
учитывались при разработке двух схожих во многом методов реализа-
реализации информационно-комментирующей системы. Этим методам соот-
соответствуют два пакета программ: пакет I и пакет II. Самое существенное
их отличие состоит в том, что в пакете I вся информационная и кон-
контрольная часть постоянно находятся в рабочем пространстве системы
Лисп, тогда как в пакете II в рабочем пространстве находится лишь
управляющая часть, а банк данных хранится во внешней памяти (в
нашем случае на диске).
Перейдем к рассмотрению этих реализаций в свете перечисленных
фактов.
Объем памяти. Поскольку в пакете I система HELP занимает
значительное место в рабочем пространстве, то он исходно хранится
во внешней памяти и считывается в рабочую память лишь при по-
поступлении от пользователя первого запроса. Этот режим основывается
на том соображении, что если пользователем написана такая боль-
большая программа на языке Лисп, что вопрос объема рабочей памяти
становится для него критичным, то с большой вероятностью он не
238 Использование локальной организации [Гл. 5
будет обращаться к ЭВМ за вспомогательной информацией, являясь
достаточно подготовленным программистом.
Как уже отмечалось, в пакете II в оперативной памяти хранит-
хранится лишь управляющая часть, состоящая из функций HELP, HELP*,
HREAD, которые будут кратко описаны позже. Информационная
часть, или банк данных, состоит из совокупности файлов, хранимых
на диске и вызываемых функцией HELP. Функция HELP* использу-
используется для обновления информации или для записи новой информации
в базу данных. Заметим, что если отказаться от возможности изме-
изменения содержания базы данных средствами языка Лисп, то можно
было бы вообще не загружать в процессе выборки данные в рабочее
пространство, как это и делается обычно в операционных системах, не
предполагающих никаких изменений пользователем.
Прозрачность. Важным параметром вспомогательных си-
систем является отсутствие интерференции с теми данными, с которыми
работает пользователь. Ясно, что пользователь уже не имеет возмож-
возможности употреблять имена HELP, HELP* и HREAD — в случае пакета II
больше никаких ограничений не возникает. В случае пакета I запре-
запрещенными оказываются еще несколько имен. Свойство прозрачности
хорошо обеспечивается самой структурой языка Лисп, где допускаются
множественные ссылки на один и тот же атом.
Удобство восприятия. Типы данных, допускаемые язы-
языком Лисп, в своей первоначальной форме мало пригодны для пред-
представления текстуальной информации, поэтому в обоих пакетах исполь-
используется специальная форматирующая функция HREAD, превращающая
список в текст по следующим правилам: внешние скобки списка всегда
опускаются; если в списке фигурирует специальный символ &, то де-
делается перенос строки и снимаются скобки соответствующего уровня
списка.
Внутренняя запись текста в обоих вариантах ведется в форме обыч-
обычных для языка Лисп списков. Этим обеспечивается возможность обра-
обработки текста стандартными средствами языка Лисп.
Удобство исправления и пополнения. В случае па-
пакета I одна и та же функция HELP используется и для считывания,
и для занесения (или замены) информации. При обращении к этой
функции вида (HELP ATOM LIST) текст LIST заносится под именем
АТОМ, так что (HELP ATOM) возвращает значение атома LIST.
В пакете II для записи (или замены) информации набирают (HELP*
АТОМ), после чего комментирующая система запрашивает пользова-
пользователя относительно новой информации. В обоих вариантах старый текст
можно перерабатывать, используя системный структурный редактор
EDIT.
Удобство обновления информации говорит о том, что пакет HELP
можно было бы использовать для записи любых комментариев, которые
пользователь захочет сделать относительно определяемых им функ-
функций. Именно поэтому система в целом и получила название информа-
информационно-комментирующей.
5.2] Интеллектуальная операционная система 239
Важно отметить, что в пакетах приняты меры дня автоматического
отделения локальной комментирующей информации пользователя от
общесистемной.
Транспортабельность системы. В смысле возможно-
возможности переноса системы на другой компьютер пакет I обладает преимуще-
преимуществом, представляя собой совокупность стандартных операторов Лисп
1.5, если не считать функцию HREAD), которую можно заменить на
стандартную функцию PRINT. Для пакета II существенным оказывает-
оказывается взаимодействие с операционной системой конкретного компьютера
[AOS, 1977], поэтому управляющая часть оказывается системно зави-
зависимой.
Некоторые подробности реализации. В пакете I ис-
используются функции HELP, HELP*, HREAD, HINSERT, HREPLACE
и группа вспомогательных функций HI, НИ, STARREM, HREPLA.
Непосредственно роль базы данных играет функция HELP*, что оправ-
оправдано, если информационных статей немного. Функция HELP обраща-
обращается к функции HELP*, обеспечивая в зависимости от значения своих
аргументов либо считывание, либо занесение информации. Функция
HREAD предназначена для форматирования списка, ее работа описана
в предыдущем разделе.
В пакете II используются три функции HELP, HELP* и HREAD.
В этом варианте функция HELP служит лишь для считывания инфор-
информации, тогда как HELP* используется для изменения или пополнения
банка данных, который представляет собой совокупность дисковых
файлов. При считывании файла, с одной стороны, тратится время
на открытие соответствующих каналов ввода-вывода и считывание
с диска, но, с другой стороны, поиск файла с данным именем ведется
непосредственно операционной системой, т. е. существенно быстрее,
чем с использованием SELECTQ в пакете I. Поэтому время реакции
системы остается примерно одинаковым в обоих случаях.
5.2. Интеллектуальная операционная система на
локальных принципах
Стремительное развитие технических показателей компьютеров от-
отнюдь не снимает вопрос об их эффективном использовании, поскольку
нагрузка на компьютер также растет. Действительно, с одной стороны,
пропорционально возможностям компьютеров растет и масштаб задач,
традиционно на них решаемых, а с другой — происходит существенное
расширение контингента пользователей, а следовательно, появление
новых проблем, среди которых, в частности, повышенные требования
к универсальности и доступности компьютера. Для удовлетворения
запросов разнообразных пользователей необходимо общение на есте-
естественном языке, привлечение больших баз знаний, автоматический син-
синтез процедур и т. п., что само по себе требует больших вычислительных
ресурсов.
Основной тезис, развиваемый в настоящем разделе, состоит в том,
что возможности и высокопроизводительных машин новейших поко-
240 Использование локальной организации [Гл.5
лений, и мощных персональных компьютеров будут использоваться
значительно полнее, если перейти от традиционных универсальных
операционных систем (ОС) к интеллектуальным ОС, которые по суще-
существу обеспечивали бы адаптацию ЭВМ к уровню данного, конкретного
пользователя.
В смысле освещения этого тезиса, настоящий раздел книги носит
замкнутый характер: в нем дается постановка задачи об интеллектуаль-
интеллектуальной ОС, впервые сформулированная нами в работе [Стефанюк, 1982],
и приводятся этапы постепенного воплощения этой идеи, завершающе-
завершающегося реализацией макета интеллектуальной ОС в виде программного
комплекса на языке Лисп.
Сразу же отметим два обстоятельства. Во-первых, интеллектуаль-
интеллектуальные ОС не дублируют другие средства обеспечения «дружественной»
реакции компьютера, например, в рамках так называемого интеллек-
интеллектуального интерфейса. Более того, они могут выступать в сочетании.
Во-вторых, описываемые ниже программы имеют и самостоятельную
ценность, создавая адекватную среду интерактивного программирова-
программирования на языке Лисп. Последний факт говорит о том, что сама идея
подстройки под пользователя и предлагаемый ниже способ ее реали-
реализации несомненно могут быть использованы на самых разных уровнях,
в частности, в экспертных системах и в других ситуациях, когда чело-
человек вступает с ЭВМ в продолжительный контакт.
Операционные системы даже малых вычислительных машин спо-
способны предоставлять пользователю самую разнообразную вспомога-
вспомогательную информацию. Так, в случае рассогласования требований,
предъявляемых составленной пользователем программой, с возможно-
возможностями вычислительной машины компьютер может выдать такие сооб-
сообщения (далее для конкретности все примеры даны для случая ОС мини
ЭВМ типа Эклипс С/330 (США) [AOS, 1977]):
FATAL ERROR
PROGRAM TERMINATED
CHANNEL NOT OPEN
BOUND ERROR
TERMINATED BY A SUPERIOR PROCESS
YOU HAVE SONS, DO YOU WANT TO TERMINATE?
TRYING TO RELOCATE DATA FROM IRESTART
PROGRAM SPACE LARGER THAN 32K
Кроме того, набрав команду HELP, на терминале можно увидеть
некоторую полезную информацию о возможностях данной ЭВМ, а,
скажем, команда HELP/V дает ту же информацию, но в развернутой
форме. Команда XHELP сообщает информацию о системе диспетчери-
диспетчеризации и т. д.
Обилие различных видов и форм представления вспомогательной
информации говорит о том, что компьютер рассчитан на самый широ-
широкий круг пользователей, которые могут столкнуться с самыми разно-
разнообразными трудностями.
5.2] Интеллектуальная операционная система 241
Отметим три важных обстоятельства: во-первых, объем вспомога-
вспомогательной информации настолько велик, что всю ее трудно представить
в сжатой и обозримой форме: этой цели служат десятки руководств для
пользователей, программистов и операторов ЭВМ; во-вторых, операци-
операционные системы, как правило, непрерывно совершенствуются (устраня-
(устраняются обнаруженные ошибки, расширяется круг вычислительных воз-
возможностей), причем это происходит быстрее, чем публикуются и рассы-
рассылаются новые описания с перечнем изменений, поэтому самая верная
информация хранится в самой ОС; в-третьих, реально программист
в своей деятельности сталкивается лишь с небольшим подмножеством
случаев из общего числа случаев, в которых ЭВМ способна дать вспо-
вспомогательную информацию, и поэтому он не склонен к обстоятельному
изучению всех возможных сообщений и их смысла.
Возвращаясь к приведенному списку сообщений, можно отметить,
что последние носят разнообразный характер, начиная от мало ин-
информативного, но решительного ФАТАЛЬНАЯ ОШИБКА, до весьма
информативных, но понятных лишь опытному программисту, хорошо
знакомому с принципами размещения и оперирования данными кон-
конкретного компьютера.
Положение будет значительно улучшено, если компьютер окажется
в состоянии «следить» за пользователем, настраиваясь на его уровень
подготовленности. Довольно много в этом плане достигнуто в системе
программирования ИНТЕРЛИСП, предназначенной для языка про-
программирования Лисп, которой мы займемся в следующем разделе.
В общем случае такая задача может быть решена путем встраи-
встраивания в ОС некоторой фиксированной сети фреймов [Минский, 1978].
Каждому фрейму, соответствующему определенному представлению
о степени подготовленности данного программиста, отвечает заданное
подмножество сообщений, которые будут понятны данному программи-
программисту. При этом можно предусмотреть посылку некоторых специальных
сообщений оператору системы или запись их в специальный файл.
Можно также предусмотреть и ведение весьма ограниченного диалога
с пользователем [ММ/1, 1980].
Если заранее известна квалификация программиста, то априори
можно решить, каким именно фреймом руководствоваться, но более
естественно допустить, чтобы компьютер, опираясь на наблюдаемое
поведение программиста (временные задержки, характер ошибок, объ-
объем и число работающих программ и т. д.), сам выбирал бы наиболее
подходящий фрейм. При этом гибкость системы можно увеличить,
опираясь на определенные возможности формального комбинирования
фреймов (см. [Кузин и Дубинина, 1980], а также раздел 4.5 выше).
Отметим, что интеллектуальная ОС приведет не просто к допол-
дополнительным удобствам для программиста, но и должна, очевидно, по-
повысить эффективность использования компьютера в целом, а также
способствовать росту квалификации программистов.
В заключение подчеркнем, что описанная в самом начале органи-
организация вспомогательной информации на практике доказала свою по-
242 Использование локальной организации [Гл.5
лезность и речь идет о дальнейшем совершенствовании и развитии
контакта человека с машиной.
5.3. Локальная организация гибкого обслуживания
в системе Лисп
Широкое распространение вычислительной техники, в частности,
внедрение персональных вычислительных машин, значительно рас-
расширило контингент пользователей вычислительных машин: кроме
программистов-экспертов появились средне и мало подготовленные
программисты, а также и просто новички в программировании.
Важно отметить, что среди таких «новичков» оказываются и вы-
высококвалифицированные специалисты в других областях, которые по
тем или иным причинам решили обратиться к компьютеру [Поспелов
и Солодов, 1984]. Однако для краткости ниже все пользователи ком-
компьютеров будут называться программистами.
В следующем разделе описываются общие принципы построения
и конкретная реализация системы, призванной обеспечить гибкую ре-
реакцию со стороны вычислительной машины, зависящую от степени
подготовленности, проявленной программистом в ходе работы на язы-
языке Лисп, присущего ему стиля программирования и т. д. Изначально
вид реакции задается автоматически или опытным программистом (в
дальнейшем называемым экспертом) по имеющейся у него информации
о данном пользователе. В дальнейшем, однако, реакция видоизменяет-
видоизменяется с учетом накопленного опыта.
Созданная система FLEX рассчитана на программирование в среде
языка Лисп, поэтому естественно, что при ее создании использова-
использовались многие соображения, включенные в такие модификации языка,
как MACLISP, BBNLISP, INTERLISP [Teitelman, 1974]. Кроме того,
были использованы методы представления знаний с использованием
фреймов и ряд общих идей из области экспертных систем. В целом
описываемую систему можно рассматривать как прототип «интеллек-
«интеллектуальной операционной системы» [Стефанюк, 1982] (см. также раз-
раздел 5.2), обеспечивающей индивидуальное обслуживание различных
пользователей компьютера, повышающей как удобство обращения, так
и эффективность его применения к решению практических задач.
Заметим, что проблеме гибкого подхода к пользователю в настоящее
время начинает уделяться все большее внимание как за рубежом, так
и в нашей стране. В частности, в работе [Lenat et al, 1983] упоминаются
зарубежные исследователи, обратившие внимание на вопрос индиви-
индивидуализации пользователей при создании экспертных систем.
5.3.1. Принципы организации системы. Система FLEX пред-
представляет собой дополнительный интерфейс между пользователем-
программистом и обычной системой Лисп, как показано на рис. 5.3.
Каждая команда (^-выражение) программиста сначала поступает
в систему FLEX, которая с учетом предыдущей истории либо передает
ее в интерпретатор Лиспа на исполнение, либо предпринимает другие
5.3] Локальная организация гибкого обслуживания в системе Лисп 243
действия, «общаясь» как с программистом, так и с интерпретатором
системы Лисп.
Ситуацией на очередном шаге процесса программирования будем
называть весь набор выражений языка Лисп, поступивших с терми-
терминала, упорядоченный по времени их поступления. В системе FLEX
для каждого из пользователей заранее задается экспертом некоторый
набор ситуаций, называемых критическими. Если текущая ситуация не
принадлежит классу критических, то FLEX просто передает очередное
s-выражение пользователя на вход интерпретатора, в результате чего
на терминале возникает результат оценки этого выражения.
Экспертом при генерации системы заранее задается вид реакции
системы FLEX на каждую из критических ситуаций. Гибкость же по-
поведения системы FLEX обеспечивается за счет обучения, при котором
с течением времени происходит видоизменение множества ситуаций,
которые для данного пользователя считаются критическими (полный
набор всех возможных критических ситуаций задается экспертом в хо-
ходе отдельного диалога с FLEX).
В результате обучения для данного пользователя формируется своя
система FLEX (или, точнее, свое состояние системы FLEX), которая
обеспечивает пользователя адекватной данному лицу системой услуг.
Этот подход является более совершенным, чем априорное выделение
категорий программистов, таких, как новички, опытные и т. п.
Программист
¦•uf
FLEX
ЛИСП-интерпретатор
Рис. 5.3. Место системы FLEX в системе программирования
Действительно, такое разбиение во многом носило бы условный
характер, так как известно, например, что даже опытный программист
может проявить свойства новичка, сталкиваясь с совершенно неизвест-
неизвестными ему возможностями, предоставляемыми данным компьютером.
5.3.2. Формальное описание системы, s-выражением в языке Лисп,
как обычно называется либо атом, либо один список языка Лисп.
Под ситуацией размерности г понимаем упорядоченный непустой набор
вида (si, . . . , sr), где Si суть s-выражения, г = 1, . . . , г.
На множестве всех ситуаций размерности г определим классы си-
ситуаций, и пусть { К^} — множество всех классов ситуаций размер-
размерности г. Классы введем таким образом, чтобы для каждой ситуации
размерности г можно было сказать, принадлежит она данному классу
или нет. Если ситуация принадлежит какому-нибудь из классов, будем
называть ее критической. Приведем несколько примеров.
Пример 1: г = 1. Зададим множество {А^1)} следующим об-
образом: оно состоит из одного класса К^\ в который входят все s-
выражения вида (CONS * *), где * обозначает произвольный подсписок,
конкретный вид которого является несущественным.
244 Использование локальной организации [Гл.5
Пример 2:г = 2. Зададим теперь множество {К^}. Пусть оно
состоит из одного класса К^2\ такого, что пара (si,^) ? K^ тогда
и только тогда, когда si имеет вид (de * * *) и одновременно S2 имеет
вид (DUMP * *).
Объединим теперь все s-выражения, имеющие вид (DE * * *), в от-
отдельный класс /С{ , а все s-выражения, имеющие вид (DUMP * *), —
в класс К\ . Теперь можно сказать, что ситуация (si, s<i) принадлежит
классу К^ тогда и только тогда, когда выполнено совместное условие
si e к[г\ s2 e к?\
Таким образом, в нашем примере класс /О2) является прямым
произведением классов К[ и /Q .
Замечание 1 . Классы ситуаций в системе FLEX задаются за-
заранее экспертом и остаются неизменными в ходе всей работы системы.
(В общем случае, множество всех классов ситуаций может пополняться
экспертом в ходе отдельного диалога с FLEX.)
Замечание 2. В описываемой системе FLEX классы ситуаций
размерности г, г > 1 задаются именно таким способом, который опи-
описан в примере 2, т. е. через классы К[ \К\ , . . . , Кг , описывающие
соответственно вид каждого из s-выражений s1? $2? • • • ? sr-
Рассмотрим теперь, как введенные нами классы ситуаций исполь-
используются при работе системы FLEX. Для этого проследим шаги про-
программирования конкретного пользователя-программиста в процессе
его работы. Пользователь системы определяется однозначно своим
именем в момент начала работы с системой. Пусть моменты рабочего
времени задаются поступлением в систему от программиста одного s-
выражения. Таким образом, конкретная ситуация в момент времени
t = к характеризуется поступлением в систему от программиста ровно
к 5-выражений. Пусть Sk означает s-выражение, поступившее в си-
систему в момент времени t = к.
Опишем теперь, как реально в системе FLEX решается вопрос, не
является ли конкретная ситуация критической.
В момент времени t = 1 проверяется принадлежность s-выражения
si и всех его подвыражений классу ситуаций единичной размерности
}
В момент времени t = 2 проверяется принадлежность множеству
{} классов единичной размерности s-выражения si, и всех под-
подвыражений s-выражения si, затем проверяется принадлежность ситу-
ситуации (si,S2) множеству {/ft2)} классов ситуаций размерности 2 (см.
замечание 2); при этом возникают две возможности: либо проверять
вид 5-выражений si и S2 и всех их подвыражений, либо осуществлять
проверку только для самих этих s-выражений. В системе FLEX выбран
компромиссный вариант — вид подвыражений проверяется рекурсивно
только для последнего s-выражения, поступившего в систему,
Максимальная размерность заранее заданных ситуаций в системе
FLEX равна 2. Это вызвано, с одной стороны, соображениями упро-
5.3] Локальная организация гибкого обслуживания в системе Лисп 245
щения системы, с другой — тем, что достойные внимания ситуации
большей размерности автору пока не встречались. Поэтому в момент
времени t = к система FLEX сначала проверяет принадлежность s-
выражений Sk и всех его подвыражений множеству классов ситуации
{/О1)}; затем проверяет принадлежность ситуации (sk-i, s^) множе-
множеству {/СB)} (причем для Sk проверяется вид всех подвыражений).
В случае, если система FLEX обнаруживает критическую ситуацию,
она выполняет некоторую последовательность функций языка Лисп,
называемую реакцией на данную ситуацию (точнее, на данный класс
ситуаций). На каждый класс ситуаций существует своя реакция, ко-
которая задается экспертом заранее — одновременно с заданием самих
классов ситуаций. Реакция может включать в себя самые разнооб-
разнообразные функции. Среди них — поддерживающие диалог с програм-
программистом, исправляющие поступившие от него s-выражения, коррек-
корректирующие имеющуюся информацию о данном программисте и т. д.
Часть реакции всегда направлена на программиста, а часть — на саму
систему FLEX. Выполнив последовательность шагов, составляющих
реакцию, система передает (или не передает) команду программиста
Лисп-интерпретатору на выполнение (это тоже зависит от реакции).
Система FLEX обучается, настраиваясь на конкретного програм-
программиста, двумя путями:
— путем получения, непосредственной информации о программи-
программисте в момент первого «знакомства» с ним (это происходит либо
в результате небольшого анкетирования самого программиста,
либо в результате использования знаний о программисте, заранее
занесенных в систему экспертом);
— путем уточнения имеющихся данных о программисте в процессе
его работы (это осуществляется посредством изменения множе-
множества классов критических ситуаций, заданного для конкретного
программиста в начальный момент его работы).
Приведем некоторые пояснения. Обозначим через {А} множество
всех классов критических ситуаций, априорно заданных экспертом,
а через {/^}0 — множество классов критических ситуаций, заданных
для конкретного пользователя перед началом его работы, т. е. в момент
времени t = 0. Заметим, что, во-первых, {/С}0 С {Л} и, во-вторых, мно-
множество {/^}0 автоматически формируется для каждого программиста
всякий раз перед началом его работы с системой FLEX на основании
информации, имеющейся у компьютера.
Пусть tai, ta2, . . . , tam — те моменты времени в процессе работы
данного программиста, в которые система FLEX обнаруживает крити-
критические ситуации и выполняет последовательность функций, составля-
составляющую реакцию на обнаруженную ситуацию. Тогда можно сказать, что
множество классов критических ситуаций для данного программиста
зависит от времени следующим образом:
) {) Wt-i> если * i {tai,taa,. ¦ ¦, tam};
246 Использование локальной организации [Гл.5
2) если t G {^ai^a25"-5^am}) T0 {K}t определяется состоянием
системы FLEX в момент времени t. Для реализованной на данном этапе
версии системы FLEX можно сказать, что для конкретного програм-
программиста
{K}t С {К}г_г С {А} , t = 0,1,2,...
Здесь {K}t означает множество классов критических ситуаций
в момент времени t.
Реакция на обнаруженную критическую ситуацию тоже зависит от
времени:
Rt = R
где t G {tQl, ?a2, . . . , ?am}; Rt — реакция в момент времени t на
класс критических ситуаций {/С}^; Cflex — состояние системы FLEX
в момент времени ?, при этом, в свою очередь, CFLEX = C(Rt), а CFLEX
однозначно задается именем программиста с учетом информации, на-
накопленной о нем в предыдущие сеансы его работы.
5.3.3. Представление знаний в системе FLEX. Знания в системе
FLEX содержат информацию о пользователях-программистах, о воз-
возможных ситуациях, возникающих при работе программистов, и о ре-
реакциях на эти ситуации, об устройстве самой системы FLEX. Знания
о пользователях и ситуациях организованы в динамическую сеть фрей-
фреймов. В системе применены два типа фреймов: фрейм пользователя
и фрейм реакции на ситуацию.
Множество всех фреймов пользователей содержит отдельные фрей-
фреймы на каждого программиста, работающего в системе FLEX, и три
стандартных фрейма на типы программистов (фрейм на новичка, на
среднего и на опытного программистов). Эти стандартные фреймы
оказываются полезными, когда в систему входит новый пользователь,
на которого еще не заведено фрейма. В результате короткого анке-
анкетирования система причисляет программиста к одному из трех типов
и выбирает для него соответствующий его уровню стандартный фрейм.
Далее в процессе работы этого пользователя его фрейм меняется в со-
соответствии с собственными правилами (в зависимости от поведения
пользователя) и вскоре становится отличным от стандартного фрейма.
(Фрейм пользователя вызывается по имени пользователя.)
Примерный общий вид фрейма пользователя приведен на рис. 5.4.
Каждый фрейм пользователя содержит административные слоты
и слоты ситуаций, количество последних в системе не фиксировано.
В административных слотах запоминается общая информация
о пользователе, например количество сеансов работы в системе FLEX,
число отказов от работы в системе FLEX, другие статистические
данные. Слоты ситуаций содержат ссылки на подфреймы ситуаций,
в которых, в свою очередь, хранится информация о поведении системы
в случае, если данный пользователь попадет в данную критическую
ситуацию, о том, сколько раз он попадал в данную ситуацию ранее,
когда он попадал в нее в последний раз и т. д.
5.3] Локальная организация гибкого обслуживания в системе Лисп 247
Административные слоты Слоты ситуаций
Имя
слота
Значение
слота
ASLOT1
VALUE1
...
ASLOTM
VALUEM
Под фрейм ситуации 1
Подфрейм ситуации 2
Подфрейм ситуации N
¦¦:¦:¦=
Hi
SIT1
?
1
SIT2
с
р
...
...
SITN
с
р
Рис. 5.4. Фрейм пользователя
Фреймы реакций на ситуации хранятся в системе под своими име-
именами. Когда система обнаруживает критическую ситуацию, она вызы-
вызывает фрейм реакции на нее. Одной ситуации может соответствовать
несколько фреймов реакций. Какие из них выбрать, если какой-либо
пользователь попал в данную ситуацию? Эту информацию система
находит во фрейме пользователя. Общий вид фрейма реакции на ситу-
ситуацию приведен на рис. 5.5.
Этот фрейм содержит семь слотов-подфреймов, которые имеют
следующий смысл:
VALUE* — содержит значение фрейма, являющееся по сути реак-
реакцией на ситуацию, вызывающую этот фрейм 1);
OPFLG — показывает, когда фрейм реакции необходимо открыть
(открытие фрейма означает, что в случае обнаружения данной си-
ситуации система будет реагировать на нее по правилам, описанным
в данном фрейме реакции);
CLFLG — показывает, когда фрейм необходимо закрыть, т. е. он
перестает участвовать в формировании реакции системы;
MISC* — слот для вспомогательных действий;
ЮС* — счетчик числа обращений к фрейму;
IACCNT* — счетчик положительных и отрицательных реакций
пользователя на сообщение или действие системы, позволяющий уста-
установить, насколько данному пользователю желательно участие системы;
COMMENT — комментарии к фрейму.
Заметим, что для конкретного программиста фрейм реакции на
конкретную ситуацию может быть открыт как по правилам для дан-
данной ситуации, содержащимся в слоте OPFLG, так и по правилам для
) Пометка * у имени слота означает, что этот слот может использоваться
экспертом и для других целей.
248
Использование локальной организации
[Гл.5
VALUE
OPFLG
CLFLG
MISC
IOC
IACCNT
COMMENT
Комментарий
VALUE
Значение
WHEN
Условие
WHAT
Значение
VALUE
Значение
WHEN
Условие
WHAT
Значение
Рис. 5.5. Фрейм реакции на ситуацию
данного программиста, заданным заранее экспертом и содержащимся
во фрейме данного программиста.
Подслоты: VALUE — содержит значение подслота; WHEN содержит
условие, когда менять значение слота; WHAT — содержит значение: на
что менять значение слота.
Фреймы обоих типов хранятся на внешних файлах и вызываются
в момент необходимости (это объясняется большим объемом знаний
даже частично заполненной системы). Фреймы реакций на ситуацию,
так же как и фрейм пользователя, постоянно меняются в процессе
работы пользователя, за их динамикой следит система.
5.3.4. Описание составных частей системы FLEX. Система FLEX
состоит из следующих частей:
FLEX_SYS — собственно система, обеспечивающая связь програм-
программиста с системой Лисп;
FLEX_INIT — подсистема, обеспечивающая начало работы (загруз-
(загрузка, формирование фрейма пользователя, введение в систему новых
пользователей и т. д.);
FLEX_AUGM — подсистема, обеспечивающая полуавтоматическое
пополнение системы FLEX новыми ситуациями.
Рассмотрим подробно каждую подсистему,
FLEX_SYS — основная задача данной подсистемы состоит в об-
обработке критических ситуаций, возникающих при работе конкретного
5.3] Локальная организация гибкого обслуживания в системе Лисп 249
программиста. Как уже было сказано ранее, распознавание ситуации
ведётся рекурсивно, однако подсистема FLEX_SYS позволяет не обра-
обрабатывать аргументы некоторых функций (например, QUOTE, HELP).
Подсистема также предоставляет возможность прервать оценивание
текущего s-выражения (не вычислять его), либо исправить его и вычис-
вычислить уже исправленное s-выражение. Подсистема обеспечивает защиту
системных функций и переменных от любых попыток их изменения
всеми программистами, кроме эксперта.
Рассмотрим, как реализовано распознавание критической ситуации.
Во-первых, отметим, что распознавание можно проводить «просмот-
«просмотром вперед», заметив первое «подозрительное» s-выражение и ожидая
следующих 5-выражений, входящих в критическую ситуацию, и «про-
«просмотром назад», увидев последнее «подозрительное» s-выражение
и проверяя, не было ли ранее s-выражений, составляющих вместе
с данным критическую ситуацию. Подсистема FLEX осуществляет
«просмотр назад».
Во-вторых, поиски более эффективной реализации распознавания
критических ситуаций привели к созданию новой версии системы
FLEX.
В первой версии распознавание ситуаций осуществлялось общей
функцией MATCH, которая сопоставляла возникшую в данный мо-
момент ситуацию со всеми возможными (предусмотренными в системе).
С возрастанием общего числа ситуаций в системе ее быстродействие
существенно замедлялось именно из-за возрастания времени работы
функции MATCH. Возникла необходимость в другом подходе к распо-
распознаванию ситуации. В новой версии системы FLEX функция MATCH
формируется автоматически для каждого отдельного программиста.
Далее в процессе работы возникающие ситуации сопоставляются функ-
функцией MATCH не со всеми имеющимися в системе ситуациями, а только
с теми, которые предусмотрены для данного программиста.
Прежде чем перейти к описанию подсистемы FLEX_INIT, сделаем
еще два замечания.
1. Работа подсистемы FLEX_SYS осуществляется посредством име-
имеющегося в языке ЭКЛИСП (см. п. 5.1.4) специального режима (MODE
3), который позволяет заменить обычный цикл
ЧТЕНИЕ - ВЫЧИСЛЕНИЕ - ПЕЧАТЬ
на цикл
SYS - ПЕЧАТЬ
где SYS — первоначально неопределенная функция. Для системы
FLEX функция SYS была определена так, чтобы в результате полу-
получился цикл
250 Использование локальной организации [Гл.5
ЧТЕНИЕ - ОЦЕНИВАНИЕ - ВЫЧИСЛЕНИЕ - ПЕЧАТЬ
ПОСТУПИВШЕГО
ВЫРАЖЕНИЯ И
ВЫПОЛНЕНИЕ
ОПРЕДЕЛЕННЫХ
ДЕЙСТВИЙ
Хотя подобные возможности имеются во многих системах, можно
обойтись и простыми средствами языка Лисп, организуя, например,
в нем бесконечный цикл:
ЧТЕНИЕ - ОЦЕНИВАНИЕ - ВЫЧИСЛЕНИЕ - ПЕЧАТЬ
ВЫРАЖЕНИЯ ПЕРЕМЕННОЙ И
В НЕКОТОРУЮ ВЫПОЛНЕНИЕ
ПЕРЕМЕННУЮ ОПРЕДЕЛЕН-
ПЕРЕМЕННУЮ ОПРЕДЕЛЕННЫХ ДЕЙСТВИЙ
2. По окончании работы программиста вся необходимая информа-
информация о нем автоматически сохраняется посредством запоминания фрей-
фрейма пользователя. В следующий раз перед началом работы данного про-
программиста система сформирует все необходимые фреймы и параметры,
обеспечивающие работу программиста с учетом информации о нем,
накопленной за все предыдущие сеансы.
В системе FLEX для программиста предусмотрена возможность
во время следующего сеанса сразу в точности восстановить состояние
системы, не настраивая отдельно необходимые фреймы и параметры.
Для этого в системе ЭКЛИСП используется функция SAVE, которая
в точности и на любой срок запоминает состояние системы на момент
вызова этой функции. Выход программиста из системы по окончании
работы через функцию SAVE является полезным, когда программист
не успел завершить какую-то логическую часть своей программы. Од-
Однако в случае, когда он приступает к новой логической части работы, по
ряду причин удобнее пользоваться обычным («нормальным») выходом
и входом в систему (например, потому что в системе не нужно при этом
хранить большое количество не относящейся к делу информации).
Основные задачи подсистемы FLEX_INIT следующие:
I. Подготовить работу системы FLEX с данным пользователем,
если пользователь желает работать в контакте с этой системой.
Для этого FLEX_INIT загружает все необходимые блоки систе-
системы FLEX, формирует фрейм пользователя с учетом имеющейся
о нем информации и открывает ситуации, которые необходи-
необходимо учитывать для данного пользователя, формирует функцию
MATCH для данного пользователя.
II. Организовать выход пользователя из системы FLEX в случае,
если он не хочет работать в контакте с системой. Для этого
FLEX_INIT изменяет фрейм пользователя с учетом новой полу-
полученной о нем информации и запоминает его до следующего раза,
5.3] Локальная организация гибкого обслуживания в системе Лисп 251
изменяет (в случае необходимости) и запоминает все другие па-
параметры системы, очищает рабочее пространство и «отключает»
систему FLEX.
III. Организовать прием нового, впервые входящего в систему пользо-
пользователя. Для этого FLEX_INIT заносит имя пользователя в список
всех пользователей системы, на основании небольшой анкеты
формирует фрейм пользователя, готовит работу пользователя
с системой FLEX (см. этап I).
Подсистема FLEX_AUGM обеспечивает полуавтоматическое по-
пополнение системы FLEX новыми ситуациями и учет новых пользовате-
пользователей. Как указывалось ранее, учет новых пользователей в системе может
происходить двумя путями:
— эксперт заранее заводит фрейм на нового программиста, где опре-
определяет режим его работы;
— если новый программист самостоятельно входит в систему, то на
него заводится один из трех стандартных фреймов, как это было
описано ранее.
Пополнение системы FLEX новыми ситуациями происходит в ре-
результате диалога эксперта с подсистемой FLEXAUGM (О системе
общения с экспертом см. далее.)
5.3.5. FLEX как экспертная система. При построении системы
FLEX гибкого обслуживания программистов авторы руководствова-
руководствовались принципами создания экспертных систем, изложенными в работах
[Алексеева и др., 1984; Алексеева и Стефанюк, 1984].
Пользователями системы FLEX являются программисты, работаю-
работающие на языке Лисп. Их уровень, стиль работы могут быть различными.
Как уже говорилось, система FLEX изначально представляет со-
собой незаполненную структуру. Ее наполнение знаниями осуществляет
эксперт-программист. Область приложения системы FLEX не так про-
проста. Поскольку формирование достаточно полного индивидуального
портрета программиста невозможно без учета определенных субъек-
субъективных характеристик, было бы желательно, чтобы эксперт привнес
в систему еще и некоторые знания психологии программиста.
Далее, как и в большинстве экспертных систем, на этапе формули-
формулирования экспертом знаний системы FLEX, так же как и в момент при-
принятия решения системой FLEX, широко используются эвристические
подходы. Что касается заполнения и пополнения системы знаниями,
то в системе FLEX предусмотрена возможность непосредственного
взаимодействия с системой самого эксперта, не знающего ее устройства
(эта возможность обеспечивается подсистемой FLEX_AUGM). Обще-
Общение происходит в результате взаимно активного диалога: новые знания
в системе формируются в результате ответов эксперта на вопросы
системы, однако, если эксперту что-то неясно, он может сам задать
вопрос системе пополнения. Система пополнения способна напомнить
252 Использование локальной организации [Гл.5
эксперту форму его ответа, структуру фреймов, в которые организуют-
организуются поступающие знания, смысл отдельных слотов и под слотов фрейма.
Система пополнения способна также дать информацию о собственных
возможностях и ограничениях.
Для экспертных систем характерно наличие также системы обще-
общения с пользователем. В системе FLEX, в связи с ее спецификой, эта
часть развита слабо: нам показалось нецелесообразным загружать и от-
отвлекать программиста вещами, не относящимися к программированию.
Однако необходимые минимальные возможности общения программи-
программиста с системой FLEX предусмотрены.
Действия системы — ее вопросы, сообщения, решения — могут
оказаться не совсем понятными для пользователя, поэтому ему предо-
предоставляется возможность задавать системе вопросы. Вопросы могут
касаться как конкретных действий системы (вопрос типа «почему?»),
так и общего устройства самой системы — ее возможностей и ограниче-
ограничений (вопросы типа «что такое?», «как работает?»...). В свою очередь,
система сама может задавать пользователю вопросы с целью уточнения
его желаний, выяснения его намерений, определения его уровня и т. д.
В системе FLEX предусмотрена возможность получения информа-
информации о результатах действий системы, в частном случае, в систему может
поступить сообщение о реакции программиста на действия системы.
Эта информация позволяет системе корректировать свои действия, все
точнее настраиваясь на конкретного программиста.
Что касается неточных знаний, то они могут возникнуть в системе
FLEX, например, в результате анкетирования (программист может
неточно оценить, либо скрыть свой уровень) либо в результате того,
что фрейм пользователя был первоначально подобран неточно. Такого
рода неточные знания, как уже говорилось ранее, корректируются
в процессе работы программиста.
Основным для экспертных систем, помимо прочего, является нали-
наличие развитой базы знаний. В системе FLEX знания организованы во
фреймы, которые динамически пополняются или изменяются в про-
процессе работы пользователей. Очевидно, что настоящую ценность такая
система приобретает только при наличии большого числа предусмот-
предусмотренных ситуаций, т. е. при наличии объемной базы знаний. Формирова-
Формирование этой базы знаний и является следующим этапом работы создателей
системы.
Таким образом, система FLEX, по существу, является «оболочкой»
экспертной системы, предназначенной для программистов на языке
Лисп. Ее принципы могут быть положены в основу создания подоб-
подобных систем и для других интерактивных языков программирования.
Наконец, поскольку общение пользователя с операционной системой
компьютера также носит простой интерактивный характер, то систему
FLEX можно в определенном смысле считать прототипом интеллекту-
интеллектуальной операционной системы из разд. 5.2.
5.4] Локально обучающаяся система поддержки ввода информации 253
5.4. Локально обучающаяся система поддержки
ввода информации
С широким распространением вычислительной техники связана
важнейшая задача обеспечения пользователя удобными средствами
взаимодействия с компьютером в диалоговом режиме. Особая роль
принадлежит персональным компьютерам, давшим возможность мас-
массовой проверки разнообразных форм обобщения, некоторые из которых
являются определенным развитием ранее существовавших идей, а дру-
другие — например «многооконный интерфейс» — совершенно новыми.
В последнее время стало ясно, что дальнейший прогресс средств,
обеспечивающих удобство общения с компьютером, определяется не
только появлением новых технических решений (многооконный ин-
интерфейс, тактильный терминал, графические средства ввода, «мышь»
и т. п.), но и возможностью для компьютера, обучаясь, «подстраи-
«подстраиваться» под решаемую данным пользователем данную задачу. Именно
на такой возможности основаны так называемые интеллектуальные
операционные системы (см. [Стефанюк, 1982; Стефанюк и Алексеева,
1986] и разд. 5.3) и подобные им диалоговые системы, являющиеся
примерами локально-организованных систем.
Важно отметить, что полезность того или иного предложения зави-
зависит от целого ряда чисто практических соображений, таких, как класс
решаемых пользователем задач, персональные свойства пользователя
(его привычки, предпочтения, интеллектуальный уровень и т. п.), нали-
наличие достаточных памяти и производительности компьютера, оснащен-
оснащенность средствами ввода информации (например богатство клавиатуры
терминала). Без детального учета этих и других факторов любая идея
рискует остаться чисто теоретической рекомендацией, которая, быть
может, никогда и не найдет своего применения.
Кратко содержание настоящего раздела можно сформулировать
так: описывается локально-организованная обучающаяся система
PROMPTER, обеспечивающая оператора подсказкой в форме
некоторого «текущего меню», отражающего повторяемость вводимой
им текстовой информации.
Эта система первоначально была разработана специально для од-
одного конкретного ее приложения — автоматизации ввода грузодоку-
ментов в ЭВМ, осуществляемого оператором морского порта в ходе
погрузки судна. При ее создании были использованы некоторые прин-
принципы обучения путем «минимального» обобщения [Жожикашвили и
Стефанюк, 1986а; 19866], см. также разд. 4.5 выше, а также практиче-
практический опыт, накопленный при использовании системы, которую можно
было бы считать упрощенным прототипом системы PROMPTER. Этот
опыт, также как и опыт, полученный на этапе реализации системы
PROMPTER, показал, что сфера ее применения может быть достаточ-
достаточно широкой и поэтому эта система заслуживает специального описания.
Заканчивая введение, отметим, что система PROMPTER реали-
реализована в виде пакета программ на языке Лисп, и в дальнейшем для
254 Использование локальной организации [Гл.5
простоты мы будем называть системой PROMPTER как этот пакет,
так и ту идею поддержки ввода информации, которую он реализует *).
5.4.1. Диалоговая система как автомат. Для описания запросо-
ответной формы диалога с компьютером часто используется представ-
представление процесса диалога, как функционирование во времени некоторого
автомата. Так, подобный диалоговый процесс в работе [Павлюк и Рос-
сиков, 1986] описывается как поведение конечного автомата, имеющего
конечное множество состояний s = {si,...,,s/c}h конечное множество
действий e = {ei,...,en}, причем функция переходов / представляет
собой элементарную композицию двух функций, первая из которых
ставит в соответствие текущему состоянию множество альтернатив-
альтернативных состояний, в которые, в принципе, возможен переход, а вторая,
задаваемая пользователем, — обеспечивает выбор из них ровно одного
состояния, а именно того, которое устраивает пользователя в соответ-
соответствии с его функцией предпочтения g.
Формальной моделью такого процесса является совокупность (см.
[Павлюк и Россиков, 1986])
= (s,e,f,g,t),
где t — моменты времени, определяемые действиями пользователя.
В такой модели конечность используемого автомата существенно
упрощает дело, позволяя, например, непротиворечиво определить дей-
действия, совершаемые ЭВМ «по умолчанию»: если пользователь опреде-
определенно отказывается принять решение, то ЭВМ может просто повторить
последнее действие пользователя, которое тот совершил находясь в точ-
точности в той же ситуации.
Тем не менее приведенное описание диалога является слишком бед-
бедным, по нашему мнению. Оно не пригодно, например, для описания
обучающихся диалоговых систем, примерами которых может служить
система FLEX (см. разд. 5.3), система PROMPTER и им подобные.
Дело в том, что конечно-автоматные модели, хотя и могут охватывать
некоторые простейшие формы запоминания (необходимые, например,
для действий по умолчанию), но не описывают собственно обучения,
ведущего к пополнению (или другой реорганизации) множества состо-
состояний s и множества действий е. В частности, в результате обучения
в системах FLEX или PROMPTER приходится иметь дело с изменяю-
изменяющимся числом состояний (действий), так что, вообще говоря, процесс
лишь с малой вероятностью может повториться буквально, что необхо-
необходимо для действий по умолчанию в смысле работы [Павлюк и Россиков,
1986].
) Исследование выполнялось в рамках договора о социалистическом со-
сотрудничестве между Институтом проблем передачи информации АН СССР
и Государственным проектно-изыскательским и научно-исследовательским
институтом морского транспорта.
5.4] Локально обучающаяся система поддержки ввода информации 255
Формальная модель обучающейся диалоговой системы может быть
записана в следующем виде:
где s, e — произвольные множества состояний и действий, / — функция
переходов, определяемая возможностями такого автомата и выбором
пользователя, g — функция предпочтения, обуславливающая выбор
пользователя, а величины Хзч Хе> Xf представляют собой, соответствен-
соответственно, правило изменения множества состояний, правило изменения мно-
множества действий и правило изменения функции переходов х).
Пример задания правил х в случае системы FLEX можно най-
найти в работах [Стефанюк и Алексеева, 1986; 1987]. В случае анали-
анализируемой здесь системы PROMPTER интересующие нас множества
и правила их изменения, определяющие формальную модель диалога,
достаточно просты. В следующем разделе мы дадим описание системы
PROMPTER на языке этих множеств и правил.
5.4.2. Описание системы PROMPTER в виде формальной модели.
Опишем несколько упрощенный вариант системы PROMPTER, опус-
опуская некоторые детали, связанные с ее реализацией.
Моменты времени t определяются нажатием пользователем любой
клавиши на терминале, что соответствует вводу им в систему одной
буквы (или цифры). Особую роль контрольно-управляющих клавиш
мы пока не будем принимать во внимание.
В начальный момент t = 0 множество s содержит один элемент,
множество действий пусто, правила изменений этих множеств непри-
-1 A)
менимы, пока в момент t = 1 не поступит от пользователя символ а\ —
начало вводимой строки.
Пусть состояние вц определяется набранной пользователем це-
(t) (t) (t) / г ч
почкой символов а\ , а\ , . . . , а\ (включая пробелы), которая всегда
высвечивается на экране терминала.
Пусть состояние s\ — это внутреннее состояние системы
PROMPTER, точнее состояние дерева, которое строится системой
от сеанса ввода информации к сеансу. Ребра этого дерева помечены
одиночными символами из числа тех, которые когда-либо вводились
пользователем.
Тогда состояние s^ системы в произвольный момент времени t
задается парой состояний вц , sA , т. е. множество s является прямым
произведением множеств вц и s^ .
Далее мы рассмотрим несколько первых тактов работы системы, из
которых можно получить содержательное представление относительно
компонент формальной модели, предложенной в конце предыдущего
раздела.
) Д. А. Поспелов назвал подобные системы семиотическими [Поспелов,
1986].
256
Использование локальной организации
[Гл.5
Будем называть сеансом ввод конкретной строки символов от на-
начала либо до конца, либо до момента поступления реакции от системы
PROMPTER. В ходе первого сеанса общения пользователь задает до
конца строку информации (которая затем поступает в некоторую базу
данных, но в данном разделе мы этим обстоятельством не интересуем-
интересуемся). В первом сеансе указанное выше дерево пусто.
Во втором сеансе в качестве дерева будет выступать введенная поль-
пользователем в первом сеансе строка символов. На самом деле, это дерево
последовательно строилось в первом сеансе, так что с поступлением
каждого нового символа в нем создавалась новая ветвь, но это никак
не отражается на работе системы. Если первый символ, введенный
B)
пользователем во втором сеансе, т. е. а\ , совпадает с пометкой первого
ребра дерева, то на экране высвечивается копия этого дерева, которая
служит в данном случае подсказкой.
Получив подсказку, пользователь может либо продолжить набор
своей собственной цепочки символов, не обращая внимания на появ-
появление подсказки, либо перейти на рассмотрение показанного ему пути
по дереву. При этом он может либо достраивать этот путь, либо его
укорачивать, зачеркнув необходимое число символов с конца.
м
о
р
с
к
о
е
п
а
Р
о
X
о
д
с
т
Рис. 5.6. Развитие дерева системы от сеанса к сеансу
В любом случае в ходе второго сеанса пользователь вводит неко-
B) B) B) г
торую строку символов а\ , а2 , . . . , а\2 , которая будет использована
в системе PROMPTER для модификации дерева при подготовке его
к третьему сеансу. В ходе этой модификации выделяются общие части
у этого дерева и вводимой информации способом, который показан на
рис. 5.6. Три дерева, изображенные на этом рисунке, соответствуют тем
деревьям, которые возникают после первого, второго и третьего сеанса:
5.4] Локально обучающаяся система поддержки ввода информации 257
1-й сеанс введено: морское пароходство
дерево: рис. 5.4 а
2-й сеанс введено: м
подсказка: морское пароходство
введено: орское судно
дерево: рис. 5.4 б
3-й сеанс введено: м
подсказка: морское пароходство
морское судно
введено: орские порты
дерево: рис. 5.4 в
Таким образом, после k-го сеанса дерево представляет собой простое
обобщение всех поступивших в систему к цепочек символов, которое
является частным случаем взятия наименьшего обобщения к ситуаций,
как обсуждалось в разд. 4.5 (см. также ниже п. 5.4.3).
Итак, мы дали качественное, описание таких элементов формаль-
формальной модели, как ход диалога запросо-ответного характера, правило
изменения множества действий (подсказки, поступающие от системы),
правило изменения функции переходов между состояниями системы.
Замечание I . При вводе оператором лишь алфавитно-
цифровой информации множество состояний системы оказывается
счетным.
Замечание 2. Описывая систему, мы не затронули механизма
работы с управляющими символами, которые в системе носят одно-
однородный характер и поэтому не включаются в формируемое системой
дерево: переход на другую строку, вычеркивание символов по одному
с конца, конец ввода строки («перевод каретки»).
В результате, пользователь в настоящее время не в состоянии с тер-
терминала управлять самим деревом. Однако нетрудно представить себе
модификацию системы, при которой пользователю разрешается при
вводе информации прибегать к некоторым специальным (управляю-
(управляющим) символам или их цепочкам, которые могли бы привести в дей-
действие некоторую продукцию, связанную с деревом, влияющую либо на
все дерево, либо на его часть, либо на характер просмотра дерева и т. п.
5.4.3. Теоретико-категорное описание системы. Теоретические
идеи, на которых основано обучение в системе PROMPTER, были
разработаны в рамках исследования систем представления знаний,
способных обучаться посредством накопления и обобщения знаний
(см. гл. 4). В теоретическом плане алгоритмы хранения, извлечения
информации и усвоения новой информации, используемые системой
PROMPTER, являются частным случаем алгоритмов, изложенных
в п. 4.5.3. Действительно, работа системы допускает описание на
предложенном в разд. 4.5 теоретико-категорном языке, которое мы
приводим ниже.
Рассмотрим множество символов Л, которые могут поступить на
вход системы. В системе PROMPTER в качестве множества А вы-
9 Стефанюк
258 Использование локальной организации [Гл.5
ступает множество букв, цифр и других знаков, которые можно вве-
ввести с клавиатуры компьютера, однако теоретически оно может быть
произвольным, например содержать отдельные слова, пиктограммы
и т. д. Обозначим символом W множество всех последовательностей
оо
элементов из множества Л, т. е. W = (J Ап. Для каждой последо-
п=0
вательности и из множества W определим отображение (ри : W —>
—>• W формулой ifu(v) = uv для любой v G W. Рассмотрим теперь
категорию, содержащую единственный объект — множество W, и мно-
множество морфизмов Нот (VK, W) = {(ри\и Е VK}. То обстоятельство, что
это действительно категория, проверяется элементарно, в частности,
тождественным морфизмом является отображение (р0, где символ 0
обозначает пустое множество, а композицией морфизмов (ри и tpv —
морфизм ipuv. Отметим, что, как известно, любую полугруппу можно
рассматривать как категорию с единственным объектом; в данном
случае такой полугруппой является множество W с операцией «при-
«приписывания» — т. е. свободная полугруппа с множеством образующих
А.
Следуя терминологии раздела 4.5, будем называть пару W и мор-
морфизм описанной категории образцом. Согласно этой, терминологии
образец (W,ipu) является частным случаем образца (VK, <pv), а образец
(W,ipv) — обобщением образца (W,ipu), если существует морфизм tpw
такой, что (ри = (pv(pw. Это означает, что для некоторой последователь-
последовательности w из множества W выполнено равенство и = vw, иначе говоря,
последовательность v является «началом» последовательности и.
Для пояснения этого определения заметим, что последовательность
и = ai, . . . , am, рассматриваемая как образец, описывает множество
последовательностей, у которых первые т символов известны и равны
«1, . . . , am, а остальные символы (и их количество) могут быть произ-
произвольными. Если теперь v = ai, . . . , ап и п ^ га, то образец, соответ-
соответствующий последовательности v, описывает множество последователь-
последовательностей, у которых первые п символов равны ai, . . . , ап. Это множество
включает в себя предыдущее, поэтому образец (W,(pv) является более
общим, чем (VK, ipu).
Пусть и = ai, . . . , ап и v = &i, . . . , bm — две последовательности из
множества VK, причем сц = bi при г < kwak ф Ъ^. Несложно убедиться,
что наименьшим обобщением образцов (VK, (ри) и (VK, (pv) будет образец
{W,<pw), где w = ai,...,ajfe_i — наибольшая последовательность,
являющаяся «началом» последовательностей как и так и v.
Если первые символы последовательностей и и v различны, их
наименьшим (и единственным) обобщением будет пустая последова-
последовательность. (Здесь и далее мы не различаем последовательность и и свя-
связанный с ней образец (W,(pu). Очевидно, что всякая пара последова-
последовательностей имеет ровно одно наименьшее обобщение.
Система PROMPTER получает на вход последовательности
символов, т. е. элементы множества W. Все введенные в систему
последовательности хранятся в памяти. При поступлении в систему
очередной последовательности, эта последовательность отыскивается
5.4] Локально обучающаяся система поддержки ввода информации 259
в памяти, если она уже встречалась (или встречалась ее начальная
часть), либо записывается в память, если она встретилась впервые.
Последовательности хранятся в памяти в виде дерева. Количе-
Количество последовательностей, известных системе, равно количеству
листьев дерева, каждому листу соответствует последовательность,
получающаяся, если пройти по ветвям от корня до этого листа
и выписать подряд все последовательности, соответствующие этим
ветвям. Так, например, дерево, изображенное на рис. 5.7, описывает
три последовательности: и, vw и vz\ здесь буквы и, v, w, z
обозначают некоторые элементы множества
W. Если считать, что каждая ветвь обозна-
обозначает морфизм, соответствующий ассоцииро-
ассоциированной с этой ветвью последовательности, мы
приходим к описанной в п. 4.5.3 сети образ-
образцов. Сформулируем приведенный там алго-
алгоритм сопоставления ситуации с деревом на
языке наших последовательностей. J
Пусть на вход системы поступает, напри-
например, последовательность и. Возможны два рис. 5.7. Пример дерева
варианта: последовательностей
1. Существует вершина дерева р и ветвь,
ведущая от корня к этой вершине, причем
соответствующая этой ветви последователь-
последовательность v является началом последовательности и, т. е. для некоторой
последовательности w из W имеем и = vw (на языке образцов это
означает, что ipu является частным случаем (fv). В этом случае ал-
алгоритм рекурсивно применяется к последовательности w и поддереву
с корнем р.
2. Такой ветви не существует. В этом случае ищется ветвь v из
корня в некоторую вершину р такая, что существует нетривиальное
минимальное обобщение tpw образцов фи и <pv, поэтому и = wx и v =
= wy для некоторых w,x,y E W. Ветвь v исключается из дерева,
к дереву добавляются новые вершины q и г и следующие ветви: w
из корня в д, х из q в г и у из q в р. (Если подходящей ветви v
нет, к дереву просто добавляется новая вершина q и ветвь и из корня
в q. Из анализа алгоритма очевидно, что может существовать не более
одной ветви v, удовлетворяющей условию 1, и не более одной ветви v,
удовлетворяющей условию 2.)
Используя дерево образцов, система PROMPTER может контроли-
контролировать ввод последовательностей, обеспечивая пользователя опреде-
определенным сервисом — возможностью вернуться в предыдущее состояние,
изображением возможных вариантов в виде меню и т. д.
260 Использование локальной организации [Гл.5
5.4.4. Выбор параметров в системе PROMPTER. При создании
системы PROMPTER планировалось, что она будет давать следующие
преимущества V :
I. Система облегчит ввод информации.
II. Система ускорит ввод данных.
III. Система позволит избежать ряда синтаксических и семантиче-
семантических ошибок.
IV. Система обеспечит стандартизацию записей в базе данных.
Ясно, однако, что пользователь-оператор будет к ней прибегать (за-
(заметим, что по самому замыслу системы «упрямый» пользователь все-
всегда может просто игнорировать появляющиеся на экране подсказки),
лишь если оператору самому будут очевидны преимущества системы,
т. е. если будут выполнены свойства I и II.
Чтобы сделать соответствующие оценки, примем следующие упро-
упрощающие выкладки соображения.
Пусть все подсказки, порождаемые системой PROMPTER в неко-
некоторый момент, размещаются на экране размером L по горизонтали (на
самом деле в системе предусмотрены средства визуализации и более
длинных путей по дереву). Пусть число подсказок, т. е. путей по дереву,
равно //, где Н — размер экрана дисплея по вертикали.
Таким образом, после задания оператором символа а под последним
высвечивается набор подсказок, который мы будем называть «меню»,
и пусть в наиболее близкой к намерениям оператора подсказке имеется
/ символов из числа тех, которые оператор намеревался ввести.
Если через т обозначить среднее время, которое тратится опера-
оператором на ввод некоторого конкретного символа, а через тп — среднее
время при многократном повторении нажатия некоторой выбранной
клавиши (эта операция возникает при перемещении по меню и при
стирании лишних символов в пределах некоторой выбранной строки
меню), то оператор будет фактически пользоваться услугами, предо-
предоставляемыми системой PROMPTER лишь при выполнении такого со-
соотношения:
(f - l) тп + т + (L - I - 1) тп + т < 1т.
Упростив это соотношение, учитывая, что Н = — L, имеем
80
иными словами, получаем
. A,15/ -2)т„-
) Могут быть и недостатки. Например, оператору может показаться пра-
правильной некоторая не подходящая ему подсказка и он, не задумываясь, ею
воспользуется.
5.4] Локально обучающаяся система поддержки ввода информации 261
Несложный эксперимент (см. ниже), проведенный для одного до-
достаточно опытного оператора, показал, что порядок отношения времен
примерно следующий: г « 2,5 тп. Отсюда получаем при L = 80,
что условием целесообразности использования системы PROMPTER
является требование, чтобы «угадывалось» не менее 27 символов из
числа задуманных оператором. Сразу же отметим, что из приведенных
выкладок следует, что при глубине дерева меньшей, чем размер экрана,
требование на размер «угаданной» части вводимой строки ослабляется.
Замечание 1 . В приведенном выше анализе не принимаются
во внимание (кроме всего прочего!) следующие два фактора. С одной
стороны, оператор будет тратить также определенное время на обна-
обнаружение в меню подходящей подсказки. Это время, однако, невелико
из-за «иконного» восприятия экрана дисплея опытным оператором.
С другой стороны, в настоящем варианте системы используется всего
четыре контрольных клавиши (конец ввода строки, перемещение по
меню вверх и вниз, вычеркивание символов с конца строки), к место-
местоположению которых оператор быстро привыкает и тратит на их поиск
меньше времени, чем величина т.
Эти факторы действуют в противоположном направлении, и для
простоты анализа мы будем ими пренебрегать. (Также как и разли-
различием действий оператора по перемещению курсора по вертикали и по
горизонтали экрана, которое ожидается в связи с некоторыми психо-
психофизическими свойствами зрения.)
Замечание 2. Целесообразно ограничить число подсказок
в меню, по крайней мере, числом строк, которые помещаются на
экране. По этой причине, а также учитывая приведенный выше
анализ, было решено ввести в систему PROMPTER два параметра
/г, /. Параметр h ограничивает сверху число возможных строк в меню,
а / — показывает минимально допустимое число символов в каждой
строке меню. Если имеющееся дерево таково, что этим границам
удовлетворить невозможно, то подсказка на экране не появляется.
Экспериментальная оценка параметров т, тп. Для оценки т вы-
вычислялось среднее время ввода символа (с учетом пробелов, конца
строки и т. д.) при вводе в компьютер текста очень хорошо известного
оператору стихотворения. Предполагалось, что при этом внимание опе-
оператора не отвлекается ни на какую другую задачу, кроме ввода каждого
отдельного символа.
Поскольку несколько проведенных экспериментов дали весьма
близкие результаты, то ниже мы будем описывать один из них, считая
его типичным.
Ввод стихотворения из 116 символов на терминале Data General
занял 59 секунд, т. е. г = 0,51 секунд. (Для сравнения заметим, что тот
же оператор на терминале Videoton показал г = 0,47 секунд.) Хорошая
машинистка *) вводит 250—300 знаков (и более) в минуту, т. е. ввод
) Березин Б. И. Самоучитель машинописи. — М.: Легкая индустрия,
1969. - 157 с.
262
Использование локальной организации
[Гл.5
знаков данным оператором осуществлялся в 2-2,5 раза медленнее, чем
это делала бы профессиональная машинистка. Однако как будет видно
из дальнейшего, если отбросить время поиска соответствующей кла-
клавиши и сконцентрироваться только на ее нажатии, то характеристики
оператора могут и превосходить характеристики хорошей машинистки,
которая, видимо, также не тратит время на поиск клавиши.
Полученная выше величина т использовалась во второй серии экс-
экспериментов, в которой требовалось, чтобы оператор вводил строки из
одинаковых букв до тех пор, пока курсор не «упирался» в предва-
предварительно наклеенную на экран терминала бумажную полоску. Чтобы
сделать результаты статистически
сопоставимыми с первым экспе-
экспериментом, оператор должен был
вводить несколько строк, нажимая
в конце строки «возврат каретки»,
причем в каждой строке использо-
использовалась своя буква и буквы эти бра-
брались подряд из начала алфавита.
Данные этого эксперимента от-
отражены на рис. 5.8 и сведены в таб-
таблицу 5.2 (эксперимент повторял-
повторялся для различных длин вводимой
строки).
Поскольку задачей этой серии
было определить «чистое» время
при многократном нажатии одной
клавиши, то при его подсчете мы
вычитали из общего времени ввода строки время поиска буквы и время
нажатия клавиши «возврат каретки». В соответствии с таблицей и была
выбрана величина тп, использованная в предыдущем разделе.
0,5-
0,3-
1
I
10
20
30
I
40
Рис. 5.8. Изменение времени ввода
символа в зависимости от длины
вводимой строки
Таблица 5.2. Данные эксперимента
Длина строки
10
20
30
40
Время на строку, с
29
39
54
64
«Чистое» время, с
3,11
2,00
1,83
1,61
5.4.5. Применение системы PROMPTER при работе с портовой
документацией. При создании автоматизированной системы передачи
и обработки грузовых документов между морскими портами возникает
отдельная задача подготовки информационных файлов для их после-
последующей передачи по каналам связи [Стефанюк, 1987а].
Подробное описание характера используемых в морском порту до-
документов выходит за рамки настоящей работы (см. [Стефанюк, 1987а]),
5.4] Локально обучающаяся система поддержки ввода информации 263
но чтобы дать общее представление, отметим, что все документы мож-
можно разбить на три группы:
I — документы, сопровождающие груз в пути следования до момен-
момента прихода груза в порт его отправки (железнодорожная накладная,
дорожная ведомость и т. п.);
II — документы, создаваемые в порту и сопровождающие груз во
время перевозки морем (погрузочный ордер, передаточная ведомость,
каргоплан, люковые записки и т. п.);
III — документы, создаваемые в порту для внутренних целей и
остающиеся в архиве порта (тальманские листки, коммерческие акты,
сведения экспедитора, опись груза, амбарная книга, книжки погрузки).
Подробный анализ документооборота показывает, что большая
часть содержащейся в них информации неоднократно дублируется.
Чрезвычайно велик объем ручного труда при их обработке (так из
Архангельска в Дудинку по железной дороге и водным артериям про-
проходит 28 тысяч партий груза по накладным. Кроме того, за навигацию
осуществляется более 100 судоотходов при 200-400 погрузоордерах на
каждом судне).
Недостаток времени на анализ информации, содержащейся в доку-
документах, часто приводит к ошибкам при составлении новых документов.
Система PROMPTER нацелена на то, чтобы облегчить ввод рекви-
реквизитов и подготовку документов группы II, попутно решив также ряд
других важных задач:
1. Подготовить файл для передачи данных о погрузке в порт назна-
назначения судна.
2. Избежать дублирования и разночтения данных (по возможно-
возможности).
3. Упростить (облегчить, ускорить) ввод данных.
4. Создать стандартную ячейку сети ЛИСПНЕТ, предназначенную
для включения в сеть автоматизированной подготовки и передачи
грузовой информации.
В настоящее время система PROMPTER реализована как пакет
программ на языке Лисп. Система позволяет создавать стандартный
информационный файл DATA.LSP, который совместно с файлом «ша-
«шапок документов» NAMES.LSP, позволяет с использованием функции
REPORT выдать содержательный файл, удобный для контроля теку-
текущего состояния документов. Приведем распечатки этих файлов.
Распечатка файла входных данных:
К50016
Ф0РМА5
2,00 ДОЛ.
200000 ДОЛ.
264 Использование локальной организации [Гл.5
100000 ДОЛ.
ВОСТОЧНЫЙ
АНАДЫРЬ
Т/Х КАПИТАН КРЕМС
П/0 "СПАССКЦЕМЕНТ" СПАССК-ДАЛЬНИЙ. 5 Р/С 9259001 В СПАССКОМ ОТД.
Г/Б
УПР. СНАБЖЕНИЯ И СБЫТА МАГАД. ОБЛИСПОЛКОМА 685026,
Г. МАГАДАН, УЛ. БАЗОВАЯ 1, Р/С 92532101 В МАГАДАНСКОМ ГОРУПРАВЛЕНИИ
Г/Б
ПОРТЛАНДЦЕМЕНТ СТРОИТЕЛЬНЫЙ М-500
НЗПБ СК12
20240
360
4
ЕСТЬ
4/2
Распечатка файла позиций документа и атрибутов системы:
(((НОМЕР КОНОСАМЕНТА:))
((НОМЕР ФОРМЫ ПЕРЕСЫЛАЕМОГО ДОКУМЕНТА:))
((СТАВКА ФРАХТА:))
((ПОЛУЧЕНО В СЧЕТ ФРАХТА:))
((ПОДЛЕЖИТ ПЕРЕВОДУ НА ПОЛУЧАТЕЛЯ:))
((НАИМЕНОВАНИЕ ПОРТА ОТПРАВЛЕНИЯ:) "SOURCE.TRE")
((НАИМЕНОВАНИЕ ПОРТА НАЗНАЧЕНИЯ:) "DESTIN.TRE")
((НАИМЕНОВАНИЕ СУДНА:) "STEAMER.TRE")
((НАИМЕНОВАНИЕ, АДРЕС, РАСЧЕТНЫЙ СЧЕТ ГРУЗООТПРАВИТЕЛЯ:)
"SENDER.TRE")
((НАИМЕНОВАНИЕ, АДРЕС, РАСЧЕТНЫЙ СЧЕТ ПЕРЕВОЗЧИКА:)
"CARRIER. TRE")
((НАИМЕНОВАНИЕ, АДРЕС, РАСЧЕТНЫЙ СЧЕТ ГРУЗОПОЛУЧАТЕЛЯ:)
"RECEIVER.TRE")
((НАИМЕНОВАНИЕ ГРУЗА:))
((ШИФР ГРУЗА:))
((ИМЕЮЩИЕСЯ НА ГРУЗЕ МАРКИ, ОТТИСКИ ПЛОМБ:))
((МАССА ГРУЗА В КГ ИЛИ В КУБОМЕТРАХ:))
((ЧИСЛО МЕСТ В ПАРТИИ:))
((НОМЕР ТРЮМА:))
((СОГЛАСИЕ НА ПЕРЕВОЗКУ ГРУЗА НА ПАЛУБЕ:) "CONFIRM.TRE")
((КООРДИНАТЫ МЕСТА РАСПОЛОЖЕНИЯ ГРУЗА НА СУДНЕ:)))
Подробная распечатка документа:
НОМЕР КОНОСАМЕНТА:
К50016
НОМЕР ФОРМЫ ПЕРЕСЫЛАЕМОГО ДОКУМЕНТА:
Ф0РМА5
СТАВКА ФРАХТА:
2,00 ДОЛ.
ПОЛУЧЕНО В СЧЕТ ФРАХТА:
5.4] Локально обучающаяся система поддержки ввода информации 265
200000 ДОЛ.
ПОДЛЕЖИТ ПЕРЕВОДУ НА ПОЛУЧАТЕЛЯ:
100000 ДОЛ.
НАИМЕНОВАНИЕ ПОРТА ОТПРАВЛЕНИЯ:
ВОСТОЧНЫЙ
НАИМЕНОВАНИЕ ПОРТА НАЗНАЧЕНИЯ:
АНАДЫРЬ
НАИМЕНОВАНИЕ СУДНА:
Т/Х КАПИТАН КРЕМС
НАИМЕНОВАНИЕ, АДРЕС, РАСЧЕТНЫЙ СЧЕТ ГРУЗООТПРАВИТЕЛЯ:
П/0 <СПАССКЦЕМЕНТМ СПАССК - ДАЛЬНИЙ, 5 Р/С 9259001
В СПАССКОМ ОТД. Г/Б
НАИМЕНОВАНИЕ, АДРЕС, РАСЧЕТНЫЙ СЧЕТ ПЕРЕВОЗЧИКА:
ДАННЫЕ НЕ ЗАНЕСЕНЫ
НАИМЕНОВАНИЕ, АДРЕС, РАСЧЕТНЫЙ СЧЕТ ГРУЗОПОЛУЧАТЕЛЯ:
УПР. СНАБЖЕНИЯ И СБЫТА МАГАД. ОБЛИСПОЛКОМА 685026, Г. МАГАДАН,
УЛ. БАЗОВАЯ 1, Р/С 92532101 В МАГАДАНСКОМ ГОРУПРАВЛЕНИИ Г/Б.
НАИМЕНОВАНИЕ ГРУЗА:
ПОРТЛАНДЦЕМЕНТ СТРОИТЕЛЬНЫЙ М-500
ШИФР ГРУЗА:
ДАННЫЕ НЕ ЗАНЕСЕНЫ
ИМЕЮЩИЕСЯ НА ГРУЗЕ МАРКИ. ОТТИСКИ ПЛОМБ:
НЗПБ СК12
МАССА ГРУЗА В КГ ИЛИ В КУБОМЕТРАХ:
20240
ЧИСЛО МЕСТ В ПАРТИИ:
360
НОМЕР ТРЮМА:
4
СОГЛАСИЕ НА ПЕРЕВОЗКУ ГРУЗА НА ПАЛУБЕ:
ЕСТЬ
КООРДИНАТЫ МЕСТА РАСПОЛОЖЕНИЯ ГРУЗА НА СУДНЕ:
4/2
При необходимости последний файл может быть распечатан в ко-
колонках такого стандартного портового документа, как коносамент.
5.4.6. Детали реализации. Как отмечено выше, система
PROMPTER была реализована в виде программного пакета,
написанного на языке Лисп. Выбор языка для реализации системы
является сложным вопросом. Использование некоторых других языков
не столь высокого уровня, например языка Си, а тем более, языка
Ассемблера, позволило бы создать более эффективную программу,
которая, к тому же, занимала бы меньше места в оперативной памяти
компьютера. Тем не менее, ряд соображений привел авторов к выбору
языка Лисп. Изложим вкратце эти соображения.
Использование Лиспа позволило создать довольно сложную про-
программу в сравнительно короткие сроки. Это было связано не только
с тем, что Лисп имеет развитые средства поддержки программиро-
программирования и отладки, значительно облегчающие работу программиста, но
и с тем,что Лисп имеет механизмы, которые при работе с другими
266 Использование локальной организации [Гл.5
языками пришлось бы специально реализовывать. Дело в том, что
списковые структуры, являющиеся основным типом данных в язы-
языке Лисп, являются идеальным способом для представления деревьев
в памяти компьютера. Особенно ярко возможности Лиспа проявляются
при работе с деревьями, которые могут «разрастаться», причем новые
ветви могут «вырастать» из любой вершины дерева. В такой ситуации
лисповские локально-действующие динамические процедуры выделе-
выделения памяти и процедуры «сборки мусора», позволяющие освободить
неиспользуемую более память, являются незаменимыми. При работе
на традиционных языках пришлось бы специально программировать
такие процедуры.
Другая причина использования языка Лисп — его локальная органи-
организация: он дает возможность создать легко перестраиваемую программу,
позволяющую вносить изменения в работу отдельных элементов систе-
системы, не переделывая ее целиком (см. обсуждение в начале гл. 5). Предпо-
Предполагалось, что система PROMPTER должна работать по-разному в за-
зависимости от типа пользователя, от характера вводимой информации.
Способ отображения информации на экране дисплея должен зависеть
от возможностей этого дисплея, наконец, способ представления дере-
деревьев в памяти мог зависеть от особенностей конкретного компьютера.
Использование локально-организованной структуры языка Лисп
позволило создать программу с модульной структурой, отдельные ком-
компоненты которой можно переделывать или заменять независимо. Так,
например, основная программа работы с деревом состоит из трех доста-
достаточно независимых блоков. Управляющий блок контролирует процесс
движения по дереву; он ответственен за выполнение описанного выше
алгоритма поиска информации и пополнения дерева. Связь с поль-
пользователем реализуется с помощью другого блока, управляющий блок
обращается к нему с помощью функции GET_INF для получения ин-
информации от пользователя и функций SHOW и UNSHOW для выдачи
информации пользователю. Информация пользователю может быть
выдана в виде одной строки или в виде меню, которое может видо-
видоизменяться в зависимости от структуры информации и возможностей
дисплея, но все это никак не меняет работу основного блока. Наконец,
отдельный блок «знает» о том, как представлено дерево в памяти ма-
машины. Управляющий блок обращается к нему с помощью небольшого
числа функций, например BRANCHES для получения списка ветвей,
выходящих из данной вершины, или GO_BACK для возврата по дереву
на один шаг. Можно изменять способ представления дерева, например
упаковывать отдельные его фрагменты для экономии памяти, можно
включать в дерево дополнительную информацию, не используемую
основным алгоритмом (например связать с каждой вершиной дерева
множество продукций, которые будут выполняться в нестандартных
ситуациях), опять сохраняя при этом основной алгоритм.
Локальная организация программы позволила сравнительно легко
реализовать системы типа PROMPTER на нескольких различных ма-
машинах с разными операционными системами и на разных диалектах
языка Лисп.
5.5] Использование знаний экспертов 267
Заключительные замечания. Исторически система
PROMPTER явилась для автора книги и руководимого им коллектива
«побочным продуктом» многолетних теоретических и эксперименталь-
экспериментальных исследований по разработке человеко-машинной системы перевода
с языка на язык, которую планировалось создавать на локальных
принципах и в которой обучению отводилась решающая роль (см.
детали и примеры в [Жожикашвили и Стефанюк, 1986а]). (Другим
«побочным» продуктом явилось теоретико-категорное описание задачи
представления знаний и задачи обучения, описанное в разд. 4.5
данной книги.) Однако система PROMPTER имеет, очевидно,
и самостоятельную ценность, не зависящую от упомянутой задачи
перевода.
Система PROMPTER может быть использована для поддержки
ввода данных во всех тех случаях, когда разнообразие алфавитно-
цифровых данных невелико по сравнению с общим числом вводимых
в систему данных, т. е. когда данные часто повторяются. Такое ограни-
ограничение выполняется во многих практических задачах, поскольку в них
обычно совокупность вводимых данных описывает некоторую узкую
область или даже некоторую конкретную концепцию. В качестве при-
примера отметим, что предшествовавшая системе PROMPTER система
с успехом использовалась когда-то в ИППИ АН СССР при организации
подписки на газеты и журналы.
В последнее время в западных программных продуктах все чаще
используется схема поддержки ввода данных, получившая название
«завершение строки» (completion), которая используется, например,
в редакторах серии GNU Emacs [Stallman, 1986]. Эта система напоми-
напоминает PROMPTER по своей сути. В GNU Emacs она также написана на
языке Лисп. Но человеко-машинный интерфейс в системах такого рода,
очевидно, развит в существенно более слабой степени, чем в нашей
системе PROMPTER.
5.5. Использование знаний экспертов при выявлении
последовательности оснований ДНК
Ниже предлагается новый подход и новые алгоритмы для восста-
восстановления имен оснований (нуклеотидов) по данным, полученным в 4-
канальном приборе, предназначенном для выявления последовательно-
последовательности оснований в ДНК с применением электрофореза. Подход основан на
соображениях из области экспертных систем и локальных топологиче-
топологических соображениях, которые позволяют избежать многих ошибочных
результатов при обработке типичного числового файла, получаемого
для каждой конкретной ДНК.
Показано, что в виду сложной природы процесса наблюдения ав-
автоматическое выявление последовательности оснований не всегда мо-
может рассматриваться как простая задача проверки гипотез или задача
распознавания образов. Оказалось, что для этой задачи наиболее под-
подходящей является технология экспертных систем и учет целого ряда
соображений локального характера.
268
Использование локальной организации
[Гл.5
5.5.1. Постановка задачи. Восстановление последовательности
оснований (base-calling) для данной ДНК с применением элек-
электрофореза представляет собой процедуру, работающую с большой
совокупностью измерений, сделанных фотодетектором, являющихся
результатом измерения уровня излучения четырех цветов. Эти цвета
обусловлены возбуждением флуоресцирующих терминальных меток,
прикрепленных к каждому члену данного олигомера, т. е. группы
однотипных отрезков ДНК, вызванным светом, поступающим от
четырех лазеров.
В последнее время техника идентификации оснований стала обыч-
обычным делом. Во многих лабораториях мира для этого используются
разнообразные установки, нацеленные на получение ясной картины
измерений. Однако несмотря на наличие многих изящных инженер-
инженерных решений идентификация последовательности оснований остается
медленной и дорогостоящей процедурой, что ограничивает ее более ши-
широкое применение в каждодневной практике медицинских учреждений
и в других случаях.
Пучки от 4-х
лазеров
Смесь
I олигомеров
Рис. 5.9. Принципиальная схема устройства для одномерной колончатой хро-
хроматографии
Выдвигались различные предложения по созданию установок, при-
призванных обеспечить быструю и надежную идентификацию. В качестве
примера можно привести секвенсер Applied Biosystems ABI 373 DNA.
В нем применяют химические метки четырех цветов в одномерной
колончатой хроматографии, предложенной еще в 1986 г. Смитом с со-
соавторами и в 1987 г. Коннелом с соавторами. В приборе используется
один фотометр, который порождает четыре записи данных на каждом
цикле сканирования геля, используемого в этой установке (рис. 5.9).
На каждом этапе сканирования флуоресцентное излучение от освеща-
освещаемой позиции в этом геле, предварительно пропущенное через четыре
полосовых фильтра, подвергается измерению с помощью фотоприем-
фотоприемника (см. описание в [Rudall, 1997]).
5.5]
Использование знаний экспертов
269
В идеале такие четыре лазера освещения порождают четкое соче-
сочетание пиков, отчетливо выявляющее каждый конкретный олигомер.
Благодаря этому появляется возможность приписать один из четырех
возможных знаков, т. е. G, А, С, Т (Гуанин, Аденин, Цитозин, Тимин),
чтобы показать тип нуклеотида этого олигомера и, в конечном счете,
установить вид соответствующего основания. В результате для данной
ДНК будет реконструирована последовательность {ж^}, г = 1,2,...,
в которой каждый Х{ выбирается из множества {G, А, С, Т} четырех
возможных азотистых оснований.
Однако реальная ситуация оказывается намного сложнее (см. рис.
5.10) *). Наблюдения оказываются зашумленными в силу различных
факторов, среди которых неконтролируемая фоновая засветка, ре-
регистрируемая непосредственно от освещающих лазеров, и дисперсия
членов олигомера — разброс времени появления флуоресцентного света
в окуляре фотоэлемента в пределах одной и той же группы отрезков
ДНК, имеющих одну и ту же длину. Масштаб указанной дисперсии
может даже скрыть различие между двумя соседними пиками. Эти
и другие явления могут серьезно снизить качество автоматической
идентификации оснований и поэтому проблема правильного приписы-
приписывания символов оснований наблюдаемым олигомерам все еще считается
трудной. Решению этой проблемы посвящен настоящий раздел книги.
1ШУ1А ЧТО AT r7V
10
i G T GACACT А ТАGa M3 A0CТАТЗА COT
и'ннш
Рис. 5.10. Образец реальных данных, полученных в результате хроматогра-
фического процесса
Предварительно заметим, что порядок символов оснований в ДНК
очень важен, так как тройка соседних нуклеотидов может составлять
так называемый кодон, т. е. код, задающий вполне определенную ами-
аминокислоту на этапе синтеза белков живого существа. Характер этой по-
х) Рис. 5.10 заимствован нами со следующей интернет-страницы:
http://www.biotech.missouri.edu/dnacore/sequencing/interpreting.html и
помещен здесь с любезного разрешения автора страницы Дж. Форрестера
(Joe Forrester) (он же приведен на обложке книги в цветном исполнении).
270 Использование локальной организации [Гл.5
следовательности в ДНК человека является уникальным, объясняя спе-
специфическое множество характеристик каждого индивидуума, идет ли
речь о физических размерах, или склонности к заболеваниям [Rudall,
1997]. Отсюда достаточно очевидно, что каждый «геномный» проект
начинается с определения последовательности оснований в конкретной
ДНК.
5.5.2. Близкие работы. Рассматриваемая область характеризуется
большим числом публикаций. Однако самой близкой к нашим исследо-
исследованиям нам показалась публикация [Tibbet et al., 1995], в которой сдела-
сделана попытка воспользоваться обучающимися нейросетями для улучше-
улучшения процедуры восстановления последовательности оснований. В этом
подходе проблема рассматривается как задача распознавания образов.
Благодаря обучению на большой выборке подобных ситуаций, исполь-
использованных для тренировки нейросети, было достигнуто существенное
улучшение качества обработки данных. Исследование в [Tibbet et al.,
1995] велось в тесном сотрудничестве с фирмой Du Pont Co.
Как и в большом числе других случаев (см. также ссылку [Wanders,
1995]), авторы работы [Tibbet et al., 1995] основывают свой анализ на
пиках, обнаруживаемых на кривых, аппроксимирующих наблюдаемые
данные: «Поиск пиков и оценка степени разделения олигомеров и их
интенсивностей выполняется с использованием алгоритма, применяю-
применяющего обработку сигнала с учетом второй производной» [Tibbet et al.,
1995].
Подобный подход обычно применяется во всех американских ДНК-
лабораториях, о которых нам известно.
5.5.3. Различные взгляды на определение последовательности
оснований.
5.5.3.1. Математический взгляд. Наблюдаемые данные выглядят
как обычный случайный процесс (см., например, Fig. 31.4 в работе
[Tibbet et al., 1995] или рис. 5.10). По этой причине многие авторы
заключали, что проблема приписывания некоторого значения для осно-
основания является проблемой испытания гипотез или задачей распозна-
распознавания образов. Однако, с математической точки зрения, эти данные
описывают довольно сложную последовательность некоторого числа
отрезков различных локальных случайных процессов, следующих друг
за другом. Более того, эти отрезки накладываются друг на друга в том
смысле, что наблюдаемые значения являются результатом суммирова-
суммирования нескольких значений, относящихся к соседствующим олигомерам.
Простой случай перекрытия показан на рис. 5.11, где мы изобразили
пример, взятый из реальной практики.
Схематический чертеж для более сложного случая показан на рис.
5.12.
На практике ситуация оказывается еще более запутанной, так как
имеется четыре частично перекрывающихся аддитивных процесса в ка-
каждом из четырех каналов измерения. Эта ситуация безусловно исклю-
исключает восстановление последовательности оснований путем анализа пи-
5.5] Использование знаний экспертов 271
ков, не считая самых простых случаев, кото-
которые, к счастью, составляют большинство на-
наблюдаемых данных.
Заметим, что описываемая трудность де-
делает также бесполезной применение обратной
матрицы флуоресценции для прямого вычис-
вычисления значений символов G, А, С, Т из наблю-
наблюдаемых данных.
Из-за описанных выше сложностей тради-
традиционные статистические методы оказываются
малопригодными в трудных случаях, изобра-
изображенных на рис. 5.11 и 5.12. Успех же с обучени-
обучением хорошему восстановлению, продемонстри-
продемонстрированный в работе [Tibbet et al., 1995], может
быть объяснен тем фактом, что все указанные
случайные отрезки все же имеют очень много
общего по своему характеру. Сложившаяся си-
ситуация напоминает в большой степени приме-
применение технологии экспертных систем для ди-
динамических прогнозов в сейсмологии [Стефа-
нюк, 1994], [Stefanuk, 2000a]. Так сейсмопро-
гноз, основанный на наблюдениях, сделанных
в различных точках Земли, становится тем не
менее возможным в силу подобия физических
явлений, происходящих в самых различных ме-
местах.
Видимо описанные выше трудности и объ-
объясняют попытки авторов [Tibbet et al., 1995]
подкорректировать свои результаты путем обу-
обучения дополнительным «апостериорным» пра- ~~
вилам редактирования. В табл. 5.3 приводится рис 5.11. «Плечо»
список действий по апостериорному редакти-
редактированию имени второго пика из двух пиков,
следующих друг за другом, заимствованный из
Table 31.1 работы [Tibbet et al., 1995].
5.5.3.2. С точки зрения обработки сигналов. Обработка сигналов,
известная из литературы, основывается на ожидании того, что форма
пиков на кривых напоминает форму функции ошибки.
Действительно, рис. 5.11 может быть представлен как результат
суммирования двух «гауссовских» форм, что и объясняет появление
там «плеча». Однако серьезных оснований для использования именно
такой формы нет. Например, во многих случаях лучше было бы ап-
аппроксимировать двумя пиками простой треугольной формы. При та-
такой аппроксимации легко видеть, что правый конец плеча совпадает
с концом первого пика. Заметим, что первый из пиков прямо не виден
из рис. 5.11 и не может быть обнаружен описанными выше автомати-
автоматическими системами восстановления оснований.
272
Использование локальной организации
[Гл.5
/\
I 1
I I
I I
I I
I i
Рис. 5.12. «Покрытие»
Таблица 5.3. Инструкции для апостериорного редактирования
Нет изменений
Вычеркнуть
Добавить
Добавить
Добавить
Добавить
Изменить
Изменить
Изменить
Изменить
G
А
С
Т
на
на
на
на
основание
G
А
С
Т
5.5.3.3. С позиции организации естественной зрительной системы.
С бионической точки зрения восстановление символов оснований напо-
напоминает работу системы цветового зрения животных. От зрительной си-
системы человека ее отличает лишь количество детекторов цвета. У чело-
человека при нормальных условиях освещения используется три детектора,
в противоположность рассматривемой нами ситуации секвенсинга, где
используется четыре таких детектора поскольку искомых оснований —
четыре.
Это означает, что многие решения могут быть прямо заимствованы
у авторов, которые исследуют вопрос неизменности зрительного вос-
восприятия цветов поверхностей (окрасок) независимо от условий освеще-
освещения [Максимов, 1984].
5.5.3.4. С позиции экспертных систем. Подход со стороны эксперт-
экспертных систем к рассматриваемой проблеме выглядит особенно ценным,
поскольку эксперты часто в состоянии исправить ошибки, допускае-
5.5] Использование знаний экспертов 273
мые автоматическими системами восстановления последовательности
оснований. Этот факт был отмечен и в работе [Tibbet et al., 1995], хотя
используемый там подход отличается от нашего.
В результате целого ряда обсуждений с экспертами в рассматривае-
рассматриваемой нами области было установлено, что эксперты пользуются некото-
некоторыми специальными семиотическими именами (концептами) для опи-
описания наблюдаемых явлений в тех случаях, когда возникает необхо-
необходимость вмешательства экспертов в процесс выявления наименований
оснований.
В частности, эксперты широко используют понятия плеча и покры-
покрытия, которые изображены на наших рис. 5.11 и рис. 5.12. Возникающее
при этом правило коррекции имеет гораздо более богатую семантику,
чем правила из работы [Tibbet et al., 1995] (см. таблицу 1 выше),
поскольку оно допускает дальнейший осмысленный пересмотр полу-
полученных данных.
5.5.4. Локальный топологический подход. Подход, предпринятый
в настоящем разделе, продолжает соображения, высказанные выше
в подп. 5.5.3.4. Он опирается на тот факт, что эксперты по выявлению
оснований во многих случаях могут установить название основания,
пользуясь какими-то дополнительными подсказками. В таких случаях
перспективен подход с позиции экспертных систем, если только име-
имеется возможность собрать те знания, к которым прибегают эксперты.
В принципе, закодировав это знание, можно создать экспертную си-
систему, позволяющую достигнуть уровня результатов, приближающихся
к результатам экспертов, и даже превзойти их.
Обычно эксперты по восстановлению названия оснований пригла-
приглашаются после того, как начальная дешифровка уже проделан с при-
применением какого-то программного обеспечения [Tibbet et al., 1995].
И действительно, если бы кривые были более четкими и все пики
четко отстояли друг от друга, исходная задача решалась бы тривиально
и необходимости в помощи экспертов не возникало.
Предлагаемый топологический подход позволяет легко решать про-
проблемы, показанные на рис. 5.11 и рис. 5.12. В случае рис. 5.11 рассуж-
рассуждение является очевидным (см. выше). Для решения задачи в случае
рис. 5.12 приходится применять некоторые соображения из теории игр,
которые мы здесь не описываем. Если последовательно воспользо-
воспользоваться подобными топологическими соображениями, результирующая
экспертная система опять становится достаточно тривиальной.
Этот подход был проверен на практике лишь отчасти. Тем не менее,
проведенное тестирование показало целый ряд замечательных при-
примеров успешной дешифровки оснований в двусмысленных ситуациях
похожих на ситуации, изображенные на рис. 5.11 и рис. 5.12. Полагаем,
что, будучи полностью запрограммированным, наш метод позволит
ближе подойти к цели получения 97-99% правильных ответов на мно-
множестве из 300-400 оснований, цели, сформулированной в работе [Tibbet
et al., 1995].
Детали предлагаемого топологического подхода сообщались сотруд-
сотрудникам Факультета электроинженеров и вычислительных наук государ-
274 Использование локальной организации [Гл.5
ственного университета Нью-Йорка, где автору книги довелось рабо-
работать над описанной проблемой в качестве приглашенного консультанта.
Кстати, хотелось бы поблагодарить членов «команды ДНК» за
предоставление в распоряжение автора всех подробностей, необходи-
необходимых для данного исследования, и, в особенности, за помощь в про-
программировании. Хотелось бы также поблагодарить членов Факультета
электроинженеров и вычислительных наук за ценные соображения,
высказанные на рабочем совещании 30 марта 2000 г., на котором автор
изложил основные принципы и относящиеся к делу алгоритмы выдви-
выдвигаемого топологического подхода, а также некоторые предварительные
результаты машинного моделирования конкретных алгоритмов обра-
обработки данных.
Заинтересованные лица могут получить информацию о реализации
соответствующих алгоритмов от автора данной книги, обратившись
к нему по электронному адресу stefanuk@iitp.ru
5.5.5. Заключение. Итак, описан новый подход к рассмотрению
расшифровки порядка следования оснований в ДНК в приборах элек-
трофоретического сканирования в реальном времени, применяющих
селективные полосовые фильтры для хроматографического разделе-
разделения четырех флуоресцирующих меток, находящихся на концах нук-
леотидов, и специфических для каждого из четырех возможных осно-
оснований.
Мы показали, что наблюдаемое явление порождает довольно слож-
сложный случайный процесс, состоящий из ряда накладывающихся адди-
аддитивных процессов, идущих друг за другом, которые соответствуют
флуоресцентному излучению, поступающему от различных олигомеров
в результате их облучения светом лазеров.
Показано также, что проблема выявления имени символа в процессе
идентификации основания (соответствующее автоматическое приписы-
приписывание одного из четырех возможных символов основания) имеет опре-
определенную аналогию с работой обычной зрительной системы. Однако
эта аналогия должна быть подвергнута более глубокому изучению.
В результате обсуждения некоторых близких работ мы предложили
использовать подход с позиции экспертных систем, основанный на
широком использовании экспертных знаний. Этот подход не полагается
целиком на выделение изолированных пиков, что на сегодня являет-
является распространенной практикой. В то же время наш подход должен
служить определенным дополнением к традиционным технологиям,
которые обеспечивают правильное приписывание символов оснований
во всех случаях, за исключением наиболее трудных.
Некоторые примеры, взятые из реальных измерений и иллюстриру-
иллюстрирующие эти «наиболее трудные случаи», представлены выше. Изложен-
Изложенные выше результаты опубликованы в работах [Stefanuk, 2000b; 2001c
и Стефанюк, 2000ж].
5.6] Профилактика заражения компьютерным вирусом 275
5.6. Профилактика заражения компьютерным
вирусом и получения спама через электронную
почту
Хорошо известны случаи получения вируса вместе с почтовыми
отправлениями. Обычно это происходит тогда, когда обладатель по-
почтовой программы открывает, т. е. читает прилагаемый к письму файл
(Attachment).
При этом создатель вируса, учитывая психологию пользователя,
старается как-то заинтересовать корреспондента в открытии такого
файла. Среди наиболее популярных способов известны два: указать
в разделе Subject письма интересующую пользователя тему, или тему
достаточно нейтральную. В последнем случае пользователь может «от-
«открыть» прилагаемый файл просто из любопытства.
Другой способ состоит в том, что распространитель вируса с помо-
помощью простых приемов выявляет список корреспондентов пользователя,
так что пользователь получает письмо, присланное якобы одним из его
коллег. В этом случае резко возрастает вероятность того, что прилага-
прилагаемый файл будет непременно открыт.
В обоих случаях пользователь редко вспоминает о рекомендации
не открывать неизвестные ему файлы: «а вдруг там содержится что-
нибудь полезное!»
Популярные антивирусные программы типа Dr.Web, AVP и другие
обнаруживают вирусы и излечивают от многих из них. Мощность
таких программ возрастает с каждым новым штаммом вирусов. Но,
к сожалению, и размер этих программ также стремительно растет,
занимая дисковое пространство компьютера. Поскольку идеи таких
программ почти всегда на шаг отстают от идей злоумышленников —
разработчиков вирусов, то это «соперничество» между ними, видимо,
никогда не кончится. Очевидно, сложившееся положение дел устраи-
устраивает обе стороны. Но оно не может устраивать рядовых пользователей
электронной почты.
Известно, что профилактика — это более правильный путь борьбы
с заболеваниями. Человек обычно старается не заболеть гриппом,
принимая профилактические меры, а не рассчитывает на то, что все
равно грипп будет вылечен теми или иными лекарствами.
Ниже предлагается простой рецепт такой профилактики в случае
компьютера.
Получив письмо, содержащее приложение (Attachment), при малей-
малейшем подозрении на возможность получения вируса, получатель письма
должен послать назад отправителю короткое письмо с просьбой под-
подтвердить факт посылки данного письма, используя для этого команду
Reply почтовой программы. Поскольку новое письмо и ожидаемый
ответ на него уже не содержат приложения, то это приведет к незна-
незначительной дополнительной нагрузке на почтовую сеть.
Только получив запрашиваемое подтверждение, можно рисковать
открыть приложение. («Рисковать», потому что вирус, тем не менее,
276 Использование локальной организации [Гл.5
может в нем содержаться, если, например, автор исходного письма не
знает, что его компьютер уже давно заражен и некий вирус автомати-
автоматически включается в каждую подходящую для этого посылку.)
Успех описанного нами алгоритма основан на том факте, что умыш-
умышленная рассылка вирусов обычно идет с адресов, которые немедленно
после рассылки закрываются (и тогда в ответ на указанный «Reply»
придет письмо от сервера, что такой-то адрес не существует).
Как легко видеть, описанный алгоритм носит опережающий харак-
характер: вирус в большинстве случаев не будет скопирован в компьютер,
каким бы совершенным он ни был. К достоинствам указанного профи-
профилактического приема следует отнести и то, что он будет отбраковывать
и так называемый «спам» — безобидную, но отвлекающую от дела
рекламу, рассылаемую массовым образом (см. следующий раздел).
В заключение отметим, что подобный образ действий может быть
реализован прямо оператором на почтовом сервере, что было бы весьма
удобным для пользователя. При этом большой процент вирусосодержа-
щих писем просто не поступал бы к пользователю.
С другой стороны, предлагаемый алгоритм прост и может приме-
применяться пользователем сразу же по прочтении этого раздела [Стефанюк,
2000д].
5.6.1. Активный фильтр для вирусов и спама. В отличие от при-
привычного пассивного фильтра, обычно поставляемого в составе почтово-
почтового пакета компьютера, активный фильтр не осуществляет простого от-
отбрасывания подозрительных писем по заранее запомненным критери-
критериям. Активный фильтр предполагает проведение встречных, предупре-
предупредительных действий, направленных на выяснение истинного характера
полученного письма при отсутствии у пользователя соответствующей
априорной информации. Предложенная нами ранее активная фильтра-
фильтрация [Стефанюк, 2000д] уже доказала свою работоспособность защиты
компьютера от поступления вирусов. Такая фильтрация опиралась на
проведение достаточно простых действий со стороны пользователя, хо-
хотя теоретически эти действия могли бы осуществляться и программой
почтового сервера.
Ниже показано, как подобный фильтр может быть использован
и для борьбы со спамом — несанкционированными почтовыми отправ-
отправлениями, — но в этом случае желательно, как показано, чтобы все
действия производились именно на уровне почтового сервера, а не на
уровне пользователя.
2.5.6.1 Основания для активной фильтрации. В работе [Стефанюк,
2000д] был описан простой локальный алгоритм активной фильтрации
приходящей почты, при которой до минимума снижается риск полу-
получения вируса при чтении письма на данном компьютере. Этот алго-
алгоритм является прекрасной альтернативой применению антивирусных
программ. Так, за время трехлетнего использования такого алгоритма
автором не было получено ни одного вируса, хотя количество и ка-
качество таких вирусов существенно возросло, о чем не забывают нас
5.6] Профилактика заражения компьютерным вирусом 277
информировать круги, связанные с производством и распространением
антивирусных программ.
Однако, решив по существу задачу исключения вирусов (но отнюдь
не борьбы с ними после того, как вирус уже проник в компьютер поль-
пользователя!), можно заняться борьбой с так называемым спамом. Такое
название получили всевозможные почтовые отправления, получение
которых никак не предусмотрено пользователем. Как правило, — это
реклама товаров и услуг, которые не были заказаны получателем, кото-
которые раздражают, отнимая массу времени на ознакомление с ними, и на
прием которых из сети Интернет расходуются средства пользователя.
Объем спама постоянно растет, а современные технические средства де-
делают, подчас, невозможной борьбу с ним с использованием предназна-
предназначенных для этой цели пассивных фильтров. Дело в том, что пассивные
фильтры хорошо отсеивают сообщения, содержащие заранее указанные
нежелательные адреса, либо некоторые ключевые слова, находящиеся
в шапке сообщения. Однако создатели спама, а среди них попадаются
и распорядители серверов и другие опытные программисты, научились
за последнее время так модифицировать адреса и так прятать инфор-
информацию о себе, чтобы практически исключить возможность пассивной
фильтрации [Стефанюк, 2004].
Немаловажно и то, что при традиционной пассивной фильтрации
письмо сначала считывается в память компьютера, а только на следу-
следующем шаге отфильтровывается, т. е. (обычно платное) время работы
с WWW тем не менее расходуется, хотя время на чтение самого этого
письма пользователем уже не тратится.
Причина бурного развития спама, на наш взгляд, чисто экономи-
экономическая. Это вопрос получения материальной выгоды для злоумышлен-
злоумышленника. Сложилась определенная ставка: рекламодатели выплачивают
порядка 200 долларов США тем, кто берется разослать информацию
по списку из 1 млн адресов. Технически такую рассылку осуществить
довольно просто. Все, что для этого нужно, — это иметь доступ к ком-
компьютеру на ограниченное время и умение как-то скрыть свой обратный
адрес, чтобы избежать получения в ответ порядка 1 млн писем от
возмущенных читателей этой не заказанной ими информации.
Скрыть свой адрес можно многими способами. Обычно временно
открывается почтовый ящик на общедоступном сервере типа Hotmail
или Yahoo, делается указанная рассылка и ящик закрывается, так что
послать свое возмущение становится просто некому.
Какое-то время назад автор делал попытку обратить внимание
хозяев этих бесплатных серверов на возможность такого использования
их систем и предлагал рассмотреть некоторые меры борьбы с этим
злом. К сожалению, тогда реакции на это не было. (Совсем недавно
стало известно, что Hotmail теперь разрешает послать одно сообщение
не более, чем по 10 адресам, что несколько затрудняет действия зло-
злоумышленников.)
Кстати, автор сталкивался с тем, что многие обычные почтовые
серверы просто закрывают с помощью пассивных фильтров доступ
корреспонденции с таких общественных серверов. При этом в жертву
278 Использование локальной организации [Гл.5
приносятся совершенно ни в чем не повинные пользователи. Однажды
это привело к тому, что у автора не было возможности связаться
с корреспондентами в Германии по срочным вопросам, связанным с ор-
организацией крупной международной конференции по искусственному
интеллекту. В это время автор временно находился в США и на тот
момент указанные выше серверы были единственным средством вос-
воспользоваться WWW.
При существующей чисто локальной организации WWW сами со-
сотрудники серверов и их ближайшие товарищи могут заниматься спа-
мом г).
В последнее время, благодаря техническому развитию WWW, стало
возможным сокрытие обратного адреса и многими другими способами.
Особенно легко это сделать, работая непосредственно на почтовом
сервере и имея соответствующие привилегии 2).
5.6.2. Активный фильтр антиспам. По существу, борьбу с получе-
получением спама предлагается проводить теми же средствами, что и борьбу
с поступлением вирусов, как отмечалось в работе [Стефанюк, 2000д].
Отличие состоит только в том, в каком месте происходит применение
алгоритма: на пользовательском компьютере или на почтовом сервере.
Если активный фильтр для вирусов может быть с равным успе-
успехом использоваться и в том и другом случае, то алгоритм борьбы со
спамом становится действительно эффективным, если он реализуется
на уровне почтового сервера. Хотя убедиться в его потенциальной
эффективности можно и имитируя его работу на компьютере пользова-
пользователя. «Имитировать», потому что на уровне пользователя компьютера
трудно автоматизировать соответствующие действия — приходится вы-
выполнять их вручную. Но тогда все предприятие теряет смысл поскольку
все шаги предпринимаются уже после того, как спам получен и может
быть оценен пользователем непосредственно.
Итак, получив сообщение, которое возможно содержит вирус или
спам, пользователь, пользуясь командой Reply согласно рекомендации
публикации [Стефанюк, 2000д] отправляет примерно следующий текст
«Подтвердите пожалуйста, что вы действительно направляли мне это
сообщение». Если в течение определенного отрезка времени ответа не
последует, то письмо можно не читая вычеркнуть из почтового ящика:
либо это спам, либо письмо, содержащее вирус.
) Это всего лишь возможность. У нас нет доказательств, что такое действи-
действительно происходит. И, конечно, речь может идти лишь о небольшой прослойке
специалистов, склонных к криминальным поступкам.
2) В нашей практике приходилось сталкивался с одним таким сервером, дей-
действующим на Украине. И хотя на каком-то этапе я его «победил», по-своему
найдя убедительные доводы прекратить несанкционированную рассылку
сообщений, в дальнейшем этот сервер возобновил свою деятельность и те-
теперь регулярно высылает мне информацию о проведении каких-то платных
семинаров по украинской экономике, которые, разумеется, не представляют
для меня никакого интереса.
5.6] Профилактика заражения компьютерным вирусом 279
Если же ответ получен, то необходимо проанализировать его со-
содержание. Если это — нормальное подтверждение, то можно прочесть
письмо и открыть приложение (см. предыдущий раздел). Если видно,
что подтверждение фиктивное, то следует поступать как и в случае
отсутствия какого-либо подтверждения, т. е. письмо следует вычерк-
вычеркнуть х).
Что значит «сообщение, которое возможно содержит вирус или
спам, или и то и другое»? В случае борьбы с получением вируса — это
наличие в письме приложения. Всякое другое письмо от неизвестного
вам корреспондента целесообразно считать потенциальным спамом.
5.6.2.1. Преимущества и недочеты установки активного фильтра на
почтовом сервере. Недочеты связаны с тем, что на сервере неизвест-
неизвестны заведомо гарантированные корреспонденты данного пользователя,
поэтому сервер должен совершать указанные действия при получе-
получении любого письма, т. е. считать каждое письмо подозрительным на
спам. Этот недостаток можно в значительной степени уменьшить за
счет того, что спамообразующие письма обычно содержат некоторые
дополнительные признаки, увеличивающие вероятность того, что это
действительно спам.
Например на сервере ИПС РАН г. Переславль-Залесский поставлена
защита, которая объявляет лишь некоторые письма подозрительными
на спам. Здесь может быть несколько критериев, множество которых
может со временем модифицироваться. Например, подозрительным
считается письмо созданое одной из специализированных программ
циркулярной рассылки и т. п.
Кроме того, на этом же почтовом сервере установлена возможность
из этого ограниченного множества выделить некоторое подмножество
«легитимных» циркулярных писем, которые поступают из заведомо
проверенных источников.
При установке активного фильтра на сервере возникают дополни-
дополнительные возможности, основанные на корреляции корреспонденции,
поступающих для различных пользователей. Например, убедившись
в «неблагонадежности» одного из источников можно запретить все
поступления, приходящие на данный сервер, независимо от того, кому
конкретно они адресованы.
Оставшиеся после такого отсеивания и все же подозрительные на
спам письма следует обработать также, как в случае антивирусной
фильтрации. А именно: послать командой Reply сообщение типа «Под-
«Подтвердите пожалуйста что имярек уполномочил вас присылать ему ваши
письма». Если ответ не приходит в течение определенного промежутка
х) При вычеркивании письма из практических соображений необходимо
известить пользователя о произведенном действии, сохранив за ним возмож-
возможность в течение какого-то отрезка времени все-таки прочитать отвергнутое
письмо. Это необходимо, чтобы избежать ситуации «ложной тревоги». Такого
порядка придерживается, например, почтовый сервер mail.iitp.ru (ИППИ
РАН) при обнаружении в письме вируса, осуществляемого с помощью стан-
стандартного антивирусного пакета.
280 Использование локальной организации [Гл.5
времени, то письмо вычеркивается из временного хранения и пользо-
пользователю не поступает.
Если ответ пришел, то возникает сложная задача автоматического
распознавания подлинности (аутентичности) письма, т. е. что письмо
не сфабриковано какой-либо автоматической программой ответа на
подобные запросы. Хотя пока что нам ничего не известно о существо-
существовании такой программы, необходимо научится узнавать результаты ее
действия. Это — благодарная задача для искусственного интеллекта,
которая является прямо противоположной задаче осмысленного поиска
на WWW полезной информации [Осипов, 1997]. Заметим, что в слу-
случае описанной выше имитации работы сервера на пользовательском
компьютере такая задача узнавания легко решается «естественным
интеллектом» пользователя. Эта легкость дает все основания считать
такую задачу разрешимой, по крайней мере в первом приближении,
и в рамках искусственного интеллекта.
Но есть одно соображение, по которому создание такой интеллекту-
интеллектуальной программы распознавания может быть на время отложено. Де-
Дело в том, что разработка и использование программы выдачи фиктив-
фиктивных подтверждений потребуют от спамеров дополнительных затрат,
причем представляется, что эти затраты могут оказаться настолько
существенными, что сделают работу по рассылке спама экономиче-
экономически неоправданной (см. п. 5.6.1). Поэтому на рис. 5.13 обсуждаемый
искусственно-интеллектуальный блок распознавания обведен пункти-
пунктиром.
Если же ответ пришел и он признан подлинным, то такое письмо
следует переправить пользователю обычным порядком.
В большинстве же случаев спама, с которыми мы сталкиваемся
сегодня, ситуация оказывается более простой — источник спама не
пришлет никакого ответа на посланный запрос. Кстати, работа алго-
алгоритма на сервере удобна тем, что на сервере часто можно убедить-
убедиться чисто сетевыми средствами, что адреса, с которого пришел спам,
физически больше не существует. В этом случае письмо может быть
вычеркнуто безо всякого переспроса. (Такая возможность отсутствует
в описанном выше режиме имитации, снижая эффективность метода.)
К сожалению, как говорилось выше, сегодня спамеры с легкостью
могут создавать фиктивные адреса на интернете, которые физически
«прописаны» в адресной шапке письма. Тем не менее, ответить пра-
правильно на переспрос они не в состоянии.
5.6.2.2. Выводы. Таким образом, предлагаемый активный фильтр
можно создавать постепенно в виде локально-организованной системы,
усовершенствуя его работу по мере поступления нового фактического
материала о дополнительных возможностях спаммеров, которые, во
многом, уже заранее предусмотрены в предлагаемом алгоритме. Еще
раз обращаем внимание читателя на то, что этим наш подход карди-
кардинально отличается от подхода разработчиков антивирусных программ,
которые совершенствуют свои программы только после поступлении
очередного варианта вируса, никак не опережая мысль создателей
вирусов и тем более распространителей спама.
5-71
Выводы по главе 5
281
WWW
ПОЧТОВЫЙ СЕРВЕР
Пассивный
фильтр
Блок
переброса
ОТВЕТ НЕ
ПРИШЕЛ -
письмо
вычеркнуть
j Блок ИИ [
ОТВЕТ
ЛЕГИТИМНЫЙ -
письмо переслать
пользователю
ПОЛЬЗОВАТЕЛЬ 1
ПОЛЬЗОВАТЕЛЬ N
Рис. 5.13. Состав активного фильтра
Хочется надеяться, что настоящая публикация будет полезной не
только для пользователей интернета, высвободив массу времени и ин-
интеллектуальной энергии, но и для спамеров, которые должны из нее
почувствовать, что для них нет будущего на интернете и попытаться
найти для себя более подходящее занятие 1).
Автор благодарен В. Ф. Хорошевскому, без дружеского одобрения
которого автор в свое время не решился бы на публикацию своего
подхода [Стефанюк, 2000д].
5.7. Выводы по главе 5
1. Показано, что программу на интерактивном языке программи-
программирования можно рассматривать как локально-организованную систему.
Приведены примеры, иллюстрирующие преимущества локальной ор-
организации программы и процесса программирования.
2. Поставлена и исследована задача перехода от рекурсивной про-
программы к итеративному коду, что эквивалентно переходу к локально-
организованной системе без взаимодействия в смысле гл. 2.
3. Выделены и описаны основные типы побочных эффектов, возни-
возникающих в системах Лисп, и описана построенная автором программа
снятия рекурсии с учетом побочных эффектов, позволяющая повысить
эффективность вычисления. Приведены примеры реальной работы
программы.
4. Предложен новый метод рекурсивного вычисления в локально-
организованной системе символьного программирования «арифмети-
) К настоящему времени автором написана программа «Mirror», реализу-
реализующая активную фильтрацию. Эта программа зарегистрирована в Федераль-
Федеральной службе интеллектуальной собственности, патентам и товарным знакам
за номером 2004611258.
282 Использование локальной организации [Гл.5
ческих» (несимвольных) функций, не прибегающий к явному исполь-
использованию сходящихся рядов.
Показано, что этот метод отличается большой простотой и нагляд-
наглядностью, позволяя установить требуемую точность вычислений в диало-
диалоговом режиме.
5. Приведены примеры наглядного программирования традицион-
традиционных вычислений с использованием рекурсии (или итерации) в обычных
языках программирования высокого уровня.
6. Методы локальной организации облегчают создание прикладных
систем, сводя (в соответствии с рис. 1.3) процесс разработки
сложной человеко-машинной системы к созданию целесообразно-
организованных достаточно простых подсистем. В частности, методы
локальной организации, описанные в гл. 5, позволили создать:
— эффективную операционную систему эклисп для мини-
компьютера ECLIPS С/330;
— гибкую систему FLEX помощи программисту при работе в среде
программирования Лисп;
— обучающуюся систему PROMPTER ввода портовой документа-
документации. Система эклисп много лет эксплуатировалась в ИППИ
РАН, МЭИ, МГУ.
Система FLEX доведена до уровня рабочего прототипа.
Система PROMPTER, была принята к внедрению в порту г. Клай-
Клайпеда (см. [Стефанюк, 1987а]).
7. Предложен новый подход и новые алгоритмы для восстановления
имен оснований (нуклеотидов) по данным, полученным в 4-канальном
приборе, предназначенном для выявления последовательности осно-
оснований в ДНК с применением электрофореза. Подход основан на ло-
локальных топологических соображениях и экспертных знаниях, которые
позволяют избежать многих ошибочных результатов при обработке ти-
типичного числового файла, получаемого для каждой конкретной ДНК.
8. Предложен новый подход в борьбе с нежелательной корреспон-
корреспонденцией, поступающей по всемирной компьютерной сети (WWW),
в основе которого лежит использование активного фильтра. В отличие
от традиционного пассивного фильтра, поставляемого в составе почто-
почтового пакета компьютера, активный фильтр предполагает проведение
встречных, предупредительных действий, направленных на выяснение
истинного характера полученного письма. Такой фильтр уже доказал
свою работоспособность в режиме защиты компьютера от поступления
вирусов.
ОБЩИЕ ВЫВОДЫ
1. В книге предложен и детально исследован новый принцип организа-
организации больших систем — локальная организация. Изучение локальной ор-
организации является самостоятельным научным направлением, основ-
основные этапы которого развиты автором книги. Локальная организация
представляет собой важную альтернативу централизованной и децен-
децентрализованной организациям систем, позволяя поставить и решить ряд
задач новых классов, среди которых:
— коллективное поведение,
— локальное управление,
— локальный подход к программированию,
— локальные аспекты искусственного интеллекта,
— локально-организованные экспертные и другие человеко-машин-
человеко-машинные системы.
2. Для всех указанных классов задач в книге построены и изуче-
изучены характерные математические примеры, носящие оригинальный ха-
характер. Эти примеры, представляющие самостоятельный интерес как
модели естественных технических систем, показывают, что локальный
подход применим к самым разнообразным областям и позволяет в этих
областях сформулировать проблемы в новых постановках.
3. Предложена общая методология анализа и синтеза локально-
организованных систем, которая последовательно реализована в по-
построенных математических и программных моделях. Предложены ори-
оригинальные математические методы исследования этих моделей, зави-
зависящие от класса решаемой задачи.
4. Под руководством автора книги и с его непосредственным участи-
участием был создан ряд программных комплексов на локальных принципах,
опытная проверка которых подтвердила их полезность на практике
и перспективность всего научного направления в целом.
5. Вышесказанное позволяет заключить, что в книге разработан
широкий круг положений, развивающих новое перспективное направ-
направление, каким является локальная организация систем, в теории и прак-
практике создания больших систем в технике и информатике и решении
проблем управления такими системами.
ПРИЛОЖЕНИЯ
П.1. Некоторые характеристики памяти со
случайной выборкой в сравнении со «стопкой
книг»
П. 1.1. Дисперсия продолжительности поиска. Для дальнейшего
обсуждения правомерности использования приближенных моделей по-
поучительно вычислить не только ?г (среднее число обращений в па-
память), но и дисперсию этой случайной величины, которая обусловлена
двумя факторами: случайным разбросом при поиске именно г-го слова
и разбросом, обусловленным недетерминированностью (т. е. с вероят-
вероятностью pi) обращения к г-му слову.
Пусть / — случайная величина, представляющая собой число срав-
сравнений с образцом прежде, чем будет найдено слово, соответствующее
данному образцу, в предположении, что образцы предъявляются с ве-
вероятностями pi, . . . , рп. Ее дисперсия определяется формулой
\ieL
где Р{1) — распределение / на множестве L натуральных чисел 1,2,...
Ясно, что
г=1
где Qi(l) — условное распределение / при условии, что ищется г-е слово.
Отсюда
^ = Е Pi Е PQV) ~ (Е Pi El Q@) •
г=1 leL \г=1 IEL )
Аналогично B.4.2) можно показать, что при поиске с возвращением
при Ni^l
Таким образом,
П.1. Некоторые характеристики памяти со случайной выборкой 285
Предполагая выполненным «закон ь.
квадратного корня», можно получить
следующее выражение: 2w»2
72
2n-l
-1,
Рис. П.1. Зависимость относи-
относительной дисперсии от средней
глубины поиска в оптимальной
случайной памяти
представляющее относительную дис-
дисперсию, в котором Л = ?°pt.
Видно, что наименьшее значение
л 2 n — 1 г
р = достигается при наиболь-
77/
шем Л (равном п), а наибольшее, /З2 =
= 2п — 2, при наименьшем Л = 1
(см. соответствующий отрезок ветви
гиперболы на рис. П.1).
Таким образом, относительная
дисперсия в случайной памяти
всегда велика, причем она достигает
наибольшего значения именно тогда,
когда применение такой памяти
наиболее оправдано *). Интересно
было бы сравнить это свойство со
свойствами дисперсии для стопки книг [Цетлин, 1963], но в следующем
разделе мы ограничимся сопоставлением математических ожиданий
для этих двух моделей.
П. 1.2. Сравнение оптимизированной случайной памяти со «стопкой
книг». Модель стопки книг, впервые предложенная М.Л. Цетлиным
[Цетлин, 1963], неоднократно заново открывалась другими автора-
авторами (см. например «независимую», но идентичную постановку задачи
в [Hendriks, 1972] ).
Однако математические результаты, полученные в [Цетлин, 1963] (в
[Стефанюк, 1961] приводится выражение для финальной вероятности
конкретного расположения книг в стопке), были существенно развиты
лишь в работе [Burville and Kingman, 1973], где показано, в частности,
что средняя глубина поиска книги определяется следующим изящным
выражением:
Pi Pj
) Найденный разброс величины t обусловлен лишь механизмом работы
самой случайной памяти. Действие разобранных в пп. 2.4.3—2.4.5 алгоритмов
формирования оптимальных значений еще увеличивает этот разброс.
286 Приложение
Сопоставив эту формулу и B.4.6), нетрудно убедиться, что ?г >
Действительно неравенство
PiPj
оказывается всегда выполненным, так как из неравенства между сред-
средним арифметическим и средним геометрическим при pi ф 0, г = 1, . . .
... , гг, следует
PiPj
Pi + Pj
Чтобы оценить количественно, насколько стопка книг «лучше» слу-
случайной памяти, рассмотрим два крайних случая.
В лучшем для применений адаптивной памяти случае имеем pi —>
—>• 1, pj —>• 0, и тогда
т. е. они ведут себя одинаково.
В самом худшем случае, когда pi = — , г = 1, . . . , гг, имеем
п
<Ч = гг, Lb = —^— ,
т. е. случайная память проигрывает стопке книг по глубине поиска
практически вдвое.
Прежде чем продолжить сопоставление стопки книг и случайной
памяти, напомним, что эти две модели отвечают двум разным встре-
встречающимся на практике ситуациям и лишь в некоторых из них пред-
представляется реальный выбор, какой из схем воспользоваться (см. п. 2.4.1
выше).
П. 1.3. Поведение случайной памяти и «стопки книг» при зависимых
заявках. В общем случае вероятность обратиться в память за г-м
словом может зависеть от всей предыстории
где i(t) — номер запрашиваемого в момент t слова (наиболее естествен-
естественной моделью здесь была бы марковская зависимость, но сейчас это не
существенно).
Дополнительно усредняя B.4.1), имеем тогда
(L(t)) = ) Ёад = 7 ?Х>(т)/;(т).
т=1 т=1г=1
Учитывая, что средняя глубина поиска слова li(r) зависит исключи-
исключительно от процедуры поиска и, согласно B.4.2), определяется только
П. 2. Двухуровневая система управления манипулятором 287
Ni, Л/", которые во времени не меняются (мы здесь уже не говорим об
алгоритмах оптимизации памяти), видим, что li(r) от времени не за-
зависит. (Для сравнения заметим, что h(r) для книг в стопке от времени
зависит, см. ниже.) Тогда имеем
г=1
Мы, естественно, ограничимся эргодическим случаем, когда суще-
существует предел
Сопоставляя
г=1
с B.4.1), убеждаемся, что все соображения о «законе квадратного
корня» и т. п. остаются в силе для случайной памяти (с заменой pi
на pi). Иными словами, случайная память после каждого обращения
к ней приходит в исходное состояние, в ней нет «последействия».
Однако в случае стопки книг, где также можно говорить о средней
глубине книги в стопке на значительном отрезке времени усреднения,
картина совершенно другая — весьма существенно, чтобы обращения
к различным книгам представляли собой строго независимые события.
Рассмотрим, например, предельный случай, когда книги (или сло-
слова) требуются в строго определенном порядке (слова, скажем, могут
соответствовать подпрограммам, вызываемым некоторой итеративной
процедурой), тогда pi = 1/п и глубина поиска в случайной памяти (при
поиске с возвращением) равна в точности п.
В этой ситуации в стопке книг видно, что требуемые книги всегда
будут расположены в строго обратном порядке — нужная книга при си-
систематическом чтении собрания сочинений будет располагаться внизу
стопки (!).
Таким образом, в случае цепочки заявок свойства стопки книг
и случайной памяти сравниваются. Более того, случайная память при
использовании процедуры без возвращения получает (при малых N)
некоторое преимущество. Действительно, из выражения B.4.21) имеем
П.2. Двухуровневая система управления
манипулятором
Первый уровень. Для многозвенных цепей существует, вооб-
вообще говоря, бесконечно много финальных положений, в которых «схват»
288
Приложение
руки находится в заданной окрестности целевой точки, и каждого из
этих положений можно достичь бесконечным числом способов. Ана-
Аналитическое определение оптимальной траектории и финальных меж-
звенных углов, как правило, затруднительно вследствие большой слож-
сложности системы уравнений динамики, описывающих движение манипу-
манипулятора. Вместо этого в каждый момент времени можно производить
оценку необходимых углов поворота звеньев и производить коррекцию
чисто локальным образом.
Можно предложить несколько достаточно естественных, хотя не
обязательно оптимальных способов такой оценки. Один из них состоит
в том, что в каждый момент для г-го звена, г = 1, . . . , п, угол поворота
6i принимается равным углу между направлениями на схват руки
(тачка А) и на целевую точку А0 (см. рис. П.2). Введем следующие
обозначения:
ai — угол между (г — 1)-м и г-м звеньями (ai — угол между первым
звеном и опорой);
Rq — расстояние от точки крепления цепи О до целевой точки;
Фо — угол между направлениями на А° из О и плоскостью опоры.
(Xn,Yn)
Рис. П.2. К кинематической модели управления манипулятором
Запишем выражения для декартовых координат Х{ и Yi г-го суста-
сустава, г = 1, . . . , п:
i = Y^ h sin^j, Xo = Y0 = 0,
П. 2. Двухуровневая система управления манипулятором 289
где г/jj = а\ + . . . + ckj, и выражения для соответствующих углов
поворота:
— arccos
(Yn - Yi-гJ
Ro
= arccos
cos ф0 - Xi-xJ + (До sin ^0 - X;_iJ
Некоторые особые случаи расположения звеньев и Л° практически не
меняют вид этой формы.
Другой способ отличается от описанного тем, что оценка углов
поворота начинается с последнего, п-го сустава, и при переходе от г-
го сустава к (г — 1)-му, г = 2,. . . , п, считается, что все предыдущие
звенья уже совершили повороты на соответствующие углы Qn, 0n_i, . . .
... ,0{ при неподвижной остальной части цепи.
Мы выбираем в каждый момент усилия мышц так, чтобы звенья
начинали поворачиваться в направлении «компенсации» углов 0{ (ко-
(которые имеют тот же знак и примерно ту же величину, что и некоторые
неизвестные истинные углы поворотов, необходимые для достижения
цели). На следующем такте, т. е. через выбранный малый промежуток
времени At, после осуществившегося поворота звеньев на достаточно
малые углы, которые определяются всеми силами, действующими в си-
системе, и распределением масс, процедура выбора углов 0{ и усилий
повторяется.
В обоих способах можно применять процедуру, позволяющую более
точно направить перемещение схвата (конца руки) на целевую точку:
углы изменяются так, чтобы скорректировать соотношение между пе-
перемещениями точки А по оси абсцисс (АХ) и по оси ординат (АК) при
повороте звеньев на малые углы Аа^, пропорциональные Q{\
г=1 г=1
где
Нетрудно приближенно оценить вращающий момент М^, который
должны развивать мышцы, управляющие г-м звеном, для поворота его
на угол Аа{ за время At:
(Att<-a«.At),
(AtJ
где OLi* — угловая скорость вращения г-го звена относительно г-го шар-
шарнира в начале такта. (Знание более точных оценок считалось излишним,
10 Стефанюк
290 Приложение
во-первых, из-за мешающего действия реакций в суставах и, во-вторых,
благодаря тому, что итеративный характер процедуры обеспечивает
достижение цели независимо от погрешностей оценок (если они относи-
относительно невелики) на отдельных тактах. Значение Mi определяет, какой
мышце из управляющей пары напрячься и какое развить усилие.
Второй уровень. Реализовавшаяся траектория неизбежно
будет иметь ряд недостатков. Силы взаимодействия между звеньями
существенно возмущают движение цепи, в результате чего на некото-
некоторых тактах конец руки может даже уходить от целевой точки. Далее,
возрастание угловых скоростей звеньев, возможно значительное, уве-
увеличивает помехи, связанные с реакцией в суставах. Большие скорости
сами по себе затрудняют управление системой (возможно промахива-
ние). Все эти факторы увеличивают время движения и затрачиваемую
энергию. Поэтому было бы целесообразно предвидеть такие отклонения
и мешающие воздействия и не допускать их, заранее корректируя уси-
усилия «мышц», чтобы улучшить характеристики движения. Для оценки
и сравнения траекторий можно использовать три естественных крите-
критерия: кинематический — время достижения целевой точки Т, энергети-
энергетический — работа управления W и обобщенный — действие S
1
= Ibdt,
где L — функция Лагранжа системы.
Обучение, в результате которого модель будет заранее «знать»
о будущих отклонениях и с упреждением корректировать их, можно
организовать следующим простым способом. В течение к-то прохода
от исходной точки к целевой (т. е. к-то цикла) запоминаются все уси-
усилия, которые развивает каждая мышца. Затем система возвращается
в исходное положение и снова начинается движение, но усилие, которое
в каждый момент выбирает мышца, теперь складывается из двух ком-
компонент с весами: из силы, которую она развивала бы в данный момент
по правилам первого уровня, и силы, которую она фактически раз-
развивала на следующем такте во время предыдущего цикла. Обозначив
через Fk+i(t) реальное усилие некоторой мышцы в момент t на (/с +
+ 1)-м цикле, и через ^?+i№ ~~ Усилие ее ПРИ условии управления
только первым уровнем, запишем правило выбора реального усилия
с помощью некоторого «упреждающе-демпфирующего» алгоритма *) :
Fk+1(t) = A - 7) Fj!+1(t) + 7 F°k{t + At).
где At — продолжительность такта, 0 ^ 7 ^ 1-
При таком способе обучения мышца на (к + 1)-цикле будет заранее
осуществлять небольшие (при 7^1) поправки и предупреждать
возникавшую на к-м цикле необходимость дальнейшего торможения,
х) Алгоритм предложен Ю. И. Крюковым.
П. 2. Двухуровневая система управления манипулятором 291
коррекции промахивания или изменения усилия по какой-либо иной
причине. Траектория движения становится более плавной, так как сгла-
сглаживаются броски цепи, вызванные появлением сил реакции в суставах,
и более точно и быстро приводящей к цели. При малых значениях 7
траектории будут незначительно отличаться от одного цикла к друго-
другому, что обеспечивает возможность обучения.
Можно ожидать, что при этих условиях последовательности {F& (?)}
будут сходиться, причем вся область начальных условий распадается
на подобласти, возможно, с несколько размытыми границами — такие,
внутри которых наборы финальных функций F^t), характеризующие
движение всей цепи, будут ненамного отличаться друг от друга, так
что некоторый усредненный набор этих функций будет для всех точек
такой подобласти достаточно точно определять необходимую последо-
последовательность усилий. Соответствующие подобласти возникнут и на мно-
множестве возможных положений целевых точек. Иными словами, пред-
предполагается выявление для данной задачи (простое попадание в цель)
небольшого числа охватывающих все возможные состояния системы
«рука — целевая точка» динамических стереотипов — некоторых анало-
аналогов синергии (см. например, [Бернштейн, 1966]), образование, которых
характерно для движений кинематических цепей живых организмов.
Моделирование на компьютере. Было проведено пред-
предварительное исследование цепи для простого случая п = 2. Програм-
Программа состоит из процедур решения алгебраической системы, к которой
после преобразования свелись дифференциальные уравнения дина-
динамики, и вспомогательных уравнений 3-й и 4-й степени общего вида;
из блоков вычисления углов рассогласования Oi расстояния от конца
руки до цели, выбора усилий, обучения и запоминания усилий; из
блоков определения коэффициентов системы уравнений динамики и,
после обращения к процедуре ее решения, вычисления дополнительной
работы управления AW и изменения действия AS после каждого
такта. Параллельно ведется сравнение функций Fk+i(t) и Fk{t) для
каждой мышцы — считается средний квадрат р разности Fk+i(t) —
— Fk(t) и максимум Q ее абсолютной величины за весь (к + 1)-й цикл.
После попадания в заданную окрестность целевой точки выводится
время (число тактов) ее достижения, работа VK, действие S и величины
р и Q. Если траектории на к-м и (к + 1)-м цикле достаточно близки
(р и Q малы), то дополнительно выводится номер последнего цикла
и программа может перейти к следующей точке, в противном случае
рука возвращается в исходное положение и снова движется к цели. Все
величины, характеризующие движение на каждом такте, могут быть
выведены на печать.
Моделирование показало, что при расположении точек прикрепле-
прикрепления мышц к стержням на равных расстояниях а от шарнира второе
звено оказывает очень большое воздействие на перемещение первого.
Это затрудняет процесс сходимости алгоритма обучения, поскольку
в таких условиях небольшие изменения усилий второй пары мышц
и положения второго звена заметно изменяют динамику всей системы.
Однако и в этих условиях примерно в 70% случаев выявилось финаль-
10*
292 Приложение
ное поведение системы. После обучения время движения от исходного
состояния к целевому в большинстве случаев оставалось прежним,
а динамические характеристики — иногда только работа управления,
иногда обе — улучшались. Например, при 1\ = 15; т\ = 15; 12 = 8;
т2 = 8; а = 1; Ro = 18; <ф0 = тг/3; оц = тг/10; а2 = Итг/12; А* = 1/30
при нулевых начальных скоростях и первом цикле было
Т = 125 тактов; W « 0,62796; S « 0,30634,
а уже на 9-м цикле выявляется финальный тип движения:
Т = 95 тактов; W « 0,61193; 5 « 0,29870.
Есть основание предполагать, что смещением точек прикрепления
мышц к звеньям можно добиться увеличения устойчивости движения
и большей эффективности управления вторым звеном, а, следователь-
следовательно, улучшить сходимость процесса обучения и динамические характе-
характеристики финального типа движения.
Выше уже отмечалось, что приведенный здесь локальный подход
к управлению манипулятором в робототехнике продолжает развивать-
развиваться Ю. И. Крюковым [Крюков, 1986] и другими авторами. При этом
Ю. И. Крюков постепенно перешел к рассмотрению этой задачи как
задачи поиска экстремума в некотором пространстве. На возмож-
возможность такой трактовки вопросов управления биосистемами указал еще
И. М. Гельфанд [Гельфанд и др., 1986].
П.З. Примеры построения категорий для
традиционных операций со знаниями
в искусственном интеллекте
Пример 1 . Пусть А — произвольное множество, которое будем
называть множеством констант. Построим категорию С следующим
образом. В качестве объектов категории возьмем множества вида Лп,
п = 0,1, ... Под множеством А0 будем понимать некоторое одноэле-
одноэлементное множество. Символом тг^ будем обозначать проекцию Ап —>• А
множества Ап = А х. . . х А на г-й сомножитель. Пусть ф\, (р2, . . . , ц>п —
отображения из Ат в А. Обозначим символом (f\ x ip2 х . . . х ipn един-
единственное отображение <р : Аш —>• Лп, для которого (pni = ^, множе-
множество Нот (Лт, Ап) определим теперь как множество всех отображений
из А171 в Ап вида тг^ х ni2 х . . . х тг^. Кроме того, определим для
каждого элемента s Е Ап отображение as : А0 —» Лп, отображающее
единственный элемент множества А0 в 5, и положим Нот(Л°,Лп) =
= {as,s E А0}. Наконец, множество морфизмов Нот(Лп,Л°) будем
считать состоящим из единственного отображения ?п, отображающего
все элементы множества Ап в единственный элемент множества А0.
Нетрудно проверяется, что так определенное множество отображений
замкнуто относительно композиций и содержит тождественные отоб-
отображения. Этим определение категории С закончено.
U.S. Примеры построения категорий для традиционных операций 293
Выберем любой из объектов категории С в качестве множества Е.
В качестве исходного объекта / возьмем множество А0. Полученная
система образцов может быть использована для описания процедуры,
которую мы будем называть классическим сопоставлением с образцом.
Изложим вкратце суть этой процедуры. Рассматриваются всевозмож-
всевозможные последовательности элементов множества А длины п. Образцом
называется последовательность длины п, состоящая из элементов мно-
множества А и переменных. Говорят, что последовательность сопоставима
с образцом, если в этот образец можно подставить вместо переменных
такие элементы из Л, что образец совпадает с последовательностью.
Существует прямая связь между классическим сопоставлением с об-
образцом, и построенной выше категорией С, которую проще всего по-
пояснить на примере. Рассмотрим образец хаух, где ж, у обозначают
переменные, а компонента а — элемент множества А. Такой образец
сопоставим с любой последовательностью, состоящей из четырех букв,
первая и последняя из которых одинаковы, а вторая есть а. Сопоставим
этому образцу морфизм <р = тг1 хе2аа х 7Г2 х 7Ti: A2 —» Л4.
Последовательности bacb сопоставим морфизм а = аьаеь: 1 —>
—>• А4. Теперь тот факт, что последовательность bacb сопоставима
с образцом хаух, на категорном языке выражается в коммутативности
диаграммы рис. 4.27. Нахождение морфизма а&с имеет тот же смысл,
что и присваивание значений бис переменным х и у.
Пример 2 . Видоизменим предыдущий пример. Пусть L озна-
означает множество последовательностей элементов из А произвольной
длины (в том числе длины 0). Обозначим, как и выше, символом тг^
проекцию Ln —>• L на г-й сомножитель. Каждому элементу s множества
L сопоставим, как и раньше, отображение as : / —> L, где I = L0
обозначает одноэлементное множество, и введем в рассмотрение, как
и в предыдущем примере, отображение еп : Ln —>• / для каждого
п. Определим для каждого п отображение ап : Ln —> L, отобра-
отображающее набор последовательностей (si,$2? • • • ?sn) B последователь-
последовательность si, «2, . . . , sn, получающуюся выписыванием подряд символов из
(si, 52, • • • , sn) (например (abc, de, f)os = abcdef).
Построим теперь соответствующую категорию С. В качестве объ-
объектов категории возьмем множества вида Ln, п = 0,1, .... В качестве
множества морфизмов категории возьмем минимальное множество
отображений между объектами категории, которое: 1) содержит все
проекции TTi : Ln —t L; 2) содержит все отображения as : / —>• L и все
отображения еп : Ln —> L; 3) содержит все отображения ап : Ln —> L;
4) если содержит отображения y?i, у?2? • • • ? фи '• L™ —> L, то содержит
и отображение ^i х ^ х . . . х (рп : Ьш —>• Ln; 5) замкнуто относительно
композиции.
Возьмем в качестве исходного объекта множество /, а в качестве
базового объекта — множество L.
Исследование свойств построенной категории не входит в нашу
задачу. Отметим лишь связь между ней и «классическим» сопоставле-
сопоставлением с образцом. Для этого рассмотрим другой вариант сопоставления
с образцом, который отличается от изложенного выше тем, что вместо
294 Приложение
переменной можно подставлять не один элемент множества Л, а про-
произвольную последовательность (возможно, пустую) таких элементов.
При таком подходе рассмотренный в предыдущем примере образец
хаух сопоставим с любой последовательностью, имеющей одинаковые
подпоследовательности в начале и в конце, причем за первой из них
следует буква а. Сопоставим образцу хаух морфизм (tti х ?2аа х 7г2 х
х tti) (J4: L2 —> L. В этих обозначениях сопоставимость последователь-
последовательности bab с образцом следует из коммутативности диаграммы рис. 4.28.
Построенная категория может быть применена для описания про-
продукций, используемых в теории формальных грамматик. Рассмотрим,
например, продукцию а —> be, означающую, что символ а в последо-
последовательности символов может быть заменен парой символов be. В ка-
категории С такой продукции соответствует пара морфизмов if = (tti x
X E<iOLa X 7Г2) СГ3: L2 —> L И ф = (tTi X ?2^bc X К2) &3: L2 —> L.
Пусть задана последовательность символов aba. Ей соответствует
морфизм а = ааьа- I ^ L2 <^>. Рассмотрим морфизм /3 = а0 х аьа-
I —} L2. Легко видеть, что а = /3(р. Последнее по определению озна-
означает, что продукция (/, (р,ф) применима к ситуации а и результатом
этого применения является ситуация, определяемая морфизмом /Зф =
= (а0 х аьа)(тп х е2аЬс х тг2) сг3 = (а0 х аЬс х аЬа) а3 = abcba, что
соответствует последовательности beba.
Пример 3 . Рассмотрим следующий пример. Пусть Л, F — про-
произвольные множества, которые будем называть множеством констант
и множеством функциональных символов соответственно.
Множество F имеет вид F\ U F2 • • •; Fi П Fj = 0; элементы мно-
множества Fn будем называть n-арными функциональными символами.
Определим понятие выражения следующим образом: 1) константа есть
выражение; 2) если / есть n-арный функциональный символ, a ei, . . .
... , еп суть выражения, то /(ei, . . . , еп) — выражение. Обозначим
символом Е множество всех выражений. Символом тг^ будем обозна-
обозначать проекцию Еп на г-й сомножитель, символом / — одноэлементное
множество Е°, символом ае — отображение / —>• Е, отображ;ающее этот
единственный элемент в выражение е, символом еп — единственное
отображение Еп —> I. Каждому элементу / множества Fn поставим
в соответствие отображение tpf : Еп —>• Е, отображ;ающее выраж:ения
ei, . . . , еп в выражение /(ei, . . . , еп).
Рассмотрим теперь категорию С , объектами которой являются
множ:ества Еп, а множеством морфизмов — минимальное множество,
которое: 1) содержит все проекции тг^ : Еп —> Е\ 2) содержит все
отображения ае : I —> Е и все отображения еп : Еп —>- /; 3) содержит
все отображения (ff : Еп —> Е, / G Fn, n = 1, 2, . . .; 4) если содержит
отображения (^i, у?2? • • • ? Рп'- Ет —> Е, то содержит и отображение
(pi х (f2 x . . . х ipn: Em —>- Еп\ 5) замкнуто относительно композиции.
В качестве базового объекта возьмем множество Ё, а в качестве
исходного объекта — множество /.
Приведем два простых случая, в которых «работает» построенная
так категория.
U.S. Примеры построения категорий для традиционных операций 295
Рассмотрим задачу преобразования алгебраических выражений.
Будем считать заданным некоторый набор правил, согласно которым
можно осуществлять эти преобразования, к примеру правило х + у —>
—> у + х позволяет переставлять слагаемые в сумме. Будем применять
префиксную нотацию, т. е. вместо х-\-у будем писать +(ж, у), где символ
«+» означает операцию сложения, тогда алгебраическое выражение
будет выражением в смысле данного выше определения, т. е. будет
элементом множества Е. Правилам преобразования выражений можно
сопоставить продукции в используемом нами смысле. Например, про-
продукция (/, <р, ф), где (р = (тг1 х тг2) <?+: Е2 ->> Е и ф = (щ х тг2) <?+:
Е2 —» Е задает приведенное выше правило коммутативности. Взяв
некоторое выражение е, мы сопоставляем ему морфизм ае : / —>• Е.
Если существует морфизм /3:1—} Е2 такой, что ае : I —> Е, то
продукция применима и результатом ее применения является выраже-
выражение, соответствующее морфизму /Зф. Возьмем, например, выражение
+ (а, 6). Тогда ае = а+(а^у Взяв C = аа х а^, легко получить, что
а = /Зф, т. е. результатом применения продукции является морфизм
/Зф = (аа х аь)(тг2 х tti) (р+ = (аь х с^а) у?+ = а+(а,бM чт0 соответствует
последовательности +F, а).
Другой пример связан с дедуктивным логическим выводом. Для та-
такого вывода можно также использовать правила, например правило
g(x,y) —} g(-\-(x, 1), +(у, 1)) или, на более привычном языке, если
х > у, тож + 1 > у -\- 1. Такое правило можно представить в виде
ПРОДУКЦИИ (/,у?,^), В КОТОРОЙ If = (ТГ1 X /K2)(fg'- Е2 ^ Е И ф =
= ((я х 6:2Q^i) ^+ х (тг2 х ^2<^i) <?+) ^^- Применение этой продукции
производится аналогичным предыдущему образом.
С логическим выводом связана процедура унификации, т. е. про-
процедура нахождения наиболее общего подстановочного частного случая
двух выражений. Легко убедиться в том, что если сопоставить выра-
выражениям морфизмы так, как это было сделано выше, то их унификатор
будет соответствовать наибольшему частному случаю этих морфизмов.
Дуальное (в теоретико-структурном смысле) понятие — наименьшее
обобщение — реже используется в логике, однако оно может иметь
важное значение для формирования гипотез и обучения,
Пример 4. Перейдем к рассмотрению следующего примера.
Для этого рассмотрим произвольное множество Р. Пусть 53(Р) обо-
обозначает множество всех подмножеств множества Р. Для каждого под-
подмножества Q множества Р определим отображение (fQ : В(Р) —}
—} Ъ(Р) по формуле: R^Pq = R U Q для любого R Е 53(Р). Постро-
Построим категорию, единственным объектом которой является множество
53(P),aHom (B(P),B(P)) = {pQ,Q E Ъ(Р)}. Естественно, в качестве
множеств Е и / выбирается множество 53 (Р).
Рассмотрим задачу, в которой может быть использована построен-
построенная категория. Пусть система, анализируя ситуацию, должна устано-
установить наличие у нее ряда признаков. Если эти признаки обнаружены,
то система может сделать некоторое заключение об этой ситуации,
причем это заключение может быть сделано в форме добавления
к описанию ситуации новых признаков. Например, если в описании
296 Приложение
животного содержатся такие признаки, как «двуногое», «имеет кры-
крылья», «летает», то можно добавить утверждение «это птица». Постро-
Построим продукцию, которая выполняла бы подобную операцию. Пусть
при наличии у ситуации признаков pi,P2, следует добавить признаки
Рз,Р4- Рассмотрим продукцию @3(Р),у>,^), где (р = у>{Р1,Р2>, Ф =
= 1Р{р1,Р2,рз,Р4}- Пусть, например, описание ситуации состоит из при-
признаков pi,P2?P5- Этому описанию соответствует морфизм <Р{Р1}Р2}Р5}-
Поскольку имеет место равенство <Р{Р5} <Р{Р1 ,Р2} = ^{pi,p2,p5}> ПР°"
дукция применима, результатом ее применения является ситуация
^{рб}^{р1,Р2,рз,Р4} = ^{р1,Р2,рз,Р4,рб}» которая соответствует набору
признаков pi, р2, рз, Р4, Р5 •
Отметим также, что определенные ранее операции взятия наи-
наибольшего частного случая и наименьшего обобщения соответствуют
теоретико-множественному объединению и пересечению в том смысле,
что наибольшим частным случаем пары образцов ifQ1 и <Pq2 является
образец (Pq1vjq2^ а их наименьшим обобщением — образец tpQ1nQ2-
Пример 5. Рассмотрим более сложный пример. Для этого обра-
обратимся к широко применяемому в настоящее время понятию фрейма.
Фреймы были введены в работе [Минский, 1978] как описания стерео-
стереотипных ситуаций. В настоящее время встречаются самые разнообраз-
разнообразные трактовки этого понятия. В большинстве случаев фрейм содержит
набор слотов, каждый из которых содержит информацию о той или
иной стороне описываемой ситуации.
Рассмотрим сильно упрощенную модель фрейма, а именно назовем
фреймом следующую структуру:
(<имя слота1 > < значение слота1>)
(<имя слота2 > < значение слота2>)
(<имя слота п > < значение слота п>)
Более сложные структуры такого вида используются в языках про-
программирования подобных FRL. Мы не будем давать специального опре-
определения для ситуации, считая ситуацией фрейм, который мы по каким-
либо причинам не хотим или не можем дальше конкретизировать.
Фрейм сопоставим с ситуацией, если можно добавить в него новые
слоты таким образом, чтобы он совпадал с этой ситуацией.
Перейдем к формальным определениям. Пусть задано множество
X, элементы которого будем называть слотами. Для каждого сло-
слота х G X зададим множество F{x) допустимых значений слота х.
Для любого подмножества U множества X положим F(U) = П F{x).
хеи
Для любых / G F(U) и х G U обозначим символом f(x) проекцию
элемента / на множество F(x). При заданном подмножестве V С U
будем обозначать символом f\v проекцию элемента / множества F{U)
на F(V). Элементы множества F(U), где U С X, будем называть
фреймами, определенными на множестве U. Если / — фрейм, опре-
U.S. Примеры построения категорий для традиционных операций 297
деленный на множестве ?/, и х Е С/, будем называть элемент f(x)
значением слота х фрейма /, а слоты из множества X — U будем
считать неопределенными. (Таким образом, мы не делаем различия
между слотом, не содержащимся во фрейме, и слотом, содержащимся
в нем, но имеющим неопределенное значение. Формально считается,
что каждый фрейм содержит все слоты из множества X, но значения
слотов, не входящих в область определения фрейма, не определены.)
Естественно считать, что фрейм / является частным случаем фрей-
фрейма g, если всякий слот, определенный во фрейме g, определен также
и во фрейме /, имея в нем то же самое значение. Иначе говоря, область
определения V фрейма g должна быть подмножеством области опре-
определения U фрейма / и должно выполняться равенство f\v = g.
Построим теперь категорию, которую можно использовать для опи-
описания введенных понятий. В качестве объектов категории возьмем
множества вида F(U), U С X, при этом будем, как и в предыдущих
примерах, понимать под F@) одноэлементное множество /.
Введем следующие обозначения: тгж, х Е U С X — проекция F(U)
на F{x)\ Ejj — единственное отображение из F(U) в /; аа — отобра-
отображение из / в F(x), отображающее единственный элемент множества /
в а, где а Е F(x).
Возьмем теперь в качестве множества морфизмов категории мини-
минимальное множество, которое: 1) содержит все проекции тгж : F(U) —>
—>• F(x), x E U С Х\ 2) содержит все отображения ец : F(U) —>
—>• /; 3) содержит все отображения аа, а Е F(x), x E X; 4) вместе
с отображениями (рх : F{U) —> F(x), x E V содержит и отображение
П <рх : F(U) -»¦ F(V).
xev
В качестве базового объекта Е возьмем множество F{x) всюду
определенных фреймов.
Каж;дому фрейму / Е F(U) с областью определения U сопоставим
морфизм iff : F(X — U) —> F(x), где (g(ff)(x) = /(ж), если х Е
Е С/, и (g(ff)(x) = g(x) в противном случае. Таким образом, фрейму
/ Е ^(С/) соответствует образец (F(U),(ff). Легко проверяется, что
фрейм / Е ^(С/) является частным случаем фрейма^ Е ^(V) в смысле
данного выше определения в том и только в том случае, когда образец
(F(U),(ff) является частным случаем образца (F(V),(pg).
Как и в ряде предыдущих примеров, естественный смысл приоб-
приобретают операции нахождения наиболее общего частного случая и наи-
наименьшего обобщения. Например, наименьшее обобщение соответствует
пересечению фреймов — фрейму, у которого определены те слоты,
значение которых одинаково в каждом из исходных фреймов (более
точно: значение слота х пересечения есть а, если значение этого слота
есть а в каждом из исходных фреймов, или значение слота х есть а в
одном из исходных фреймов, а в другом — слот не определен; во всех
остальных случаях значение слота х пересечения не определено).
Аналогично, наибольший частный случай двух фреймов соответ-
соответствует их объединению. Такое объединение содержит все слоты, входя-
входящие хотя бы в один из исходных фреймов, при условии, что исходные
298 Приложение
фреймы не противоречат друг другу, т. е. не имеют одинакового слота
с разными значениями. Если же фреймы противоречат друг другу, то
их объединение пусто.
П.4. Учет побочных эффектов и организация
программы снятия рекурсии
П.4.1. Побочные эффекты и относительные побочные эффекты.
В «чистом» Лиспе любое допустимое выражение состоит из ряда при-
примитивов, таких как, NIL, атомов, списков и функций, среди которых
CAR, CDR, CONS, COND, EQUAL. В работе [Воуег and Moore, 1973]
можно найти пример такого «чистого» Лиспа. Интерпретатору системы
Лисп изначально известна информация о некотором числе атомов (их
именах, значениях и описках свойств), а также о некоторых списках.
Интерпретатор воспринимает выражение и возвращает его зна-
значение *). Свойством «чистого» Лиспа является то, что после такого
оценивания система Лисп восстанавливает свое исходное состояние.
В системе не остается следа, показывающего, что некоторое выражение
подверглось оцениванию (изолированный CONS создает некоторый
новый список, но к нему не ведет ни один указатель). Единственным пу-
путем изменения результата оценивания выражения является изменение
изначально выбранного множества атомов и списков. Можно сказать,
что такая система не имеет памяти в отношении данного выражения.
Однако требования удобства, вычислительной эффективности
и т. п. привели к тому, что Лисп был пополнен рядом функций
совершенно другой природы, так сказать, с последействием.
Наиболее часто встречается оператор присваивания SETQ. Напри-
Например, выражение
(SETQ V 'LISP)
хотя и имеет значение, но оно обычно не представляет интереса. Важ-
Важным и самым существенным эффектом является то, что кроме выдачи
этого значения, оценивание выражения ведет к тому, что в системе
Лисп строится новый атом V со значением LISP, который будет ею за-
запомнен. Это и есть, собственно, побочный эффект. Оценка выражения
(DE FOO(L M) (MEMB L М))
также дает побочный эффект: теперь система Лисп знает, как вычис-
вычислять новую функцию FOO.
Функции print (x, file) и read (file) также обладают побочным эф-
эффектом в этом смысле: состояние системы Лисп изменится после их
оценки, если в систему включить среду ввода-вывода.
) В современных версиях Лиспа допускается возвращение сразу несколь-
нескольких, т. е. кратных, значений.
П.4- Учет побочных эффектов и организация снятия рекурсии 299
Остановимся, наконец, на структуро-разрушающих функциях типа
RPLACA. Эта функция может создавать побочный эффект, а может
и не создавать его, что зависит от характера ее употребления. Напри-
Например, если определить функцию РЕЕ следующим образом:
(FEE
[LAMBDA (X)
(RPLACA X (QUOTE E]),
то оценивание (fee '(А В С)) дает в качестве значения список (Е В С).
Это — пример функции, создающей побочный эффект на своем Л-
выражении.
Итак, мы будем говорить, что некоторое выражение создает в си-
системе Лисп побочный эффект тогда и только тогда, когда оценивание
этого выражения так изменяет состояние системы, что найдется такое
другое выражение, что его оценивание до и после оценивания первого
выражения приведет к различным результатам. (Интересно отметить,
что в более традиционных языках программирования основную роль
как раз играют побочные эффекты, возникающие при оценивании
выражений» составляющих некоторую программу. Однако программа
в целом, если она нормально заканчивает работу, не должна оставить
побочного эффекта, так как после ее выполнения компьютер восстанав-
восстанавливает свое исходное состояние, если не учитывать, правда, состояние
внешних запоминающих устройств.)
Возвращаясь к сформулированной нами в разделе 5.1. проблеме
оптимизации порядка оценивания, необходимо ввести понятие относи-
относительного побочного эффекта, касающегося двух последовательно оце-
оцениваемых форм. Относительные побочные эффекты являются част-
частным случаем вышеопределенного побочного эффекта.
Определение. Будем говорить, что форма F1 создает отно-
относительный побочный эффект в отношении формы F2 тогда и только
тогда, когда оценивание формы F1 может изменить результат оцени-
оценивания формы F2.
В случае снятия рекурсии мы сталкиваемся с двумя категориями
побочных эффектов. Предположим, что при рекурсивном обращении
к функции foo(Xl,... ,XN) мы имеем foo(Fl,... ,FN). Тогда в итератив-
итеративном коде мы должны сделать следующие присваивания:
(SETQ XI F1)
(SETQ X2 F2)
(SETQ XN FN).
Таким образом, эта итеративная схема будет сама порождать неко-
некоторые побочные эффекты, даже в том случае, когда формы F1,... ,FN
не порождают побочных эффектов. Мы назовем эти побочные эффек-
эффекты негативными [Stefanuk, 1979] (поскольку в норме мы не хотели бы,
чтобы на результаты оценивания формы FK повлияли бы результаты
300 Приложение
оценивания предыдущих форм в указанном итеративном коде). Именно
такие побочные эффекты учитываются программой [Rish, 1973].
В то же время формы F1,..., FN сами по себе могут создавать
побочные эффекты, и нам показалось естественным рассмотреть оба
класса побочных эффектов в рамках единой формальной схемы [Ste-
fanuk, 1979]. С этой целью были написаны две программы.
Одна из них, DIMA-P, учитывает возможные ограничения на поря-
порядок оценивания форм. Это наиболее распространенный случай прояв-
проявления побочных эффектов.
Пакет DIMANP учитывает несколько более широкий тип побоч-
побочных эффектов, а именно побочный эффект, проявляющийся через
некоторую переменную. При этом в программе учитывается, что этот
побочный эффект может быть желательным или не желательным (мы
его называем, соответственно, позитивным и негативным побочным
эффектом).
П.4.2. Описание принципов работы пакетов. Не следует удивлять-
удивляться, что для работы программ автоматического снятия рекурсии с уче-
учетом побочных эффектов требуется, чтобы программист внес в про-
программу определенные декларативные команды. В конечном счете, про-
программа должна работать в режиме запроса, когда такие декларации
запрашиваются самой программой по мере возникновения в них необ-
необходимости.
Такие декларации могут быть источником дополнительных
неудобств для программиста и он, возможно, предпочтет оставаться
в рамках предположения «наихудшего случая», когда никакой оптими-
оптимизации не производится. Однако, если эффективность вычисления
является существенным вопросом, то без подобных деклараций
не обойтись, но тогда их внесение в программу не представляется
сложным, поскольку так или иначе они учитываются программистом
в ходе создания программы, использующей побочные эффекты для
повышения эффективности ее работы.
В программе DIMA-P единственной декларацией является список
PSEFLIST, содержащий пары форм, порядок оценивания которых из-
изменять нельзя. При этом программа находит оптимальный порядок
оценивания с учетом такого ограничения.
В программе DIMANP допускаются декларации более сложных
типов. В ней пользователь запрашивается о том, какие переменные
охвачены побочным эффектом для каждой из рассматриваемых форм.
Эта информация хранится для каждой формы в виде свойства с именем
SIDEF. Затем программа проверяет, есть ли соответствующая пара
форм в списке PSEFLIST, и только в этом случае побочный эффект
считается негативным и система при необходимости вводит промежу-
промежуточную переменную.
Мы завершим этот подраздел примером, охватывающим поднятые
вопросы. Но прежде этого отметим, что некоторые авторы [Darlington
and Burstall, 1973] полагают, что в ряде случаев низкая эффективность
рекурсивной программы обусловлена тем, что одна и та же форма
оценивается несколько раз.
П.4- Учет побочных эффектов и организация снятия рекурсии 301
Пример. Предположим, что необходимо дать итеративное пред-
представление для рекурсивно определенной функции
(F00 X Y Z U), (П.4.1)
где при рекурсивном обращении к FOO необходимо оценить
[F00
(CDR X)
(COHS (CAR X)
(CDR Z)) (П.4.2)
(CONS (CAR X)
(CDR Z))
(CDR Y]
Здесь у нас присутствует четыре формы Fl, F2, F3, F4 и при нормаль-
нормальном выполнении программы форма F2 будет оцениваться дважды.
Если рекурсия многократная, то с целью повышения эффективно-
эффективности вычисления можно заменить (П.4.2) на следующее:
[F00
(CDR X)
(SETQ T_l (CONS (CAR X)
(CDR Z))) (П.4.3)
(CONS (CAR X)
T_l)
(CDR Y]
а в итерации мы тогда получим
(SETQ X (CDR X))
(SETQ T_l (CONS (CAR X)(GDR Z)))
(SETQ U (CDR Y))
Здесь формы F2, F3 были заменены на F2!, F3!. Форма F2! создает
относительный побочный эффект в отношении F3! через переменную
Т_1. Это — позитивный побочный эффект, и он здесь умышленно
сохранен.
Получив код (П.4.3) и (F2! F3!) в качестве значения списка PSE-
FLIST, программа DIMA-P сохранит этот порядок форм и в то же
время сохранит Y для (CDR Y). (На самом деле, в этом примере
программа DIMA-P оценит F4 перед F2!.)
При отсутствии такой декларации программа даст ошибку. Однако
ошибки не будет, если рассмотреть слегка видоизмененную функцию
FEE:
[FEE
302 Приложение
(CDR X)
(SETQ T_l (CONS (CAR Y)
(CDR Z))) (П.4.4)
(CONS (CAR Y)
T_l)
(CDR Y]
В этом случае DIMA-P сохранит Y для формы F3! (и для формы F4).
Возвращаясь назад к кодам для FOO, мы видим, что ошибкой будет
взять вместо (П.4.3) следующее:
[F00
(CDR X)
(SETQ Y (CONS (CAR X)
(CDR Z))) (П.4.5)
(CONS (CAR X)
Y)
(CDR Y]
Здесь мы имеем также негативный (нежелательный) побочный эффект
формы F2! на F4.
Рассмотрим следующий итеративный вариант:
(SETQ X (CDR X))
(SETQ Y (CONS (CAR X) (CDR Z))) A1.4.6a)
(SETQ Z (CONS (CAR X) Y))
(SETQ U (CDR Y))
Он даст тот же самый результат, если второе присваивание считать
позитивным побочным эффектом для третьего присваивания, но нега-
негативным для четвертого, причем эта информация должна быть внесена
извне. Пользователь может предпочесть этому просто помещение чет-
четвертой формы перед второй:
[F00
(CDR X)
(CONS (CAR X)
(CDR Z))) (П.4.66)
(CONS (CAR Y)
Y)
(CDR Y]
В случае (П.4.5) программа DIMANP при заданном списке PSE-
FLIST вида ((F2! F3! Y)) «поймет» различие между этими двумя отно-
относительными побочными эффектами и либо сохранит саму переменную
Y для использования в F4, либо оценит F4 перед F2!
Наконец, в случае (П.4.6) программа DIMA-P даст не тот результат,
которого мы добиваемся: она сохранит Y для формы F3! или даже
П.4- Учет побочных эффектов и организация снятия рекурсии 303
обратит порядок оценивания и делу не поможет, если даже задать
в качестве значения PSEFLIST список ((F2! F3!)).
Этот побочный эффект будет верно рассмотрен программой DI-
MANP и в случае (П.4.6), если ей предоставлена информация ((F2!
F3! Y)). Похоже, что скорость вычислений в этом случае будет макси-
максимальной.
Если же значением PSEFLIST установить список ((F2! F3!)), то
программа будет рассматривать этот «обобщенный» побочный эффект,
как негативный для рассматриваемых форм и сохранит значение Y.
Заметим, что программы типа REMREC [Rish, 1973], имеющие дело
лишь с негативным побочным эффектом вполне определенного типа,
совпадают с нашими программами, если в них положить значение
списка PSEFLIST равным NIL
Мы закончим подраздел примером, где ничего нельзя сделать для
использования побочных эффектов, так как они вступают в противоре-
противоречие, точно так же, как и в примере рекурсивного вычисления функции
FEE, упомянутой нами выше:
[FEE
(CDR X)
(CONS (CAR Y)
(CDR Z)) (П.4.7)
(CONS (CAR Y)
Y)
(CDR Y]
Это выражение никогда не даст тот же результат, что выражение
(П.4.4).
Подводя итоги нашего анализа, мы приходим к выводу, что при пре-
превращении рекурсивного кода в итеративный в присутствии побочных
эффектов возникает несколько случаев:
A) Сами формы F1,..., FN побочного эффекта не создают. Тогда
побочные эффекты, возникающие в ходе присваивания, следует рас-
рассматривать как негативные.
B) Имеется относительный побочный эффект, требующий опреде-
определенного порядка оценивания форм. Такие побочные эффекты (разо-
(разобранные выше) следует рассматривать как негативные.
C) Позитивный побочный эффект через некоторую переменную
(кстати, такие возникает и в результате присваиваний при переходе
к итерациям) следует рассматривать как желаемый (например в случае
(П.4.7)).
D) Возможны комбинации перечисленных свойств.
В компиляторе системы Interlisp [Teitelman, 1974] указатели пере-
переставляются на новое значение переменной лишь после того, как были
оценены все формы. Такая организация учитывает случаи A), B), но не
учитывает случая C). Следующие изменения создали бы возможность
для полного использования позитивных побочных эффектов: в случае
C) указатель должен быть переставлен на результат оценивания фор-
304 Приложение
мы, создающей позитивный побочный эффект, сразу же после её вы-
выполнения. Тогда, при наличии определенных декларативных команд,
код (П.4.6) создает тот же результат, что и код (П.4.2), но с большей
эффективностью.
Однако подобная реорганизация потребует введения в компилятор
дополнительной проверки и эффективность вычисления в целом может
упасть.
Это соображение может получить дальнейшее развитие, если стро-
строить компилятор, как предлагают некоторые авторы, в котором при
оценке любой функции решается вопрос, оценивается ли она из-за
ее значения, или она оценивается из-за создаваемого ею побочного
эффекта.
П.4.3. Описание деталей программ. Мы дадим описание пакета
DIMANP, поскольку пакет DIMA-P, по существу, является ее сокра-
сокращенным и упрощенным вариантом. Пакет DIMANP позволяет решать
более широкий класс задач и содержит в себе элементы, допускающие
дальнейшее обобщение.
Общий подход в этой программе основан на поиске оптимальной
последовательности оценивания форм, отправляясь от описания их
локальных, парных отношений.
Приведем список возможных «конфликтов» между формами F1
и F2 через переменную X, предполагая, что эти формы оцениваются
в порядке Fl, F2 (слова «действует на» заменяют слова «создает по-
побочный эффект для»).
F1>X>F2 (Fl действует на X; X используется F2),
F1>X*>F2 (Fl действует на X; X используется F2; зна-
значение F2 заносится в X),
F1>*X>F2 (Fl действует на X; значение F1 заносится
в X; X используется F2),
F1-*X<F2 (значение F1 заносится в X; F2 действует на
X),
F1<*X<F2 (X используется F1; значение F1 заносится (П.4.8)
в X; F2 действует на X),
F1>*X<F2 (Fl действует на X; значение F1 заносится
в X; F2 действует на X),
F1-X*>F2 (значение F1 заносится в X; X используется
F2),
F1<*X>F2 (X используется F1; значение F1 заносится
в X; X используется F2).
Здесь учтены лишь те случаи, когда введение промежуточной пе-
переменной является обязательным. Мы не включили также побочные
эффекты, связанные с Л-переменными, поскольку они еще не доста-
достаточно нами изучены.
П.4- Учет побочных эффектов и организация снятия рекурсии 305
Заметим, что в программе DIMA-P, где не учитываются негативные
побочные эффекты через переменную, из списка (П.4.8) следует взять
два последних случая.
С другой стороны, этот список можно расширять (включив, напри-
например, побочные эффекты, связанные с Л-переменными).
В программе DIMANP для представления оцениваемых программ
используются так называемые семантические программы. Семантиче-
Семантическая программа составляется из четырех элементарных частей:
F1 — имя формы;
(SAVE X) — для переменной X вводится промежуточная
ячейка;
(SAVE F1 X) — промежуточная ячейка используется для (П.4.9)
хранения результата оценивания F1;
(RETURN X F1 X) — хранимое в промежуточной ячейке
значение F1, возвращается назад в X.
Язык таких семантических программ оказался весьма удобным на
этапе разработки DIMANP.
Ниже приведены частичные семантические подпрограммы для кол-
коллизий, содержащихся в (П.4.8):
Для кодов F1>X>F2, F1>X*>F2, FK*X>F2:
((SAVEX)(F1)(F2)).
Для кодов F1-*X<F2, F1>*X<F2:
((SAVE Fl -)(F2)(RETURN X Fl -)).
Для кода Fl < *X < F2:
((SAVE Fl X)(F2)(RETURN X Fl X)).
Для кода F1-*X >F2:
((SAVE X)(F1)(F2)) (П.4.10)
или ((SAVE Fl -)(F2)(RETURN X Fl -)).
Для кода Fl <*X > F2:
((SAVEX)(F1)(F2))
или ((SAVE Fl X)(F2)(RETURN X Fl X)).
Эти подпрограммы хранятся в программе DIMANP и используются
функцией PEPROG для создания семантической программы оценива-
оценивания форм Fl, F2,... в данном порядке.
Окончательная программа оценивания форм в их порядке для всех
«конфликтных» переменных создается лисповской функцией SEM-
PROG5. Это делается локальным и пошаговым образом с помощью
306 Приложение
PEPROG, которая находит правильное место для всех элементарных
частей и, в частности, пытается как можно раньше вставить return,
чтобы сделать «оборку промежуточных переменных» в ходе работы,
которая упоминается в статье [Darlington and Burstall, 1973].
Получив на вход семантическую программу, функция NORMPROG
строит список, представляющий программу в обычном смысле слова
с использованием операторов SETQ и промежуточных переменных.
Функция FCOST используется для подсчета числа промежуточных
ячеек @, 1 или 2), необходимых для некоторой переменной. После
этого EXPRIS1 вычисляет полную стоимость в смысле числа допол-
дополнительных присваиваний SETQ, необходимых для оценки F1,F2,... FN
в заданном порядке.
Наконец, с помощью процедуры полного перебора отыскивается
оптимальная последовательность оценивания форм. Хотя такая проце-
процедура довольно расточительна, на том уровне общности, на котором дей-
действует пакет DIMANP, трудно указать более экономный способ поиска
оптимума. Поэтому для экономии времени мы эвристически использу-
используем каноническое представление для направленного графа, описанное
выше в гл. 5, подп. 5.1.1.1.
Функция CANON 1 дает разбиение совокупности форм на некоторое
число подгрупп, обладающее тем свойством, что оценивание левой
группы в списке, представляющем такое разбиение, не сказывается
на результате оценивания групп, стоящих правее. Благодаря такому
свойству, оптимизация и построение программы может вестись для
этих групп независимо (слева направо), что позволяет использовать
одни и те же промежуточные ячейки.
Следует учесть однако, что на практике даже в тех случаях, когда
возникает большая совокупность форм, взаимодействует лишь неболь-
небольшое их число.
Список литературы 307
Список литературы
[Алексеева и др., 1984] Алексеева Е.Ф., Георгеску И., Стефанюк В.Л.
Общие вопросы проектирования экспертных систем // Представление
знаний в человеко-машинных и робототехнических системах. — М.:
ВИНИТИ, 1984. Т. С. - С. 226-254.
[Алексеева и Стефанюк, 1984] Алексеева Е.Ф. Стефанюк В.Л. Экс-
Экспертные системы — состояние и перспектива // Изв. АН СССР. Техн.
кибернет. 1984. №5. С. 153-167.
[Андрусевич, 1981] Андрусевич В.В. Динамика коллективного поведе-
поведения в системах с векторными элементами // Автоматика и телемех.
1981. С. 143-152.
[Антонюк, 1985] Антонюк Б.Д. Разработка экспертных систем в
США. - Препринт / ВНИИСИ - М., 1985. - 77 с.
[Афанасьев, 1979] Афанасьев В.Н. Аналитическое конструирование //
Математическое конструирование оптимальных систем. 4.1. — М.: МИ-
ЭМ, 1979. - 180 с.
[Афанасьев, Колмановский, Носов, 1989] Афанасьев В.Н., Колманов-
ский В.Б., Носов В.Р. Математическая теория конструирования систем
управления. — М.: Высшая школа, 1989. — 447 с.
[Беккенбах, Беллман, 1965] Беккенбах Э. Беллман М. Введение в нера-
неравенства. — М.: Мир, 1965. — 165 с.
[Беликов, 1983] Беликов Е.Н. Об организации в Академии наук СССР
работ по информатике, вычислительной технике и автоматизаии //
Вестн. АН СССР. 1983. №6. С. 24-30.
[Беллман, 1968] Беллман Р. Введение в теорию матриц. — М., 1968.
[Беркинблит, Гельфанд, Фельдман, 1986] Беркинблит М.Б., Гельфанд
И.М., Фельдман А.Г. Модель управления движениями многосуставной
конечности // Биофизика. 1986. Т. 31. №1. С. 128-138.
[Бернштейн, 1947] Бернштейн Н.А. О построении движений. — М.:
Медгиз, 1947. - 255 с.
[Бернштейн, 1966] Бернштейн Н.А. Очерки по физиологии движений
и физиологии активности. — М.: Медицина, 1966. — 349 с.
[Бессонова, 1986] Бессонова И.А. Исследование и разработка настраи-
настраиваемого интерпретатора систем общения с базами данных: Дис. — М.:
МЭИ, 1986.
[Бутрименко и Лазарев, 1965] Бутрименко А.В., Лазарев В.Г. Система
поиска оптимальных путей передачи сообщений // Пробл. передачи
информ. 1965. Т. 1. №1. С. 80-87.
[Бутрименко, 1966] Бутрименко А.В. Об играх автоматов, обладающих
различной активностью // Пробл. передачи информ. 1966. Т. 3. №4.
С. 81-88.
[Вайсборд, 1968] Вайсборд Э.М. Игры двух автоматов с различной
глубиной памяти // Автоматика и телемех. 1968. Т. 29. №3. С. 91-102.
308 Список литературы
[Вагин, 1988] Вагин В.П. Дедукция и обобщение в системах принятия
решенийю. — М.: Наука, 1988. — 383 с.
[Вайнцвайг и Полякова, 1975] Вайнцвайг М.Г.. Полякова М.П. Об од-
одном подходе к проблеме искусственного интеллекта // Моделирование
обучения и поведения. — М.: Наука, 1975. — С. 209-235.
[Варшавский и Гершт, 1966] Варшавский В.И., Гершт A.M. Поведение
непрерывных автоматов в случайных средах // Пробл. передачи ин-
форм. 1966. Т. 2. №3. С. 68-75.
[Варшавский и др., 1969] Варшавский В.И., Мелешина М.В., Перекрест
В. Т. Организация коллективного поведения автоматов в задаче о рас-
распределении ресурсов // Автоматика и телемех. 1969. №7. С. 101-108.
[Варшавский, 1973] Варшавский В.И. Коллективное поведение автома-
автоматов. — М.: Наука, 1973. — 407 с.
[Варшавский и Поспелов, 1984] Варшавский В.П., Поспелов Д. А. Ор-
Оркестр играет без дирижера. — М.: Наука, 1984. — 207 с.
[Васильев и др., 1969] Васильев Н.Б, Петровская М.Б., Пятецкий-
Шапиро И.И. Моделирование голосования со случайной ошибкой //
Автоматика и телемех. 1969. № 10. С. 103-107.
[Велихов, 1987] Велихов Е.П. Электронизация народного хозяйства:
задачи и перспективы // Информатика и научный прогресс. — М.:
Наука, 1987. - С. 5-13.
[Вентцель, 1988] Вентцель Е.С. Исследование операций. Задачи, прин-
принципы, методология. — М.: Наука, 1988. — 208 с.
[Виноград, 1976] Виноград Т. Системы, понимающие естественный
язык. — М.: Мир, 1976.
[Волгин, 1968] Волгин Л.П. Проблемы оптимальности в теоретической
кибернетике. — М.: Сов. радио. 1968. — 160 с.
[Волконский, 1965] Волконский В.А. Асимптотические свойства пове-
поведения простейших автоматов в игре // Пробл. передачи информ. 1965.
Т. 1,№2. С. 36-53.
[Вунт, 1978] Вунт Г Теория систем. — М.: Сов. радио, 1978. — 288 с.
[Гаек и Гавранек, 1984] Гаек П., Гавранек Т. Автоматическое образова-
образование гипотез. — М.: Наука, 1984. — 277 с.
[Гантмахер, 1966] Гантмахер Ф.Р. Теория матриц. — М.: Наука, 1966. —
576 с.
[Гейл, 1963] Ге.Теория линейных экономических моделей. — М.: ИЛ,
1963. - 418 с.
[Гершт, 1967] Гершт A.M. Об играх непрерывных автоматов // Пробл.
передачи информ. 1967. Т. 1. №3. С. 50-56.
[Гершт и Стефанюк, 1967] Гершт A.M., Стефанюк В.Л. Эмпирическая
задача Байеса в марковски переключаемой среде// 3-я конференция
по теории передачи и кодирования информации.—М., 1967. — С. 58-66.
[Гершт и Стефанюк, 1968] Гершт A.M.. Стефанюк В.Л. Автомат для
решения эмпирической задачи Байеса в марковски переключаемой
среде // Автоматика и телемех. 1968. № 11. С. 96-107.
Список литературы 309
[Гельфанд и др., 1963] Гельфанд И.М., Пятецкий-Шапиро И.О., Цет-
Цетлин М.Л. О некоторых классах игр и игр автоматов // Докл. АН СССР.
1963. Т. 152, №4. С. 845-848.
[Гельфанд и др., 1986] Гельфанд И.М., Гурфинкелъ B.C., Цетлин М.Л.,
Шик М.Л. Некоторые вопросы исследования движений // Модели
структурно-функциональной организации некоторых биологических
систем. - М.: Наука, 1986. - С. 264-275.
[Гельфанд и Прелов, 1978] Гельфанд СИ., Прелое В. В. Связь с многими
пользователями // Итоги науки и техники. Сер. «Теор. вероятностей.
Теор. кибернетика. Математ. статистика». Т. 15. — М.: ВИНИТИ,
1978. - С. 123-162.
[Гермейер, 1971] Гермейер Ю.Б. Введение в теорию исследования опе-
операций. - М.: Наука, 1971. - 383 с.
[Гинзбург и Стефанюк, 1979] Гинзбург Б.М., Стефанюк В. Л. О путях
повышения пропускной способности сети с изоаритмическим управле-
нибм // 5-й международный симпозиум по теории информации. — М.:
Наука, 1979. - С. 100-102.
[Гинзбург и Стефанюк, 1970] Гинзбург С.Л., Стефанюк В.Л. Игры п
автоматов с единственной точкой Нэша // Автоматика и телемех. 1970.
№8. С. 75-83.
[Глушков, 1969] Глушков В.М. Прогнозирование на основе экспертных
оценок // Кибернетика. 1969. №2. С. 2-4.
[Гнеденко, 1969] Гнеденко Б.В. Курс теории вероятностей. — М.: Наука,
1969. - 400 с.
[Голомб, 1975] Голомб СВ. Полимино. - М.: Мир, 1975. - 208 с.
[Горелов, 1987] Горелов И.И. Разговор с компьютером. Психолингви-
Психолингвистический аспект проблемы. — М.: Наука, 1987. — 256 с.
[Гурфинкелъ и др., 1972] Гурфинкелъ B.C., Малкин В.Б, Цетлин М.Л,
Шнейдер А.Ю. Биоэлектрическое управление. — М.: Наука, 1972. —
243 с.
[Горностаев, 1998] Горностаев Ю.М. Мобильные системы 3-го поколе-
поколения., М.: Международный центр научной и технической информации,
1998. 164 с.
[Гаврилова, Хорошевский, 2000] Гаврилова Т.А., Хорошевский В.Ф.
Базы знаний интеллектуальных систем. — С.-П., 2000, 382 с.
[Демидович и Марон, 1966] Демидович Б.П., Марон И.Ф. Основы вы-
вычислительной математики. — М.: Наука, 1966. — 664 с.
[Деннинг и др., 1984] Деннинг В., Эссинг Г., Маас С. Диалоговые
системы «человек - ЭВМ». Адаптация к требованиям пользователя. —
М.: Мир, 1984. - 112 с.
[Дружинин и Конторов, 1976] Дружинин В.В., Конторов Д.С. Про-
Проблемы системологии. — М.: Сов. радио, 1976. — 295 с.
[Де Дюв, 1983] Кристиан Де Дюв. Микротельца живой клетки // В
мире науки. 1983. №7. С. 30-41.
310 Список литературы
[Епифанов, 1974] Епифанов М.Е. Индуктивное обобщение в ассоциа-
ассоциативных сетях // Изв. АН СССР. Техн. кибернет. 1984. №5. С. 132-145.
[Ершов, 19] Ершов А.П. Смешанные вычисления // В мире нау-
KH(Scientific American), 1984. №6. С. 28-42.
[Ершов, 1988] Ершов А.П. Информатизация: от компьютерной грамот-
грамотности учащихся к информационной культуре обществах // Коммунист.
1988. №2. С. 82-92.
[Жожикашвили и Стефанюк, 1984а] Жожикашвили А.В., Стефанюк
В.Л. Статистические модели формирования простых фреймов // 4-й
семинар «Интеллектуальные банки данных». Тез. докл. — М.: МНИПИ
СПУ, 1984. - С. 8-9.
[Жожикашвили и Стефанюк, 19846] Жокикашвили А.В., Стефанюк
В. Л. Оптимизация времени выборки данных за счет формирования
простых фреймов // 2-е всесоюзное совещ. «Высокопроизводительные
вычислительные системы». Тез. докл. — М.: ИПУ, 1984, С. 180-181.
[Жожикашвили и Стефанюк, 1985] Жожикашвили А.В., Стедшнюк
В. Л. Использование методов теории категорий в задачах представления
знаний и обучения // ИВЕРСИ-85. — Тбилиси, 1985. — С. 139.
[Жожикашвили и Стефанюк, 1986а] Жожикашвили А.В., Стефанюк
В.Л. Представление знаний и обучение в терминах теории категорий
// Алгоритмы обработки экспериментальных данных. — М.: Наука.
1986.- С. 130-155.
[Жожикашвили и Стефанюк, 19866] Жожикашвили А.В., Стефанюк
В.Л. Теория категорий в задачах представления знаний и обучения //
Изв. АН СССР. Техн. кибернет. 1986. №2. С. 17-31.
[Жожикашвили и Стефанюк, 1988а] Жожикашвили А.В., Стефа-
Стефанюк В. Л. Обучающаяся система поддержки ввода информации в
ЭВМ — PROMPTER //Обработка и представление данных в человеко-
машинных системах. — М.: Наука. 1988. — С. 116-132.
[Жожикашвили и Стефанюк, 19886] Жожикашвили А.В., Стефанюк
В.Л. Ситуации, образцы ситуаций и их обобщение при обучении //
Всесоюзная конф. по искусств, интеллекту. Тез. докл. Т. 1. — М.: АН
СССР, 1988. - С. 364-369.
[Жожикашвили и Стефанюк, 2002] Жожикашвили А.В., Стефанюк
В.Л. О понятии продукции в искусственном интеллекте // Изв. РАН.
Сер. Теория и сист. управл. 2002. №4, С. 76-81.
[Жожикашвили и Стефанюк, 2002а] Жожикашвили А.В., Стедшнюк
В.Л. Алгебраическая теория продукционных систем // Восьмая наци-
национальная конференция по искусственному интеллекту. КИИ'2002, 7-
12 октября, Коломна, Россия. Труды конференции. — М.: Физматлит,
2002. Т. 1. С. 428-436.
[Жожикашвили и Стефанюк, 2002в] Жожикашвили А.В., Стефанюк
В.Л. О понятии продукции в искусственном интеллекте // Изв. РАН.
Сер. Теор. и сист. управл. №4, С. 76-81, 2002
[Журавлев, 1979] Математические методы в теории систем / Под ред.
Ю.И. Журавлева. — М.: Мир, 1979. —328 с.
Список литературы 311
[Загоруйко, 1999] Загоруйко Н.Г. Прикладные методы распознавания
образов. Новосибирск: Изд-во Ин-та математики, 1999, 270 с.
[Зенкин, 1991] Зенкин А.А. Когнитивная компьютерная графика. — М.:
Наука, 1991. - 188 с.
[Закревский, 1988] Закревский А.Д. Логика распознавания. — Минск:
Наука и техника, 1988. — 118 с.
[Зенин, 1988] Зенин А.Г. Система поддержки базы данных класси-
классификации в АСУ плодородия почв: Дис. канд. физ.-мат. наук. — М.:
ВАСХНИЛ, 1988.
[Интел, процессы, 1987] Интеллектуальные процессы и их моделирова-
моделирование. — М.: Наука, 1987. — 397 с.
[Исия и др, 1988] Исия Т., Симояма И. и др. Мехатроника. М.: Мир,
1988. - 314 с.
[Карлин, 1964] Карлин С. Математические методы в теории игр, про-
программировании и экономике. — М.: Мир, 1964. — 838 с.
[Клернер, 1975] Клернер Д.А. Покрытия прямоугольников конгруэнт-
конгруэнтными полимино // Полимино. — М.: Мир, 1975. — С. 192-203.
[Кобелев, 1982] Кобелев В. В. Диалоговая сервисная система «Джин». —
Препринт / ИТМ ВТ АН СССР. №8. - М., 1982. - 35 с.
[Котляр и Стефанюк, 1972] Котляр СБ., Стефанюк В.Л. Об одной
упрощенной модели взаимодействия в коллективе автоматов // Prob-
Problems of Control and Information Theory. — 1972. — V.lC-4). — С 297-305.
[Кохонен, 1982] Кохонен Т. Ассоциативные запоминающие устрой-
устройства. — М.: Мир, 1982. — 383 с.
[Крейн, 1986] Крейн И.М. Контакт «разумных систем» // Проблемы
поиска жизни во вселенной. — М.: Наука, 1986. — С. 104-109.
[Кринский, 1966] Кринский В.И. Об играх с нулевой суммой двух
асимптотически оптимальных последовательностей автоматов // Про-
бл. передачи информ. 1966. Т. 2, №2. — С. 43-53.
[Крылов и Цетлин, 1963] Крылов В.Ю., Цетлин М.Л. Об играх авто-
автоматов // Автоматика и телемеханика. 1963. Т. 24, №7. — С. 975-987.
[Крюков, 1986] Крюков Ю.И. Планирование перемещений многозвен-
многозвенной кинематической цепи как процесс поиска экстремума функции в
пространстве состояний системы //Алгоритмы обработки эксперимен-
экспериментальных данных. — М.: Наука, 1986. — С. 108-114.
[Крюков и Стефанюк, 1981] Крюков Ю.И., Стефанюк В.Л. Об алго-
алгоритмах выработки навыка в действиях манипулятора. — М., 1981. — 14
с. - Деп. в ВИНИТ. 22.06.81, №3004-81.
[Крюков и др., 1974] Крюков Ю.И. ,Стефанюк В.Л., Фомин СВ.
Об алгоритме выработки навыка в действиях манипулятора // VII
симпозиум по кибернетике. Научный совет по комплексной проблеме
«Кибернетика» — М.: Наука, 1974. — С. 16.
[Кузин и Дубинина, 1980] Кузин Л. Т., Дубинина В.Г. Интеллектуаль-
Интеллектуальная система проектирования сетей ЭВМ // Проектирование интеллек-
интеллектуальных систем. — М.: Атомиздат, 1980. — С. 12-16.
312 Список литературы
[Кузнецов и Адельсон-Вельский, 1988] Кузнецов О.П., Аделъсон-
Вельский Г.М. Дискретная математика для инженера. 2-е изд. — М.:
Энергоатомиздат, 1988. — 480 с.
[Лазарев и Саввин, 1973] Лазарев В.Г., Саввин Г.Г. Сети связи, управ-
управление и коммутация. — М.: Связь, 1973. — 264 с.
[Лавров и Силагадзе, 1978] Лавров С.С, Силагадзе Г.С. Автоматиче-
Автоматическая обработка данных. Язык Лисп и его реализация. — М.: Наука,
1978. - 176 с.
[Ларичев, 1989] Ларичев О.И. и др. Выявление экспертных знаний. М.,
1989.
[Леви и Сикевиц, 1971] Леей А., Сикевиц Ф. Структура и функции
клетки. — М.: Мир, 1971. — 583 с.
[Либерман, 1972] Либерман Е.А. Молекулярная вычислительная ма-
машина клетки (МВМ). Общие соображения и гипотезы // Биофизика.
1972. Т. 17, №5. С. 932-943.
[Либерман, 1982] Либерман Е.А. Живая клетка. — М.: Наука, 1982. —
160 с.
[Лингв, обеспечение, 1987] Лингвистическое обеспечение информацион-
информационных систем. - М.: ПИК ВИНИТИ-ИНИОН АН СССР, 1987. - 219 с.
[Лорьер, 1991] Лорьер Ж.-Л. Системы искусственного интеллекта. М.:
Мир, 1991, 568 с. (оригинал — 1987).
[Майклсен и др., 1987] Майклсен Р.Х., Мини Д., Буланже А. Эксперт-
Экспертные системы // Реальность и прогнозы искусственного интеллекта. —
М.: Мир, 1987. - С. 162-182.
[Малишевский, 1972] Малишевский А.В. Модели совместного функци-
функционирования многих целенаправленных элементов I—II // Автоматика и
телемех. 1972. №11. С. 92-110; 1972. №12. С. 108-128.
[Малишевский и Тенисберг, 1969] Малишевский А.В., Тенисберг Ю.Д.
Один класс игр, связанный с моделями коллективного поведения //
Автоматика и телемех. 1969. №11. С. 128-137.
[Месарович, Мако,Такахара, 1973] Месарович М., Мако Д., Такахара
Я. Теория иерархических многоуровневых систем. — М.: Мир, 1973. —
344 с.
[Месарович и Такахара, 1978] Месарович М., Такахара Я. Общая теория
систем. — М.: Мир, 1978. — 311 с.
[Микийчук и Стефанюк, 1971] Микийчук А.М.,Стефанюк В.Л. Об
одном типе взаимодействия, гарантирующем глобальную устойчивость
локального управления //2-е всесоюзное совещание по теории релей-
релейных устройств и конечных автоматов. Тез. докл.— Рига, 1971. — С. 100—
101.
[Микулич, 1985] Микулич Л.И. Проблемы создания экспертных систем
// Теория и модели знаний — Тартуский университет, 1985. — № 714. —
С. 87-115.
[Минский, 1978] Минский М. Фреймы для представления знаний //
Психология машинного зрения. — М.: Мир, 1978. — С. 249-339.
Список литературы 313
[Моисеев, 1987] Моисеев П.П. Изучать реальные механизмы в их ре-
реальном действии // Информатика и научный прогресс. — М.: Наука,
1987. - С. 55-68.
[Миркин, 1989] Миркин Б.М. Адаптация и оптимизация динамических
систем с децентрализованной структурой управления: Дис. —М.: ИПУ,
1989.
[Максимов, 1984] Максимов В.В. Трансформация цвета при изменении
освещения. — М.: Наука, 1984.
[Невдяев, 2002] Невдяев Л.М. Телекоммуникационные технологии.
Англ о-русский толковый словарь-справочник / Под ред. Ю.М.
Горностаева. М.: Связь и бизнес, 2002. 568 с.
[Нейман, 1956/ Нейман Дж. Вероятностная логика и синтез надежных
организмов из ненадежных компоненту // Сб. Автоматы / Под ред.
К.Э. Шенона, Дж. Маккарти — М.: ИЛ, 1956. — 403 с.
[Нейман, 1971] Нейман Дж. Теория самовоспроизводящихся автома-
автоматов. — М.: Мир, 1971. — 382 с. (оригинал — 1966).
[Нильсон, 1973] Нильсон Н. Искусственный интеллект. Методы поиска
решений. — М.: Мир, 1973. — 265 с.
[Опойцев, 1974-1975] Опойцев В.И. Динамика коллективного поведения
I-III //Автоматика и телемех. 1974. №4. С. 157-168; 1974. №6. С. 133-
144; 1975. №1. С. 124-138.
[Опойцев, 1977] Опойцев В.И. Равновесие и устойчивость в моделях
коллективного поведения. — М.: Наука, 1977. — 245 с.
[Осипов, 1997] Осипов Г. С. Приобретение знаний интеллектуальными
системами. — М.: Наука. Физматлит, 1997, 112 с.
[Павлюк и Россиков, 1986] Навлюк О.В., Россиков В.В. Формальная
модель диалоговой системы директивного типа // Программирование.
1986. №5. С. 53-59.
[Пароди, 1960] Народи М. Локализация характеристических чисел мат-
матриц и ее применения. М., 1960.
[Плесневич, 1982] Нлесневич Г. С. Представление знаний в ассоциатив-
ассоциативных сетях // Изв. АН СССР. Техническая кибернетика. 1982. № 5. С. 6-
22.
[Плетнев, 1985] Плетнев A.M. Поведение конечных и бесконечных
автоматов в игровых ситуациях // Автоматика и телемех. 1985. № 5.
С. 132-142.
[Пол, 1973] ПоР.Управление траекторией руки с помощью вычисли-
вычислительной машины // Интегральные роботы. — М.: Мир, 1973. — С. 326—
338.
[Попов, 1987а] Попов Е.П. Робототехника и гибкие производственные
системы. — М.: Наука, 1987. — 191 с.
[Попов, 1987] Попов. Э.В. Экспертные системы. — М.: Наука, 1987. —
284 с.
314 Список литературы
[Поспелов и Поспелов, 1965] Поспелов Г.С, Поспелов Д. А. Искусствен-
Искусственный интеллект — прикладные системы // Новое в жизни, науке, тех-
технике. Сер. «Математика, кибернетика». — М.: Знание,1965. №9. — 48 с.
[Поспелов и Солодов, 1984] Поспелов Г.,Солодов В. Коллективная диа-
диалоговая система планирования «Гранит» // Представление знаний в
человеко-машинных и робототехнических системах. — М.: ВИНИТИ,
1984. Т. С. 168-182.
[Поспелов, 1986] Поспелов Д. А. Ситуационное управление. Теория и
практика. — М.: Наука, 1986. — 284 с.
[Прангишвили, 1987] Прангишвили И.В. Структурная организация и
программное обеспечение многопроцессорных вычислительных ком-
комплексов с перестраиваемой структурой ПС-3000. — М.: ИПУ, 1987. —
50 с.
[Прохоров и Розанов] Прохоров Ю.В., Розанов Ю.А. Теория вероятно-
вероятностей. — М.: Наука, 1967. — 495 с.
[Поляк и Щербаков, 2002] Поляк Б. Т., Щербаков П. С. Робастная устой-
устойчивость и управление. — М: Наука, 2002. — 303 с.[Попов и др., 1996]
Попов Э.В., Фоминых И.В., Кисель Е.Б., Шапот М.Д. Статические и
динамические экспертные системы. Финансы и статистика. — М., 1996,
319 с.
[Попов, 1982] Попов Э.В. Общение с ЭВМ на естественном языке. М.:
Наука, 1982. — 360 с.
[Попов, 1996] Попов Э.В. Реинжиниринг бизнес-процессов и искус-
искусственный интеллект // Новости искусственного интеллекта. Россий-
Российская ассоциация искусственного интеллекта. №4. 1996. С. 5-39.
[Поспелов, 1994]. Информатика: Энциклопедический словарь для на-
начинающих / Сост. .А. Поспелов. — М.: Педагогика-Пресс, 1994. — 352
с.
[Поспелов и Фет, 1998] Очерки истории информатики в России // Ред.-
сост. Д.А. Поспелов, Я.И. Фет. — Новосибирск: ОИГГМ СО РАН,
1998. - 663 с.
[Романовский, 1977] Романовский В.И. Дискретные цепи Маркова. —
М.: Гостехиздат, 1949. — 436 с.
[Стефанюк и Рождественский, 1984] Стефанюк В.Л., Рождественский
К. Определение тональности музыкального произведения // Пробл. ис-
искусственного интеллекта и распознавания образов. Тез. докл. и сообщ.
Секция 1. — Киев: Институт кибернетики, 1984. — С. 170.
[Семенова, 1977] Семенова Е.Т. Язык программирования ЛИСП 1.5
(Учебное пособие по курсу «Языки программирования»). — М.: МЭИ,
1977. - 86 с.
[Семиотика, 1986] Семиотика и информатика. — М.: ВИНИТИ, 1986. —
164 с.
[Соболь, 1964] Соболь И.М. О периодах псевдослучайных последова-
последовательностей // Теория вероятностей и ее применения. 1964. Т. 9. № 2.
С. 367-373.
Список литературы 315
[Стефанюк, 1961] Стефанюк В. Л. Некоторые задачи о поведении авто-
автоматов: Дипломная работа. — М.: МГУ, 1961. — 32 с.
[Стефанюк, 1963] Стефанюк В. Л. Пример задачи на коллективное
поведение двух автоматов // Автоматика и телемеханика. — 1963. —
Т. 24. №6.-С. 781-784.
[Стефанюк, 1966] Стефанюк В. Л. Об отношении сигнал/шум для кана-
канала с аддитивным тепловым шумом // Проблемы передачи информации.
1966. Т. 2.№1. С. 58-67.
[Стефанюк и Цетлин, 1967] Стефанюк В.Л., Цетлин М.Л. О регули-
регулировке мощности в коллективе радиостанций // Проблемы передачи
информации. 1967. Т. 3, №4. С. 59-67.
[Стефанюк, 1967] Стефанюк В. Л. Об устойчивости регулировки мощ-
мощности в сети радиостанций // 3-я конференция по теории передачи и
кодирования информации. — М.: Совет по кибернетике, 1967. — С. 64-
71.
[Стефанюк, 1968а] Стефанюк В. Л. Поведение коллектива автоматов
в задаче о регулировке мощности // Проблемы кибернетики. 1968.
№20.-С. 131-144.
[Стефанюк, 19686] Стефанюк В.Л. Некоторые локальные критерии
устойчивой регулировки мощности в коллективе радиостанций // Про-
Проблемы передачи информации. 1968. Т. 4, №1. — С. 90-91.
[Стефанюк, 1968в] Стефанюк В.Л. Коллективное поведение автоматов
и задача устойчивого локального управления системой связи: Дис.
1968. - 115 с.
[Стефанюк, 1969] Стефанюк В.Л. О локальных критериях устойчивого
выбора уровня мощности // Проблемы передачи информации. 1969.
Т. 5, №3. - С. 46-63.
[Стефанюк, 1970] Стефанюк В.Л. Локальное управление мощностью
в большой системе связи // 3-й Международен симпозиум «Новости в
радиоэлектрониката». 4.2. Варна, 1970. — С. 1-7.
[Стефанюк, 1971а] Стефанюк В.Л. Об описании игр ^-автоматов //
Автоматика и телемех. 1971. №4. С. 83-88.
[Стефанюк, 19716] Стефанюк В.Л. О «взаимопомощи» в коллективе
радиостанций // Пробл. передачи информ. 1971. Т. 7, №3. С. 103-107.
[Стефанюк и Меерков, 1971] Стеамнюк В.Л., Меерков С. Асимптоти-
Асимптотически точное описание игр автоматов // 5-е всесоюзное совещание по
проблемам управления. Ч. II. — М.: Наука, 1971. — С. 207-210.
[Стефанюк, 1971в] Стефанюк В.Л. Школа-семинар по вероятностным
автоматам // Успехи матем. наук. 1971. Т. 26, №4A60). С. 255-258.
[Стефанюк и Котляр, 1971] Стефанюк В.Л., Котляр СВ. Об одной
модели группового взаимодействия // 2-е всесоюзное совещание по
теории релейных устройств и конечных автоматов. — Рига, 1971. —
С. 107.
[Стефанюк, 1973а] Стеамнюк В. Л. О взаимодействии при локальном
управлении // Автоматика и телемех. 1973, №6. С. 48-56.
316 Список литературы
[Стефанюк, 19736] Стефанюк В.Л. Одна теорема об М-матрицах и ее
применения // Матем. заметки. 1973. Т. 13, №2. С. 235-246.
[Стефанюк, 1974] Стефанюк В. Л. Оптимизация поиска по образцу в
случайной памяти // VII симпозиум по кибернетике (г. Тбилиси). —
М.: Наука. — Научный совет по комплексной проблеме «Кибернетика»,
1974. - С. 19.
[Стефанюк, 1975] Стефанюк В.Л. Представления для задачи «крепкий
орешек» // Труды IV международной объединенной конференции по
искусственному интеллекту. Т. 2. Методы представления задач, мето-
методы поиска решений, эвристические методы. — М.: Научный совет по
комплексной проблеме «Кибернетика», 1975. — С. 2.143-2.154.
[Стефанюк и др., 1977] Стефанюк В.Л., Крюков Ю.И., Белов Д.Ф.,
Курдюмов Г.Л. Центральное управление подводными роботами. — От-
Отчет по НИР. - М.: ИППИ АН СССР, 1977. Инв. N. 625337. 50 с.
[Стефанюк, 1979] Стеамнюк В.Л. Хранение и поиск по образцу при
случайном выборе из памяти // Вопросы кибернетики. Вып. 61. Про-
Проблемы искусственного интеллекта. 1979. С. 86-95.
[Стефанюк и др., 1980] Стеамнюк В.Л. (отв.исп.), Крюков Ю.И., Юди-
Юдина Е.Ф. Центральное управление роботом. — Отчет о НИР. — М.:
ВНИТИЦЕНТР, 1980. Инв. N. 901871. - 51 с.
[Стефанюк, 1981а] Стефанюк В.Л. Рекурсивное оценивание арифме-
арифметических функций в системах ЛИСП // Программирование. 1981. № 5.
С. 92-94.
[Стефанюк, 19816] Стефанюк В.Л. Наглядное программирование вы-
вычислений // 9-й Всесоюзный симпозиум по кибернетике (Сухуми, 1981
г-)
[Стефанюк, 1982а] Стефанюк В.Л. Проектирование интеллектуальной
операционной системы // 3-я школа-семинар «Интеллектуальные бан-
банки данных» ИБД-82 (Батуми). - М.: МНИПИ СПУ, 1982. - С. 7-8.
[Стефанюк, 19826] Стеамнюк В.Л. Об адаптивном управлении в се-
сети виртуальных соединений // Школа-семинар по системам управле-
управления. - М.: ИПУ АН СССР, 1982. - С. 15-16.
[Стефанюк, 1985] Стеамнюк В. Л. (рук. темы) Восстановление зависи-
зависимости, прогнозирование и планирование при небольшом числе наблю-
наблюдений (заключительный отчет). Отчет о НИР по теме 1.13.5.1(гл. 1,2). —
М.: ВНИТИЦЕНТР, 1985. N. 0286.0 004520. - 113 с.
[Стефанюк и Алексеева, 1986] Стеамнюк В.Л., Алексеева Е.Ф. К со-
созданию интеллектуальной операционной системы // Алгоритмы обра-
обработки экспериментальных данных.— М.: Наука, 1986. — С. 115—130.
[Стефанюк, 1987а] Стеамнюк В.Л. (отв. исполнитель) Обучающаяся
система поддержки ввода грузовой документации через терминалы
ЭВМ (Отчет НИР). - М.: ИППИ АН СССР, 1987. - 56 с.
[Стефанюк, 19876] Стефанюк В.Л. Некоторые аспекты теории эксперт-
экспертных систем // Изв. АН СССР. Технич. кибернетика. 1987. № 2. С. 85-91.
Список литературы 317
[Стефанюк, 1987в] Стефанюк В.Л. Предисловие к книге «Реальность
и прогнозы искусственного интеллекта». — М.: Мир, 1987. — С. 5—8.
[Стефанюк, 1987г] Стефанюк В.Л. Экспертные системы. Перспектив-
Перспективный аналитический обзор. — М.: ВИНИТИ, 1987. — 27 с.
[Стефанюк и Алексеева, 1987] Стефанюк В.Л., Алексеева Е.Ф. Универ-
Универсальная адаптирующаяся система ЛИСП // Изв. АН СССР. Технич.
кибернетика. 1987. №5. С. 173-178.
[Стефанюк, 1988а] Стефанюк В.Л. Организация диалога в экспертной
системе для иммуно-пандеми-ческого заболевания // Проблемы про-
проектирования экспертных систем. Тезисы докладов Всесоюзной школы-
совещания, 22-30 апреля 1988г., ч. 2. — М.: АН СССР, Союз научных и
инженерных обществ СССР, 1988. - С. 255-256.
[Стефанюк, 19886] Стефанюк В.Л. Доверять ли свидетельствам? //
Всесоюзная конференция по искусственному интеллекту (Т 1). — М.:
АН СССР, 1988. - С. 406-410.
[Стефанюк, 1989] Стефанюк В.Л. Оптимизация работы сети Интер-
Интернет как многоагентной системы с элементами обучения // Труды 6-й
национальной конференции по искусственному интеллекту с между-
международным участием КИИ'98. - Пущино: ОНТИ ИФПБ РАН, 1989. -
С. 30-34.
[Стефанюк, 1989а] Стефанюк В. Л. Консультирующая экспертная си-
система с локальной организацией // Всесоюзная конференция «Про-
«Проблемы разработки и внедрения экспертных систем». — М.: ВНИ-
ИНС. 1989. - С. 33-34.
[Стефанюк, 19896] Стефанюк В.Л. Анализ целесообразности локально-
организованных систем через потоки вероятности // Модели в системах
обработки данных. — М.: Наука, 1989. — С. 33-45.
[Стефанюк, 1989в] Стефанюк В.Л. Равновесие в дробно-линейной си-
системе взаимодействия при локальных данных // Модели в системах
обработки данных. — М.: Наука, 1989. — С. 45-54.
[Стефанюк и Жожикашвили, 1990а] Стефанюк В. Л, Жожикашвили
А.В. Консультирующая метаэкспертная система МЕТА-ЭС // II Всесо-
Всесоюзная конференция «Искусственный интеллект-90». Тезисы докладов.
— АН СССР, Тверь, «Центрпрограммсистем», 1990 — Секционные и
стендовые доклады, Т. 3 — С. 191—195.
[Стефанюк и Жожикашвили, 1990а] Стефанюк В.Л, Жожикашвили
А.В. МЕТА-ЭС (консультирующая метаэкспертная система) // Про-
Программное обеспечение и прикладные системы искусственного интел-
интеллекта. Каталог выставки на II Всесоюзной конференции «Искусствен-
«Искусственный интеллект-90», М.-ИВТС МГТПТО, С. 116-120, 191.
[Стефанюк, 1994] Стефанюк В.Л. Поведение квазистатической обо-
оболочки в изменяющейся нечеткой среде // Сб. научных трудов наци-
национальной конференции с международным участием «Искусственный
интеллект - 94». Т. 1. 1994. С. 190-203.
[Стефанюк, 1995] Стефанюк В.Л. От автоматов М.Л. Цетлина к ис-
искусственному интеллекту (Этапы и вехи, или как это было) // Новости
318 Список литературы
искусственного интеллекта. Российская ассоциация искусственного ин-
интеллекта. №4. 1995. С. 56-92.
[Стефанюк, 1996] Стефанюк В. Л. Выработка нового представления
задачи в ходе перебора // V национальная конференция по искусствен-
искусственному интеллекту (КИИ-96). Т. III. - С. 374-378.
[Стефанюк, 1997] Стефанюк В. Л. От многоагентных систем к коллек-
коллективному поведению // Труды международного рабочего совещания
«Распределенный искусственный интеллект и многоагентные систе-
системы» (DAIMAS'97). - С-П., 1997. С. 327-338.
[Стефанюк, 2000д] Стефанюк В.Л. Профилактика заражения вирусом
через почтовое отправление // Новости искусственного интеллекта.
Российская ассоциация искусственного интеллекта. № 1-2. 2000. С. 102—
103.
[Стефанюк, 2000е] Стеашнюк В.Л. Представление задач // Новости
искусственного интеллекта. Российская ассоциация искусственного ин-
интеллекта. №1-2. 2000. С. 37-61.
[Стефанюк, 2000ж] Стефанюк В.Л. Использование знаний экспертов
при выявлении последовательности оснований ДНК // Труды конфе-
конференции КИИ' 2000 (Международная конференция по искусственному
интеллекту, 24-27 октября 2000, Переславль-Залесский. Т. 1). — М.:
Физматгиз. — С. 83-91.
[Стефанюк, 2000з] Стефанюк В.Л. Принцип семиотической интроспек-
интроспекции Научная сессия МИФИ-99. Сб. науч. трудов. Т. 3. — М., 2000. —
С. 56-57.
[Стефанюк, 20026] Стеашнюк В. Л. Представление знаний и рассуж-
рассуждений (сжатый обзор по материалам IJCAI-2001, США) // 8-я нацио-
национальная конференция по искусственному интеллекту. КИИ'2002, 7-12
октября, Коломна, Россия. Труды конференции. М.: Физматлит, Т. 1,
С. 33-41.
[Стефанюк, 2002в] Стеашнюк В.Л. Уроки искусственного интеллекта.
Сборник научных трудов Научной сессии МИФИ-2002, том 3, «Интел-
«Интеллектуальные системы и технологии» — М.: МИФИ, 2002. — С. 18-19.
[Стефанюк, 2002г] Стеашнюк В.Л. Учить или учиться // Новости
искусственного интеллекта. Российская ассоциация искусственного ин-
интеллекта. №5. 2002. - С. 113-124.
[Стефанюк, 2002д] Стефанюк В.Л. Издержки демократии // Новости
искусственного интеллекта. Российская ассоциация искусственного ин-
интеллекта. №6. 2002. — С. 27.
[Стефанюк, 2002е] Стеашнюк В.Л. Международная объединенная кон-
конференция по искусственному интеллекту. Тбилиси. 1975 г. Политехни-
Политехнические чтения «КИБЕРНЕТИКА — ожидания и результаты». Вып. 2. —
М.: Знание, 2002. - С. 84-89.
[Стефанюк, 2002ж] Стеашнюк В.Л. Введение в интеллектуальные обу-
обучающие системы. Учебно-методическое пособие. М.: Российский уни-
университет дружбы народов, 2002, 59 с.
Список литературы 319
[Стефанюк, 2003а] Стефанюк В. Л. Мобильная связь для всех // Науч-
Научная сессия МИФИ-2003. Сб. науч. трудов. Т. 3. — М.: МИФИ, 2003. —
С. 23-25.
[Тарасов, 2002] Тарасов В. Б. От многоагентных систем к интеллекту-
интеллектуальным организациям: философия, психология, информатика. — М.:
УРСС. 2002. - 348 с.
[Тильчин и Шор, 1985] Тильчин О.Т., Шор О.Л. Организация эф-
эффективного хранения и поиска данных на основе анализа частотных
свойств потока запросов // Программирование. 1985. №6. — С. 64-68.
[Тыугу, 1984] Тыугу Э.Х. Концептуальное программирование. — М.:
Наука, 1984. - 256 с.
[Уемов, 1971] Уемов А. И. Логические основы метода моделирования. —
М.: Мысль, 1971. - 311 с.
[Уинстон, 1980] Уинстон П. Искусственный интеллект. — М.: Мир,
1980. - С. 42-59.
[Фельдман, 1987] Фельдман Дж.А. Сетевые модели // Реальность и
прогнозы искусственного интеллекта. — М.: Мир. 1987. — С. 137-147.
[Фогель и др., 1969] Фогель Л., Оуэне А., Уолш М. Искусственный
интеллект и эволюционное моделирование. — М.: Мир, 1969. — 230 с.
[Фомин, Беркинблит, 1973] Фомин СВ., Беркинблит М.Б. Математи-
Математические проблемы в биологии. — М.: Наука, 1973. — 199 с.
[Форсайт, 1984] Форсайт Р. Экспертные системы. Принципы работы и
примеры. — М.: Радио и связь, 1984. — 222 с.
[Фролов] Фролов К. В. Наука и машиностроение в стратегии ускорения
// Информатика и научный прогресс. — М.: Наука, 1987. — С. 121-189.
[Финн, 1991] Финн В.К. (ред.) Интеллектуальные информационные
системы. — М., 1991.
[Хейес-Рот, Уотерман, Ленат, 1987] Хейес-Рот Ф., Уотерман Д., Ленат
Д. Построение экспертных систем. — М.: Мир, 1987. — 441 с.
[Хеллман и Ковер, 1970] Хеллман М.Е., Ковер Т.М. По поводу авто-
автоматов в случайной среде // Пробл. передачи информ. 1970. Т. 6, № 2.
С. 21-30.
[Хинтон, 1987] Хинтпон Дэю.Е. Обучение в параллельных сетях //
Реальности и прогнозы, искусственного интеллекта. —М.: Мир, 1987. —
С. 124-136.
[Цаленко и Шульгейфер, 1974] Цаленко М.Ш., Шульгейфер Е.Г. Осно-
Основы теории категорий. — М.: Наука, 1974. — 256 с.
[Церцвадзе, 1968] Церцвадзе Г.Н. Об асимптотических свойствах целе-
целесообразных автоматов в стационарной случайной среде // Автоматика
и телемех. 1968. №8. С. 93-99.
[Цетлин, 1961] Цетплин М.Л. О поведении конечных автоматов в слу-
случайных средах // Автоматика и телемех. 1961. Т. 22, № 10. С. 1345-1354.
[Цетлин, 1963] Цетлин М.Л. Конечные автоматы и моделирование
простейших форм поведения // Успехи матем. наук. 1963. Т. 18, №4.
С. 3-28.
320 Список литературы
[Цетлин, 1969] Цетлин М.Л. Исследования по теории автоматов и
моделированию биологических систем. — М.: Наука, 1969. — 316 с.
[Цетлин и Гинзбург, 1968] Цетлин М.Л., Гинзбург С. Л. Об одной кон-
конструкции стохастических автоматов // Проблемы кибернетики. 1968.
Т. 20. С. 19-26.
[Цетлин и Крылов, 1963] Цетлин М.Л., Крылов В. Д. Примеры игр
автоматов // ДАН СССР. 1963. №2. С. 284-287.
[Цуприков] Цуприков В. А. Задача стохастического управления режи-
режимами каскада насосных станций магистрального канала. — Ленин-
Ленинград: Политехнический институт им М.И. Калинина. — Диссертация
@5.13.01).
[Цыбаков и Лиханов, 1985] Цыбаков B.C., Лиханов Н.В. Некоторые
новые алгоритмы случайного множественного доступа // Проблемы
передачи информ. 1985. Т. 21, №27. С. 68-89.
[Цыганов, 1987] Цыганов В.В. Адаптивные механизмы функционирова-
функционирования активных систем III // Автоматика и телемех. 1987. № 3. С. 117-126.
[Цыпкин, 1946] Цыпкин Я.З. Устойчивость систем с запаздывающей
обратной связью // Автоматика и телемех. 1946. №2-3. С. 107-129.
[Ченцов, 1980] Ченцов В.М. Системы распределения информации. Син-
Синтез структуры и управления. — М.: Связь, 1980. — 143 с.
[Шадурскис, 1986] Шадурскис К.П. Устойчивость статистического рав-
равновесия систем коллективного поведения. — Диссертация к. т. н.— Рига,
1986.
[Шнейдерман, 1984] Шнейдерман Б. Психология программирования.
Человеческие факторы в вычислительных и информационных систе-
системах. — М.: Радио и связь, 1984. — 304 с.
[Штернберг, 1986] Штернберг А.А. Аналитическое конструирование
многоуровневых децентрализованных систем автоматического управ-
управления. — Диссертация @5.13.01). — М.: 1986.
[Шмуклер, 1968] Шмуклер Ю.И. Термодинамическая модель адапта-
адаптации. Доклады Академии наук СССР, 1968, Т. 182, №6, С. 1290-1293
[Эйдус, Марков, Венедиктов, 1965] Эйдус Г.С., Марков И.И., Венедик-
Венедиктов М.Д. Асинхронные адресные системы связи (обзор) // Проблемы
передачи информ. 1965. Т. 1, №47. С. 3-20.
[Эндрю, 1985] рА. Искусственный интеллект. — М.: Мир, 1985. — 264
с. (оригинал — 1983).
[Abramson, 1970] Abramson N. The ALOHA System — Another alternative
for computer communication // Proc. 1970 Fall Joint Computer Confer-
Conference. - AFIPS Press, 1970. V.37.- P. 281-285.
[AOS, 1977] Advanced Operating System (AOS), User's Manual 093-
000122-01. DGC, 1977. - P. A1-A3.
[Back and Mannila, 1984] Back R.J.R., Mannila H. A. Semantic Approach
to Program Modularity. // Information and Control. 1984. V. 60, Nos. 1-3.
P. 138-167.
Список литературы 321
[Boyer and Moore, 1973] Boyer R.S., Moore J.S. Proving theorems about
LISP functions // Proceedings of 3rd. International Joint Conference on
Artificial Intelligence (IJCAI-73). — Menio Park: Stanford Research Insti-
Institute, 1973. - P. 486-493.
[Bundy, 1996] A.Bundy (Ed.) Artificial Intelligence Techniques. A compre-
comprehensive Catalogue. Fourth Revised Edition. — Berlin-Heidelberg: Springer-
Verlag, 1996. - 296 p.
[Burville and Kingman, 1973] Burville P.J., Kingman J.F.C. On a model
for storage and search // Journal of Applied Probability. 1973. No. 10. P.
697-701.
[Chandrasekaran and Shen, 1969] Chandrasekaran В., Shen D. W. Stochas-
Stochastic Automata Games // IEEE Trans. Syst.Sci. and. Cybernet. 1969. V. 5,
No. 2. P. 145-149.
[Charniak, 1978] Charniak E. On the use of Framed Knowledge in Language
Comprehension // Artificial Intelligence. 1978. No. 11. P. 225-265.
[Cover and Helman, 1970] Cover T.M., Helman M.E. The Two-armed-
Bandit Problem with Time-Invariant Finite Memory // IEEE Transact
ions on Information Theory. 1970. V. IT-16, No. 2. P. 185-195.
[Darlington and Burstall, 1973] Darlington J., Burstall R.M. A system
which automatically improves programs // Proceedings of 3rd. Interna-
International Joint Conference on Artificial Intelligence (IJCAI-73). — Menlo Park:
Stanford Research Institute, 1973. - P. 419-485.
[Devis, 1972] Devis D. W. Control of Congestion in Packet Switching Net-
Network // IEEE Trans. Commun. Technol. — Special Issue on computer
Communication, pt-11. - 1972. V. Com-20. - P. 547-555.
[Dijkstra, 1970 ] Dijkstra E.W. Notes on Structured Programming //
Structured Programming / Dahl O.J., eds. — London and New York:
Academic Press., 1970. - P.1-81.
[Eager, 1974] Eager B. Using the Internet // Que Corporation, 1974.
[Johnson and Kotz, 1989] H.L. Johnson & S. Kotz. Axiomatic approach
to formulas for combining likelihoods of evidence, C310 in Journal of
Statistical Computation and Simulation 31 A989), pp/ 49-54.
[Haraldson, 1975] Haraldson A. Lisp-detailes, Interlisp/360-370. — Uppsala
University, 1975. — 151p.
[Hasemer, 1984] Hasemer T. MacSolo-AURAC: a Programming Environ-
Environment for Novices // Proc. of IJCAI. — Pisa, 1984. — P. 399-408.
[Hellman and Cover] Hellman M.E., Cover T.M. Comments on Automata
in Random Media / Доклад на международной конференции по теории
информации (г.Дубна). 19-25 июня. 1969.
[Hendriks, 1972] Hendriks W.J. The stationary distribution of an interesting
Markov chain // Journal of Applied Probability. 1972. No. 9. P.231-233.
[Heyes-Roth, 1985 ] Heyes-Roth B. A Blackboard architecture for Control
// Artificial Intelligence. 1985. V. 26. - P. 251-921.
[Hicks, 1946] Hicks J.R. Value and Capital. — Oxford University Press,
1946. — Ch.4-8 and Appendix. — 340 p.
11 Стефанюк
322 Список литературы
[Hillis, 1985] Hillis W.D. The connection machine. - Cambridge: MIT
Press, 1985. — 190 p.
[Hofstadter, 1981] Douglas R. Hofstadter. Godel, Escher, Bach: An eternal
golden braid. A metaphorical fugue on minds and machines in the spirit of
Lewis Carrol. — Penguin Books, 1981, 777 p.
[IJCAI-1979] Proceedings of 6-th International Joint Conference on Artifi-
Artificial Intelligence. — Tokyo, 1979.
[IJCAI-1985] Proceedings of 9-th International Joint Conference on Artifi-
Artificial Intelligence. — San Francisco, 1985.
[IJCAI-2001] Proceedings of International Joint Conference on Artificial
Intelligence, Seattle, 2001.
[Johnson and Kotz, 1989] N.L.Johnson & S.Kotz. Axiomatic approach
to formulas for combining likelihoods or evidence, C310 // Journal of
Statistical Computation and Simulation. 1981. V. 31. P. 49-54.
[Kempe, 1979] Kempe A.B. On the geometrical problem of four colors //
American Journal of Mathematics. 1879. No. 2. 193-204.
[Khan and Jain, 1985] Khan N.A., Jain R. Uncertainty Management in
Distributed Knowledge Based Systems // Proc. of IJCAI-85. — Los Altos.
Calif: Morgan Kaufmann Publishers, Inc., 1985. - P. 318-320.
[Klopf, 1982] Klopf. The hedomisic Neuron // A theory of Memory, Learn-
Learning, and Intelligence. — 1982.
[Kowalski, 1979] Kowalski R. Logic for problem solving. — New York-
North-Holland, 1979.
[Lakshmivarahan and Narendra, 1975] Lakshmivarahan S.,Narendra K.S.
Analysis of Memory Depth in Fixed Structure Learning Automata //
Bector Center Technical Report CT-62. — Yale University, 1975. — 16
P-
[Lenat et al, 1983] Lenat D.B. et al. Knoesphere. Building expert systems
with encyclopedic knowledge // Proc. IJCAI-8, 1983. — P. 167-169.
[Mac Lane, 1972] Mac Lane. Categories for the working mathematicians. —
Springer, 1972. - 250 p.
[McCarthy, 1964] McCarthy J. A Tough Nut Proof Procedures. — Stanford
University; Al Project Memo, 1964. — N.16.
[McCarthy, 1990] McCarthy J. Coloring Maps and the Kowalski Doctrine
// Formalizing common sense / Ed. by Lifschitz. — Norwood, New Jersey:
Ablex publishing corp., 1990, 256 p.
[Mizogushi and Kakusho, 1979] Mizogushi R., Kakusho O. Hierarchical
production system // The Sixth International Joint Conference on Artificial
Intelligence. — Tokio. Japan, 1979. — P. 586-588.
[MM/1, 1980] MM/1 Man-machine interface // Software Pract. and Exper.
— 1980. - P. 751-763.
[Munakata, 1998] Munakata T. Fundamentals of the New Artificial Intelli-
Intelligence. Beyond Traditional Paradigms. — Springer-Verlag, New York Inc.,
1998. - 231 с
Список литературы 323
[Narendra and Thathacher, 1977] Narendra K.S.,Thathacher M.A.L.
Learning Automata — a Survey // IEEE Trans., SMC. — 1977. —V.4. —
P. 323-334.
[Nordstrom and Sandewall, 1970] Nordstrom M., Sandewall E. LISP Fl. A
Fortran implementation of LISP 1.5. — Uppsala University: Datalogilabo-
ratoriet, 1970. — 73 p.
[Rish, 1973] Rish T. REMREC — a program for automatic recursion re-
removal in LISP // DLU 73/74. — Uppsala University: Datalogilaboratoriet,
1973.
[Ritch, 1983] Ritch E. Users are individuals: individualizing user models //
Int. J. Man-machine Std. 1983. N. 8. P. 199-214.
[Rudall, 1997] Rudall B.H. Contemporary systems and cybernetic // KY-
BERNETES. 1997. V. 26, N. 4. P. 370-388.
[Shortliff, 1976] Shortliff E. Computer based Medical Consultations
MYCIN. — Hew York: American Elsevier, 1976. — 264 p.
[SIGART, 1972] SIGART // Newsletter. 1972. N. 16. P. 9-27.
[Simon and Siklossy, 1972] Simon H.A., Siklossy L.A. Representation and
Meaning. — Prentice-Hall, Inc., 1972. — P. 423-425.
[Simon, 1995] Simon H.A. Explaining the Ineffable: AI on the Topics of
Intuition, Insight and Inspiration //Proc. IJCAI-95. Morgan Kaufmann
Publishers, San Mateo, 1995. P. 939-948.
[Simon and Siklossy, 1972] Representation and Meaning / Simon H.A.,
Siklossy L.A. (eds.). Prentice-Hall, Inc., 1972.
[Sleeman, 1985] Sleeman D.H. UMFE: A User Modelling Front-End. Sub-
Subsystem // Int. J. Man-Machine Std., 1985. — N. 23. — P. 71-88.
[Sutton, Barto, 1998] Sutton R.G., Barto A.G. Reinforcement Learning. An
introduction, 1998.
[Tibbet et al., 1995] Tibbets G, Bowling J.M.& Golden I. Neural Networks
for Automated Base-calling of Gel-based DNA Sequencing Ladders //
Automated DNA Sequencing and Analysis / Ed. by M.D.Adams, С Fields,
J.C.Venter — London: Academic Press.
[Stallman, 1986] Stallman R. GNU Emacs Manual. Fifth Edition, Emacs
Version 18 for Unix Users , 1986. — 286 p.
[Stefanuk, 1970] Stefanuk V.L. Local power control in a large communica-
communication system // 3d international symposium «Advances in Radioelectronics»,
Bulgaria, Varna, 1970. - Part 2 - pp. 1-7
[Stefanuk, 1971] Stefanuk V.L. Collective Behavior of Automata and the
Problem of Stable Local Control of a Large Scale System // Second
International Joint Conference on Artificial Intelligence, London, pp. 51-
56, 1971.
[Stefanuk, 1973] Stefanuk V.L. On a local approach to representation
in problem solving // Proceedings of the 3IJCAI. — Stanford: Stanford
University, 1973. - P. 612-617.
li*
324 Список литературы
[Stefanuk, 1974] Stefanuk V.L. A model of random pattern matching in a
data base // MIP-R-110, University of Edinburgh, 1974. — 15 p.
[Stefanuk, 1976] Stefanuk V.L. The use of a graph representation for reduc-
reduction of Problem Solving Complexity // Firbush News. N.6. — Edinburgh
University, 1976.
[Stefanuk, 1979] Stefanuk V.L. The use of a graph representation in opti-
optimization of variable replacement in LISP in the presence of side-effects //
Machine Intelligence 9. — New York, John Wiley & Sons, 1979. — P. 27-40.
[Stefanuk, 1987] Stefanuk V.L. Towards Intelligent operating system: flex-
flexible Lisp environment // VTT Symposium on man-machine interface. —
ESPOO.: Technical Research Centre of Finland, 1987. - P. 117-127.
[Stefanuk, 1993] Stefanuk V.L. Local Control in a System with Contralinear
Interaction of Subsystems, Proceedings of European Control Conference
(ECC'93), Vol. 1, Groningen, pp. 117-119, 1993.
[Stefanuk, 1996] Stefanuk V.L. Discovery of Representations through
Search: Case Study // ECAI96. 12t/l European Conference on Artificial
Intelligence: Workshop W30: «Applied Semiotics», 1996. — P. 33-37.
[Stefanuk, 1996a] Stefanuk V.L. Intelligent Systems: A Semiotic Perspective
// Proceedings of the 1996 International Multidisciplinary Conference.
Volume II : Applied Semiotics, October 20-23, Gaithersburg, MD, USA. —
P. 1-6.
[Stefanuk, 2000a] Stefanuk V.L. Dynamic expert systems // KYBER-
NETES. The International Journal of Systems & Cybernetics. V. 29, Issue
5. — MCB University Press, 2000. — P. 702—709.
[Stefanuk, 2000b] Stefanuk V. Semiotics of Sign Discovery in Noisy DNA
Sequencing. Workshop on Applied Semiotics: Control Problems (asc2000),
Berlin, 2000. - P. 6-8.
[Stefanuk, 2000c] Stefanuk V.L. Applied Semiotics: Control Problems (ASC
2000), AI Communication 14 B001), IOS Press. P. 105-109.
[Stefanuk, Zhozhikashvili, 2002a] Stefanuk V.L., Zhozhikashvili A.V. Pro-
Productions and rules in artificial intelligence // KYBERNETES. The Inter-
International Journal of Systems & Cybernetics. MCB University Press, 2002.
V. 31, N 5, 6. P. 817-826.
[Stefanuk, Zhozhikashvili, 2002b] Stefanuk V.L., Zhozhikashvili A.V. Al-
Algebraic Theory of Production Systems // Knowledge-Based Software En-
Engineering. Proceedings of the Fifth Joint Conference on Knowledge-based
Software Engineering / Ed. T.Welzer, S.Yamamoto, and I.Rozman. — IOS
Press, 2002. - P. 116-124.
[Steele, 1984] Steele G.L. Common Lisp. The language. — Massachusetts:
Digital Press, 1984. - 465 p.
[Takeushi, Kitahashi, 1973] Takeushi A., Kitahashi T. Two-person zero-
sum games between automata // Trans. Inst. Electron, and Comunic. Eng.
Jap. 1973. V.56A. N. 2. P. 40-45.
[Teitelman, 1974] Teitelman W. INTERLISP Reference Manual. — Xerox
Palo Alto Research Center, 1974. — 260 p.
Список литературы 325
[Time-life, 1987] Speed and Power. — Alexandria, Virginia: Time-life books,
1987. - 128 p.
[Wanders, 1995] Wanders B.J. Advances in Sequence Assembly // Hand-
Handbook of Capillary Electrophoresis / Ed. by James P.Landers. — CRC Press,
Roca Raton, Boston, 1995. - P. 449-456.
[Weissman, 1967] Weissman C. LISP 1.5 Primer. — Belmont. Calif.: Dick-
enson Publishing Company, 1967. — 226 p.
[Zadeh, 1965] Zadeh L. Fuzzy sets // Information and control. — N. 8. —
1965. - P. 338-348.
[Zisman, 1978] Zisman M.D. Use of production systems for modeling asyn-
asynchronous concurrent process // Pattern-directed inference systems. — New
York: Academic Press, 1978. — P. 53-68.
ОГЛАВЛЕНИЕ
Предисловие 4
Введение 11
Глава 1. Общие принципы локальной организации систем . 26
1.1. Математическое моделирование систем 26
1.1.1. Общая теория систем B7). 1.1.2. Исследование операций
и теория игр B9). 1.1.3. Игровое децентрализованное управле-
управление C0).
1.2. Примеры систем, требующих локальной организации 31
1.3. Методика изучения локально-организованной системы 34
1.4. Исторические предпосылки и краткая библиография 40
1.5. Выводы по главе 1 45
Глава 2. Методы исследования локальной организации по-
поведения систем в дискретных моделях 47
2.1. Асимптотический (с ростом глубины памяти) анализ 49
2.1.1. Формулировка игры ^-автоматов E0). 2.1.2. Полный
анализ на ЭВМ игры двух автоматов путем моделирования E2).
2.1.3. Асимптотическая оптимальность последовательности
коллективов ^-автоматов в игре с одной партией Нэша E5).
2.1.4. Асимптотическое описание произвольных игр е-
автоматов E9). 2.1.5. Свойства вспомогательных цепей
Маркова, построенных для некоторых примеров игр F0).
2.1.6. Доказательство леммы и теоремы 2.1 F5).
2.2. Анализ потоков вероятности 67
2.2.1. Примеры вычисления финальных вероятностей F9).
2.2.2. Теорема М.Л. Цетлина о глубоком состоянии автомата
(необходимое условие) G2).
2.3. Приближенный анализ коллективного поведения при большом
числе участников 76
2.3.1. Модель формирования мнения G6). 2.3.2. Вывод уравне-
уравнения процесса формирования мнения и его анализ (80). 2.3.3. Ис-
Исследование приближенного уравнения процесса при нечетных
к = 21 + 1 (81).
2.4. Комбинированное исследование модели памяти 82
2.4.1. Качественное описание памяти со случайной выборкой
и примеры ее применения (83). 2.4.2. «Закон квадратного кор-
корня» (85). 2.4.3. «Естественный» алгоритм образования и уничто-
жения копий слов (87). 2.4.4. Использование «геометрических»
соображений (88). 2.4.5. «Явные» алгоритмы оптимизации (89).
2.4.6. Поиск без возвращения (93). 2.4.7. Другие характеристики
модели памяти со случайной выборкой (94).
2.5. Выводы по главе 2 95
Глава 3. Локальная организация целесообразного поведе-
поведения в непрерывных моделях 97
3.1. Исследование роли взаимодействия при локальном управлении . 100
Оглавление 327
3.1.1. Устойчивость локального управления в невзаимодействую-
невзаимодействующем (иерархическом) коллективе A01). 3.1.2. Неэластичность
поведения для широкого класса критериев в локально-орга-
локально-организованной системе A03). 3.1.3. Доказательство теорем 3.1
и 3.2 A06).
3.2. Содержательные условия устойчивости локального управления . 112
3.2.1. «Обобщенная локальная устойчивость» A13). 3.2.2. Диф-
Дифференциальная форма содержательных условий устойчиво-
устойчивости A14). 3.2.3. Устойчивость в малом A16).
3.3. Поведение коллектива автоматов в задаче о регулировке мощно-
мощности 118
3.3.1. Моделирование систем связи A18). 3.3.2. Математическая
модель коллектива радиостанций A19). 3.3.3. Конструкция ав-
автоматов регулировки мощности A22). 3.3.4. Устойчивость регу-
регулировки мощности A23). 3.3.5. Регулировка мощности с запаз-
запаздыванием A24). 3.3.6. Заключительные замечания A32).
3.4. Одна теорема об М-матрицах и ее применения 134
3.4.1. Выпуклость множества Л^ A40). 3.4.2. Об одном условии
невырожденности произвольной матрицы A44). 3.4.3. О взаимо-
взаимопомощи в коллективе автоматов A44).
3.5. Локально-организованное управление многозвенным манипуля-
манипулятором 149
3.5.1. Модель манипулятора A50). 3.5.2. Двухуровневая система
управления A51).
3.6. Выводы по главе 3 152
Глава 4. Локальный подход к решению фундаментальных
задач искусственного интеллекта 154
4.1. Локальный подход к выбору представления задач 155
4.1.1. Принцип семиотической интроспекции A56). 4.1.2. Семи-
Семиотическая интроспекция в задаче «крепкий орешек» A58).
4.2. Вариации на тему задачи «крепкий орешек» 160
4.2.1. Иерархия проблем A61). 4.2.2. Работа с произвольным
массивом клеток A72). 4.2.3. Локальное управление потоками
такси A78). 4.2.4. Имитационное моделирование A80).
4.3. Локальный подход при эволюционном конструировании 182
4.3.1. Аргументы в сравнении со знаниями A84).
4.4. Локальное формирование простых фреймов 186
4.4.1. Суть проведенных экспериментов A86). 4.4.2. Экспери-
Эксперименты с программой формирования фреймов A87). 4.4.3. Оцен-
Оценка целесообразности обобщения ситуаций A95).
4.5. Формальная теория представления знаний и локального обучения 197
4.5.1. Основные определения A98). 4.5.2. Примеры конкретиза-
конкретизации теории в приложениях B01). 4.5.3. Сети образцов B02).
4.5.4. Сети продукций (р-сети) B07).
4.6. Некоторые аспекты теории локально-организованных человеко-
машинных (экспертных) систем 209
4.6.1. Экспертные системы метауровня B09). 4.6.2. Использова-
Использование нечеткой логики B11). 4.6.3. Получение закона объединения
328 Оглавление [Гл. 5
свидетельств — аксиоматический подход B13). 4.6.4. Взаимо-
Взаимозависимость свидетельств B14). 4.6.5. Принцип максимального
доверия свидетельствам B16).
4.7. Выводы по главе 4 218
Глава 5. Использование локальной организации при разра-
разработке прикладных программных и человеко-машинных си-
систем 220
5.1. Локальный подход в программировании 222
5.1.1. Проблема взаимодействия подпрограмм в локально-орга-
локально-организованной программе B24). 5.1.2. Рекурсивное взаимодействие
при вычислении арифметических функций B30). 5.1.3. Нагляд-
Наглядное программирование вычислений B34). 5.1.4. Интерактивная
система программирования ЭКЛИСП B36). 5.1.5. Комментиру-
Комментирующая система для языка Лисп B36).
5.2. Интеллектуальная операционная система на локальных принци-
принципах 239
5.3. Локальная организация гибкого обслуживания в системе Лисп. . 242
5.3.1. Принципы организации системы B42). 5.3.2. Формаль-
Формальное описание системы B43). 5.3.3. Представление знаний в си-
системе FLEX B46). 5.3.4. Описание составных частей системы
FLEX B48). 5.3.5. FLEX как экспертная система B51).
5.4. Локально обучающаяся система поддержки ввода информации . 253
5.4.1. Диалоговая система как автомат B54). 5.4.2. Описание
системы PROMPTER в виде формальной модели B55).
5.4.3. Теоретико-категорное описание системы B57). 5.4.4. Вы-
Выбор параметров в системе PROMPTER B60). 5.4.5. Применение
системы PROMPTER при работе с портовой документаци-
документацией B62). 5.4.6. Детали реализации B65).
5.5. Использование знаний экспертов при выявлении последователь-
последовательности оснований ДНК 267
5.5.1. Постановка задачи B68). 5.5.2. Близкие работы B70).
5.5.3. Различные взгляды на определение последовательности
оснований B70). 5.5.4. Локальный топологический подход B73).
5.5.5. Заключение B74).
5.6. Профилактика заражения компьютерным вирусом и получения
спама через электронную почту 275
5.6.1. Активный фильтр для вирусов и спама B76). 5.6.2. Актив-
Активный фильтр антиспам B78).
5.7. Выводы по главе 5 281
П.1. Некоторые характеристики памяти со случайной выборкой
в сравнении со «стопкой книг» 284
П.2. Двухуровневая система управления манипулятором 287
П.З. Примеры построения категорий для традиционных операций со
знаниями в искусственном интеллекте 292
П.4. Учет побочных эффектов и организация программы снятия
рекурсии 298
Список литературы 307