/
Автор: Дасгупта Д.
Теги: вычислительная математика численный анализ математика информатика алгоритмы анализ данных математическое моделирование
ISBN: 5-9221-0706-2
Год: 2006
Текст
УДК 519.6
ББК 22.18
И 86
Искусственные иммунные системы и их применение / Под ред. Д. Дас-
гупты. Пер. с англ. под ред А.А. Романюхи. — М.: ФИЗМАТЛИТ, 2006. —
344 с. - ISBN 5-9221-0706-2.
Книга посвящена новой области информатики и математического моделиро-
моделирования — искусственным иммунным системам. Принципы работы и механизмы
иммунной системы используются для построения алгоритмов анализа данных,
оптимизации и распознавания, систем компьютерной и интернет-безопасности,
оценки финансовых рисков и других приложений. Данное направление близ-
близко к идеям и методам искусственного интеллекта, но несколько отличается
исходными положениями и подходами.
Для специалистов, а также студентов старших курсов и аспирантов, инте-
интересующихся новыми подходами к анализу и обработке информации, к инфор-
информационной безопасности и проблемам искусственной жизни.
На обложке: фрагмент репродукции картины Пьеро ди Козимо A461-1521)
«Легенда о Прометее».
ISBN 5-9221-0706-2 © физматлит, 2006
ISBN 3-540-64390-7 (англ.) © Springer-Verlag, 1999
ОГЛАВЛЕНИЕ
Предисловие редактора перевода 9
Предисловие 11
Список авторов 16
Часть I. Введение
Глава 1. Обзор искусственных иммунных систем и их при-
приложений. Дипанкар Дасгупта 19
1.1. Введение 19
1.2. Вычислительные аспекты иммунной системы 22
1.3. Нервная и иммунная системы 24
1.4. Модели, основанные на принципах функционирования им-
иммунной системы 25
1.5. Некоторые приложения искусственных иммунных систем 31
1.6. Выводы 37
Список литературы 38
Глава 2. Двойная пластичность иммунной сети как источ-
источник инженерных решений. Уго Берсини 42
2.1. Введение 42
2.2. Простейшая иммунная сеть и основные принципы систем
с двойной пластичностью 50
2.3. Двойная пластичность нейросетевых классификаторов ... 52
2.4. Двойная пластичность обучения автономных агентов ме-
методом подкрепления 57
2.5. Двойная пластичность для управления хаосом 61
2.6. Выводы 64
Список литературы 65
Часть П. Искусственные иммунные системы:
моделирование и эксперимент
Глава 3. Центральная и периферическая иммунные систе-
системы. Джон Стюарт, Йорг Карнейро 69
3.1. Введение 69
3.2. Сетевые модели второго поколения 71
3.3. Иммунная сеть с учетом взаимодействий В- и Т-клеток . . 78
3.4. Заключительные замечания 83
Список литературы 85
Оглавление
Глава 4. Иммунология как наука об автономной децентра-
децентрализованной системе. Л. А. Сигел, Р. Л. Бар-Op 89
4.1. Введение 89
4.2. Нанокурс иммунологии 90
4.3. Общая характеристика иммунной системы 92
4.4. Роль обратных связей 92
4.5. Оптимизация функции эффекторов 94
4.6. Оптимизация выбора эффекторов 99
4.7. Влияние пространственной структуры 105
4.8. Каналы связи 106
4.9. Другие подходы к изучению децентрализованных систем 107
4.10. Заключение 110
Список литературы 114
Приложение 115
Глава 5. Иммунная сеть как пример сложной адаптивной
системы. Дебашиш Чоудхури 117
5.1. Введение 117
5.2. Краткий обзор экспериментальных данных 118
5.3. Математическое моделирование клональной селекции . . . 120
5.4.3а границами клональной селекции: иммунная сеть 127
5.5. Краткое содержание и выводы 131
Список литературы 132
Глава 6. Иммунная память ассоциативна. Дерек Дж. Смит,
Стефани Форрест, Алан С. Перелъсон 135
6.1. Введение 135
6.2. Иммунная память 136
6.3. Рассредоточенная память 139
6.4. Соответствие между иммунной и рассредоточенной памя-
памятью 141
6.5. Особенности явления ассоциативной активации в иммун-
иммунной системе 143
6.6. Заключение 144
Список литературы 144
Глава 7. Оценка и прогноз количества свободных вирусов
иммунодефицита человека и Т-лимфоцитов с использо-
использованием нелинейного фильтра Калмана. Вай-Юанъ Тан,
Шихуа Сянг 148
7.1. Введение 148
7.2. Стохастическая модель патогенеза ВИЧ-инфекции 149
7.3. Модель пространства состояний патогенеза ВИЧ-инфек-
ВИЧ-инфекции 157
7.4. Пример применения моделей 164
Оглавление
7.5. Результаты применения метода Монте-Карло 167
7.6. Обсуждение и выводы 170
Список литературы 171
Приложение. Доказательство теорем 7.1 и 7.2 173
Глава 8. Моделирование влияния предшествующей инфек-
инфекции на эффективность вакцинации. Дерек Смит, Стефа-
Стефани Форрест, Дэвид Экли, Алан Перелъсон 177
8.1. Введение 177
8.2. Материалы и методы 179
8.3. Результаты и обсуждение 181
Список литературы 186
Глава 9. Jisys: разработка искусственной иммунной систе-
системы для практических приложений. Джон Хант, Джон
Тиммис, Дэнис Кук, Марк Нил, Клайв Кинг 188
9.1. Введение 188
9.2. Исследования по проекту Isys 189
9.3. Система Jisys 194
9.4. Структура системы Jisys 206
9.5. Приложение: мошенничество с закладными 207
9.6. Возможности системы Jisys 209
9.7. Сравнение с аналогичными работами 210
9.8. Направления развития системы 211
9.9. Заключение 214
Список литературы 214
Глава 10. Алгоритм децентрализованного выбора поведе-
поведения для автономных мобильных роботов с использова-
использованием иммунной сети. Юджи Ватанабе, Акио Ишигуро,
Иошики Учикава 217
10.1. Введение 217
10.2. Естественная иммунная система 219
10.3. Иммунный алгоритм выбора поведения 222
10.4. Механизмы адаптации 231
10.5. Выводы и перспективы 237
Список литературы 237
Глава 11. Иммунный алгоритм параллельного поиска для
оптимизации мультимодальных функций. Тойо Фу куда,
Казуюки Мори, Макото Цукияма 240
11.1. Введение 240
11.2. Иммунный алгоритм оптимизации 242
11.3. Результаты численных экспериментов 246
11.4. Выводы 248
Список литературы 249
Оглавление
Глава 12. Иммунный адаптивный критик в задаче автоном-
автономного управления летательными аппаратами. Калманджи
Кришнакумар, Джеймс Нейдхофер 250
12.1. Введение 250
12.2. Уровни интеллектуального управления 251
12.3. Проблема автономного управления летательными аппара-
аппаратами 254
12.4. Иммунные вычислительные системы 257
12.5. Иммунный адаптивный критик 261
12.6. Вывод 270
Список литературы 270
Глава 13. Проект создания компьютерной иммунной систе-
системы. Джеффри О. Кефарт, Грегори Б. Соркин, Мортон
Свиммер, Стив Р. Уайт 272
13.1. Введение 272
13.2. Требования, предъявляемые к компьютерной иммунной
системе 274
13.3. Реализация иммунной системы для киберпространства. . . 277
13.4. Замечания и выводы 290
Список литературы 295
Глава 14. Иммунный алгоритм обнаружения аномалий.
Дипанкар Дасгупта, Стефани Форрест 297
14.1. Введение 297
14.2. Алгоритм отрицательного отбора 298
14.3. Обнаружение аномалий 300
14.4. Эксперименты 303
14.5. Заключение 310
Список литературы 312
Глава 15. Модели управления поточной линией для про-
производства полупроводников, построенные на принципах
иммунной системы. Тойо Фукуда, Казуюки Мори, Макото
Цукияма 314
15.1. Введение 314
15.2. Проблема производства полупроводников 315
15.3. Искусственные иммунные системы и мультиагентные сети 318
15.4. Выводы 322
Список литературы 322
Общий список литературы 324
Авторский указатель 335
Предметный указатель 337
Предисловие редактора перевода
Данный сборник статей представляет читателям новую область
исследований — искусственные иммунные системы и их приложения.
Иммунная система рассматривается авторами как источник идей и
методов решения различных задач в области обработки и анали-
анализа информации, математического моделирования и информационной
безопасности. В настоящее время количество работ по развитию и
применению искусственных иммунных систем быстро увеличивается.
Ежегодно, начиная с 2002 года, проводится международная научная
конференция, посвященная данной области исследований (International
Conference on Artificial Immune Systems, ICARIS).
Иммунная система способна распознавать огромное количество
молекулярных структур — антигенов, в том числе и не существую-
существующих в природе, например синтезированные в лаборатории вещества.
Результатом распознавания является обучение и формирование иммун-
иммунной памяти к данному антигену. В зависимости от частоты и силы
антигенных сигналов иммунная система непрерывно изменяется, теряя
или усиливая иммунную память к разным антигенам, что обеспечивает
эффективную защиту с использованием ограниченных ресурсов.
Знание о схожих антигенах используется при реакциях на новые
инфекции. Таким образом, иммунная система, как и нервная систе-
система, способна создавать, совершенствовать и использовать знания об
окружающем мире. Важным отличием иммунной системы от нервной
системы является отсутствие центральной структуры управления. Им-
Иммунная система представляет собой набор временных коллективов кле-
клеток (в лимфатических узлах), непрерывно перестраивающихся и обме-
обменивающихся клетками и сигналами. Следовательно, иммунная система
является децентрализованной и распределенной системой обработки
и анализа информации. Именно эта характеристика иммунитета, как
и способность отличать клетки своего организма от любых чужих,
рассматривается в большинстве статей сборника.
За рамками рассмотрения остался ряд важных компонентов и
свойств иммунной системы, обеспечивающих эффективную защиту
против разнообразных и нередко очень изощренных вирусов и мик-
микробов. Это разделение защитной реакции на специфическую и неспе-
неспецифическую. Например, при появлении ранних признаков инфекции
клетки атакованного органа немедленно переходят в «защищенный»
режим работы. Они выполняют только базовую часть своих функций,
но не могут быть заражены. Это состояние поддерживается, пока
повторяются атаки, а иммунная система занята распознаванием вируса
и выработкой специфических средств его элиминации.
10 Предисловие редактора перевода
Важной особенностью организма является принципиально разный
уровень защищенности различных тканей и клеток. Например, инфек-
инфекции слизистых оболочек организма практически неизбежны так как
они открыты внешней среде. Инфекции внутренних органов происхо-
происходят гораздо реже, как правило при повреждении иммунитета.
Другим приемом повышения устойчивости к инфекциям является
разделение функциональных клеток и стволовых клеток. Функцио-
Функциональные клетки относительно слабо защищены, периодически обнов-
обновляются и в случае инфекции элиминируются. Популяции этих клеток
формируются более защищенными стволовыми клетками, доступ к ко-
которым тщательно контролируется иммунной системой. В результате,
даже успешная инфекция может привести лишь к временному сниже-
снижению эффективности работы организма.
При рассмотрении задачи защиты компьютерных сетей от вирусных
атак могут оказаться полезными результаты математической эпиде-
эпидемиологии, которые позволяют оценить уровень защиты, необходимый
для подавления или искоренения инфекции в зависимости от свойств
вируса и популяции хозяев.
Хотелось бы отметить вклад в появление перевода этой книги
А.С.Попова и В.Ю.Статьева, которые помогли в организации и реа-
реализации этого проекта. Отдельная благодарность Российскому фонду
фундаментальных исследований, поддержавшему издание книги.
Книга предназначена для специалистов, интересующихся новыми
подходами к анализу и обработке информации, информационной без-
безопасности и проблемам искусственной жизни. Она может быть ис-
использована как основа спецкурса для студентов и аспирантов. Ниже
приводится список работ на русском языке, которые помогут заинтере-
заинтересованным читателям глубже разобраться в обсуждаемых вопросах.
Апрель 2006 г. А.А. Романюха
д.ф.-м.н., профессор
Дополнительный список литературы
1. Андерсон Р., Мэй Р. Инфекционные болезни человека. Динамика
и контроль. — М.: Мир, Научный мир, 2004. 784 с.
2. Люгер Дж. Искусственный интеллект. — М.: Издательский дом
«Вильяме», 2003. 864 с.
3. Марчук Г.И. Математические модели в иммунологии. Вычисли-
Вычислительные методы и эксперименты. — М.: Наука, 1991. 304с.
4. Петров Р.В. Иммунология. — М.: Медицина, 1987. 416с.
5. Пол У. Иммунология (в 3-х тт.).-М.: Мир, 1987-1989.
6. Роит А., Бростофф Дж., Мейл Д. Иммунология. — М.: Мир,
2000. 592 с.
7. Ярилин А.А. Основы иммунологии. — М.: Медицина, 1999. 720 с.
Предисловие
Иммунная система организма представляет собой сложную адап-
адаптивную структуру, эффективно использующую различные механизмы
защиты от внешних патогенов. Основная задача иммунной системы
заключается в распознавании клеток (или молекул) организма и клас-
классификации их как своих или чужих. Выявляемые чужеродные клетки
служат сигналом для активации защитного механизма соответствую-
соответствующего типа.
С точки зрения организации обработки данных иммунная систе-
система — это высокопараллельная структура. В ней реализованы меха-
механизмы обучения, памяти и ассоциативного поиска для решения за-
задач распознавания и классификации. В частности, иммунная система
способна обучаться распознаванию важных структур (антигенных пеп-
пептидов); запоминанию уже встречавшихся структур и использованию
законов комбинаторики в рамках генных библиотек для эффективной
генерации детекторов структур (вариабельных участков молекул ан-
антител), взаимодействующих с внешними антигенами и собственными
клетками организма. При этом реакция на антиген происходит не
только на уровне отдельных распознающих единиц, но и на системном
уровне путем взаимного распознавания клонов лимфоцитов в реакциях
антиген-антитело. Таким образом, поведение иммунной системы опре-
определяется всей совокупностью локальных сетевых взаимодействий.
Система иммунитета вызывает большой интерес вследствие ее
важной роли в поддержании целостности организма. Свойства им-
иммунной системы служат замечательным примером локальных адаптив-
адаптивных процессов, реализующих эффективные глобальные реакции. Для
объяснения механизмов иммунитета существует несколько различных
теорий (которые иногда противоречат друг другу). Опубликован ряд
имитационных моделей, описывающих реакции различных компонен-
компонентов иммунной защиты. Происходит расширение сферы применения
новых методов решения прикладных задач, основанных на принципах
иммунологии. Эти методы имеют различные названия: искусственные
иммунные системы, системы, основанные на принципах иммунитета,
иммунологические вычисления, и т. д. Сфера их применения включает
следующие области (но не ограничивается ими):
• методы вычислений,
• когнитивные модели,
• искусственные иммунные системы для распознавания образов,
12 Предисловие
• методы обнаружения аномалий и неисправностей,
• мультиагентные системы,
• модели самоорганизации,
• модели коллективного интеллекта,
• системы поиска и оптимизации,
• модели автономных распределенных систем,
• модели искусственной жизни,
• системы компьютерной и интернет-безопасности,
• модели обучающихся систем,
• методы извлечения информации,
• искусственные иммунные системы для выявления подделок,
• методы обработки сигналов и изображений.
По мере развития рассматриваемой области возникла идея орга-
организации научных конференций и семинаров для обмена информацией
и представления результатов текущих исследований. Первый меж-
международный семинар «Методы, основанные на принципах иммунной
системы» состоялся 10 декабря 1996 г. в Японии. Впоследствии была
организована отдельная секция «Искусственные иммунные системы и
их применение» на международной конференции Института инжене-
инженеров по электротехнике и электронике (IEEE) «Системы, человек и
кибернетика» (SMC97), проходившей с 12 по 15 октября 1997 г. в
Орландо (США). Аналогичное мероприятие планируется организовать
на SMC98 в Сан-Диего (Калифорния). Представляется актуальным
собрать наиболее важные работы в одном сборнике, чтобы снабдить
специалистов подробным и систематическим описанием этой быстро
развивающейся области. Мы полагаем, что искусственные иммунные
системы вскоре привлекут такое же внимание, как аналогичные биоло-
биологически-мотивированные подходы — генетические алгоритмы, нейрон-
нейронные сети и клеточные автоматы.
Настоящая книга — первое издание, в котором основное внимание
уделяется методам иммунологических вычислений и их применениям
в задачах компьютерной безопасности, информационной проходки,
машинного обучения, обнаружения неисправностей и других. Несмотря
на то что основное внимание уделено вычислительным аспектам
иммунной системы, в книге рассматриваются также биологические
модели, поскольку они важны для понимания механизмов иммунитета
и разработки вычислительных алгоритмов. Книга будет полезной
научным работникам и инженерам, интересующимся теорией и
приложениями математических моделей и методов, основанных на
иммунологических принципах.
Книга состоит из трех частей: введения, описания моделей искус-
искусственных иммунных систем и приложений. В ней проводится анализ
Предисловие 13
механизмов иммунитета с точки зрения обработки информации и ре-
решения сложных задач.
Первая глава вводной части книги освещает основные принципы
функционирования иммунной системы и их вычислительные аспекты.
В ней также дается обзор соответствующих вычислительных моделей
и их приложений к решению различных задач распознавания образов,
диагностики и обнаружения неисправностей, компьютерной безопасно-
безопасности и других.
Вторая глава (автор У. Берсини) посвящена описанию свойства
двойной пластичности иммунной сети, позволяющего иммунной систе-
системе устойчиво функционировать в условиях постоянных возмущений,
вызываемых изменениями организма в онтогенезе и ответом на взаи-
взаимодействие с внешней средой. В качестве примера автор описывает три
области приложений, в которых имеется два уровня адаптируемости,
напоминающих двойную пластичность иммунных сетей, что позволяет
быстро находить удовлетворительное решение.
В гл.З показано, что иммунную систему можно представить со-
состоящей из двух блоков: центральной иммунной системы (ЦИС) и
периферической иммунной системы (ПИС). ПИС представлена клона-
клонами лимфоцитов, обычно взаимодействующих с внешними антигенами,
а ЦИС реагирует на собственные антигены организма. Рассматрива-
Рассматриваются иммунные сети второго поколения. С целью установления более
полного соответствия между основными положениями теоретической
иммунологии и экспериментальными данными предложена модель им-
иммунной сети третьего поколения.
Л.Сигел и Р. Бар-Op рассматривают иммунную систему с точки
зрения автономных распределенных систем (гл.4). Они предложили
три различные модели системы иммунитета и провели их сопоставле-
сопоставление с другими автономными распределенными системами.
В гл.5 (автор Д.Чоудхури) представлена математическая модель
динамики популяций иммунокомпетентных клеток. Описание взаимо-
взаимодействий внутри и между клонами дается как в дискретной, так и
непрерывной формулировке.
Д. Смит и др. (гл. 6) показывают, что иммунная память относится к
тому же классу ассоциативной памяти, что и рассредоточенная память
Канервы (РП). Авторы этой главы установили соответствие между В-
и Т-клетками иммунной системы и аппаратными ячейками РП. Так,
например, показано, что В- и Т-клетки осуществляют накрытие всех
возможных антигенов способом, аналогичным неплотному накрытию
аппаратными ячейками всех возможных адресов в РП.
Следующие две главы во второй части книги дают более подробное
представление о биологии иммунной системы человека. В гл. 7 (авторы
В.-Ю.Тан и Ш.Сянг) построена модель оценки и прогноза концен-
концентрации свободных вирусов иммунодефицита человека и Т-лимфоцитов
у ВИЧ-инфицированных с использованием фильтра Калмана. Про-
Процессы патогенеза ВИЧ-инфекции описаны на основе стохастических
14 Предисловие
дифференциальных уравнений. Модели уточнены путем сопоставления
оценок концентрации копий вирусной РНК, полученных с использо-
использованием фильтра Калмана, и динамики соответствующих показателей
у ВИЧ-инфицированных. По утверждению авторов, эти модели могут
оказаться полезными для мониторинга динамики ВИЧ-инфекции на
клеточном уровне, а также для оценки эффективности противовирус-
противовирусного лечения.
Глава8 (авторы Д.Смит и др.) содержит описание и результаты
компьютерного моделирования иммунной системы позвоночных для
изучения влияния предшествующей инфекции на эффективность вак-
вакцинации. Авторы показали, что наличие перекрестно-реагирующей
памяти в условиях воздействия трех антигенов может приводить к
неэффективности вакцинации, и изучили возможные механизмы этого
явления. Авторы полагают, что их результаты могут быть использованы
для изучения вакцинации против непрерывно мутирующих вирусов,
таких как вирус гриппа.
Статья Дж.Ханта и др. из третьей части книги (гл.9) посвящена
описанию системы машинного обучения, основанной на модельных
представлениях об иммунной системе. Авторы иллюстрируют текущую
версию искусственной иммунной системы, известной под названием
Jisys. Система Jisys способна к изучению структуры данных на основе
совместного использования знаний о предметной области, а также ме-
механизмов распознавания и обучения. В главе представлены приложения
системы Jisys для решения задачи о выявлении мошенничества при
получении кредита. Авторы показывают, что система Jisys обладает
рядом уникальных особенностей, что может оказаться полезным для
большого числа практических приложений.
Ю.Ватанабе и др., используя принципы иммунной системы (гл. 10),
построили алгоритм децентрализованного выбора режима работы в
конфликтной ситуации и в ряде экспериментов показали его надеж-
надежность. В частности, они применили свой алгоритм для решения задачи
сбора мусора автономным мобильным роботом.
В гл.11, посвященной методам параллельного поиска для опти-
оптимизации мультимодальных функций, предложен иммунный алгоритм,
сочетающий свойства разнообразия и обучаемости. Показано, что он
эффективен для поиска как локальных, так и глобальных решений.
К. Кришнакумар и Дж. Нейдхофер (гл. 12) приводят описание раз-
разработанных ими иммунных вычислительных методов, сочетающих воз-
возможность использования априорных данных со способностью иммун-
иммунной системы к адаптации. Эти методы представляют собой интересную
альтернативу существующим методам интеллектуального контроля.
Авторы применили алгоритм адаптивного иммунного надзора для
генерации траектории полетов летательных аппаратов в нелинейной
задаче интеллектуального управления второго уровня.
В гл. 13 Дж. Кефарт и др. приводят описание компьютерной иммун-
иммунной системы, способной обнаруживать присутствие не известного ранее
Предисловие 15
вируса и затем в течение нескольких минут автоматически вырабаты-
вырабатывать и запускать предписание для его обнаружения и удаления. По
утверждению авторов, в настоящее время эта система интегрируется в
коммерческий антивирусный программный продукт — IBM-антивирус.
Д. Дасгупта и С. Форрест предложили иммунный алгоритм обна-
обнаружения аномалий (гл. 14). В соответствии с этим алгоритмом, про-
происходит накопление статистических данных о нормальном функциони-
функционировании системы (или процесса) и на случайной основе генерируется
набор детекторов, обнаруживающих любые отклонения от нормального
поведения системы. Авторы провели эксперименты по анализу времен-
временных рядов и приводят результаты, иллюстрирующие эффективность
алгоритма.
В заключительной главе (авторы Т. Фукуда и др.) описана структу-
структура автономной распределенной системы. Она представляет собой муль-
тиагентную систему, которая применялась для управления поточной
линией на фабрике по производству полупроводников.
Редактирование книги по междисциплинарной тематике является
сложной и трудоемкой задачей, которая бы не могла быть успешно
решена без поддержки и конструктивной критики со стороны авторов.
Мне бы хотелось поблагодарить их за потраченные усилия, а также
за чтение остальных глав книги и высказанные замечания. Момент
завершения редактирования книги совпал для меня с большой личной
трагедией: в феврале 1998 г. умер от рака мой отец.
Приношу свою искреннюю благодарность исполнительному редак-
редактору издательства Springer-Verlag Хансу Восснеру за постоянную по-
помощь на протяжении всего проекта. Книга была подготовлена с ис-
использованием издательской системы Ш^Х. Выражаю признательность
Франку Хольцварту, Жаклин Ленц и Габи Фишер за помощь в оформ-
оформлении окончательного варианта рукописи. Также благодарю мою жену
Гиту за моральную поддержку и помощь в наборе текста.
Август 1998 г. Дипанкар Дасгупта
Мемфис, США
Список авторов
Рут Лев Бар-Ор
(Ruth Lev Bar-Or)
Department of Mathematics
and Computer Science
Weizmann Institute
Rehovot, Israel
Уго Берсини
(Hugues Bersini)
IRIDIA, CP 194/6
Universite Libre de Bruxelles
50, av. Franklin Roosevelt
1050 Bruxelles, Belgium
bersini@ulb.ac.be
Юджи Ватанабе
(Yuji Watanabe)
Department of Information
Electronics
Graduate School of Engineering
Nagoya University, Furo-cho
Chikusa-ku Nagoya 464-8603,
Japan
yuji@bioele.nuee.nagoya-u.ac.jp
Дипанкар Дасгупта
(Dipankar Dasgupta)
Department of Mathematical
Sciences
The University of Memphis
Memphis, TN 38152-6429, USA
dasgupta@msci.memphis.edu
Акио Ишигуро
(Akio Ishiguro)
Department of Computational
Science and Engineering
Graduate School of Engineering
Nagoya University
Furo-cho, Chikusa-ku
Nagoya 464-01, Japan
ishiguro@bioele.nuee.nagoya-u.ac.jp
Йорг Карнейро
(Jorge Carneiro)
Theoretical Biology &
Bioinformatics
Padualaan 8 3584 CH Utrecht
The Netherlands
jorge@binf.biol.ruu.nl
Джеффри Кефарт
(Jeffrey О. Kephart)
IBM Thomas J. Watson
Research Center
30 Saw Mill River Rd.
Hawthorne, NY 10532, USA
kephart@watson.ibm.com
Клайв Кинг
(Clive King)
Department of Computer Science
University of Wales, Aberystwyth
Penglais, Aberystwyth
Ceredigion, SY23 3DB, UK
cmk@aber.ac.uk
Калманджи Кришнакумар
(Kalmanje KrishnaKumar)
Department of Aerospace
Engineering and Mechanics
The University of Alabama
Tuscaloosa, AL 35487-0280, USA
kkumar@coe.eng.ua.edu
Список авторов
П
Дэнис Кук
(Denise Cooke)
Department of Computer Science
University of Wales, Aberystwyth
Penglais, Aberystwyth
Ceredigion, SY23 3DB, UK
dzc@aber.ac.uk
Казуюки Мори
(Kazuyuki Mori)
Industrial Electronics and
Systems Laboratory
Mitsubishi Electric Corporation
Amagasaki, Hyogo 661, Japan
mori@soc.sdl.melco.co.jp
Джеймс Нейдхофер
(James Neidhoefer)
Department of Aerospace
Engineering and Mechanics
The University of Alabama
Tuscaloosa, AL 35487-0280, USA
james@coe.eng.ua.edu
Марк Нил
(Mark Neal)
Department of Computer Science
University of Wales, Aberystwyth
Penglais, Aberystwyth
Ceredigion, SY23 3DB, UK
mjnl@aber.ac.uk
Алан Перельсон
(Alan S. Perelson)
Theoretical Division
Los Alamos National Laboratory
Los Alamos, NM 87545, USA
asp@tlO.lanl.gov
Мортон Свиммер
(Morton Swimmer)
IBM Thomas J. Watson
Research Center
P.O. Box 704, Yorktown Heights
NY 10598, USA
swimmer@watson.ibm.com
Ли Сигел (Lee A. Segel)
Department of Mathematics
and Computer Science
Weizmann Institute, Rehovot,
Israel
lee@wisdom.weizmann.ac.il
Дерек Смит (Derek Smith)
Department of Computer Science
University of New Mexico
Albuquerque, NM 87131, USA
dsmith@cs.unm.edu
Грегори Соркин
(Gregory В. Sorkin)
IBM Thomas J. Watson
Research Center
P.O. Box 704, Yorktown Heights
NY 10598, USA
sorkin@watson.ibm.com
Джон Стюарт (John Stewart)
COSTECH, Departement
Technologie
et Sciences de l'Homme
Universite de Technologie
de Compiegne BP 60649, F-60206
F-60206 Compiegne cedex, France
John.Stewart@utc.fr
Шихуа Сянг (Zhihua Xiang)
Department of Mathematical
Sciences
The University of Memphis
Memphis, TN 38152-6429, USA
xiang@mathsci.msci.memphis.edu
Вай-Юань Тан
(Wai-Yuan Tan)
Department of Mathematical
Sciences
The University of Memphis
Memphis, TN 38152-6429, USA
TANWY@mathsci.msci.memphis.
edu
18
Список авторов
Джонатан Тиммис
(Jonathan Timmis)
Department of Computer Science
University of Wales, Aberystwyth
Penglais, Aberystwyth
Ceredigion, SY23 3DB, UK
jot@aber.ac.uk
Макото Цукияма
(Makoto Tsukiyama)
Industrial Electronics
& Systems Laboratory
Mitsubishi Electric Corporation
Amagasaki, Hyogo 661, Japan
tsukiyama@soc.sdl.melco.co.jp
Стив Уайт
(Steve R. White)
IBM Thomas J. Watson
Research Center
30 Saw Mill River Rd.
Hawthorne, NY 10532, USA
srwhite@watson.ibm.com
Иошики Учикава
(Yoshiki Uchikawa)
Department of Computational
Science and Engineering
Graduate School of Engineering
Nagoya University, Furo-cho
Chikusa-ku Nagoya 464-8603,
Japan
uchikawa@bioele.nuee.nagoya-
u.ac.jp
Стефани Форрест
(Stephanie Forrest)
Department of Computer Science
The University of New Mexico
Albuquerque, NM 87131, USA
forrest@cs.unm.edu
Тойо Фукуда
(Toyoo Fukuda)
School of Policy Studies
Kwansei Gakuin University
2-1 Gakuen Sanda
Hyogo 669-13, Japan
fukudat@mars.dti.ne.jp
Джон Хант (John Hunt)
Department of Computer Science
University of Wales, Aberystwyth
Penglais, Aberystwyth
Dyfed, SY23 3DB, UK
jjh@aber.ac.uk
Дебашиш Чоудхури
(Debashish Chowdhury)
Department of Physics
Indian Institute of Technology
Kanpur 208016, India
debch@iitk.ernet.in
Дэвид Экли (David H. Ackley)
Department of Computer Science
The University of New Mexico
Albuquerque, NM 87131, USA
ackley@cs.unm.edu
Часть I
ВВЕДЕНИЕ
Глава 1
ОБЗОР ИСКУССТВЕННЫХ
ИММУННЫХ СИСТЕМ И ИХ ПРИЛОЖЕНИЙ
Дипанкар Дасгупта
Обработка иммунной системой внешних сигналов осуществляется при
помощи высокопараллельного процесса. Иммунная система служит превосход-
превосходным примером системы, реализующей адаптивные процессы глобального уров-
уровня на основе локальных взаимодействий. Для решения задач распознавания
и классификации иммунная система использует механизмы обучения, памяти
и ассоциативного поиска. В настоящей главе приводится описание различных
механизмов иммунитета, их отношения к обработке информации и дается
общее представление о быстро растущем направлении исследований под общим
названием искусственные иммунные системы. Соответствующие методы с
успехом применяются для решения задач распознавания образов, диагностики
и обнаружения неисправностей, а также для создания систем компьютерной
безопасности и в некоторых других приложениях.
1.1. Введение
Естественная иммунная система представляет собой слож-
сложную систему, состоящую из нескольких функционально различ-
различных компонентов. Иммунная система использует многоуровневую
защиту против внешних антигенов, включая действие неспе-
неспецифических (врожденных) и специфических (приобретенных)
защитных механизмов. Основная роль иммунной системы за-
заключается в распознавании всех клеток (или молекул) организма
и классификации их как «своих» или «чужих». Чужеродные
клетки подвергаются дальнейшей классификации с целью стиму-
стимуляции защитного механизма соответствующего типа. В процессе
эволюции иммунная система обучается различать внешние ан-
20 Гл. 1. Обзор искусственных иммунных систем и их приложений
тигены (например бактерии и вирусы) и собственные клетки или
молекулы организма.
Установлено, что в организме человека поддерживается боль-
большое количество иммунокомпетентных клеток, которые циркули-
циркулируют по всему телу. Основным типом клеток, участвующих в
иммунном ответе и обладающих свойствами специфичности, раз-
разнообразия, памяти и адаптивности, являются лимфоциты. Дру-
Другие клетки, имеющие название фагоцитов, — нейтрофилы, эози-
нофилы, базофилы и моноциты — это вспомогательные клетки,
основная функция которых заключается в обеспечении способ-
способности иммунной системы к уничтожению антигенов. В организме
имеется два основных типа лимфоцитов — Т- и В-лимфоциты.
Местом созревания и дифференцировки лимфоцитов служат
первичные лимфоидные органы. Так, например, Т-лимфоциты
образуются в костном мозге и затем попадают в тимус, где
происходит их дальнейшее развитие, а В-лимфоциты образуются
и достигают функциональной зрелости в костном мозге. Основ-
Основной функцией вторичных лимфоидных органов является захват
антигенов и обеспечение взаимодействия с ними лимфоцитов для
стимуляции иммунного ответа [34]. Указанные два типа лим-
лимфоцитов играют в иммунном ответе разную роль, хотя и могут
взаимодействовать, контролируя таким образом свои функции.
Например, Т-клетки могут усиливать или подавлять реакцию
В-клеток на действие стимула.
При попадании антигена в организм лишь малая часть кле-
клеток иммунной системы способна к распознаванию его пепти-
пептидов 0. Такое распознавание стимулирует процессы размножения
и дифференцировки лимфоцитов, приводящие к образованию
клонов идентичных клеток (или антител) 2). Этот процесс, на-
называемый размножением клона, формирует многочисленную по-
популяцию специфичных к антигену антителопродуцирующих кле-
клеток. Размножение клона иммунокомпетентных клеток приводит
к разрушению или нейтрализации антигена. Часть образовав-
образовавшихся клеток сохраняется для иммунной памяти. В результате,
последующее воздействие похожего антигена приводит к более
быстрой иммунной реакции (вторичному ответу).
х) Макрофаги и другие антиген-презентирующие клетки выставляют ча-
частицы антигена (называемые пептидами) на своей поверхности, привлекая
внимание В- и Т-клеток для распознавания.
2) Увеличение аффинности происходит, если в результате образования свя-
связей между антителами клона и антигеном скорость мутации клеток увеличива-
увеличивается. Мутантные клетки, образующие более прочные связи, делятся быстрее.
/./. Введение 21
Процесс циркуляции В- и Т-лимфоцитов в первичных и
вторичных лимфоидных органах тщательно контролируется, что
обеспечивает попадание соответствующих клеточных популя-
популяций — наивных («необученных») и эффекторных клеток, а так-
также клеток памяти — в разные места назначения. Избирательная
миграция лимфоцитов в различные органы и ткани имеет назва-
название хоуминга (самонаведения). В этих органах имеется специ-
специализированная среда для поддержания процессов размножения
активированных антигеном лимфоцитов и их дифференцировки
в эффекторные клетки и клетки памяти. Интересно, что клетки
памяти оказывают избирательное предпочтение тому типу тка-
тканей, в котором они впервые встретились с антигеном. Вероятно,
это обеспечивает возврат каждой конкретной клетки памяти
в тот участок тела, где она, скорее всего, снова встретится
с антигеном.
Существует два основных варианта иммунного ответа: гу-
гуморальный, опосредованный В-клетками и их продуктами, и
клеточный, в котором участвуют Т-клетки. Обоим вариантам
иммунных реакций соответствуют сходные последовательности
этапов защиты организма: активация, деление, дифференциров-
ка, секреция, иммунная атака, супрессия и память, однако они
осуществляются различными способами. В регуляции как гумо-
гуморального, так и клеточного иммунитета участвуют популяции
Т-клеток, называемые хелперными или супрессорными клетка-
клетками, которые усиливают либо, соответственно, подавляют иммун-
иммунный ответ.
Цель настоящей главы — дать общее представление об интен-
интенсивно развивающейся области научных исследований, имеющей
название искусственные иммунные системы, или иммуноло-
иммунологические вычисления. В ней также рассматриваются различные
механизмы иммунитета и их отношение к обработке информа-
информации и решению задач. По сравнению с другими моделями и
методами, созданными на основе биологических представлений,
такими как нейронные сети и эволюционные алгоритмы, искус-
искусственные иммунные системы до настоящего времени привлекали
очень мало внимания. В следующем разделе дана характеристи-
характеристика вычислительных аспектов естественной иммунной системы.
Третий раздел посвящен описанию сходств и различий нервной
и иммунной систем. В четвертом разделе обсуждаются некото-
некоторые математические модели иммунной защиты. Пятый раздел
дает представление об использовании этих моделей в различных
областях науки и техники. В заключительном разделе сформули-
сформулированы основные выводы и приводятся некоторые комментарии.
22 Гл. 1. Обзор искусственных иммунных систем и их приложений
1.2. Вычислительные аспекты иммунной системы
Иммунная система представляет большой интерес как систе-
система, способная эффективно обрабатывать значительные объемы
данных. В частности, она выполняет большой объем сложных
высокопараллельных распределенных вычислений [17]. Поведе-
Поведение иммунной системы в целом определяется всей совокуп-
совокупностью локальных взаимодействий.
По выражению Роуэ [40], иммунная система функционирует
как «второй мозг», поскольку способна хранить информацию об
интенсивности предыдущих контактов составляющих ее клеток
и отвечать на новые, ранее не встречавшиеся структуры (ан-
(антигены). Описание закономерностей развития иммунного отве-
ответа представляет собой интересную задачу теории динамических
систем [39]. В отношении возможных приложений для обра-
обработки информации перспективны следующие свойства иммунной
системы.
• Распознавание. Иммунная система способна распознавать
и классифицировать различные молекулярные структуры и изби-
избирательно на них реагировать. Распознавание происходит в ходе
межклеточных контактов, при этом сила образующихся связей
определяется формой молекул и величиной электростатического
заряда. Распознавание своего и чужого является одной из основ-
основных задач, которую решает иммунная система.
• Выделение особенностей. Антиген-презентирующие клет-
клетки (АПК) интерпретируют антигенное окружение и выделяют
особенности путем обработки антигенов и представления анти-
антигенных пептидов на своей поверхности. Каждая АПК служит в
качестве «фильтра», подавляющего молекулярный шум, и «уве-
«увеличительного стекла», фокусирующего внимание лимфоцитов-
рецепторов [5].
• Разнообразие. Иммунная система использует комбинатор-
комбинаторный механизм (генетически-обусловленный процесс) для обра-
образования множества различных рецепторов лимфоцитов, с тем
чтобы гарантировать, что хотя бы один лимфоцит из всей сово-
совокупности сможет провзаимодействовать с любым наперед задан-
заданным (известным или неизвестным) антигеном.
• Обучение. Иммунная система оценивает структуру конкрет-
конкретного антигена, используя его случайные контакты с составля-
составляющими эту систему клетками. Обучение состоит в изменении
концентрации лимфоцитов, которое происходит при первичном
ответе (в результате первого контакта с антигеном). Следова-
Следовательно, способность иммунной системы к обучению заложена,
1.2. Вычислительные аспекты иммунной системы 23
главным образом, в механизме пополнения клонов [2], приводя-
приводящем к образованию новых иммунокомпетентных клеток с учетом
текущего состояния системы (этот процесс имеет название раз-
размножения клона).
• Память. Небольшая часть лимфоцитов, находящихся в акти-
активированном состоянии, становится клетками памяти (ассоциатив-
(ассоциативная память). Считается, что время жизни клеток памяти являет-
является динамической величиной и определяется частотой стимуляции
антигенами. Используя кратковременные и долгосрочные меха-
механизмы иммунной памяти, иммунная система поддерживает иде-
идеальный баланс между экономией ресурсов и исполнением функ-
функции за счет сохранения минимально необходимой, но достаточной
памяти о предыдущих контактах с антигеном.
• Распределенный поиск. По своей сути иммунная система —
это распределенная система. Клетки иммунной системы, главным
образом лимфоциты, непрерывно рециркулируют через кровь,
лимфу, лимфоидные органы и остальные ткани. В случае встречи
с антигеном они осуществляют специфический иммунный ответ.
• Саморегуляция. Иммунная защита обладает свойством са-
саморегуляции. Центрального органа, контролирующего функции
иммунной системы, не существует. В зависимости от способа
проникновения в организм и других свойств антигена, регуляция
иммунного ответа может быть как локальной, так и системной.
• Пороговый механизм. Иммунный ответ и размножение им-
иммунокомпетентных клеток происходят лишь после преодоления
некоторого порога, зависящего от силы химических связей.
• Совместная стимуляция. Активация В-лимфоцитов жест-
жестко регулируется при помощи дополнительного стимулирующего
сигнала. Второй сигнал (от хелперных Т-лимфоцитов) помогает
обеспечивать толерантность и проводить различие между серьез-
серьезной угрозой и «ложным звонком» (т. е. опасными и неопасными
антигенами).
• Динамическая защита. Клональное размножение и сома-
соматическое гипермутирование позволяют иммунной системе про-
продуцировать высокоаффинные иммунокомпетентные клетки (этот
процесс называется увеличением аффинности), что создает дина-
динамический баланс между изучающей и защитной функцией адап-
адаптивного иммунитета. Наличие динамической защиты постепенно
приводит к расширению зоны наблюдения, контролируемой им-
иммунной системой.
• Вероятностное обнаружение. Перекрестные реакции в
ходе иммунного ответа — это процесс стохастический. К тому
же обнаружение антигена всегда неизбежно происходит прибли-
24 Гл. 1. Обзор искусственных иммунных систем и их приложений
зительным образом; следовательно лимфоцит может взаимодей-
взаимодействовать с несколькими структурно сходными антигенами.
В иммунном ответе на антиген важную роль играют и другие
характеристики иммунной системы, такие как адаптируемость,
специфичность, самотолерантность, дифференцировка и другие.
Все эти замечательные свойства, имеющие отношение к обработ-
обработке информации, создают ряд интересных возможностей с вычис-
вычислительной точки зрения.
1.3. Нервная и иммунная системы
Одно из принципиальных различий между нервной и иммун-
иммунной системами заключается в особенностях их взаимодействия с
окружающей средой. Несмотря на то, что механизмы образова-
образования и гибели лимфоцитов in vivo до конца не изучены, наиболее
вероятно, что соответствующая функция имеет характер некото-
некоторой простой нелинейности [38]. Лимфоциты могут образовывать
связи с внешними антигенами или друг с другом при помощи
антиидиотипических взаимодействий [43]. По мнению Вертосика
и Келли [43], клональное размножение и увеличение аффинно-
аффинности в ходе иммунного ответа напоминают метод обучения Хебба.
Обучение в иммунной системе реализуется на основе изменений
количества и аффинности рецепторов. Связи в нервной системе
имеют детерминированный характер, в то время как перекрест-
перекрестные взаимодействия в иммунном ответе — это вероятностный
процесс.
Нервная система обычно подразделяется на сенсорную и
моторную части. Аналогичное деление на распознающие и эф-
фекторные функции можно провести и в иммунной системе; в
этом случае эффекторные механизмы приводят к элиминации
антигена. По-видимому, в нервной системе забывание происхо-
происходит в результате изменения силы связей между нейронами, а
не изменения самих нейронов как таковых. Далее, мозг имеет
способность осуществлять вспоминание на основе ассоциаций,
и гибель отдельных нейронов не приводит к радикальным из-
изменениям деятельности мозга в целом. Аналогично, наличие
перекрестной памяти, а также вариация скоростей размножения
клеток и программируемой клеточной гибели позволяют иммун-
иммунной системе динамично распределять ресурсы (то есть клетки)
в соответствии с требованиями внешней среды.
Несмотря на то, что модели нейронных сетей и соответствую-
соответствующие приложения привлекли широкое внимание, применение мо-
моделей иммунной системы достаточно ограниченно. По сравнению
1.4. Модели, основанные на принципах иммунной системы 25
с нейрофизиологией, где основу для моделирования составляют
уравнения Ходжкина-Хаксли, единое соглашение об общем виде
уравнения, описывающего функционирование отдельных имму-
нокомпетентных клеток, отсутствует [39]. Вместе с тем, нервная
и иммунная системы обладают рядом общих свойств, характери-
характеризующих базовые когнитивные механизмы. В табл. 1.1 суммирова-
суммированы сходства и различия этих систем (соответствующие свойства
показаны в работах [4, 12,44]).
Многие биологи считают, что по сравнению с нервной си-
системой иммунная система, в принципе, более сложна. Были
предложены основанные на экспериментальных данных различ-
различные теории иммунитета. Некоторые из этих теорий противо-
противоречат друг другу в части описания вариантов межклеточных
взаимодействий в ходе иммунного ответа. Вследствие пробелов
в понимании механизмов иммунитета единая модель или точка
зрения, объясняющая все известные иммунологические явления,
до сих пор отсутствует. Также остается открытым вопрос, функ-
функционирует ли иммунная система в стационарном, колебательном
или хаотическом режиме.
1.4. Модели, основанные на принципах
функционирования иммунной системы
Для объяснения иммунологических механизмов существуют
разные теории [31,36] и математические модели [38,42]. Так-
Также имеется растущее число компьютерных моделей [43,45] для
имитации динамики различных компонентов иммунной системы
и ее поведения в целом. Эти подходы включают модели, сформу-
сформулированные в виде систем дифференциальных [38] и стохастиче-
стохастических [4] уравнений, клеточно-автоматные модели [3,41], модели
пространства конфигураций [46] и другие. Вместе с тем, есте-
естественная иммунная система служит источником новых идей для
развития интеллектуальных методов решения сложных задач,
но работ в этой области пока немного. Необходимо проводить
больше исследований, в частности, для изучения механизмов
обработки информации в иммунной системе, что может иметь
большое практическое значение.
К сожалению, в настоящее время существует лишь неболь-
небольшое число вычислительных моделей, основанных на принципах
работы иммунной системы. По-видимому, это связано с сохра-
сохраняющейся неопределенностью основных положений, предложен-
предложенных для ее описания. Среди таких моделей часто используются
следующие [7].
26 Гл. 1. Обзор искусственных иммунных систем и их приложений
ф
н
5
1
К
О
PQ
а
о § х
Е- К
а) Ч н
а _г к о н
X Е-1 и С то1
fc3SSo
1
IS
CD
3
m
л о _
Pi's!
' О Он
О к
S2
II
0
CD g
Он О
II
li
s ^
00 Л
oo g
§«§
Он
Е- CD
^ CD
Я X
pq ;
ex Е- ;
S
С
Ё ° ffl
IP
О K
Он О
§ g
S s ?
oo CD Д
g g s.
о о м
C
О Е-
II
о
CD H
S CD
X ^
CD Ж
S S
н О CD
5*
If
S
S
oo ?
CD О
2 *
Он О
PQ
I
11
«I
IS
si
VO ^
О .
II
н S _
4 5 к 2
1
OJ К
у О И
s
о
il
1 I—о
1 S я
^ s I и
s s
l
i
pq
t?
i
§ 11
1
oo
О pq
С О
Он
VO
О
Он
X
«1
Он
VO
о
11
11II
? jq o vo
й й S
VO VO
о о s
as
,jq oo
X S
X X
U о
X
ш
е-
х
s
X
CD
I"
о
1.4. Модели, основанные на принципах иммунной системы
27
ая система
X
:мун
К
се
CD
Е-
CJ
К
CJ
td
Нервн;
к
Е-1
CJ
обенно
CJ
О
1
к
о
X
ливированны
Г
ее
част
1
Е-
CD
1
Он
гически:
[лы синап-:
к
CJ
Структура
мять
то
а
и ненг
pq
К
ки ассоциат
Е-
К
о С
Он g
тов
след
jq
к
гю пам.
Уем>
:енаслед
ивную и н
Е-1
самоассоци
,
CD
ОКОМ
сение иммун
а
к
к
иваци
Акт:
t^
"о
обхода
CD
>i связей
лорог силг
Существуе!
н
CD
-О4
СП
эК
3
PQ
О
f_
О
Он
о
с:
о
(-Н
о
редеь
ят выше оп
1-4
исхо
про
о
Е-
CD
НЫХ
о
Он
с
CD
со
pq
CJ
CJ
Средн5
нейронов.
td
возбуждена
исяще
:, зав
[ связывания
.НОС!
^ТИВ
)га эф
о
с
1 их удель:
X
порциональ
эй реакции
^чес:
S
Ин
корос
Е-
о
о
плох
о
X
голерантная,
о
сам!
s
се
еряем
генная
л
иям
зрежден
о
с
се
pq
S
=s
о
Весьма уст<
jq
Е-
CJ
о
pq
S
=s
о
^н
зличия
1>^
анизм;
у орг
уют по всем;
Он
<ули
Он
S
я
ИЗ
s
я
о
S
ано
иксиров
-&
pq
О
О
Он
=s
CD
Положение
td
Я
се
СО
S
се
о
клето
X
компетентнь
о
1мун
S
уляци
щород
II
Он
о
§
[ронов
i ней
пуляцш
'СЯ, ЧТО ПО
1т-1
CD
Предполага
на
pq
О
Е-
X
CD
CD
Ss
С
S
X KOt
очны
jx межклет
р-Ц
CD
вре]
CD
OCHOE
a
[Г-
s
CJ
X
S
тричес
элек
п,ством
тся посре,
к
Осуществлю
td
S
се
IV!
ммуни]
о
X
оримы
)аств
секреции f
yTeiv
s
tj
s
^и ао,
E-i
S
CO
td
s
жестк
врез
ЩХСЯ Ч(
эстранякш
Он
налов, расг
жул
о
S
Он
ее
X
CD
ее
энам и
CJ
се
есть по
нтами, то
CD
4
между эле»
там
,
yfHOKOIV
имм^
се
Он
Е-
|_Н
о
о
СО
Хар;
s
CJ
О
ш нер
шац1
ем актр
;тся уровн
>^
Характериз
CD
СТОЯНИ
о
и
X
о
VO
о
pq
: рецепторов
X
**|
tj Е-
ИН ^н
с се
стемы
гнкцие
>-^
1-г1
управление
се
рган
о
о
(-Н
о
ж
тралы
Цен
(_
СО
О
Е-
CD
td
равл
гемы уп
рвной сис^
CD
Ж
Функцией ]
CD
S
равлен:
>>
существует
CD
:сте»
CJ
уннои
имм
28 Гл. 1. Обзор искусственных иммунных систем и их приложений
1.4.1. Модель иммунной сети. Ерне [30,31] предложил
гипотезу, согласно которой иммунная система представляет со-
собой регулируемую сеть молекул и клеток, распознающих друг
друга даже при отсутствии антигена. Такие структуры часто
называют идиотипическим сетями, они служат математиче-
математической основой для изучения поведения иммунной системы. Тео-
Теория Ерне интерпретируется в виде системы дифференциальных
уравнений, описывающей динамику концентрации клонов лим-
лимфоцитов и соответствующих молекул иммуноглобулинов. Теория
идиотипической регуляции основана на предположении, что раз-
различные клоны лимфоцитов друг от друга не изолированы, а
поддерживают связь путем взаимодействий между своими рецеп-
рецепторами и антителами. Следовательно, распознавание антигена
осуществляется не единичным клоном клеток, а скорее на си-
системном уровне, с участием различных клонов, взаимодействую-
взаимодействующих по типу реакций антиген-антитело как единая сеть.
Ерне считал, что в ходе иммунного ответа сам антиген вы-
вызывает лишь выработку первого набора антител АЬ\. Затем эти
антитела, действуя в качестве антигена, вызывают выработку
второго набора «анти-идиотипических» антител т4Ь2, распознаю-
распознающих идиотопы на антителах АЬ\. Аналогично осуществляется
выработка третьего набора антител, АЬ%, распознающих антите-
антитела т4Ь2, и так далее.
Ключевой постулат теории Ерне заключается в том, что еди-
единичная клетка продуцирует лишь один тип антител; отсюда сле-
следует несколько выводов: 1) существует аллельное исключение,
2) все антитело-подобные рецепторы на поверхности лимфоцита
должны быть идентичными или, по крайней мере, иметь иден-
идентичные легкие цепи и вариабельные области тяжелых цепей;
а также что 3) все антитела, продуцируемые данной клеткой,
и ее потомки должны иметь одинаковый идиотип. Формулируя
основы своей теории, Ерне ввел понятия формальных и функцио-
функциональных сетей. Формальные сети служат для изучения вопросов
репертуара, дуализма и супрессии. При рассмотрении функцио-
функциональных сетей представлена количественная картина теории.
Вероятностный подход к изучению идиотипических сетей на
основе работы Ерне предложил Перельсон [38]. Данный подход
предельно математизирован и, в основном, связан с описани-
описанием фазовых переходов. Перельсон разделил плоскость фазовых
переменных рассматриваемой системы уравнений на докрити-
ческую область, область перехода и посткритическую область.
Последние 20 лет предложенной Ерне теории иммунной сети [31]
уделялось значительное внимание [38,42,43], что привело к по-
1.4. Модели, основанные на принципах иммунной системы 29
дробному изучению многих вычислительных аспектов соответ-
соответствующих математических моделей [23,25,29].
1.4.2. Алгоритм отрицательного отбора. Форрест и
др. [16] предложили алгоритм отрицательного отбора для
обнаружения изменений, построенный на основе принципов
распознавания своего и чужого в системе иммунитета [37].
В иммунной системе такое распознавание обеспечивается Т-лим-
фоцитами и другими клетками, имеющими на своей поверх-
поверхности рецепторы, способные обнаруживать чужеродные белки
(антигены). Рецепторы создаются на основе псевдослучайного
генетически обусловленного процесса перегруппировки в ходе
образования Т-клеток. Попадая в тимус, Т-клетки подвергаются
цензурированию, называемому отрицательным отбором, при этом
клетки, вступившие в реакцию с собственными белками, уничто-
уничтожаются, а остальные (не образующие с ними связей) получают
возможность покинуть тимус. Затем эти Т-клетки циркулируют
по всему организму и выполняют функцию защиты от чужерод-
чужеродных антигенов. Аналогично действует алгоритм отрицательного
отбора, случайным образом создавая детекторы и удаляя те из
них, которые распознают свое, так что остающиеся детекторы
могут обнаруживать любое не свое. Этот подход можно форма-
формализовать следующим образом.
• Определим свое как совокупность S строк длины / над ко-
конечным алфавитом, которую необходимо защищать или контро-
контролировать. Например, в качестве S могут выступать программа,
файл данных (любое программное обеспечение) или нормальная
форма активности, подразделяемые на подстроки равной длины 0.
• Образуем набор детекторов R, каждый из которых не
должен соответствовать любой строке в S. Вместо точного, или
идеального, соответствия 2) используем правило частичного со-
соответствия, при котором две строки соответствуют друг другу,
если и только если они совпадают по крайней мере в г следую-
следующих друг за другом позициях, где г — некоторый целочисленный
параметр (см. [16]).
*) Аналогично способу, которым белки расщепляются иммунной системой
на отдельные субъединицы, называемые пептидами, для распознавания рецеп-
рецепторами Т-клеток.
2) Для достаточно длинных отрезков точное соответствие весьма малове-
маловероятно, поэтому используется правило частичного соответствия, поощряющее
более специфичные соответствия (совпадение в большем количестве битов).
Это правило отражает тот факт, что способность иммунной системы к распо-
распознаванию должна быть весьма специфичной во избежание ошибочной класси-
классификации своих молекул как чужеродных и наоборот.
30 Гл. 1. Обзор искусственных иммунных систем и их приложений
• Проверим S на предмет изменений путем непрерывного
сравнения детекторов из R с элементами S. Если хотя бы один
из детекторов окажется соответствующим, значит произошло
изменение, поскольку детекторы по определению отобраны так,
чтобы не соответствовать любой строке из S.
В исходном описании алгоритма [16] кандидаты в детекто-
детекторы генерировались случайно и затем проверялись (подвергались
цензурированию) на соответствие любой строке своего. Если
соответствие имело место, то такой кандидат отвергался. Про-
Процедура повторялась до тех пор, пока не создавалось нужное
количество детекторов, необходимое для обеспечения определен-
определенного уровня надежности, которое оценивалось с использованием
статистических методов. Главное ограничение подхода со слу-
случайной генерацией детекторов, по-видимому, состоит в вычисли-
вычислительной сложности их создания, так как количество детекторов
растет экспоненциально по мере увеличения размерности своего.
Впоследствии Хелман и Форрест предложили более эффектив-
эффективный алгоритм генерации детекторов [20] с линейной зависимо-
зависимостью от размерности своего. Также были предложены другие
методы генерации детекторов [11], имеющие разную степень
вычислительной сложности.
Приведенный алгоритм опирается на три важных принципа:
1) каждый вариант алгоритма уникален, 2) процесс выявления
изменений имеет вероятностный характер и 3) надежная система
должна обнаруживать не только заранее известные варианты
изменений, но и любую чужеродную активность. Дальнейшие
исследования показали большие возможности алгоритма [10, 11];
его некоторые возможные приложения обсуждаются в следую-
следующем разделе.
1.4.3. Другие модели. Существуют и другие вычислитель-
вычислительные модели, имитирующие различные иммунологические явле-
явления, например способность иммунной системы находить общие
структуры в зашумленной среде [15], возможность обнаружи-
обнаруживать и поддерживать охват структур, принадлежащих различным
классам, а также способность к эффективному обучению даже
в том случае, если экспрессированы не все молекулы иммуно-
иммуноглобулинов и не все антигены присутствуют [21]. В нескольких
работах для моделирования процесса соматических мутаций (при
котором образуются антитела для распознавания конкретного
антигена) применялись генетические алгоритмы. Хоффман [22]
сопоставил иммунную систему с нервной системой, показал ряд
аналогий, имеющихся на уровне общего поведения этих систем
1.5. Некоторые приложения искусственных иммунных систем 31
(отличающихся на уровне структурных элементов), и теорети-
теоретически допустил существование симметричной модели нейронной
сети с поведением, аналогичным иммунной реакции в ответ на
действие стимула. Фармер и др. [13], а также Берсини и Варела
[1,2] сопоставили иммунную систему с самообучающимися си-
системами классификаторов.
1.5. Некоторые приложения искусственных
иммунных систем
Модели, основанные на принципах функционирования систе-
системы иммунитета, применяются в различных областях науки и
техники.
1.5.1. Компьютерная безопасность. Группа под руковод-
руководством Стефани Форрест из университета Нью-Мексико работает
над проектом создания искусственной иммунной системы (ИИС)
для компьютеров. Эта система, использующая принципы работы
иммунитета, имеет гораздо более изощренные средства обнару-
обнаружения и защиты, чем применявшиеся до сих пор. Напомним, что
безопасность компьютерных систем определяется способностью
обнаруживать попытки неавторизованного использования ресур-
ресурсов системы, поддерживать целостность данных и подавлять
распространение компьютерных вирусов.
Проблема защиты компьютерных систем от вирусов являет-
является частью более общей проблемы нахождения отличий своего
(законных пользователей, неиспорченных данных, и т. п.) от
опасного чужого (неавторизованных пользователей, вирусов и
других опасных агентов). Предполагается, что ИИС будут до-
дополнять традиционные подходы к обеспечению компьютерной
безопасности — криптографический и разграничительный по до-
доступу. Например, при установлении целостности файлов данных
и обнаружении компьютерных вирусов в качестве первого этапа
можно использовать рассмотренный выше алгоритм отрицатель-
отрицательного отбора.
Обнаружение вирусов. Для решения задачи обнаружения
изменений в защищаемых данных и программных файлах Фор-
Форрест и др. [16] использовали алгоритм отрицательного отбора.
Ими был проведен ряд экспериментов в среде DOS с различ-
различными вирусами, включая вирусы, инфицирующие файлы дан-
данных и загрузочные сектора. Полученные результаты показывают,
что указанный алгоритм легко обнаруживает изменения в за-
зараженных файлах. По сравнению с существующими методами
32 Гл. 1. Обзор искусственных иммунных систем и их приложений
выявления вирусов алгоритм отрицательного отбора имеет ряд
преимуществ: он вероятностный и может подстраиваться за счет
увеличения времени работы процессора (вероятность обнару-
обнаружить изменения увеличивается), он может быть перенесен на
самые разные компьютерные системы (причем надежно работает
при низкой стоимости) и способен обнаруживать новые, ранее не
идентифицируемые вирусы.
Хранящаяся в компьютере информация по своей природе
изменчива, поэтому определение своего в компьютерных систе-
системах должно происходить более динамично, чем в естественной
иммунной системе. Например, пользователи регулярно обновля-
обновляют программное обеспечение, редактируют файлы и запускают
новые программы. Следовательно, данный алгоритм имеет огра-
ограниченное применение — он предназначен только для защиты
постоянных файлов данных или программ.
Мониторинг процессов в системе UNIX. В продолжение
работ по компьютерной безопасности, Форрест и др. [14] при-
применили предложенный ими алгоритм отрицательного отбора для
мониторинга процессов UNIX и выявления опасных проникно-
проникновений в систему. Для сохранения способности выявлять атаки
такой алгоритм должен не только определять признаки своего
для процессов UNIX, но и уточнять и переопределять их путем
согласования с изменениями, вызванными допустимой активно-
активностью в системе.
Эта работа основана на предположении, что вызовы процес-
процессов управления аппаратными средствами системы (root proces-
processes) могут привести к более опасным повреждениям, чем вызовы
пользовательских процессов. Вместе с тем процессы управления
аппаратными средствами, как правило, имеют ограниченный и
устойчиво сохраняющийся во времени набор вариантов. Тогда
нормальный, или свой, определяется на основе расчетов корре-
корреляций типов вызываемых системой процессов. Это определение
своего устойчиво при нормальной работе стандартных программ
UNIX на небольших интервалах времени. Аналогично можно об-
обнаруживать и попытки проникновения в программу электронной
почты sendmail. Необходимость мониторинга этой программы
состоит в том, что ее активность достаточно сложна и изменчива,
и, следовательно, анализ этой активности дает предварительную
оценку ситуации, тем более что имеется несколько задокумен-
задокументированных атак против sendmail, которые можно использовать
в целях оценки эффективности предложенного алгоритма. В упо-
упомянутых экспериментах генерируются результаты трех типов ак-
активности, отличающихся от нормальной: последствия успешной
1.5. Некоторые приложения искусственных иммунных систем 33
и неуспешной атаки sendmail, а также последствия сбоев в самой
системе. Также имеется возможность отслеживать последствия
двух одновременных атак.
Проведенные эксперименты показали, что обнаруживать в
sendmail источники аномальной активности позволяют короткие
последовательности вызовов системы [14]. Так как эта характе-
характеристика легко вычисляется и требует приемлемого объема па-
памяти, то она удобна для реализации в виде системы on-line,
ядро которой проверяет каждый вызов системы процессами ад-
администрирования. При такой схеме каждый сайт создает свою
собственную базу нормальных данных, соответствующую ло-
локальной конфигурации программного и аппаратного обеспечения
и конкретным способам его использования. Преимуществом та-
такого подхода является то, что каждый сайт имеет собственные
уникальные характеристики, несколько отличающиеся от харак-
характеристик других сайтов. Это приводит к тому, что успешное
проникновение в один сайт не обязательно будет успешным для
других сайтов, использующих одинаковое программное обеспе-
обеспечение. В результате увеличивается вероятность того, что хотя
бы один сайт обнаружит атаку. Данная работа выглядит весьма
многообещающе и открывает новые перспективы исследований
в области компьютерной безопасности.
Альтернативный метод обнаружения вирусов. В рабо-
работе [33] предложен новый метод обнаружения компьютерных ви-
вирусов, основанный на иммунологической гипотезе об инструк-
инструктивном механизме иммунного ответа. Согласно предложенному
подходу, известные вирусы обнаруживаются по их кодовым по-
последовательностям (сигнатурам), а неизвестные вирусы — по
их необычной активности в вычислительной системе. Соответ-
Соответствующая программа обнаружения вирусов непрерывно скани-
сканирует программное обеспечение на наличие признаков вирусной
инфекции. Процесс выявления таких признаков включает запуск
программ-приманок (decoy programs), единственной целью ак-
активности которых является их инфицирование вирусом.
В различных областях памяти для захвата вирусов применя-
применяются специализированные наборы программ-приманок. Приман-
Приманки создаются так, чтобы они были как можно более привлека-
привлекательными для наиболее активно распространяющихся вирусов.
Каждая из приманок время от времени проверяется на предмет
изменений. Если одна или несколько из них были изменены, то
можно быть почти уверенным, что неизвестный вирус проник в
систему и каждая из измененных программ-приманок содержит
образец этого вируса. Инфицированные приманки обрабатыва-
2 Д. Дасгупта
34 Гл. 1. Обзор искусственных иммунных систем и их приложений
ются определителем сигнатур (signature extractor), который со-
создает распознаватель вируса. Определители сигнатур извлекают
из приманки информацию о том, каким образом вирус прикреп-
прикрепляется к инфицируемой программе, что позволяет восстанавли-
восстанавливать инфицированные программы. Определитель должен выбрать
сигнатуру вируса (из последовательностей байтов, образующих-
образующихся на этапе прикрепления), позволяющую избегать как ложно
отрицательных, так и ложно положительных реакций. Другими
словами, сигнатура должна обнаруживаться при каждом появле-
появлении вируса и не должна обнаруживаться в неинфицированных
программах. Для выбора наилучшей из возможных сигнатур
проводится сравнение с полугигабайтным набором допустимых
программ, что позволяет избежать ложноположительных резуль-
результатов. Информация для восстановления подготавливается экс-
экспертом по результатам тестирования.
Сигнатура и программа восстановления помещаются в ар-
архив антивирусной базы данных, обновленная версия которой
направляется пользователям. Этот подход можно использовать
для подавления распространения вируса в компьютерной сети.
В этом случае инфицированные машины подают сигналы, преду-
предупреждающие другие компьютеры об атакующем вирусе. Сигналы
должны содержать информацию о том, как уничтожить новый и
ему подобные вирусы.
1.5.2. Обнаружение аномалий во временных рядах дан-
данных. Алгоритм отрицательного отбора [16] применялся в экс-
экспериментах по выявлению аномалий во временных рядах данных
(как модельных, так и реальных) [6,9]. Данная работа прово-
проводилась с целью создания алгоритма, способного эффективно вы-
выявлять любые изменения стационарных характеристик системы
или процесса. Понятие своего в указанных экспериментах опре-
определялось как набор вариантов нормальной активности монитори-
руемой системы 0. Тогда любое изменение в данных, превосходя-
превосходящее допустимую величину, рассматривается как аномалия. Этот
подход основывается на достаточно больших выборках нормаль-
нормальных данных (включая все содержательные типы данных) для
генерации набора детекторов, способных обнаруживать измене-
изменения без использования априорных знаний о вариантах аномалий
и дефектов.
х) Предполагается, что нормальная активность системы или процесса ха-
характеризуется несколькими рядами данных наблюдений. Также предполага-
предполагается, что в норме активность системы может быть отнесена к одному из
устойчивых во времени типов.
1.5. Некоторые приложения искусственных иммунных систем 35
Рассматривался алгоритм выявления поломки резца (the tool
breakage detection) при фрезеровании [8]. Соответствующая про-
проблема была сформулирована как задача выявления изменений
в режущем усилии, возникающих в результате поломки резца.
Для этого проводился анализ поступающих данных на отличие
от нормальных характеристик работы системы, что указывало на
изменение режима работы.
Указанный алгоритм успешно выявлял аномалии при обра-
обработке сигналов, генерируемых имитационной моделью процесса
фрезерования. Предлагаемый подход можно использовать для
автоматического мониторинга процессов с повышенным уровнем
опасности.
1.5.3. Диагностика неисправностей. В работах Ишиды
[26,27] рассматривается возможность применения принципов
строения и функционирования иммунной сети [31] для диа-
диагностики неисправностей. В этих исследованиях устойчивость
к повреждениям достигалась за счет взаимного распознавания
связанных между собой единиц оборудования завода. Таким
образом, оценка состояния системы в целом обеспечивалась за
счет распознавания на уровне составляющих ее единиц.
Модель имеет следующие характеристики: а) возможность
параллельной работы компонентов системы; б) способность
оперировать неполной информацией и данными; в) способность
к самоорганизации; г) распространение неисправностей без
использования механизма обратной связи. В работе [25] описано
приложение модели взаимного распознавания к процессу функ-
функционирования технологического оборудования химического завода.
Для диагностики неисправностей модель взаимного распознава-
распознавания использует сеть датчиков, соединенных двунаправленными
дугами. Полученные результаты представляют интерес для
дальнейших исследований.
В работе Ишигуро [29] модель иммунной сети [31] приме-
применяется для оперативной диагностики производственных систем.
В ней используются следующие предположения: а) сенсорами
снабжены не все компоненты производственных систем заво-
завода, причем сенсоры выдают только два варианта сообщений:
компонент в норме или неисправен; б) рассматривается только
один источник неисправностей (одновременные и комплексные
повреждения не учитываются); в) сигнал о состоянии неисправ-
неисправности распространяется по всем без исключения компонентам
системы; г) для распространения неисправности не используется
обратная связь. В данной работе предпринята попытка создать
2*
36 Гл. 1. Обзор искусственных иммунных систем и их приложений
универсальный метод диагностики неисправностей, применимый
к различным производствам.
1.5.4. Искусственная иммунная система и распознавание
образов. Способность к обучению искусственной иммунной
системы (ИИС), основанной на принципах функционирования
иммунной сети [31], исследовалась в [23,24]. ИИС оказалась
устойчивой к шумам, способной к самообучению и не нуждалась
как в отрицательных примерах, так и в явном указании на то,
что именно следует запоминать. В этой системе объединены
достоинства обучающейся системы классификации с некоторыми
преимуществами нейронных сетей, алгоритмов машинного выво-
вывода и аналогового поиска.
ИИС состоит из управляющего объекта (сети клеток), а
также обучающего и тестового наборов данных. Каждая клетка
сети имеет компонент, позволяющий распознавать структуры
на основе сравнения. Этот компонент создается при помощи
процесса, напоминающего генетический механизм образования
антител в естественной иммунной системе. Так формируется
словарь структур и поддерживается его разнообразие. Система
генерирует два типа ответов: первичный и вторичный. Первич-
Первичный ответ соответствует фазе обучения, во время которой ИИС
изучает структуры для формирования обучающего набора дан-
данных. Вторичный иммунный ответ соответствует распознаванию
структур, во время которого ИИС пытается классифицировать
новые данные, сравнивая их с ранее изученными.
При использовании ИИС для конкретных целей необходимо
сначала провести настройку системы на обучающей выборке,
предъявляя ее или всю целиком, или по частям (в зависимо-
зависимости от задачи). Полученную в результате обучения информацию
можно использовать несколькими способами.
Так, было показано, что ИИС способны решать задачи рас-
распознавания образов. ИИС применялись для решения задачи вы-
выявления промоторов в последовательностях ДНК, то есть для
решения вопроса о том, содержат ли новые последовательности
промоторы, или нет. Использованный алгоритм включает следу-
следующие этапы.
Случайная инициализация исходной популяции В-клеток;
нагрузка набором антигенов;
повторение до выполнения условия окончания:
случайный выбор антигена,
случайный выбор точки в сети В-клеток для введения антигена,
выбор В-клеток из числа клеток, локализованных в этой точке
сети,
1.6. Выводы 37
для каждой выбранной В-клетки:
презентировать антиген для запуска иммунного ответа,
упорядочить В-клетки по уровню ответа,
удалить 5 % В-клеток из исходной популяции,
создать п новых В-клеток (где п равно 25 % популяции),
выбрать m В-клеток для включения в иммунную сеть
(где m составляет 5 % от размера популяции).
В работе [24] было показано, что ИИС являются примером
обучающихся нелинейных адаптивных сетей, содержащих явно
адресуемую память. Целью этих исследований было создание
инструментария для решения задач машинного обучения, осно-
основанного на принципах иммунной системы.
1.5.5. Другие приложения ИИС. В работе [2] для уско-
ускорения параллельного поиска локальных экстремумов использо-
использовался алгоритм, напоминающий процесс рекрутирования лимфо-
лимфоцитов в ходе иммунного ответа. Ишида рассмотрел такие осно-
основанные на принципах иммунитета методы, как мажорирующие
сети, системы исполнительных устройств и самоидентифицирую-
самоидентифицирующиеся системы [28]. Для решения задач распознавания образов
в работе [18] предпринята попытка создать самоассоциативную
и содержательно адресуемую память, использующую принципы
иммунной сети. На вход системы подавались мозаичные черно-
белые структуры размером 64 х 64 пикселей, выполнявшие роль
антигенов. Хотя авторам и не удалось получить устойчивые ре-
решения, предлагаемый подход представляется весьма интересным.
В работе [35] алгоритм отрицательного отбора был применен для
сегментации аэрофотоснимков. Для решения задач структурной
оптимизации использовался генетический алгоритм, основанный
на принципах иммунной сети [19].
1.6. Выводы
Значительные возможности иммунной системы по решению
задач обработки информации представляют большой интерес для
исследований. При решении сложных задач иммунная система
использует параллельные и распределенные методы вычислений.
Как и нервная система, иммунная система способна к обучению,
использованию ранее полученной информации и решению задач
распознавания образов. По-видимому, процесс обучения иммун-
иммунной системы напоминает биологическую эволюцию. В этой главе
были рассмотрены модели, основанные на различных вычисли-
вычислительных аспектах системы иммунитета. Ограниченность объема
38 Гл. 1. Обзор искусственных иммунных систем и их приложений
главы не дает возможности подробно рассмотреть модели и их
приложения. Реализованные методы, основанные на принципах
иммунной системы, имитируют, как правило, лишь один из ее
механизмов. В будущем необходимо объединить в одной системе
все потенциально полезные свойства системы иммунитета.
Рассматриваемые модели могут быть полезны для решения
многих прикладных задач. К ним относятся задачи диагностики
и обнаружения неисправностей, мониторинга, контроля доступа,
выявления шума, защиты компьютеров и данных, распознавания
образов, поиска закономерностей и многие другие. Отметим, что
механизмы иммунитета сложны и не всегда понятны даже имму-
иммунологам. Их изучение представляет интерес не только вследствие
ключевой роли иммунной системы в контроле развития болезней,
но также и для решения вычислительных задач. Если функция
иммунной системы станет понятной с вычислительной точки зре-
зрения, то это будет способствовать развитию области массивных
адаптивно-параллельных вычислений.
Работа поддержана исследовательским грантом университета
г. Мемфиса. Сокращенная версия этой главы опубликована в
трудах международной конференции IEEE «Системы, человек и
кибернетика» (октябрь 1997г.).
Список литературы
1. Bersini Я., Varela F.J. Hints for adaptive problem solving gleaned
from immune networks // In: Proc. of the first workshop on parallel
problem solving from nature, 1990. P. 343-354.
2. Bersini Я, Varela F.J. The immune recruitment mechanism: A
selective evolutionary strategy // In: Proc. of the fourth international
conference on genetic algorithms, San Diego, July 13-16, 1991.
P. 520-526.
3. Celada F., Seiden P.E. A computer model of cellular interactions in
the immune system // Immunol. Today. 1992. V. 13, №2. P. 56-62.
4. Chowdhury D., Stauffer D. Statistical physics of immune networks //
Physica A. 1992. V. 186. P. 61-81.
5. Cohen I. R. The cognitive paradigm and the immunological homuncu-
lus // Immunol. Today. 1992. V. 13, № 12. P. 490-494.
6. Dasgupta D. Using immunological principles in anomaly detection //
In: Proc. of the artificial neural networks in engineering (ANNIE'96),
St. Louis, USA, November 10-13, 1996.
7. Dasgupta D., Attoh-Okine N. Immunity-based systems: A survey //
In: Proc. of the IEEE international conference on systems, man, and
cybernetics, Orlando, Florida, October 12-15, 1997.
Список литературы 39
8. Dasgupta D., Forrest S. Tool breakage detection in milling operations
using a negative-selection algorithm // Technical report CS95-5,
Department of computer science, University of New Mexico, 1995.
9. Dasgupta D., Forrest S. Novelty detection in time series data using
ideas from immunology // In: ISCA 5th international conference on
intelligent systems, Reno, Nevada, June 19-21, 1996.
10. D'haeseleer P. An immunological approach to change detection:
theoretical results // In: Proceedings of IEEE symposium on research
in security and privacy, Oakland, CA, May 1996.
11. D'haeseleer P., Forrest S., Helman P. An immunological approach to
change detection: algorithms, analysis, and implications // In: Proc. of
IEEE symposium on research in security and privacy, Oakland, CA,
May 1996.
12. Farmer J.D. A rosetta stone for connectionism // Physica D. 1990.
V.42. P. 153-187.
13. Farmer J.D., Packard N.H., Perelson A. S. The immune system,
adaptation, and machine learning // Physica D. 1986. V. 22. P. 187—
204.
14. Forrest S., Hofmeyr S.A., Somayaji A, Longstaff T.A. A sense of
self for unix processes // In: Proc. of IEEE symposium on research
in security and privacy, Oakland, CA, May 1996.
15. Forrest S., Javornik В., Smith R., Perelson A. S. Using genetic
algorithms to explore pattern recognition in the immune system //
Evol. Сотр. 1993. V. 1, №3. P. 191-211.
16. Forrest S., Perelson A.S., Allen L., Cherukuri R. Self-nonself dis-
discrimination in a computer // In: Proc. of IEEE symposium on research
in security and privacy, Oakland, CA, 16-18 May 1994. P. 202-212.
17. Frank S.A. The design of natural and artificial adaptive systems.
N.Y.: Academic Press, M.R.Rose and G.V. Lauder edition, 1996.
18. Gilbert C.J., Routen T. W. Associative memory in an immune-based
system // In: Proc. of the 12th national conference on artificial
intelligence (AAAI-94), Seattle, July 31-August 4, 1994. P. 852-857.
19. Hajela P., Yoo /., Lee J. GA based simulation of immune networks —
applications in structural optimization // J. Eng. Optimiz. 1997.
20. Helman P., Forrest S. An efficient algorithm for generating random
antibody strings // Technical report №CS94-7, Department of com-
computer science, University of New Mexico, 1994.
21. Hightower R., Forrest S., Perelson A.S. The evolution of emergent
organization in immune system gene libraries // In: Proc. of the 6th
international conference on genetic algorithms, Pittsburg, 1995. San
Francisco, Ca.: Morgan Kaufmann, 1995.
22. Hoffmann G. W. A neural network model based on the analogy with
the immune system // J. Ther. Biol. 1986. V. 122. P. 33-67.
23. Hunt J.E., Cooke D.E. An adaptive, distributed learning system,
based on the immune system // In: Proc. of the IEEE international
conference on systems, man and cybernetics, 1995. P. 2494-2499.
24. Hunt J. E., Cooke D. E. Learning using an artificial immune system //
J. Network Сотр. Appl. 1996. V. 19. P. 189-212.
40 Гл. 1. Обзор искусственных иммунных систем и их приложений
25. Ishida Y., Mizessyn F. Learning algorithms on an immune network
model: application to sensor diagnosis // In: Proc. of international
joint conference on neural networks, China, November 3-6, 1992.
V. 1. P. 33-38.
26. Ishida Y. Fully distributed diagnosis by PDP learning algorithm:
Towards immune network PDP model, I, June 17-21, 1990. P. 777-
782.
27. Ishida Y. An immune network model and its applications to process
diagnosis // Syst. Сотр. Japan. 1993. V.24, №6. P. 38-45.
28. Ishida Y. The immune system as a self-identification process: A sur-
survey and proposal. Presented at IMBS workshop on immunity-based
system, December 1996.
29. Ishiguro A, Watanabe Y., Uchikawa Y. Fault diagnosis of plant
systems using immune networks // In: Proc. of the 1994 IEEE
international conference on multisensor fusion and integration for in-
intelligent systems (MFI'94), Las Vegas, October 2-5, 1994. P. 34-42.
30. Jerne N. K. The immune system // Sci. Am. 1973. V. 229, № 1. P. 52-
60.
31. Jerne N. K. Towards a network theory of the immune system //
Ann. Immunol. (Inst. Pasteur). 1974. V. 125C. P. 373-389.
32. Jerne N. K. The generative grammar of the immune system // The
EMBO Journal. 1985. V.4, №4. P. 847-852.
33. Kephart J. 0. A biologically inspired immune system for computer //
In: Proc. of artificial life, Cambridge, MA, July 6-8, 1994.
34. Kuby J. Immunology. W. H. Freeman and Co., 2nd edition, 1994.
35. McCoy D., Devarajan V. Artificial immune systems for aerial image
segmentation // In: Proc. of the IEEE international conference on
systems, man, and cybernetics, Orlando, Florida, October 12-15,
1997. P. 867-872.
36. Mohler R.R., Bruni C, Gandolfi A. A system approach to immunol-
immunology // Proc. IEEE. 1980. V. 68, №8. P. 964-990.
37. Percus J.K., Percus O., Perelson A. S. Predicting the size of the
antibody combining region from consideration of efficient self/non-self
discrimination // PNAS. 1993. V. 60. P. 1691-1695.
38. Perelson A. S. Immune network theory // Immunol. Rev. 1989. V. 10.
P. 5-36.
39. Perelson A.S., Weisbuch G. Immunology for physicists / Preprint
for Review of Modern Physics, June, 1995.
40. Rome G. W. The theoretical models in biology. Oxford University
Press, 1st edition, 1994.
41. Santos R.M.Z., Bernardes A. T. The stable-chaotic transition on
cellular automata used to model the immune repertoire // Physica A.
1995. V.219. P. 1-12.
42. Varela F.J., Stewart J. Dynamics of a class of immune networks I.
Global stability of idiotype interactions // J. Theor. Biol. 1990. V. 144,
№1. P. 93-101.
43. Vertosick F. Т., Kelly R. H. Immune network theory: a role for parallel
distributed processing? // Immunology. 1989. V. 66. P. 1-7.
Список литературы 41
44. Vertosick F. Т., Kelly R. H. The immune system as a neural network:
A multi-epitope approach // J. Theor. Biol. 1991. V. 150. P. 224-237.
45. Weinand R. G. Somatic mutation, affinity maturation and antibody
repertoire: A computer model // J. Theor. Biol. 1990. V. 143, №3.
P. 343-382.
46. Weisbuch G. A shape space approach to the dynamics of the immune
system // J. Theor. Biol. 1990. V. 143, №4. P. 507-522.
Д-р Дипанкар Дасгупта работает доцентом информатики факультета ма-
математических наук в университете Мемфис, штат Тенесси (США). В широком
смысле его научные интересы относятся к области вычислений и сопровож-
сопровождению практических задач на основе междисциплинарных контактов. Область
его непосредственных интересов включает искусственный интеллект, генети-
генетические алгоритмы, нейронные сети, а также вычислительные модели иммунной
системы и их приложения. Д-р Дасгупта опубликовал более 40 научных
работ в монографиях, журналах и трудах международных конференций. Был
редактором книги «Эволюционные алгоритмы в инженерных приложениях»,
опубликованной издательством Springer-Verlag в 1997 г.
Д-р Дасгупта получил степень бакалавра в области электротехники
A981г.) и магистра в области компьютерных технологий A987 г.) в Индии.
Защитил степень доктора философии по информатике в Страсклайдском уни-
университете (Глазго, Шотландия) в 1994 г. После этого до августа 1995 г. работал
в университете Нью-Мексико в должности докторанта. До перехода в январе
1997 г. в университет г. Мемфис был преподавателем университета Миссури
(г. Сент-Луис). Д-р Дасгупта член Института инженеров по электротехнике и
электронике (IEEE) и компьютерного общества IEEE, Ассоциации по вычис-
вычислительной технике (АСМ) и других профессиональных объединений. Состоит
в редколлегии международного журнала, был членом программного комите-
комитета многих международных конференций. Организовал отдельное направление
из двух секций по искусственным иммунным системам на международной
конференции IEEE «Системы, человек и кибернетика» (SMC97, Орландо,
12-15 октября 1997 г.) и проводит аналогичное мероприятие на конференции
SMC98, которая должна состояться в Сан-Диего с 11 по 14 октября 1998 г.
Имеет по этой теме учебное пособие.
Глава 2
ДВОЙНАЯ ПЛАСТИЧНОСТЬ ИММУННОЙ СЕТИ
КАК ИСТОЧНИК ИНЖЕНЕРНЫХ РЕШЕНИЙ
Уго Берсини
Несмотря на то, что по обсуждавшимся выше причинам иммунология
оказывала в целом мало влияния на создание искусственных систем, одно
ключевое свойство иммунных сетей — их двойная внутренняя пластичность —
могло бы представлять интерес для инженерных приложений, имеющих дело
со сложной видоизменяющейся средой. Двойная пластичность обеспечива-
обеспечивает функционирование иммунной сети в условиях непрерывных возмущений,
вызываемых онтогенетическими изменениями организма и взаимодействием
с внешней средой. В этой главе показано, что развитие сложных систем, спо-
способных к адаптации как на структурном, так и на параметрическом уровнях,
должно удовлетворять следующим принципам: 1) структурные изменения про-
происходят реже, чем параметрические изменения; 2) свойство структурной пла-
пластичности означает добавление в систему новых и изъятие избыточных элемен-
элементов; 3) структурные регуляции определяются временной эволюцией параметров
системы, меняющихся в процессе обучения. Таким образом, порядок и тип
структурных изменений должны зависеть от динамики изменений параметров,
причем этот процесс регулируется внутренними, а не внешними факторами;
4) структурные изменения должны носить коллективный характер и иметь
в основе эвристические принципы типа «помочь наиболее слабым элементам»
(или «компенсировать их недостаток»), «поддержать разнообразие», «заполнить
нишу», «удалить избыточные элементы». Кратко обсуждаются три типа задач,
в которых применение принципов двойной пластичности дает, по-видимому,
положительный эффект: нейросетевая классификация, обучение автономных
агентов методом подкрепления и управление хаосом.
2.1. Введение
2.1.1. Причины слабого влияния иммунологии на созда-
создание искусственных систем. Биологические исследования яв-
являются важным источником новых идей для построения инже-
инженерных систем. Значительное влияние на развитие новых типов
алгоритмов в таких прикладных областях, как нелинейное мо-
моделирование и оптимизация, в последние годы оказывают два
типа биологических систем — это нейронные сети и эволюци-
эволюционные алгоритмы. Благодаря развитию нейросетевого подхода
классические методы нелинейного моделирования и распознава-
2.1. Введение 43
ния образов были дополнены новыми идеями многоуровневой
иерархической декомпозиции, параллельной обработки данных
и использования насыщающих функций активации, основанных
на фундаментальных представлениях о структуре и функциях
мозга. Развитие эволюционных алгоритмов привело к двум ос-
основным результатам. Во-первых, это использование параллель-
параллельных методов поиска с механизмом отбора и генерацией новых
кандидатов на случайной основе в окрестности вариантов ре-
решения. Во-вторых, это использование в задачах комбинаторной
оптимизации механизма рекомбинации для получения новых
кандидатов в окрестности «успешных». В обоих случаях я скло-
склонен рассматривать биологическое влияние как сильное, так как
путь к разработке этих алгоритмов обязан был пройти через
исследования живых систем. По-видимому, упомянутые методы
не появились бы без достаточных знаний о строении и функции
нервной системы, а также о механизмах естественного отбора.
Повлияли ли столь же сильно и непосредственно на создание
новых типов алгоритмов или искусственных систем наши пред-
представления об иммунной системе организма? Насколько мне из-
известно, все еще нет. Многие алгоритмы, методы и искусственные
объекты, авторы которых настаивали на их непосредственной им-
иммунологической подоплеке, вполне могли быть предложены (и не-
нередко действительно предлагались) авторами, не имеющими об
иммунной системе ни малейшего понятия. Безусловно, это не
должно восприниматься как критика в адрес тех исследователей,
чьи оригинальные и, возможно, глубокие по содержанию работы
опирались на знание иммунологических принципов (на самом
деле, я считаю себя одним из таких людей), а скорее как желание
отделить сильное влияние биологических принципов от слабого.
Это позволяет объяснить, почему прикладные результаты, полу-
полученные на основе знаний об иммунной системе, не завоевали той
же популярности, какой в наше время пользуются нейронные сети
и генетические алгоритмы. Вероятно, в данном случае существу-
существуют реальные альтернативные способы вывода тех же результатов,
для которых знание иммунологии не является необходимым.
Другим ключевым фактором слабого влияния иммунологии
на создание искусственных систем является то, что многие фун-
фундаментальные принципы иммунной системы уже были сфор-
сформулированы на техническом (если не сказать военном) языке:
иммунная система распознает «нарушителей» (классическое рас-
распознавание образов), удаляет их из организма и запоминает
имевший место контакт (классический механизм обучения). Это
в точности соответствует задачам армии или полиции, и люди
44 Гл. 2. Двойная пластичность иммунной сети
уже давно придумали способы защищать свои дома от несанкци-
несанкционированного доступа и используют их, даже не подозревая, что
их иммунная система выполняет аналогичные функции. Способ
реализации защитных механизмов в иммунной системе также
не является столь оригинальным, как это традиционно пред-
представляется в литературе, особенно если читатель уже сталки-
сталкивался с необходимостью решения фундаментальной проблемы
классификации внешних факторов как чужеродных — задачи
распознавания своего и чужого (во многих приложениях она
является тривиальной). Таким образом, любой алгоритм защиты
произвольной системы (например компьютерной сети), т.е. ос-
основной тип искусственных объектов, который кажется создан-
созданным на базе иммунологических принципов [9, 18, 23], по всей
видимости, вряд ли получает дополнительные преимущества от
использования иммунологических представлений, помимо тех,
что функция иммунной системы тоже состоит в защите орга-
организма. Иными словами, как иммунная система, так и защита
любого искусственного объекта построены на основе некоторых
абстрактных представлений о системе защиты вообще. Более
тонкое понимание аналогий и различий между этими объектами
в настоящее время отсутствует.
Ввиду указанных причин я, естественно, не утверждаю, что
развитие описанных далее алгоритмов было бы невозможно без
хорошего знания иммунологии. Должен оговориться вновь, что
это влияние представляется мне довольно слабым. Однако если
оно в действительности существует, то новизна заключается
здесь не в классическом понимании законов функционирования
иммунной системы как системы защиты, а скорее в представле-
представлении об иммунной системе как о самоотождествляющей системе
[25, 35, 37]. В условиях постоянного контакта с внешней сре-
средой это свойство обеспечивается за счет постоянной внутренней
реорганизации иммунной системы как на структурном, так и на
параметрическом уровнях.
2.1.2. Двойная пластичность иммунных сетей. Суще-
Существует множество примеров биологических систем, способных
к адаптации на основе параметрических и структурных изме-
изменений. Термином «параметрическая пластичность» обозначают
механизм адаптации, позволяющий системе в ходе выполнения
некоторой задачи изменять параметры функционирования для
повышения ее эффективности. Типичным примером параметри-
параметрической пластичности служит изменение силы синаптических свя-
связей между нейронами (т. е. весовых коэффициентов синапсов)
2.1. Введение 45
как неотъемлемый элемент эффективного функционирования
нервной системы. Структурная пластичность дает системе новые
возможности для адаптации. В системах взаимодействующих
элементов структурная пластичность сводится к способности
добавления новых и исключения уже имеющихся элементов.
В случае нейронных сетей это означает способность нейронов
вовремя исчезать или появляться [20], так что в процессе функ-
функционирования системы могут изменяться не только весовые ко-
коэффициенты, но и общая структура сети. Это разные типы из-
изменений. Например, если представить динамику системы в виде
дифференциальных уравнений, то параметрические изменения не
меняют их вида, а структурные изменения означают добавление
новых или исключение некоторых из уже существующих урав-
уравнений.
Иммунные сети относятся к рассмотренному типу биологиче-
биологических сетей (убедительная попытка сопоставления таких систем
и выработки общего языка для их описания имеется в [16]).
Они состоят из взаимодействующих элементов и обладают двой-
двойной пластичностью: концентрация уже существующих элементов
может изменяться в результате процессов рождения и гибели
(пример биологически-ориентированных вычислений содержится
в [6, 10, 12]). Другим примером систем с двойной пластичностью
являются экосистемы. Параметрическая пластичность обеспечи-
обеспечивается в экосистемах за счет варьирования плотностей биологи-
биологических видов в результате их взаимодействий и влияния внеш-
внешних факторов. Появление новых видов происходит в результате
перекрестной рекомбинации и мутации генов.
Для иммунных сетей и экосистем важное значение имеет тот
факт, что давление отбора, приводящее к включению новых и
исключению уже имеющихся элементов осуществляется на внут-
внутрисистемном уровне и не зависит напрямую от внешних воздей-
воздействий. Влияние внешней среды в этом случае опосредованное —
через реорганизацию сети в результате контактов между ее эле-
элементами. В технике, что совершенно естественно, потребности
реорганизации часто обусловлены взаимодействиями с внешней
средой, в то время как процесс адаптации биологических систем
связан с необходимостью обеспечить функционирование системы
как единого целого. Экзогенный подход широко распространен
и в иммунологии, так как представление о системе иммунитета
как о системе защиты организма подразумевает, прежде всего,
взаимодействие с внешними нарушителями. С другой стороны,
точка зрения Варелы, Стюарта и Коутиньо [3, 7, 12, 25, 35,
37] на иммунную систему как самоотождествляющую, конечная
46 Гл. 2. Двойная пластичность иммунной сети
функция которой состоит в поддержании некоторых механизмов
внутренней коммуникации и обеспечении постоянства внутрен-
внутренней среды, является аргументом в пользу эндогенного подхода
к анализу иммунной системы.
Помимо указанного основного сходства экосистем и иммун-
иммунной системы необходимо отметить их ключевое различие. Им-
Иммунные сети имеют целевую функцию и задачи глобального
уровня, а экосистемы не несут коллективной ответственности.
Вместо этого каждый элемент таких систем пытается улучшить
свое собственное поведение (вспомним знаменитое выражение
Докинза «эгоистичный ген») с учетом как сетевых регуляций,
так и внешних воздействий. Остальные элементы сети могут
препятствовать или помогать выживанию данного элемента, но
они не заботятся о выживании всей сети как единого целого.
Функция иммунной системы, какой бы она в действительности
ни представлялась, по-видимому, является коллективной, хотя на
уровне составляющих ее индивидуальных элементов должна вос-
восприниматься как соответствующий уровень экосистем. В следую-
следующем параграфе будет дано простое описание явления двойной
пластичности иммунной сети и показан механизм формирования
памяти в ходе эндогенной реорганизации сети при взаимодей-
взаимодействии с внешней средой.
В последние годы все большее внимание привлекают систе-
системы классификаторов (СК) Джона Холланда [8,13,19,21]. Они
представляют собой первую и наиболее интересную попытку
разработать методологию взаимной интеграции двух вариантов
пластичности в распределенной системе, взаимодействующей со
сложной, быстро и непредсказуемо изменяющейся внешней сре-
средой. Грубо говоря, классификаторы представляют собой сенсо-
моторные элементы, способные к изменению в процессе работы
(постепенную адаптацию обеспечивает алгоритм «пожарной це-
цепочки» — разновидность метода временных разностей в обучении
с подкреплением [8,13,33]) на основе изменения вероятности
отбора в случае, если среда вступит в контакт с их сенсорной
частью. Это параметрическая пластичность, которая эволюци-
эволюционирует как функция штрафов и поощрений, последовательно
налагаемых внешней средой на исполнительные элементы. Наи-
Наиболее эффективный элемент получает все большую поддержку,
и в конечном итоге будет всегда отбираться при возникновении
соответствующей ситуации. Кроме того, в результате мутаций
и рекомбинаций из уже имеющихся лучших элементов могут
образовываться новые элементы.
2.1. Введение 47
Свойство структурной пластичности реализуют знаменитые
генетические алгоритмы (ГА) [8,19]. Несмотря на то что но-
новаторские идеи Холланда останутся важным источником моти-
мотивации будущих исследований адаптивных механизмов сложных
автономных систем, мы полагаем, что некоторые биологические
системы (например экосистемы) могут стать источником невер-
неверной трактовки свойства структурной пластичности в рамках СК.
Действительно, искусственные генетические алгоритмы, осно-
основанные на моделировании процесса эволюции, стремятся про-
произвести наилучших отдельных представителей данной системы.
Эта индивидуалистическая стратегия оправдывает себя, если
каждый стремится к повышению собственных шансов на вы-
выживание в среде, формируемой другими. Данная особенность
объясняет нынешнюю популярность ГА, реализующих альтерна-
альтернативную (по сравнению с СК) стратегию оптимизации. Собрание
воедино отдельных удачных элементов актерской игры — это
интуитивно привлекательный способ создания еще лучших акте-
актеров (возможно идеальных). Однако стоит ли к этому стремиться,
если интересующее нас действие является, скорее, результатом
коллективного поведения актеров на сцене, а не их индивиду-
индивидуальной игры?
В качестве альтернативной гипотезы мы предполагаем, что
для повышения общей производительности системы ее структур-
структурная подгонка должна осуществляться «в духе коллективизма»
на основе компенсации слабейших элементов системы, поддер-
поддержания разнообразия и заполнения ниш, не занятых имеющимися
элементами, а также путем удаления избыточных элементов. За-
Задача отслеживания слабейших и получения новых (компенсиру-
(компенсирующих) элементов популяции диаметрально противоположна роли
генетических алгоритмов в системах классификаторов. Генети-
Генетические алгоритмы сосредоточены на поиске лучших элементов
и создания на их основе им же подобных. В отличие от этого,
мы предлагаем определять слабейшие элементы и генерировать
совершенно отличные от них. Такой подход аналогичен известно-
известному способу улучшения качества работы стереосистемы, которое
гораздо сильнее зависит от слабых, а не от сильных элементов
(колонок). Если есть возможность заменить один из элементов
стереосистемы, то имеет смысл начинать со слабейшего.
Многие инженерные системы (например полиномиальные
и нейронные сети, а также нечеткие системы) были введены
в эксплуатацию в результате взаимной подгонки структурных и
функциональных параметров. Однако, к сожалению, в большин-
большинстве случаев структурная подгонка системы остается сложной
48 Гл. 2. Двойная пластичность иммунной сети
задачей. Поэтому часто структура выбирается произвольной и
достаточно массивной, с тем чтобы обеспечить все потребности
адаптации за счет параметрической пластичности. Примером
является практика применения нейронных сетей, правила выбора
архитектуры которых часто напоминают кулинарные рецепты.
При таком недостаточном внимании к выбору структуры возни-
возникает несколько проблем. С учетом возможностей параметричес-
параметрической регуляции выбранная структура может оказаться некоррект-
некорректной — недостаточно полной или, наоборот, слишком массивной,
что приводит к увеличению объема вычислений и памяти при
подгонке параметров, либо к появлению эффекта смещения
(например, хорошо известно явление чрезмерной подгонки в ней-
нейронных сетях). Как правило, предпочтение следует отдавать мини-
минимальным структурам, и лучше, если удастся автоматизировать вы-
выполнение этой задачи непосредственно в процессе работы системы.
Свойства иммунных сетей позволяют предположить, что кон-
конструкция сложных инженерных адаптивных систем, способных
к изменению собственной структуры и регулировке параметров
непосредственно в процессе работы, должна удовлетворять сле-
следующим основным принципам:
1) характерный масштаб времени структурной адаптации, пе-
периодически происходящей в системе, больше масштаба вре-
времени параметрической адаптации;
2) наличие или отсутствие структурной пластичности опре-
определяется способностью к добавлению новых и удалению
избыточных элементов;
3) структурные изменения определяются динамикой измене-
изменения параметров системы в процессе обучения или другими
внутрисистемными процессами, и, таким образом, измене-
изменение структуры определяется эндогенным поведением самой
системы и не зависит от внешних факторов;
4) структурные изменения носят коллективный характер и
основаны на простых эвристических принципах, таких как
помощь или компенсация слабейших элементов системы,
поддержание разнообразия, заполнение ниши или удаление
лишних элементов.
Для обоснования этих принципов в настоящей главе рассмат-
рассматриваются три практических примера систем, способных к из-
изменению параметров и структуры: нейросетевые классификато-
классификаторы, автономные агенты, адаптирующиеся в процессе обучения
с подкреплением, и регуляторы хаотических систем. Поскольку
каждое из этих приложений и их результаты уже описаны в соот-
соответствующих работах, мы остановимся кратко на характеристике
2.1. Введение 49
их соответствия перечисленным выше принципам, основанным
на представлении о функционировании биологических систем.
Детальное понимание приложений потребует чтения специаль-
специальной литературы. Несмотря на то, что для решения указанных
задач применяются разные методы, мы покажем общность неко-
некоторых принципов, на которые они опираются. Отсюда следует
вывод о потенциальной применимости рассматриваемого подхода
во многих областях приложений.
2.1.3. Краткий обзор трех прикладных областей. В п. 2.3
описан новый алгоритм самоструктурирования нейросетевых
классификаторов. Он имеет название EMANN (от англ. evolving
modular architecture for neural networks — выделение модульной
архитектуры для нейронных сетей) [32]. Данный алгоритм поз-
позволяет поддерживать структуру минимального размера и, следо-
следовательно, минимальное количество параметров (весовые коэффи-
коэффициенты синапсов) для совместного обучения с достаточным для
данной структуры количеством параметров. В алгоритме широко
используются внутренние локальные переменные и механизм их
модификации в процессе обучения для коррекции структуры.
В п. 2.4 будет рассмотрено применение одного из алгорит-
алгоритмов обучения с подкреплением, носящего название Q-обучение
Уоткинса [1, 2, 5, 34, 38, 39] в задачах поиска выхода из
лабиринтов [33]. Для иллюстрации механизма ускорения поиска
оптимальных стратегий с использованием двойной пластичности
метода усиленного обучения мы будем частично опираться на
работу [28]. Ускорение достигается за счет параллельного поис-
поиска минимальной структуры и нахождения на ней оптимального
решения, что приводит к снижению вычислительных затрат.
Кроме того, в соответствии с выводом, первоначально сформу-
сформулированным Холландом [21], наличие структурной пластичности
приводит к расширению границ адаптации системы, избавляя
ее от недостатков классических методов искусственного интел-
интеллекта. И хотя сочетание Q-обучения и структурной адаптации
также наделено свойством двойной пластичности, как и системы
классификаторов Холланда (алгоритм пожарной цепочки и ГА;
обсуждение такой эквивалентности см. в [8]), далее будут с лег-
легкостью показаны различия в их структурной пластичности.
За последние годы были разработаны методы управления
хаотическими системами в окрестности неустойчивых орбит,
вложенных в хаотические аттракторы. Такие методы содержат
линейное управление по типу обратной связи для малой окрест-
окрестности интересующей траектории. Вместе с моими коллегами
50 Гл. 2. Двойная пластичность иммунной сети
Антуаном Дюшато и Ником Брэдшоу из лаборатории IRIDIA, мы
разработали нелинейный локальный модельно-ориентированный
подход к управлению хаосом, который заключается в постепен-
постепенном введении новых локальных линейных операторов управле-
управления [14]. Два основных преимущества такого подхода по срав-
сравнению с исходным методом Отта, Гербоги и Йорке [29] состоят
в том, что сначала эффективно расширяется область управления
и таким образом снижается время, необходимое для стабилиза-
стабилизации хаотического режима. Метод контроля хаотического отоб-
отображения Хенона путем постепенного увеличения зоны действия
локально-линейного оператора управления будет кратко проил-
проиллюстрирован в п. 2.5.
2.2. Простейшая иммунная сеть и основные принципы
систем с двойной пластичностью
В 1974 году Ерне нашел интересный способ объяснения
механизмов поддержания памяти о взаимодействиях иммунной
системы с антигеном, которые приводят к увеличению эффек-
эффективности иммунной реакции при повторном контакте с тем же
антигеном [22] (рис. 2.1). Иммунная память может возникать
в иммунной сети, состоящей из элементов двух типов: антиген-
связывающих антител и анти-антител, взаимодействующих с ан-
антителами. Объяснение этого эффекта заключается в следующем.
Ш+ 1 Ш^ 2
ОБ
И анти-антитело
i=i низкая концентрация
iffifffi высокая концентрация
Рис. 2.1. Простейшая схема реализации иммунной памяти
При достаточной концентрации попавшего в организм антигена
формируется интервал аффинности антител, комплементарных
данному антигену и способных с ним взаимодействовать. Кон-
Концентрация таких антител увеличивается в результате размно-
размножения. Взаимодействия с антигеном приводят к уменьшению
концентрации антител и антигена. Если антиген-связывающих
антител становится достаточно много, то это приводит к акти-
2.2. Простейшая иммунная сеть 51
вации и размножению антител второго типа, называемых анти-
антиантителами, взаимодействующих с антителами как с антигеном,
на основе взаимной комплементарности. При этом часто «анти-
«антигенные детерминанты» антител называют внутренними образами
антигена. Интересно прежде всего то, что для объяснения явле-
явления иммунной памяти наличия антител этих двух типов и ме-
механизма их взаимной стимуляции оказывается достаточно. В ре-
результате взаимодействий в этой простейшей сети концентрация
антител первого типа, необходимых для подавления попавшего
в организм антигена, будет поддерживаться на определенном
среднем уровне, а формирование памяти является процессом
установления нового баланса в сети.
Впоследствии Варела, Стюарт и Коутиньо [35-37], Перель-
сон [30,31], Де Бур [10], Вейсбуш [40] и другие исследовате-
исследователи, сохранив представление об иммунной системе как о сети
взаимодействующих антител, внесли важный вклад в развитие
математических моделей и более глубокое понимание функцио-
функциональных особенностей иммунных сетей. Обзор этих работ занял
бы слишком много места и увел бы нас в сторону от основ-
основной задачи этой главы. Отметим только, что в них разделяется
точка зрения Ерне, согласно которой существование иммунной
сети объясняет коллективные эффекты и новые функциональ-
функциональные возможности иммунной системы. Из краткого рассмотрения
в предыдущем параграфе следует, что память является резуль-
результатом функционирования сети как единого целого (хотя и огра-
ограниченного взаимодействиями элементов двух типов). Некоторые
исследователи убеждены, что функционирование иммунной сети
должно обеспечивать поддержание определенного уровня связно-
связности или жизнеспособности — разновидности гомеостаза, предо-
предохраняющего сеть от коллапса и неконтролируемого размножения
клонов несмотря на взаимодействия с внешними и собственными
антигенами. Эти взаимодействия должны направлять иммунную
сеть по пути гармоничного развития и не приводить к потере
устойчивости. Каковы бы ни были реальные механизмы само-
самоподдержания иммунной сети, приведенный выше простой пример
хорошо иллюстрирует основные принципы, которым, по всей
видимости, должны удовлетворять адаптивные распределенные
системы, наделенные свойством двойной пластичности.
• Структурные изменения (т. е. приток новых антител в си-
систему) происходят реже, чем параметрические изменения
(изменение концентрации антител).
52 Гл. 2. Двойная пластичность иммунной сети
• Структурные изменения зависят от временной эволюции
параметров системы. Приток антител второго типа проис-
происходит лишь после того, как концентрация антител первого
типа достигнет определенного уровня.
• Характер структурных изменений определяется сетевы-
сетевыми взаимодействиями, а не только внешними контактами.
В приведенном примере приток антител второго типа опре-
определяется антителами первого типа, а не внешними антиге-
антигенами (хотя они и являются начальным элементом цепочки
взаимодействий). В случае сетей с большим количеством
типов взаимодействий для увеличения концентрации анти-
антител следующего типа требуется их высокая чувствитель-
чувствительность ко всем элементам сети (примеры моделирования
таких сетей имеются в [6, 10, 12]).
• Вновь добавляемые элементы комплементарны, а не по-
подобны уже имеющимся элементам. В этом состоит важное
отличие иммунных сетей от генетических алгоритмов.
Приведенный пример, независимо от степени его биологической
адекватности, достаточно хорошо иллюстрирует свойства адап-
адаптивных систем с двойной пластичностью, где, в отличие от
экосистем, за достижение полезного результата отвечает коллек-
коллективное поведение системы, а не ее взаимодействие с внешней
средой.
2.3. Двойная пластичность
нейросетевых классификаторов
Мы разработали новый алгоритм под названием EMANN для
самоструктурирования нейросетевых классификаторов и пред-
представили его в [32]. Аналогичный подход был представлен в [11].
В этом параграфе мы коротко опишем ключевые механизмы
реализации алгоритма, отражающие принципы, описанные
в предыдущем параграфе (более подробное описание и резуль-
результаты экспериментов можно найти в исходной работе). Проблема
классификации может рассматриваться здесь как задача адапта-
адаптации в оперативном режиме, поскольку наш алгоритм одновре-
одновременно строит и обучает сеть, а обучающие элементы постоянно
доступны. Основная идея алгоритма заключается в широком ис-
использовании временной эволюции параметров системы в процес-
процессе обучения, а не в изменении структуры системы. Мы полагаем,
что такая альтернатива улучшения точности классификатора
с одновременным поддержанием минимальной архитектуры
2.3. Двойная пластичность нейросетевых классификаторов
53
нейронной сети может иметь преимущество. Скорее всего, для
повышения качества работы системы необходимо, прежде всего,
отслеживать ее внутренние параметры (например весовые коэф-
коэффициенты синапсов), а не внешние (например функцию ошибки
[22, 11]).
По аналогии с работами [11, 20], сеть строится добавлением
и/или изъятием нейронов без изменения остальной структуры
(например весовых коэффициентов). Таким образом, любое из-
изменение структуры не требует переобучения сети). Это может
увеличить скорость работы алгоритма. В отличие от этого, при-
применение генетических алгоритмов в задачах структурной опти-
оптимизации требует повторной инициализации и переобучения сети
с появлением каждой новой структуры (см., например, [27]).
При поэтапном подходе, реализованном в алгоритме EMANN,
начальная структура слишком мала и необходимо введение но-
новых нейронов. Мы считаем, что это позволяет лучше сохранять
существенные обобщающие возможности сети. Кроме того, веро-
вероятно, это дает возможность избегать локальных минимумов: при
добавлении новых нейронов увеличивается размерность весового
пространства, что позволяет легко обходить локальные мини-
минимумы. Помимо поэтапного добавления нейронов и усложнения
структуры сети, периодически проводится удаление некоторых
(неустановившихся) нейронов.
Как и в методе каскадных корреляций Фальмана [15], вво-
вводится дополнительная операция расширения сети, так как архи-
архитектура получаемой нейронной сети представляет собой иерархию
модулей (см. рис. 2.2). Однако, в отличие от метода Фальмана,
каждый модуль представляет собой классическую сеть с одним
выход модуля 2 =
= выход сети
\ добавление нового
верхнего модуля
модуль 1 ^
1\
<Э О О О^
•- выход модуля 1
привлечение нового нейрона
из скрытого уровня
входы сети
Рис. 2.2. Общий вид двухмодульной архитектуры EMANN
54 Гл. 2. Двойная пластичность иммунной сети
скрытым уровнем (с количеством нейронов, зависящим от преды-
предыдущей операции расширения сети). Входы задачи соединены со
входами всех вышележащих модулей. Это позволяет избежать
тотальной зависимости новых модулей от тех модулей, которые
некорректно обрабатывают входную информацию. Далее, выходы
модулей соединены со входами всех вышележащих модулей,
поэтому получаемое в результате решение задачи соответствует
выходам верхнего модуля. В результате обучения каждый вновь
добавляемый модуль должен хорошо дополнять уже существую-
существующие и извлекать ценную информацию из модулей более низкого
уровня.
Для выбора весов синапсов, т. е. параметрической пластич-
пластичности, в алгоритме EMANN используется эвристическая моди-
модификация метода обратного распространения ошибки, называемая
«extended delta-bar-delta», описанная в [17]. В ходе обучения
с использованием данного алгоритма проводится подгонка па-
параметров шага и импульса. Каждая связь имеет собственные
параметры обучения. Перед началом обучения их ручная подгон-
подгонка не требуется. Ключевой локальной переменной, используемой
в процессе адаптации сети, является весовой параметр нейрона
(ВПН), определяемый как среднее значение весов для данного
нейрона. Пусть п — суммарное количество всех связей нейрона,
a Wi — значение веса г-й связи. Тогда
впн =
Полезный вклад нейрона в процесс классификации характе-
характеризуется близкими к единице значениями сигмоидальной акти-
вационной функции, которая достигает своего максимума при
больших входных значениях. Мы определяем стабильный ней-
нейрон как такой нейрон, ВПН которого превышает некоторое по-
пороговое значение. Стабильный нейрон резко ограничивает свое
пространство входов. Результаты экспериментов показывают, что
для решения задачи классификации такие нейроны наиболее
полезны, а соответствующая им гиперплоскость, по-видимому,
устойчива.
Если все нейроны данного модуля становятся стабильными,
то соответствующие гиперплоскости будут почти неподвижными.
Такой модуль больше не может совершенствоваться. Поэтому
алгоритм EMANN стремится поддерживать в модуле некоторое
количество нестабильных нейронов. Нейрон с низким значением
ВПН выдает одинаковое значение на выходе, равное ±0,5, для
2.3. Двойная пластичность нейросетевых классификаторов 55
большого количества сочетаний весовых коэффициентов синап-
синапсов, а положение связанных с ними гиперплоскостей постоянно
изменяется. Определим бесполезный нейрон как нейрон, ВПН
которого меньше некоторого значения, называемого порогом по-
полезности. Таким образом, влияние ВПН определяется двумя
величинами: порогом полезности и порогом стабилизации. Про-
Проведенные эксперименты с модулями нейронных сетей с одним
скрытым уровнем убедили нас в возможности удаления бесполез-
бесполезных нейронов при сохранении основных особенностей поведения
модулей. Удаление нейронов осуществляется перед добавлением
нового верхнего модуля.
Оказалось, что при добавлении нового нейрона в скрытый
уровень модуля имеет смысл задавать его весовые коэффициенты
не случайно, а выбирать их по принципу комплементарности
остальным нейронам данного модуля. Для содействия другим
нейронам, имеющим низкие значения ВПН, новые нейроны ини-
инициализируются таким способом, что их выходы максимально
отличаются от выходов таких нейронов. Это достигается за счет
снабжения нового нейрона комбинацией весовых коэффициентов
синапсов, имеющей максимальное количество инверсий знаков.
Однако если такая комбинация для некоторого нейрона из дан-
данного модуля уже существует, то выбирается другая комбинация,
снова близкая к полученной, но не совпадающая с остальными.
Алгоритм EMANN начинает работу, имея минимальную
структуру с одним нейроном в скрытом слое. Количество ней-
нейронов на входном и выходном уровнях определяется из условия
задачи. Эволюция каждого модуля включает четыре этапа: подъ-
подъем, улучшение, сокращение и восстановление.
Этап подъема заключается в периодическом добавлении ней-
нейрона при некотором пороговом значении константы подъема (этот
параметр устанавливается заранее). Данный этап завершается,
как только один из нейронов становится стабильным, но при
этом хотя бы один вес связей между входами сети и текущим
модулем превышает порог стабилизации. Это гарантирует, что
хотя бы один из новых нейронов реально участвует в решении
задачи, а не просто копирует результаты, выдаваемые модулями
более низкого уровня (эта проблема обсуждается ниже).
На этапе улучшения при каждом новом появлении стабиль-
стабильного нейрона добавляется новый нейрон. После стабилизации
нейрона модуль пытается найти решение задачи. По мере уве-
увеличения количества стабильных нейронов решение улучшается.
Фаза улучшения прекращается, если ни один из нейронов не
56 Гл. 2. Двойная пластичность иммунной сети
стабилизировался за время, называемое параметром терпения
(еще один параметр алгоритма).
Этап сокращения состоит в удалении всех нейронов, значение
ВПН которых меньше порога полезности.
И наконец, на этапе восстановления запускается алгоритм
обучения модуля для небольшого количества периодов для вос-
восстановления ранее достигнутой на обучающей последовательно-
последовательности точности решения задачи, несколько сниженной на этапе
сокращения сети.
После завершения описанных этапов структура модуля фик-
фиксируется, и алгоритм EMANN переходит к построению нового
модуля более высокого уровня, но при условии, если добавление
рассмотренного модуля достаточно сильно улучшило решение
задачи. Наблюдения за фазой улучшения показали, что числен-
численность нестабильных нейронов, которая поддерживается на посто-
постоянном уровне и пропорциональна количеству периодов подъема,
необходимых для стабилизации первого нейрона, служит на-
надежной характеристикой трудности задачи. Высокая численность
нестабильных нейронов указывает на необходимость увеличе-
увеличения разнообразия нейронов для решения задачи. Естественный
механизм регуляции состоит в повышении численности таких
клеток с увеличением сложности задачи, что помогает алгоритму
обучения найти решение задачи.
Одна из основных трудностей реализации алгоритма EMANN
заключается в проблеме копирования. При добавлении нового
модуля появляется тенденция к увеличению количества выходов
низлежащего модуля. Это приводит к стабилизации нейронов,
выполняющих единственную функцию — копирование. Чтобы
избежать этого, на этапе подъема алгоритм ожидает появления
достаточно сильной связи нейрона с одним из входов задачи,
после чего переходит к фазе улучшения. Это дополнительное
требование обеспечивает завершение фазы подъема нахождени-
нахождением нового способа решения поставленной задачи новым модулем.
Величина порога подъема для модулей более высокого уровня
выше, чем у модуля первого уровня. Алгоритм EMANN прекра-
прекращает процесс построения сети (т.е. добавления новых модулей),
если обучение последнего модуля не приводит к существенному
повышению точности решения на обучающей последовательности.
Мы проверили эффективность работы алгоритма EMANN
на эталонных задачах классификации. Результаты оказались до-
достаточно обнадеживающими и придали нам уверенности в том,
что в алгоритмах самоструктуризации нейронных сетей должно
уделяться больше внимания локальным внутренним парамет-
2.4. Двойная пластичность обучения автономных агентов 57
рам за счет глобальных внешних переменных. Такие алгорит-
алгоритмы должны быть способны к интроспективной оценке поведе-
поведения и, при необходимости, к должному изменению архитектуры
сети.
2.4. Двойная пластичность обучения
автономных агентов методом подкрепления
Процесс обучения с подкреплением обычно применяется в та-
таких задачах, где агент, действующий в определенной среде,
стремится максимизировать суммарный результат, имея слабо
информативные ответные реакции со стороны внешней среды.
Все остальные возможности исследования или использования
проблемного пространства отсутствуют, поэтому обучающийся
агент может полагаться лишь на метод проб и ошибок.
Для решения проблемы обучения с подкреплением были
независимо предложены два основных подхода: Q-обучение [1,2,
4, 7, 13, 24, 34, 38, 39] и системы классификаторов (СК) [8, 13,
19, 21]. Было установлено, что эти подходы имеют много об-
общего [13]. Процесс Q-обучения приводит к селекции необходи-
необходимого действия для каждого состояния внешней среды, так что
в результате обучения выбранная стратегия поведения максими-
максимизирует функцию полезности, вычисленную для каждого цикла
обучения.
Встроенная в рекурсивную схему алгоритма оценка действия
для каждого конкретного состояния зависит только от немедлен-
немедленного ответа среды, происходящего одновременно с такой оцен-
оценкой, но вычисляемого в следующем состоянии. Так как метод
Q-обучения относится к слабым методам обучения, он очень мед-
медленный и экспоненциально зависит от размерности проблемного
пространства.
Были предложены и с различной степенью успеха прове-
проверены способы ускорения работы алгоритма на основе струк-
структурной генерализации [26], иерархической декомпозиции зада-
задачи и последовательного увеличения размерности проблемного
пространства. Ускорение сходимости алгоритма для проблемного
пространства большого размера остается одной из главных задач
большинства исследований, проводимых в этой области.
Предположим, что сначала проблемное пространство пред-
представляет собой множество, состоящее из N клеток, и в каждой
клетке необходимо выбрать некоторое действие из общего их
58
Гл. 2. Двойная пластичность иммунной сети
числа К (рис. 2.3). Классический алгоритм Q-обучения можно
представить следующим образом.
разбиение
области
замена неудачного действия
на противоположное
+
J
Рис. 2.3. Два типа структурной пластичности Q-обучения: разбиение обла-
области {б) и замена «неудачного» действия на противоположное (в)
Определим качество Q-значения действия j в клетке х. Вы-
Выбор действия в клетке QJX обычно основан на распределении
Больцмана Q-значений с выбором на вероятностной основе наи-
наибольших Q-значений. Вначале равное нулю, Q-значение дей-
действия j, переводящее агент из клетки х в х + 1, изменяется
согласно формуле
AQl = a(rt + 7 тахдгж+1 - QJ),
г
где rt — немедленный ответ среды в ответ на действие j, a —
скорость обучения @ < а < 1), а 7 ~~ дисконтирующий мно-
множитель @ < 7 < 1)' экспоненциально подавляющий поощрения
в итоговой функции стоимости
к=0
для минимизации количества итераций для поощрений и макси-
максимизации — для штрафов или просто для ограничения величины
стоимости.
Первоначально предложенный Уоткинсом, алгоритм много-
многократно применялся и исследовался как с практической, так и
с теоретической точки зрения [1,2, 34, 38, 39]. Алгоритм Q-обу-
Q-обучения обеспечивает параметрическую пластичность структуры.
2.4. Двойная пластичность обучения автономных агентов 59
В результате сходимости в каждой клетке всегда выбирается
наилучшее действие (локальный эффект которого состоит в мак-
максимизации функции стоимости Е).
Сложность алгоритма Q-обучения экспоненциально зависит
от количества клеток N и действий К. Поэтому любой способ
поддержания небольшого количества клеток или действий по-
потенциально приводит к значительной экономии вычислительных
затрат. Фактически, представленные далее способы реализации
структурной пластичности состоят в попытке минимизации ко-
количества сегментов N или действий К. Для практической ре-
реализации методы обучения с подкреплением требуют наличия
эффективных способов разбиения пространства состояний и вы-
выбора действий. Эта тема являлась предметом исследования как
у специалистов по системам классификаторов, так и по алгорит-
алгоритмам Q-обучения.
В системах классификаторов обобщение получается в резуль-
результате использования оператора безразличного состояния # (don't
care operator). Описатель классификатора, занятый оператором
безразличного состояния, рассматривается как нерелевантный,
и таким образом с его помощью происходит обобщение экви-
эквивалентных пар состояние-действие. Однако остается открытой
проблема построения набора правил, эффективно использующих
такие возможности обобщения.
Кроме того, СК по своей сути являются дискретными систе-
системами, что затрудняет построение таких вариантов обобщений,
в которых близкие входные значения давали бы близкие значе-
значения на выходе. Этого проще добиться, воспользовавшись систе-
системами Q-обучения, снабженными нейронными сетями, например
системой Лина [24].
Рассматривая алгоритмы обучения с подкреплением, способ-
способные к адаптации структуры проблемного пространства, мы име-
имеем два традиционных противоположных подхода: снизу-вверх и
сверху-вниз. В первом случае проблемное пространство изна-
изначально имеет сложную структуру, конечная же структура полу-
получается путем объединения отдельных областей по признаку их
подобия [26]. Во втором случае начальное пространство задачи
однородно и постепенно разбивается на подобласти. Так как
методы «сверху-вниз» дают пошаговое увеличение структуры, то
это лучше соответствует принципам структурной пластичности.
Биологическая ориентированность Холланда (экосистемы и
генетические механизмы наследования) привела его к рассмотре-
рассмотрению структурной пластичности с использованием генетических
алгоритмов. В системах классификаторов ГА отвечают за два ти-
60 Гл. 2. Двойная пластичность иммунной сети
па структурных изменений, в зависимости от того, применяются
ли они к изменению способа кодирования пространства состояний
или изменению множества действий. Эти типы изменений также
изучались и специалистами по Q-обучению, но с более при-
привлекательной «собирательной и компенсаторной» точки зрения,
которая была рассмотрена выше. Имея в виду экспоненциальную
зависимость времени поиска от размерности пространства состо-
состояний и действий, Мюнос, Патинель и Гойо [28] предложили ин-
интересный метод последовательного разбиения области, при кото-
котором алгоритм Q-обучения находит удовлетворительное решение
в пространстве наименьшей возможной размерности.
В общих чертах, предложенный ими алгоритм выглядит сле-
следующим образом. Решение задачи начинается с набора крупных
областей, т. е. малого числа клеток. Затем клетки (области) пе-
периодически делятся, если подкрепление, полученное в результате
действия в данной клетке, испытывает большие колебания, что
свидетельствует о неадекватности данного действия для всей
клетки как единого целого (рис. 2.3 6). В этом случае необходимо
разбиение клетки на подобласти с заданием в них различных
действий.
Таким образом, если обновленные Q-значения испытывают
значительные изменения, то это указывает на неоднородность
клетки и необходимость ее деления с целью получения двух
однородных клеток из одной неоднородной.
Для того же самого типа приложений и несмотря на прояв-
проявленный интерес к обучению с подкреплением в области сложных
распределенных адаптивных систем (Q-обучение по своей сути
очень близко к параметрической пластичности систем класси-
классификаторов, например алгоритму пожарной цепочки), такой тип
структурной пластичности представляется совершенно не соот-
соответствующим роли, выполняемой генетическими алгоритмами
в системах классификаторов. Он сосредотачивается на неудо-
неудовлетворительной части системы и пытается ее улучшить путем
структурных дополнений. Так как количество составных частей
системы необходимо поддерживать на минимальном уровне, был
предложен механизм перегруппирования похожих и исключения
лишних областей: подобласть сохраняется до тех пор, пока не
найдется область с более высоким Q-значением. Алгоритм при-
применялся для решения лабиринтных задач с весьма обнадежива-
обнадеживающими результатами. Мы снова обнаруживаем здесь описанные
выше основные принципы.
• В процессе временной эволюции Q-обучения структурные
изменения происходят с меньшей частотой.
2.5. Двойная пластичность для управления хаосом 61
• Структурным изменениям методом разбиения подвергаются
именно «слабейшие» элементы, т. е. дающие осциллирую-
осциллирующие Q-значения.
• Избыточные разбиения устраняются.
В отношении функциональной части системы, была предло-
предложена другая стратегия ускорения поиска решения (рис. 2.3 в),
для которой изменения структурного и параметрического ти-
типов снова происходят в разных временных масштабах [3-5, 7].
В этом случае структура области задается с самого начала и
не изменяется. Новой целью является выбор наилучшего дей-
действия в каждой клетке из некоторого множества, количество
элементов в котором должно поддерживаться на низком уровне.
Сначала алгоритм Q-обучения пытается выбрать в каждой клетке
наилучшее действие из предварительного набора (одинакового
для каждого состояния). Это повторяется для некоторого числа
итераций Q-обучения. Затем, в ожидании сходимости процесса,
добавляются новые действия в клетки, имеющие действия с бо-
более низкими Q-значениями, по сравнению с другими действиями
в той же самой или соседних клетках. Новые действия выби-
выбираются как противоположные «неудачным» действиям, которые
они заменяют (например, «двигаться влево» вместо «двигаться
вправо» или отрицательное значение вместо положительного),
при условии, что они дают Q-значение наилучшего действия,
уже имеющегося в клетке (новые действия сразу же проходят
проверку). Затем снова проводится цикл Q-обучения на новом
наборе действий, общее количество которых в итоге не меняется.
Такое чередование процесса Q-обучения и замены действий вы-
выполняется до получения удовлетворительного решения. В [4, 5]
показан способ корректной реализации алгоритма управления
перевернутым маятником в результате смены нескольких поко-
поколений новых действий. В этом примере мы вновь видим вы-
выполнение тех же принципов: медленные структурные изменения,
зависящие от параметрической подгонки, внимание к слабейшим
элементам системы, изъятие «неудачных» элементов и замена их
на противоположные.
2.5. Двойная пластичность для управления хаосом
В работе [29] Отт, Гербоги и Йорке предложили метод управ-
управления хаотическими системами вблизи неустойчивых неподвиж-
неподвижных точек, вложенных в аттрактор системы (пригодный, в прин-
принципе, и для периодических решений с большим периодом). Метод
опирается на локально линейную модель системы, которая
62 Гл. 2. Двойная пластичность иммунной сети
получается на основе теоретических выкладок или эмпирически,
с последующим применением стандартных методов оптимального
управления для стабилизации движения вблизи неподвижных
точек. Новизна заключается в том, что в окрестности неустойчи-
неустойчивой неподвижной точки для получения нужного результата до-
достаточно использовать управляющие воздействия ограниченной
амплитуды. Область управления зависит как от допустимых зна-
значений управляющих параметров, так и от точности используемой
модели. Так как законы управления действуют лишь в малой
окрестности неподвижной точки, данный подход полагается на
динамику нерегулируемой системы, траектория которой прохо-
проходит в малой окрестности неподвижной точки. Как правило, это
действительно имеет место, поскольку неустойчивая неподвиж-
неподвижная точка аттрактора обычно плотно окружена другими точками
траекторий движения.
Для минимизации времени начального блуждания траекторий
решения вокруг аттрактора желательно максимально расширить
область определения оператора управления. Задача проводимой
мной в настоящее время совместной работы [14] заключается
в увеличении суммарного размера управляемых областей
аттрактора. Мы называем их областями эффективного контроля
(ОЭК). Постепенно вводя новые ОЭК, мы пытаемся максимально
расширить управляемую область. Для этого необходимо по-
построить оператор управления, удовлетворяющий двум основным
требованиям.
Во-первых, он должен быть глобально нелинейным, так как
исходная система существенно нелинейна и ее линеаризованный
вид для окрестности неподвижной точки не будет сохраняться
для других точек пространства состояний. Во-вторых, поскольку,
по условию, амплитуда управляющего воздействия жестко огра-
ограничена, поиск должен осуществляться таким способом, чтобы
на любом временном шаге искомый оператор обеспечивал пере-
переход системы в нужное состояние под действием малых возму-
возмущений.
ОЭК размещаются последовательно вдоль неконтролируемой
сходящейся траектории (структурная пластичность), а линейный
оператор управления в каждой ОЭК должен научиться вести
хаотический процесс вдоль этой траектории (параметрическая
пластичность). Область определения каждого последующего опе-
оператора управления служит мишенью действия предыдущего, так
чтобы любое малое отклонение системы от неконтролируемой
траектории компенсировалось управляющим воздействием, ам-
амплитуда которого не превышает некоторого значения. Центр пер-
2.5. Двойная пластичность для управления хаосом
63
вой области эффективного управления находится в неподвиж-
неподвижной точке (которую мы считаем известной). Эту область можно
рассматривать как базисную зону управления, поскольку без
нее управление процессом невозможно. Стратегия управления,
аналогичная используемой в [29], состоит в обучении удержанию
траектории движения системы внутри ОЭК. Новизна заключает-
заключается в последовательном введении новых операторов управления.
Структурные изменения остаются при этом эндогенными, так
как новые операторы вводятся на естественных траекториях дви-
движения хаотической системы.
Если система провела некоторое заранее заданное количество
времени в зоне эффективного контроля (в ходе вычислительных
экспериментов использовалось значение, равное 200), то можно
сказать, что процесс сошелся и обучение прошло успешно. За-
Затем мы начинаем добавлять новые ОЭК. Для этого необходимо
дождаться случайного попадания в нашу область другой траек-
траектории движения, после чего мы определяем последовательность
ОЭК с центрами в точках траектории движения, находящихся
вне первой ОЭК. Области эффективного контроля нумеруют-
нумеруются в восходящем порядке, так что система, состояние которой
является центром некоторой ОЭК, к новому моменту времени
перейдет в ОЭК со следующим номером.
2,0
1,0
-1,0
-2,0
-2,0 -1,0
1,0 2,0
Рис. 2.4. Сеть, состоящая из пяти ОЭК, для стабилизации хаотического отоб-
отображения Хенона в его неподвижной точке (центр ОЭК-1). При нахождении
траектории, сходящейся к неподвижной точке, центры новых ОЭК располага-
располагаются в точках траектории, лежащих вне ОЭК-1
На рис. 2.4 показана последовательность ОЭК, отвечающих
за стабилизацию хаотического отображения Хенона в окрестно-
окрестности неподвижной точки.
64 Гл. 2. Двойная пластичность иммунной сети
После структурных изменений, состоящих в добавлении но-
новых ОЭК, в каждой из них происходит настройка параметров, ко-
когда каждый локальный оператор управления учится переводить
систему в центр следующей ОЭК. После ряда этапов параметри-
параметрического обучения, с целью постепенного накрытия пространства
состояний можно снова вводить новые ОЭК на эксперименталь-
экспериментальных траекториях движения. В результате сеть ОЭК постепен-
постепенно эволюционирует. Связность областей эффективного контроля
обеспечивается за счет требования перевода состояния системы
в соседнюю ОЭК. Полученная схема напоминает сеть антител,
встроенную в пространство соматических взаимодействий и ре-
реакций на антиген.
2.6. Выводы
Мы рассмотрели три области приложений, в которых система
двойной адаптации, реализованная по аналогии с механизмами
двойной пластичности иммунных сетей, позволяет быстро нахо-
находить удовлетворительное решение с использованием параметри-
параметрической и структурной адаптации и с сохранением минимальной
структуры. Во всех случаях двойная пластичность обеспечива-
обеспечивалась с соблюдением принципов, присущих биологическим си-
системам: на этапе эксплуатации системы структурные изменения
происходили с меньшей частотой, и в зависимости от парамет-
параметрических изменений структурные изменения направлялись на
компенсацию более слабых звеньев системы, поддержание раз-
разнообразия или заполнение незанятых областей, а также на со-
сохранение минимальной структуры. Было отмечено отличие этих
принципов от традиционно применяемых генетических алгорит-
алгоритмов с системами классификаторов.
Мы показали возможность использования новых принципов
в трех областях приложений. В роли структурных изменений
выступали: введение новых и изъятие уже существующих нейро-
нейронов из нейросетевого классификатора, разбиение или укрупнение
подобластей проблемного пространства в ходе обучения авто-
автономного агента методом подкрепления, а также добавление ли-
линейных адаптивных операторов для управления хаосом на всем
пространстве состояний. Мы полагаем, что многие инженерные
системы, производительность которых существенно зависит от
структуры и значений настраиваемых параметров, можно улуч-
улучшить, если осуществить указанные принципы.
Переход к планированию сложных систем, обладающих зна-
значительной автономией и предназначенных для взаимодействия
Список литературы 65
с реальной, не поддающейся моделированию и точному прогнозу
средой, закономерно потребует замены критериев оптимизации
«удовлетворяющими» критериями, точных целей — жизнеспособ-
жизнеспособными целями, а процесса обучения — слабо контролируемым
руководством.
Это будет означать фактический переход к системам, обла-
обладающим высокой пластичностью как на параметрическом, так
и на структурном уровне, способным к существенной внутрен-
внутренней ненаправленной реорганизации. Подобно внешней среде, эти
системы будут иметь потенциальную независимость от проекти-
проектировщика, медленно реализуемую в ходе взаимодействий с внеш-
внешней средой, и не предопределенную заранее индивидуальность,
постоянно пребывающую в процессе становления. Чем сложнее,
труднее для моделирования и изменчивее будут задача класси-
классификации, среда автономных агентов или динамическая система,
тем естественнее инженерные приложения станут усваивать об-
обсуждаемые в этой главе биологически ориентированные алгорит-
алгоритмические принципы.
Список литературы
1. Barto A. Connectionist learning for control // Neural networks for
control (Eds. T. Miller III, R. Sutton, P. Werbos). MIT Press, 1990.
P. 5-58.
2. Barto A, Singh S.P. Reinforcement learning and dynamic program-
programming // Proc. 6th Yale Workshop on Adaptive and Learning Systems
(Ed. K.S.Narendra). New Haven, 1990.
3. Bersini H., Varela F. Hints for adaptive problem solving gleaned from
immune networks // Proc. 1st Conf. on Parallel Problem Solving from
Nature (Eds. H.-P. Schwefel, R. Manner). Springer-Verlag, 1990.
P. 343-354.
4. Bersini H. Immune network and adaptive control. Toward a prac-
practice of autonomous systems // Proc. 1st ECAL (Eds. F. Varela,
P.Bourgine). MIT Press, 1993. P. 217-225.
5. Bersini H. Reinforcement and recruitment learning for adaptive pro-
process control // Proc. 1992 IFAC/IFIP/IMACS on Artificial Intelli-
Intelligence in Real Time Control. 1992a. P. 331-337.
6. Bersini H. The interplay between the dynamics and the metadynamics
of the immune network // Presented in the 3rd Conference on
Artificial Life, Santa Fe, 15-19 June. 1992b.
7. Bersini H., Varela F. The immune learning mechanisms: Recruitment
reinforcement and their applications // Computing with biological
metaphors (Ed. R. Patton). L.: Chapman and Hall, 1994.
3 Д. Дасгупта
66 Гл. 2. Двойная пластичность иммунной сети
8. Booker L.B, Goldberg D.E., Holland I.E. Classifier systems and
genetic algorithms // Artificial Intelligence 40. Elsevier, 1989.
P. 235-282.
9. Dasgupta D., Attoh-Okine N. Immunity-based systems: A survey //
Presented at the ICMAS workshop on Immunity-Based Systems,
Japan, December, 1996.
10. De Boer R.J., Perelson A. Size and connectivity as emergent proper-
properties of a developing immune network // J. Theor. Biol. 1991. V. 149.
P. 381-424.
11. Deffuant G. Reseaux connectionistes auto-construits. These D'Etat,
1992.
12. Detours V., Bersini Я., Stewart /., Varela F. Development of an
idiotypic network in shape space // J. Theor. Biol. 1994. V. 170.
P. 401-414.
13. Dorigo M., Bersini H. A comparative analysis of Q-learning and
classifier systems // Proc. SAB'94. MIT Press, 1994. P. 248-255.
14. Duchateau A., Bradshaw N., Bersini H. A multi-model solution for
the control of chaos // Int. J. Control. 1999. V. 72. P. 727-739.
15. Fahlman S., Lebiere С The cascade-correlation learning architec-
architecture // Advances in Neural Information Processing System, V. 2.
Morgan Kaufman, 1990. P. 524-532.
16. Farmer J.D. A rosetta stone to connectionism // Emergent computa-
computation (Ed. S.Forrest). MIT Press, 1991.
17. Fombellida M. Methodes heuristiques et methodes d'optimalisation
non contraintes pour l'apprentissage des perceptrons multicouches //
Proc. 5th Int. Conf. on Neural Networks and their Application:
Neuro-Nimes, 1992. P. 349-366.
18. Forrest S., Hofmeyr S.A., Somayaji A, Longstaff T.A. A sense of
self for unix processes // Proc. IEEE Symp. on Research in Security
and Privacy. Oakland, 1996.
19. Goldberg D.E. Genetic algorithms in search, optimization and ma-
machine learning // Addison-Wesley, 1989.
20. Hirose Y., Yamashita K., Hijiya S. Back-propagation algorithm which
varies the number of units // Neural Networks. 1991. V. 4. P. 61-66.
21. Holland J.H., Holyoak K.J., Nisbett R.E., Thagard P.R. Induction:
Processes of inference, learning and discovery. Cambridge: MIT
Press, 1986.
22. Jerne N.K. Towards a network theory of the immune system // Ann.
Immunol. (Inst. Pasteur). 1974. V. 125C. P. 435-441.
23. Kephart J.O. A biologically inspired immune system for computer //
Proc. Artificial Life. MIT Press, 1994.
24. Lin L.-J. Self-improving reactive agents based on reinforcement learn-
learning, planning and teaching // Machine Learning. 1992. V. 8, №3-4.
P. 293-322.
25. Lundkvist /., Coutinho A., Varela F., Holmberg D. Evidence for
a functional idiotypic network among natural antibodies in normal
mice // Proc. Natl. Acad. Sci. 1989. V. 86. P. 5074-5078.
Список литературы 67
26. Mahadevan S., Connel J. Automatic programming of behavior-based
robots using reinforcement learning // Artificial Intelligence 55, El-
sevier, 1993. P. 311-365.
27. Miller G., Todd P., Hedge S. Designing neural networks using
genetic algorithms // Proc. 3rd Int. Conf. on Genetic Algorithms,
1989. P. 379-384.
28. Munos R., Patinel J. and Goyeau P. Partitioned Q-learning. CEMA-
GREF Technical Report, Paris, France // Proc. of SAB'94 Conference.
MIT Press, 1994. P. 354-363.
29. Ott E., Gerbogi C, Yorke J.A. Controlling chaos // Phys. Review
Lett. 1990. V.64, № 1196. P. 292-295.
30. Perelson A.S. Towards a realistic model of the immune system. In:
Theoretical Immunology, V. 2 (Ed. A. S. Perelson). SFI Studies in the
Sciences of Complexity, V. 3. Reading, MA: Addison-Wesley, 1988.
P. 377-401.
31. Perelson A.S. Theoretical immunology // Lectures in Complex Sys-
Systems. SFI Studies in the Sciences of Complexity, V.2 (Ed. E.Jen).
Addison-Wesley, 1990. P. 465-500.
32. Salom Т., Bersini H. An algorithm for self-structuring neural net
classifiers // Proc. 2nd IEEE Conf. On Neural Network (ICNN'94),
1994. P. 1307-1312.
33. Sutton R.S. Reinforcement learning architectures for animats // Proc.
1st SAB Conference (Eds. J.-A. Meyer and S.W. Wilson). MIT Press,
1990. P. 288-296.
34. Tsitsiklis J.N. Asynchronous stochastic approximation and
Q-learning. Internal Report from Laboratory for Information and
Decision Systems and the Operations Research Center, MIT, 1993.
35. Varela F., Coutinho A, Dupire В., Vaz N. Cognitive networks:
Immune, neural and otherwise. In: Theoretical Immunology, V. 2 (Ed.
A. Perelson). SFI Series on the Science of Complexity. New Jersey:
Addison Wesley, 1988. P. 359-375.
36. Varela F., Sanchez V., Coutinho A. Adaptive strategies gleaned
from immune networks // Evolutionary and epigenetic order from
complex systems: A Waddington Memorial Volume (Eds. B. Goodwin,
P. Saunders). Edinburgh Univ. Press, 1989.
37. Varela F.J., Coutinho A. Second generation immune network //
Immunol. Today. 1991. V. 12, №5. P. 159-166.
38. Watkins C.J.C.H. Learning with delayed rewards. Ph.D. dissertation,
Psychology Department, University of Cambridge, England, 1989.
39. Watkins C.J.C.H., Day an P. Technical note: Q-learning // Machine
Learning. 1992. V. 8, №3-4. P. 279-292.
40. Weisbuch G., De Boer R.J., Perelson A.S. Localized memories in
idiotypic networks // J. Theor. Biol. 1990. V. 146. P. 483-499.
Д-р Уго Берсини защитил степени магистра A983) и доктора философии
в области технических наук A989) в Свободном университете Брюсселя,
где является сотрудником лаборатории IRIDIA по проблемам искусственного
интеллекта. В качестве доцента преподает теорию вычислительных машин и
3*
68 Гл. 2. Двойная пластичность иммунной сети
систем, а также теорию искусственного интеллекта. Участвует в нескольких
промышленных проектах, а также в проектах Европейской стратегической про-
программы исследования и развития информационных технологий (EEC ESPRIT)
с использованием адаптивных нечетких регуляторов и нейроконтроллеров. За
последние 10 лет опубликовал около 80 работ в областях когнитологии, приме-
применения искусственного интеллекта для управления промышленными процесса-
процессами, коннективизма, нечеткого управления и алгоритмов «ленивого обучения»
для моделирования и контроля. Основное внимание в них уделяется проблемам
обучения с подкреплением, биологических сетей, использования нейронных
сетей в медицинских приложениях, нарушений в сложных системах, хаоса и
образования понятий. Д-р Берсини — автор ряда обзорных статей по примене-
применению нейронных и нечетких систем, а также по изучению поведения сложных
систем. Был одним из организаторов проведенной в Свободном университете
Брюсселя Второй конференции по биологически мотивированным параллель-
параллельным методам решения сложных задач (PPSN) и Второй европейской конфе-
конференции по проблемам искусственной жизни (ECAL). Участвовал в организации
трех европейских семинаров по обучению с подкреплением (EWRL'95, 96, 97),
а также Первого международного конкурса алгоритмов эволюционной оптими-
оптимизации AСЕ0'9б). Является координатором европейского проекта FAMIMO LTR
по нечеткому управлению процессами с большим числом входов и выходов.
Часть II
ИСКУССТВЕННЫЕ ИММУННЫЕ
СИСТЕМЫ: МОДЕЛИРОВАНИЕ И
ЭКСПЕРИМЕНТ
Глава 3
ЦЕНТРАЛЬНАЯ И ПЕРИФЕРИЧЕСКАЯ
ИММУННЫЕ СИСТЕМЫ
Джон Стюарт, Йорг Карнейро
В этой главе обсуждается гипотеза, согласно которой иммунная система
организма представлена двумя подсистемами: центральной (ЦИС) и перифери-
периферической (ПИС) иммунными системами. ПИС состоит из разобщенных (не вза-
взаимодействующих между собой) клонов лимфоцитов, пребывающих в покое до
момента их специфической активации антигеном, которая приводит к иммун-
иммунному ответу классического типа. ЦИС представляет собой сеть клонов, обла-
обладающих автономной активностью и интегрирующих внешние антигены в свою
регуляторную динамику. Можно считать, что в функциональном отношении
ПИС отвечает за реакции на внешние антигены, а ЦИС взаимодействует с
собственными антигенами организма. Приводится систематический обзор се-
сетевых моделей второго поколения (СМВП). Сформулирован вывод, что они не
дают удовлетворительного описания различий между ЦИС и ПИС. Учесть как
структурные, так и функциональные различия ЦИС и ПИС, а также объяснить
механизмы формирования этих различий на основе явления самоорганизации
способна сетевая модель третьего поколения (СМТП), учитывающая процессы
кооперации В- и Т-лимфоцитов. В заключение сформулирован вывод, что
трудность экспериментальной проверки теоретических результатов является
общим характерным признаком сетевых моделей и возможной причиной того
скепсиса, с которым сообщество иммунологов в настоящее время относится
к теории иммунных сетей.
3.1. Введение
Цель этой главы состоит в обсуждении гипотезы, впервые
предложенной Коутиньо и др. (Huetz et ai, 1988; Coutinho,
1989), согласно которой иммунная система состоит из двух раз-
70 Гл. 3. Центральная и периферическая иммунные системы
личных блоков: центральной (ЦИС) и периферической (ПИС)
иммунных систем. ПИС состоит из не взаимодействующих меж-
между собой клонов лимфоцитов, остающихся в состоянии покоя до
момента их стимуляции специфическим антигеном, в результате
чего происходит иммунный ответ классического типа, приво-
приводящий к элиминации антигена. ЦИС представляет собой сеть
клонов, взаимодействующих между собой на основе идиотипи-
ческих регуляций и, следовательно, проявляющих автономную
активность даже при отсутствии внешней антигенной стиму-
стимуляции. ЦИС способна реагировать на внешние антигены, но
это чаще всего не приводит к выраженному иммунному отве-
ответу, поскольку ЦИС интегрирует антиген в свою регуляторную
динамику. В функциональном отношении разумно считать, что
ПИС отвечает за реакции на внешние антигены, а ЦИС — на
собственные антигены организма.
Вопрос, который мы хотим обсудить, связан с изучением
механизмов формирования ЦИС и ПИС, а также с определением
различий между ними. В ходе обсуждения мы будем опираться
на предположение, которое уместно привести в явном виде, а
именно, что каждый из имеющихся клонов лимфоцитов в любой
момент времени относится либо к ЦИС, либо к ПИС (эти воз-
возможности взаимоисключающие).
Таким образом, рассматриваемые наборы клонов не пересека-
пересекаются и в совокупности составляют все множество лимфоцитов
иммунной системы (ее репертуар).
С этих позиций рассмотрим некоторые модели иммунной
системы и охарактеризуем возникающее в их рамках соотноше-
соотношение между ЦИС и ПИС. Вероятно, наиболее привлекательное
следствие рассматриваемой гипотезы заключается в том, что
соотношение между структурой и функцией иммунной системы
она задает в явном виде:
ЦИС = сеть = толерантность;
ПИС = независимые клоны = иммунитет.
Как мы увидим, большинство существующих моделей способ-
способны учитывать либо структурные, либо функциональные свойства
ЦИС и ПИС, но не могут воспроизводить их одновременно.
Показано, что для полноценного описания структурно-функ-
структурно-функциональных свойств ЦИС и ПИС необходимо учитывать специ-
специфические взаимодействия между В- и Т-лимфоцитами.
3.2. Сетевые модели второго поколения 71
3.2. Сетевые модели второго поколения
Первый набор рассматриваемых нами моделей — это
класс «сетевых моделей второго поколения» (СМВП) (Varela,
Coutinho, 1991). Под ними понимается не только определенный
набор математических моделей иммунных сетей, но и более
широко — вся программа моделирования естественного авто-
автономного поведения иммунной системы. Первую модель такого
рода предложили Варела и др. (Varela et ai, 1988). Эта модель
обладает рядом характерных свойств, присущих большинству
более поздних моделей СМВП, в частности моделям Де Бура и
др. (DeBoer, Hogeweg, 1989 а-с; DeBoer, Perelson, 1991; DeBoer
et ai, 1993a), Вейсбуша и др. (Weisbuch et ai, 1990, 1993),
Фаро и Веласко (Faro, Velasco, 1993c), а также Зульцера и
др. (Sulzer et al., 1993). В этой главе, независимо от целей
исследования, термин СМВП мы будем применять в узком
смысле — к указанному классу математических моделей.
Отличительные особенности сетевых моделей второго поко-
поколения в сравнении с другими моделями идиотипических сетей
вытекают из следующего набора предположений качественного
характера.
Во-первых, предполагается, что иммунная сеть состоит из
клонов В-лимфоцитов, связанных идиотипическими взаимодей-
взаимодействиями. Участие Т-лимфоцитов обычно не рассматривается или
игнорируется.
Во-вторых, игнорируется различие, проводимое ранее Ерне
(Jerne, 1974), во взаимодействиях между паратопами и идиото-
пами, и за основу берется схема Хоффмана (Hoffmann, 1975,
1980). Аффинность рецепторов лимфоцитов, взаимодействующих
на основе идиотипов, предполагается одинаковой, а сами взаимо-
взаимодействия — симметричными. «Хелперные» или «супрессорные»
свойства лимфоцитов имеют относительный характер и зависят
от масштаба взаимодействий в сети.
В-третьих, степень активации и динамика популяций лим-
лимфоцитов существенным образом контролируются уровнем ли-
гирования 0 рецепторов растворимыми молекулами иммуногло-
иммуноглобулинов. Процесс активации лимфоцитов отвечает кривой лог-
нормального распределения, типичной для описания чувстви-
чувствительности, а именно для суммы концентраций лигандов, взве-
взвешенных на соответствующую аффинность рецепторов. Вид этой
1) Лигирование (от англ. ligation) — сшивание концов макромолекул. —
Прим. перев.
72 Гл. 3. Центральная и периферическая иммунные системы
кривой выбран на основе результатов изучения эксперименталь-
экспериментального иммунного ответа на липополисахарид (Coutinho, 1974),
перекрестного связывания мембранных рецепторов иммуногло-
иммуноглобулинов (Perelson, DeLisi, 1980; Perelson, 1984; Faro, Velasco,
1993 a, b) и конкуренции между процессами клеточного размно-
размножения и созревания (Grossman, Cohen, 1980; Sulzer et ai, 1993).
В-четвертых, основными медиаторами идиотипических
взаимодействий служат растворимые молекулы иммуногло-
иммуноглобулинов, поскольку они быстро переносятся в организме
с током жидкости в количествах, намного превышающих
численность молекул иммуноглобулинов, экспрессированных
в виде рецепторов на поверхности лимфоцитов.
Первая из обсуждаемых нами сетевых моделей второго поко-
поколения была предложена и исследована Вейсбушем и Нойманом
при участии Де Бура и Перельсона (DeBoer, 1989; Neumann,
1992; Weisbuch et ai, 1990). В начальной формулировке в ней
не различаются свободные и связанные с мембраной иммуно-
иммуноглобулины, но Андерсон и др. (Anderson et ai, 1993) показали,
что снятие этого ограничения не приводит к изменению основ-
основных выводов. В простом случае двух комплементарных клонов
модель обладает типичным аттрактором в виде неподвижной
точки, в котором первый клон имеет высокую концентрацию и
находится в «иммунном» состоянии (последующая антигенная
стимуляция приводит к размножению клона), а второй клон,
имеющий низкую концентрацию, находится в состоянии «супрес-
«супрессии» (последующая антигенная стимуляция приводит к сниже-
снижению концентрации клеток; в работе (DeBoer et ai, 1993a, b)
представлен анализ условий существования этого динамического
режима). Для изучения обобщенной иммунной сети Вейсбуш и
др. использовали структуру связности в виде дерева Кэйли 0 и
набор параметров, позволяющий избежать тотального расшире-
расширения сети. В зависимости от количественных характеристик пре-
зентирования и элиминации антигена возникают два основных
варианта динамики решений: «вакцинация» (клоны, комплемен-
комплементарные антигену, вызвавшему иммунный ответ, находятся в им-
иммунном состоянии) и «толерантность» (соответствующие клоны
находятся в состоянии супрессии). Иммунная сеть как целое
может обладать независимой локальной «памятью» об антигенах
(как в вакцинированном, так и в толерантном состоянии).
Возникает вопрос, можно ли интерпретировать эту модель
в терминах представлений о центральной и периферической им-
Определение дерева Кэйли см. в гл. 5 на с. 129. — Прим. перев.
3.2. Сетевые модели второго поколения 73
мунной системе? Для этого необходимо установить тождество
между состоянием «вакцинации» и ПИС, а также «толерантно-
«толерантности» и ЦИС. Для обоснования такого отождествления Нойман
{Neumann, 1992) предложил следующую интерпретацию: «В пре-
натальном и неонатальном состоянии, когда имеются полиспе-
полиспецифичные клоны и нечетные петли, в ответ на представленные
(собственные) антигены образуются локализованные в сети ат-
аттракторы толерантности. По мере развития иммунной системы
полиспецифичные клоны постепенно подавляются, нечетные пет-
петли исчезают и воздействие антигена все чаще приводит к фор-
формированию иммунитета, а не толерантности. Невостребованные
в процессе начального развития иммунной системы клоны теперь
приобретают способность отвечать на новые антигены и форми-
формировать против них иммунитет. Но вместе с тем сеть остается
толерантной к антигенам, представленным вначале (собственным
антигенам), поскольку развитие идиотипов, способных с ними
взаимодействовать, сдерживается соответствующими антиидио-
типами».
Интересно сопоставить эти результаты с полученными в ра-
работе {Detours et ai, 1994). Авторы использовали модель, пред-
предложенную Варелой {Varela et ai, 1988), различающую цирку-
циркулирующие и мембранные иммуноглобулины; несмотря на это
при достаточно большом начальном периоде базовая динамика
двух клонов имеет один и тот же асимметричный аттрактор —
неподвижную точку, — как и обсуждаемая выше модель с одним
общим пулом иммуноглобулинов. В обобщенной сети структура
связности идиотипических взаимодействий соответствует «дву-
«двулистной» версии квазинепрерывного двумерного конфигураци-
конфигурационного пространства, в котором каждая точка характеризует
пару комплементарных клонов. В этом случае распространения
сигнала по всей сети избежать нельзя. Постоянное присутствие
антигена стимулирует размножение комплементарных клонов,
которые, в свою очередь, стимулируют идиотипы, структурно
сходные с антигеном; в результате образуются распространяю-
распространяющиеся «волны» идиотипов и антиидиотипов. При встрече двух
волновых фронтов формируется квазиустойчивая «стоячая вол-
волна» с очень сильным полем. Эта «стена» образует границу, раз-
разделяющую две однородные области в пространстве конфигура-
конфигураций, одна из которых соответствует толерантному, а другая —
вакцинированному состоянию. Введение нового антигена в зону
толерантности приводит к минимальным изменениям, в то время
как антиген, введенный в зону вакцинации, провоцирует силь-
сильный иммунный ответ. Интересно отметить, что если в процессе
74
Гл. 3. Центральная и периферическая иммунные системы
онтогенеза в нативной иммунной системе появляется антиген,
то он всегда оказывается в зоне толерантности. Если интерпре-
интерпретировать эту модель в терминах гипотезы о ЦИС и ПИС, то
ясно, что зона толерантности соответствует функции ЦИС, а
зона вакцинации — ПИС.
Рассмотренная модель графически иллюстрирует свойство,
характерное также для модели Вейсбуша. В обоих случаях
идиотипические взаимодействия, формирующие динамическую
память, определяют структуру ЦИС и ПИС: клоны лимфоцитов,
относящиеся к ЦИС, поддерживаются комплементарными клона-
клонами ПИС, и наоборот. Это означает, что ЦИС и ПИС взаимозави-
взаимозависимы и имеют примерно равный по размеру репертуар и, кроме
того, что толерантность эквивалентна вакцинации против моле-
молекулярных структур, комплементарных собственным антигенам, и
наоборот, вакцинация эквивалентна толерантности в отношении
молекулярных структур, комплементарных внешним антигенам.
Суммируя, можно утверждать, что указанные модели без труда
описывают свойства ЦИС и ПИС, однако при этом их взаимосвя-
взаимосвязи оказываются противоречащими интуитивным представлениям
иммунологов и эмпирическим данным.
Несколько иная картина имеет место при моделировании
динамики притока клонов в обобщенную сеть активированных
лимфоцитов (Bersini, 1992; DeBoer, Perelson, 1991; DeBoer et
ai, 1992; Stewart, Varela, 1991). В этом случае характерной
особенностью является симметричность реакций взаимно под-
поддерживаемых идиотипов. Основной результат, полученный Стю-
Стюартом и Варелой A991), а затем подтвержденный и обобщенный
в расширенной интерпретации Де Бура и др. A992) и воспроиз-
воспроизведенный Берсини A992), состоит в следующем: после довольно
хаотичного начального периода наблюдается характерная кар-
•b
о cD „
** о о °
о *« •*°О#
• •
•
о
• о . ОЪ
о о%
° т Оооэ •*•
° • ••"* °о&° °о
\о "• :• •% о** °о
• о • * °
о о °0 ° •„ °
о #* . 8 о о
•о о
о • Чэ°
•*• •
% о °оо Оо
*** о
® • О °°
•>
•
о °°
•
о
0
о°8о° ?
о03 ф • # лр • €>
ск оЪо
о "b?
Рис. 3.1. Четыре последовательных этапа самоорганизации иммунной сети,
выделяемых при численном моделировании в двумерном пространстве конфи-
конфигураций. После начального хаотического периода (а, б) появляются (в) и затем
стабилизируются (г) параллельные цепи «черных» и «белых» клонов. Взято из
(Stewart, Varela, 1991)
3.2. Сетевые модели второго поколения
75
тина формирования квазиустойчивых структур в пространстве
конфигураций, которые имеют вид параллельных цепочек ком-
комплементарных клонов (рис. 3.1).
В образовавшиеся цепочки идиотипов встраиваются лишь
структурно близкие им антигены (рис. 3.2). Поскольку область
пространства конфигураций, которой соответствуют такие ан-
антигены, невелика, то это соответствует состоянию толерант-
толерантности. Следовательно, вся самоорганизующаяся сеть соответ-
соответствует ЦИС, а ПИС представляет собой множество остальных
неактивированных клонов, поступающих из костного мозга и
не взаимодействующих с сетью вследствие удаленности от нее
в пространстве конфигураций. Такая картина намного лучше
. .t.sg :
• 0* f •# •
° • ••••».
• ••
•Л»!'.
г
Рис. 3.2. Последствия взаимодействия иммунной сети с фиксированными ан-
антигенами (черные и белые квадраты). Показаны примеры, иллюстрирующие
интеграцию антигенов в структуру цепей одинаково окрашенных клонов (а, б);
конфигурация (б) сохраняется даже после удаления антигенов, что соответ-
соответствует формированию устойчивой «памяти» (в); введение антигена, не соответ-
соответствующего текущей конфигурации сети, приводит к адаптивному изменению
цепочек (г). Взято из (Stewart, Varela, 1991)
соответствует начальным представлениям о различиях между
ЦИС и ПИС, сформулированным Коутиньо (Coutinho, 1989),
особенно в отношении роли ЦИС как средства самоидентифика-
самоидентификации. Однако имеется существенная проблема, связанная с тем,
что во всех существующих моделях ЦИС имеет тенденцию к
расширению и заполнению всего пространства конфигураций.
ПИС, представляющая собой дополнение ЦИС, сокращается до
масштаба нескольких процентов всего пространства.
Впервые на эту проблему обратили внимание Де Бур и Пе-
рельсон A991), предположившие на основании результатов, по-
полученных в одномерном и двумерном пространствах конфигу-
конфигураций, что в случае пространства более высокой размерности
доля не участвующих в сетевых взаимодействиях «наивных»
клонов будет в конечном итоге расти (DeBoer, Perelson, 1992).
Однако это предположение непосредственно не проверялось, а
76 Гл. 3. Центральная и периферическая иммунные системы
все имеющиеся в настоящий момент результаты, по-видимому,
указывают на противоположное, а именно, что включение в сеть
всего репертуара является общим свойством для всех сетевых
моделей второго поколения. 1)
Во-первых, исследования, в которых константы аффинитета
определялись на основе сравнения двоичных векторов (понима-
(понимаемых как элементы пространства конфигураций высокой раз-
размерности), уже привели к отрицательному результату (DeBoer,
Perelson, 1991). Во-вторых, в наших расчетах по модели Варелы
и др. (Varela et al., 1988) с использованием процедуры генерации
непрерывных коэффициентов аффинности со случайной тополо-
топологией (Detours et al., 1994; подробности см. в (Carneiro, 1996 b))
иммунная сеть также имела тенденцию к развитию вплоть до
заполнения всего репертуара. И наконец, можно показать, что
способность к сосуществованию сравнимых по численности «се-
«сетевых» и «наивных разобщенных» клонов реализуется в случае
топологии дерева Кэйли с бинарной структурой констант аф-
аффинитета, равных нулю или фиксированному положительному
значению (Weisbuch et al., 1990; Anderson et al., 1993; Weisbuch,
Oprea, 1994); снятие этих топологических ограничений приводит
к утрате свойства локализованности сети (Neumann, Weisbuch,
1992а; de Monvel, Martin, 1995).
Тенденция сети к расширению и заполнению всего вступает
в явное противоречие как с эмпирическими оценками (в селе-
селезенке неинфицированных животных активировано не более 20%
лимфоцитов, что оставляет периферической иммунной системе
80% клеток), так и с функциональными потребностями: для
формирования иммунного ответа против патогенов репертуар
периферической иммунной системы должен быть практически
1) Недавно Де Бур и др. A995) предложили уточненный вид функции акти-
активации лимфоцитов, основанный на перекрестных взаимодействиях рецепторов
и дающий преимущество взаимодействиям с более высокой аффинностью.
Использование этой функции в ходе расчетов для двумерного пространства
конфигураций привело к образованию множества малых локализованных сетей
с высокоаффинными внутренними связями (DeBoer et al., 1995). Такие сети не
имели тенденции к распространению, так как в них не включались клоны с
более низкой аффинностью, а используемый формализм для описания конкрет-
конкретного пространства конфигураций допускал для каждого клона существование
лишь одного и только одного комплементарного клона высокой аффинности.
При снятии последнего ограничения на топологию взаимодействий клонов и
допущении возможности для каждого клона иметь несколько комплементарных
клонов высокой аффинности динамика решений модели вновь сводилась к
постепенному расширению иммунной сети и заполнению всего репертуара
(Takumi, DeBoer, 1996).
3.2. Сетевые модели второго поколения 11
полным (Perelson, Oster, 1979; DeBoer, Perelson, 1993; Percus et
ai, 1993; Nemazee, 1996).
В попытке отождествления ЦИС с сетевой компонентой
СМВП эта проблема не является единственной. Дополнительную
трудность создают наблюдаемые динамические свойства сети,
например отсутствие устойчивости к внешним возмущениям. На
главную проблему, тесно связанную с симметрией идиотипи-
ческих взаимодействий, впервые обратили внимание Де Бур и
Хогевег (DeBoer, Hogeweg, 1989). Клон, размножение которого
поддерживается специфическим антигеном, может легко отде-
отделиться от сети, поскольку в этом случае он подавляет ком-
комплементарные ему клоны. Для характеристики таких случаев,
столь характерных для сетевых моделей второго поколения, Кар-
нейро (Carneiro, 1997) заимствовал термин «разбитое зеркало»,
впервые предложенный Обеном.
Многие работы, посвященные иммунным сетям второго по-
поколения, были сосредоточены на описании регуляции иммунного
ответа и иммунной памяти (DeBoer, Hogeweg, 1989 a; Weisbuch
et ai, 1990; Neumann, Weisbuch, 1992 a, b; Sulzer et at., 1993;
Weisbuch, Oprea, 1994; de Monvel, Martin, 1995). В большинстве
из них устранение антигена является непосредственной функци-
функцией соответствующего клона лимфоцитов. После вывода антигена
клон неминуемо сокращается и проходит ряд последовательных
циклов стимуляции, что приводит к восстановлению комплемен-
комплементарных ему клонов. Устойчивая динамика локальной сети при
отсутствии антигена интерпретировалась как наличие иммун-
иммунной памяти. В этой конкретной ситуации объяснение эффекта
«разбитого зеркала», вызываемого антигеном, не представляет
трудностей, однако серьезной проблемой является интерпрета-
интерпретация в рамках представлений о ЦИС. Действительно, отделение
от сети клонов, специфичных для собственных антигенов ор-
организма, можно интерпретировать как нарушение естественной
толерантности и начало аутоиммунного заболевания. Поэтому
важно спросить: как избежать вызываемого антигеном отделения
клона?
В случае клонов, зависящих от собственных антигенов ор-
организма, этого можно достичь, если клоны постоянно поддер-
поддерживаются в супрессированном состоянии и принадлежат аттрак-
аттрактору, качественно похожему на асимметричную неподвижную
точку в ранее описанной модели, т. е. такому аттрактору, где
любые два зеркальных клона не меняют своего «иммунного» или
«супрессированного» состояния. Это свойство выполняется для
большинства ситуаций, при которых под действием постоянной
78 Гл. 3. Центральная и периферическая иммунные системы
антигенной стимуляции иммунная сеть остается в пределах неко-
некоторого ограниченного множества, включая даже такие экзоти-
экзотические варианты топологии сети, как дерево Кэйли (Neumann,
Weisbuch, 1992 a; Anderson et ai, 1993), пространство конфигу-
конфигураций (Detours et ai, 1994) и некоторые более сложные струк-
структуры (например KS-сеть О (Detours, 1996)). Как следствие, лю-
любой динамический аттрактор, в котором антиген-специфические
клоны флуктуируют между состояниями супрессии и активации,
создает хотя бы временную возможность для отделения кло-
клонов, взаимодействующих с антигеном (DeBoer, Perelson, 1991;
Takumi, DeBoer, 1996; Detours et ai, 1994; Calenbuhr et ai,
1994; Van Hammen, устное сообщение; Faro, устное сообщение;
Neumann, устное сообщение; Carneiro, неопубл.).
В качестве альтернативы, специфические клоны могут под-
поддерживаться в супрессированном состоянии в силу своей высо-
высокой связности. Эта простая идея была впервые реализована Стю-
Стюартом и др. (Stewart, Varela, 1989; Stewart et ai, 1989) на при-
примере специально выбранной матрицы связности (Kearney et ai,
1987). Позднее Зульцер и др. A994), изучая поведение решений
предложенной ими ранее модели (Sulzer et ai, 1993), установили
с использованием матрицы аффинности в ABCD-топологии Стю-
Стюарта, что толерантность устойчиво сохраняется в том и только
том случае, если собственные антигены организма взаимодей-
взаимодействуют с группой А, элементы которой связаны между собой
высокой аффинностью; структура остальных групп не может
надежно гарантировать выполнения этого свойства.
3.3. Иммунная сеть с учетом взаимодействий
В- и Т-клеток
Выше мы поставили под сомнение основное предположение
моделей СМВП, согласно которому помощь Т-клеток ни при
каких условиях не ограничивает скорость размножения В-лим-
фоцитов и выработку антител. В усиленном варианте модели,
предложенной Варелой и др. (Varela et ai, 1988), мы сделали
процесс активации В-лимфоцитов явно зависящим от взаимодей-
взаимодействий с активированными Т-лимфоцитами.
В этой модели сохраняются основные предположения СМВП
и вводятся дополнительные предположения для описания дина-
динамики взаимодействий клонов Т-лимфоцитов между собой, а так-
также с клонами В-лимфоцитов и продуцируемыми ими антителами.
l) Knowledge structure. — Прим. перев.
3.3. Иммунная сеть с учетом взаимодействий В- и Т-клеток 79
Процесс активации В-лимфоцитов был разделен на два этапа.
Первый этап — это индукция, зависящая от величины лиги-
рования рецепторов в результате перекрестных взаимодействий
между различными агентами, такими как циркулирующие анти-
идиотипические антитела или естественный антиген. Поскольку
процесс индукции аналогичен активации лимфоцитов в СМВП,
он описывается аналогичной лог-нормальной функцией поля.
Второй этап состоит из взаимодействий между индуцированны-
индуцированными В-клетками и активированными Т-клетками, что приводит
к полной активации В-клеток. Этот процесс описывается при
помощи функции, насыщаемой с увеличением численности В- и
Т-клеток, взвешенной на их попарную аффинность. Эта функция
описывает конкуренцию В-лимфоцитов за Т-клеточную помощь.
Индуцированная В-клетка может взаимодействовать с активиро-
активированной Т-клеткой, если она занимает рецептор Т-клетки одним
из двух способов: действуя как ан-
тиген-презентирующая или анти-
идиотипическая клетка (рис. 3.3).
Динамика численности клонов
Т-лимфоцитов напоминает дина-
динамику В-клеточных клонов с тем
отличием, что она определяет-
определяется лишь антигенными пептидами,
представленными на антиген-пре-
зентирующих клетках. Интенсив- рис 3.3. два варианта взаимо-
НОСТЬ презентации пептидов ан- действий В-лимфоцитов с ак-
тителами, экспрессируемыми и тивированными Т-лимфоцитами:
Продуцируемыми В-ЛИмфоцитами, презентация пептидов (а); идио-
считается пренебрежимо малой и типические взаимодействия (б)
не рассматривается вследствие их
невысокой концентрации. Циркулирующие иммуноглобулины
опосредуют идиотипические взаимодействия между клонами
В-лимфоцитов, осуществляя контроль процесса индукции во
многом аналогично способу контроля их активации в моделях
СМВП. Циркулирующие антитела могут препятствовать разви-
развитию Т-клеточных клонов путем подавления активации в слу-
случае, если антитела имеют достаточно высокий аффинитет к
Т-клеточным рецепторам. В рассматриваемой модели циркули-
циркулирующие антитела — это единственный фактор, влияющий на ак-
активацию и размножение Т-лимфоцитов. Поэтому ограниченное
размножение клонов Т-лимфоцитов происходит лишь в том и
только том случае, если их рецепторы интегрированы в идиоти-
пическую сеть.
80 Гл. 3. Центральная и периферическая иммунные системы
Динамические свойства новой модели критически зависят от
двух вариантов реакций В- и Т-клеток, показанных на рис. 3.3.
В случае, когда клон В-лимфоцитов взаимодействует с соответ-
соответствующим клоном Т-лимфоцитов путем представления антиген-
антигенных пептидов в комплексе с мембранными молекулами главного
комплекса гистосовместимости, специфических взаимодействий
между рецепторами этих двух типов клеток не происходит. Мо-
Молекулы антител, продуцируемые В-лимфоцитами в результате
активации, напрямую с Т-клеточными рецепторами не взаимо-
взаимодействуют и потому не влияют на состояние активации данного
клона. Следствием таких взаимодействий между В- и Т-лимфо-
цитами является экспоненциальный рост обоих типов клеток при
условии наличия остальных необходимых стимулов.
Второй тип реакций имеет место, если контакт В- и Т-лим-
Т-лимфоцитов происходит опосредованно в результате специфических
взаимодействий Т-клеточных рецепторов с антителами, которые
продуцируют активированные В-лимфоциты. Поскольку такие
антитела служат ингибиторами Т-лимфоцитов, то в результа-
результате действия обратной связи численность соответствующей пары
клонов В- и Т-лимфоцитов стабилизируется. Таким образом,
даже при прочих оптимальных условиях стимуляции динамика
численности пары клонов неминуемо придет к такому положе-
положению, когда специфичные к рецепторам Т-лимфоцитов и продуци-
продуцируемые В-лимфоцитами молекулы антител (как свободные, так
и связанные с мембраной) будут поддерживать определенный
уровень активности Т-клеток, которых, в свою очередь, окажется
достаточно для поддержания активности В-лимфоцитов. Такое
положение равновесия устойчиво, поскольку, если бы актив-
активность В-лимфоцитов увеличилась, то дополнительные антитела
к рецепторам Т-клеток понизили бы концентрацию Т-клеток и
в результате сниженная Т-клеточная помощь вновь привела бы
к снижению активности В-клеток до равновесного значения.
Ясно, что математическая модель должна описывать два
варианта взаимодействия с антигеном: «иммунный ответ», при
котором численность клонов Т- и В-лимфоцитов экспоненциаль-
экспоненциально растет, и «толерантность», при которой численность клонов
Т-лимфоцитов контролируется путем включения их рецепторов
в репертуар идиотипической В-клеточной сети. Вместе с тем
понятно, что в функциональном отношении эти два варианта
можно отождествить с ПИС и ЦИС соответственно. Взаимодей-
Взаимодействие между В- и Т-лимфоцитами нарушает симметрию в ре-
реакциях между идиотипами и антиидиотипами и устанавливает
3.3. Иммунная сеть с учетом взаимодействий В- и Т-клеток
81
ясное соотношение между структурой связности и функциями
толерантности и иммунитета.
Теперь важно рассмотреть результаты моделирования обоб-
обобщенной иммунной сети, в которой происходит метадинамическое
взаимодействие между двумя указанными типами клеточной ко-
кооперации (Carneiro et ai, 1996 b). Аналогично работе (Detours
et ai, 1994), начальное состояние соответствует наличию одних
только антигенов. Сначала происходит антиген-опосредованная
активация и размножение клонов Т-лимфоцитов, за которым
сразу же следует появление «волн» антиген-специфических и
антиидиотипических клонов В-лимфоцитов, распознающих цир-
циркулирующие идиотипы и рецепторы Т-клеток, способные взаимо-
взаимодействовать с антигеном. Вследствие постоянного притока новых
клонов репертуар идиотипической сети увеличивается, пока не
становится практически «полным» (рис. 3.4). С этого момента
200
400
600
800 Время
Рис. 3.4. Устойчивое развитие модели иммунной сети всегда сопровождается
переходом в результате притока новых клонов от фазы расширения к фазе
сокращения репертуара В-клеток, составляющего в результате лишь некото-
некоторую долю от полного. Показана устойчивая динамика величины р х N для
нескольких расчетов (р — постоянная вероятность того, что иммуноглобулин
распознает другую молекулу, а N — общее количество клонов В-лимфоцитов
в иммунной системе; произведение этих величин служит мерой «полноты»
репертуара сети). Взято из (Carneiro et al., 1996b)
Т-клетки, способные взаимодействовать с антигеном, не могут
избежать распознавания идиотипической сетью, и поэтому их
размножение сдерживается циркулирующими антиидиотипиче-
скими антителами.
На этой фазе Т-лимфоциты, способные взаимодействовать с
антигеном, становятся лимитирующим фактором для В-клеток,
и индуцированные В-лимфоциты для полной активации теперь
должны конкурировать между собой за ограниченное количество
82
Гл. 3. Центральная и периферическая иммунные системы
Т-клеточных рецепторов. В ходе вычислений регулярно наблюда-
наблюдается этап конкурентного исключения, на котором клоны с более
высокой аффинностью к рецепторам Т-клеток вытесняют менее
приспособленные клоны (рис. 3.5). В результате происходит сни-
снижение количества специфичностей и связей в идиотипической се-
сети, которая «фокусируется» вокруг клеток, взаимодействующих
с антиген-активированными клонотипами Т-лимфоцитов. Фак-
Фактический репертуар идиотипической сети ограничивается лишь
некоторой частью потенциального репертуара В-клеток (рис. 3.4).
В результате происходит разделение репертуара на две груп-
группы, представленные лимфоцитами идиотипической сети и всеми
остальными покоящимися наивными клетками (недавно пришед-
пришедшими из костного мозга, не активированными и ожидающими
гибели). Ясно, что эти две группы соответствуют структурному
определению ЦИС и ПИС, первоначально предложенному Коу-
тиньо.
Средний коэффициент
взаимодействия
В- и Т-лимфоцитов
1,2-
1,0-
0,8-
0,6-
5™
4™
2-
1 =
5-
4
Относительная
численность
Т-клеток-помощников
к
1 \
0 100 200 300 400 500 Время
0 100 200 300 400 500 Время
Рис. 3.5. Динамика среднего коэффициента взаимодействий В- и Т-лимфоци-
Т-лимфоцитов (слева) и среднего отношения численности Т-клеток помощников и соот-
соответствующего клона В-лимфоцитов (справа) для типичного варианта решений,
при котором наблюдается устойчивое развитие сети. Отметим доступность
Т-клеточной помощи на ранней фазе развития; снижение количества доступной
«помощи» сопровождается постепенным увеличением среднего коэффициента
взаимодействий. Взято из (Carneiro et ai, 1996 b)
Давайте сравним эти результаты с полученными на обоб-
обобщенной модели СМВП. До тех пор, пока Т-клеточная по-
помощь не является лимитирующим фактором, модель Карнейро
и др. (Carneiro et ai, 1996 a, b) ведет себя аналогично модели
смвп. О
1) Следует отметить, что в пределе при увеличении количества активиро-
активированных Т-лимфоцитов до бесконечности функция активации В-лимфоцитов в
работах (Carneiro et ai, 1996 a, b) сходится к функционалу, рассматриваемому
в работах (Varela et ai, 1988; Detours, 1994).
3.4. Заключительные замечания 83
Следовательно, в обоих классах моделей репертуар идиотипи-
ческой сети становится «полным». Однако в стандартной СМВП
это соответствует (метадинамически) устойчивому состоянию
системы, тогда как в модели Карнейро и др. это состояние пере-
переходное, за которым следует заметное сокращение репертуара.
Метадинамически устойчивые состояния, т. е. такие состоя-
состояния сети, в которых не происходит притока новых или отделения
от сети уже имеющихся клонов, в таких моделях с неизбеж-
неизбежностью различны. В СМВП по мере увеличения разнообразия
клонов в иммунной сети система приходит к положению равнове-
равновесия, при котором средняя связность минимальна. Приток новых
клонов прекращается, так как новые кандидаты, продуцируемые
в костном мозге, как правило, получают супрессирующий сиг-
сигнал. Если репертуар сети сокращается в результате гибели кло-
клонов из-за внутренней активности сети, то новые кандидаты вновь
становятся «пригодными» и компенсируют имевшие место потери
(в действительности многие расчеты показывают непрерывную
гибель и восполнение клонов; в пространстве конфигураций это
приводит к характерному движению цепочек).
В отличие от этого, в модели Карнейро и др. (Carneiro et al.,
1996 b) равновесное состояние сети формируют те клоны В-лим-
фоцитов, которые проходят отбор на взаимодействие с Т-лим-
фоцитами. Это состояние устойчиво, так как сетевые клоны
имеют максимальные коэффициенты взаимодействия и успешно
конкурируют с любыми другими кандидатами на помощь со
стороны Т-клеток. На это состояние почти не влияют свойства
клонов, продуцируемых в костном мозге. Леон и др. (Leon et al.,
1998) использовали свойство метадинамической устойчивости
идиотипической сети для объяснения механизма возникновения
толерантности.
3.4. Заключительные замечания
В этой главе мы рассмотрели два типа моделей иммунных
сетей с точки зрения возможности их интерпретации в терминах
ЦИС и ПИС. Было показано, что имеется два способа опреде-
определения СМВП. Первый основан на «структурном определении»:
динамически регулируемая сеть интерпретируется как ЦИС, а
разобщенные клоны — как ПИС. Однако при таком подходе труд-
трудно согласовать функциональные характеристики ЦИС и ПИС.
Для этого есть несколько причин: соотношение численностей
клеток, принадлежащих ЦИС и ПИС, меняется на практически
противоположное, что не позволяет устойчиво воспроизводить
84 Гл. 3. Центральная и периферическая иммунные системы
свойство естественной толерантности сети. Второй способ состо-
состоит в отображении функциональных определений ЦИС и ПИС на
различные наборы клонов, рассматриваемых в СМВП. Основная
трудность здесь заключается в том, что возникающие взаимосвя-
взаимосвязи между ЦИС и ПИС противоречат иммунологической интуи-
интуиции. Вследствие этого не существует иного четко определенного
свойства, позволяющего отнести данный клон к ЦИС или ПИС,
кроме его способности реагировать на антигенную стимуляцию.
Мы обсудили возможности преодоления указанных ограниче-
ограничений СМВП, обобщив эти модели с учетом взаимодействий В- и
Т-лимфоцитов (Carneiro et al., 1996a, b). Было показано, что та-
такой подход позволяет согласованно описать структурные и функ-
функциональные свойства ЦИС и ПИС и наряду с этим на основе
свойства самоорганизации сети объяснить, как формируются раз-
различия между ЦИС и ПИС. Поскольку такая модель качественно
отличается от всех предыдущих моделей СМВП, мы предлагаем
называть ее «сетевой моделью третьего поколения» (СМТП).
Важно отметить, что хотя СМТП в отличие от СМВП спо-
способна проводить различие между ЦИС и ПИС, это не дает нам
полного права сформулировать строгий вывод относительно ее
обоснованности. Указанные типы моделей — это всего лишь
две альтернативные гипотезы об организации иммунной систе-
системы. Ерне представлял себе идиотипическую сеть как полную
сеть, способную к выполнению разнообразных функций, вклю-
включая доиммунный отбор репертуара, толерантность, регуляцию
иммунного ответа и другие (Jerne, 1974; Coutinho, устное сооб-
сообщение). Обобщенные модели СМВП, такие как модель Детура и
др. (Detours et al., 1994; 1996), можно рассматривать как один из
возможных вариантов математической реализации схемы Ерне.
В отличие от этого классического подхода, гипотеза Коутиньо
представляет собой попытку согласования сетевой теории Ерне с
клонально-селекционной теорией. Предполагается, что иммунная
система состоит из двух структурно и функционально различных
подсистем (более полное обсуждение этого вопроса имеется в
(Carneiro et al., 1997)). Сетевая модель третьего поколения со-
соответствует математически ясной формулировке этой гипотезы.
Завершим эту главу сопоставлением рассмотренных моделей
с эмпирическими данными по естественным антителам. Веро-
Вероятно, наиболее заметное различие между СМВП и СМТП за-
заключается в прогнозе относительного размера идиотипической
сети в устойчивом состоянии. Изучение СМВП показало, что
иммунная сеть должна иметь «полный репертуар» в том смыс-
смысле, что практически каждый из вновь образующихся в костном
Список литературы 85
мозге клонов должен вступать во взаимодействие с циркулирую-
циркулирующими антителами. В отличие от этого в сетевой модели третьего
поколения большинство клонов, образующихся в костном моз-
мозге или тимусе, не должно участвовать в таких взаимодействи-
взаимодействиях. Возникает важный для эмпирических исследований вопрос:
является ли сеть, представленная популяцией циркулирующих
антител, «полной» или нет. Эмпирические данные в поддержку
какой-либо из этих теорий отсутствуют, поскольку фактическая
оценка «полноты» репертуара сопровождается целым рядом кон-
концептуальных и эмпирических трудностей (Carneiro, 1997; Bris-
sac et al., 1998). Необходимость сопоставления теории и данных
является насущной задачей всего сетевого подхода и возможной
причиной того скепсиса, с которым сообщество иммунологов
в настоящее время относится к теории иммунных сетей.
Эта глава не была бы написана без стимулирующих обсуж-
обсуждений с Уго Берсини, Чандрикой Бимарао, Каролиной Бриссак,
Верой Каленбур, Антонио Коутиньо, Винсентом Детуаром, Кале
Леоном, Оливье Мартеном и Франциско Варелой.
Список литературы
1. Anderson R. W., Neumann A. U., Perelson A. S. A Cayley tree im-
immune network model with antibody dynamics // Bull. Math. Biol.
1993. V.55. P. 1091.
2. Bersini H. The interplay between dynamics and metadynamics of the
immune network. Artificial Life III Workshop, Santa Fe, 15-19 June,
1992.
3. Calenbuhr V., Bersini Я., Stewart /., Varela F.J. Natural tolerance
in simple immune network // J. Theor. Biol. 1994. V. 177. P. 199.
4. Carneiro /., Faro /., Coutinho A., Stewart J. A model of the immune
network with B-T cell co-operation. I. Prototypical structures and
dynamics // J. Theor. Biol. 1996a. V. 182. P. 513.
5. Carneiro /., Coutinho A., Stewart J. A model of the immune network
with B-T cell co-operation. II. The simulation of ontogenesis // J.
Theor. Biol. 1996b. V. 182. P. 531.
6. Carneiro J. Towards a comprehensive view of the immune system.
PhD Thesis. University of Porto, Portugal, 1997.
7. Coutinho A. Immune activation of В cells: an analysis of the trig-
triggering mechanisms. Stockholm: Akademisk Avhandling, Karolinska
Institutes 1974.
8. Coutinho A. Beyond clonal selection and network // Immunol. Rev.
1989. V. 110. P. 63.
9. DeBoer R. J. Clonal selection versus idiotypic network models of the
immune system: a bioinformatic approach. PhD thesis, University of
Utrecht, The Netherlands, 1989.
86 Гл. 3. Центральная и периферическая иммунные системы
10. DeBoer R.J., Hogeweg P., Perelson A. S. Growth and recruitment
in the immune network // Theoretical and experimental insights into
immunology (Eds. A. S. Perelson, G. Weisbuch, A. Coutinho). N.Y.:
Springer, 1992.
11. DeBoer R.J., Hogeweg P. Memory but no suppression in low-
dimensional symmetric idiotypic networks // Bull. Math. Biol. 1989a.
V.51. P. 223.
12. DeBoer R.J., Hogeweg P. Stability of symmetric idiotypic net-
networks — a critique of Hoffmann's analysis // Bull. Math. Biol. 1989b.
V.51. P.217.
13. DeBoer R.J., Hogeweg P. Unreasonable implications of reasonable
idiotypic network assumptions // Bull. Math. Biol. 1989c. V.51.
P.381.
14. DeBoer R.J., Perelson A. S. Size and connectivity as emergent prop-
properties of a developing network // J. Theor. Biol. 1991. V. 149. P.381.
15. DeBoer R.J., Segel L.A., Perelson A. S. Pattern formation in one-
and two-dimensional shape-space models of the immune system // J.
Theor. Biol. 1992. V. 155. P. 295.
16. DeBoer R.J., Perelson A.S., Kevrekidis I.G. Immune network be-
behavior. I. From stationary states to limit cycle oscillations // Bull.
Math. Biol. 1993. V.55. P. 745.
17. DeBoer R.J., Perelson A.S., Kevrekidis I. G. Immune network be-
behavior. II. From oscillations to chaos and stationary states // Bull.
Math. Biol. 1993b. V.55. P. 781.
18. DeBoer R.J., Perelson A. S. How diverse should the immune system
be? // Proc. R. Soc. Lond. B. 1993. V.252. P. 171.
19. De Monvel J.H.B., Martin О. С Memory capacity in large idiotypic
networks // Bull. Math. Biol. 1995. V. 57. P. 109.
20. Detours V. Modeles formels de la selection des cellules Bet T. PhD
Thesis, University Paris 6, France, 1996.
21. Detours V., Bersini H., Stewart /., Varela F. Development of an
idiotypic network in shape space // J. Theor. Biol. 1994. V. 170.
P. 401.
22. Faro /., Velasco S. Crosslinking of membrane immunoglobulins and
B-cell activation: a simple model based on percolation theory // Proc.
R. Soc. Lond. B. 1993a. V.254. P. 139.
23. Faro /., Velasco S. Numerical analysis of a model of ligand-induced
B-cell antigen-receptor clustering. Implications for simple models of
B-cell activation in an immune network // J. Theor. Biol. 1993b.
V. 167. P. 45.
24. Faro /., Velasco S. Studies on a recent class of network models of
the immune system // J. Theor. Biol. 1993c. V. 164. P. 271.
25. Grossman Z., Cohen I. R. A theoretical analysis of the phenotypic
expression of immune response genes // Eur. J. Immunol. 1980. V. 10.
P. 633.
26. Hoffman G. W. A theory of regulation and self-nonself discrimination
in an immune network // Eur. J. Immunol. 1975. V. 5. P. 638.
Список литературы 87
27. Hoffman G. W. On network theory and H-2 restriction // Contemp.
Top. Immunobiol. 1980. V. 11. P. 185.
28. Huetz F., Jacquemart F., Репа-Rossi C, Varela F., Coutinho A.
Autoimmunity: The moving boundaries between physiology and
pathology // J. Autoimmunity. 1988. V. 1. P. 507.
29. Jerne N. K. Towards a network theory of the immune system // Ann.
Immunol. (Inst. Pasteur). 1974. V. 125C. P. 373.
30. Kearney J.F., Vakil M., Nicholson N. Non-random VH gene ex-
expression and idiotype-antiidiotype expression on early В cells //
Evolution and vertebrate immunity: The antigen receptor and MHC
gene families (Eds. G.Kelsoe, D. Schulze). Austin: Texas University
Press, 1987. P. 174.
31. Leon K., Carneiro /., Perez R., Montero E., Lage A. Natural and
induced tolerance in an immune network model // J. Theor. Biol.
1998. V. 193. P. 519.
32. Nemazee D. Antigen receptor capacity and the sensitivity of self-
tolerance // Immunol. Today. 1996. V. 17. P. 25.
33. Neumann A. U. Dynamical transitions and percolation in network
models of the immune response. PhD thesis, Bar-Пап University,
Israel, 1992.
34. Neumann A. U., Weisbuch G. Dynamics and topology of idiotypic
networks // Bull. Math. Biol. 1992a. V.54. P. 699.
35. Neumann A. U., Weisbuch G. Window automata analysis of popu-
population dynamics in the immune system // Bull. Math. Biol. 1992b.
V.54. P.21.
36. Perelson A. S. Some mathematical models of receptor clustering by
multivalent ligands // Cell surface dynamics: Concepts and models
(Ed. A. S. Perelson). N.Y.: Marcel Dekker, 1984. P. 377.
37. Percus J.K., Percus O.E., Perelson A. S. Predicting the size of the
T-cell receptor and antibody combining region from consideration of
efficient self-nonself discrimination // Proc. Natl. Acad. Sci. USA.
1993. V.90. P. 1691.
38. Perelson A.S., DeLisi С Receptor clustering on a cell surface. I.
Theory of receptor cross-linking by ligands bearing two chemical
distinct functional groups // Math. Biosci. 1980. V.64. P. 169.
39. Perelson A.S., Oster G.F. Theoretical studies of clonal selection:
minimal antibody repertoire and reliability of self-non-self discrimi-
discrimination // J. Theor. Biol. 1979. V.81. P. 645.
40. Stewart /., Varela F.J. Exploring the meaning of connectivity in the
immune network // Immunol. Rev. 1989. V. 110. P. 37.
41. Stewart /., Varela F.J. Morphogenesis in shape-space. Elementary
meta-dynamics in a model of the immune network // J. Theor. Biol.
1991. V. 153. P. 477.
42. Stewart /., Varela F.J., Coutinho A. The relationship between con-
connectivity and tolerance as revealed by computer simulation of the
immune network: some lessons for an understanding of autoimmu-
autoimmunity // J. Autoimmun. 1989. V.2. P. 15.
88 Гл. 3. Центральная и периферическая иммунные системы
43. Sulzer В., Van Hemmen J.L., Neumann A.U., Behn U. Memory
in idiotypic networks due to competition between proliferation and
differentiation // Bull. Math. Biol. 1993. V.55. P. 1133.
44. Sulzer В., Van Hemmen J.L., Behn U. Central immune system, the
self and autoimmunity // Bull. Math. Biol. 1994. V. 56. P. 1009.
45. Takumi K., DeBoer R.J. Self assertion modeled as a network reper-
repertoire of multi-determinant antibodies // J. Theor. Biol. 1996. V. 183.
P. 55.
46. Varela F.J., Coutinho A. Second generation immune networks //
Immunol. Today. 1991. V. 12. P. 159.
47. Varela F.J., Coutinho A., Dupire В., Vaz N. Cognitive networks: im-
immune, neural and otherwise // Theoretical immunology (Ed. A. S. Pe-
relson). Redwood City: Addison-Wesley, 1988. P. 359.
48. Weisbuch G., DeBoer R.J., Perelson A. S. Localized memories in
idiotypic networks // J. Theor. Biol. 1990. V. 146. P. 483.
49. Weisbuch G., Dos Santos R.M., Neumann A. U. Tolerance to hor-
hormones and receptors in an idiotypic network model // J. Theor. Biol.
1993. V. 163. P. 237.
50. Weisbuch G., Oprea M. Capacity of a model immune network // Bull.
Math. Biol. 1994. V. 56. P. 899.
Д-р Джон Стюарт защитил диссертацию в области генетики в Кембридже
A966 г.). Сфера его научных интересов включает физиологическую генетику,
социологию знания, проблемы происхождения науки о мышлении и теоретиче-
теоретическую иммунологию. Д-р Стюарт является сотрудником Национального центра
научных исследований (CNRS, Франция). Руководит научным коллективом по
проблемам знания, организации и системной методологии факультета техноло-
технологий и науки о человеке Технического университета г. Компьень, Франция.
Глава 4
ИММУНОЛОГИЯ
КАК НАУКА ОБ АВТОНОМНОЙ
ДЕЦЕНТРАЛИЗОВАННОЙ СИСТЕМЕ
Л. А. Сигел, Р. Л. Бар-Ор
Выдвигается и обосновывается предположение о том, что у иммунной
системы отсутствуют долговременные цели, а выявляемые локальные цели
часто противоречат друг другу. На основе простой модели показано, что ис-
использование обратных связей позволяет 1) согласовать конфликтующие цели,
2) увеличить возможности эффекторных клеток и 3) обеспечить преимуще-
преимущественное размножение более мощных эффекторов. Также показано, что неспе-
неспецифические химические сигналы, используя пространственную организацию
системы, могут отбирать соответствующие ее целям специфические иммунные
элементы. Проводится сопоставление с другими автономными децентрализо-
децентрализованными системами.
4.1. Введение
Одним из наиболее плодотворных направлений современной
науки является сопоставление естественной и искусственной
жизни. Компьютерное и обычное зрение, управление движением
животных и роботов служат примерами быстро развивающихся
областей исследований в биологии и вычислительной матема-
математике.
Настоящая работа относится к новому направлению исследо-
исследований — искусственной и естественной иммунологии.
Рассмотрение основных биологических механизмов помогает
увидеть, что иммунная система является прототипом как бы
«перевернутого» искусственного интеллекта. Подчеркнем, что
иммунная система является распределенной системой (по край-
крайней мере в первом приближении), а ее агенты, клетки, очень
сложны. Взаимоотношения клеток между собой и с патогенами
хорошо изучены и представляют значительный биологический и
медицинский интерес.
В статье рассматриваются следующие основные вопросы:
1) В чем состоят «цели» иммунной системы, и каким обра-
90 Гл. 4. Иммунитет и автономные децентрализованные системы
зом их достижению может способствовать наличие обратной
связи? 2) Каким образом неспецифические химические сигналы,
используя пространственную организацию иммунной системы,
выбирают те специфические компоненты иммунной системы, ко-
которые обеспечивают достижение целей системы? 3) Полезно ли
сопоставление иммунной системы с другими децентрализован-
децентрализованными системами?
4.2. Нанокурс иммунологии
Сначала кратко рассмотрим систему адаптивного иммуни-
иммунитета, которая имеется у позвоночных, но отсутствует у более
простых организмов. Введем несколько определений и терминов,
необходимых для понимания изучаемого предмета. Дальнейшие
подробности при этом не столь важны, так как для наших
целей будет достаточно общего представления (все необходи-
необходимые сведения о системе иммунитета можно найти в книге [13],
из более свежих работ отметим статью «Иммунология для
физиков» [24]).
Основной функцией иммунной системы является ограничение
повреждений организма хозяина патогенами (вредными бак-
бактериями, вирусами, грибками, простейшими и червями). Эти
организмы, как и большие отдельные молекулы, вызывают им-
иммунный ответ и поэтому называются антигенами. При одном
типе ответа так называемые В-клетки секретируют молекулы
антител. Для секреции антител необходимо активировать незре-
незрелые В-клетки и запустить процессы сначала их пролиферации
(размножения), а затем дифференцировки (превращения) в сек-
ретирующие антитела плазматические клетки.
Одним из способов, которым антитела уничтожают бактерии,
является опсонизация (от греческого офои — готовить пищу).
Антитела связываются (образуют химическую связь) с бактери-
бактерией за счет комплементарного соответствия между пространствен-
пространственной молекулярной структурой на поверхности бактерии и «рабо-
«рабочего конца» (вариабельной области) молекулы антитела. Всего
имеется примерно 107 различных вариантов пространственных
структур (специфичностей) молекул антител. Первоначально в
организме имеется лишь несколько копий каждой специфично-
специфичности. Появление антигена вызывает пролиферацию тех В-клеток,
антитела которых хорошо связываются с данным антигеном.
Молекула антитела имеет Y-образную форму с двумя идентич-
идентичными вариабельными областями в верхней части. Нижняя часть
молекулы называется константной областью. Такое строение
4.2. Нанокурс иммунологии 91
характерно для антител разных идиотипов (обозначаемых IgGl,
IgG2, IgM, IgA и других). Если к бактерии прикрепляется мно-
много антител, то она начинает напоминать дикобраза, покрытого
бесчисленными тонкими иглами с константными областями на
концах. Константная область IgGl особенно привлекательна для
макрофагов — клеток, фагоцитирующих, или «перевариваю-
«переваривающих», опсонизированные антителами IgGl бактерии.
Некоторые бактерии успешно существуют внутри макрофа-
макрофагов. Один из ведущих способов уничтожения внутриклеточных
патогенов связан с цитотоксическим (убивающим клетки) вари-
вариантом клеток, которые называются цитотоксическими Т-клет-
ками. Буквы В и Т обозначают место происхождения клеток,
В — костный мозг (bone marrow) и Т — тимус (thymus). Т-клет-
ки другого типа называются Т-хелперы (от англ. helper — по-
помощник). Сигнальные молекулы, вырабатываемые Т-хелперами,
называются цитокинами или интерлейкинами. Эти молекулы
оказывают мощное воздействие на остальные клетки иммунной
системы. Например, цитокины переводят покоящиеся В-клетки в
состояние размножения и, затем, выработки антител, они также
влияют на изотип антител.
Каким образом цитотоксические Т-клетки узнают, что они
должны убить макрофаг, в котором поселились внутриклеточ-
внутриклеточные бактерии или, скажем, эпителиальную клетку, в которую
проникли вирусы? Для этого используется сложный внутрикле-
внутриклеточный механизм, встраивающий небольшие фрагменты бакте-
бактериальных или вирусных белков (пептиды) в специальные мо-
молекулы так называемого главного комплекса гистосовместимо-
сти (ГКГ) 0 (ГКГ-молекулы) на поверхности атакуемой клетки.
Т-клетки несут на своей мембране молекулы (рецепторы), кото-
которые «распознают» комбинации ГКГ-белок, соответствующие их
структуре (специфичности). Успешное распознавание запускает
каскад внутриклеточных реакций, приводящий к уничтожению
клетки-мишени (или, при других условиях, к активации Т-хел-
перов).
Отметим, что в ходе борьбы с патогеном цитотоксическая
Т-клетка разрушает клетки хозяина. В ряде случаев уничтоже-
уничтожение патогена сопровождается значительным повреждением хо-
хозяина. Если процесс разрушения собственных клеток организма
выходит из-под контроля, то развиваются аутоиммунные забо-
заболевания.
l) Major histocompatibility complex, MHC. — Прим. перев.
92 Гл. 4. Иммунитет и автономные децентрализованные системы
4.3. Общая характеристика иммунной системы
Завершая краткий обзор иммунной системы, перечислим ее
основные характеристики.
• Клетки иммунной системы являются сложными высокоор-
высокоорганизованными живыми машинами.
• Иммунная система — это распределенная децентрализован-
децентрализованная система (в первом приближении связи между иммун-
иммунной и нервной системами не рассматриваются).
• Компонентами иммунной системы являются как эффекторы
(«боевые части»), такие как макрофаги, антитела различ-
различных специфичностей и изотипов, так и «части управления»,
представленные Т-клетками-помощниками и их цитоки-
нами.
• Против разных патогенов эффективны различные комбина-
комбинации защитных компонентов иммунной системы. Например,
на рис. 9.33 в учебнике Джейнвэя и Трэверса [13] показано
около 20 различных комбинаций из четырех изотипов и
двух видов клеточного иммунитета, используемых против
30 часто встречающихся патогенов.
• Даже в ходе короткой инфекции патогены могут изменять
свою внешнюю оболочку, что снижает эффективность их
распознавания иммунной системой. Кроме того, патогены
могут использовать ряд других механизмов для нарушения
систем управления иммунитетом.
• Перед лицом бесчисленного множества возможных «про-
«противников», каждый из которых имеет свой собственный
«образ жизни» и способ заражения, иммунная система
должна уметь автоматически использовать против каждого
патогена адекватные по времени и интенсивности примене-
применения средства защиты.
• Неудачный выбор эффекторных компонентов может при-
привести к истощению ресурсов, отвлечь внимание от более
опасного патогена или понизить эффективность защиты,
«ослепив» используемые компоненты (например, избыточно
синтезируемые антитела блокируют доступ к комплексам
ГКГ-белок и, следовательно, ослабляют действие цитоток-
сических Т-клеток).
4.4. Роль обратных связей
В течение тысячелетий эволюция создавала иммунную си-
систему, способную достаточно эффективно справляться с пато-
патогенами. Коэволюция иммунной системы и патогенов неизбежно
4.4. Роль обратных связей 93
приводит к определенному снижению эффективности иммуните-
иммунитета, так как предполагает наличие компромисса между возмож-
возможностями патогенов и иммунной системы. Эволюция зависит от
цены поддержания системы иммунитета и ущерба, наносимого
патогенами. На направление и скорость эволюции также влияет
ее предшествующая история. Отметим, что объемы производств
фармацевтической индустрии указывают, хотя и косвенно, на
недостатки нашей иммунной защиты.
Позволяет ли эволюционный подход связать повышение эф-
эффективности функционирования иммунной системы с общими
целями всего организма? Специалисты по теории эволюции дают
отрицательный ответ. Они (как и мы) считают, что история
жизни на Земле эквивалентна поведению динамических систем,
которое подчиняется законам физики и химии, а поэтому нет
оснований считать, что при этом что-то оптимизируется [16,22].
Несмотря на то, что общей цели, к которой «стремится»
иммунная система, может и не существовать, иногда исследо-
исследователям удобно использовать гипотезу о наличии такой цели.
В классических работах по теории эволюции показано, что при
определенных условиях продуктивным является предположение
о том, что в ходе эволюции максимизируется величина «при-
«приспособленности». «Приспособленность» можно определить как
долговременный репродуктивный успех. Предположение о мак-
максимизации приспособленности относится к моделям, а не к дей-
действительности, поэтому оно является упрощением, дающим, од-
однако, определенное понимание сложных механизмов эволюции.
Предположим, что иммунная система изменяется в соответ-
соответствии с эволюционным критерием, что приводит к увеличению
долговременного репродуктивного успеха соответствующих ин-
индивидов. Проблема состоит в том, что для оценки текущих ре-
реакций иммунной системы эволюционный критерий является
слишком общим и размытым. Поэтому организм должен иметь
возможность интерпретировать этот критерий для процессов бо-
более низкого уровня. Допустим, что такая интерпретация име-
имеет вид предположения о наличии физиологического критерия
эффективности иммунной системы, состоящего в минимизации
суммарного повреждения организма в результате действий как
патогена, так и иммунных реакций против патогена. Опишем
молекулярные и клеточные механизмы, которые могут обеспечи-
обеспечивать реализацию такого физиологического критерия.
Ключевым элементом такого механизма является обратная
связь. Причем не связь обычного типа, когда управление си-
системой основывается на величине различия между желаемым и
94 Гл. 4. Иммунитет и автономные децентрализованные системы
реальным состоянием системы. Скорее речь идет о выявлении
путем небольших изменений в работе иммунной системы во
время заболевания «позитивных» или «негативных» тенденций,
что позволяет повысить эффективность борьбы с патогеном.
Аналогичные ситуации часто встречаются в биохимии, где на
активность фермента влияет множество факторов. Точную цель
этих многочисленных обратных связей установить очень трудно,
но можно утверждать, что набор множественно регулируемых
ферментов позволяет организму одновременно контролировать
концентрации различных и важных для жизни веществ.
Обратная связь может помочь иммунной системе в решении
двух проблем: 1) оптимизации функции данного эффектора и
2) оптимизации выбора типа эффекторов. Возникающие при этом
задачи мы проиллюстрируем с использованием простых матема-
математических моделей. Наша цель заключается в выяснении стра-
стратегии решения таких задач. Представляется, что такой подход
может быть полезен для разработки эффективных искусственных
иммунных систем.
4.5. Оптимизация функции эффекторов
Сначала рассмотрим реакцию клона эффекторных клеток
против одного штамма патогена. Нашей главной задачей являет-
является рассмотрение случая, когда повреждение патогеном организма
хозяина сопровождается разрушением клеток организма хозяи-
хозяина под действием эффекторов, уничтожающих патоген. В этом
случае возникает проблема выбора, так как сильная реакция
эффекторов приводит к серьезному повреждению организма, а
слабый ответ эффекторов не подавляет патоген, что затягивает
инфекцию и позволяет патогену нанести значительные повре-
повреждения.
Предположим, что эффекторные клетки Е секретируют ток-
токсичное вещество N (как, например, макрофаги — окись азота).
Если gjy — скорость распада N, то
d^- = sE-gNN. (la)
Предположим, что патоген Р размножается по экспоненциаль-
экспоненциальному закону с константой скорости г и уничтожается клетками-
эффекторами Е со скоростью, пропорциональной произведению
ЕР (вероятности встречи эффектора и патогена). Уничтожение
патогена определяется локальной концентрацией N, создаваемой
эффекторами. Так как наша модель не учитывает пространствен-
пространственную неоднородность, то мы предполагаем, что средняя концен-
4.5. Оптимизация функции эффекторов 95
трация N отражает локальные концентрации. Таким образом,
скорость уничтожения патогенов пропорциональна произведению
Е на Р и на N: ,р
^ = rp -aEPN. A6)
Будем считать, что скорость размножения эффекторов пропорци-
пропорциональна количеству патогенов, а константа скорости их гибели
равна gE:
В качестве меры эффективности защиты будем использовать
величину а — среднюю скорость повреждения организма:
т
(T = ^\(hPP + HNN)dt. B)
о
В этом выражении hp и hjy обозначают константы скорости по-
повреждения клеток организма за счет патогена Р и токсического
вещества N соответственно.
Уравнения Aа-1в) и выражение B) составляют нашу первую
модель, которую назовем модель А. Характерный вид ее ре-
решений сохраняется для широкой области значений параметров.
Популяция патогена сначала растет, а затем, когда стимули-
стимулируется достаточно много эффекторов, начинает убывать. Когда
численность популяции патогена сокращается до низкого уровня,
эффекторы начинают гибнуть быстрее, чем размножаться, и в
результате их популяция резко уменьшается. Это в свою очередь
приводит к возобновлению роста популяции патогена, и весь
процесс начинается сначала. Таким образом, решение постоянно
осциллирует.
Пренебрежем всеми подъемами концентрации патогена, кро-
кроме первого. Тогда интервал интегрирования можно ограничить
временем Т, где Т — период осцилляции. Более точно, мо-
момент времени Т выбирается таким, что величина hpP + h^N
достигает минимального значения. Аналогичное определение Т
использовалось в работе [2]. Обоснованием такого приближения
является то, что в большинстве случаев осцилляции не влияют
на иммунную реакцию. Возобновление роста патогена начина-
начинается, как правило, со столь низкого уровня, что использова-
использование дифференциальных уравнений перестает быть корректным
приближением. При очень низких средних уровнях патогена Р
у большинства хозяев его нет вообще, так как инфекция эли-
элиминируется в результате случайных событий, не описываемых
в модели А. Ранее это явление рассматривалось в работе [9].
96 Гл. 4. Иммунитет и автономные децентрализованные системы
На рис. 4.1 показаны результаты численного решения уравне-
уравнения A) модели А. Средняя скорость повреждения организма а
представлена как функция константы скорости секреции s. Как
и можно было ожидать, существует оптимальная скорость сек-
секреции, при которой минимизируется средняя скорость повреж-
повреждения а. На рис. 1 б и \в показана зависимость оптимального
Р@) = 2
Р@)=10
4 5 6 7 8 9 10 1Н, с
10 11 t,c
Рис. 4.1. Модель А: зависимость скорости повреждения о от начального
количества патогена: Р@) = 2 (а); Р@) = 10 (б); Р@) = 50 (в). Показано
численное решение уравнения A). Значения параметров: gN = 30, г = 5,
а = 0,02, цР = 0,1, gE = 3, hP = I, hN = 1, Е@) = 1, N@) = 0
значения от начального количества патогена. Видно, что при
увеличении численности начальной популяции оптимуму соот-
соответствует более сильное повреждение хозяина эффекторами, так
как необходимо усиливать уничтожение патогенов для уменьше-
уменьшения причиняемого ими вреда.
Эти результаты иллюстрируют очевидную мысль о том, что
оптимум защиты не абсолютен, но зависит от внешних условий,
в которых находится организм. Как иммунная система опреде-
определяет правильный баланс между уровнем повреждения хозяина и
эффективностью уничтожения патогенов при различных значе-
значениях таких факторов, как вирулентность и количество патогенов?
Ответ состоит в том, что у организма должны быть приспособ-
4.5. Оптимизация функции эффекторов 97
ления, позволяющие отслеживать основные характеристики ин-
инфекции. Например, в модели А можно добавить две переменные:
вещество К — «индикатор уничтожения», которое характеризу-
характеризует элиминацию патогена, и вещество Я, характеризующее по-
повреждения хозяина. Скорость образования К пропорциональна
скорости уничтожения патогена (см. уравнение A)), а константа
скорости его распада равна gK-
^ = cK(aEPN)-gKK. (За)
Скорость образования Я пропорциональна суммарной скорости
повреждения клеток хозяина как патогеном, так и эффекторами
(см. уравнение B)). Константу скорости распада Я обозначим
gH, тогда
d-g = cH(hPP + hNN) - gHH. C6)
Величину Нр — количество клеток хозяина, пораженных пато-
патогеном, можно оценить при помощи выражения
Выражение (Зв) показывает, что Нр стремится к нулю при
достаточно больших значениях N (таких, что все повреждения
связаны с эффекторами), и Нр « Н при достаточно малых N
(все повреждения вызваны патогеном). Заметим, что выражение
(Зв) имеет простое биохимическое обоснование; это классиче-
классическое выражение для описания действия ингибитора (N) и агони-
ста (Я).
Теперь в нашем распоряжении имеются три переменные, со-
содержащие важную информацию о взаимодействиях между пато-
патогенами и иммунной системой: повреждение хозяина патогеном
(Нр), повреждение хозяина иммунной системой (N), и скорость
уничтожения патогена (К). Покажем, как можно использовать
эту информацию, если предположить, что указанные три ве-
вещества влияют на скорость пролиферации эффекторов (точнее,
скорость активации и/или пролиферации, так как Е представ-
представляет собой эффективность эффекторов). Эта гипотеза приводит
к следующей модификации выражения Aв):
d] Cг)
При прочих равных условиях повреждение хозяина эффектора-
эффекторами должно ослаблять иммунный ответ. Следовательно, увеличе-
увеличение N должно приводить к подавлению активации и размноже-
4 Д. Дасгупта
98 Гл. 4. Иммунитет и автономные децентрализованные системы
ния эффекторов в выражении (Зг). С другой стороны, иммунный
ответ должен усиливаться как в результате повреждения хозяина
патогеном Яр, так и уничтожения патогенов К. Союз «и» озна-
означает произведение Нр я К в выражении (Зг). Предполагается,
что эффект усиления активации и размножения ослабевает при
больших значениях произведения, то есть происходит насыще-
насыщение. Новая модель Б представляет собой систему уравнений
Aа)-Aб) и (За)-(Зг).
Рисунок 4.2 аналогичен 4.1, но построен для модели Б. Вид-
Видно, что в этом случае оптимальная скорость секреции существен-
существенно ниже, чем в модели А, а соответствующая ей скорость повре-
повреждения организма хозяина а уменьшилась примерно в два раза.
Р@) = 2
Р@)=10
б
Рис. 4.2. Модель Б. Зависимость скорости повреждения организма от началь-
начального количества патогена: Р@) = 2 (а); Р@) = 10 (б). Численное решение
системы (la-16 и За-Зг). Значения параметров: ск = 5, gK = 1, сн = 1,
gH = 1, kp = 1, /ip = 0,1, qKH = 1. Величины остальных параметров те же,
что и на рис. 4.1
Графики на рис. 4.3 позволяют понять причину этих изменений.
Использование в модели Б дополнительной информации приво-
приводит к тому, что оптимальное решение характеризуется гораздо
более медленной секрецией N, чем в модели А (ср. решения на
рисунках 4.1 и 4.2). Несмотря на более низкую скорость секре-
секреции, общее количество N в обоих случаях примерно одинаково
(рис. 4.3 в), хотя популяция эффекторов в решении модели Б бо-
более многочисленна (рис. 4.3 б). Одинаковые уровни N означают
близкие скорости повреждения хозяина эффекторами, а значи-
значительно более высокий уровень эффекторов обеспечивает более
интенсивную элиминацию патогена (рис. 4.3 а) и, следовательно,
значительное снижение повреждения хозяина патогеном.
В ходе вычислений в качестве меры повреждения хозяина
эффекторами мы использовали концентрацию вещества N. Более
точно это повреждение можно оценить величиной Не — раз-
4.6. Оптимизация выбора эффекторов
99
ностью между общим повреждением организма и Нр — повреж-
повреждением, вызванным патогеном:
НЕ = Н - НР =
kpN
D)
Приведенные на рис. 4.2 а графики позволяют оценить влияние
замены в уравнении (Зг) переменной N на Не- Видно, что ве-
величина оптимума при этом изменяется незначительно. Это дает
основание утверждать, что выбор эффективной стратегии может
3 Время
3 Время
Рис. 4.3. Динамика патогена Р (а), эффекторов Е (б) и токсичного веще-
вещества N (в). Сплошная линия соответствует решению модели А, пунктирная —
модели Б. Р@) = 2, а остальные параметры те же, что и для рис. 4.1 и 4.2
осуществляться несколькими примерно равноценными способами,
позволяющими иммунной системе реализовать данную схему под-
подстройки на языке межклеточных связей. В этом случае задача ста-
ставится в таком виде: при прочих равных условиях повреждение
организма хозяина иммунной системой должно угнетать иммун-
иммунный ответ.
4.6. Оптимизация выбора эффекторов
Предположим, что имеется несколько типов эффекторов с раз-
различными характеристиками, и рассмотрим возможные способы вы-
выбора иммунной системой наиболее эффективного варианта защиты.
100 Гл. 4. Иммунитет и автономные децентрализованные системы
Иммунный ответ происходит в результате действия ряда
факторов, таких как, например, быстро растущая концентрация
патогенов [12] или выявление признаков «враждебности» [20].
Допустим, что одновременно активируется несколько различных
типов эффекторов, характеристики которых можно измерить.
Рассмотрим возможные условия для решения задачи выбора наи-
наиболее эффективных эффекторов. Адекватной мерой компетентно-
компетентности эффекторов будем считать уничтожение патогенов. Предпо-
Предположим также, что сначала иммунный ответ как бы «размыт», но
постепенно становится более сфокусированным за счет того, что
активация и размножение эффекторов каждого типа пропорцио-
пропорциональны тому, насколько успешно они уничтожают патогены. На
основе простой математической модели, описывающей взаимоот-
взаимоотношения между патогеном Р и несколькими «конкурирующими»
типами эффекторов покажем, как это предположение может быть
реализовано иммунной системой.
Пусть переменные Е и F обозначают (эффективное) количе-
количество двух типов эффекторов. Для учета влияния пространствен-
пространственного распределения рассмотрим два компартмента и обозначим
их индексом г: г = 1,2. Клетки и вещества могут диффундиро-
диффундировать из одного компартмента в другой со своими коэффициента-
коэффициентами диффузии Aк-
Патогены Р в г-м компартменте размножаются с константой
скорости г, уничтожаются эффекторами Е и F с константами
скорости а и b и диффундируют в другой компартмент:
^ + bF.)p. + d- P(Pj - Р{). E)
Состояние каждого компартмента описывается своим уравнени-
уравнением, при этом г ф j.
Обобщая (За), введем в рассмотрение вещество К — «инди-
«индикатор уничтожения», характеризующее количество уничтожен-
уничтоженных патогенов. Скорость образования К пропорциональна ско-
скорости уничтожения патогенов. Кроме того, К распадается и
диффундирует. Таким образом, уравнение для К имеет следую-
следующий вид:
^ = cK(aEi + bFi)Pi - gKKi + dK{Kj - Ki). F)
Уравнения для эффекторов Е и F описывают процессы актива-
активации и размножения, гибели и потери активности (учитывается
параметром g), а также диффузии в другой компартмент. При
описании активации и размножения используется возрастающая
4.6. Оптимизация выбора эффекторов 101
функция с насыщением, зависящая от К:
-E^ Ga)
где п — константа насыщения (Михаэлиса), равная величине К,
при которой скорость реакции равна половине от максимальной.
Уравнения E)-G) образуют модель В.
Слагаемые, описывающие активацию и размножение (про-
(пропорциональны q), те же что и в уравнениях Gа) и G6). Они
описывают действие сигнальных веществ и клеток-помощни-
клеток-помощников, поэтому нет оснований предполагать, что взаимодействие
с одним типом эффекторов может быть предпочтительнее, чем
с другими. Каким же образом неспецифический сигнал может
выделить те эффекторы, которые наиболее эффективно уни-
уничтожают патогены? В этом случае в дело вступает геометрия.
Предположим, что в начале эффекторы Е сосредоточены вокруг
некоторой точки Р\, а эффекторы F — вокруг точки Р2. В случае
модели В эффекторы сосредоточены в компартменте 1, a F — в
компартменте 2. Предположим, что клетки Е в отличие от F эф-
эффективно уничтожают патоген. Тогда «индикатор уничтожения
патогена» К продуцируется преимущественно около точки Pi, и
поэтому эффекторы Е размножаются быстрее, чем F. На рис. 4.4
показано решение, описывающее такое поведение. В начальный
момент времени в компартменте 1 имеется одна единица Е, а
в компартменте 2 — единица F'. Эта начальная концентрация
очень мала по сравнению с более поздними концентрациями Е
и F'. Клетки Е уничтожают патоген в десять раз быстрее, чем
F; это приводит к тому, что К\ гораздо больше, чем К2. В ре-
результате клетки Е размножаются быстрее и достигают большей
концентрации, чем F. Ускоренное размножение Е\ обеспечива-
обеспечивается положительной обратной связью:
Е уничтожают больше Р —> больше К —> больше Е.
При исследовании модели В мы ограничимся решением задачи
выбора таких значений параметров, относящихся к сигнальным
молекулам К, которые обеспечивают повышение эффективности
иммунного ответа. Величина М будет использоваться в качестве
меры качества иммунного ответа. Она определяется как разность
между суммарным количеством высоко эффективных клеток Е,
наработанных в обоих компартментах, и суммарным количеством
102 Гл. 4. Иммунитет и автономные децентрализованные системы
менее эффективных клеток F. Предположив, что концентрация
клеток пропорциональна их выработке, получаем:
т
М = \(ЕХ + Е2- Fx- F2)dt. (8)
о
Время Т соответствует моменту времени, когда E{t) уменьшает-
уменьшается до заранее выбранной малой величины.
F\>F2
100
50
\ п = 5000
10 Время 20
700
350
\ n
= 1000
= 5000
-чл=150
Время
14
2,5 _ 5,0
Время
Рис. 4.4. Модель В. Более эффективные клетки Е (а); менее эффективные
клетки F (б); индикатор уничтожения патогена К (в); количество патогена
Р (г). При проведении расчетов использовалось несколько значений пара-
параметра п. Модель задается системой уравнений E)-G). Динамика перемен-
переменных в компартменте 1 показана сплошными линиями, в компартменте 2 —
пунктирными. Значения параметров: г = 5, а = 8, b = 0,8, dp = 5, ск = 20,
gK = 0,5, d,K = 1, q = 2,5, gE = gF = 0,8, cLe = d,F = 0,1. Начальные
значения зависимых переменных: Pi@) = Рг@) = 10, i?i@) = ^@) = 1,
^2@) = Fi@) = ATi(O) = АГ2(О) = 0
Рассмотрим динамику величины М.
1. При увеличении коэффициента диффузии dx в диапазоне
от 0,01 до 100 величина М уменьшается (увеличение скоро-
скорости перемешивания уменьшает различия между компартмен-
тами).
4.6. Оптимизация выбора эффекторов
103
1200 ft
2. При увеличении времени жизни вещества К (l/gx) в
интервале от 0,002 до 4 величина М сначала растет, а затем
снижается (если время жизни К очень мало, то его влиянием
можно пренебречь. Напротив, если время жизни велико, то
вещество К «помнит» всю историю действия эффекторов,
что постепенно приводит к сглаживанию различий между
компартментами за счет диффузии).
3. При увеличении скорости образования К (параметр ск)
в интервале от 0,1 до 20 величина М достигает максималь-
максимального значения при ск — 1 {низкая скорость образования К
означает, что К ни на что не влияет. Следствием высокой
скорости образования К яв-
является максимальная ско-
скорость размножения эффекто-
эффекторов в обоих компартментах и
равенство скоростей размно-
размножения Е и F).
4. Величина М достигает
минимума при промежуточных
значениях п. Более подробно о 2500 5000
эта зависимость представлена
на рис. 4.5, а ее обсуждение —
в приложении 1.
Отметим, что зависимость
эффективности иммунного от-
ответа от величины п меняется
на обратную, если использовать нормированную меру качества
иммунного ответа — М, получающуюся в результате деления ин-
интеграла разности уровней эффекторов на интеграл от их суммы:
Рис. 4.5. Модель Г. Зависимость ве-
величины М (уравнение (8)) от пара-
параметра п в уравнении G). Величины
остальных параметров те же, что и
для рис. 4.4
](ЕХ + Е2 - Fx - F2) dt
| .
](ЕХ + Е2 + Fx + F2) dt
(9)
На рис. 4.6 видно, что максимальное значение нормированной
меры качества иммунного ответа М достигается при проме-
промежуточном значении п. Такая зависимость является следствием
низкого уровня эффекторов при промежуточных значениях п
(см. рис. 4.4). Какой вид зависимости больше соответствует био-
биологическому смыслу: М или М? Показатель М отражает абсо-
абсолютную разницу между наработкой более и менее эффективных
клеток, а в показателе М эта разница нормализована. Мож-
104 Гл. 4. Иммунитет и автономные децентрализованные системы
10000
Рис. 4.6. Аналогично рис. 4.5, но
вместо М используется М (форму-
(формула (9))
но предположить, что М — «удельный» показатель качества в
пересчете на одну клетку — будет полезен в случаях, когда
важна цена образования кле-
клеток. И напротив, можно предста-
представить ситуации, когда угрожаю-
угрожающий жизни патоген должен быть
уничтожен независимо от цены;
в этом случае М является адек-
адекватной мерой качества иммунно-
иммунного ответа.
Процесс преимущественного
размножения более эффектив-
эффективных клеток Е постепенно зату-
затухает из-за диффузии как сиг-
сигнального вещества, так и самих
клеток Е и F. Система будет функционировать более устойчиво
и надежно, если процесс отбора будет более жестким и после-
последовательным. Как хорошо известно из теории формообразова-
формообразования [21], основной способ сделать отбор более жестким состоит
в сочетании ближней активации и дальнего подавления.
В модели В для оптимизации выбора эффекторов в уравнении
G) используется процесс активации и размножения, усиливаю-
усиливающийся под действием К. Еще одним биологически обоснованным
способом является подавление клеток F в результате успеха
клеток Е. Предположим, что, как и раньше, К усиливает сигнал
размножения клеткам Е, но фактически этот сигнал переносится
клетками А. Предположим далее, что клетки А обладают поло-
положительным хемотаксисом к К, то есть клетки А перемещаются
в направлении более высокой концентрации К. Тогда начальное
нарастание величины К приведет не только к преимущественной
поддержке Еь но и к перемещению клеток А из компартмента 2
в компартмент 1. Дополнительные клетки А еще больше усилят
размножение Е\, что приведет к дальнейшему уничтожению
патогенов и, следовательно, увеличению выработки К\. Исчез-
Исчезновение клеток А из компартмента 2 приводит к снижению К^.
В результате происходит увеличение разности концентрации К
и, следовательно, миграции А из компартмента 2 в 1. Случайные
возмущения противодействуют этому процессу, но тем не менее
хемотаксис существенно усиливает размножение Е и ингибирует
менее эффективные F.
Для изучения этого сценария введем уравнение для клеток А
со стандартным дискретным описанием случайных блужданий и
хемотаксиса [14]. Общее количество клеток А считается посто-
4.7. Влияние пространственной структуры 105
янным. Их участие в увеличении темпа размножения моделиру-
моделируется при помощи умножения параметра ск на А{ (см. уравнение
F)). Расчеты показали, что учет явления хемотаксиса значи-
значительно увеличивает скорость размножения клеток Е и подавляет
размножение клеток F.
Имеющиеся данные указывают, что в роли клеток А мо-
могут выступать макрофаги, а также что многие используемые в
этой работе предположения биологически вполне обоснованны.
Например, роль вещества К — показателя уничтожения бакте-
бактерий — могут играть бактериальный белок теплового шока или
вызывающие иммунный ответ палиндромные последовательно-
последовательности ДНК [26], а также специфические для бактерий N-формил-
метиониновые белки, являющиеся сильными хемоаттрактантами
лейкоцитов [28].
4.7. Влияние пространственной структуры
Если принять во внимание, что антитела и рецепторы Т-кле-
ток способны распознавать большое количество разных анти-
антигенов, то разнообразие видов эффекторов в иммунной системе
становится астрономическим. Количество различных цитокинов,
координирующих эти эффекторы, несопоставимо меньше. Каким
же образом, используя всего несколько сигнальных веществ,
среди миллиардов клеток выбираются те немногие, которые необ-
необходимы для иммунного ответа?
В предыдущем разделе было показано, что отбор возможен,
если группы идентичных клеток пространственно разделены (на-
(например, клетки Е сосредоточены в компартменте 1, a F — в ком-
партменте 2). Благодаря положительной обратной связи с успеш-
успешным функционированием клеток одной группы и отрицательной
обратной связи с неудачей клеток другой группы, клетки пер-
первой группы получают дополнительный стимул для размножения,
а клетки второй группы ингибируются.
На первый взгляд, такую пространственную структуру со-
создать трудно. В частности из-за того, что патогены обычно
концентрируются в тканях, а содержание лейкоцитов в них,
как правило, низкое. Патогены крови обитают в турбулентной
среде, в которой отсутствует какая-либо устойчивая клеточная
структура. Однако активность иммунной системы, в основном,
локализована в лимфатических узлах, расположенных вблизи
очага инфекции. «Образцы» патогена переносятся в лимфатиче-
лимфатические узлы с током лимфы и/или специальными дендритными
клетками. Затем в результате сложных взаимодействий лимфо-
106 Гл. 4. Иммунитет и автономные децентрализованные системы
цитов нескольких типов начинает развиваться локальный иммун-
иммунный ответ. Следовательно, можно предположить, что имеющаяся
пространственная организация лимфатического узла позволяет
осуществить необходимый отбор среди разных групп клеток.
(Селезенка выполняет аналогичную роль, особенно для инфек-
инфекций крови.) После селекции в этих «стычках» или «имитациях»
(термин предложен Робом Де Буром), отобранные клетки стано-
становятся основой для создания большого количества эффекторов,
предназначенных для главной схватки с патогеном. Известно,
что некоторые В-клетки проходят через лимфатический узел,
попадают в костный мозг, где размножаются и затем мигрируют
в инфицированную ткань.
Другой областью, где обратные связи могут модулировать
образование пространственных структур, является поверхность
кровеносных сосудов, расположенных вблизи очага инфек-
инфекции [3].
4.8. Каналы связи
Связь между клетками иммунной системы осуществляется
при помощи специальных молекул. Некоторые из них секрети-
руются, диффундируют и связываются с рецепторами на клет-
клетках как гормоны. Передача других сообщений требует контакта
между молекулами-передатчиками, расположенными на поверх-
поверхности клеток. Вероятно, внутриклеточные связи являются даже
более сложными, чем межклеточные. После связывания рецеп-
рецепторов внутри клетки начинается каскад сопряженных процес-
процессов, конечным результатом которых будет изменение активности
определенных генов. Существуют также опосредованные каналы
связи, например, в виде направленного перемещения клеток для
их дальнейшего созревания или действия против патогенов.
Анализ данных приводит к важному обобщению, касающе-
касающемуся всех сигналов: все сигнальные молекулы участвуют в реа-
реализации сразу нескольких задач и каждая задача регулируется
несколькими сигналами. То есть имеют место сетевые взаимо-
взаимодействия. Мы считаем, что при наличии большого числа кри-
критериев оценки функции иммунной системы такая плейотропия
неизбежна. Подтверждения этому предположению были получе-
получены при моделировании «эволюции» иммунной системы. Задача
улучшения набора параметров модели решалась с использовани-
использованием генетического алгоритма. Если модель была достаточно слож-
сложна и/или помещалась в сложную среду, то всегда появлялись
сети плейотропных связей.
4.9. Другие подходы к изучению децентрализованных систем 107
Структуры связей естественных и искусственных иммунных
систем довольно сложны и с трудом поддаются полному описа-
описанию. В частности, эта проблема была рассмотрена на примере
относительно простого случая создания нейронной сети, предна-
предназначенной для решения конкретных задач [7,4]. Тем не менее мы
считаем, что рассмотрение задачи управления распределенными
децентрализованными системами с различных позиций дает по-
полезное общее понимание систем, даже если детали их работы
остаются загадкой.
4.9. Другие подходы к изучению
децентрализованных систем
Что может дать изучение иммунной системы для понимания
общих принципов функционирования совокупностей независи-
независимых агентов и их способности к «интеллектуальной» активности?
Для ответа на этот вопрос необходимо тщательно сопоставить
идеи, относящиеся к иммунной системе, с представлениями о
распределенных интеллектуальных системах. В этой главе мы
приведем лишь несколько примеров, показывающих полезность
такого сопоставления.
Во многих работах отмечается важность пространственного
фактора. Например, Мейс [17] предлагает подход с использова-
использованием «размещенных агентов». В указанной работе обсуждается,
как для отбора среди конкурирующих целей можно использовать
распространение волны активации, при этом возникают явные
аналогии с функционированием иммунной системы. Мейс по-
попытался "отказаться от использования «бюрократических моду-
модулей», единственная задача которых заключается в воздействии
на функции других агентов, которые и изменяют свое окру-
окружение". С другой стороны, в иммунной системе «бюрократы»
Т-хелперы очень важны для управления эффекторами (в нашей
модели участие Т-хелперов только подразумевается, но прямо
они не описываются).
Одной из центральных проблем организации группы агентов
для выполнения определенной задачи является «распределение
задач» и вознаграждений за успешное достижение поставлен-
поставленных целей и подцелей (или наказаний за неудачи) между аген-
агентами (хорошим введением в эту проблему является классиче-
классическая статья [8], посвященная компьютерным чекерам, см. также
[2,25,19]). Подчеркнем, что главным способом вознаграждения
за данное действие служит подкрепление агентов, расположен-
расположенных в окрестности места действия. Другой способ поощрения,
108 Гл. 4. Иммунитет и автономные децентрализованные системы
предложенный в данной работе, связан с перераспределением
повреждения организма между эффекторами и патогеном. Про-
Простая, построенная по «ассоциации» комбинация переменных (Зв)
обеспечивает разумное решение этой задачи. Способность функ-
функции (Зв) тонко выделять контекст состояния системы созвучна с
многочисленными данными о перекрестных влияниях цитокинов
в иммунной системе.
В работе [18] рассмотрена задача обучения групп роботов вы-
выбору вариантов поведения из заранее определенного набора. На
примере этого исследования обсудим сходство и различие между
иммунитетом и другими децентрализованными системами.
Роботы решают конкретную задачу: собрать в заранее опре-
определенном месте («доме») разбросанные объекты (шайбы). Реше-
Решение задачи ищется в виде обучаемых (адаптивных) и взаимоис-
взаимоисключающих вариантов поведения:
осторожное блуждание,
рассредоточение,
возвращение домой.
(В этом упрощенном описании пропущены действия, несуще-
несущественные для целей сопоставления, в частности, игнорируется
необходимость подзарядки батарей роботов.) Выбор вариантов
поведения зависит от состояний:
есть шайба (S\),
есть сосед (#2).
Автоматически выполняются следующие действия:
взять шайбу (А\),
отнести шайбу домой (Л2),
унести шайбу из дома
В любой момент времени t каждой паре с зависимым пове-
поведением (behaviour-condition) приписывается счет в виде норма-
нормализованной суммы подкреплений (положительных — вознаграж-
вознаграждений, или отрицательных — наказаний), полученных данной
парой в прошлом. Подкрепления обновляются после каждого
события:
действие,
изменение поведения.
Действия А\ и А^ дают положительное подкрепление, А^ —
отрицательное. При состояниях S\ и $2 подкрепление положи-
4.9. Другие подходы к изучению децентрализованных систем 109
тельное, если расстояние до дома или до соседа увеличивается;
если расстояние сокращается, то подкрепление отрицательно.
Слишком маленькое подкрепление ведет к прекращению текуще-
текущего поведения, а следующее поведение данного робота выбирается
так: если робот не имеет пары, то выбирается еще не исполь-
использованное поведение, в противном случае выбирается поведение
с максимальным счетом.
Хотя «общеизвестно, что эффективность роботов трудно оце-
оценить», в [18] такие оценки были получены путем сравнения двух
матриц счетов для пар поведение-состояние: «желательной» и
полученной в результате обучения. Показано, что в 90% экспери-
экспериментов в результате обучения получается желательная матрица.
Сравним свойства иммунной системы и системы роботов,
собирающих шайбы [15].
• У иммунной системы нет четко определенной общей цели.
• Клетки иммунной системы могут осуществлять различ-
различные варианты поведения: секретировать, уничтожать па-
патогены, перемещаться (диффундировать) и активировать-
активироваться/размножаться.
• В иммунной системе разные варианты поведения могут
выполняться одновременно, а не строго последовательно,
как в случае роботов.
• Вместо использования подкрепления для выбора следую-
следующего варианта поведения (как роботы), в иммунной систе-
системе интенсивность всех вариантов поведения регулируется
с помощью обобщенной функции размножения.
• Аналогом показателей успеха (счета) роботов в иммунной
системе являются концентрации сигнальных веществ, та-
таких как К и Н. У роботов имеется ясная цель. В случае
иммунной системы «позитивное изменение» определяется
на основе сопоставления с размытой и неявно определен-
определенной целью, которую приблизительно можно определить как
«минимизация связанных с патогеном повреждений, вызы-
вызываемых как непосредственно патогеном, так и иммунной
реакцией».
• События в иммунной системе носят непрерывный характер
(это различие не очень важно, так как модель иммунной
системы можно представить в дискретной формулировке).
• Интегрирующие связи иммунной системы представлены
диффундирующими веществами.
В моделях искусственного интеллекта проблема взаимоот-
взаимоотношений между простыми автономными агентами возникает не
ПО Гл. 4. Иммунитет и автономные децентрализованные системы
только в приложениях, сходных с координацией действий группы
роботов. Примером более сложной системы, в которой такие
отношения играют важную роль, служит проект построения ана-
аналогий Хофстадтера и Митчела [23]. Предварительный анализ
выявил аналогии с иммунной системой и в этом случае.
Другой сложной проблемой, для изучения которой может
быть полезна аналогия с иммунной системой, является целена-
целенаправленное поведение систем. В работе [1], посвященной це-
целенаправленной самоорганизации, утверждается, что «хорошая
теория самоорганизации должна объяснить появление разумного
целенаправленного поведения сетей, состоящих из единиц, у
которых нет целей и поведение которых определяется только
локальными законами». В этой работе ставится вопрос: «можно
ли представить машину, цель и задача которой не заданы извне,
а выработаны самой машиной» (курсив автора [1])? Полагаем,
что наши результаты проясняют то, как эволюция может совер-
совершенствовать машины, сходные с иммунной системой. Эта систе-
система может быть описана как имеющая «признаки разумности»,
состоящие в «самостоятельной выработке критериев распознава-
распознавания», и, следовательно, «строго» соответствует критерию самоор-
самоорганизации, приведенному в работе [1]. Однако иммунная система
не является «целенаправленно самоорганизующейся», так как
интерпретация ее поведения идет не из самой системы, а от
ученых, которые (интеллектуально, но не физически) отделены
от исследуемой системы.
4.10. Заключение
Иммунная система представляет большой интерес для ис-
исследователей, так как является сложным, но в целом понятным
биологическим явлением и очень важным для медицины фи-
физиологическим механизмом. Кроме этого, по нашему мнению,
иммунная система интересна как образцовый пример распреде-
распределенной интеллектуальной системы и решения задачи управления
такой системой для достижения сложных целей. Более того,
решение задачи управления, используемое иммунной системой,
является одним из вариантов, созданным и затем забытым в ходе
эволюции.
Механизмы функционирования иммунной системы хорошо
изучены, за исключением, пожалуй, влияния некоторых особен-
особенностей реакций клеток на достижение общих целей. Ситуация
в нейробиологии существенно иная: очень немного известно о
связях между клеточным уровнем и поведением — прежде всего
4.10. Заключение 111
из-за чрезвычайной сложности поведения организма. Все это
подчеркивает значение изучения иммунной системы для пони-
понимания общих принципов функционирования распределенных ин-
интеллектуальных систем.
Одним из направлений исследований является использование
идей и методов естественной иммунологии для решения таких
«искусственных» проблем, как борьба с компьютерными виру-
вирусами [10]. Возможно, еще важнее собрать сведения о работе
иммунной системы, касающиеся устройства распределенных си-
систем, позволяющие ей решать сложные задачи.
Интересны результаты первых попыток изучения роли когни-
когнитивных аспектов иммунологии [5,6,27]. В работе [15] Кон и
Лэнгман обратили внимание на то, что подходящие эффекторы
нужно как-то отбирать из исходно широкого набора отвечающих
клеток, и высказали ряд идей о том, как это может проис-
происходить. В работе [11] подчеркивается важность «сигналов об-
обратной связи, характеризующих суммарную эффективность всех
клеток» и отмечается, что «этот сигнал может быть локальной
мерой стресса тканей и усиливать процессы, коррелирующие
со снижением стресса». В работах [11,12] подчеркивается, что
порог активации и другие внутриклеточные механизмы должны
настраиваться и «обучаться», улучшая иммунный ответ, хотя
обсуждение в основном касается отбора из числа предсуще-
ствующих клеток.
В данной работе мы рассматриваем задачу, как улучшить
иммунный ответ, не зная, что является хорошим ответом. Тра-
Традиционный подход к созданию системы, выполняющей некото-
некоторый спектр задач, включает разработку универсальной меры
эффективности выполнения всех этих задач, а затем выбор та-
такой структуры и параметров системы, при которых эта мера
достигает экстремума. В случае таких сложных явлений, как
иммунная защита, довольно непросто (как для эволюции, так и
для ученых) сконструировать удовлетворительную меру качества
достижения комплекса разнообразных целей.
Индикатор повреждения клеток организма Н является ра-
разумной мерой эффективности иммунной системы. Отметим, что
процессы распада и диффузии искажают точность, с которой Н
характеризует суммарное повреждение. Вместе с тем, при всех
недостатках величина Н дает ценную информацию, и одна из
основополагающих идей нашей работы заключается в том, что
даже несовершенная мера эффективности очень полезна при
решении задач достижения комплекса целей.
112 Гл. 4. Иммунитет и автономные децентрализованные системы
О каких целях идет речь? Минимизация скорости поврежде-
повреждения организма является шагом в правильном направлении. Что
следует минимизировать: среднюю или максимальную скорость
повреждения (что позволит избежать летальных исходов), или
какую-то комбинацию этих двух скоростей? Как учитывать то,
что одни органы гораздо важнее, чем другие? Или то, что одни
ткани восстанавливаются гораздо быстрее, чем другие? Соче-
Сочетание каких патогенов должно быть взято в качестве основы
при решении задачи минимизации? Эти вопросы приводят к
эволюционному критерию успеха — максимизации эффективной
долговременной скорости репродукции.
Таким образом, разработка универсальной меры качества яв-
является чрезвычайно трудной задачей. Более того, как уже было
отмечено, даже если такая мера будет предложена, эту конструк-
конструкцию, относящуюся к верхним уровням исследуемой системы,
вероятно, будет невозможно использовать для оценки поведения
компонентов нижнего уровня. Предложенный в этой работе аль-
альтернативный подход опирается на показатели эффективности,
неявно характеризующие распределение в пространстве локаль-
локальных функциональных свойств системы. Эти свойства можно раз-
разделить на две группы. Хорошие свойства (такие как уничтоже-
уничтожение патогенов) и плохие, нежелательные свойства. Если такое
разделение почему-либо затруднено, то данные свойства игнори-
игнорируются, как не влияющие на ответ. Некоторые свойства могут
быть хорошими или плохими в зависимости от обстоятельств.
Наша задача заключается в выявлении «базового набора» таких
характеристик.
В простейшем случае «хорошие» свойства действуют как ак-
активаторы тех локальных единиц, которые эти свойства создают,
а «плохие» действуют как ингибиторы. И хотя путем измене-
изменения величин коэффициентов активации и ингибирования можно
менять относительный вклад различных свойств, тем не менее
окончательный вид функции качества остается неизвестным, и,
как правило, post hoc (вследствие этого) трудно точно опреде-
определить, насколько хорошо в целом функционирует система.
Хорошие и плохие свойства часто перекрываются и кон-
конфликтуют. Как иммунная система вырабатывает необходимые
компромиссы? Мы предполагаем, что это можно сделать путем
регуляции скорости размножения и/или уровня активации дан-
данного типа эффекторов как возрастающей функции благоприят-
благоприятных свойств и убывающей функции неблагоприятных свойств.
В подходящей области значений параметров (которая должна
быть выбрана путем «эволюции»), взаимосвязанная динамика
4.10. Заключение 113
эффекторов будет приводить к селекции элементов, обеспечи-
обеспечивающих адекватный иммунный ответ.
Эволюцию иммунной системы мы рассматриваем как все бо-
более сложную комбинацию элементарных «хороших» и «плохих»
свойств. Эволюционный скачок, создавший такое элементарное
свойство, приводит к сохраняющемуся на протяжении многих по-
поколений изменению. Это связано с тем, что добавление хорошего
свойства или уменьшение плохого улучшает выживаемость ор-
организма. Например, «уничтожение проникших в организм бакте-
бактерий» в целом кажется желательным свойством для позвоночных,
несмотря на явные недостатки такого образа действия (поскольку
многие бактерии безвредны или даже полезны). После того как
элементарное свойство появилось, эволюция может модифициро-
модифицировать новые взаимодействия в организме, повышая со временем
их эффективность.
В результате этой работы можно предложить следующую
трехступенчатую схему управления процессом улучшения функ-
функционирования сложной распределенной системы при отсутствии
явно заданной общей цели: а) определить элементарные под-
подцели, двинуться в правильном направлении; б) оценить сте-
степень приближения к подцелям; в) получить такую комбинацию
оценок приближения, которая позволяет оценивать общую эф-
эффективность системы. В биологических системах поиск такой
эффективной комбинации оценок осуществляется эволюцией.
В случае искусственной распределенной системы, которая на-
настолько сложна, что ее цель не может быть явно сформулиро-
сформулирована, место эволюции может занять интеллектуальный анализ
результатов имитационных вычислительных экспериментов, поз-
позволяющий сопоставить поведение системы в широком диапазоне
условий.
Эта глава является дополненной и переработанной версией
статьи под названием «Иммунная система как прототип автоном-
автономных децентрализованных систем», автор Л.А.Сигел, опублико-
опубликованной в трудах Международной конференции IEEE «Системы,
человек и кибернетика» (Орландо, Флорида, 1997). Мы благодар-
благодарны Р. Де Буру, И.Когану, С.Форрест, Дж. Келсу, П.Матзингеру
и А. Перельсону, Т. Флэш, С. Джилену и М. Матарику за обсуж-
обсуждения, способствовавшие улучшению нашего понимания проблем
децентрализованных систем. Мы благодарны С. Флегельман за
превосходную подготовку рукописи. Работа выполнена при под-
поддержке гранта 95-00526 Научного фонда США-Израиль.
114 Гл. 4. Иммунитет и автономные децентрализованные системы
Список литературы
1. Atlan Н. International self-organization. Emergence and reduction:
towards a physical theory of intentionality. Thesis Eleven, 1998. P. 5-
34.
2. Barto A. G. Reinforcement learning // In: Handbook of brain theory
and Neural Networks (Ed. M.A.Arbib). Cambridge: MIT Press,
1995.
3. Butcher E.C., L.J. Picker. Lymphocyte homing and homeostasis //
Science. 1996. V.272. P. 60-66.
4. Carpenter G.A., Tan A.H. Rule extraction: From neural architec-
architecture to symbolic representation // Connections Science. 1995. V. 7.
P. 3-28.
5. Cohen I. R. The cognitive principle challenges clonal selection //
Immunol. Today. 1992. V. 13. P. 441-444.
6. Cohen I. R. A cognitive paradigm of the immune system // Immunol.
Today. 1992. V. 13. P. 490-494.
7. D'Alche-Buc F., Andres V., Nadal J. -P. Rule extraction with fuzzy
neural network // Intern. J. Neural Systems. 1994. V. 5. P. 1-11.
8. Feigenbaum E.A., Feldman J. Computers and thought. N.Y.:
McGraw-Hill, 1963.
9. Fishman M.A., Perelson A. S. Modeling T cell-antigen presenting
cell interactions // J. Theor. Biol. 1993. V. 160. P. 311-342.
10. Forrest S., Perelson A.S., Allen L., Cherukuri R. Self-nonself dis-
discrimination in computer // Proc. 1994 IEEE Symp. on Research in
Security and Privacy. Los Alamitos, CA: IEEE Computer Society
Press, 1994. P. 202-212 (в этом сборнике также рекомендуется
статья Кефарта).
11. Grossman Z. Contextual discrimination of antigens by the im-
immune system: towards a unifying hypothesis // In: Theoretical
and experimental insights into immunology (Eds. A. S. Perelson
and G. Weisbuch). NATO ASI Series, Vol. H66. Berlin, Heidelberg:
Springer-Verlag, 1992. P. 71-89.
12. Grossman Z., Paul W. E. Adaptive cellular interactions in the immune
system: The tunable activation threshold and the significance of
subthreshold responses // Proc. Natl. Acad. Sci. USA. 1992. V. 89.
P. 10365-10369.
13. Janeway С A., Travers P. Immunobiology. Oxford: Blackwell Scien-
Scientific Publications, 1994.
14. Keller E.F., Segel L.A. The initiation of slime mold aggregation
viewed as an instability // J. Theor. Biol. 1970. V.26. P. 399-425.
15. hangman R.E. The immune system. San Diego: Academic Press,
1989.
16. Levin S.A. On the evolution of ecological parameters // In: Ecolog-
Ecological genetics: The interface (Ed. P. F. Brussard). Proceedings in Life
Sciences. Springer, 1978. P. 3-26.
17. Maes P. Situated agents can have goals // Robotics and Autonomous
Systems. 1990. V.6. P. 49-70.
Приложение 115
18. Mataric M.J. Reinforcement learning in the multi-robot domain //
Autonomous Robots. 1997. V.4, №1. P. 73-83.
19. Mataric M.J. Using communication to reduce locality in distributed
multi-agent learning // Proc. AAAI-97, Providence, Rhode Island,
July 27-31, 1997.
20. Matzinger P. Tolerance, danger, and the extended family // Annu.
Rev. Immunol. 1994. V. 12. P. 991-1045.
21. Meinhardt H. Models for biological pattern formation. London: Aca-
Academic Press, 1982.
22. Metz J.A.I, Nisbet R.M., Geritz S.A.H. How should we define
«fitness» for general ecological scenarios? // TREE. 1992. V. 7, №6.
P. 198-202.
23. Mitchell M. Analogy-making as perceptron. Cambridge, MA.: MIT
Press, 1993.
24. Perelson A. S., Weisbuch G. Immunology for physicists // Rev. Mod-
Modern Phys. 1997. V. 69. P. 1219-1267.
25. Rumelhart D.E., McClellend J.L. Parallel distributed processing.
Cambridge: MIT Press, 1986.
26. Sato Y., Roman M., Tighe H. et al. Immunostimulatory DNA se-
sequences necessary for effective intradermal gene immunization //
Science. 1996. V.273. P. 352-354.
27. Varela F., Coutinho A, Dupire R, Vaz N. N. Cognitive net-
networks: immune, neural and otherwise // In: Theoretical immunology
(Ed. A. S. Perelson), Part 2. Redwood, Ca.: Addison-Wesley, 1988.
P. 359.
28. Zigmond S.H., Sullivan S.J. Receptor modulation and its conse-
consequences for the response to chemotactic peptides // In: Biology of
the chemotactic response (Eds. J.M.Lackie and P.C.Wilkinson).
Cambridge: Cambridge University Press, 1981. P. 73-88.
Приложение
Пояснения к рис. 4.5. На рис. 4.5 показано, что характе-
характеристика качества М достигает минимума при промежуточной
величине константы полунасыщения п, описывающей влияние К
на скорость размножения эффекторов. Для понимания смысла
этого наблюдения рассмотрим временную динамику максималь-
максимальных значений некоторых функций. Из рис. 4.4 следует, что при
возрастании п величина Етах проходит через минимум. Вместе
с тем, величины Ктах и Ртах увеличиваются монотонно. На
первый взгляд это выглядит парадоксально. Сравнивая значения
этих величин при малых п со значениями при промежуточных п,
мы видим, что большим значениям Ртах и Ктзх соответству-
соответствуют меньшие значения Етах, но для еще больших значений п
дальнейшее увеличение Ртах и Ктах сочетается с большими
значениями i?max.
116 Гл. 4. Иммунитет и автономные децентрализованные системы
0,8
о
i/v-
; looo ч\
5000
Для того чтобы объяснить, как это происходит, сначала на
рис. 4.4 заметим, что в любой момент времени большим значени-
значениям п соответствуют большие значения К. Образование К зави-
зависит от произведения Е на Р. При фиксированном К увеличение
п оказывает разное влияние на Е и Р; Е снижается, так как
скорость размножения уменьшается, но снижение Е приводит
к увеличению Р. Результаты моделирования показывают, что
этот последний эффект в представленной модели доминирует, и
именно он отвечает за рост К.
Считая, что увеличение п приводит к росту К, мы получа-
получаем противоположные по знаку эффекты в отношении роста Е.
Пусть р{К\) обозначает скорость раз-
q*Kl/(n + Ki) множения Е\, тогда из Gа) получаем
¦ \ i $ *у \j \j \j
' ' ч^ Прямым следствием увеличения п
является снижение р, но важное
косвенное следствие роста п, уве-
увеличение К\, влечет за собой рост
р. На рис. 4.7 видно, что динамика
р{К\) при промежуточных значениях
п определяется первым (прямым) эф-
llt^o^ZJ^- Фектом (К*,) Уменьшается при уве-
торов A0) при трех значе- личении п от 150 до 1000), но при
ниях п. Расчеты выполнены больших значениях п второй (опо-
для результатов, показанных средованный) эффект становится ос-
на рис.4.4 новным, и в результате р(К\) при
п = 5000 больше, чем при п = 150 и п = 1000. Иными словами,
хотя /Стах при увеличении п растет, переход от п = 150 до
п = 1000 не приводит к такому росту величины К, который
перевешивал бы депрессирующее влияние увеличения п на р.
Д-р Ли Сигел окончил Гарвардский колледж A953) и Массачусетский
технологический институт, где в 1959 г. защитил степень доктора философии.
В промежутке получил стипендию Фулбрайта и провел один год в Кембридж-
Кембриджском университете. После стажировки в Национальной физической лаборато-
лаборатории (Великобритания) становится сотрудником факультета прикладной мате-
математики Политехнического института Ренеселаера (г. Троя, штат Нью-Йорк).
В 1971-72 гг. получил исследовательский грант Гугенхейма в институте Вейц-
мана в Израиле, в 1973 г. стал постоянным членом его научного коллек-
коллектива. Первоначально исследовательские интересы д-ра Сигела были сосре-
сосредоточены вокруг задач нелинейной гидродинамической теории устойчивости.
С 1969 г. основная область его научных исследований связана с проблемами
теоретической биологии.
10 Время 20
Глава 5
ИММУННАЯ СЕТЬ КАК ПРИМЕР СЛОЖНОЙ
АДАПТИВНОЙ СИСТЕМЫ
Дебашиш Чоудхури
О существовании иммунной памяти известно уже давно, однако лежащие в
ее основе механизмы изучены мало. Согласно клонально-селекционной теории,
в ответе на определенный внешний антиген (например бактериальный) участ-
участвует клон специфических клеток. Некоторые лимфоциты, активированные в
ходе первичного иммунного ответа, остаются затем в состоянии покоя и цирку-
циркулируют в иммунной системе длительное время, поддерживая память о данном
антигене. Такие долгоживущие клетки имеют название клеток памяти. Сторон-
Сторонники альтернативной сетевой гипотезы утверждают, что в иммунной реакции
участвует целая сеть взаимодействующих между собой клонов. В последние
годы обсуждалось несколько возможных вариантов строения и функциони-
функционирования иммунной сети. В этой главе приводятся математические модели,
особенность которых заключается в единообразном описании популяционной
динамики различных клонов иммунокомпетентных клеток. Взаимодействия
внутри клонов и между клонами рассматриваются совместно в виде дискретной
модели. Также рассматривается непрерывная версия модели.
5.1. Введение
Латинское слово immunitas означает освобождение от
чего-либо — от службы, обязанностей, гражданской ответствен-
ответственности и т. д. (например «дипломатический иммунитет» посла
некоторого государства). Уже более двух тысяч лет известно,
что в некоторых случаях выздоравливающие от болезни люди
могут становиться «иммунными», т.е. невосприимчивыми к ней
впоследствии [1]. Это явление носит название приобретенного
иммунитета. Однако научные исследования в области иммуноло-
иммунологии начались значительно позднее, когда Дженнер использовал
явление приобретенного иммунитета для разработки вакцины
против оспы. Первый прорыв в понимании механизмов этого
важного явления был осуществлен Луи Пастером в 1880 г.
За последние сто лет накопилось огромное количество данных
об «аппаратной части» иммунной системы (например о клетках
118 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
и молекулах, участвующих в иммунных реакциях) [2-4], но
при этом о соответствующем «программном обеспечении», т.е.
о принципах управления различными иммунологическими про-
процессами, до сих пор известно очень мало.
Теоретическая иммунология связана с математическим мо-
моделированием иммунологических процессов различного уровня:
молекулярного, клеточного и уровня клеточных популяций [5,6].
Одна из важнейших задач теоретической иммунологии заключа-
заключается в прогнозировании «макроскопических» свойств иммунной
системы на основе изучения закономерностей взаимодействий ее
«микроскопических» составляющих [7,8]; эта задача аналогична
той, с которой имеют дело физики, применяющие методы стати-
статистической механики. Иммунологи-теоретики разрабатывают ма-
математические модели для изучения законов эволюции иммунной
системы на длительных интервалах времени для исследования
ее пространственно-временной изменчивости, выяснения меха-
механизмов межклеточных взаимодействий и влияния этих взаимо-
взаимодействий на динамику популяций клеток различного типа в ходе
иммунного ответа, а также механизмов адаптивного «обучения»
иммунной системы при встрече с новыми антигенами и хранения
информации в ее «памяти». Для описания известных и предска-
предсказания еще не открытых иммунологических явлений создан ряд
математических моделей. В этой главе приводится обзор несколь-
нескольких современных подходов к математическому моделированию
процессов иммунитета с иллюстрацией их на конкретных приме-
примерах. Существует надежда, что некоторые из этих подходов могут
оказаться полезными при разработке искусственных иммунных
систем.
5.2. Краткий обзор экспериментальных данных
Известно, что в иммунной системе имеется свыше миллиона
субпопуляций лимфоцитов различной специфичности. Соглас-
Согласно клоналъно-селекционной теории, на определенный антиген
могут отвечать только лимфоциты одной специфичности. Эта
особенность иммунного ответа резко отличает его от неспеци-
неспецифической реакции на антиген, осуществляемой макрофагами.
Генерируя большое разнообразие лимфоцитов, иммунная система
организма, по-видимому, ожидает появления любых возможных
антигенов. В ходе антиген-специфической реакции прежде всего
необходимо распознать антиген специфическими лимфоцитами.
Различные типы лимфоцитов распознают антиген по-разному.
В результате те из лимфоцитов, которые лучше всего «соответ-
5.2. Краткий обзор экспериментальных данных 119
ствуют» данному антигену, быстро размножаются и образуют
клоны — популяции генетически идентичных клеток. Соответ-
Соответствующий процесс имеет название клональной селекции, по-
поскольку антиген «выбирает», какие именно лимфоциты должны
образовать клон.
Имеется несколько взаимно дополняющих вариантов им-
иммунного ответа. В ходе гуморального иммунного ответа раз-
размножаются специфические В-лимфоциты. Заключительный этап
дифференцировки некоторой части В-лимфоцитов приводит к об-
образованию плазматических клеток. Плазматические клетки про-
продуцируют антитела, которые взаимодействуют с антигеном и в
конечном итоге выводят его из организма хозяина. Остальная
часть В-лимфоцитов переходит в состояние покоя и циркулирует
в крови и лимфе, сохраняя память о своем антигене. Такие
В-лимфоциты имеют название В-клеток памяти. При клеточно-
опосредованном иммунном ответе специфические Т-лимфоци-
ты становятся цитотоксическими и уничтожают антиген непо-
непосредственно. Память о взаимодействии с конкретным антигеном
обеспечивают Т-клетки памяти. Ключевую роль в регуляции
иммунного ответа обоих типов играют хелперные Т-лимфоциты,
или Т-лимфоциты-помощники. Говорят, что хозяин, имеющий
клетки памяти, обладает приобретенным иммунитетом против
данного антигена. В случае повторного контакта с антигеном
наличие клеток памяти приводит к более быстрому и выражен-
выраженному вторичному иммунному ответу. В сущности, это явление
составляет основу вакцинации. Схемы гуморального и клеточно-
опосредованного иммунного ответа показаны на рис. 5.1.
В норме иммунная система способна отличать клетки и ткани
хозяина («свое») от внешних факторов («не-свое», или «чужое»).
Нормальный иммунный ответ происходит в случае, если коли-
количество внешнего антигена в организме превышает порог толе-
толерантности [10]. Однако при определенных условиях в результа-
результате «сбоя» иммунная система может ошибочно принимать часть
клеток или тканей хозяина за «чужеродную» субстанцию [11].
В этом случае иммунный ответ носит название аутоиммунной
реакции и может привести к развитию аутоиммунного заболе-
заболевания.
Вирус иммунодефицита человека (ВИЧ) является особым
примером внешнего антигена в том смысле, что в отличие от
других антигенов он уничтожает хелперные Т-лимфоциты, иг-
играющие ключевую роль в обоих вариантах иммунного ответа.
Поэтому на поздних стадиях ВИЧ-инфекции иммунная система
выходит из строя. Это состояние имеет название синдром приоб-
120 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
ретенного иммунодефицита (СПИД). В конечном итоге больной
СПИДом погибает от вторичной инфекции, а не от вируса имму-
иммунодефицита как такового [12].
Клональная селекция
Клональная селекция
Щу
X
Y
Антитела
Гуморальный ответ
тзг тзг тз
Клеточный ответ
© © ©
В-клетки памяти Т-клетки памяти
Рис. 5.1. Схематическое описание вариантов иммунного ответа
5.3. Математическое моделирование
клональной селекции
Уравнения динамики клеточных популяций, участвующих в
иммунном ответе против некоторого антигена, можно строить
двумя различными способами. В случае дискретного подхода
популяции клеток каждого типа обычно характеризуются дис-
дискретными переменными, которые могут принимать лишь два зна-
значения: 0 или 1 при низкой и высокой численности соответствен-
соответственно. В этом случае уравнения динамики записываются на основе
отображений с дискретным временем. Кроме того, считается, что
парные взаимодействия между клетками разных типов также
5.3. Математическое моделирование клональной селекции 121
описываются конечным набором допустимых значений. В случае
непрерывного подхода предполагается, что популяции клеток,
взаимодействия между клетками различного типа и временная
характеристика задаются в виде непрерывных вещественных ве-
величин; в этом случае динамика клеточных популяций описыва-
описывается системой дифференциальных уравнений.
Непрерывный подход к моделированию клональной селекции
был впервые применен Беллом [13, 14] и затем многими другими
исследователями. Но поскольку очень часто такие модели оказы-
оказываются «недоопределенными», т.е. имеющимся в наличии экспе-
экспериментальным данным может соответствовать более одной модели,
в последние годы некоторые авторы стали сторонниками исполь-
использования дискретного подхода в качестве первого этапа формули-
формулировки количественных теорий [15]. Преимуществом такого подхода
является узость набора допустимых значений переменных модели,
в результате чего для описания известных экспериментальных
данных нет необходимости привлечения большого числа свобод-
свободных параметров. Дискретные модели могут удовлетворительно
описывать качественные закономерности иммунного ответа. Они
не стремятся заменить собой более реалистичное непрерывное
описание. Используя соответствующие математические подходы,
можно всегда достроить дискретную модель до непрерывной.
Относительные достоинства и недостатки дискретного и
непрерывного подходов подробно обсуждались в литературе.
5.3.1. Дискретные модели клональной селекции. Дис-
Дискретные переменные, описывающие популяции клеток в дис-
дискретных моделях, иногда называют «автоматами», а система,
состоящая из взаимодействующих автоматов, имеет название
клеточного автомата. Понятие клеточного автомата было введено
фон Нейманом в контексте теории эволюции, и позднее более
подробно исследовалось Вольфрамом [16]. Известно, что кле-
клеточные автоматы обладают большим разнообразием вариантов
пространственно-временной динамики, в зависимости от задава-
задаваемых правил эволюции. Это обстоятельство нашло практическое
применение, например при моделировании динамики жидкостей
и в других областях.
Дискретные модели популяционной динамики клеток иммун-
иммунной системы можно строить в терминах «пороговых» или «дво-
«двоичных» (булевых) автоматов [17].
Пороговые автоматы. Популяцию клеток типа г обозначаем
через Si, где Si может принимать одно из двух возможных
значений: 0, что соответствует низкой плотности популяции,
122 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
и 1, что соответствует высокой плотности популяции. Популяция
клеток г-го типа в момент t + 1 определяется динамическим
отображением [18]
Si(t+l) = e(hi-vLi) (i= 1,2,...,гс), E.1)
где в (у) — ступенчатая функция, т.е. в (у) = О для у < 0 и
в (у) = 1 для у ^ 0. Величина hi = ^ • CijSj представляет собой
общий стимул, воспринимаемый клетками типа г, где Cij харак-
характеризует влияние клеток типа j на клетки типа г, a /i^ — наперед
заданный порог, при котором происходит переключение ^ с 0
на 1. Считаем, что характеристики взаимодействий Cij могут
принимать лишь конечное число целых значений, например —1,
0 и 1. Конкретный вид модели определяется количеством п типов
клеток, набором значений Cij для всех пар (i,j) и набором
значений /^ для всех г. Если для любого г одновременно выпол-
выполняется Si(t + 1) = Si(t), то соответствующий набор значений Si
называется неподвижной точкой системы. Если же для любого г
выполняется Si(t + Т) = Si(t), то система имеет предельный
цикл, называемый динамическим аттрактором.
Также в теоретической иммунологии широко используется
понятие оконного автомата [19,20]. Предположим, что Si = 1,
если и только если величина hi попадает в окно между некото-
некоторыми двумя пороговыми значениями, т. е. // < hi < //', и Si = 0,
если hi не принадлежит этому интервалу. Тогда Si есть пример
оконного автомата.
Булевы автоматы. Булев автомат — это логическая пере-
переменная, которая может принимать лишь значения «истина» или
«ложь», обычно обозначаемые 1 или 0 соответственно. Таким
образом, клеточные популяции в дискретных моделях можно
описывать булевыми переменными. Однако к ним не применимы
обычные алгебраические операции сложения, умножения и др.
Если дискретная модель сформулирована в терминах булевых
автоматов, то динамические отображения будут включать логи-
логические операторы И, ИЛИ, НЕ и другие. Например, если Л, В
и С — булевы автоматы, то тогда
А = В.ИЛИ.С равно 1, если В или С или обе величины равны 1;
А = В.И.С равно 1, если и только если и В, и С равны 1;
А = .НЕ.В равно 1, если В равно 0, и наоборот.
Понятие динамического аттрактора для сети булевых автоматов
можно определить аналогично случаю сетей пороговых авто-
автоматов.
5.3. Математическое моделирование клональной селекции 123
Теперь приведем пример дискретной модели нормального им-
иммунного ответа на основе булевых автоматов в рамках сцена-
сценария, предлагаемого теорией клональной селекции. Эту модель
мы будем называть моделью р-КУТ, поскольку первоначально
она была предложена Кауфманом, Урбайном и Томасом [21] и
позднее была обобщена Чоудхури и Стауффером [22,23]. Обо-
Обозначим через Ab, S, Н, В и Ag популяции специфических ан-
антител, супрессорных Т-лимфоцитов, хелперных Т-лимфоцитов,
В-лимфоцитов и внешнего антигена соответственно. Динамиче-
Динамическое отображение, определяющее поведение популяций, в модели
р-КУТ задается в виде:
Ab(t + 1) = Ag(t)M.B(t)M.H(t),
S(t+ 1) = Я(«).ИЛИ.5(<),
H{t+\) = [Ag(t).H.(.HE.S(t))].HnH.H(t),
B(t + 1) = [Ag{t).\\J\W.B(t)].W.H(t),
Ag(t+l) = Ag(t)M.(.HE.Ab(t)).
Легко проверить, что эта модель имеет пять неподвижных то-
точек, каждая из которых допускает биомедицинскую интерпрета-
интерпретацию. Например, неподвижная точка АЬ = S = Н = В = Ag = О
соответствует наивному или толерантному состоянию, а непо-
неподвижная точка Ag = Ab = О, Н = S = В = 1 интерпретиру-
интерпретируется как иммунное состояние, при котором популяция специ-
специфических лимфоцитов высокой численности сохраняет память
о предыдущих контактах иммунной системы с антигеном. Хотя
существование популяций супрессорных Т-лимфоцитов остается
под вопросом, в первоначальной модели Кауфмана и др. [21]
была предложена другая интерпретация возникновения супрес-
сирующего эффекта, которую подверг критике Хоффман [24].
Биомедицинская интерпретация в построенной модели р-КУТ
возможна не только для неподвижных точек. Было показано, что
последовательность промежуточных состояний, через которые
система эволюционирует от начального состояния к некоторой
неподвижной точке, также соответствует экспериментально из-
известным фактам.
Чоудхури и др. [23] предложили обобщение модели р-КУТ
для описания динамики клеточных популяций в случае нормаль-
нормального иммунного ответа, аутоиммунной реакции, а также нор-
нормального иммунного ответа на не-ВИЧ-антигены у ВИЧ-инфици-
ВИЧ-инфицированных лиц и у больных СПИДом. Обозначим концентрации
«собственных антигенов» и антигенов ВИЧ через 10 и IV
соответственно, а концентрации киллерных, или эффекторных,
124 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
клеток, участвующих в аутоиммунной реакции, через IK. В ка-
качестве постулата мы приняли, что динамическое отображение,
определяющее поведение популяций, для этой модели имеет вид
Ab(t + 1) = Ag(t)M.B(t)M.H(t),
s(t+ l) =
= [((Ай-(<).ИЛИ./О).И.(.НЕ.5(<))).ИЛИ.Я(«)].И.(.НЕ./У),
l) = [Ag(t).WJ\W.B(t)}.W.H(t),
Ag{t + 1) = Ag(t).H.(.HE.Ab(t)),
IK(t+ 1) =
Также были построены и исследованы клеточно-автоматные мо-
модели для описания некоторых других аспектов иммунного отве-
ответа [25-27].
5.3.2. Непрерывные модели клональной селекции. На-
Начав с построения дискретных динамических уравнений в терми-
терминах логических операторов над булевыми переменными, можно
перейти к формулировке соответствующей системы дифференци-
дифференциальных уравнений вида
-^ = gi(y\,y2,--- ,Уп) ~ diyi E.2)
для клеток п типов, где yi и di представляют собой, соот-
соответственно, концентрацию и константу скорости естественной
гибели клеток типа г. Функции gi включают комбинации сигмо-
идальных функций yj. Их вид можно определить на основе хо-
хорошо известной процедуры, зная правую часть соответствующих
дискретных отображений [21,28]. Для того чтобы определить
правую часть дифференциального уравнения для концентрации
Уг на основе правой части соответствующего дискретного отоб-
отображения для дискретной величины Si, необходимо следующее.
1. Каждая из переменных Sj заменяется на соответствующую
сигмоидальную функцию
т
а каждая из величин .НЕ.Sj заменяется на функцию
ДТП
\ ij
67] + гЛ1'
5.3. Математическое моделирование клональной селекции
125
где число Хилла т характеризует крутизну сигмоидальных
функций F+ и F~, а в^ — порог регуляции клеток типа г
клетками типа j.
2. Логические операторы .ИЛИ. и .И., используемые в дис-
дискретной модели, заменяются в непрерывной формулировке на
арифметические операции сложения (+) и умножения (•) соот-
соответственно.
3. Для описания процесса естественной гибели клеток типа г
добавляется аддитивный член вида —diyi (где d{ > 0). Напри-
Например, дифференциальное уравнение, соответствующее дискретно-
дискретному уравнению
имеет вид
F~(y2) + k'3F+(y3) -
Следуя приведенной схеме, Чоудхури [29] вывел дифферен-
дифференциальные уравнения, соответствующие дискретному динамиче-
динамическому отображению в обобщенной модели, и затем упростил их.
Важное свойство нормального иммунного ответа проиллю-
проиллюстрировано на рис. 5.2. Небольшого количества антигена оказы-
50 100 150 200
Время
50
40 -
&|20:
1 г'
50 100 150200
Время
50 100 150200
Время
Рис. 5.2. Зависимость численности популяции антител от времени при нор-
нормальном первичном и вторичном иммунном ответе для разных начальных доз
антигена. Начало первичного и вторичного ответа соответствует моментам
времени t = 0 и t = 100 соответственно. Первичная и вторичная дозы антигена
составляют 1 (а), 10 (б), 100(в), а также 1 и 100 в моменты времени ? = 0 и
? = 100 соответственно (г)
126 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
вается достаточно для адекватной иммунизации хозяина с очень
сильным вторичным ответом против того же самого антигена
даже в том случае, если доза антигена велика. Это соответствует
основному принципу иммунизации или вакцинации.
Другое интересное свойство модели показано на рис. 5.3.
Если хозяин инфицирован ВИЧ, но концентрация ВИЧ мала,
то может происходить вторичный ответ на не-ВИЧ-антигены,
несмотря на истощение популяций Т-лимфоцитов памяти. С дру-
другой стороны, если концентрация вирусов достаточно высока, то
к 16
12
к о
-¦ ¦ ¦ ¦ 1 ¦ ¦ ¦ ¦ 1 ¦ ¦ ¦ ¦ !
:
¦ 1111 ¦"¦
8 :
4s
О 50
100 150 200
Время
50
100 150 200
Время
50
100 150 200
Время
50
100 150 200
Время
0 50 100 150 200
Время
Рис. 5.3. Зависимость от времени концентрации хелперных Т-лимфоцитов
(сплошная линия), супрессорных Т-лимфоцитов (пунктирная линия), антител
(линия из точек) и антигена у хозяина, впервые иммунизированного против
некоторого не-ВИЧ-антигена для ВИЧ-инфекций различной выраженности, и
при последующем вторичном иммунном ответе. Заражение ВИЧ происходит в
момент t = 0, а вторичная доза не-ВИЧ-антигена вводится в момент t = 150,
причем начальная доза не-ВИЧ-антигена равна 5. Величины доз заражения
составляют 0,5 (а), 1,0 (б) и 5,0 (в)
вторичного ответа на не-ВИЧ-антигены не происходит. Таким
образом, симптомы СПИДа (то есть отсутствие защитных ре-
реакций против побочных инфекций) у ВИЧ-инфицированных при
условии низкого уровня вирусов могут не проявляться.
5.4. За границами клональной селекции: иммунная сеть 127
5.4. За границами клональной селекции:
иммунная сеть
Клонально-селекционная теория позволяет весьма успешно
описывать многие важные аспекты иммунного ответа, но вме-
вместе с тем оказывается, что на некоторые ключевые вопросы в
рамках этой теории ответить, по-видимому, нельзя. Например,
что позволяет лимфоцитам поддерживать память длительное
время? Одно из объяснений состоит в возможности стимуляции
иммунной системы даже тогда, когда количество антигена в
организме опускается ниже границы толерантности; в этом слу-
случае клетки памяти представляют собой ничто иное, как клетки,
постоянно поддерживаемые в стимулированном состоянии. Но
если так, то что и как поддерживает эти клетки в состоянии
стимуляции столь избирательно [30, 31]? Ряд имеющихся данных
свидетельствует, что стимулировать Т- и В-клетки памяти могут
остаточные количества внешнего антигена после первичного от-
ответа [32,33]. Но, как было показано в недавних экспериментах,
хотя этого механизма может оказаться достаточно, он не всегда
является необходимым [34,35].
Возможным ключом к разгадке установления источников спе-
специфической стимуляции, поддерживающих клон столь избиратель-
избирательно и долго после удаления внешнего антигена служат результаты
других экспериментов. В классическом варианте клонально-
селекционной теории предполагается, что любой иммунный
ответ запускается антигеном. Однако было установлено, что у
«безмикробных» мышей (т. е. у мышей, содержащихся в течение
нескольких поколений в среде, свободной от внешних антигенов)
количество активированных лимфоцитов примерно соответствует
значениям, наблюдаемым у мышей, разводимых в обычных усло-
условиях [36,37,45]. Это наблюдение свидетельствует о возможной
стимуляции клонов также благодаря внутренним механизмам.
Сейчас мы покажем, что при выходе за границы клонально-
селекционной теории и привлечении концепции иммунной сети
наличие таких механизмов стимуляции становится очевидным.
Сетевая теория также способна более удовлетворительно опи-
описывать некоторые другие иммунологические явления, например
толерантность и распознавание своего и чужого.
Рассмотрим два клона Ci и С2. Предположим, что поверх-
поверхностные рецепторы лимфоцитов и свободные антитела, относя-
относящиеся к С\ и С2, «соответствуют» эпитопам внешних антигенов
Ag\ и Ag2. Следовательно, согласно клонально-селекционной
теории, С\ избирательно и специфически отвечает на Ag\,
128 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
а С2 — на Ag2. Совершенно естественно ожидать, что молеку-
молекулярные структуры рецепторов, способные распознавать эпитопы
внешних антигенов, могут быть сами распознаны другими ре-
рецепторами. Например, если поверхностные рецепторы С\ и С2
«соответствуют» друг другу, то клон С2 может отвечать на раз-
размножение клона С\ совершенно так же, как и на Ag2. Другими
словами, С2 взаимодействует с С\ и Ag2 на одинаковой основе;
следовательно, С\ можно рассматривать как «внутренний образ»
Ag2. Эпитоп, характеризующий поверхностные рецепторы и ан-
антитела некоторого клона лимфоцитов, имеет название идиото-
па. Функциональную сеть, образуемую на основе распознавания
идиотопов, обычно называют идиотипической сетью [38-40].
Сторонники теории иммунной сети утверждают, что в иммун-
иммунном ответе на внешние антигены участвует вся иммунная систе-
система (или, по крайней мере, более одного клона) на коллективной
основе, хотя ключевую роль в этой реакции может играть един-
единственный клон, поверхностные рецепторы которого лучше всего
«соответствуют» эпитопам внешнего антигена [41-46]. Однако
размножение клеток отвечающего клона (идиотип) и выработку
антител запускает ответ антиидиотипов, которые в свою очередь
могут стимулировать собственные антиидиотипы, и т. д. Разу-
Разумеется, конкретный вариант динамики иммунной сети может
зависеть от масштабов и характера связности.
Линейные и циклические сети. Впервые модели иммунных
сетей предложил Рихтер [47], в них постулировалось существо-
существование «цепной реакции» клонов. Предположим, клоны устроены
так, что С\ стимулирует С2, С2 стимулирует С%, который, в свою
очередь, стимулирует С\, и т.д. Однако такая цепная реакция
ограничена тем, что каждый клон подавляет конкретный клон,
вызвавший его стимуляцию, т. е. одновременно предполагается,
что С\ подавляет Сз, С% подавляет С2, который, в свою очередь,
подавляет С\. Йерно [48] заменил линейную цепь циклической
и исследовал ее свойства. Хоффман и др. [49-51] несколько
улучшили модель Рихтера. Фармер и др. [52, 53] предложили
простую модель и сравнили ее свойства со свойствами других
сетей, используемых в адаптивных вычислениях [54]. Впослед-
Впоследствии их модель была дополнена описанием динамики В-клеток
[55,56]. Аттракторами динамики таких сетей могут являться
предельные циклы, для которых численность популяции антител
периодически изменяется, а иммунная память поддерживается
благодаря сочетанию статических элементов (а именно долгожи-
вущих клеток памяти) и динамического процесса (предельного
5.4. За границами клональной селекции: иммунная сеть
129
цикла). Миниатюрная дискретная модель иммунной сети была
построена Чоудхури и др. [57]; было проведено исследование ее
непрерывного аналога [58].
Сеть со структурой дерева Кэйли. Дерево Кэйли — это
дерево без циклов, характеризуемое величиной z — количеством
ветвей, исходящих из каждой его вершины. В такой сети суще-
существует иерархия клонов. Общий стимул, получаемый В-клетка-
ми, относящимися к г-му уровню, составляет [59]
h* =
(z -
где х — концентрация В-клеток. Концентрация клонов В-клеток
г-го уровня определяется клеточными автоматами (в дискретной
формулировке) или их непрерывными аналогами (в непрерывной
формулировке).
Подход с использованием обобщенного пространства кон-
конфигураций. Данный подход использует то обстоятельство, что
аффинность поверхностных рецепторов и свободных антител,
относящихся к различным клонам, определяется степенью ком-
плементарности их геометрической формы, электрических заря-
зарядов и т.д. Следовательно, если обобщенная конфигурация клона
(включающая d различных характеристик) задается вектором г
на d-мерной решетке, то положение
его антиидиотипа на той же d-мер-
ной решетке будет —г (см. рис. 5.4).
Таким образом, сила взаимодействия
между клонами, соответствующими
положениям решетки г и —г, макси-
максимальна. Клон, соответствующий по-
положению г в обобщенном простран-
пространстве конфигураций, также должен
иметь высокий уровень комплемен-
комплементарное™ с ближайшими к —г по-
положениями решетки. Предполагает-
Предполагается, что он может взаимодействовать
и с клонами, соответствующими по-
положениям -г ± 5Х и -г ± 5У,
/
/ __
ъх
)
/
/
/
/
(
1 J
/-6
Рис. 5.4. Схема двумерно-
двумерного обобщенного пространства
конфигураций
хотя эти взаимодействия и намного слабее, чем между г и —г
[60-62, 46, 63, 64]. Желательно, чтобы при взаимодействии
нативной иммунной системы с любым антигеном иммунная ре-
реакция оставалась в пределах ограниченной области обобщенного
пространства конфигураций, несмотря на связность иммунной
сети. В конце концов, если кто-то заразится туберкулезом, то
5 Д. Дасгупта
130 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
нельзя ожидать, что у него образуется большое количество ан-
антител против холеры! Было показано, что ответ на вопрос о
локализации или распространении реакции на всю сеть зависит
от размерности конфигурационного пространства.
В целях явного описания взаимодействий между клонами и
внутри них Чоудхури и др. [57] обобщили клонально-селекци-
онную модель р-КУТ [22,23]. Они предположили, что иммунная
система хозяина состоит из нескольких функциональных сетей
разного размера. Клоны, относящиеся к разным сетям, не вза-
взаимодействуют между собой; вступать в контакты между собой
могут только клоны, принадлежащие одной сети. Например, ди-
динамические отображения на квадратной решетке, определяющие
временную эволюцию популяций различных типов клеток, зада-
задаются в виде:
АЬ(г, t + 1) =Ag(r, <).И.Б(г, *).И.Я(г, t)\
Б(г, t + 1) =[Ag(r, *).ИЛИ.Я(-г, *).ИЛИ.Я(-г + 6ut).
.ИЛИ.Я(-г + 62, <).ИЛИ.Я(-г + 5г, *)•
.ИЛИ.Я(-г + (У4,*)].И.Я(г,<);
Я(г, t + 1) =[Ag(r, *).ИЛИ.Я(-г, *).ИЛИ.Я(-г + 6ut).
.ИЛИ.Я(-г + 62, <).ИЛИ.Я(-г + <*з, *)•
.ИЛИ.Я(-г + (У4,*)].И.[.НЕ.[Я(-г,«).И.Я(-г +Jbt).
.И.Я(-г + 52, «).И.Я(-г + (У3, «).И.Я(-г + S4, t)]]\
Ag(r, t + 1) =Ag(r, <).И.[.НЕ.А6(г, t)]\
где г + S\, r + #2, г + 5з и г + 54 обозначают положения четырех
ближайших к г точек. Таким образом каждый клон, соответ-
соответствующий г, способен стимулировать не только антиидиотип —г,
но и клоны, соответствующие ближайшим к —г положениям.
С другой стороны, если речь идет о супрессии, численность
популяции клона, соответствующего г, может быть уменьшена
до низкого уровня, если и только если численности популяций
клонов, соответствующих -г и ближайшим к нему 2^-узлам
решетки, будут одновременно высокими. Следовательно, с одной
стороны, взаимодействия симметричны как в смысле стимуляции
(клон, соответствующий г, стимулирует клон, соответствующий
—г, и наоборот), так и в смысле супрессии (клоны, соответ-
соответствующие г и ближайшим 2^-узлам решетки, могут снижать
численность клона, соответствующего —г, и, аналогично, клоны,
соответствующие —г и ближайшим узлам, могут снижать чис-
5.5. Краткое содержание и выводы 131
ленность клона г до низкого уровня). Однако при этом между
стимуляцией и супрессией имеется асимметрия, поскольку су-
супрессия достигает цели, только если высока численность анти-
идиотипа вместе с ближайшим окружением. Чоудхури и др. [57]
установили, что в этой модели после возмущения некоторо-
некоторого участка пространства конформаций распространяется сигнал,
форма которого является периодической функцией времени и
сохраняет таким образом динамическую память об антигене.
5.5. Краткое содержание и выводы
Иммунная система — пример сложной адаптивной системы.
Другим примером является мозг (нейронная сеть) [65]. Несмотря
на ряд важных различий, между нервной и иммунной системами
имеются поразительные аналогии. Адаптивные системы обуча-
обучаются, или адаптируются, подобно живым системам. Процесс обу-
обучения биологических систем происходит в сильно отличающихся
масштабах времени. Например, мозг способен обучаться в тече-
течение секунд или часов, иммунная система — часов или дней, био-
биологические виды — от дней до столетий, а экосистемы — от сотен
до тысяч лет. По моему мнению, существует по крайней мере два
различных аспекта динамики иммунной системы: а) численность
клеток специфического клона (и, возможно, близких клонов)
быстро увеличивается после распознавания антигена, а после
вывода антигена снова снижается; б) вследствие естественной
гибели нестимулированных лимфоцитов и притока новых имму-
нокомпетентных клеток иммунная сеть эволюционирует, и все ее
характерные свойства, такие как размер, связность и т.д., могут
также подвергаться изменениям. Оба этих процесса происходят
на сравнимых интервалах времени. Следовательно, их рассмот-
рассмотрение в рамках единой модели более желательно, чем изучение
популяционной динамики иммунной сети фиксированного разме-
размера и связности.
Помимо изучения эволюции иммунной сети взрослого орга-
организма важной проблемой также является исследование законо-
закономерностей ее формирования у новорожденных. Размер и связ-
связность иммунной системы могут оказаться следствием ее коллек-
коллективных свойств [66]. Высказывалось мнение [67], что иммунная
память была бы гораздо более устойчивой, если бы она распре-
распределялась среди нескольких клонов лимфоцитов, а не осуществ-
осуществлялась единственным клоном.
В этой главе мы не только описали некоторые методы мо-
моделирования в теоретической иммунологии, но и представили
5*
132 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
ряд иллюстрирующих примеров. И хотя модели не способны
адекватно описывать все разнообразие механизмов иммунной
защиты, они, тем не менее, могут применяться при построении
искусственных иммунных систем для решения задач защиты
информационных систем (например компьютеров, интернета, и
др.) от соответствующих «антигенов» (таких как компьютерные
и интернет-вирусы.
Автор благодарит Д. Стауффера за многолетнее сотрудниче-
сотрудничество в области моделирования иммунных сетей, а также за его
замечания относительно ранних вариантов рукописи.
Список литературы
1. Silverstein A.M. A history of immunology. N.Y.: Academic Press,
1989.
2. Alberts В., Bray D., Lewis /., Raff M., Roberts K., Watson J. The
molecular biology of the cell, 2nd ed. N. Y.: Garland, 1989.
3. Darnell /., Lodish H., Baltimore D. Molecular cell biology. San
Francisco: Freeman, 1990.
4. Jaret P., Nilsson L. National geographic, 1986, June, 702.
5. Perelson A.S., Weisbuch G. // Rev. Modern Phys. 1997. V.69.
P. 1219.
6. Chowdhury D., Stauffer D. // Physica A. 1992. V. 186. P. 61.
7. Perelson A. S. (Ed.) Theoretical immunology. Parts I, II. Reading,
Ma.: Addison-Wesley, 1988.
8. Marchuk G.I. Mathematical models in immunology. N.Y.: Optimiza-
Optimization Software, 1983.
9. Burnet F.M. // Austr. J. Sci. 1957. V.20. P. 67; более подробное
описание см. в The clonal selection theory of acquired immunity.
Cambridge: Cambridge University Press, 1959; см. также Sci. Am.
1961. V.204, №1. P. 58.
10. Rennie J. // Sci. Am. 1990. V. 10. P. 77; см. также специальный
выпуск «Frontiers in biotechnology: Tolerance in the immune system»
журнала Science. 1990. V.248.
11. Cohen I.R. II Sci. Am. 1988. V.258. P. 34; см. также Perspectives
on autoimmunity. Boca Raton: CRC Press, 1988.
12. Weber J.N., Weiss R.A. // Sci. Am. 1988. V.I. P.81; см. также
другие статьи в этом специальном выпуске, посвященном СПИДу.
13. Bell G.I. II J. Theor. Biol. 1970. V. 29. P. 191.
14. Bell G.I. II J. Theor. Biol. 1971. V. 33. P.339.
15. Atlan H. II Bull. Math. Biol. 1989. V.51. P. 247.
16. Wolfram S. // Theory and applications of cellular automata. World
Scientific, 1986.
17. Weisbuch G. Complex systems dynamics: An introduction to automata
networks. Addison-Wesley, 1991.
Список литературы 133
18. Weisbuch G., Atlan H. // J. Phys. A. 1988. V.21. P.L189; см. также
Cohen I.R., Atlan H. // J. Autoimmun. 1989. V.2. P.613.
19. Neumann A. U., Weisbuch G. // Bull. Math. Biol. 1992. V.54. P. 21.
20. Neumann A. U., Weisbuch G. // Bull. Math. Biol. 1992. V.54. P.699.
21. Kaufman M., Urbain /., Thomas R. // J. Theor. Biol. 1985. V. 114.
P. 527.
22. Chowdhury D., Stauffer D. // J. Stat. Phys. 1990. V. 59. P. 1019.
23. Chowdhury D., Stauffer D., Choudary P. V. // J. Theor. Biol. 1990.
V. 145. P. 207.
24. Hoffmann G. W. // J. Theor. Biol. 1987. V. 129. P. 355.
25. Pandey R.B. // Physica A. 1991. V. 179. P. 442.
26. Pandey R.B., Stauffer D. //J. Stat. Phys. 190. V.61. P.235.
27. Celada F., Seiden P.E. // Eur. J. Immunol. 1996. V.26. P. 1350.
28. Kaufman M., Thomas R. // J. Theor. Biol. 1987. V. 129. P. 141.
29. Chowdhury D. // J. Theor. Biol. 1993. V. 165. P. 135.
30. Vitetta E.S., Berton M. 7., Burger С et al. // Annu. Rev. Immunol.
1991. V.9. P. 193.
31. Sprent J. II Cell. 1994. V. 76. P. 315.
32. Gray D., Skarvall H. // Nature. 1988. V. 336. P. 70.
33. Fishman M.A., Perelson A. S. // J. Theor. Biol. 1995. V. 173. P. 241.
34. Lau L.L., Jamieson B.D., Somasundaram Т., Ahmed R. // Nature.
1994. V.369. P. 648.
35. Hou S., Hyland L, Ryan K. W., Portner A., Doherty P. С // Nature.
1994. V.369. P.652.
36. Hoykaas H., Benner R., Pleasants R., Wostmann B. // Eur. J. Im-
Immunol. 1984. V. 14. P.I.
37. Pereira P., Forni L., Larson E.L. et al. // Eur. J. Immunol. 1986.
V. 16. P. 685.
38. Jerne N. K. // Sci. Am. 1973. V.229. P. 52.
39. Jerne N. K. // Ann. Immunol. (Inst. Pasteur). 1974. V. 125C. P. 373.
40. Jerne N. K. // Immunol. Rev. 1984. V. 79. P. 5.
41. Perelson A. S. // Immunol. Rev. 1989. V. 110. P. 5.
42. Atlan H., Cohen I. R. (Eds.) Theories of immune networks. Springer,
1989.
43. Stewart J, Varela F.J. // Immunol. Rev. 1989. V. 110. P. 37.
44. Coutinho A. // Immunol. Rev. 1989. V. 110. P. 63.
45. Varela F.J, Coutinho A. // Immunol. Today. 1991. V. 12. P. 159.
46. De Boer R.J., Neumann A. U., Perelson A.S. et al. // In: Proc. of
the first European biomathematics conference (Eds. V. Capasso,
P.Demongeot). Springer, 1992a.
47. Richter P.H. // Eur. J. Immunol. 1975. V. 5. P. 350.
48. Hiernaux J. // Immunochem. 1977. V. 14. P. 733.
49. Hoffmann G. W. // Eur. J. Immunol. 1975. V. 5. P. 638.
50. Hoffmann G. W., Kion T.A., Forsyth R.B. et al. // In: Theoretical
immunology, Part II (Ed. A. S. Perelson). Addison-Wesley, 1988.
51. Royer S. Masters Thesis, Univ. of British Columbia, 1994.
52. Farmer J. D., Packard N. H, Perelson A. S. // Physica D. 1986. V. 22.
P. 187.
134 Гл. 5. Иммунная сеть как пример сложной адаптивной системы
53. Farmer J.D., Kaufman S.A., Packard N.H., Perelson A.S. //
In: Perspectives in biological dynamics and theoretical medicine
(Eds. S.H.Koslow, A. J. Mandell, M. F. S Me singer). N.Y.:
N.Y. Acad. Sci., 1987.
54. Farmer ID. // Physica D. 1990. V.42. P. 153.
55. Behn U., Van Hemmen J.L. // J. Stat. Phys. 1989. V. 56. P. 533.
56. Behn U., Van Hemmen J.L, Sulzer B. // J. Theor. Biol. 1993.
V. 165. P.I; см. также Lippert K., Van Hemmen J.L. // In: Ann.
Rev. Сотр. Phys. (Ed. D.Stauffer), V. 5. World Scientific, 1997.
57. Chowdhury D., Deshpande V., Stauffer D. // Int. J. Modern Phys.
1994. V.C5. P. 1049.
58. Chowdhury D. Ind. J. Phys. 1995. V.69B. P. 539.
59. Weisbuch G., De Boer R.J., Perelson A.S. // J. Theor. Biol. 1990.
V. 146. P. 483.
60. Perelson A.S., Oster G. // J. Theor. Biol. 1979. V.81. P. 645.
61. Segel L.A., Perelson A.S. // In: Theories of immune networks
(Eds. H.Atlan, I. R. Cohen). Springer, 1989.
62. De Boer R.J., Segel LA., Perelson A.S. // J. Theor. Biol. 1992b.
V. 155. P. 295.
63. Stauffer D., Weisbuch G. // Physica A. 1992. V. 180. P. 42.
64. SahimiM., Stauffer D. // Phys. Rew. Lett. 1993. V.71. P. 4271.
65. Amit D.J. Modelling brain functions. Cambridge University Press,
1989.
66. De Boer R.J., Perelson A.S. // J. Theor. Biol. 1991. V. 149. P.381.
67. Parisi G. // In: Chaos and complexity (Eds. R.Livi, S.Ruffo,
S. Ciliberto, and M.Buiatti). World Scientific, 1988.
Д-р Дебашиш Чоудхури — профессор физики Индийского технологиче-
технологического института, Канпур. Является автором книги «Спиновые стекла и дру-
другие фрустрированные системы», опубликованной издательством Принстонского
университета совместно с World Scientific. Имеет более 100 научных работ.
Область его научных интересов связана с изучением структуры и динамики
неупорядоченных и сложных систем на основе методов статистической физики.
Глава 6
ИММУННАЯ ПАМЯТЬ АССОЦИАТИВНА
Дерек Дж. Смит, Стефани Форрест, Алан С. Перельсон
В этой главе 0 приводится обоснование того факта, что иммунная па-
память относится к тому же классу ассоциативной памяти, что и рассредото-
рассредоточенная память П. Канервы, мозжечковая модель арифметического компьютера
Дж. Альбуса и теория мозжечка, предложенная Д. Марром. Ассоциативность и
устойчивость функционирования этого класса памяти обеспечиваются за счет
неплотной выборки элементов пространства входных данных распознающими
единицами (в иммунной системе — В- и Т-лимфоцитами) и распределения па-
памяти среди большого количества независимых единиц (В- и Т-клеток памяти).
6.1. Введение
Вакцинация вирусами коровьей оспы, применяемая для за-
защиты людей от оспы, стала первым известным примером об-
обдуманного использования явления ассоциативной активации в
иммунной системе [1]. Современные исследования механизмов
этого явления начались с наблюдения, что антитела, образо-
образовавшиеся в ходе инфекции вирусом гриппа, часто имеют более
высокий аффинитет к предыдущим штаммам вируса по сравне-
сравнению со штаммами, вызвавшими данную инфекцию. Это привело
к гипотезе, что такие антитела были синтезированы клетками
памяти, образовавшимися в результате предшествующих инфек-
инфекций [2,3]. В развитие этих работ изучались реакции клеток
памяти лабораторных животных на заражение одним антигеном
с последующим введением близкого по структуре антигена [4, 5].
Некоторые исследователи считали, что ассоциативная активация
служит признаком «вырождения вторичного иммунного отве-
ответа» [11]. Однако в дальнейшем, когда оказалось, что это явление
имеет место для многих лабораторных моделей и видов анти-
антигенов, стало ясно, что оно отражает общее свойство иммунной
х) Данная работа была впервые представлена на семинаре IMBS'96 «Мето-
«Методы, основанные на принципах иммунной системы» 10 декабря 1996 г. в Киото,
Япония.
136 Гл. 6. Иммунная память ассоциативна
памяти [7-11]. У иммунологов ассоциативная активация носит
название перекрестной вторичной иммунной реакции, или «пер-
«первородного антигенного греха» [5].
Задача этой главы заключается в том, чтобы показать ассо-
ассоциативность и устойчивость иммунной памяти, а также ее при-
принадлежность к классу рассредоточенной ассоциативной памяти.
Свойства ассоциативности и устойчивости выполняются за счет
неплотной выборки элементов пространства входных данных и
распределения памяти среди большого количества независимых
агентов [12]. Другими представителями этого класса являются
модель мозжечка человека, предложенная Д.Марром [13], моз-
мозжечковая модель арифметического компьютера Дж. Альбуса [14]
и рассредоточенная память П.Канервы [15]. Вначале мы при-
приводим упрощенное описание явлений иммунного ответа и им-
иммунной памяти. Затем дается представление о рассредоточенной
ассоциативной памяти с характеристикой ее соответствия им-
иммунной памяти. В заключительной части главы показано, что
ассоциативная активация может оказывать как полезное, так и
вредное воздействие на иммунную систему хозяина, увеличивая
или снижая его приспособленность.
6.2. Иммунная память
Иммунная система должна уметь распознавать большое ко-
количество клеток и молекул (антигенов), с которыми она ранее
никогда не встречалась, а также решать, как на них реагировать.
Некоторые антигены (например антигены организма хозяина) не
должны быть атакованы иммунной системой. 1) Другие антиге-
антигены, такие как вирусы, бактерии, паразиты и токсины, вызывают
реакцию различных типов Т-лимфоцитов и антител. Иммунная
система хранит память о встречавшихся ранее антигенах и при
последующих контактах часто бывает способна выводить их из
организма еще до начала болезни. Наличие памяти является
основой вакцинации и объясняет, почему многими видами ин-
инфекций мы болеем лишь один раз. Механизмы иммунного ответа
и иммунной памяти сложны и недостаточно хорошо изучены,
поэтому их дальнейшее описание будет носить неизбежно упро-
упрощенный и ограниченный характер.
1) Примерами аутоиммунных заболеваний, вызываемых атакой иммунной
системы собственного организма, являются множественный склероз, ревмато-
ревматоидный артрит и инсулин-независимый диабет.
6.2. Иммунная память
137
Распознавание. Для распознавания антигена иммунная си-
система человека снабжена большим количеством высоко специ-
специализированных В- и Т-лимфоцитов. Иммунная система обла-
обладает потенциалом для генерации из имеющегося генетического
материала на основе вероятностного комбинаторного механизма
свыше 1010 различных рецепторов В-лимфоцитов [16]. Реальное
разнообразие В-клеточных рецепторов в организме поддержива-
поддерживается на уровне 107-108 [17-19]. Количество всех возможных
типов антигенов оценить трудно, но полагают, что эта величина
составляет порядка 1012-1016 [20]. Рецепторы В- и Т-лимфо-
Т-лимфоцитов взаимодействуют с антигеном лишь при условии, что их
аффинность к антигену превышает некоторое пороговое значе-
значение. Известно, что в норме доля стимулированных антигеном
В-лимфоцитов составляет от 10~5 до 10~4 [21-23]. В-лимфоци-
ты, способные взаимодействовать с некоторым антигеном, будем
называть находящимися в области стимуляции данного анти-
антигена [24] (рис. 6.1 а).
Первый антиген*
Второй антиген х
х х Ассоциативно" х
активированные клетки
Рис. 6.1. Двумерная иллюстрация многомерного неплотного распределения
рецепторов В- и Т-лимфоцитов в пространстве, расстояние в котором слу-
служит мерой аффинности для антигена. В- и Т-лимфоциты с аффинностью
поверхностных рецепторов, превышающей некоторый порог, взаимодействуют
с антигеном и переходят в состояние активации. Расстояние, в пределах
которого данный антиген активирует лимфоциты, называется его радиусом
стимуляции (а). Активированные В-лимфоциты размножаются и подвергаются
мутациям с последующим отбором клеток более высокой аффинности (б). По-
После удаления антигена из организма происходит формирование долгоживущей
популяции клеток памяти (в). Повторное воздействие того же или близкого
по структуре антигена приводит к стимуляции и размножению клеток памяти
(ассоциативная активация) (г)
138 Гл. 6. Иммунная память ассоциативна
Иммунный ответ. Стимулированные антигеном В- и Т-лим-
фоциты начинают делиться. Иногда рецепторы делящихся
В-лимфоцитов мутируют, это может приводить к увеличению
аффинности образующихся клеток. В период завершения
иммунного ответа, когда количество антигена снижается,
В-лимфоциты с более высокой аффинностью получают пре-
преимущество в приспособленности перед остальными клетками,
и в ходе последующего отбора их относительная частота
увеличивается (рис. 6.1 б) [25]. В ходе размножения некоторая
часть В-лимфоцитов трансформируется в производящие антитела
плазматические клетки. Антитела взаимодействуют с антигеном,
что способствует его удалению из организма. В случае вирусной
инфекции некоторые Т-лимфоциты становятся цитотоксически-
ми (ЦТЛ), т.е. приобретают способность уничтожать инфици-
инфицированные вирусом клетки.
К моменту завершения иммунного ответа, после выведения
антигена, популяция В-лимфоцитов уменьшается, оставляя вме-
вместо себя долгоживущие клетки памяти (рис. 6.1 в). Механизмы
длительного поддержания иммунной памяти изучены не полно-
полностью. Одно из возможных объяснений этого явления заключа-
заключается в том, что клетки памяти сами по себе живут долго [26].
Другое объяснение состоит в предположении об их эпизодиче-
эпизодической повторной стимуляции. Существует несколько гипотез о
возможных механизмах повторной стимуляции. В работе [27]
была предложена теория идиотипической сети, согласно кото-
которой клетки стимулируются в результате происходящих между
ними взаимодействий аналогично взаимодействию с антигеном.
В рамках другой гипотезы предполагается постоянное присут-
присутствие в лимфатических узлах малых количеств антигена [28, 29].
Третья гипотеза предполагает наличие механизма перекрестной
стимуляции внешними антигенами различных клонов лимфоци-
лимфоцитов [30].
В качестве основного объяснения свойства ассоциативности
иммунной памяти в некоторых работах предлагалось рассмат-
рассматривать идиотипические взаимодействия [31,32]. Однако в све-
свете упомянутых выше гипотез это служит лишь одним из воз-
возможных предположений о механизмах поддержания иммунной
памяти и не является безусловным ключом к пониманию ее
ассоциативного характера и устойчивости.
Механизмом запоминания в иммунной системе служит фор-
формирование долгоживущей популяции клеток памяти. При по-
повторной встрече с антигеном популяция клеток памяти быстро
вырабатывает большое количество антител (или ЦТЛ), в резуль-
6.3. Рассредоточенная память 139
тате чего антиген выводится из организма, часто еще до начала
болезни. Это явление носит название вторичного иммунного
ответа. В случае, если попавший в организм антиген несколько
отличается от предыдущего, то в его области стимуляции может
находиться некоторая часть популяции образовавшихся ранее
клеток памяти (рис. 6.1 г). Клетки памяти, принадлежащие этому
множеству, стимулируются антигеном и продуцируют антитела
и/или ЦТЛ. Иммунологи называют это явление перекрестным
ответом; специалисты, знакомые с понятием ассоциативной па-
памяти, могли бы назвать его ассоциативной выборкой данных.
Сила вторичного иммунного ответа пропорциональна количеству
клеток памяти, находящихся в области стимуляции антигена.
Если под действием сходного антигена стимулируется лишь
некоторое подмножество клеток памяти, то в результате ответ
будет слабее [33]. Таким образом, иммунная память распре-
распределена по всей популяции клеток памяти. Иммунная память
устойчива, так как в случае гибели некоторой части клеток
памяти оставшаяся их часть сохраняет способность отвечать
на антиген.
6.3. Рассредоточенная память
Рассредоточенная память Канервы (РП) принадлежит классу
рассредоточенной ассоциативной памяти, к которому, как мы
показали, относится также и иммунная память. Как и в памяти
случайного доступа (т.е. в оперативной памяти компьютера),
запись и считывание в РП осуществляются на основе указания
адреса. В отличие от памяти случайного доступа, адресное про-
пространство РП весьма большое, составляя иногда до 1000 бит,
что дает 21000 возможных адресов ячеек памяти. РП не может
заполнить целиком столь огромное количество ячеек памяти,
поэтому ее значения задаются лишь на некотором подмножестве,
скажем, в 1 млн. адресов. Соответствующие ячейки памяти име-
имеют название аппаратных ячеек. Говорят, что они осуществляют
неплотное накрытие пространства входных данных (адресов
ввода) [15].
В случае, если для некоторого адреса существуют аппарат-
аппаратные ячейки, находящиеся от него в пределах некоторого порого-
порогового расстояния по Хэммингу, то эти аппаратные ячейки активи-
активируются. Совокупность всех таких аппаратных ячеек называется
областью доступа для данного адреса (рис. 6.2 а).
В процессе записи каждый бит вводимых данных хранится
независимо счетчиками всех аппаратных ячеек, принадлежащих
140
Гл. 6. Иммунная память ассоциативна
области доступа. Если г-й бит вводимых данных равен 1, то зна-
значение г-го элемента счетчика каждой аппаратной ячейки увели-
увеличивается на 1, а если 0, то значение уменьшается на 1 (рис. 6.2 б).
При считывании данных значение каждого бита ячейки вывода
формируется независимо от других битов. Значения г-х элемен-
элементов счетчиков всех аппаратных ячеек, принадлежащих области
доступа, суммируются. Если сумма положительна, то значение
г-го бита данной ячейки памяти принимается равным 1, в про-
противном случае — 0 (рис. 6.2 в).
Адрес
Дшшые=11010010100
""Vi-у">
x x 1 . * x x
Запись
ШЕЩШШЗШ
x\ X^
Счетчики данных x
каждой аппаратной
ячейки области доступа
настраиваются в соот-
соответствии с данными х*
Чтение
Счетчики данных поэлементно складыва-
складываются и образуют двоичный вектор на осно-
х х ве порогового соотношения х х j
х Ассоциативная
выборка данных
Рис. 6.2. Двумерная иллюстрация аппаратных ячеек, неплотно и случайно рас-
распределенных в двоичном пространстве входных данных высокой размерности.
Расстояние между ними задается по Хэммингу. Аппаратные ячейки, находя-
находящиеся в пределах заданного расстояния от вводимого адреса, активируются и
образуют его область доступа (а). В процессе записи активированные аппарат-
аппаратные ячейки настраивают свои счетчики данных (б), которые аккумулируются
при чтении на основе порогового соотношения (в) (см. текст). Область доступа
для близкого адреса может содержать аппаратные ячейки, задействованные
в момент предыдущих записей, что позволяет получить ассоциативную выбор-
выборку данных (г)
Распределение данных на множестве аппаратных ячеек де-
делает память устойчивой к потере некоторых аппаратных ячеек
и позволяет производить выборку данных даже в том случае,
если считываемый адрес несколько отличается от адресов ранее
записанных данных. Если область доступа считываемого адреса
имеет непустое пересечение с областью доступа адресов записи,
6.4. Соответствие между иммунной памятью и РП 141
то некоторые аппаратные ячейки адресов записи будут активи-
активированы адресом считывания и дадут в результате ассоциативную
выборку (рис. 6.2 г).
6.4. Соответствие между иммунной
и рассредоточенной памятью
В двух предыдущих параграфах было показано, что иммун-
иммунная память и РП — это разновидности рассредоточенной ассо-
ассоциативной памяти и, следовательно, обладают свойствами ассо-
ассоциативности и устойчивости. Соответствие между этими двумя
типами памяти суммировано в табл. 6.1 и обсуждается ниже.
Таблица 6.1
Структурно-функциональное соответствие между иммунной памятью
и рассредоточенной памятью Канервы
Иммунная память
Антиген
В- и Т-лимфоциты
Область стимуляции
Аффинность рецепторов
Ответ и толерантность
Первичный ответ
Вторичный ответ
Перекрестная реакция
РП
Адрес
Аппаратные ячейки
Область доступа
Расстояние по Хэммингу
Данные
Запись и считывание данных
Считывание данных
Ассоциативная выборка данных
Для распознавания входных данных как РП, так и иммунная
память используют множество детекторов. В случае РП распо-
распознавание адресов осуществляется аппаратными ячейками, а в
случае иммунной памяти антигены распознаются В- и Т-лимфо-
цитами. В обеих системах потенциальное количество вводимых
данных чрезвычайно велико, и в силу ограниченности ресурсов
количество детекторов на много порядков меньше количества
данных — обе системы неплотно накрывают пространство ад-
адресов ввода. Для ответной реакции не требуется точного со-
соответствия адресов детекторов и вводимых данных: активация
детекторов происходит, если они отстоят от адресов ввода не
далее чем на некоторое пороговое расстояние. В случае РП
рассматривается расстояние по Хэммингу, а в случае иммунной
142 Гл. 6. Иммунная память ассоциативна
памяти роль расстояния играет аффинность рецепторов иммуно-
компетентных клеток. Таким образом, в обеих системах входные
данные активируют некоторое подмножество детекторов. В РП
это подмножество носит название области доступа для данного
адреса, а в иммунной памяти — области стимуляции для данного
антигена.
Детекторы обеих систем хранят информацию о каждом вводе
данных. В случае РП информация представляет собой двоичный
вектор и поступает извне. В случае иммунной памяти информа-
информация является результатом взаимодействий в иммунной системе,
определяющих, отвечать ли на данный антиген и если отвечать,
то выработкой какого класса антител и/или цитотоксических
Т-лимфоцитов.
Информация в обеих системах распределяется по всем ак-
активированным детекторам. В случае РП входные данные ис-
используются для настройки счетчиков, а в иммунной системе
происходит формирование большого количества клеток памяти,
которые (в случае В-лимфоцитов) подвергаются генетической
перестройке и последующему отбору. Вся информация хранится
независимо в каждом детекторе. Сила выходного сигнала опре-
определяется суммированием информации по всем активированным
детекторам.
По мере выхода детекторов из строя интенсивность выходно-
выходного сигнала постепенно снижается пропорционально количеству
оставшихся активированных детекторов. Таким образом, рас-
распределенный характер хранения информации в обеих системах
позволяет им устойчиво функционировать в условиях выхода
из строя отдельных детекторов.
В случае РП данные распределяются по аппаратным ячей-
ячейкам, каждая из которых имеет свой собственный адрес, а в
случае иммунной памяти — по клеткам, имеющим уникальные
поверхностные рецепторы (в действительности существуют це-
целые множества клеток с одинаковыми или близкими по струк-
структуре рецепторами). Если совокупность детекторов некоторого
близкого элемента входных данных (шумящий адрес в случае
РП или мутантный штамм в случае иммунной памяти) образует
непустое пересечение с множеством детекторов, активирован-
активированных в предыдущие моменты времени (рисунки 6.1 г и 6.2 г), то
последние примут участие в формировании ответной реакции.
Ассоциативная активация и медленное снижение интенсивности
выходного сигнала по мере изменения входного сигнала происхо-
происходят за счет распределения данных на множестве активированных
детекторов.
6.5. Ассоциативная активация в иммунной системе
143
6.5. Особенности явления ассоциативной активации
в иммунной системе
Предшествующее воздействие патогена часто защищает про-
против воздействия его мутантных штаммов. Например, в случае
гриппа индивиды более старшего возраста имеют повышенный
иммунитет к новым штаммам вирусов [2]. В этом случае явление
ассоциативной активации оказывает положительный эффект.
Вместе с тем, ассоциативная активация может иметь и недо-
недостатки. Если в области стимуляции вакцины (второго антиге-
антигена) частично содержится память к предшествующей инфекции
(первому антигену), то такая вакцина может быть выведена из
организма в результате ассоциативной активации, еще не успев
сформировать высокоспецифичной памяти против составляющих
ее антигенов. Если область стимуляции антигена, вызывающего
последующую инфекцию (т.е. третьего антигена), также содер-
содержит первичную память, то все в порядке (рис. 6.3 а). Однако в
противном случае может развиться болезнь, и вакцина окажется
неэффективной (рис. 6.3 б).
Первый антиген, например
прошлая инфекция вирусом гриппа
Второй антиген, например
вакцина против гриппа ,
а Третий антиген, например
вирус гриппа
Рис. 6.3. Ассоциативная активация клеток памяти, образовавшихся в ходе
первичного ответа на антиген может привести к неэффективности вакцины
(второго антигена). Предшествующая инфекция способна модифицировать им-
иммунный ответ против вакцины, усиливая (а) или подавляя (б) иммунный ответ
против штамма, вызывающего последующую (третью) инфекцию
Неоднозначная ситуация может возникнуть, если близкие
входные данные вызывают существенно различные варианты от-
ответной реакции.
В случае иммунной памяти это означает, что два близких
по структуре антигена вызывают иммунный ответ разного типа.
Считается, что такая ситуация имеет место в случае некоторых
144 Гл. 6. Иммунная память ассоциативна
видов малярии, когда предшествующая инфекция близким по
структуре антигеном уводит иммунный ответ в нежелательную
сторону [34].
6.6. Заключение
Мы показали, что существует соответствие между В- и
Т-клетками иммунной системы и аппаратными ячейками рас-
рассредоточенной памяти Канервы. А именно, множество В- и
Т-лимфоцитов осуществляет неплотное накрытие всех возмож-
возможных антигенов способом, аналогичным неплотному накрытию
всех возможных адресов РП аппаратными ячейками. Входные
данные распределяются среди большого количества В- и Т-кле-
ток памяти, аналогично распределению данных среди большого
количества независимых аппаратных ячеек РП. Таким образом,
иммунная память принадлежит семейству рассредоточенной ас-
ассоциативной памяти. Следствием этого является наличие у нее
свойств ассоциативности и устойчивости.
Д-р Дерек Смит благодарит Институт Санта-Фе и факуль-
факультет информатики Университета Нью-Мексико за предоставле-
предоставление стипендий в области искусственного интеллекта и вычис-
вычислительных систем. Он также благодарит Дэвида Экли, Уилла
Этфилда, Рона Хайтауэра, Терри Джонс, Пенти Канерву, Линду
Цикарелла, Рона Мура, Франческу Шрэди и Пола Стэнфорда за
полезные замечания. Часть работы выполнена под патронажем
Министерства энергетики США. Работа поддержана грантами
Национального института здоровья (NIH AI28433, RR06555),
фонда Джозефа П. и Джин М.Сэлливан, Управления военно-
морских исследований (ONR N00014-95-1-0364) и Национально-
Национального научного фонда США (NSF IRI-9157644). Авторы признатель-
признательны Институту Санта-Фе за постоянную поддержку.
Список литературы
1. Jenner E. An inquiry into the causes and effects of the variolae
vaccinae. L.: Sampson Low, 1798.
2. Francis T. Influenza, the new acquayantance // Ann. Intern. Med.
1953. V.39, №2. P. 203-221.
3. Davenport F.M., Hennessy A.V., Francis T. Epidemiologic and im-
munologic significance of age distribution of antibody to antigenic
variants of influenza virus // J. Exp. Med. 1953. V. 98. P. 641-656.
4. Gilden R.V. Antibody responses after successive injections of related
antigen // Immunology. 1963. V. 6, №30. P. 30-36.
Список литературы 145
5. Fazekas de St. Groth S., Webster R.G. Disquisitions of original
antigenic sin. II. Proof in lower creatures // J. Exp. Med. 1966.
V. 124. P. 347-361.
6. Risen H.N., Little J.R., Steiner L.A., Simms E.S., Gray W. Degen-
Degeneracy in the secondary immune response: Stimulation of antibody
formation by cross-reacting antigens // Isr. J. Med. Sci. 1969. V. 5.
P. 338-351.
7. Ivanyi J. Recall of antibody synthesis to the primary antigen following
successive immunization with heterologous albumins. A two-cell
theory of the original antigenic sin // Eur. J. Immunol. 1972. V. 2,
№4. P. 354-359.
8. Deutsch S., Bussard A.E. Original antigenic sin at the cellular
level I. Antibodies produced by individual cells against cross-reacting
haptens // Eur. J. Immunol. 1972. V.2, №4. P. 374-378.
9. Fish S., Zenowich E., Fleming M., Manser T. Molecular analysis
of original antigenic sin I. Clonal selection, somatic mutation, and
isotype switching during a memory В cell response // J. Exp. Med.
1989. V. 170, №4. P. 1191-1209.
10. Nara P.L., Goudsmit J. Clonal dominance of the neutralizing re-
response to the HIV-1 V3 epitope: evidence for original antigenic
sin during vaccination and infection in animals including humans //
Vaccines (Cold Spring Harbor Eighth Annual Meeting), V. 91 (Ed.
R. M. Chanock), Modern Approaches to New Vaccines including Pre-
Prevention of AIDS. Cold Spring Harbor, NY, 1990.
11. Smith D.J. A literature review of original antigenic sin. Technical
Report TR 94-10, University of New Mexico, Albuquerque, NM,
1994.
12. Kanerva P. Sparse distributed memory and related models //
Associative neural memories: Theory and implementation (Ed.
H.M.Hassoun), Ch.3. Oxford: Oxford University Press, 1992.
13. Marr D. A theory of cerebellar cortex // J. Physiol. 1969. V.202.
P. 437-470.
14. Albus J.S. Brains, behavior, and robotics. Peterborough: Byte Books,
1981.
15. Kanerva P. Sparse distributed memory. MIT Press, Cambridge, MA,
1988.
16. Berek C, Milstein С The dynamic nature of the antibody repertoire //
Immunol. Rev. 1988. V. 105. P. 5-26.
17. Kohler G. Frequency of precursor cells against the enzyme beta-
galactosidase: Au estimate of the BALB/c strain antibody reper-
repertoire // Eur. J. Immunol. 1976. V.6. P. 340-347.
18. Klinman N.R., Press J.L., Sigal N.H., Gerhart P.J.. The acquisition
of the В cell specificity repertoire: the germ-line theory of prede-
predetermined permutation of genetic information // The generation of
antibody diversity (Ed. A. J. Cunningham). N.Y.: Academic Press,
1976. P. 127-150.
19. Klinman N.R., Sigal N.H., Metcalf E.S., Gerhart P.J., Pierce S.K.
Cold Spring Harbor Symp. Quant. Biol. 1977. V.41. P. 165.
146 Гл. 6. Иммунная память ассоциативна
20. Inman J.K. The antibody combining region: Speculations on the
hypothesis of general multispecificity // Theoretical immunology
(Eds. G.Bell, A. Perelson, GPimbley). N.Y.: Marcel Decker, 1978.
P. 243-278.
21. Edelman G.M. Origins and mechanisms of specificity in clonal selec-
selection // Cellular selection and regulation in the immune system (Ed.
GM. Edelman). N.Y.: Raven Press, 1974. P. 1-38.
22. Nossal C.J.V., Ada G.L. Antigens, lymphoid cells and the immune
response. N.Y.: Academic Press, 1971.
23. Jerne N.K. Clonal selection in a lymphocyte network // Cellular
selection and regulation in the immune system (Ed. G M. Edelman).
N.Y.: Raven Press, 1974. P. 39-48.
24. Perelson A.S., Oster GF. Theoretical studies of clonal selection:
Minimal antibody repertoire size and reliability of self-non-self dis-
discrimination // J. Theor. Biol. 1979. V.81. P. 645-670.
25. Burnet F.M. The clonal selection theory of immunity. L.: Cambridge
University Press, 1959.
26. Mackay C.R. Immunological memory // Adv. Immunol. 1993. V. 53.
P. 217-265.
27. Jerne N.K. Towards a network theory of the immune system // Ann.
Immunol. (Institute Pasteur). 1974. V. 125C. P. 373.
28. Tew J.G., Mandel Т.Е. Prolonged antigen half-life in the lymphoid
follicles of antigen-specifically immunized mice // Immunology. 1979.
V. 37. P. 69-76.
29. Tew J.G, Phipps P.R., Mandel Т.Е. The maintenance and regulation
of the humoral immune response, persisting antigen and the role of
follicular antigen binding dendritic cells // Immunol. Rev. 1980. V. 53.
P. 175-211.
30. Matzinger P. Immunological memories are made of this? // Nature.
1994. V.369. P. 605-606.
31. Farmer J.D., Packard N.H., Perelson A.S. The immune system, adap-
adaptation, and machine learning // Physica D. 1986. V.22. P. 187-204.
32. Gibert C.J., Routen T.W. Associative memory in an immune-based
system // Proc. 12th Natl. Conf. on Artificial Intelligence, Cambridge,
MA, 1994. AAAI Press/The MIT Press. P. 852-857.
33. East I.J., Todd P.E., Leach S.J. Original antigenic sin: Experiments
with a defined antigen // Mol. Immunol. 1980. V. 17. P. 1539-1544.
34. Good M.F., Zevering Y., Currier /., Bilsborough J. «Original anti-
antigenic sin», T cell memory, and malaria sporozoite immunity: A
hypothesis for immune evasion // Parasite Immunol. 1993. V. 15,
№4. P. 187-193.
Д-р Дерек Смит является сотрудником факультета информатики в уни-
университете Нью-Мексико, где защитил диссертацию в 1997 г. До этого в течение
10 лет работал в исследовательских лабораториях компании Texas Instruments.
Имеет публикации в области генетических алгоритмов, нейронных сетей,
систем автоматизированного проектирования и архитектуры вычислительных
систем.
Список литературы 147
Д-р Стефани Форрест — доцент информатики университета Нью-Мекси-
Нью-Мексико в Альбукерке и сотрудник внешнего факультета Института Санта-Фе. По-
Получила степень магистра и доктора философии в области информатики в Ми-
Мичиганском университете, Энн Арбор A982, 1985), а также степень бакалавра
искусств в колледже св. Иоанна Крестителя, Анаполис, и институте Санта-Фе
A977). Редактор двух сборников научных статей, автор книги по системам
классификации и большого количества статей в области параллельных адап-
адаптивных систем, включая генетические алгоритмы, системы классификации,
эмерджентные вычисления, вычислительную иммунологию и компьютерную
безопасность.
Д-р Алан С. Перельсон — руководитель группы теоретической биологии
и биофизики Лос-Аламосской национальной лаборатории. Директор Програм-
Программы исследований по теоретической иммунологии в институте Санта-Фе. Его
научные интересы связаны с математическим моделированием в иммунологии
и медицине.
Глава 7
ОЦЕНКА И ПРОГНОЗ КОЛИЧЕСТВА
СВОБОДНЫХ ВИРУСОВ ИММУНОДЕФИЦИТА
ЧЕЛОВЕКА И Т-ЛИМФОЦИТОВ
С ИСПОЛЬЗОВАНИЕМ НЕЛИНЕЙНОГО
ФИЛЬТРА КАЛМАНА
Вай-Юань Тан, Шихуа Сянг
Для оценки и прогноза количества свободных вирусных частиц и Т-лим-
фоцитов у ВИЧ-инфицированных предложены математические модели патоге-
патогенеза ВИЧ-инфекции. Динамика инфекции описывается системой нелинейных
стохастических дифференциальных уравнений, а статистическая модель на-
наблюдений основана на данных по концентрации в крови вирусной РНК и/или
Т-лимфоцитов CD4+ в различные моменты времени. Это модели непрерывного
фильтра Калмана с дискретным временем. Разработаны алгоритмы оценки
и прогноза численности субпопуляций Т-лимфоцитов и свободных вирусов
с использованием квадратичного и расширенного фильтров Калмана. Эти ал-
алгоритмы применяются для моделирования данных по динамике концентрации
в крови вирусной РНК, собранных в течение двух недель после лечения
пациента, описанного в работе [1], ингибитором протеазы. Показано, что через
две недели после лечения большинство вирусных частиц неинфекционные.
Оценки численности свободных вирусов, полученные для первых 10 дней
после введения лекарственного препарата с использованием фильтра Калмана,
свидетельствуют о более сильном действии препарата, чем оценки, полученные
на основе детерминированной модели.
7.1. Введение
Начальная стадия патогенеза ВИЧ-инфекции связана с ин-
инфицированием незараженных Т-лимфоцитов CD4+ свободными
(внеклеточными) частицами ВИЧ, что в конечном итоге при-
приводит к истощению популяции этих клеток. В работах Хо
и соавт. [2], а также Вея и соавт. [3] было показано, что
этот процесс протекает весьма динамично: свободные вирусы
и ВИЧ-инфицированные Т-лимфоциты CD4+ характеризуются
высокой скоростью обновления собственных популяций и корот-
коротким временем жизни. Поэтому истощение популяции Т-лимфо-
Т-лимфоцитов CD4+ является следствием их разрушения вирусом, а не
7.2. Стохастическая модель патогенеза ВИЧ-инфекции 149
снижения скорости их образования [4]. Д.Хо сформулировал
вывод [4], что движущей силой патогенеза ВИЧ-инфекции яв-
является непрерывный процесс интенсивной репликации вируса.
Следовательно, для понимания и уточнения степени развития
патологического процесса важны оценки концентрации свобод-
свободных вирусных частиц и Т-лимфоцитов в ходе ВИЧ-инфекции.
Для решения этой задачи в настоящей главе построена модель
пространства состояний патогенеза ВИЧ-инфекции. Важность
оценки динамики концентрации свободных вирусных частиц под-
подтверждается данными, полученными в работах [5,6], о высокой
корреляции концентрации частиц с тяжестью течения заболе-
заболевания.
В п. 7.2 строится стохастическая модель патогенеза ВИЧ-ин-
ВИЧ-инфекции, описывающая процессы, происходящие в инфицирован-
инфицированном организме на клеточном уровне. В п. 7.3 на основе ре-
результатов, полученных в п. 7.2, построена модель пространства
состояний патогенеза ВИЧ-инфекции с использованием данных
по концентрации копий вирусной РНК или Т-лимфоцитов CD4+.
В п. 7.4 эта модель применяется для описания и анализа состо-
состояния пациента под номером 104, данные о котором приведены
в работе [1], получавшего лечение в виде ингибитора протеазы.
В п. 7.5 с использованием метода Монте-Карло анализируется
эффективность и полезность моделей фильтра Калмана. Нако-
Наконец, в п. 7.6 обсуждается ряд вопросов, относящихся к модели
пространства состояний, и сформулированы общие выводы.
7.2. Стохастическая модель патогенеза ВИЧ-инфекции
Пусть T{t) обозначает количество здоровых незараженных
Т-лимфоцитов CD4+, T*(t) — количество Т-лимфоцитов CD4+
с активной ВИЧ-инфекцией, V(t) — количество свободных (вне-
(внеклеточных) вирусов в момент времени t. В результате приме-
применения антивирусных препаратов свободные вирусные частицы
делятся на три типа: неинфекционные (Vq), инфекционные и
чувствительные к препарату (V\), инфекционные и устойчивые
к препарату (V2). Таким образом, V(t) = Vo(t) + V\(t) + V2(t),
где Vi(t) — количество свободных вирусных частиц типа г
(г = 0, 1,2) в момент t. Популяция клеток Т*, в свою очередь,
делится на группы Т* (j = 1,2), где Т* — количество Т-лимфо-
Т-лимфоцитов CD4+, активно инфицированных вирусом Vj (j = 1,2). Ла-
Латентно инфицированные Т-лимфоциты не рассматриваются, так
как они мало влияют на общее количество свободных вирусов
150 Гл. 7. Оценка и прогноз количества свободных вирусов
(см. замечание 1 и [1]). Построим стохастическую модель этих
процессов.
Для простоты мы рассматриваем действие одного препара-
препарата — ингибитора протеазы. В целях описания процесса фор-
формирования устойчивости к лекарственному препарату введем
величину V\{a) — количество чувствительных к препарату ин-
инфекционных свободных вирусов, которые подверглись действию
препарата в течение времени а, а через V\(t,a) обозначим ко-
количество V\(a) в момент t. Так как продолжительность жиз-
жизни свободных вирусов очень мала (от 6 до 12 часов, см. [1]),
то без потери общности можно считать, что а < 5 сут. Пусть
?(?) = min(t — to, 5 сут.), где to — момент начала применения пре-
препарата. Тогда для t ^ to получаем, что V\{t) = j^ V\(t, a) da.
7.2.1. Механизмы ВИЧ-инфекции. Для построения моде-
модели патогенеза ВИЧ-инфекции обратимся к биологическим дан-
данным, приведенным в работах [7-10], а также к статьям Киршнер,
Перельсона и соавт. [11-15] и Шензле [16]. Рассмотрим сле-
следующие результаты экспериментальных исследований и покажем
способы описания зависимых переменных процесса.
1. Новые здоровые незараженные Т-лимфоциты CD4+ (обо-
(обозначаемые далее как Т-лимфоциты) образуются в костном мозге
из стволовых клеток, мигрируют в тимус, там созревают и током
крови переносятся в различные участки тела. При отсутствии
вирусов иммунодефицита человека скорость образования этих
клеток постоянна; при наличии свободных вирусов эта скорость
является убывающей функцией их численности, так как вируса-
вирусами могут быть заражены и стволовые клетки [7, 12, 15]. Опишем
процесс появления новых Т-лимфоцитов в виде пуассоновской
случайной величины s(t), убывающей с увеличением количества
свободных вирусов (см. [12, 15]). Пусть S(t) — количество об-
образованных таким способом Т-лимфоцитов за время (t,t + At].
Тогда с точностью до o(At) величина S(t) имеет пуассоновское
распределение со средним s(t)At. Это означает, что S(t)\ V(t)
близка к пуассоновской величине со средним s(t)At. Следуя [12]
и [15], предположим, что если не оговорено особо, то величина
s(t) имеет вид s6/F + V\(t) + V2(t)).
2. Как показано в [12, 15, 17-19], вирус иммунодефици-
иммунодефицита человека может заражать активно делящиеся Т-лимфоциты,
интегрироваться в геном клетки хозяина и переходить в со-
состояние провируса. Такие Т-лимфоциты имеют название активно
инфицированных и обозначаются как Т*; эти клетки выделя-
выделяют свободные частицы ВИЧ и затем обычно погибают. Пусть
7.2. Стохастическая модель патогенеза ВИЧ-инфекции 151
k(t) — скорость заражения Т-лимфоцитов вирусами в момент t.
Тогда для заданного количества Т-лимфоцитов T(t) в момент t
вероятность заражения клетки свободным вирусом на интерва-
интервале (t,t + At] с точностью до о (At) равна k(t)T(t)At. Пусть
S(t) — доля делящихся Т-лимфоцитов в момент t, Nj(t) —
общее количество Т-лимфоцитов (за исключением делящихся
клеток), способных заразиться вирусом в момент t, a %(?) —
вероятность того, что вирус попадает в уже зараженную клетку.
Тогда, согласно закону действующих масс, вероятность зараже-
заражения Т-лимфоцита свободным вирусом на интервале (t, t + At]
с точностью до o(At) равна x(t)[S(t)T(t)/(S(t)T(t) + Nr(t))]At,
так что k(t) = x(t)S(t)/(S(t)T(t) + Nj(t)). Отсюда видно, что
величина k(t), как правило, очень мала.
Замечание 1. Как показано в [12, 15, 17-19], ВИЧ может
также инфицировать покоящиеся (неделящиеся) Т-лимфоциты.
Однако если свободный вирус заразит такую клетку, то основная
часть провирусной ДНК не будет интегрирована в геном клет-
клетки хозяина, а сформирует внехромосомные цитоплазматические
образования [18]. Такие клетки не продуцируют ВИЧ до тех
пор, пока в результате активации они не перейдут в клетки Т*
[17, 18]. Так как внехромосомные фрагменты ДНК со временем
утрачиваются, латентно инфицированные Т-лимфоциты обычно
переходят в здоровые клетки и мало влияют на образование
свободных вирусов [1]. Поэтому, по аналогии с работой [1],
мы пренебрегаем образованием свободных вирусов в латентно
инфицированных клетках.
3. В результате действия ВИЧ и его антигенов Т-лимфоциты
активируются и начинают делиться. С другой стороны, продол-
продолжительность жизни Т-лимфоцитов ограничена, поэтому для лю-
любого конечного интервала времени вероятность их гибели больше
нуля. Биологические данные, приведенные в [12,15], а также
результаты работы [20] позволяют рассматривать процессы рож-
рождения и гибели как стохастические процессы с не зависящими
от инфекционного процесса скоростями рождения b\(t) = X(t) и
гибели fi\(t). При этом X(t) — это логистическая кривая, имею-
щая вид A(t) = l(t)V{t){\ - [T(t) + T*(t)]}/[Tmax(ev + V(t))},
где Tmax = max(T,T*). Пусть B\(t) — количество Т-лим-
Т-лимфоцитов, образующихся на интервале (t, t + At] в резуль-
результате деления клеток, активированных свободным вирусом и
его антигенами, a D\(t) — количество Т-лимфоцитов, поги-
погибающих за время (t,t + At]. Тогда, с точностью до о (At),
{Bi(t),Di(t)}\ [V(t),T(t),T*(t)] имеет мультиномиальное рас-
распределение [T(t), X(t)At, fj,\(t)At].
152 Гл. 7. Оценка и прогноз количества свободных вирусов
4. Можно предположить, что клетки Т* не делятся, так как
они имеют короткое время жизни и в результате активации по-
погибают [1,2, 12, 15]. С другой стороны, клетки Т*, как и клетки
Т, имеют конечную продолжительность жизни и, следовательно,
для любого интервала времени вероятность их гибели больше
нуля. Апоптоз и цитопатическое действие ВИЧ приводят к тому,
что продолжительность жизни клеток Т* гораздо меньше, чем у
клеток Т [12, 15, 17-19,21] (это эквивалентно тому, что скорость
гибели клеток Т* гораздо больше, чем у клеток Т*, примерно
в 10 раз [1-3]). Также установлено, что продолжительность
жизни свободных вирусов еще меньше, чем у клеток Т* (средняя
продолжительность жизни свободных вирусов составляет 0,3 сут.
[1-3]). Более того, скорость клиренса свободных ВИЧ не зависит
от фазы болезни несмотря на то, что на поздних фазах вирусная
нагрузка, как правило, увеличивается [2-4]).
5. Гибель клеток Т* в момент t приводит к выходу в среду
N(t) свободных вирусов. На данном этапе работы мы прене-
пренебрегаем случайной вариацией этой величины и считаем, что
N(t) — детерминированная функция, зависящая от времени t.
В дальнейшем наша модель будет обобщена на случай, когда
N(t) является случайной величиной, распределенной по некото-
некоторому закону. Отметим, что результаты статистических вычисли-
вычислительных экспериментов [22] показывают, что, хотя зашумление
N(t) увеличивает амплитуду шума, это не влияет на тренды,
динамику и исходы моделируемого процесса.
6. В настоящее время для лечения ВИЧ-инфекции приме-
применяются две группы антивирусных препаратов. Препараты пер-
первой группы блокируют обратную транскрипцию вирусной РНК
в ДНК в клетках, что приводит к уменьшению скорости зараже-
заражения Т-лимфоцитов свободными ВИЧ. Такой механизм действия
имеют препараты азидотимидин (AZT), залцитабин (DDC) и
диданозин (DDI). Препараты второй группы действуют на ВИЧ,
блокируя протеазу, что приводит к снижению скорости образо-
образования свободных ВИЧ после гибели клеток (вирусные частицы
становятся неинфекционными). Препараты данной группы на-
называются ингибиторами протеазы. Таким образом, при лечении
препаратами первой группы вирусы становятся дефектными по
обратной транскриптазе, из-за чего они не способны заразить
Т-лимфоциты. Вместе с тем, дефектные вирусные частицы сохра-
сохраняют способность проникать в Т-лимфоциты и, таким образом,
покидать пул свободных вирусов. При лечении ингибиторами
протеазы большинство вирусов, освобождающихся в результате
гибели клеток CD4+, являются неинфекционными. Для просто-
7.2. Стохастическая модель патогенеза ВИЧ-инфекции 153
ты в этой главе мы рассмотрим лишь результаты применения
ингибитора протеазы.
7. При длительном лечении происходят мутации вирусов, и
ВИЧ типа V\ переходят в ВИЧ V2. Обратный переход не на-
наблюдается [23-27]. Далее, скорость перехода V\ —> V2 зависит
от длительности воздействия препарата на V\. Обозначим через
га (а) скорость перехода V\{a) —^ V2. Тогда вероятность того, что
за время (t,t + At] вирус типа V\(a) перейдет в V2, с точностью
до о (At) равна m(a)At.
8. Предполагаем, что определенные таким образом компо-
компоненты вектора Xt являются попарно независимыми случайными
величинами.
7.2.2. Вывод уравнений. Для вывода стохастических
дифференциальных уравнений рассмотрим интервал времени
(t,t + At]. Пусть F\(t,a) — количество новых клеток Т*,
появляющихся в результате заражения делящихся Т-лимфоцитов
свободными V\(a) на интервале (t,t + At], a F2(t,a) —
количество новых клеток Т2*, появляющихся в результате
заражения делящихся Т-лимфоцитов свободными V2 на том
же самом интервале. Количество новых мутантных вирусов
V2, образующихся из V\ за время (t,t + At], обозначим через
M(t,a), а через u(t) — среднюю долю Vq (свободных неин-
неинфекционных вирусных частиц), высвобождающихся в момент
времени t в результате гибели клеток Т*. Пусть Dyi(t) —
количество свободных вирусов Vi (г = 0,2), выведенных за
время (t,t + At], a D^ (t) — количество погибших клеток Т*,
j = 1,2 за время (t,t + At]. Тогда динамика изменения величин
{T(t,t + At), Tf(t,t + At), j = 1,2, Vi(t,t + At), г = 0,2,
V\(t,t + At,0), V\(t,t + At,a + At), ?(t) ^ a > 0} может быть
описана следующими стохастическими уравнениями:
T(t + At) = T(t) + S(t) + Bx(t) - Fx(t) - F2(t) - Dx(t), A)
T/(* + At) = T*(t) + S(t) + Fj(t) - DBj\t), i = 1,2, B)
VQ(t + At) = V0(t) + co(t)N(t)D{2l\t) - Dvo(t), C)
Vx(t + At,0) = [1 - oj(t)]N(t)D{2l\t), D)
V\(t + At,a + At) =
= V\ (t, a) - Fx (t, a) - M(t, a) - Dvx (t, a), a > 0, E)
V2(t + At) = V2(t) + N(t)D{2\t) + M(t) - F2(t) - Dv2(t), F)
154 Гл. 7. Оценка и прогноз количества свободных вирусов
где величины S(t), B\(t) и D\(t) определены в предыдущем
разделе, а ?(?) = min(t - to, 5 сут), F\{t) = j^ F\(t,a)da и
M{t) = J*(t) M(t,a)da.
Предполагается, что все переменные в уравнениях A)-F)
являются случайными величинами. Как уже отмечалось, их
условные распределения при заданных Xt = (Т(?),Т*(?), j =
= 1,2, Vi(t), г = 0,2, Vi(t,0), Vi(t,a),?(t) > a > 0} можно пред-
представить в следующем виде:
• 5D) | V(t) ~ пуассоновское [з(*)Д?];
• M(t,a) | Vi(t, a) ~ биномиальное [V\(t, a); m(a)At], a > 0;
• G(t,a) = {Fi(t,a),DVi(t,a)} | {Vi(t,a),T(t)} - мульти-
мультиномиальное [Vi(t,a);k(t)T(t)At;iJ,v(t)Ai\, ^(t) ^ a > 0;
• G2(*,a) = {F2(t);Dy2(^)} I {V2(t),T(t)} - мультиноми-
мультиномиальное [V2(ty, k(t)T(t)At;fiv(t)At];
• Mi(t) = {B\(t); D\(t)} | T(t) ~ мультиномиальное
[()Л()Д()Д]
биномиальное [Т^(*)
биномиальное [Vo(t);
где A(«) = 7@A - [T(t) + E?=i 77(*)]/7max}V(«)/[ev + V(t)],
= Vo(i) + V\(t) + V2(i). Далее, при заданных Xt величины
S(t), M(t,a), G(t,a), G2(t,a), M{(t), D^\t) (j = 1,2) и Dv0(t)
являются независимо распределенными.
Пусть st = [ei(t),eBj)(t), j = 1,2, e3(t),e4(t,0),e4(t,a),
T, где
[Bi(t) - X(t)T(t)At] -
) ~ Ht)T(t)Vi(t)At] - [Dx(t) - /
i=\
s{2j)(t)At = [Fj(t) - k(t)Vj(t)T(t)At] - [D{2j)(t) - ii2(t)T*(t)At\,
- T?(t)ii2(t)At] - [Dvo(t) - iiv{t)VQ{t)At\-
s4(t,0)At = [1 -u(t)]N(t)[DBl\t)-T?(t)ii2(t)At};
eA{t, a)At = -[Fx (t, a) - k{t)V{ (t, a)T(t)At] -
- [M(t, a) - m{a)Vx (t, a)At] - [Dvl (t, a) - (j,v(t)Vx (t, a)At],
a > 0;
7.2. Стохастическая модель патогенеза ВИЧ-инфекции 155
s5(t)At = N(t)[Df\t) - T2*(t)n2(t)At] +
- [ m(a)Vi{t,a)daAt\ - [F2(t) - k(t)T(t)V2(t)At]-
° -[Dv2{t)-^v{t)V2{t)At].
Обозначим — Z(t) = lim —- -^——, тогда уравнения
t>0
(l)-F) преобразуются в систему стохастических дифференци-
дифференциальных уравнений
T(t) = sit) +
-T/(i) = kit)
dt
^V\(t,
.+ OJ\Vi(t,a]
^(t) = N(t)LLo
X(t)T(t)-T
mmt)-:
U(t)N(t)Tf(t
O) = [l-u(t
) = -[m(a) +
?(t
{t){fn(t) + k{t)[\
Г/(«)/Х2(*) + е2Ш(
0М2(*) - V0(t)liV
)]N(t)T*n2(t) +
¦k(t)T(t) + Mi
+ ?4(t, a), ^
mia)V\it, a) da
'lit)
(*)¦
?4(<
l]) + ei(<
i = l,2,
f ез(*),
,0),
(t,a) +
). G)
(8)
(9)
A0)
A1)
0
- k(t)V2(t)T(t) -
Если устойчивость к препарату не успевает развиться за
время tN, то для t ^ tjy имеем \^(^) = 0 и T2*(t) = 0. При
отсутствии лекарственной устойчивости выполняются равенства
T*(t) = T*(t) и га (a) = 0, а уравнения G)—A2) сводятся к
± T(t) = s(t) + \(t)T(t) - T{t){»{ (t) + k{t)Vx {t)) + ei («), A3)
ft T*(t) = k(t)V,(t)T(t) - T*(t)»2(t) + e2(t), A4)
ft V0(t) = u{t)N{t)T*{t)v2{t) - V0{t)nv{t)e3, A5)
{k{t)T{t) + nv{t)}V\{t) + eA{t). A6)
В уравнениях G)—A2) при заданных Xt случайные возмуще-
возмущения et = {exit), ef{t), i = 1,2, s3(t),e4(t,a), ?(t) > a > 0, e5(t)}
имеют нулевое математическое ожидание, а значит Ее4 = 0.
156 Гл. 7. Оценка и прогноз количества свободных вирусов
Используя стандартные выражения для Cov(X,Y) =
= E{Cov[(X,Y)\ Z}} + Cov[E(X| Z), Е(У| Z)], а также то, что
?t не коррелировано с элементами Х$, можно получить выраже-
выражения для дисперсии и ковариации элементов et с точностью до
o(At):
Var[ei(t)] =
= E{s(t) + X(t)T(t) + [/xi (t) + k(t)(Vi(t) + V2(t))]T(t)},
Cov[ei(t),e$\t)] = -k(t)E[Vj(t)T(t)], j = 1,2,
Cov[ei (t), e3(t)] = Covfei (t), ?4@, <)] = 0,
Cov[ei (t), ?4(a, t)] = k(t)E[Vi (a, t)T(t)], a > 0,
Li2(t)T2*(t)], j = 1,2,
= -u;(t)N(t)E[T?(t)],
= -[1 -
Cov^1^),^^)] = Cov[42)(t),e3(<)] =
= Cov[42)(<), ?4(b, t)] = 0,
Cov[s{2l)(t),eb(t)] = 0,
Cov[42)(*),?5(*)] = -k(t)E[V2(t)T(t)] - N(t)fi2
Var[e3(t)] = w2(t)W2(*)M2(<)E:rf (t),
Cov[e4@, t), e3(t)] = w(*)[l - w(t)]yV2(i)/
Cov[?4(o,<),?3(*)] = Gov[e3{t),s5(t)] = 0, a > 0,
Var[e4@,t)] = [1 - u(t)]2N2fi2(t)ET?(t),
Var[e4(o,<)] = E{[fe(i)T(i) +^v(<) + m(a)]Vi(a,<)}, a > 0,
Cov[e4(ai,i),e4(a2,i)] = Cov[e4@, t),?5(i)] = 0, ai ^ 02. aj ^ 0,
m(o)E[Vi(o,«)]da
0
Cov[e4(a,t),e5(t)] = -m(a)E[Ki(a,i)], a > 0.
7.3. Модель пространства состояний патогенеза ВИЧ-инфекции 157
7.3. Модель пространства состояний патогенеза
ВИЧ-инфекции
Модель пространства состояний состоит из системы стоха-
стохастических дифференциальных уравнений, описывающих динами-
динамику изменения фазовых переменных системы, и статистической
модели результатов наблюдений. Размерность этой модели явля-
является суммой размерностей двух моделей, одна из которых учи-
учитывает базовые механизмы патогенеза и случайные возмущения
в системе, а другая — данные наблюдений. Модель пространства
состояний объединяет в себе достоинства обеих моделей, и ее
основной целью является получение оптимальных оценок теку-
текущего фазового состояния и прогноза динамики стохастической
системы.
Модель патогенеза ВИЧ-инфекции, описанная в п. 7.2,
представляет собой систему стохастических дифференциальных
уравнений G)—A2), а модель наблюдений описывает данные
по концентрации в крови вирусной РНК и/или Т-лимфоцитов
CD4+ в различные моменты времени. Предположим, что для
некоторого отрезка времени проведены измерения концентрации
вирусной РНК (или Т-лимфоцитов CD4+). Пусть Yj — резуль-
результаты измерений в моменты tj (j = l,...,n). Тогда уравнения
модели наблюдений имеют вид
+ ej, j = 1,..., n, A7)
где ej — случайная ошибка измерений величины Yj. (Если Yj —
результаты измерений численности Т-лимфоцитов CD4+, а не
вирусов, то выражение V(tj) = J2i=Q Vi(tj) необходимо заменить
на T(tj) + ^2i=lT*(tj).) Как обычно, величины ej предполага-
предполагаются независимыми и нормально распределенными со средним
0 и дисперсией а2-. Также предположим, что ej не зависят от
случайных возмущений еA) стохастической системы.
Модель пространства состояний содержит систему стохасти-
стохастических уравнений с непрерывным временем и уравнения наблю-
наблюдений с дискретным временем. Далее, уравнения наблюдений
линейные, а стохастическая система нелинейная. Еще более услож-
усложняет ситуацию наличие стохастического уравнения в частных
производных. Общей теории для таких моделей не существует.
Один из возможных подходов состоит в дискретизации пере-
переменных времени и возраста с переходом к стохастическим раз-
разностным уравнениям. Этот подход использовался в работе [28]
158 Гл. 7. Оценка и прогноз количества свободных вирусов
для моделирования антивирусной терапии и процесса формиро-
формирования лекарственной устойчивости. Если лечение продолжается
не слишком долго, то резистентность чаще всего не развивается.
Это имеет место и для рассматриваемого нами клинического слу-
случая в работе [1]. Тогда динамика фазовых переменных системы
задается уравнениями A3)-A6), и далее, говоря про стохасти-
стохастические уравнения, мы будем иметь в виду эту систему (если
не указано иное).
7.3.1. Квадратичный фильтр Калмана. Система стоха-
стохастических диффренциальных уравнений A3)—A6) квадратична,
за исключением члена, содержащего s{t) в уравнении A3). Так
как количество свободных ВИЧ до лечения, как правило, очень
велико, то s(t) хорошо описывается первым членом разложе-
разложения в ряд Тейлора. В этом разделе мы получим аналитические
результаты для моделей пространства состояний, имеющих вид
системы стохастических уравнений с квадратичной правой ча-
частью, описывающих динамику фазовых переменных, и линейной
модели наблюдений.
Рассмотрим модель пространства состояний ВИЧ-инфекции,
состоящую из системы уравнений модели (А) и уравнений на-
наблюдений (Б).
(А) Система уравнений:
4- X(t) = a(t) + B(t)X(t) + R(X(t)XT(t)) + e(t), A8)
где a(t) и B(t) — детерминированные функции, e(t) — вектор
случайного шума, a R(X(t)XT(t)) — вектор-столбец, г-й эле-
элемент которого равен XT(t)RiX(t) = tr{RiX(t)XT(t)} (R* -
симметричная матрица).
(Б) Уравнения наблюдений:
+ еи), A9)
ri
где H(j) — детерминированные величины, a e(j) — вектор слу-
случайных возмущений, связанный с ошибкой измерений величины
В уравнениях A8) и A9) предполагается, что Ee(t) = О,
Ее(j) = 0, Var[e(«)] = Vx(t), Var[e(j)] = S,-, Cov[e(t), e{j)] = 0,
l-^l l~^l rsj rsj rsj rsj
а также что e(t) и e(j) некоррелированы с X{r) для любых
7.3. Модель пространства состояний патогенеза ВИЧ-инфекции 159
Используя эти определения, построим оценочную функцию
(или предсказатель) для X(t) и ковариационной матрицы оши-
бок в предположении о нормальном распределении величин e{t)
и e(j). Предположение о нормальности для случайных шу-
мов подтверждается результатами работы [29] для стационар-
стационарных условий. Отметим, что в случае нормального распределения
оценка методом максимального правдоподобия совпадает с оцен-
оценкой методом наименьших квадратов (МНК). Для вывода этих
оценок положим:
• для tj^t< tj+u j = 0, 1,... X(t\tj) = МНК-оценка X(t)
по данным {У(I), 1 = 1,..., j};
. e(t\j) = X(t\tj) - X(t) и e(j\j) = Xitjltj) - X(t), a
Var[e(t\j)] = Q(t\j) и Var[e(j|j)] = P(j\j);
• пусть X@) = X@|0) является оценкой Х@) в момент вре-
мени to = 0, и удовлетворяет условиям ЕХ@|0) = ЕХ@) и
Var[e@|0)|X@)] = Р@) = Р@|0).
Для получения МНК-оценки X{t) используем следующую
аппроксимацию системы уравнений (А):
X(t + dt) w a(t) dt + [I + B(t)dt]X(t) +
t+dt
+ R(X(t)XT(t))dt+ f s(u)du. B0)
t
Так как случайные возмущения описываются нормальным рас-
распределением для заданных {Y(l), I = 1,..., j\, то X(t + dt) так-
же имеют нормальное распределение с условным средним X(t +
rp
+ dt\tj) w a(t)dt + [I + B(t)dt]X(t\tj) + R{X{t\tj)X (t\tj))dt +
+ R(Q(t\tj))dt. Здесь Q(t\tj) — условная ковариационная мат-
рица X(t + dt\tj) для данных {Y(l), l = l,...,j} и X(t + dt).
Отсюда следует, что X(t\tj) — МНК-оценка X{t) по данным
|Y(I), I = 1,..., j} — удовлетворяет уравнению
-? X(t\tj) = a{t) + B{t)X{t\ti)
+ R(Q(t\tj)) B1)
160 Гл. 7. Оценка и прогноз количества свободных вирусов
с граничным условием lim X(t\tj) = X(tj+\\tj) = u(j + l|j).
Кроме того, для tj+\ — tj = ndt и 0 ^ г < п выполняет-
выполняется X(t + (i + l)dt\tj) « a(t + idt)dt + [I + B(t + idt)dt] x
x X(t + i dt\tj) + R(X(t + i dt\tj)XT(t + i dt\tj))dt + R(Q(t +
+ fdt\tj))dt.
Чтобы получить выражение для Q(t\tj), заметим, что
условные погрешности в момент времени t + At имеют
вид ?(i + At\j) = X(t + At\tj) - X(t + At) « {/ + [B(t) +
+ 2C(t)]At}s(t\j) + R(Q(t\tj))At + R(e(t\j)eT(t\j))At -
~ Jt+ l ?(x)dx, где C(t) — симметричная матрица, г-я строка
которой имеет вид X (t\tj)Hi. Так как случайные возмущения
имеют нормальное распределение, то
Q(t + At\tj) « {/ + [B(t) + 2C(t)]At}Q(t\tj)x
t+At
x {/ + [B(t) + 2C(t)]Aty + 2u(t)At + Vx(u) du,
t
где ?l(t) — симметричная матрица, (u,v)-u элемент которой
имеет вид tr{RuQ(%)RvQ(%)}.
Отсюда следует, что Q(t\tj) удовлетворяет уравнению
± Q(t\tj) = {I + [B(t) + 2C(t)]}Q(t\b) +
+ Q(t\tj){I + [B(t) + 2C(t)]}T + 2fi(t) + Vx(t) B2)
с граничным условием lim Q(t\tj) = Q(tj+\\tj) = P(j + l|j).
Далее, для tj+\ — tj = ndtnO^i<n выполняется
Q(t + (i+ l)At\tj) « {/ + [B(t + iAt) + 2C(t + i Д*)]Д*}х
x Q(t + i At\tj){I + [B(t + iAt) + 2C(t + i At)]At}T +
t+(i+\)At
+ 2u(t + iAt)At+ f Vx{u)du.
t+iAt
Из вышеприведенной формулы при условии X it At j) = u(j\j)
и Q(tj\tj) = P(j\j) можно получить МНК-оценку (прогноз)
для X(t) и Q(t\tj). Для вычисления u(j\j) и P(j\j) положим
X(tj+i\j) = u(j + l)|j) и Q(tj+i\tj) = P(j + l|j). Так как e(j)
7.3. Модель пространства состояний патогенеза ВИЧ-инфекции 161
имеет нормальное распределение, то условное распределение
Y(j + 1) для наблюдений {Y(l), I = 1,..., j} является нормаль-
ным с условным средним H(j + l)u(j + l|j). Условная матрица
ковариаций для Y(j + 1) при наблюдениях {УA), I = I,... ,j} и
заданном X{tj+{) равна H(j + \)P{j + l\j)HT(j + 1) + ?y+i-
Следовательно, условное среднее X(tj+\) при наблюдениях
{Y(l), I = 1,..., j + 1} имеет вид
где Kj+x = P(j + 1 \j)HT(j + l){H(j + l)P(j + l\j)HT(j + 1) +
Легко показать, что ковариационная матрица ошибки филь-
фильтрации e(j + l|j + 1) = X(tj+\\tj+i) - X(tj+\) имеет вид {/ -
Формулы для вычисления X(t\tj) и Q(t\tj) представляют
nj
собой обобщения формулы, приведенной в [30]. Это форму-
формулы прямой фильтрации. Для моделей пространства состояний
с квадратичной правой частью методы обратной фильтрации и
сглаживания в настоящее время отсутствуют.
7.3.2. Расширенный фильтр Калмана. Квадратичные
члены в формулах A3)-A6), как правило, имеют вид k(t)T(t)At.
Так как k(t) обычно очень мало, то эти формулы должны хорошо
приближаться расширенным фильтром Калмана с использова-
использованием первых членов разложения в ряд Тейлора. Для модели из
п. 7.2 это подтверждается результатами исследований методом
Монте-Карло, приведенными в п. 7.5.
Запишем систему уравнений модели A3)—A6) и уравнение
модели наблюдений A7) с V^) — 0' соответственно, в виде
CLZ ^
для tj ^ t < tj+\, j = 0, 1,..., n;
где Hj = {0,0, 1,1}.
Рассмотрим оценочную (прогнозирующую) функцию X(t).
Скажем, что оценка X(t) фазового вектора X(t) является несме-
6 Д. Дасгупта
162 Гл. 7. Оценка и прогноз количества свободных вирусов
щенной, если для ^e{t) = X(t) — X{t) выполняется Ee(t) = 0.
r^J rsj r^J r^J
Предположим, что Х@) не смещена для Х@) и имеет ко-
ковариационную матрицу Р@) = Р@|0). Тогда, если взять за
основу Х@) = Х@|0), то процедура, описанная в следующих
двух теоремах, дает хорошее приближение к оптимальной оценке
(прогнозу) величины X(t). Схема доказательства этих теорем
содержится в приложении к этой главе.
Теорема G.1). Рассмотрим те же обозначения, что и
в п. 7.3.1. Тогда, начиная с Х@) = й@|0) при Р@) = Р@|0),
хорошее приближение к линейной несмещенной оценке с мини-
минимальной дисперсией величины X(t) с данными Yu, и = l,...,j
(j ^ n) может быть получено применением следующей рекур-
рекурсивной процедуры.
(i) Для tj < t < tj+i, j = 0, 1,... ,n (t0 = 0, tn+\ = oo),
X(t\tj) удовлетворяет следующим уравнениям с граничными
условиями
l\m X(t\tj) = Xitjltj) = u(j\j),
где u(j\j) задается в (Ш):
± X(t\tj) = ?[*(%)] tj^t< tj+u j = 0, 1,..., п.
(ii) Для tj ^ t < tj+\,j = 0, 1,... ,n ковариационная матри-
матрица Q(t\tj) удовлетворяет следующим уравнениям с граничными
условиями
H
где P(j\j) задается в (Ш):
± Q(t\tj) = Fj(t)Q(t\tj) + Q(t\tj)Fj(t) + Vx(t),
для tj^t< tj+u j = 0, 1,..., n, где Fj (t) = -?^/(X)
VOX - - %
и Vx(t) — матрица дисперсий и ковариационная матрица слу-
случайных возмущений стохастической системы.
(ш) Обозначим u(j + l|j) = lim X(t\tj) из (i) и P(j +
+ l|j)= Ит Q№j) из 00- Тогда S(j + l|j + l) и P(j + \\j +
t->tj+i
+ 1) задаются в виде
Kj+x{Yj+x - h[u(j
7.3. Модель пространства состояний патогенеза ВИЧ-инфекции 163
где
Kj+l = P(j + l\j)H [HT P(j + l\j)H +a]]-\
В последнем выражении а2- — это дисперсия величины ej.
Для реализации описанной процедуры необходимо взять за
основу оценку Х@) = й@|0) и Р@) = Р@|0). Затем на этапах
(i) и (ii) вычисляются X(t\to) и Q(t\to) для to ^ t < t\, а на этапе
(ш) получаются йA|1) и РA|1). Повторное выполнение этапов
дает JV(t|tj) и E(^|^j) Для tj^t< tj+\, j = 0, 1,... ,п. Данная
процедура носит название прямой фильтрации.
Теорема G.2). Пусть Х(?|п) — оценочная функция фазо-
вого вектора X{t) по данным У^-, j = l,...,n. Пусть Q(t|n) —
ковариационная матрица величины *e(t\n) = X(t\n) — X{t). Обо-
r^J r^J rsj
значим u(j\N) = X(tj\n) и P(j\n) = Q(tj\n). Тогда, если взять
начальную оценку Х@) = и@\0) и Р@) = Р@|0), то линейная
несмещенная оценка фазового вектора с минимальной дисперси-
дисперсией величины X(t) и данными Yj, j = 1,... ,п хорошо аппрокси-
аппроксимируется следующими рекурсивными соотношениями:
(i) Для tj^t< tj+\(j = 0,1,... ,п) величина X(t\n) удо-
удовлетворяет следующему уравнению с граничными "условиями
lim X{t\n) = u(j\n), где u(j\n) задается в (III):
ttt r^i r^i ~
для tj ^ t < tj+\, з =0,\,... ,n.
(ii) Для tj ^ t < tj+\ (j =0,\,... ,n) величина Q(t\n) удо-
удовлетворяет следующим уравнениям с граничными условиями
YimQ(t\n) = P(j\n),
t—yt j
где Р(з\п) задается в A11):
j. Q(t\n) = FjWQitln) + Q{t\n)FJ {n) + Vx(t),
для tj < t < tj+\, 3 = 0, 1, ...,n, где Fj(n) =
OX
6*
164 Гл. 7. Оценка и прогноз количества свободных вирусов
(iii) u(j\n) и P(j\n) для j = l,...,n— 1 определяются сле-
следующими рекурсивными соотношениями:
u(j\n) = u(j\j) + Aj{u(j + l\n)-u(j + l\j)}
P(j\n) = P(j\j) - Aj{P(j + l|j) - P(j + l\n)}Af,
где
Для реализации алгоритма с целью получения оценки X(t\n)
при заданном начальном распределении X{t) в момент t$ необхо-
димо сначала воспользоваться формулами теоремы C.1) (прямая
фильтрация), а затем решать задачу, двигаясь в обратном на-
направлении (от п к 1) с использованием формул теоремы C.2)
(обратная фильтрация).
7.4. Пример применения моделей
Применим теорию, изложенную в п. 7.3, к описанию данных
пациента под номером 104 [1], получавшего лечение в виде
ингибитора протеазы. У данного пациента в течение двух недель
после лечения было проведено 15 измерений концентрации ви-
вирусной РНК в крови (данные, приведенные в табл.7.1, оценены
приближенно на основе рис. 1 в работе Перельсона и соавт. [1]).
Поскольку интервал времени, прошедший после лечения пациен-
пациента, слишком мал лекарственная устойчивость не успевает сфор-
сформироваться. По аналогии с работой [1] можно предположить, что
пациент находится в псевдостационарном состоянии, а величина
N(t) = Nq не зависит от t.
Для данного пациента были выбраны следующие оценки пара-
параметров: s(t) = s = 20/сут/мм3, 6(t) = в = 0,4571 • 10~3/сут/мм3,
7 = 0,023757/сут, fi^t) = дн = 0,02/сут, fi2(t) = fi2 = 0,5/сут,
/iV(t) = fj,v = 3,6792/сут, No = 618374/сут, k(t) = k = 5,1989x
x 10~5/сут/мм3. Оценки s, fii (i = 1,2), /iy взяты из
литературных источников [1-3, 12, 15], а параметры 7, к, в и No
оценивались на основе МНК-приближения (см. [29]). В качестве
начальных условий мы взяли Vq(O) = 0, Vi@) = 9,8 • 104/мм3,
Т@) + Т*@) = 2/мм3.
На основе этих оценок и процедур, описанных в предыдущих
разделах, мы вычислили концентрации инфекционных и неин-
неинфекционных вирусов иммунодефицита человека, а также общее
количество Т-лимфоцитов и клеток Т* в различные моменты
7.4. Пример применения моделей
165
времени с использованием моделей квадратичного и расширенно-
расширенного фильтров Калмана. Оказалось, что полученные результаты по-
почти совпадают. Для иллюстрации основных особенностей оценок
фильтром Калмана будем использовать результаты расширенного
фильтра Калмана. „ ^
Таблица 7.1
Наблюдаемые значения концентрации вирусной РНК
в крови у пациента 104 [1]
Время, часы
0
2
4
6
12
18
24
30
Концентрация
РНК, ед./мм3
52000
94000
180000
175000
110000
110000
100000
110000
Время, часы
36
42
48
72
96
120
144
168
Концентрация
РНК, ед./мм3
57000
60000
55000
34000
22000
20000
18000
3000
На рис.7.1 показаны наблюдаемые данные по концентрации
вирусной РНК и кривые приближения, а на рис. 7.2 — концен-
концентрации неинфицированных и активно инфицированных Т-лим-
фоцитов. На рис. 7.3 приведены соответствующие оценки для
свободных инфекционных и неинфекционных вирусных частиц.
xl0J
16
14
12 1
10
8
6
4
2-
0:
Копии вирусной РНК
Фильтр Калмана
о о Детерминированнная модель
**-^* Данные наблюдений
0 20 40 60
80 100 120 140 160 180
Время (часы)
Рис. 7.1. Наблюдаемые количества вирусной РНК, а также оценки с использо-
использованием фильтра Калмана и детерминированной модели для пациента 104
Были получены следующие результаты.
1. На рис. 7.1 видно, что калмановские оценки гораздо лучше
приближают данные по концентрации вирусной РНК, чем детер-
детерминированная модель, полученная при отмене действия случай-
166
Гл. 7. Оценка и прогноз количества свободных вирусов
ных возмущений. Эти оценки практически совпадают с данными
наблюдений, а гладкие кривые решения детерминированной си-
системы уравнений приближают данные с меньшей точностью.
2,0
1,6
1,2 ;
о,8
0,4
CD4 Т-лимфоциты
Фильтр Калмана (неинфицир.)
Детеминир. модель (неинфицир.)
Фильтр Калмана (инфицир.)
Детеминир. модель (инфицир.)
0 20 40 60
80 100 120 140 160 180
Время (часы)
Рис. 7.2. Концентрация Т-лимфоцитов, полученная с использованием фильтра
Калмана и детерминированной модели
14
12 Н
10
8
6
4
Свободные вирусы ВИЧ
Фильтр Калмана (инфекц.)
Детеминир. модель (инфекц.)
Фильтр Калмана (неинфекц.)
Детеминир. модель (неинфекц.)
0 20 40 60 80
100 120 140 160 180
Время (часы)
Рис. 7.3. Концентрация свободных инфекционных и неинфекционных ВИЧ,
полученная на основе фильтра Калмана и детерминированной модели, для
пациента 104
2. Результаты расчетов на рис. 7.3 свидетельствуют о неболь-
небольших различиях оценок концентрации инфекционных вирусных
частиц с использованием фильтра Калмана и детерминированной
модели как следствие их относительно низких значений. С дру-
другой стороны, для свободных неинфекционных ВИЧ наблюдаются
значительные различия, особенно до 60-го часа после лечения.
Для пациента 104 калмановская оценка была значительно выше
до 10-го часа после лечения и значительно ниже между 10-м и
50-м часом. Таким образом, для пациента 104, оценка Калмана
соответствует значительно более выраженному эффекту лечения,
чем детерминированная модель.
7.5. Результаты применения метода Монте-Карло 167
7.5. Результаты применения метода Монте-Карло
С целью обоснования применимости методов фильтра Кал-
мана для модели пространства состояний, которая представляет
собой стохастическую систему уравнений A3)—A6) и уравне-
уравнения наблюдений A7), мы провели вычислительные эксперименты
с использованием метода Монте-Карло. Значения параметров
модели пространства состояний были взяты из п. 7.4, при этом
Т@) = 1 и Т*@) = 20.
Для вычисления Т, Т*, Vq и V\ использованы результаты
теории распределений, изложенные в п. 7.2, которые включают,
в основном, параметры пуассоновского, биномиального и мульти-
мультиномиального распределений. Генераторы соответствующих слу-
случайных величин имеются в пакете IMSL [31]. В качестве еди-
единичного шага по времени выбран интервал 2,4 часа @,1 сут).
В модели наблюдений вводятся гауссовские случайные шумы
для общего количества свободных вирусных частиц, что дает
Yj = Y(tj) для 16 различных моментов времени, как показано
в примере из п. 7.4. Таким образом, величина Yj генерируется
согласно закону
Yj = V0(tj) + Vx{Tj) + ej = V(t) + ej9 j = 1,..., n, B3)
где ej предполагаются независимо распределенными случайными
величинами с нулевым средним и дисперсией V(tj)a2, где а2 =
= 4. При этом V(tj) = Vo(tj) + V\(tj) определяется так, как это
описано выше.
В табл. 7.2 показан пример сгенерированных данных Yj =
= Y{tj). Мы повторили эксперимент 200 раз. С использованием
данных по концентрации копий вирусной РНК были получены
оценки фазовых переменных модели на основе квадратичного и
расширенного фильтра Калмана. Эти оценки сопоставлены с дан-
данными. В табл. 7.3 показаны оценки с использованием фильтра
Калмана и детерминированной модели для клеток Т, Т*, а также
свободных вирусных частиц Vo и V\ по данным из табл. 7.2.
(Так как различия численности Т-лимфоцитов очень малы, то на
рисунках они не видны, поэтому мы представили их в таблице.)
На рис. 7.4 показаны оценки численности свободных вирусных
частиц Vq. При рассмотрении данных были сделаны следующие
заключения.
1. Результаты применения квадратичного и расширенного
фильтров Калмана отличаются мало. Оценки, получаемые с ис-
использованием фильтра Калмана, весьма точны. Это показывает,
что расширенный фильтр Калмана, описанный в п. 7.3, подходит
168
Гл. 7. Оценка и прогноз количества свободных вирусов
для оценки количества Т-лимфоцитов и свободных вирусов им-
иммунодефицита человека при ВИЧ-инфекции.
Таблица 7.2
Сгенерированные значения концентрации копий вирусной РНК
Время, часы
0
2
4
6
12
18
24
30
Концентрация
РНК, ед./мм3
52000
79742
94515
124585
148138
131254
111024
99262
Время, часы
36
42
48
72
96
120
144
168
Концентрация
РНК, ед./мм3
95320
77322
74642
45710
22906
14273
10726
5155
Неинфекционные ВИЧ
Фильтр Калмана
Сгенерированная траектория
Детерминированная модель
20 40 60 80
100 120 140 160 180
Время (часы)
Рис. 7.4. Концентрация неинфекционных ВИЧ, полученная на основе фильтра
Калмана и детерминированной модели
2. В табл. 7.3 показано, что для Т-лимфоцитов и свобод-
свободных вирусов V\ оценки с использованием фильтра Калмана и
детерминированной модели очень близки. Однако, как следует
из рис. 7.4, между оценками свободных неинфекционных ВИЧ
(Vq) имеются значительные различия. По сравнению с детерми-
детерминированной моделью, калмановские оценки свидетельствуют о
более выраженном действии лекарственного препарата в первые
10 часов после его введения.
7.5. Результаты применения метода Монте-Карло
169
Таблица 7.3
Оценки концентраций клеток Т, Т*, а также свободных
вирусных частиц Vo и V\ (количество в мм3)
t =
0
2
4
6
12
18
24
30
36
42
48
72
96
120
144
168
t =
0
2
4
6
12
18
24
30
36
42
48
72
96
120
144
168
Незаряженные
A)
3,6-
4,3-
3,0-
4,7-
1,8-
3,6-
1,3-
1,0-
7,5-
4,1 •
3,3-
2,3-
4,5-
1,9-
8,6-
3,4-
ю-1
ю-3
ю-4
ю-5
ю-6
ю-7
ю-7
ю-7
ю-8
ю-8
ю-8
ю-8
ю-8
ю-7
ю-7
ю-6
A)
5,2
4,1
3,2
2,8
1,6
1,1
9,1
5,9
7,2
5,7
4,5
4,5
2,3
1,1
6,8
4,2
. ю4
•104
. ю4
. ю4
. ю4
. ю4
• 103
• 103
• 103
• 103
• 103
• 103
• 103
• 103
. 102
. 102
B)
3,6-
4,1 •
2,5-
3,6-
1,2-
1,8-
6,5-
2,7-
1,8-
1,1 •
5,2-
1,2-
3,4-
7,1 •
5,2-
2,0-
ю-1
ю-3
ю-4
ю-5
ю-6
ю-7
ю-8
ю-8
ю-8
ю-8
ю-9
ю-8
ю-8
ю-9
ю-8
ю-7
Т-лимфоциты
3,
4,
3,
5,
2?
з!
6,
1,
6,
з,
з,
з,
C)
6- 10
5- Ю-3
1 • Ю-4
2- Ю-5
1 • Ю-6
0-ю-7
9- 10-8
8- Ю-8
з. ю-9
0,0
0-10-9
з. ю-9
0,0
0,0
4- 10-7
0,0
Инфекционные ВИЧ
B)
5,2
4,0
3,4
2,9
1,9
1,2
9,9
8,0
7,5
6,5
5,1
3,9
2,2
9,8
7,4
3,5
. ю4
•104
. ю4
. ю4
. ю4
. ю4
• 103
• 103
• 103
• 103
• 103
• 103
• 103
•102
•102
•102
5
4
3
2
1
1
1
8
8
6
6
3
1
1
8
4
C)
,2 • 104
,1 • 104
,2 • 104
,8 • 104
,9 • 104
,3 • 104
,0 • 104
,5 • 103
,0 • 103
,5 • 103
,2 • 103
,8 • 103
,9 • 103
,2 • 103
,8 • 102
,3 • 102
D)
3,6- 10
2,8- Ю-3
1,6- Ю-4
2,5- Ю-5
1,1 • Ю-6
2,1 • Ю-7
7,0- Ю-8
3,2- Ю-8
1,9- Ю-8
1,3- Ю-8
1,1 • Ю-8
1,4- Ю-8
4,2- Ю-8
1,7- Ю-7
8,7- Ю-7
5,0- Ю-6
D)
5,2 • 104
4,1 • 104
3,3 • 104
2,7 • 104
1,7- 104
1,3- 104
1,0- 104
8,9 • 103
7,7 • 103
6,7 • 103
5,9 • 103
3,6 • 103
2,1 • 103
1,3- 103
7,8 • 102
4,7 • 102
Зараженные
A)
19,6
19,6
18,4
17,4
15,1
13,7
12,1
10,9
9,66
8,55
7,79
4,58
2,62
1,71
1,01
0,65
B)
19,6
19,6
18,4
17,4
15,2
13,7
12,1
10,9
9,54
8,48
7,66
4,57
2,77
1,71
1,04
0,63
Г-лимфоциты
C)
19,6
19,3
18,7
17,7
15,3
13,5
12,0
10,6
9,19
8,17
7,09
4,20
2,56
1,55
0,92
0,56
D)
19,6
19,3
18,5
17,7
15,6
13,8
12,1
10,7
9,42
8,30
7,31
4,41
2,66
1,61
0,97
0,58
Неинфекционные ВИЧ
A)
0,0
2,5 • 104
8,3 • 104
1,1 • 105
1,3- 105
1,0- 105
9,9 • 104
8,6 • 104
8,2 • 104
7,2 • 104
5,7 • 104
4,3 • 104
2,4 • 104
1,1 • 104
8,3 • 103
3,9 • 103
B)
0,0
2,6 • 104
8,0 • 104
1,1 • 105
1,3- 105
1,0- 105
9,9 • 104
8,4 • 104
8,2 • 104
7,1 • 104
5,6 • 104
4,3 • 104
2,4 • 104
1,1 • 104
8,2- 103
3,9- 103
3,
6,
9,
1,
1,
1,
9,
8,
7,
6,
4,
2?
1,
9,
4,
C)
0,0
9- 104
2- 104
7- 104
3- 105
2- 105
0- 105
0- 104
7- 104
1 • 104
9- 104
2- 104
1 • 104
3- 104
7- 103
8- 103
4
7
9
1
1
1
9
8
7
6
3
2
1
8
5
D)
0,0
,3 • 104
,2 • 104
,2 • 104
,1 • 105
,1 • 105
,0- 105
,4 • 104
,4 • 104
,4 • 104
,5 • 104
,9- 104
,4 • 104
,4 • 104
,6- 103
,2- 103
A) — сгенерированные данные, B) — расширенный фильтр Калмана,
C) — квадратичный фильтр Калмана, D) — детерминированная модель.
170 Гл. 7. Оценка и прогноз количества свободных вирусов
7.6. Обсуждение и выводы
В этой главе предложена модель пространства состояний
для описания клеточных механизмов патогенеза ВИЧ-инфекции.
Модель патогенеза представляет собой систему стохастических
дифференциальных уравнений, а модель наблюдений — стати-
статистическую модель, основанную на данных по концентрации ви-
вирусной РНК в крови в различные моменты времени и/или по
количеству Т-лимфоцитов CD4+. В п. 7.3 уже обсуждалось, что
преимуществом использования таких моделей является сочета-
сочетание свойств стохастических и статистических моделей.
Модель пространства состояний, построенная в п. 7.3, объ-
объединяет модель состояния системы (векторного случайного про-
процесса) с непрерывным временем и дискретную модель наблюде-
наблюдений. В первом случае, за исключением члена, содержащего s(t),
правая часть модели, в основном, квадратичная. В предположе-
предположении об отсутствии формирования лекарственной устойчивости
в п. 7.3 была построена общая теория оценки и прогноза фазовых
переменных системы с использованием МНК-приближения.
В качестве альтернативы отметим, что так как скорость
развития ВИЧ-инфекции обычно очень мала, то модель из
п. 7.3 можно хорошо аппроксимировать с помощью расширенно-
расширенного фильтра Калмана. С использованием такой аппроксимации
мы разработали процедуры построения близких к оптимальным
оценок концентрации Т-лимфоцитов различных типов, а также
неинфекционных и инфекционных свободных вирусных частиц в
предположении отсутствия лекарственной устойчивости вирусов.
В п. 7.4 показано, что оценки на основе расширенного фильтра
Калмана и квадратичного фильтра Калмана почти совпадают.
Для иллюстрации возможностей применения модели про-
пространства состояний, в п. 7.3 мы описали на ее основе набор
данных для пациента 104 [1], леченного ингибитором протеазы.
Данные наблюдений представляют собой 15 значений концен-
концентрации копий вирусной РНК в крови, полученных в течение
двух недель после введения препарата. На основе этих данных
построена модель пространства состояний для указанного паци-
пациента, в предположении отсутствия лекарственной устойчивости,
и получены калмановские оценки количества свободных вирусов
(Vo и V\), а также различных типов Т-лимфоцитов. Была пока-
показана близость оценок на основе квадратичного и расширенного
фильтров Калмана, что свидетельствует о точности аппроксима-
аппроксимации с использованием расширенного фильтра Калмана. Однако
были выявлены существенные различия оценок численности сво-
Список литературы 171
бодных вирусов Vo для модели фильтра Калмана и детерминиро-
детерминированной модели. Далее, для рассматриваемого пациента, в первые
10 дней после применения ингибитора протеазы калмановская
оценка величины Vq значительно превышала оценку, полученную
на основе детерминированной модели.
Для оценки эффективности фильтра Калмана в п. 7.5 приве-
приведены результаты численного исследования модели пространства
состояний методом Монте-Карло в предположении отсутствия
лекарственной устойчивости вирусов. Результаты ясно показали,
что оценки с использованием фильтра Калмана в большинстве
случаев очень точно воспроизводят данные. Оценки на основе
квадратичного и расширенного фильтров Калмана практически
совпадают. Это свидетельствует о том, что расширенный фильтр
Калмана, по-видимому, хорошо аппроксимирует реальные дан-
данные благодаря, прежде всего, низкой (в большинстве случаев)
скорости развития ВИЧ-инфекции. С другой стороны, имеются
значительные расхождения между результатами фильтрации и
оценкой на основе детерминированной модели.
Полученные результаты позволяют предположить обоснован-
обоснованность применения фильтра Калмана для исследования динамики
ВИЧ-инфекции, а также для оценки эффективности лекарствен-
лекарственных препаратов. Для описания более широкого круга явлений,
связанных с ВИЧ-инфекцией, необходимо дальнейшее развитие
модели с учетом лекарственной устойчивости и других факторов.
Работа частично поддержана грантом Национального инсти-
института аллергии и инфекционных заболеваний (NIH, AI31869).
Список литературы
1. Perelson A.S., Neumann A.U., Markowitz M. et al. HIV-1 dynamics
in vivo: Virion clearance rate, infected cell life-span, and viral gener-
generation time // Science. 1996. V.271. P. 1582-1586.
2. Ho D.D., Neumann A.U., Perelson A.S. et al. Rapid turnover of
plasma virus and CD4 lymphocytes in HIV-1 infection // Nature.
1995. V.373. P. 123-126.
3. Wei X., Ghosh S.K., Taylor M.E. et al. Viral dynamics in human
immunodeficiency virus type 1 infection // Nature. 1995. V.373.
P. 117-122.
4. Ho D.D. Pathogenesis of HIV infection, New York Meeting, Aaron
Diamond AIDS Research Center and New York University, New York,
1996.
5. Ioannidis J.P.A., Cappelleri J.C., Lau J. et al. Predictive value of
viral load measurements in asymptomatic untreated HIV-I infection:
A mathematical models // AIDS. 1996. V. 10. P. 225-262.
172 Гл. 7. Оценка и прогноз количества свободных вирусов
6. Mellors J.W., Rinaldo C.R. Jr., Gupta P. et al. Prognosis in HIV-1
infection predicted by the quantity of virus in plasma // Science.
1996. V.272. P. 1167-1170.
7. Fauci A.S. Immunopathogenic mechanisms in human immunodefi-
immunodeficiency virus (HIV) // Ann. Int. Med. 1993. V. 114. P. 678-693.
8. Haseltine W.A. Replication and pathogenesis of the AIDS virus // J.
AIDS. 1988. V.I. P.217-240.
9. Levy J.A. HIV research: a need to focus on the right target // Lancet.
1995. V.345. P. 1619-1621.
10. Pantaleo G., Graziosi C, Fauci A.S. The immunopathogenesis of
human immunodeficiency virus infection // New Engl. J. Med. 1993.
V.328. P. 327-335.
11. Kirschner D. AZT chemotherapy of HIV infection: Scheduling and
resistance // Fourth Int. Conf. on Mathematical Population Dynamics,
Rice University, Houston, TX, May 23-27, 1995.
12. Kirschner D., Perelson A.S. A model for the immune system re-
response to HIV: AZT treatment studies // Mathematical Population
Dynamics 3, Chapter 18 (Eds. O.Arino, D.E.Axelrod, M.Kimmel).
Wuerz Publishing, Winnipeg, Manitoba, Canada, 1993.
13. Kirschner D., Webb G.F. A model for treatment strategy in the
chemotherapy of AIDS // Bull. Math. Biol., 1996. V.58. P. 367-390.
14. Perelson A.S. Modeling HIV infection // Fourth Int. Conf. on Math-
Mathematical Population Dynamics, Rice University, Houston, TX, May
23-27, 1995.
15. Perelson A.S., Kirschner D., De Boer R. Dynamics of HIV infection
of CD4+ T cells // Math. Biosci. 1993. V. 114. P. 81-125.
16. Schenzle D. A model for AIDS pathogenesis // Statistics in Medicine.
1994. V. 13. P. 2067-2069.
17. Essunger P., Perelson A.S. Modeling HIV infection of CD4+ T-cell
subpopulations // J. Theor. Biol. 1994. V. 170. P. 367-391.
18. Stevenson M., Stanwick T.L., Dempsey M.P., Lamonica C.A. HIV-1
replication is controlled at the level of T-cell activation and proviral
integration // EMBO J. 1990. V.9. P. 1551-1560.
19. Philips A.N. Reduction of HIV concentration during acute infection:
Independence from specific immune response // Science. 1996. V. 271.
P. 497-499.
20. Tan W.Y., Piantadosi S. On stochastic growth process with appli-
application to stochastic logistic growth // Statistica Sinica. 1991. V.I.
P. 527-540.
21. Levy J.A. HIV research: a need to focus on the right target // Lancet.
1995. V.345. P. 1619-1621.
22. Tan W.Y., Ye Zh. Assessing effects of different types of free HIV and
macrophage on HIV pathogenesis by a stochastic model // Invited
paper at the International Statistic Symposium, August 11-15, 1998,
Taipei, Taiwan.
23. Demeter L.M., Nawaz Т., Morse G. et al. Development of zidovu-
dine resistance mutations in patients receiving prolonged didanosine
monotherapy // J. Infect. Dis. 1995. V. 172. P. 1480-1485.
Приложение. Доказательство теорем 7.1 и 7.2 173
24. Erice A., Balfour Н.Н. Resistance of HIV-1 to anti-retroviral agents:
A review // Clin. Infect. Dis. 1995. V. 18. P. 149-156.
25. Kozal M.J., Kroodsma K., Winters M.A. et al. Didanosine resistance
in HIV-infected patients switched from zidovudine to didanosine
monotherapy // Ann. Intern. Med. 1994. V. 121. P. 263-268.
26. Schininazi R.F., Lloyd R.M. Jr., Ramanathan C.S., Taylor E.W.
Antiviral drug resistance mutations in human immunodeficiency
virus type 1 reverse transcriptase occur in specific RNA structural
regions // Antimicrob. Agents Chemother. 1994. V.38. P. 268-274.
27. Zhang D., Galiendo A.M., Eron J.J. et al. Resistance to 2',3'-dideoxy-
cytidine conferred by a mutation in codon 65 of the human immun-
immunodeficiency virus type 1 reverse transcriptase // Antimicrob. Agents
Chemother. 1994. V.38. P.282-287.
28. Tan W.Y., Zhang D.Z. Modeling effects of drug resistance in HIV-
infected individuals (paper in preparation).
29. Tan W.Y., Wu H. Stochastic modeling of the dynamics of CD4+ T
cell infection by HIV and some monte carlo studies // Math. Biosci.
1998. V. 147. P. 173-205.
30. Catfin D.E. Estimation, Control and Discrete Kalman Filter. New
York: Springer-Verlag, 1989.
31. IMSL, MATH/LIBRARY User's Manual, IMSL, Houston, Texas,
1989.
32. Gelb A. Applied Optimal Estimation, MIT Press, Cambridge, MA,
1974.
33. Sage A.P., Melsa J.L. Estimation Theory With Applications to Com-
Communications and Control. New York: McGraw-Hill, 1971.
Приложение. Доказательство теорем 7.1 и 7.2
Так как расширенный фильтр Калмана линейный, то доста-
достаточно доказать справедливость наших утверждений для следую-
следующей линейной модели пространства состояний:
X(t) F{t)X(t) + e(t) B4)
(Ль <"^> <"^> <"^>
ДЛЯ to ^ t\
Yj = HjX(tj) + ej, j = \,...,n, B5)
где Cov{e{t),ej) = 0, Cov(e(t),e(r)) = S(t - r)Vx(t),
Cov(sj,s )~= 6juT,j, Cov(e(t),x1t)) = 0 и Cov(X(t),Sj) = 0,
где S(t) — дельта-функция Дирака, a Sju — символ Кронекера.
Тогда результаты пункта (i) теорем G.1) и G.2) можно пере-
переформулировать в следующем виде.
174 Гл. 7. Оценка и прогноз количества свободных вирусов
(ia) Для tj < * < tj+i, j = О, l,...,n (to = O, tn+\ = ос),
X(t|tj) удовлетворяет следующим уравнениям с граничными
условиями
П
где u(j\j) задается в (ш):
j- X(t\tj) = F(t)X(t\tj), tj^t< tj+x, j = 0, 1,..., n;
(ib) Для t < tn X(t\n) удовлетворяет следующим уравнениям
л;
с граничными условиями lim X(t\n) = и(п\п), где и(п\п) опре-
делена в формулировке теоремы C.1):
±X(t\n) = F(t)X(t\n).
at ~ ~
Чтобы доказать эти утверждения для рассматриваемой ли-
линейной модели пространства состояний, определим R(t,tj) =
= lim ПГ^Л^ + р(гз + (i ~ 1)А*)Д<]] для t = tj + nAt. Тогда
R(t,t) = Ip и ^-R{t,tj) = F(t)R(t,tj) для t ^ tj. Далее, для
t ^ tj решение уравнения B4) имеет вид
где ?j(t) = Г* R(t,x)e(x)dx.
Очевидно, что Esj(t) = 0, Cov[ej(t), e(l)] = 0 для любых j,
l и t ^ tj, а ковариационная матрица для Sj{t) имеет вид
t
Var(ej(t)) = [ R(t, x)Vx(x)RT(t, x) dx.
h
Положим u(j) = X(tj), G(j) = R(tj+i,tj) и ?j(^+i) = CO' + 0-
1), B6)
+ l). B7)
Таким образом, модель пространства состояний для u(j)
дискретная и линейная. Для такого типа моделей линейные
несмещенные оценки и(г) с минимальной дисперсией ошибки и
данными (Yu,u = 1,..., j) при г = j определяются пунктом (ш)
Приложение. Доказательство теорем 7.1 и 7.2 175
теоремы G.1), а при 0 < j < п — пунктом (ш) теоремы G.2).
Доказательство можно найти в работах [30] и [32, 33]. Отсюда
следует справедливость пункта (ш) теорем G.1) и G.2).
Теперь для tj ^ t условное среднее X(t) и соответствующие
ошибки оценок Y ,1= 1,..., j имеют вид X(t\tj) = R(t,tj)u(j\j)
и e(t\tj) = X(t\tj) - X(t) = R(t,tj)^(tj\tj) - Sj{t). Ковариаци-
л; r^j r^i r^i r^j
онная матрица ошибки *e(t\tj) имеет вид
t
Q(t\tj) = R(t\tj)P(j\j)RT(t, tj) + f R(t, x)Vx(x)RT(t, x) dx.
Очевидно, что X(t\tj) и Q(t\tj) удовлетворяют следующим
уравнениям с граничными условиями lim X(t\tj) = u(j\j) и
lim Q(t\tj) =
ij. ^ *~ \v \" 'I J *~ \" J * ^ \v i " 'I J *" \J \J ) \ ) ^^ V 7 /
и
ftQ(t\tj) = F(t)R{t,tj)P(j\j)RT{t,tj) +
+ R[t, tj)P{j\j)RT{t, tj)FT(t) + R(t, t)Vx(t)RT(t, t)
t
T (
F{t) f R(t, u)Vx(u)RT(t, u) du
t
R(t, u)Vx{u)RT{t, u) duFT(t) =
= F(t)Q(t\tj) + Q(%)FT(t) + Vx{t).
Так как u(j\j) — линейная несмещенная оценка u(j) для данных
У/, / = 1,..., j, то при tj < t X{t\tj) обладает теми же свойства-
свойствами для X(t) и данных У/, / = l,...,j. Это доказывает пункты
(i) и (ii) теоремы C.1). Аналогично доказываются пункты (i) и
(П) теоремы C.2).
Д-р Вай-Юань Тан имеет три высших образования (в областях агро-
агрономии, статистики и математики) и степень доктора философии по матема-
математической статистике. Является профессором факультета математических наук
университета г. Мемфиса, США. Им опубликованы 4 монографии и более 160
научных статей в реферируемых журналах и сборниках. Член Американского
176 Гл. 7. Оценка и прогноз количества свободных вирусов
статистического общества (ASA). В настоящее время его научные интере-
интересы связаны с исследованиями рака, СПИДа и оценкой риска экологических
факторов. В.-Ю. Тан внес значительный вклад в развитие таких разделов
математической статистики, как байесовские и устойчивые выводы, линейные
модели, специальные функции и выборочные распределения, многомерный
анализ, биостатистика, математическая генетика, прикладные стохастические
процессы, стохастические модели рака и СПИДа, биомедицинские системы, а
также регрессионный и дисперсионный анализ.
Д-р Шихуа Сянг имеет два высших образования в области статистики
и степень доктора философии по прикладной статистике. Опубликовал 14
научных работ, посвященных байесовским выводам и моделированию СПИДа.
Глава 8
МОДЕЛИРОВАНИЕ ВЛИЯНИЯ
ПРЕДШЕСТВУЮЩЕЙ ИНФЕКЦИИ
НА ЭФФЕКТИВНОСТЬ ВАКЦИНАЦИИ )
Дерек Смит, Стефани Форрест,
Дэвид Экли, Алан Перелъсон
Построена компьютерная модель влияния предшествующей инфекции на
эффективность вакцинации. Изучался процесс последовательного введения в
организм трех антигенов. Первый антиген, обозначаемый как предшествую-
предшествующий, имитировал первичную инфекцию или вакцинацию. Второй, вакцин-
вакцинный, антиген представлял отдельную составляющую трехкомпонентной вак-
вакцины против гриппа. Третий, эпидемический, антиген имитировал действие
эпидемического штамма вируса. Для фиксированного уровня перекрестной
реактивности вакцинного и эпидемического штаммов были получены наборы
предшествующих антигенов с разными значениями перекрестной реактивно-
реактивности с вакцинным и эпидемическим штаммами. Оказалось, что для многих
значений перекрестной реактивности вакцинация, предваряемая инфекцией,
приводит к повышению уровня защиты от эпидемий. Однако в некоторых
случаях предшествующая инфекция снижала защитное действие вакцинации
и вызывала элиминацию вакцины до начала формирования иммунной памяти.
Соотношение уровней перекрестной реактивности между предшествующим,
вакцинным и эпидемическим штаммами играет решающую роль в оценке
эффективности вакцины. Результаты этой главы могут быть использованы
для изучения вакцинации против непрерывно мутирующих вирусов, таких как
вирусы гриппа.
8.1. Введение
Многим видам вирусов, включая вирусы гриппа, иммуно-
иммунодефицита человека и гепатита С, свойственны постоянные и
быстрые изменения антигенной структуры. В результате высокой
скорости мутации популяции таких вирусов обычно представля-
представляют собой конгломераты, состоящие из тысяч подвидов вирусов и
имеющие название квазивидов (species swarm, quasi-species) [1].
х) Воспроизводится из Proc. of the IEEE International Conference on Sys-
Systems, Man, and Cybernetics, Orlando, Florida, October 12-15, 1997, p. 363-368
(с разрешения).
178 Гл. 8. Моделирование влияния предшествующей инфекции
Вакцинация против квазивидов является трудной задачей из-за
необходимости обеспечить иммунную защиту одновременно про-
против многих вирусных штаммов, которые, к тому же, постоянно
мутируют. Например, в случае гриппа всемирная сеть эпидемио-
эпидемиологического надзора ежегодно регистрирует сотни новых вирус-
вирусных штаммов. В современной практике здравоохранения приме-
применяются смешанные трехкомпонентные вакцины против основных
вирусных конгломератов, циркулирующих в данный период вре-
времени. Для отслеживания эволюции вирусов обычно приходится
ежегодно менять хотя бы один компонент вакцины. Вместе с тем,
эффективность вакцинации и вирулентность вирусов также ва-
варьируют. В неудачные эпидемические сезоны, несмотря на про-
проведенную вакцинацию, известны случаи гибели до 20% больных
из группы пожилых людей, проходивших лечение от гриппа в до-
домашних условиях. Как мы вскоре покажем, это может происхо-
происходить вследствие действия квазивидов и, возможно, под влиянием
на результаты вакцинации предшествующей инфекции.
Влияние предшествующей инфекции на эффективность вак-
вакцинации ранее подробно не изучалось. Известно [2, 3], что
в иммунном ответе против вирусов гриппа основную роль играет
иммунная память против вирусов, вызвавших предыдущую ин-
инфекцию. В большинстве экспериментальных исследований этого
явления использовались два вирусных штамма [4, 5]. Однако
имеет смысл рассмотреть взаимодействия иммунных ответов
против, по крайней мере, трех антигенов: предшествующей ин-
инфекции, вакцины и эпидемического штамма [6]. В случае трех
вирусных штаммов и, скажем, восьми различных уровней их
перекрестной реактивности, мы имеем сотни возможных комби-
комбинаций реактивности. Поэтому для полноценного исследования
всех возможных вариантов взаимодействий необходимо провести
тысячи экспериментов.
Ввиду практических трудностей реализации такого коли-
количества опытов in vivo мы построили компьютерную модель.
Преимуществом этого подхода является быстрое и недорогое
прогнозирование результатов, а недостаток заключается в воз-
возможности неточного описания функции иммунной системы и,
следовательно, получения ошибочных результатов. Верификация
модели показала ее достаточно хорошее качественное согла-
согласие с данными наблюдений. Параметры модели выбирались из
условия соответствия ее решений иммунологическим данным по
динамике перекрестных иммунных реакций [7]. Все описанные
в этой главе результаты были получены на основе компьютерного
моделирования.
8.2. Материалы и методы 179
8.2. Материалы и методы
Компьютерная модель представляет собой упрощенное опи-
описание гуморального иммунитета позвоночных, состоящего из
В-лимфоцитов, плазматических клеток, антител, В-клеток па-
памяти и антигенов. Т-клеточная помощь моделируется неявно,
в предположении, что, при необходимости, Т-лимфоцитов всегда
имеется достаточно. Каждый В-лимфоцит, плазматическая клет-
клетка и В-клетка памяти в ходе эксперимента рассматриваются как
отдельные элементы. Модель имеет агентную архитектуру, ана-
аналогичную описанной в работе [8]. Так как количество антител
в естественной иммунной системе слишком велико, то антитело
в нашей модели соответствует реальной популяции высокой чис-
численности. Аналогично, каждый антиген в модели соответствует
большому количеству естественных антигенов. В-лимфоциты,
антитела и антигенные детерминанты представлены в виде на-
наборов символов, которые можно грубо считать соответствующи-
соответствующими аминокислотным последовательностям участков связывания.
При введении антигенов В-лимфоциты могут взаимодействовать
с ними с интенсивностью, зависящей от величины аффинности.
В результате антигенной стимуляции происходит деление В-лим-
В-лимфоцитов с возможностью мутации их антиген-связывающих ре-
рецепторов и дифференцировки В-лимфоцитов в клетки памяти
или плазматические клетки. Плазматические клетки синтезиру-
синтезируют антитела, способные связываться с антигеном. Если коли-
количество антител, связанных с некоторым антигеном, превышает
пороговое значение, то такой антиген считается выведенным из
организма и далее в модели не рассматривается.
В-лимфоциты, антитела и антигенные детерминанты описаны
в виде 20-символьных последовательностей, где каждый сим-
символ соответствует одному из четырех классов эквивалентности
аминокислот. В нашей модели последовательности соответству-
соответствуют форме рецепторов, а аффинность определяется количеством
комплементарных рецепторов. В качестве порога аффинности,
необходимой для начала иммунного ответа, мы выбрали 15 ком-
комплементарных рецепторов. Это соответствует иммунологическим
данным [7] и означает, что при наличии 1012 В-лимфоцитов и
вероятности взаимодействия с антигеном, равной 10~5 [9-11],
что соответствует 107 В-лимфоцитов каждой специфичности
[12-14], два антигена не вызовут перекрестной иммунной ре-
реакции, если их аминокислотные последовательности отличаются
более чем на 35% [15, 16]. Вместо характеристики процент-
процентных различий между аминокислотными последовательностями
180 Гл. 8. Моделирование влияния предшествующей инфекции
антигенов мы будем использовать понятие антигенного рас-
расстояния, которое определяется как количество несовпадающих
знаков в соответствующих символьных строках. Таким образом,
для рецепторов, длина которых равна 20, имеется 21 возмож-
возможный вариант антигенного расстояния, и любые два антигена,
антигенное расстояние между которыми больше или равно семи
(что соответствует 35%-ным различиям), не дают перекрестной
реакции. Следовательно, в нашей модели имеется восемь уров-
уровней перекрестных взаимодействий, соответствующих значениям
антигенного расстояния от 0 до 7.
Для изучения взаимосвязи между предшествующей инфек-
инфекцией и эффективностью вакцинации мы зафиксировали уровень
перекрестного реагирования между вакцинным и эпидемическим
штаммами и варьировали уровни перекрестной реактивности с
этими штаммами предшествующего антигена (рис. 8.1). Доза
заражения и скорость репликации вирусов выбирались такими
E00 единиц вирусов эпидемического штамма, популяция кото-
которых удваивается один раз в шесть часов), чтобы с большой
вероятностью модельный невакцинированный организм в резуль-
результате заражения стал больным. Доза заражения и тип вакцины
A000 единиц инактивированной вакцины, антигенное расстоя-
расстояние до эпидемического штамма равно двум) выбирались из усло-
условия ее 50%-й эффективности против эпидемического штамма.
В качестве предшествующих генерировались штаммы со всевоз-
всевозможными комбинациями антигенных расстояний до вакцинного
и эпидемического штаммов (всего использовался 31 штамм).
Предшествующий Предшествующий
штамм B, 2) штамм B, 3)
Эпидемический / \^^ /
Вакцина штамм / ^^^ \ /
2 2
Вакцина Эпидемический
штамм
а б
Рис. 8.1. Антигенные расстояния между штаммами: постоянное и равное 2
для всех экспериментов между вакцинным и эпидемическим (а); различные
от предшествующих штаммов (всего 31) до вакцинного и эпидемического
штаммов (показаны только два из них) (б)
В соответствии с табл. 8.1, 10 контрольных групп и 31 экс-
экспериментальная подвергались заражению различными комбина-
комбинациями предшествующих, вакцинных и эпидемических штаммов.
8.3. Результаты и обсуждение 181
Таблица 8.1
Распределение моментов времени и доз заражения
для предшествующей инфекции, вакцинации и эпидемии
Группа Цель Предшествующая Вакцина (неразмн. Эпидемическая ин-
инфекция (размн. антиген), доза на фекция (размнож.
антиген), доза на 75-е сутки антиген), доза на
5-е сутки 145-е сутки
1
2
3-10
11-41
Контроль
Контроль
Контроль
Экспери-
Эксперимент
200*
200**
1000
1000
500
500
500
500
*В группах с 3 по 10 предшествующие штаммы находились от эпидемического
штамма на антигенном расстоянии от 0 до 7 соответственно.
**Группы 11-41 заражали вирусными штаммами с различными комбинация-
комбинациями антигенных расстояний (от 0 до 7) до вакцинного и эпидемического штам-
штаммов. Соответствие между группами и антигенными растояниями показано на
рис. 8.2.
Моменты введения штаммов выбирались таким образом, чтобы
титры антител перед каждым последующим введением антигена
устанавливались на уровне, соответствующем начальному зна-
значению. Для контрольных групп (группы 1-10) рассматривался
период времени продолжительностью 120, а для эксперименталь-
экспериментальных групп (группы 11-41) — 250 вирусных репликаций. «Порог
болезни» был взят равным 2500 единиц вирусов. Если вирусная
нагрузка превышала данное значение, то процесс вычислений
прекращали. В каждом эксперименте вирусную нагрузку, титры
антител и их аффинность для каждого антигена определяли с ин-
интервалом 6 часов. Перед каждым новым введением антигена и на
пике иммунного ответа регистрировали количество, аффинность
для каждого антигена и историю размножения В-лимфоцитов.
8.3. Результаты и обсуждение
Модель описывает классические варианты поведения пере-
перекрестно-реагирующей иммунной памяти в ответ на введение
вакцины после предшествующей инфекции, а также при зара-
заражении эпидемическим штаммом вируса после предшествующей
инфекции и вакцинации. Перекрестная реактивность усилива-
усиливалась по мере снижения антигенного расстояния между штам-
штаммами (столбцы на рис.8.2в и [16]), при этом увеличивалось
количество перекрестно-реагирующих клеток памяти (табл. 8.2
и [17]). Количество новых клеток памяти, образующихся в от-
182
Гл. 8. Моделирование влияния предшествующей инфекции
вет на антиген, дающий перекрестные реакции, было снижено
из-за наличия иммунной памяти к предшествующему антигену
(табл. 8.2 и [4]). Этот эффект иногда называют первородным
антигенным грехом (original antigenic sin) [4].
В 6
I!-
6 g
S I 2
g=l p=0,00 g=2 p=0,50
(а) Эпидемическая (б) Вакцин. i > t
инфекция, эпидимическая ou
контроль контроль Ггрунла J)
(группа И
ц=14 р=0,66 <:=!8 p=0J5 >^=22 p=0,74^=2
II I
g=2i р=0.У4 .ц=25 p=().v3
(,-) Эксперименты с
нредшес !ву ющей инфекцией,
вакцмнашюй и эпидимической
инфекцией (группы 11 -41)
g=15p=0,99
g=3 p=0,99
1 2 34 5
Антигенное расстояние между предшествующими и
вакцинными штаммами
7 (в) Предшествующая
инфекция и эпидимическая
инфекция, но без вакцинации
контроль (группы 3-Ю)
Рис. 8.2. Данные по максимальной вирусной нагрузке эпидемическим штам-
штаммом для каждого вычислительного эксперимента. Прямоугольники содержат
графики, состоящие из 250 вертикальных линий A20 для контрольных групп),
высота которых соответствует максимальной вирусной нагрузке в ходе экспери-
эксперимента. Эксперименты в каждой группе показаны в порядке возрастания макси-
максимальной вирусной нагрузки. Черным цветом показана нагрузка, превышающая
величину порога болезни, поэтому ширина черного участка характеризует ча-
частоту заболеваемости в рассматриваемой группе. Воздействие инфекционного
штамма при отсутствии предшествующей инфекции и вакцинации во всех
случаях приводило к болезни (а). Эффективность вакцины при отсутствии
предшествующей инфекции, по построению, взята равной 50% (б). Частота
развития заболевания при наличии предшествующей инфекции была пропор-
пропорциональна антигенному расстоянию между предшествующим и эпидемическим
штаммами (в). В случае предшествующей инфекции эффективность вакцины
против эпидемического штамма варьировала от 40 до 100%, в зависимости от
антигенного расстояния между штаммами (г). Моменты введения антигенов
выбирались из условия нормализации уровня антител к предшествующей ин-
инфекции
При фиксированном антигенном расстоянии между предше-
предшествующим и вакцинным штаммами уровень защиты против эпи-
эпидемического штамма снижался по мере увеличения антигенного
расстояния между предшествующим и эпидемическим штаммами
(столбцы на рис. 8.2 г). Это происходило за счет уменьшения
8.3. Результаты и обсуждение 183
количества перекрестно реагирующих с эпидемическим штаммом
В-лимфоцитов памяти.
Таблица 8.2
Анализ клеточной строки на рис. 8.2 г*
Антигенное рас- Доля одинаковых Доля вновь образо- Вероят-
стояние от пред- участков антигенных ванных клеток памя- ность
шествующего до детерминант пред- ти в результате вакци- защиты
вакцинного шествующего и вак- нации (по сравнению
штамма цинного штаммов с контролем)
3 12% 66% 45%
4 5% 79% 56%
5 1% 94% 55%
6 0% 96% 56%
7 0% 100% 61%
* Для клеточной строки на рис. 8.2 г антигенное расстояние между предше-
предшествующим и эпидемическим штаммами равно 5, а между предшествующим и
вакцинным штаммами — варьирует от 3 до 7. В случае, когда предшествую-
предшествующая инфекция была к вакцине ближе всего, с вакциной реагировала наиболь-
наибольшая часть В-лимфоцитов, образованных в ходе предшествующей инфекции.
Это привело к снижению процента вновь образованных клеток памяти в хо-
ходе вакцинации, по сравнению с вакцинацией при отсутствии предшествую-
предшествующей инфекции, что снизило защитное действие вакцины против эпидемиче-
эпидемического штамма.
При постоянном антигенном расстоянии между предшест-
предшествующим и эпидемическим штаммами, защита против эпидеми-
эпидемического штамма была наименьшей при минимальном антигенном
расстоянии между предшествующим и вакцинным штаммами
(столбцы на рис. 8.2 г). Это происходило потому, что чем ближе
был предшествующий антиген к вакцинному, тем больше дей-
действовал эффект первородного антигенного греха на снижение
количества клеток памяти, образующихся в результате вакци-
вакцинации, уменьшая таким образом защитное действие вакцинации
(рис. 8.3 и табл. 8.2). Этот результат дает возможность предпо-
предположить, что при выборе вакцины предпочтение следует отда-
отдавать той, которая имеет максимальное антигенное расстояние
от предшествующей инфекции и, следовательно, меньше всего
подвержена эффекту первородного антигенного греха (другим
очевидным требованием является антигенная близость вакцины
к эпидемическому штамму).
Предшествующая инфекция иногда снижала эффективность
вакцинации (группы 24, 29 и 34 на верхней диагонали рис. 8.2 г).
Это происходило, если предшествующие штаммы были на доста-
достаточно далеком антигенном расстоянии от эпидемических штам-
184
Гл. 8. Моделирование влияния предшествующей инфекции
мов (чтобы не вызвать защиты от эпидемий) и на достаточно
близком расстоянии от вакцинных штаммов (для активации ме-
механизма первородного антигенного греха и снижения эффек-
эффективности вакцинации) (рис. 8.3 и табл. 8.2). Такие ситуации
Аффинитет отно- Аффинитет
ситсльного штамма относительно
предшествующей вакцины
инфекции
Аффинитет
относительно
эпидемического
штамма
Ответ на предшествующую инфек-
инфекцию включает 4 больших клона (а),
один из которых (на 2 часа), пере-
) ] И крестно реагирует с умеренным
' IJI аффинитетом на вакцину (б), все
,/ / эти 4 клона не реагируют на эпи-
-" демический штамм (в).
Состояние
в период пика i \
вакцинации \ \
(82-й день)
В ответе на вакцинацию доминиру-
доминируют предшествующие клоны (д), вак-
цина индуцировала три небольших
клона (на 5, 10 и 12 часов), из кото-
i рых только один (на 5 часов) пере-
крестно реагирует с эпидемическим
штаммом с низкой афинностью.
Состояние
в период пика /
эпидемической
инфекции
A50-й день)
В результате низкой перекрестной
¦ реактивности эпидемической
• инфекции со штаммом: предшест-
предшествующей инфекции и вакцины
образуется много новых клонов (и).
Каждая точка представляет В-клетку. В-клетки, изображенные на разных рисунках на одинаковом рас-
Расстояние от В-клетки до центра стоянии от центра и в одном угловом секторе, представляют один
показывает аффинитет В-клетки - и тот же клон (имеют общего предшественника). К координатам:
чем ближе к центру, тем выше каждой В-клетки добавляется гауссовская случайная величина,
иммунитет. так чтобы на графике можно было оценить число клеток.
Рис. 8.3. Пример влияния первородного антигенного греха на снижение эф-
эффективности вакцины. Показаны результаты 81-го эксперимента с группой 24,
в котором антигенное расстояние от предшествующего до эпидемического и
вакционного штаммов равнялось 5 и 3 соответственно. Клон В-лимфоцитов,
перекрестно реагирующий с вакциной и взаимодействовавший с предшествую-
предшествующей инфекцией, доминировал в иммунном ответе на вакцину, что препятство-
препятствовало образованию новых вакцинных клонов, перекрестно взаимодействующих
с эпидемическим штаммом. Так как в результате образовалось мало клеток
памяти для взаимодействий с эпидемическим штаммом, то иммунный ответ
против него протекал по типу первичного и максимальное значение вирусной
нагрузки превысило порог болезни
наблюдались в случае накапливающихся мутаций, т. е. если
вакцинный и эпидемический штаммы различались в участках
антигенных детерминант, отличных от несовпадающих участ-
участков антигенных детерминант предшествующего и вакцинного
штаммов [18], а также если предшествующий и эпидемиче-
эпидемический штаммы имели относительно низкий уровень перекрестного
реагирования. Несмотря на то, что из 31 экспериментальной
группы только 5 имели накапливающиеся мутации в предше-
8.3. Результаты и обсуждение 185
ствующем, вакцинном и эпидемическом штаммах, вероятность
их появления на практике более высока, поскольку в начале
эволюции квазивидов количество немутировавших вирусов боль-
больше количества мутировавших, и, следовательно, более высока
вероятность накапливающихся, а не последовательных мутаций.
Например, с момента своего появления в 1968 году до 1980 года
основные штаммы вируса гриппа H3N2 содержали только на-
накапливающиеся мутации (в сравнении с эталонным штаммом
A/Hong Kong/8/68) [18], хотя, теоретически, это могло происхо-
происходить и под влиянием других факторов.
Вакцинация всегда увеличивает защиту от эпидемического
штамма, так как даже если вакцина находится на малом анти-
антигенном расстоянии от предшествующего штамма, так что ее эф-
эффективность снижается в результате эффекта первородного ан-
антигенного греха, то она все же приводит к появлению некоторого
количества клеток памяти, способных перекрестно взаимодей-
взаимодействовать с эпидемическим штаммом. Вакцинация увеличивает
уровень защиты и в результате стимуляции клеток памяти, по-
полученных в ходе иммунного ответа на предшествующую инфек-
инфекцию, перекрестно реагирующих с вакцинным и эпидемическим
штаммами.
В случае умеренного или высокого уровня перекрестной ре-
реактивности предшествующего и эпидемического штаммов среди
клеток памяти, перекрестно взаимодействующих с эпидемиче-
эпидемическим штаммом, было больше клеток, образованных в ходе пред-
предшествующей инфекции, а не вакцинации (данные не показаны).
Это происходило из-за эффекта первородного антигенного греха,
приводящего к снижению количества клеток памяти, образуемых
в результате вакцинации, а также в связи со стимуляцией пере-
перекрестно реагирующих с вакцинным и эпидемическим штаммами
клеток памяти, образованных в ходе предшествующей инфекции.
Это отчасти согласуется с данными о том, что в иммунном
ответе против вирусов гриппа доминируют клетки памяти, об-
образованные в ходе предыдущих инфекций [19]. Однако в нашей
модели в иммунном ответе на эпидемический штамм преобла-
преобладали антитела, специфические к вакцинному штамму, так как
перекрестная реактивность предшествующего и эпидемического
штаммов была низкой или отсутствовала.
Мы изучили явления перекрестно-реагирующей памяти и
первородного антигенного греха при наличии трех антигенов и
показали их возможное влияние на снижение эффективности
вакцинации. В отсутствии предшествующей инфекции эффек-
эффективность вакцины была взята равной 50%. При наличии пред-
186 Гл. 8. Моделирование влияния предшествующей инфекции
шествующей инфекции эффективность вакцинации варьировала
от 40 до 100%, в зависимости от антигенного расстояния между
предшествующим и вакцинным, а также эпидемическим штамма-
штаммами (при фиксированном антигенном расстоянии вакцина-эпиде-
вакцина-эпидемический штамм). Несмотря на возможность некоторого сниже-
снижения эффективности вакцинации в результате предшествующей
инфекции, вакцинация всегда повышала уровень защиты от эпи-
эпидемий. Экстраполируя эти результаты на случай, когда пред-
предшествующая инфекция являлась вакцинацией, можно сказать,
что в нашей модели вакцинация повышает защиту от инфекций,
но в зависимости от антигенного расстояния между штаммами
может снижать эффективность последующих вакцинаций. Полу-
Полученные знания о взаимодействиях предшествующих, вакцинных
и эпидемических штаммов, а также о роли антигенных расстоя-
расстояний между ними могут быть использованы при решении задачи
выбора эффективной вакцины против гриппа.
Авторы благодарят Институт Санта-Фе и программу Джо-
Джозефа П. и Джин М. Сэлливан по теоретической иммунологии
за постоянную поддержку. Дерек Смит выражает призна-
признательность факультету вычислительной техники Университета
Нью-Мексико за научные стипендии на исследования в области
искусственного интеллекта и цифрового оборудования, а также
благодарят Патрика Дехазелера, Рона Хайтауэра, Терри Джонс,
Эндрю Косорезова, Стэна Ли, Уэнделла Миллера, Рональда
Мура, Михаэлу Опреа, Франческу Шреди, Пола Стенфорда,
Джейсона Стюарта, Бернхарда Зульцера и Карлу Вофси. Часть
работы выполнена под патронажем министерства энергетики
США. Работа поддержана грантами Управления морских
исследований @0014-95-1 -0364), Национального научного
фонда США (IRI-9157644) и Лос-Аламосской национальной
лаборатории (программа LDRD).
Список литературы
1. Eigen М. Viral quasispecies // Sci. Am. 1993. V. 269, № 1. P. 32-39.
2. Francis T. Influenza, the new acquaintance // Ann. Intern. Med.
1953. V.39. P. 203-221.
3. Davenport F.M., Hermessy A.V., Francis T. Epidemiologic and im-
munologic significance of age distribution of antibody to antigenic
variants of influenza virus // J. Exp. Med. 1953. V.98. P. 641-656.
4. Fazekas S. de St. Groth, Webster R.G. Disquisitions of original
antigenic sin. II. Proof in lower creatures // J. Exp. Med. 1966.
V. 124. P. 347-361.
Список литературы 187
5. Deutsch S., Bussard A.E. Original antigenic sin at the cellular
level. I. Antibodies produced by individual cells against cross-reacting
haptens // Eur. J. Immunol. 1972. V.2. P. 374-378.
6. Angelova L.A., Shvartsman Ya.S. Original antigenic sin to influenza
in rats // Immunology. 1982. V.46. P. 183-188.
7. Smith D.J., Forrest S., Hightower R.R., Perelson A.S. Deriving shape
space parameters from immunological data // J. Theor. Biol. 1997.
V. 189. P. 141-150.
8. Seiden P.E., Celada F. A model for simulating cognate recognition
and response in the immune system // J. Theor. Biol. 1992. V. 158.
P. 329-357.
9. Edelman G.M. Origins and mechanisms of specificity in clonal selec-
selection // Cellular Selection and Regulation in the Immune System (Ed.
G.M. Edelman). New York: Raven Press, 1974. P. 1-38.
10. Nossal C.J.V., Ada G.L. Antigens, Lymphoid Cells and The Immune
Response. New York: Academic Press, 1971.
11. Jerne N.K. Clonal selection in a lymphocyte network // Cellular
Selection and Regulation in the Immune System (Ed. G.M. Edelman).
New York: Raven Press, 1974. P. 39-48.
12. Kohler G. Frequency of precursor cells against the enzyme beta-
galactosidase: an estimate of the BALB/c strain antibody repertoire //
Eur. J. Immunol. 1976. V.6. P. 340-347.
13. Klinman N.R., Press J.L., Sigal N.H., Gerhart P.J. The acquisition of
the В cell specificity repertoire: the germ-line theory of predetermined
permutation of genetic information // The Generation of Antibody
Diversity (Ed. A.J. Cunningham). New York: Academic Press, 1976.
P. 127-150.
14. Klinman N.R., Sigal N.H., Metcalf E.S., Gerhart P.J., Pierce S.K.
Cold Spring Harbor Symp. Quant. Biol. 1977. V.41. P. 165.
15. Champion А.В., Soderberg K.L., Wilson A.C., Ambler R.P. Im-
Immunological comparison of azurins of known amino acid sequence:
Dependence of cross-reactivity upon sequence resemblance // J. Mol.
Evol. 1975. V.5. P. 291-305.
16. East I.J., Todd P.E., Leach S.J. Original antigenic sin: Experiments
with a defined antigen // Mol. Immunol. 1980. V. 17. P. 1539-1544.
17. Gerhard W. The analysis of the monoclonal immune response to
influenza virus. III. The relationship between stimulation of virus-
primed precursor В cells by heterologous viruses and reactivity of
secreted antibodies // J. Immunol. 1978. V. 120. P. 1164-1168.
18. Both G.W., Sleigh M.J., Cox N.J., Kendal A.P. Antigenic drift in
influenza virus H3 hemagglutinin from 1968 to 1980: Multiple evolu-
evolutionary pathways and sequential amino acid changes at key antigenic
sites // J. Virol. 1983. V.48. P. 52-60.
19. Francis Т., Davenport F.M., Hennessy A.V. A serological recapitu-
recapitulation of human infection with different strains of influenza virus //
Trans. Assoc. Am. Physicians. 1953. V.66. P. 231-239.
Глава 9
JISYS: РАЗРАБОТКА ИСКУССТВЕННОЙ
ИММУННОЙ СИСТЕМЫ
ДЛЯ ПРАКТИЧЕСКИХ ПРИЛОЖЕНИЙ
Джон Ханту Джон Тиммис, Дэнис Кук,
Марк Нил, Клайв Кинг
Описывается система машинного обучения, созданная на принципах, ана-
аналогичных механизмам иммунитета человека. Эта система, названная искус-
искусственной иммунной системой (ИИС), разрабатывалась на протяжении трех лет,
и текущая реализация, называемая Jisys, является итогом этих исследований.
Эта система нуждается в дальнейшем развитии, но ее уже можно исполь-
использовать для решения сложных практических задач. Возможности ИИС Jisys
обсуждаются на примере задачи выявления случаев мошенничества в ипотеке.
Отметим, что в данной работе скорее указываются направления исследований
и приемы решения задач, а не описывается проект создания ИИС, хотя неко-
некоторые элементы такого описания присутствуют.
9.1. Введение
Исследовательский проект Isys финансируется правитель-
правительством Великобритании и направлен на использование представ-
представлений об иммунной системе человека для создания систем ма-
машинного обучения. В качестве основы используется описание
механизмов иммунной системы в работе (Perelson, 1989). Отме-
Отметим, что это описание поддерживается только частью иммуноло-
иммунологов-теоретиков. Однако это не является проблемой для Isys, так
как мы не пытаемся прямо моделировать иммунную систему (как
это делали бы исследователи искусственной жизни), а скорее пы-
пытаемся применить базовые идеи иммунитета, используя по мере
необходимости и другие подходы, такие как выбор ближайшего
соседа (Kolodner, 1993) и поиск трех близких строк.
Далее мы обсудим предпосылки, лежащие в основе проекта
Isys, и результаты выполнения первого этапа работ. Затем рас-
рассмотрим возможности применения Jisys как ИИС. После этого
рассмотрим использование Jisys для решения задачи выявления
9.2. Исследования по проекту Isys 189
случаев мошенничества в ипотеке. И наконец, обсудим, как эти
результаты могут быть использованы для построения искусствен-
искусственных иммунных систем.
9.2. Исследования по проекту Isys
Иммунная система человека является важным механизмом
защиты. Эта система непрерывно обучается выявлять чужерод-
чужеродные субстанции, от которых она должна нас защищать. Однако
иммунная система не привлекла такого внимания специалистов
по вычислительным алгоритмам, как нейроны или эволюционные
процессы обучения.
Вместе с тем системы самообучения, построенные на прин-
принципах иммунитета, характеризуются такими важными особенно-
особенностями, как:
• наличие емкой и адресуемой памяти, доступ к которой
осуществляется посредством сложного механизма распо-
распознавания;
• способность распознавать новые субстанции после первого
контакта с ними;
• построение в виде децентрализованной самоорганизующей-
самоорганизующейся системы без центрального контроллера (в такой системе
нельзя выделить центральный исполнительный блок);
• способность к ограничению специализации (невозможно
приобрести иммунитет только к одной болезни, даже если
сталкиваться с ней часто и в очень больших дозах);
• способность забывать мало используемую информацию
(из-за этого мы нуждаемся в повторных иммунизациях
против таких болезней как столбняк).
В этой работе искусственная иммунная система (ИИС) стро-
строится как самообучающаяся система, создаваемая по аналогии
с естественной иммунной системой. В рамках проекта Isys это
означает попытку обеспечить близкое соответствие между ИИС
и иммунной системой человека (Cooke and Hunt, 1995, Hunt and
Cooke, 1996, Hunt and Cooke, 1995). Мы использовали одно из
современных теоретических описаний функционирования имму-
иммунитета (Perelson, 1989).
Построенная в результате модель ИИС была по своим харак-
характеристикам близка к естественной системе иммунитета. В част-
частности, она не «переучивалась» и была способна забывать мало
190
Гл. 9. Искусственная иммунная система Jisys
используемую информацию. Сейчас эта модель ИИС известна
как Pisys 0.
9.2.1. Как работает Pisys. Pisys включает (см. рис. 9.1)
корневой объект, сеть узлов, набор данных для обучения и набор
данных для тестирования системы. Каждый узел сети вклю-
включает распознающий элемент со случайно генерируемым паттер-
паттерном распознавания. Эти узлы меняются так, чтобы распознавать
входные данные. Этот процесс происходит на первой фазе работы
системы —на фазе обучения. Вторая фаза представляет процесс
распознавания, в ходе которого Pisys пытается классифициро-
классифицировать новые данные по отношению к обучающим данным.
Костный мозг
Иммунная
сеть
В-клетки с антителами
Рис. 9.1. Структура системы Pisys
В ходе фазы обучения поступающие данные случайно вза-
взаимодействуют с узлами сети. Для оценки сходства между пат-
паттерном узла и данными применяется алгоритм последователь-
последовательного сопоставления участков. Этот алгоритм устроен так, что
протяженные области сходства получают дополнительные веса.
Алгоритм пытается найти такие области сходства в каждой точке
сравниваемых паттернов. Подробно алгоритм описан в работе
х) Название Pisys происходит от названия программной среды, в которой
создавалась эта система. POPLOG является британской средой для систем
искусственного интеллекта и включает CLOS, PROLOG и POP 11 — язык типа
языка Паскаль. Следовательно Pisys является сокращением от POPLOG-Isys.
9.2. Исследования по проекту Isys 191
(Hunt and Cooke, 1996). В результате такого процесса оценива-
оценивается «величина сходства» узла.
Если величина сходства превосходит «порог сходства», то
узел становится стимулированным. Если уровень стимуляции
достигает определенной величины (порога селекции клона), то
узел считается достаточно стимулированным, чтобы себя клони-
клонировать. В процессе клонирования паттерн узла может мутиро-
мутировать. Введенная таким образом изменчивость дает возможность
добиваться лучшего соответствия с входными данными. Если
мутировавшие узлы хорошо распознают данные, то они добав-
добавляются в сеть. Выделим п узлов, максимально близких новому
узлу, и свяжем его с ними. В случае, если выделенный узел уже
имеет т связей, удаляется связь с наименее похожим узлом и
добавляется связь с новым узлом. Это приводит к образованию
области, способной распознавать
сходные сигналы. Между такими
областями часто возникают мости-
мостики, указывающие на сходство реша-
решаемых задач. Рисунок 9.2 иллюстри-
иллюстрирует эти процессы.
Сеть, в свою очередь, по ме-
механизму обратной связи усиливает
стимуляцию лучших узлов и по-
подавляет стимуляцию худших. Эта
обратная связь обеспечивает более
высокий уровень стимуляции узлов
С большим числом близких по СВО- Рис-92- Развивающаяся им-
муннзя сеть
им паттернам соседних узлов, по
сравнению с уединенными узлами. Размер сети и связи в ней
определяются динамикой взаимоотношений между узлами. Со-
Сочетание действий эффекта сети и уровня соответствия данных
на узел проиллюстрировано на рис. 9.3.
Узлы, не достигшие уровня порога сходства в результате
презентирования данных, удаляются из сети и разрушаются.
В результате, сеть с течением времени меняется и лучше реаги-
реагирует на поступающие данные.
Помимо узлов, непрерывно меняется и структура связей, ис-
исчезают одни связи и создаются другие.
Отметим, что если встроенный в сеть узел проверяет сход-
сходство с определенными данными, то с этими данными сопостав-
сопоставляются также все связанные с ним узлы. Процесс сопоставле-
сопоставления осуществляется с уменьшающимся окном. То есть сначала
сопоставляется 75% от всех связанных узлов, затем 50%, и
192
Гл. 9. Искусственная иммунная система Jisys
наконец, перед завершением процесса сопоставления рассматри-
рассматривается только 25% связанных узлов. Схематически это показано
на рис. 9.4.
Близость к текущей ситуации h
Близость к соседям по сети
Уровень стимуляции узла
Уровень стимуляции ниже
пороговой величины
Уровень стимуляции выше
пороговой величины
Гибель клетки
Клонирование клетки
Рис. 9.3. Процессы, определяющие уровень стимуляции узла
После завершения анализа очередной
порции данных проводится уточнение
пороговых уровней, с тем чтобы учесть
возможные улучшения в работе всей
системы. В нашем случае величины по-
порогов определяют способность системы
обучаться на поступающих данных.
После фазы обучения сети предла-
предлагаются тестовые данные. Система пыта-
пытается обнаружить в них общие признаки
с обучающими данными. Эти признаки
могут показать, что данные близки к
определенному классу обучающих дан-
данных или что в новых данных присутствует паттерн, близкий
к паттернам обучающих данных.
9.2.2. Трудности данного подхода. Предложенный подход
хорошо работает при относительно небольшом числе тестовых
узлов. В работе (Hunt and Cooke, 1996) описаны результаты ряда
экспериментов с системой. Однако при рассмотрении более слож-
сложных реальных задач в рамках данной реализации проявляются
ограничения, на которые надо обратить внимание.
• Представление узлов. Узел устроен слишком просто, он
включает паттерн, задаваемый строкой символов, устрой-
устройство сопоставления и порог сходства. Этих компонентов
недостаточно для решения разнообразных задач обучения.
Рис. 9.4. Расширенный ана-
анализ данных
9.2. Исследования по проекту Isys 193
• Инициализация сети. При случайной инициализации се-
сети на создание работоспособных паттернов и осмысленной
структуры связей между узлами затрачивается очень много
времени.
• Затраты на расширение сети. По мере увеличения раз-
размера иммунной сети быстро снижается эффективность ал-
алгоритма включения в сеть новых узлов. Это связано с тем,
что алгоритм предполагает сравнение нового узла со всеми
существующими узлами. Это необходимо вследствие того,
что сеть динамически собирается из связанных узлов. Свя-
Связи между узлами отражают их сходство. Следовательно,
алгоритм должен находить узлы, наиболее сходные с новым
узлом, и связывать его с ними. Идея состоит в том, что
такой процесс приведет к появлению структурированной
памяти, удобной для работы алгоритма поиска.
• Упрощенный алгоритм сопоставления. Алгоритм сопо-
сопоставления напоминает аналогичный процесс в иммунной
системе человека. Он ищет устойчивые соответствия
в непрерывных последовательностях полей узла. Однако
результат сравнения зависит от относительного положения
полей. Этот подход работает с простыми двоичными или
ДНК-последовательностями, но в общем случае более
эффективным оказывается метод сравнения с ближайшим
соседом.
• Сравнение узлов. В исходном варианте системы узлы в се-
сети располагались случайно. В результате характеристики
системы были не просто случайны, а допускалась полная
потеря важных узлов. Например, в сети имеется узел,
идеально соответствующий поступившим данным, но он
расположен далеко от случайных точек проверки и поэтому
не рассматривается. В результате снижается производи-
производительность системы в целом.
• Удаление узлов. Была использована концепция забывания
узла. Она позволяет удалять мало используемую инфор-
информацию. Эта концепция реализована как поддержка (или
отсутствие поддержки) данного узла соседними узлами.
Однако, как уже отмечалось, алгоритм расширения низко-
низкоэффективен. Следовательно, способность системы забывать
мало используемые узлы нуждается в дополнительном рас-
рассмотрении.
• Инициация процесса клонирования. В некоторых случаях
узел может плохо распознавать текущие данные, но хоро-
хорошо поддерживаться соседями, которые часто являются его
7 Д. Дасгупта
194 Гл. 9. Искусственная иммунная система Jisys
клонами. Это приводит к высокому уровню стимуляции.
В результате узел последовательно клонируется, несмотря
на то что не распознает данные. Уровень стимуляции очень
важен, так как он определяет, какой узел будет удален,
а какой останется. Следовательно, нужно отделять стиму-
стимуляцию от функции клонирования 0.
В дальнейших исследованиях должны быть учтены следую-
следующие характеристики созданной системы:
• способность забывать редко используемую информацию,
• способность к самоорганизации иммунной памяти в узле,
• способность иммунной сети к эффективному поиску инфор-
информации.
Желательно, чтобы создаваемые системы воспроизводили
свойство универсальности иммунитета, то есть способность
справляться с ранее не известной инфекцией, если она близка,
хотя и не идентична ранее встречавшейся инфекции. Система
Jisys будет развиваться в этом направлении.
9.3. Система Jisys
Проблемы и ограничения исходной версии системы заставили
нас рассмотреть различные подходы их решения. Результаты
экспериментов приведены в работах [Hunt and Fellows, 1996]
и [Hunt et ai, 1995]. В результате этих исследований была
разработана система Jisys. Рассмотрим ее подробнее.
Текущая версия системы Jisys реализована на языке програм-
программирования Java с использованием реляционной базы данных для
хранения информации об узлах сети и связях между ними 2). Она
будет описана в разделе 9.4. На рис. 9.5 представлена логическая
структура системы Jisys.
Функционирование Jisys делится на четыре четко различа-
различающихся стадии. На первой стадии инициализируется иммунная
память, на второй — память преобразуется в иммунную сеть, на
следующей стадии производится обобщение иммунной памяти
(на первой и третьей стадиях для обучения используются разные
данные), на четвертой стадии происходит классификация новых
1) В реализованной версии Jisys уровень стимуляции определяет начало
клонирования.
2) Так же как Pisys обозначает POPLOG и Isys, Jisys обозначает Java и
Isys. Язык Java выбран из-за объектно-ориентированных свойств, отсутствия
указателей, явного распределения памяти и переносимости.
9.3. Система Jisys
195
незнакомых данных. Рассмотрим эти стадии и обеспечивающие
их операции.
Рис. 9.5. Логическая структура системы Jisys
9.3.1. Узел. В системе Jisys включенная в сеть клетка
рассматривается как узел. Этот термин указывает на то, что
каждый элемент сети представляет один из возможных сцена-
сценариев. Структура узла представлена на рис. 9.6. Отметим, что
на рисунке показаны поля, которые используются далее в этой
главе, и выбор полей зависит от приложений. Отметим также,
что если добавить поле «уровень стимуляции», то эта структура
будет близка к тем, что используются во многих компьютерных
системах записей 0. Это поле модифицируется системой Jisys.
9.3.2. Сетевая память: инициализация. При предъявле-
предъявлении системе Jisys новых данных на этапе инициализации исполь-
используется линейный узел памяти. Особенностью линейного (или
плоского) узла памяти является то, что он не навязывает узлу
какую-либо организационную структуру. Каждый узел считается
потенциально столь же значимым, что и все остальные. Все
узлы включены в список. Новые узлы могут добавляться в на-
CBR —computer-based recording system.
7*
196
Гл. 9. Искусственная иммунная система Jisys
чало, в конец или в середину списка. В нашей системе новые
узлы добавляются в конец списка. Это увеличивает произво-
производительность системы по сравнению с исходной системой Pisys,
в которой сеть реструктурируется после включения каждого
нового узла. В нашем случае сеть реструктурируется только
после включения всех новых узлов и завершения фазы инициа-
инициализации.
Поле Значение Тип
Имя
Пол
Номер дома
Название дома
Улица
Квартал
Район
Город
Страна
Почтовый код
Место работы
Должность
Зарплата
Джон Смит
м
20
Ти Коч
Эол Бонт
Динас
Эберстви
Серед и дж
Sy23 4DC
UWA
Бухгалтер
23 000
Уровень
стимуляции
245
Строка
Булевская
Число
Строка
Строка
Строка
Строка
Строка
Строка
Строка
Строка
Строка
Число
Рис. 9.6. Структура узла
9.3.3. Реструктурирование сети. На рис. 9.7 показан ре-
результат трансформации узлов в иммунную сеть. Иммунная
сеть является самоорганизующейся
структурой (это свойство особенно
полезно при анализе данных, для
которых отсутствуют сведения, поз-
позволяющие предложить определен-
определенную структуру памяти). Формиро-
Формирование иммунной сети происходит
путем соединения «похожих» уз-
узлов.
ч
Рис. 9.7. Структура иммунной
сети
Отметим следующие характеристики сети:
• паттерны в узлах соответствуют последним предъявленным
данным,
• связи отражают сходство узлов,
• группы связанных узлов имеют сходные паттерны.
9.3. Система Jisys 197
Представленная на рис. 9.7 сеть включает три группы узлов
с близкими паттернами. Эта диаграмма является фрагментом
реальной сети.
9.3.4. Алгоритм включения. Алгоритм включения основан
на алгоритме, описанном в работе [Hunt et ai, 1995], но в си-
системе Jisys он используется только один раз, после того как
получены все узлы, которые хотелось бы включить в оконча-
окончательный вариант сети. На рис. 9.8 представлена схема алгоритма
Выполняется Для узла линейной памяти
В списке узлов иммунной сети найти п наиболее похожих
Выполняется Для существующих узлов в списке п наиболее похожих
Если узел уже имеет т связей, тогда
Если в какой-нибудь из существующих связей сходство ниже, то
Удалить связь с минимальным уровнем сходства
Связать узел с существующими узлами
Связать существующие узлы с узлом
Включить узел в список узлов сети
Конец Если
Конец Если
Конец Для
Конец Для
Рис. 9.8. Схема алгоритма включения
включения. Видно, что при включении узла в иммунную сеть
система находит в сети узлы, наиболее похожие на новый, и
соединяет его с ними. В результате в сети образуются области,
которые объединяют узлы, пред- _
назначенные для решения сход- "" " ^*-^^^
ных задач. Мосты между этими
областями показывают наличие
характеристик, общих для рас-
рассматриваемых задач.
Выявление таких особенностей
данных само является полезным
результатом. В настоящее время
система интегрирована с про-
программным продуктом JavaSpace,
который упрощает визуализацию
и исследование иммунных сетей.
Представление иммунной сети с
г т с> Рис- 9.9. Пример визуализации им-
помощью JavaSpace показано на ой сетри с ПРОМО1^ЬЮ javaSpace
рис. 9.9.
198
Гл. 9. Искусственная иммунная система Jisys
9.3.5. Процесс сопоставления узлов. Блок-схема процесса
сопоставления узлов приведена на рис. 9.10. В системе Jisys для
оценки сходства узлов используются три метода:
• метод последовательного кругового сравнения,
• метод триграмм,
• метод сравнения чисел.
Эти методы позволяют получать две разные оценки близости.
Первая оценка получается в результате сопоставления с по-
последовательными сдвигами закольцованных строк, сопоставле-
сопоставления групп из трех символов для всех текстовых полей и срав-
сравнения чисел для числовых полей. Степень сходства оценивает-
оценивается для каждого поля. Для каждого поля также вводится вес,
который используется при вычислении меры близости структур
в целом.
Уровень похожести
является лучшим из
Взвешенных
ближайших
соседей
Связанных
текстовых
полей
Числовых
полей
Структура узла
Поле: Название дом<
Сравнение
кольцевых
участков
Трехэлементное
сравнение
Сравнение
чисел
Рис. 9.10. Блок-схема процесса сопоставления узлов в системе Jisys
Вторая оценка получается в результате объединения всех
текстовых полей узла в одну строку и применения методов по-
последовательного кругового сравнения и триграмм к этой строке.
Для численных полей проводится сравнение чисел.
Обе оценки выражаются в процентах от возможной макси-
максимальной величины сходства. Затем наивысшие оценки первого
и второго типа используются как оценки сходства всего узла.
9.3. Система Jisys
199
Отметим, что во все алгоритмы сравнения мы включили возмож-
возможность сравнения с групповым символом 1) (обозначаемым в ви-
виде «*»). Результат оценки с использованием группового символа
должен иметь уменьшенный вес E0% для всех оценок), с тем
чтобы мы не пришли к случаю, когда узел, полный групповых
символов, сходен с любым другим узлом!
Последовательное круговое сравнение. Верхний уровень
алгоритма проверяет наличие пустых строк:
if at least one string empty then (если как минимум одна
строка пустая то);
percentage match is 0 (уровень сходства в процентах ра-
равен 0);
else (иначе);
perform circular region match on string (провести последова-
последовательное круговое сравнение строки);
endif (конец если).
Этим обеспечивается то, что последовательное круговое срав-
сравнение будет проводиться с непустыми строками. На следующем
шаге все символы обеих строк переводятся в верхний регистр,
так как при сравнении символов регистр не учитывается. Затем
применяется собственно алгоритм последовательного кругового
сравнения. Сначала первая строка просто сравнивается со вто-
второй. Затем вторая строка сдвигается на один символ. Получив-
Получившаяся строка сравнивается с первой, и этот процесс повторяется
до тех пор, пока вторая строка не вернется в исходное состояние.
В табл. 9.1 показан процесс сравнения двух строк «Monday» и
«Tuesday».
Таблица 9.1
Сравнение двух строк алгоритмом
последовательного кругового сравнения
MONDAY^TUESDAY
MONDAY^UESDAYT
MONDAY^ESDAYTU
MONDAY^SDAYTUE
MONDAY^DAYTUES
MONDAY^AYTUESD
MONDAY^YTUESDA
Число
совпадении
3
0
0
0
0
0
0
Длина
участка
3
0
0
0
0
0
0
Весовой коэффициент
для длины участка
*2
*2
*2
*2
*2
*2
*2
Общий
балл
9
0
0
0
0
0
0
wild card
200 Гл. 9. Искусственная иммунная система Jisys
Величина сходства для единичного сравнения вычисляется
как сумма числа совпадающих букв и длины непрерывного
участка совпадения (с весовым коэффициентом 2). Величина
сходства строк определяется как максимум из результатов всех
единичных сравнений этих строк.
Метод триграмм. В этом методе сравнение двух строк на-
начинается с идентификации слов. Для этого сначала все буквы
изменяются на верхний регистр, затем удаляются все знаки
препинания, и для каждой строки создается список слов. Затем
для каждого слова создается список триграмм, который является
перечислением всех возможных триграмм для данного слова.
В табл. 9.2 приведен список триграмм для слова John.
Таблица 9.2
Триграммы для строки John
— J
О Н N
- J О
HN-
J О N
N
Затем проводится сравнение списков триграмм для всех слов
из двух строк. Оценка близости для единичного сравнения по-
получается следующим образом:
• за каждое совпадение букв в одинаковой позиции к оценке
близости прибавляется 6 О,
• за совпадение букв в разных позициях прибавляется 2.
Каждая триграмма сравнивается со всеми триграммами вто-
второго слова, и ей присваивается лучшая из всех полученных
оценок сходства. Общая оценка сходства строк является суммой
оценок всех триграмм и выражается в процентах от возможного
максимального значения.
Например, в табл. 9.3 приведены лучшие оценки для три-
триграмм, составляющих имя Malcolm и его ошибочную запись
Malcom.
Общая оценка сходства равна 106 из 126, или 85%, что
указывает на близкое сходство этих двух строк.
Метод сравнения чисел. Числовые поля, например номер
дома, можно сравнивать, используя описанные выше методы, что
дает оценку сходства цифр двух чисел. Но для числовых полей
правильнее сравнивать величины чисел, а не составляющие их
цифры. Это делается при помощи метода сравнения величин.
1) Величины б и 2 приведены для иллюстрации. В системе Jisys значения
этих параметров задаются в конфигурационном файле.
9.3. Система Jisys
201
Если числа равны, то поля полностью совпадают. При близком,
но не точном сходстве вводится понятие интервала. Если чис-
числа различаются, но разница между ними меньше определенной
величины или равна ей, то они определяются как частично
сходные. В приведенном далее алгоритме эта величина равна
80%-му совпадению. Если числа находятся за пределами этого
интервала, тогда для оценки сходства используется разность
между ними в процентах.
Таблица 9.3
Сравнение двух триграмм
—
—
м
А
L
С
О
L
М
- м
М А
A L
L С
С О
О L
L М
М -
—
—
м
А
L
С
С
О
м
- м
М А
A L
L С
С О
О М
О М (или ОМ—)
м -
б
12
18
18
18
14
8
б
б
Поиск ближайшего соседа. Имея оценки сходства для каж-
каждого поля узла, можно найти оценку сходства для всего узла.
Для этого используется метод ближайшего соседа с учетом
его веса.
В этом методе каждому полю присваивается весовой коэффи-
коэффициент, который отражает его важность. Например, поле номера
дома может быть более важным, чем поле почтового индекса,
поэтому вес первого будет 15, а второго — 5. Оценка сходства
каждого поля умножается на соответствующий весовой коэффи-
коэффициент.
Оценка сходства с ближайшим соседом получается в резуль-
результате сложения взвешенных оценок полей. Эту величину также
удобно выражать в процентах от максимальной оценки сходства.
Полученная таким образом оценка зависит от свойств двух уз-
узлов.
Таблица 9.4 показывает пример вычисления оценки сходства
с ближайшим соседом. По приведенным оценкам сходства полей
и их весам вычисляется общая оценка для пары узлов. Она равна
4775 из 6600 возможных, или 72%.
202
Гл. 9. Искусственная иммунная система Jisys
Таблица 9.4
Оценка сходства с ближайшим соседом
Поле
Имя
Название дома
Номер дома
Улица
Микрорайон
Город
Страна
Почтовый индекс
Оценка сходства с
Оценка
20
45
80
75
0
100
100
100
Весовой коэффициент
5
5
15
10
10
5
5
15
ближайшим соседом
Взвешенная оценка
100
225
1200
750
0
500
500
1500
4775
9.3.6. Сетевая память: обобщение. Целью этого этапа яв-
является такое обобщение памяти узла, в результате которого она
была бы способна не просто обрабатывать данные, но и выявлять
в потоке данных тренды и паттерны. Для этого системе переда-
передается второй набор данных. Проводится сканирование всех узлов
системы для оценки их сходства с новыми данными. Получив п
лучших узлов, система прибавляет величину оценки сходства
нового узла к уровням стимуляции существующих узлов. Таким
образом, используется следующий алгоритм:
for existingNode in best N Nodes do
matchValue := match(newNode, existingNode);
existingNode.stimulationLevel :=
existingNode.stimulationLevel + match-
Value;
Как только уровень сходства становится выше порога се-
селекции, узел дублируется (или клонируется) 0. Число образо-
образовавшихся клонов зависит от разности между средним порогом
*) Отметим главное новшество по сравнению с нашей предыдущей работой.
Там клонирование определяется уровнем стимуляции, и узел дублируется, если
уровень стимуляции узла выше порога селекции. Однако у узла может быть
много очень похожих на него соседей, что вызовет клонирование, даже если
он не очень схож с данными. Это может снизить эффективность всей системы.
Однако уровень стимуляции эффективен как подкрепляющий механизм, уве-
увеличивающий выживание узлов в сети. Поэтому мы сделали так, что уровень
сходства прямо влияет на уровень стимуляции.
9.3. Система Jisys
203
стимуляции всех узлов и порогом стимуляции данного узла.
Клон является точной копией исходного узла.
Селекция клона реализована как случайный выбор одного из
трех исходов 0.
Сохранение. Клон не меняется и остается точной копией
оригинала.
Обобщение. Сравниваются клоны и индуцировавшие их дан-
данные. Все одинаковые элементы (то есть совпадающие поля) оста-
остаются в клоне, все оставшиеся поля заполняются групповыми
символами (которые обозначаются как «*»), см. рис. 9.11.
Сравнение
ттъ
Клон 1
Обобщение
Мутация
Мутировавший
клон 1
Обобщенный
клон 2
Рис. 9.11. Селекция клонов и гипермутирование
Мутация. Клон мутирует так, что новый узел немного от-
отличается от исходного (рис. 9.11). Отметим, что происходящие
на этой фазе мутации не обязательно совпадают с мутациями
в генетических алгоритмах [Goldberg, 1989]. Далее этот вопрос
будет рассмотрен подробнее.
Затем текущий набор данных передается всем клонам для
определения уровня сходства. После этого клон добавляется к
памяти узла, которая остается линейно упорядоченной и орга-
*) Это еще одно отличие от предшествующей работы. До этого мы рассмат-
рассматривали только две операции с клонами: сохранение и оценку сходства. Такой
подход ближе к естественной иммунной системе. Однако такие приложения
как распознавание мошенничества при получении кредита требуют поиска
обобщающих паттернов. Мутации могут затрагивать такие паттерны, а могут
и не касаться их. Введя обобщение, мы получили больше шансов генерировать
узлы с универсальными паттернами. Конечно, они могут становиться слишком
общими и в этом случае должны погибнуть, так как совпадение группового
символа генерирует более низкий уровень сходства, чем точное совпадение.
204 Гл. 9. Искусственная иммунная система Jisys
низованной как сеть. Клон интегрируется в сетевую структуру
и на фазе уточнения получает соответствующий набор уровней
стимуляции.
Таким образом узлы, которые лучше совпадают с новыми
наборами данных, клонируют себя, обеспечивая тем самым вы-
высокий уровень сходства для нового узла.
Отметим, что если обобщение или мутация приводят к по-
появлению узла, который не соответствует данным (или плохо
соответствует данным), то уровень его стимуляции падает зна-
значительно ниже уровней других узлов. Это важно для следующей
стадии процесса обучения.
9.3.7. Мутации в системе Jisys. При клонировании узла
могут происходить мутации. Они определяются случайно генери-
генерируемым индикатором мутации. Если величина индикатора выше
порога мутации, то клон мутирует. Для разных типов полей
используются различные типы мутаций.
Булевские поля. При мутировании этого поля новое значе-
значение производится случайным выбором из «true» и «false».
Числовые поля. Для мутирования числовых полей мы ис-
используем «вязкое» варьирование действительного числа. Для
этого генерируются случайные числа, меняющиеся в интервале
от 0 до исходного значения. Это число затем случайно прибав-
прибавляется или вычитается из исходного значения.
Поля перечислений. Для мутирования полей, содержащих
такие перечисления, как дни недели, новое значение случайно
выбирается из допустимых.
Строковые поля. В этих полях используется один из меха-
механизмов мутирования:
• случайные мутации букв;
• выбор нового значения из существующих узлов.
Выбор осуществляется при помощи алгоритма рулетки: сна-
сначала выбирается еще один узел, а затем случайным образом
решается, брать ли значение из клона или из выбранного узла.
Отметим, что для данного клона выбор узла осуществляется
только один раз.
На рис. 9.12 показаны результаты мутирования клона узла,
представленного ранее на рис. 9.6. Мутации выделены наклон-
наклонным шрифтом.
9.3.8. Сетевая память: уточнение. На этом шаге система
Jisys просматривает все узлы сети и находит такие, уровень
стимуляции которых ниже порога стимуляции. Эти узлы уда-
удаляются из памяти. Величина порога стимуляции выбирается как
9.3. Система Jisys
205
процент от среднего уровня стимуляции и зависит от решаемой
задачи.
Поле Значение Тип
Имя
Пол
Номер дома
Название дома
Улица
Квартал
Район
Город
Страна
Почтовый код
Место работы
Должность
Зарплата
Джон Смит
м
27
Фёрст
Эол Бонт
Ваун Фар
Эберстви
Серед и дж
Sy23 3DB
UWA
Лектор
16 000
Уровень
стимуляции
245
Строка
Булевская
Число
Строка
Строка
Строка
Строка
Строка
Строка
Строка
Строка
Строка
Число
Рис. 9.12. Мутировавший клон
Результатом этого процесса является то, что в памяти со-
содержатся узлы, наиболее часто участвующие в классификации
представляемых системе данных. Чем чаще узел совпадает с
новым узлом, тем выше уровень его стимуляции. Затем память
узлов трансформируется в иммунную сеть (см. рис. 9.7).
9.3.9. Классификация. После того как иммунная сеть по-
построена, она может быть использована для классификации новых
данных. Алгоритм сопоставления сравнивает поступившие дан-
данные со всеми полями узла и проделывает это со всеми узлами.
При этом память узла рассматривается как одноуровневая (ли-
(линейная). Если уровень сходства между входным узлом и данным
узлом выше порога селекции, то можно сказать, что данный узел
классифицирует входные данные. Такие узлы затем предъявля-
предъявляются пользователю как данные, в некотором смысле близкие
входным. Например, в случае анализа мошенничества при полу-
получении кредита, новое предложение имеет что-то общее с пред-
предшествующими мошенничествами. Количество предъявляемых уз-
узлов определяется пользователем и может быть равно одному
или больше. Узлы упорядочиваются по уровню сходства с вход-
входными данными. Важным направлением дальнейших исследова-
исследований является разработка методов анализа сетей узлов, наиболее
подходящих для решения различных задач классификации.
206
Гл. 9. Искусственная иммунная система Jisys
9.4. Структура системы Jisys
Система Jisys включает ряд функциональных единиц, кото-
которые образуют функционально-логическую схему системы, пока-
показанную на рис. 9.5. Физическая структура системы приведена на
рис. 9.13.
Интерфейс
Jidea
Генератор
сети
Реляционная
база данных
:— idea: tifi Oiiat>iisef#ir fitpiriiTteTa.Tlei.aie Ап*1рв j * .¦
Cax.iibsx.il *ш
Классификатор
Jview
Визуализатор
JavaSpace
Рис. 9.13. Физическая структура си-
системы Jisys
Рис. 9.14. Интерфейс системы Jisys
Система Jisys состоит из пяти основных компонентов. Каж-
Каждый из них выполняет свою специфическую роль.
• Jidea. Это сокращение от Jisys Isys Database for Experi-
Experimental Analysis. Jidea является пользовательским интер-
интерфейсом. Он позволяет выбирать файлы с данными для
обучения и тестирования иммунной сети, просматривать
их и редактировать. На рис. 9.14 показан внешний вид
интерфейса Jidea.
• Network Generator. Это ключевой компонент системы Jisys.
Он инициализирует память узла, создает начальную сеть,
обобщает и уточняет сеть. Задачей этого компонента также
является поддержание узлов и связей между ними в табли-
таблицах реляционной базы данных. Он также позволяет загру-
загрузить из базы данных ранее созданную сеть.
• Relational database. Это реляционная система управления
базой данных (СУБД), которая используется не только для
эффективной генерации сети и доступа к ней, но и для
ее поддержания. Исходная система, создавая сеть связей
между объектами, использует объектно-ориентированный
подход. Хотя использование реляционной базы данных тре-
требует некоторой трансформации связей между объектами и
входами в таблицу, в результате достигается значительное
увеличение производительности системы. База данных до-
9.5. Приложение: мошенничество с закладными 207
ступна в Java 1.1 через механизм JDBC (средство органи-
организации доступа Java-приложений к базам данных в сети).
Это позволяет изолировать Jisys от конкретной системы
управления базой данных.
• JavaSpace. Это средство визуализации сети описано в дан-
данной главе ранее. Оно позволяет наблюдать изменения сети
узлов в ходе процесса обучения или же анализировать
загруженную из базы данных ранее созданную сеть.
• JView. Этот компонент осуществляет в Jisys операцию
классификации. В настоящее время это наименее развитая
часть системы.
9.5. Приложение: мошенничество с закладными
Согласно оценкам, объем мошенничества с закладными
в Великобритании составляет около 100 млн. фунтов в год.
Следовательно иммунизация финансовых организаций против
мошенничеств со ссудами и закладными является важной и
нетривиальной компьютерной проблемой. Эта проблема включает
определение надежности, новизны, потенциальной полезности
и, наконец, понятности паттернов для очень больших массивов
данных. Фактически задачей является извлечение знаний из
данных. В зависимости от применяемых приемов, полученные
знания могут быть использованы для:
• обнаружения мошенничества в новых заявках,
• объяснения произошедших мошенничеств,
• возможности логической (в отличии от «графической») ви-
визуализации данных для поддержки более глубокого анали-
анализа паттернов мошенничеств.
Особенностью задачи является то, что по мере роста баз дан-
данных ручная идентификация случаев мошенничества становится
все более и более затруднительной. В помощь человеку для
решения таких задач развито несколько подходов. Один из них
предполагает использование таких методов искусственного ин-
интеллекта (ИИ), как нейронные сети и машинный вывод. В этом
разделе мы опишем, каким образом можно использовать систему
Jisys для изучения паттернов в базе данных по мошенничествам
с закладными.
9.5.1. Выявление паттернов мошенничества. В этом па-
параграфе искусственная иммунная система (ИИС) будет использо-
использована для идентификации мошенничества в заявках на ссуды. Эта
работа состоит в обучении системы на базе данных, включающей
208 Гл. 9. Искусственная иммунная система Jisys
как установленные случаи мошенничества, так и добросовестно
оформленные заявки. Она является продолжением ранее опубли-
опубликованных исследований (Hunt and Fellows, 1996). В ходе работы
создается сеть узлов, которые представляют в ней свои паттерны
(отметим, что эти узлы сильно отличаются от узлов в нейронных
сетях, так как активно презентируют паттерны, а связи между
узлами отражают их сходство). Эту сеть можно изучать при
помощи графического визуализатора и выявлять группы тесно
связанных узлов. Узлы также могут действовать как дискрими-
дискриминаторы при рассмотрении новых заявок.
9.5.2. Данные. Данные по мошенничествам с закладными
могут быть разделены на два типа:
• неправильное описание фактов с целью получения ссуды,
так как в противном случае заявитель не проходит по пра-
правилам; в этом случае заявитель намеревается возвращать
ссуду;
• мошенническая заявка (например придумывание несуще-
несуществующего юридического лица с целью получения денег
без намерения возвращать долг).
Оба типа могут приводить к безнадежным долгам, кото-
которые желательно минимизировать. Например, крупное кредитное
агентство рассматривает в день примерно 3000 заявлений. Из
них 10% мошеннические. Величина займа, в среднем, равна 5000
фунтов, следовательно каждый день такое агентство имеет дело
с мошенничеством на 1500000 фунтов. Судебное преследование
в таких случаях может быть затруднительным, так как кредитор
должен доказать намеренный обман. Это трудно сделать, так как
закон рассматривает тех, кто не может заплатить, как «наме-
«намеревающихся вернуть долг, но не способных сделать это», а не
как обманщиков — даже если предоставленная ими информация
была неточной. Следовательно, превентивные меры значительно
лучше, чем исправление ошибок, хотя в этом вопросе могут быть
трения между теми, кто занимается маркетингом, и теми, кто
выявляет мошенничества.
Идентификация мошеннических заявок является очень труд-
трудной задачей, так как применяемые при этом способы непрерывно
меняются. В этих условиях главным ресурсом кредитора в борьбе
с обманами являются базы данных с прошлыми мошенническими
заявками. В этих данных закодированы паттерны поведения мо-
мошенников. Однако эти базы очень большие. Поэтому для иденти-
идентификации паттернов необходимо применять технические средства.
Использованный в этой работе файл с типичными паттернами
поведения мошенников был подготовлен совместно с крупным
9.6. Возможности системы Jisys 209
кредитным агентством. Этот файл не содержал реальных заявок;
скорее в нем содержались типичные паттерны мошенничества,
которые можно найти в таких данных.
9.5.3. Домен знания. Ключевым свойством системы явля-
является возможность простого подключения к ней существующего
домена знаний. Эти знания будут использоваться в операторах
оценки сходства узлов, в операторах мутирования и (после того
как они будут включены в систему) в операторах «гистосовме-
стимости» и «самораспознавания». Операторы «гистосовмести-
мости» и «самораспознавания» рассматривают отношения в пат-
паттерне узла, а также между данным и другими паттернами сети.
9.5.4. Анализ случаев мошенничества. Система Jisys
применялась для решения задач идентификации и визуализа-
визуализации паттернов мошенничеств с закладными. Система способна
идентифицировать сходные заявки как группы связанных узлов,
а также может помочь классифицировать новые заявки. По-
Полученные результаты показывают, что точность идентификации
паттернов выше 90%, а точность классификации выше 80%.
9.6. Возможности системы Jisys
В этом разделе рассматриваются результаты обучения си-
системы распознаванию мошенничеств и возможности Jisys как
искусственной иммунной системы.
9.6.1. Визуализация иммунной сети. Применение визуа-
лизатора сети JavaSpace позволяет исследовать кластеры узлов
иммунной сети. Эти кластеры могут указывать как на мошен-
мошенническое, так и на добросовестное поведение. В узле мошенни-
мошеннического поведения могут быть зафиксированы некоторые общие
паттерны мошенничества. Эти паттерны должны быть изучены
экспертами, знакомыми с методами обмана кредитных агентств.
Это поможет уточнить форму и процедуру подачи заявки и обе-
обеспечит более легкое выявление обмана.
9.6.2. Идентификация случаев мошенничества. Содер-
Содержащаяся в иммунной сети информация может быть использована
как основа системы обнаружения мошенничества. Как и в есте-
естественной иммунной системе, выявленный паттерн мошенниче-
мошенничества распознается при последующих встречах. Это означает, что
если другие попытаются повторить чей-то обман, то они будут
пойманы.
210 Гл. 9. Искусственная иммунная система Jisys
9.6.3. Искусственная иммунная система. По сравнению
с предыдущими разработками система Jisys еще дальше ушла
от естественной иммунной системы. Это отражается не только
в заимствовании термина узел, а не В-клетка, но и в использова-
использовании приемов обработки компьютерных записей (таких как поиск
ближайшего соседа). Мы считаем, что стратегия заимствования
помогла преодолеть ряд слабых мест прежнего подхода. Напри-
Например, разрешение клонирования узла несколькими способами, а
не только через процесс мутирования, часто оказывается очень
полезным. В качестве дополнительного оператора клонирования
рассматривается кроссовер, так как он позволяет комбинировать
полезные характеристики.
Мы считаем, что прагматичное использование различных ме-
методов и приемов уже принесло такие дивиденды, как возмож-
возможность применять систему Jisys для решения практических задач.
9.7. Сравнение с аналогичными работами
Количество исследований искусственных иммунных систем
быстро растет (о чем свидетельствует и этот сборник). Однако,
если сравнивать разные работы, то к искусственной иммунной
системе в буквальном смысле наиболее близка та, что представ-
представлена в этой главе. Например, работа (Kephart et ai, 1997) по
обнаружению вирусов скорее фокусируется на аналогии между
их системой и иммунитетом, чем на прямом заимствовании кон-
концепций из иммунной системы. В похожей работе (Dilger, 1997)
аналогии с иммунной системой используются для управления
«умным домом».
Другим направлением исследований в этой области являются
попытки применить концепции иммунной системы как допол-
дополнение к другим подходам решения задач обучения. Например,
в работе (Hoffmann, 1997) иммунная система, иммунная сеть и
иммунный ответ сравниваются с нейронной сетью, а в работах
(Farmer et ai, 1986; Bersini and Varela, 1990) — с обучающими-
обучающимися системами классификации. Все это очень сильно отличается
от нашего подхода.
В работе (Smith et ai, 1997) авторы строят компьютерные
модели для прояснения принципов работы иммунной системы.
Сходным образом (Forrest et ai, 1993), используя генетический
алгоритм, моделируют эволюцию и механизмы иммунной систе-
системы. То есть авторы применяют генетический алгоритм к модели
иммунной системы для исследования ее поведения.
9.8. Направления развития системы 211
С точки зрения машинного обучения работы двух групп,
(Bersini, 1991; Bersini and Varela, 1990; Bersini and Varela,
1994) и (Gilbert and Routen, 1994), близки к нашим исследова-
исследованиям. Помимо этого Берсини и Варела исследовали возможность
применения иммунной сети как механизма эволюционного обуче-
обучения. Их работа почти полностью сконцентрирована на иммунной
сети и игнорирует генетические механизмы иммунной системы.
Они создали подход, который может быть использован для ре-
решения задач оптимизации функций или управления. Этот под-
подход они применили для осуществления функций тестирования,
для решения задачи коммивояжера и задачи оптимизации ба-
балансировки перевернутого маятника. Отличием нашего подхода
является решение задач машинного обучения (классификации,
извлечения информации) для анализа представленных данных.
Это означает, что хотя оба подхода вдохновлены принципами
иммунной системы, их философия, архитектура и возможности
очень сильно различаются.
Наконец, в работе (Gilbert and Routen, 1994) концепция
иммунной сети была использована для создания содержатель-
содержательно адресуемой аутоассоциативной памяти. Они применили эту
систему для запоминания и распознавания черно-белых картин
размера 64 х 64. Их система представляет иммунитет как свя-
связывающее устройство, в котором локализованы взаимодейству-
взаимодействующие узлы (В-клетки), изучающие новые концепции или рас-
распознающие прошлые ситуации. Как отмечали сами Гильберт и
Роутен, их подход существенно отличается от нашего, так как их
интересуют только «аспекты, существенные для взаимоотноше-
взаимоотношений, ... только области их взаимодействия». В системе Jisys мы
интересуемся не только представляющими клетками (как узлами
в сети), но и генетическими механизмами, создающими новые
узлы, а также эволюцией сети. Также интересно отметить, что
им не удалось получить устойчивую модель, способную запом-
запомнить паттерны. В отличие от указанных авторов нам удалось
получить память в системе Jisys. Это объясняется различием
способов использования сети для поддержания узлов, которые
должны запоминать паттерны.
9.8. Направления развития системы
Будущие исследования можно разделить на три направления.
9.8.1. Новые аналогии с иммунитетом. Предполагается
продолжить аналогии с иммунной системой и рассмотреть поня-
понятия узлов-киллеров, узлов-героев, Т-клеток и так далее. Целью
212
Гл. 9. Искусственная иммунная система Jisys
такого дополнения системы Jisys является усиление ее способно-
способности к обучению. В настоящее время изучается применение опера-
операторов гистосовместимости и самораспознавания. Рассмотрим их
подробнее.
Операторы гистосовместимости и самораспознавания.
После завершения стадии обобщения (см. рис. 9.5) память узлов
может быть просканирована для выявления узлов, к которым
можно применить операторы гистосовместимости и саморас-
самораспознавания 0. Эти операторы зависят от домена, в котором
используются, и влияют на уровень стимуляции узла. Например,
оператор «гистосовместимости» может определять, является
ли информация в узле совместимой, и в зависимости от
решаемой задачи этот факт может оказывать отрицательный или
положительный эффект на уровень стимуляции узла.
В свою очередь, операторы самораспознавания могут опреде-
определять, насколько соседи данного узла сходны с ним. Это может
оказывать положительный или отрицательный эффект на уро-
уровень стимуляции узла. Этот процесс можно рассматривать как
обобщение влияния соседей в сети системы Pisys.
На рис. 9.15 показана схема воздействий на уровень стимуля-
стимуляции узла. Для задач с закладными оператор гистосовместимости
может проверять, совпадает ли адрес с почтовым индексом или
пол заявителя с его именем и т. д. Операторы самораспознавания
Сходство с текущим состоянием
Операторы гистосовместимости
Операторы распознавания своего
(например похожести на соседей
по сети)
Уровень стимуляции узла
Уровень стимуляции ниже пороговой
величины
Гибель клетки
Рис. 9.15. Факторы, определяющие уровень стимуляции узла в системе Jisys
1) Эта концепция и ее использование многократно обсуждалась участни-
участниками проекта Isys. Однако она до сих пор не реализована, и этот раздел
является планом по ее реализации, а предложенная методология разработана
путем «мысленных экспериментов».
9.8. Направления развития системы
213
могут проверять, нет ли большего количества заявок из одной
местности со сходными характеристиками.
9.8.2. Обобщения в системе Jisys. Один из операторов
клонирования осуществляет обобщение созданного узла. Это
может быть сделано путем слияния нового узла с набором ис-
исходных данных. При этом поля, не совпадающие с исходными
данными, могут быть заменены групповым символом. Результа-
Результатом будет узел, который представляет признаки, общие для срав-
сравниваемых данных и узла. Иллюстрирующий пример приведен на
рис. 9.16.
Порция
данных
Клон
Обобщенный узел
Джон Смит
м
20
ТиКоч
Эол Бонт
Динас
Эберстви
Середидж
SY23 4DC
UWA
бухгалтер
23 000
Поле
Имя
Пол
Номер дома
Название дома
Улица
Квартал
Район
Город
Страна
Почтовый код
Место работы
Должность
Зарплата
Значение
Джон Смит
м
20
ТиКоч
Эол Бонт
Динас
""
Эберстви
Середидж
SY23 4DC
UWA
бухгалтер
23 000
Поле
Имя
Пол
Номер дома
Название дома
Улица
Квартал
Район
Город
Страна
Почтовый код
Место работы
Должность
Зарплата
Значение
*
м
20
ТиКоч
Эол Бонт
Динас
ПН
Эберстви
Середидж
*
*
бухгалтер
23 000
Рис. 9.16. Процесс обобщения клона
9.8.3. Иммунные сети. Значительно более важной обла-
областью исследований является анализ иммунной сети после за-
завершения процесса обучения. Сейчас сеть, обучение которой
завершено, используется при помощи Jview для классификации
(подобно тому, как и в Системе доказательной аргументации).
В идеале эта сеть должна быть скомпилирована или каким-то
образом сжата. Это связано с тем, что многие случаи содержат
наборы связанных и очень похожих узлов. В результате сеть
трудна для понимания пользователем и менее эффективно клас-
классифицирует. Существует ряд способов сжать сеть.
Альтернатива 1: анализ сетей. Создание искусственной
иммунной системы из набора данных приводит к структуре,
которая классифицирует и связывает эти данные. Она также
создает эффективный набор суммарных случаев, которые сами
могут рассматриваться как набор данных. Большая сеть может
не иметь какой-то общей структуры, и после преобразования
такой сети в соответствующий набор данных они могут анали-
анализироваться так же, как и исходные данные. Следовательно, этот
214 Гл. 9. Искусственная иммунная система Jisys
процесс обработки сети как набора данных может повторяться,
и в результате создается иерархический набор иммунных сетей,
представляющих все более общие классы.
Альтернатива 2: изучение самоорганизации сети. Ясно,
что такой способ создания сети приводит к «топологически упо-
упорядоченной» сети. То есть если точки близки в сети, то они так-
также близки в пространстве решаемой задачи. Это свойство сети
позволяет построить более эффективные алгоритмы дополнения
и удаления узлов. Показано, что это справедливо для иммунной
сети, независимо от представляемых данных. Для дальнейших
исследований было бы полезным построить теоретическое обос-
обоснование такого свойства сети.
9.9. Заключение
Jisys как система машинного обучения (и, в частности, как
система обнаружения мошенничества с закладными) характери-
характеризуется следующими важными особенностями.
1. Явное выделение паттернов в данных. Например, это озна-
означает выделение доступных для анализа пользователем пат-
паттернов мошеннического поведения. Эти паттерны могут
быть основанием для изменений правил выдачи ссуд.
2. Возможность включения существующих доменов знаний
в процессы распознавания и обучения. Это может значи-
значительно улучшить процесс обучения.
3. Используемый подход не допускает пропуска сходных пат-
паттернов после выполнения процедуры обобщения.
4. Способность генерировать детекторы паттернов. Это позво-
позволяет системе автоматически анализировать новые заявки на
ссуды и определять, не являются ли они мошенническими.
Нам не известны другие искусственные иммунные системы с
таким набором возможностей. Эти возможности делают систему
Jisys уникальной и способной решать широкий спектр практиче-
практических задач.
Список литературы
1. Bersini Н., Varela F. Hints for adaptive problem solving gleaned from
immune networks // Proc. First Conf. on Parallel Problem Solving
from Nature, 1990. P. 343-354.
2. Bersini H. Immune network and adaptive control // Proc. First
European Conf. on Artificial Life (Eds. F. J. Varela and P. Bourgine).
MIT Press, 1991. P. 461-465.
Список литературы 215
3. Bersini Я., Varela F. The immune learning mechanisms: reinforce-
reinforcement, recruitment and their application / Computing with Biolog-
Biological Metaphors (Ed. R.Paton). London: Chapman and Hall, 1994.
P. 166-192.
4. Cooke D.E., Hunt I.E. Recognising promoter sequences using an
artificial immune system // Proc. Intelligent Systems in Molecular
Biology (ISMB'95). AAAI Press, 1995. P. 89-97.
5. Dilger W. Decentralized autonomous organization of the intelligent
home according to the principle of the immune system. IEEE SMC,
1997. P. 351-356.
6. Forrest S., Javornik В., Smith R.E., Perelson A.S. Using genetic
algorithms to explore pattern recognition in the immune system //
Evol. Сотр. 1993. V. 1. P. 191-211.
7. Gilbert C.J., Routen T.W. Associative memory in an immune-based
system // Proc. AAAI, 1994. V.2. P. 852-857.
8. Goldberg D. Genetic Algorithms in Search, Optimization and Ma-
Machine Learning. Addison Wesley, 1989.
9. Hoffmann G. W. A neural network model based on the analogy with
the immune system // J. Theor. Biol. 1986. V. 122. P. 33-67.
10. Hunt J.E., Cooke D.E., Holstein H. Case memory and retrieval
based on the immune system // Proc. First Int. Conference on Case
Based Reasoning (Eds. M.Weloso and A.Aamodt). Lecture Notes in
Artificial Intelligence, 1995. V. 1010. P. 205-216.
11. Hunt J.E., Cooke D.E. An adaptive, distributed learning system, based
on the immune system // Proc. IEEE Int. Conference on Systems,
Man and Cybernetics, 1995. P. 2494-2499.
12. Hunt J.E., Cooke D.E. Learning using an artificial immune system //
J. Netw. Сотр. Appl. (Special issue on Intelligent Systems: Design
and Application), 1996. V. 19. P. 189-212.
13. Hunt J.E., Fellows A. Introducing an immune response into a CBR
system for data mining // Research and Development in Expert
Systems XIII (Proc. BCS ESG'96 Conf.), 1996.
14. Kephart J.O., Sorkin G.B., Chess D.M., White S.R. Fighting com-
computer viruses // Sci. Am. 1997. P. 56-61.
15. Kolodner J.L. Case-Based Reasoning. Morgan Kaufmann, 1993.
16. Perelson A.S. Immune network theory // Immunol. Rev. 1989.
V. 110. P. 5-36.
Д-р Джон Хант — руководитель группы разработки программного обеспе-
обеспечения факультета вычислительной техники Валлийского университета (г. Абе-
Аберистуит, Великобритания). Его научные интересы связаны с разработкой имму-
носетевых программ визуализации повторного использования комплектующих
и диагностики программного обеспечения, а также применения искусственных
иммунных сетей в задачах классификации. Текущая работа Джона Ханта,
относящаяся к системе Isys, состоит в применении общих концепций систем
искусственного интеллекта, основанных на модельных представлениях об им-
иммунной системе, для визуализации повторно используемых компонент. Дирек-
Директор Европейской сети содействия промышленно-ориентированным системным
216 Гл. 9. Искусственная иммунная система Jisys
исследованиям на основе количественного и качественного моделирования
(MONET).
Д-р Марк Нил является преподавателем Валлийского университета в Абе-
Аберистуите, где он ранее защитил диссертацию в области комбинированной
традиционной и нейросетевой обработки данных. Участвовал в различных
исследовательских программах, связанных с применением методов искусствен-
искусственного интеллекта. Значительная часть его работ посвящена разработке методов
решения практических задач, включая многомерный анализ данных и управ-
управление роботами.
Джонатан Тиммис — штатный научный сотрудник Валлийского универ-
университета в Аберистуите. После окончания с отличием факультета вычислитель-
вычислительной техники начал работать над проектом Isys. Его научные интересы связаны
с применением модельных представлений об иммунной системе к проблеме ма-
машинного обучения, а также с развитием приложений искусственных иммунных
сетей для решения других сложных практических задач.
Глава 10
АЛГОРИТМ ДЕЦЕНТРАЛИЗОВАННОГО
ВЫБОРА ПОВЕДЕНИЯ ДЛЯ
АВТОНОМНЫХ МОБИЛЬНЫХ РОБОТОВ
С ИСПОЛЬЗОВАНИЕМ ИММУННОЙ СЕТИ
Юджи Ватанабе, Акио Ишигуро, Иошики Учикава
В последние годы большое внимание уделяется системам искусственно-
искусственного интеллекта, построенным на основе знаний о режиме работы системы,
которые уже доказали свою робастность и гибкость в условиях динамично
изменяющейся среды. Однако при таком подходе остаются нерешенными за-
задачи построения алгоритма принятия решений, осуществляющего непосред-
непосредственный выбор модуля компетентности, или поведенческих примитивов, а
также построения самих модулей компетентности. Один из подходов к реше-
решению этой задачи основан на использовании биологических принципов. В этой
главе мы остановимся на характеристике иммунной системы, поскольку ее
основная задача заключается в обеспечении целостности организма в условиях
враждебной среды (нет необходимости напоминать, что автономные мобиль-
мобильные роботы должны устойчиво функционировать в динамично изменяющейся
среде). Сначала на основе современных представлений о естественной иммун-
иммунной системе строится алгоритм децентрализованного выбора поведения. Затем
этот алгоритм применяется к задаче сбора мусора автономным мобильным
роботом. Для проверки эффективности предложенного алгоритма приводятся
результаты экспериментов с использованием реального робота. Изучаются два
типа механизмов адаптации для построения искусственной иммунной сети,
функционирующей без вмешательства человека.
10.1. Введение
В последние годы большое внимание уделяется системам
искусственного интеллекта (ИИ), построенным на основе знаний
о режиме работы системы (behavior-based artificial intelligence),
которые уже доказали свою робастность и гибкость в условиях
динамично изменяющейся среды. При таком подходе ожидает-
ожидается, что интеллектуальные свойства системы явятся результатом
взаимодействий как между различными модулями компетенции,
или поведенческими примитивами, так и всей системы с внешней
средой. Однако в этом случае остаются нерешенными задачи по-
218 Гл. 10. Алгоритм децентрализованного выбора поведения
строения алгоритма принятия решений, осуществляющего непо-
непосредственный выбор модуля компетентности, а также построения
самих модулей компетентности.
Недавно Брукс предложил решение первой из упомянутых
задач с использованием категориальной архитектуры (sub-
sumption architecture) [I, 2]. Несмотря на то, что его метод
оказался весьма робастным, необходимо отметить, что в такой
архитектуре готовые модули компетентности выбираются на ос-
основе фиксированных приоритетов. Однако было бы совершен-
совершенно естественно варьировать приоритеты выбора модулей компе-
компетентности в зависимости от ситуации. Мейс предложил другой
гибкий алгоритм, называемый поведенческой сетью (behavior
network system) [3, 4]. В этом случае агенты (модули компе-
компетентности) образуют сеть, основанную на причинно-следствен-
причинно-следственных взаимосвязях. Агент, подходящий для текущей ситуации и
заданных целей, выбирается в результате процесса распростране-
распространения активационного сигнала в сети. Однако этот алгоритм труд-
трудно использовать в задачах с плохо формализуемыми причинно-
следственными отношениями между агентами.
Одним из многообещающих альтернативных способов реше-
решения таких задач является использование биологических прин-
принципов. Мы подробно остановимся на характеристике иммунной
системы, поскольку ее основной задачей является самосохране-
самосохранение во враждебной среде. Иммунная система обладает рядом
свойств, таких как иммунная память, иммунологическая толе-
толерантность и распознавание образов, интересных с инженерной
точки зрения.
Проведенные недавно иммунологические исследования пока-
показали, что иммунная система не только обнаруживает и удаляет
из организма чужеродные субстанции, называемые антигенами,
такие как вирусы и раковые клетки, но и, прежде всего, участву-
участвует в процессах самоподдержания организма в условиях динамич-
динамично изменяющейся внешней среды путем взаимодействий меж-
между лимфоцитами и/или антителами. Следовательно, можно
ожидать, что иммунная система обладает методологией решения
динамических, а не статических задач в условиях неизвестного
и враждебного окружения.
На основе приведенных соображений мы попытались постро-
построить иммунные алгоритмы для робототехники [5-8]. Ожидает-
Ожидается, что путем имитации иммунной системы живых организмов
можно получить новые интеллектуальные методы и алгоритмы,
применимые в условиях динамично изменяющейся среды.
10.2. Естественная иммунная система 219
В этой главе особое внимание уделяется механизмам регуля-
регуляции иммунной системы и предложен алгоритм децентрализован-
децентрализованного выбора поведения для автономных мобильных роботов, ос-
основанный на архитектуре иммунной системы. Данный алгоритм
применяется для решения задачи сбора мусора автономным мо-
мобильным роботом. Для проверки эффективности предложенного
метода мы провели ряд экспериментов с использованием реаль-
реального робота (Khepera). Для автоматизации процесса построе-
построения соответствующих иммунных сетей мы попытались придать
предложенной нами искусственной иммунной сети способность к
адаптации, основываясь на механизмах корректировки (adjust-
(adjustment) и нововведений (innovation).
10.2. Естественная иммунная система
10.2.1. Общие представления. Основными компонентами
естественной иммунной системы являются макрофаги, антите-
антитела и лимфоциты. Лимфоциты подразделяют на две основные
группы: В- и Т-лимфоциты.
В-лимфоциты — это клетки, происходящие из костного
мозга. Согласно грубой оценке, в организме человека имеется
порядка 107 различных типов В-лимфоцитов, каждый из кото-
которых обладает уникальной структурой поверхностных рецепто-
рецепторов и продуцирует Y-образные антитела. Антитела распознают
конкретные антигены — чужеродные факторы, способные за-
заражать организм. В роли антигенов могут выступать вирусы,
раковые клетки и другие субстанции. Взаимодействия анти-
антиген-антитело часто сравнивают с отношением ключ - замочная
скважина. Для удобства дальнейшего изложения введем опреде-
определения некоторых иммунологических понятий. Участок антигена
(«ключ»), непосредственно распознаваемый антителом, имеет на-
название эпитопа (антигенной детерминанты), а участок антитела
(«замочная скважина»), распознающего антигенную детерминан-
детерминанту, называют паратопом (рис. 10.1).
Т-лимфоциты — это клетки, созревающие в тимусе. Они
предназначены для уничтожения зараженных клеток и регуля-
регуляции выработки антител В-лимфоцитами и могут рассматриваться
как внешний круг обсуждаемой далее сети В-лимфоцитов (идио-
типической сети).
10.2.2. Сетевая гипотеза Ерне. Недавние исследования
позволили установить, что каждый тип антител обладает набо-
набором специфических антигенных детерминант, называемых идио-
220 Гл. 10. Алгоритм децентрализованного выбора поведения
топами. Используя этот факт, Ерне предложил знаменитую
гипотезу идиотипической (иммунной) сети [9-13]. Гипотеза
состоит в том, что антитела и лимфоциты разной специфичности
функционально не изолированы и вступают во взаимодействия
между собой. Эта идея проиллюстрирована на рис. 10.1.
Эпитоп
Паратоп
ИД2
П2
Антитело 2
Стимуляция
Антитело 3 Супрессия
Рис. 10.1. Гипотеза Ерне идиотипической сети
На рис. 10.1 показано, что идиотопы антител типа 1 (Idl)
стимулируют В-лимфоциты типа 2 и прикрепляются к ним путем
взаимодействий с паратопами антител 2 типа, находящихся на их
поверхности. С точки зрения антител типа 2, Idl действует как
антиген. В результате, антитела типа 2 подавляют В-лимфоциты
и антитела типа 1.
В то же время, идиотопы антител типа 3 (ИЗ) стимулируют
антитела типа 1, поскольку с точки зрения таких антител ИЗ
действуют как антиген. В результате, цепочки стимуляции и
супрессии антител образуют крупномасштабную сеть и взаимо-
взаимодействуют по принципу распознавания своего и чужого. Мы по-
полагаем, что данный механизм регуляции может служить основой
нового алгоритма децентрализованной обработки данных.
10.2.3. Метадинамика. В естественной иммунной системе
структура сети не фиксирована и подвержена постоянным изме-
изменениям. Она гибко самоорганизуется в соответствии с изменени-
10.2. Естественная иммунная система
221
ями внешней среды. Эта замечательная способность иммунной
сети, называемая метадинамикой [14-16], реализуется главным
образом путем встраивания в нее новых и удаления ненужных
клеток. На рис. 10.2 показана схема этого процесса.
Костный мозг
[ Удаление
Естественная
гибель
Квазивиды
Антитело (Агент)
Размножение
Рис. 10.2. Метадинамическая функция
Новые клетки образуются как в результате рекомбинации
генов в костном мозге, так и в процессе мутаций активированных
клеток при их размножении (мутантные клетки имеют название
квазивидов (quasi-species)). Несмотря на то, что ежедневно об-
образуется множество лимфоцитов, большинство из них не участ-
участвует в сетевых взаимодействиях и при отсутствии стимуляции
вскоре погибает. Благодаря этим значительным потерям и обес-
обеспечивается функция метадинамики, что дает возможность им-
иммунной системе поддерживать клеточный репертуар, адекватный
изменениям внешней антигенной среды. Можно ожидать, что ме-
метадинамическая функция системы иммунитета явится источни-
источником новых инженерно-технических решений и соответствующих
алгоритмов.
Прежде чем новые Т-лимфоциты, образующиеся в результате
рекомбинации генов, получат доступ к остальным органам и
тканям организма, они подвергаются отбору в тимусе. В ходе
отбора свыше 95% Т-лимфоцитов уничтожаются в результате
апоптоза. Удаляются те клетки, которые слишком сильно реаги-
реагируют на собственные антигены либо не взаимодействуют с ними
вовсе.
Другими словами, механизм отбора увеличивает способность
иммунной системы к эффективному встраиванию новых типов
клеток.
222
Гл. 10. Алгоритм децентрализованного выбора поведения
10.3. Иммунный алгоритм выбора поведения
10.3.1. Алгоритм выбора поведения и иммунная сеть.
Выше уже отмечалось, что в системах искусственного интеллек-
интеллекта, построенных на основе знаний о режиме работы системы,
необходимо решать задачу построения алгоритма принятия ре-
решений на основе выбора модулей компетентности. Рассмотрим
способ решения этой задачи с использованием иммунологическо-
иммунологического подхода. Более конкретно, мы будем использовать для этого
архитектуру иммунной сети. На рис. 10.3 схематически показаны
два объекта: система выбора поведения для автономного мобиль-
мобильного робота и архитектура иммунной сети.
Динамически меняющаяся
f cPfда \ Мобильный
робот
\<1 ~"\ Система контроля
^ Си; / поведения
^ш О
Помеха
\ I к;, твое
состояние
Модуль компетентности -
(Поведенческий примитив)
Выбор действия -
Антигены
Стимуляция
Супрессия
Антитело
Иммунная сеть
б
Рис. 10.3. Основная схема предложенного метода: а — автономный мобильный
робот с механизмом выбора поведения; б — архитектура иммунной сети
Из рис. 10.3 видно, что между этими двумя системами име-
имеется ряд аналогий. Текущие ситуации (например направление
и расстояние до препятствия), которые оцениваются установ-
установленными сенсорами, можно интерпретировать как совокупность
10.3. Иммунный алгоритм выбора поведения
223
антигенов, а генерируемые модули компетентности (т. е. пове-
поведенческие примитивы) можно рассматривать как антитела (или
В-лимфоциты), в то время как взаимодействия между моду-
модулями интерпретируются как стимуляция и супрессия антител.
Основная концепция нашего подхода заключается в том, что
автономный мобильный робот, снабженный иммунной сетью, от-
отбирает соответствующие текущей ситуации (антигенам) модули
компетентности (антитела) по принципу «снизу-вверх».
10.3.2. Формулировка задачи. Для простоты последую-
последующего объяснения сформулируем вначале задачу автономного
мобильного робота со встроенным иммуносетевым алгоритмом
принятия решений (для удобства мы называем наш робот имму-
ноидом).
Для реальной автономности робот должен не только уметь
выполнять поставленную задачу, но и быть при этом самодоста-
самодостаточным [17, 18]. Руководствуясь идеями, изложенными в цити-
цитированных работах, мы трансформировали задачу сбора мусора
с учетом концепции самодостаточности. На рис. 10.4 показана
проблемная среда. Она представляет собой окруженную стеной
Мусор
Дальняя
зона
^Контейнер для Зарядное устройств
сбора мусора —
Уровень зарядки
Рис. 10.4. Проблемная среда
замкнутую площадку, на которой находится несколько контей-
контейнеров с мусором. Мусор необходимо собрать и доставить на
базу, где находятся корзина для сбора мусора и электрическое
зарядное устройство. При передвижении иммуноид потребляет
энергию, и заряд его батареи расходуется. Это напоминает про-
процесс метаболизма в биологических системах. Задача иммуноида
заключается в том, чтобы собрать мусор в корзину, не разрядив
при этом полностью батарею.
224 Гл. 10. Алгоритм децентрализованного выбора поведения
Будем считать, что иммуноид имеет некоторый наперед за-
заданный начальный уровень энергии, а один из его внутрен-
внутренних сенсоров отслеживает текущий уровень зарядки батареи.
В целях количественного описания мы используем следующие
предположения.
• На каждом временном шаге иммуноид потребляет Еш еди-
единиц энергии.
• В случае переноса мусора на каждом шаге расходуется
дополнительно Е'ш единиц энергии.
• В случае столкновения со стеной или контейнером теряется
количество энергии Ес.
• По прибытии на базу заряд батареи иммуноида мгновенно
пополняется до максимального уровня.
• Во избежание перегрузки батареи, при высоком уровне
зарядки робот не должен возвращаться на базу.
На основе этих предположений текущий уровень энергии можно
вычислить по формуле
E(t) = E(t -\)-Еш- кхЕ'ш - к2Ес, A0.1)
1, если в захватном устройстве находится мусор
0 иначе
1 при столкновении со стеной или контейнером
0 иначе,
где E(t) — количество энергии в момент t. Поясним на конкрет-
конкретном примере, почему данная задача может быть интерпретирова-
интерпретирована как проблема выбора поведения.
Предположим, что иммуноид находится на большом расстоя-
расстоянии от базы и имеет низкий уровень зарядки батареи. В этой си-
ситуации, если иммуноид несет мусор, то согласно формуле A0.1)
на каждом шаге времени он будет дополнительно расходовать
Е'ш единиц энергии. Поэтому иммуноид должен вернуться на
базу для восполнения заряда батареи. Другими словами, приори-
приоритет действия возвращаться на базу в этом случае должен быть
выше приоритета действия собирать мусор. В случае же если
иммуноид находится рядом с базой, то более высокий приоритет
должно иметь действие собирать мусор.
Из приведенного примера ясно, что иммуноид обязан выби-
выбирать соответствующий модуль компетентности, гибко варьируя
приоритеты выбора в соответствии с внутренним состоянием и
внешней ситуацией.
10.3. Иммунный алгоритм выбора поведения
225
10.3.3. Описание антигенов и антител. Состояние робота
и внешняя среда, а также поведенческие примитивы функциони-
функционируют как антигены и антитела соответственно. Антигены дают
информацию о наличии мусора (направление), стен (направле-
(направление) и базы (направление и расстояние), а также об уровне
зарядки батареи. Для простоты выделим следующие характери-
характеристики направления, расстояния и запаса энергии:
• направление — вперед, назад, влево, вправо;
• расстояние — большое, среднее, малое;
• запас энергии — высокий, низкий.
Для описания механизма выбора иммуноидом подходящих
антител против конкретного антигена дадим определение и опи-
опишем строение антител. При этом необходимо помнить, что им-
иммунный механизм выбора поведения должен выбирать антитела
по восходящему алгоритму посредством взаимодействий между
антителами.
Как отмечалось в предыдущем параграфе, уникальность ан-
антител определяется структурой (например формой молекул) их
паратопов и идиотопов. Рис. 10.5 иллюстрирует предлагаемое на-
нами определение антител. Паратопом мы называем совокупность
Структура антитела
Паратоп
Идиотоп
Предусловие
Поведение
Порядковые номера
антител и уровни их стимуляции
¦ Предусловие -
G: Мусор
(F: спереди, R: справа, L: слева, N: нет,
Н: в захватном устройстве)
W: стена
(F: спереди, R: справа, L: слева, N: пет)
НЬ: База
(F: спереди, R: справа, L: слева, N: нет,
Nr: близко, Md: недалеко, Fr: далеко)
Eg: уровень зарядки батарей
(Hi: высокий, Lo: низкий)
Поведение —
F: Двигаться прямо
R: Повернуть направо
L: Повернуть налево
Sh: Поиск базы
С: Взять мусор
Е: Анализировать
Рис. 10.5. Описание антител
предусловия и поведения, а к идиотопу относим порядковый
номер стимулирующего антитела и уровень стимуляции. Струк-
Структура предусловия та же, что и у описанного выше антитела.
Иммуноид, решающий задачу сбора мусора, имеет следующие
варианты выбора поведения: двигаться прямо, повернуть на-
направо, повернуть налево, исследовать, взять мусор, а также
поиск базы.
Д. Дасгупта
226
Гл. 10. Алгоритм децентрализованного выбора поведения
Для выбора антитела необходимо иметь количественный по-
показатель полезности антител при данных условиях. Припишем
каждому антителу переменную состояния, называемую концен-
концентрацией антител (это обсуждается далее в разделе 10.3.5).
10.3.4. Взаимодействие между антителами. Опишем по-
подробно процесс взаимодействия антител — основной принцип
функционирования нашей иммунной сети. Для простоты пред-
предположим, что иммуноид столкнулся с ситуацией, показанной на
рис. 10.6. В этом случае имеется три антигена.
Мусор
Уровень
зарядки
Антиген 1
База справа
Антиген 2
Мусор спереди
База
Антиген 3
Иммуноид
Антитело 1
Низкий уровень зарядки
Антитело 2
База
справа
Повернуть
направо
4
( Антитело 3
Низкий
уровень
зарядки
Поиск
базы
1
Мусор
спереди
Взять
3
1 Антитело 4
Высокий
уровень
зарядки
Двигаться
прямо
2
Стимуляция
Супрессия
Рис. 10.6. Пример сети взаимодействующих антител
Предположим, что для ответа на антигены заранее приготов-
приготовлены 4 типа антител. Например, наличие антител 1 типа означа-
означает, что если иммуноид обнаружит базу справа, то такое антитело
активируется, что может привести к выбору действия повернуть
направо. Однако если текущий запас энергии высокий, то данное
антитело активирует другие антитела, взаимодействующие с его
идиотопом (в нашем случае антитела 4 типа), которые предохра-
предохраняют батареи от перегрузки.
Допустим, что робот имеет достаточный запас энергии.
В этом случае антигенами стимулируются антитела 1, 2 и 4
типов, и концентрация их увеличивается. Однако в результате
взаимодействий паратопов и идиотопов, показанных стрелками,
концентрация антител может быть разной. На рис. 10.6 видно,
10.3. Иммунный алгоритм выбора поведения 227
что в результате наиболее высокая концентрация будет у антител
2 типа, что приведет к их отбору. Это означает, что иммуноид
примет решение взять мусор.
Если запас энергии у иммуноида недостаточно высокий, то
тенденцию быть отобранным имеет антитело 1 типа. Это означа-
означает, что робот игнорирует мусор и будет стремиться восполнить
заряд батареи. Из данного примера следует, что взаимодействия
между антителами служат механизмом регулирования приоритетов.
10.3.5. Динамика. Динамика антител г-го типа, обозначае-
обозначаемых di, определяется следующим образом:
dA [ N N
A0.2)
_ A0.3)
где N — количество антител, rriji — аффинность антител j-ro и
г-го типов (то есть степень подобия), rrii — аффинность антител
г-го типа и обнаруженного антигена. Первое и второе слагаемые
в правой части A0.2) соответствуют стимуляции и супрессии,
соответственно, со стороны других антител. Третье слагаемое
описывает стимуляцию антигеном, а четвертое слагаемое — есте-
естественную гибель антител. Формула A0.3) представляет собой
функцию сплющивания, которая используется для обеспечения
устойчивости концентрации антител. Выбор антител осуществ-
осуществляется на случайной основе с вероятностью, пропорциональной
концентрации антител. Отметим, что в результате активации
отбирается лишь один тип антител и реализуется одно соответ-
соответствующее данному типу антител действие.
10.3.6. Результаты экспериментов. Для проверки осуще-
осуществимости предложенного алгоритма мы провели ряд экспери-
экспериментов с использованием в качестве иммуноида реального робо-
робота Khepera, который широко используется в экспериментальных
исследованиях. Робот имеет захватное устройство для мусора и
снабжен восемью инфракрасными датчиками расстояния, восе-
восемью фотосенсорами и цветной телекамерой на ПЗС 0. Каждый
инфракрасный датчик ведет поиск контейнера для мусора или
стены в соответствующем направлении. Фотосенсоры опреде-
определяют направление на электрическую лампочку (т.е. на базу).
Камера на ПЗС определяет цвет площадки в данном положении
ПЗС — прибор с зарядовой связью. — Прим. перев.
228
Гл. 10. Алгоритм децентрализованного выбора поведения
робота — красный (дальняя зона), зеленый (средняя зона) или
синий (ближняя зона), —что дает информацию иммуноиду о те-
текущем расстоянии до базы (см. рис. 10.7).
Цветная телекамера
наПЗС
Рис. 10.7. Экспериментальная система: а — иммуноид; б —экспериментальная
среда
10.3. Иммунный алгоритм выбора поведения
229
На начальном этапе исследования мы подготовили 24 антите-
антитела с заранее известными паратопами и идиотопами. На рис. 10.8
представлена структура иммунной сети, задаваемой такими ан-
антителами. Уровни стимуляции (аффинности) идиотопов не пока-
показаны ввиду недостаточности места на рисунке.
19
G.N Е
IF
к 23
от-1144
от 11-14
от 1549
23
Eg.Lo
Sh
JlTi-5,
15-19
Eg.Hi
:6-14
от 15-19 l
¦ Hb.Nr
W.F
R
Л
7 /
W.F
I/
A
./ /
W.R
L/
W.L
R
10
W.N
E
1
к 11-18, 23
Hb.Fr
E
|Hb.Md E
к 10, 1549
к 10-19
, к 1044
Рис. 10.8. Структура иммунной сети
Вначале мы снабжаем иммуноид максимальным количеством
энергии A000 единиц). Считаем, что Ет = 1, Е'т = 3, Ес = 5.
Типичный результат, получаемый в эксперименте, выглядит сле-
следующим образом: пока уровень энергии достаточно высок, им-
иммуноид собирает мусор и доставляет его на базу. По мере умень-
230 Гл. 10. Алгоритм децентрализованного выбора поведения
шения количества энергии иммуноид стремится отбирать анти-
антитела, соответствующие возвращению на базу и/или поиску базы.
После возвращения на базу робот вновь приступает к решению
основной задачи.
Для оценки возможностей предложенного алгоритма приня-
принятия решений мы провели простой эксперимент, варьируя на-
начальный уровень зарядки батареи. На рис. 10.9 а, б показаны
Бала
Л
Ближняя
зона
Средняя
зона
Дальняя Робот-
зона
База
Ближняя
зона
Средняя
зона
Робот
Дальним
зона
Рис. 10.9. Траектории движения иммуноида: а — начальный уровень энергии
1000 единиц; б —начальный уровень энергии 300 единиц
10.4. Механизмы адаптации 231
траектории движения иммуноида с начальным уровнем энергии
1000 (максимум) и 300 единиц соответственно. В случае (а)
робот забирает мусор В и успешно добирается до базы. В случае
(б) из-за критически низкого уровня зарядки батареи иммуноид
игнорирует мусор В и забирает мусор А.
Несмотря на простоту экспериментов, из рис. 10.9 следует,
что иммуноид выбирает антитела, исходя из внутреннего состо-
состояния и внешней ситуации, гибко меняя приоритеты выбора.
10.4. Механизмы адаптации
10.4.1. Классификация механизмов адаптации. В преды-
предыдущем разделе структура антител и архитектура иммунной сети
задавались вручную. Однако с увеличением количества антител
такой подход приводит к неудаче, поэтому необходимо введение
механизмов адаптации. Обычно выделяют два типа механизмов
адаптации: корректировки и нововведений [19, 20]. Коррек-
Корректировку можно рассматривать как адаптацию путем изменения
параметров системы (примером служит модификация весовых
коэффициентов синапсов в нейронных сетях), а нововведение —
как адаптацию в результате действия механизмов отбора. Далее
предложены два типа механизмов адаптации, основанных на
корректировке и нововведении, для построения иммунной сети
без вмешательства человека.
10.4.2. Механизм корректировки. Для выбора подходя-
подходящего решения необходимо для каждого идиотопа определить
порядковый номер стимулируемого антитела и уровень стиму-
стимуляции rriij. Для этого нами предложен алгоритм оперативной
корректировки, в котором идиотопы антител вначале не заданы
и затем определяются в процессе обучения с подкреплением.
Предположим, что иммуноид имеет дело с антигеном 1 и 2
(рис. 10.10). В этом случае одновременно стимулируются антите-
антитела 1 и 2 (соответственно Ат1 и Ат2). В результате концентрация
таких антител увеличивается. Однако, так как сравнительные
приоритеты антител 1 и 2 неизвестны (вначале идиотопы не
определены, и цепочки стимуляции и супрессии отсутствуют), то
в этом случае каждое из них может быть отобрано на случайной
основе.
Предположим теперь, что иммуноид случайно выбирает Ат1
и получает положительное подкрепление. Для формирования
тенденции к выбору Ат1 при наличии тех же самых или подоб-
подобных антигенов (ситуаций) мы записываем порядковый номер Ат1
(т.е. 1) в идиотоп Ат2 и увеличиваем уровень стимуляции rri2\.
232
Гл. 10. Алгоритм децентрализованного выбора поведения
В нашей работе уровни стимуляции изменяются следующим
образом:
rriAb\ , грАЬ^
(Ю.4)
гп2\ =
A0.5)
Ab2
где
и T^bx — суммарное количество поощрительных и
АЬх
штрафных сигналов при выборе антитела Ат1. Величина ТЛЬ
обозначает количество случаев одновременной активации анти-
антигенами специфических антител типа 1 и 2. Отметим, что данная
Паратоп
Идиотоп
Ат1
Ат2
Отобрано антитело 1 (Ат1)
|
Идиотоп изначально
не определен
а) Получен поощрительный
сигнал
б) Получен штрафной
сигнал
Ат1
Ат2
Ослабление
Усиление
1
т21
Ат1
Ат2
2
т12
Усиление
Ослабление
Рис. 10.10. Предложенный механизм регуляции
процедура приводит к увеличению относительного приоритета
Ат1 над Ат2. В случае, если иммуноид получает штрафной сиг-
сигнал, мы записываем порядковый номер антитела 2 типа (т. е. 2)
в идиотоп Ат1 и аналогичным образом изменяем тп\2- Это при-
приводит у уменьшению относительного приоритета Ат1.
Для проверки валидности предложенного механизма коррек-
корректировки мы провели ряд экспериментов. Использовались следую-
следующие поощрительные и штрафные сигналы.
Поощрение:
• иммуноид перезаряжается при низком уровне энергии;
• иммуноид забирает мусор при высоком уровне энергии.
10.4. Механизмы адаптации
233
Штраф:
• иммуноид забирает мусор при низком уровне энергии;
• иммуноид сталкивается с контейнером для мусора или сте-
стеной.
На рис. 10.11 показана эволюция времени жизни и доли
успешных попыток сбора мусора в зависимости от номера цикла
обучения. Видно, что обе величины постепенно растут.
400i
к
I зооН
CD
Он
100-
0
1 ё
i йодо-
I
о
0 100 200 300 400
Цикл обучения
0 100 200 300 400
Цикл обучения
Рис. 10.11. Эволюция времени жизни и доли успешных попыток
, Уровень зарядки —Л ^ Поиск базы -
Eg, Lo
Sh
1 Eg, Hi F
Расстояние
Hb, Nr E
Hb,Md E
Hb, Fr E
Захватное устройство
G,H Sh
Рис. 10.12. Пример иммунной сети, построенной в результате процесса обучения
На рис. 10.12 показан пример иммунной сети, полученной
в результате процесса обучения. Для простоты здесь показаны
234 Гл. 10. Алгоритм децентрализованного выбора поведения
лишь связи с высокой аффинностью (т^- > 0,6). Из приведен-
приведенного рисунка следует, что в случае низкого заряда батареи им-
иммунная сеть заставляет иммуноид вести поиск базы, а в случае
высокого уровня энергии иммуноид стремится проводить сбор
мусора. Несмотря на отсутствие явных подкрепляющих сигналов
в отношении расстояния до базы, иммуноид стремится искать
базу в случае, если это расстояние велико. Если робот находится
вблизи базы, то он стремится выбрать действие собирать мусор.
В настоящее время проводится встраивание данного механизма
в реальную экспериментальную систему.
10.4.3. Механизм нововведений. В рассмотренном выше
механизме адаптации мы описывали паратоп каждого антитела
по принципу «сверху-вниз». Очевидный способ преодолеть эту
трудность заключается в использовании механизма нововведе-
нововведений. В п. 10.2.3 отмечалось, что таким механизмом является
метадинамическая функция естественной иммунной системы.
На рис. 10.13 показана схема предлагаемого механизма ново-
нововведений. Вначале иммунная сеть состоит из N антител, каж-
каждое из которых образуется в результате процесса рекомбинации
генов и имеет одну переменную состояния, называемую кон-
концентрацией В-лимфоцитов. Для соотнесения этой переменной
с процессом выбора действия уравнение A0.2) видоизменено
следующим образом:
dA ( N N
{ j = l k=\ )
A0.6)
где bi(T) — концентрация В-лимфоцитов г-го типа в Т-й период
времени. Если в результате действия антитело получает подкреп-
подкрепляющий сигнал, то соответствующая концентрация В-лимфоци-
В-лимфоцитов меняется: ( ,
™P A0.7)
где гi = 1, если антитело г отбирается и получает подкрепляю-
подкрепляющий сигнал, Г{ = — 1, если антитело г получает штрафной сигнал,
и п = 0, если антитело г не отбирается. К — это параметр
диссипации (естественной гибели) В-лимфоцитов. Если величи-
величина bi(T) становится меньше 0, то соответствующее антитело
удаляется и под действием механизма отбора в иммунную сеть
встраивается новое антитело.
Для повышения эффективности отбора моделируется функ-
функция тимуса. Сначала на случайной основе в процессе реком-
10.4. Механизмы адаптации
235
бинации генов образуется т кандидатов в антитела. Затем вы-
вычисляются параметры чувствительности gi и Si между каждым
Генерация т новых антител на случайной основе
Ab\ Aiy{ AtS{
^^^^—^^^^— Механизм отбора ^^^^^^^^^^^^
1 Вычисление параметров чувствительности ст/ и 8г\
» Выбор по различным критериям единственного антитела и его внедрение
1 Ч
ц
- Существующие иммунные сети (N антител)-
Внедрение
h = Ъш
Распознавание Действие Оценка
Удаление
Среда
Рис. 10.13. Предлагаемый механизм нововведений
новым антителом и существующей иммунной сетью, которые
задаются в виде
N
N
A0.8)
A0.9)
Антитела взаимодействуют между собой по принципу сти-
стимуляции или супрессии. Параметры чувствительности ai и Si
представляют собой, соответственно, сумму стимулирующих и
супрессирующих сигналов со стороны иммунной сети. В конеч-
конечном итоге, на основе некоторого заранее выбранного критерия
236
Гл. 10. Алгоритм децентрализованного выбора поведения
в иммунную сеть встраивается только одно антитело. В работе
использовались два различных критерия: тахсг^ и тах|<Тг — д{\.
Возможности данного подхода проиллюстрированы на про-
простом примере — задаче обхода препятствий. Проблемная среда
включает в себя иммуноид, множество препятствий и зарядную
станцию. Цель иммуноида заключается в том, чтобы регулярно
посещать станцию для зарядки батареи, избегая столкновения
с препятствиями. В эксперименте использовались следующие
поощрительные и штрафные сигналы.
Поощрение:
• при низком уровне зарядки батареи иммуноид движется по
направлению к базе;
• иммуноид движется по прямой линии без столкновений.
Штраф:
• иммуноид сталкивается с препятствием или стеной.
• при отсутствии препятствий иммуноид меняет направление
движения.
Предполагаем, что количество антител N равно 50, а коли-
количество кандидатов в новые антитела т равно 20. На рис. 10.14
900
800
700
600
500
400
300
200
100
о
к
д/ИП\
W
- —
т
L
б
200 400 600 800 1000
Попытка
200 400 600 800 1000
Попытка
900-
800-
700-
600-
500-
400-
300-
200-
100-
0
¦ Результирующее время
жизни
¦ Количество движений в
разных направлениях
¦ Количество столкновений
0
200 400 600 800 1000
Попытка
Рис. 10.14. Результаты экспериментов для трех различных вариантов отбора:
а — без механизма отбора; б —с отбором (maxs); в —с отбором (max|s — d\)
Список литературы 237
показана эволюция времени жизни, а также количества прямо-
прямолинейных движений и столкновений для трех экспериментов.
В случае (а) механизм отбора не используется, и в систе-
систему встраивается произвольно выбранное антитело. В случаях
(б) и (в) используется механизм отбора по критерию тахо^ и
тах|сг^ - Si\ соответственно.
Видно, что наличие механизма отбора (в особенности по
критерию max|<T^ — Si\) позволяет улучшить адаптационные воз-
возможности системы. В настоящее время этот результат подробно
анализируется.
10.5. Выводы и перспективы
В этой главе рассмотрен новый алгоритм децентрализованно-
децентрализованного выбора поведения, основанный на представлениях о функцио-
функционировании естественной иммунной системы, и показаны возмож-
возможности его использования на примере нескольких экспериментов.
Предложены два варианта механизма адаптации на основе
обучения с подкреплением.
В связи с тем что искусственные системы имеют тенденцию
к увеличению сложности, обязательным условием для их реали-
реализации является соблюдение принципов самоподдержания и са-
самосохранения. Поэтому мы считаем, что естественная иммунная
система, наделенная указанными свойствами, может служить
источником новых идей о принципах устойчивого функциони-
функционирования искусственных систем во враждебной среде в режиме
реального времени.
Работа частично поддержана грантом на поддержку при-
приоритетных направлений научных исследований Министерства
образования, науки, спорта и культуры Японии (№07243208,
08233208) и Фондом мехатронной техники.
Список литературы
1. Brooks R. A robust layered control system for a mobile robot // IEEE
Journal R&A. 1986. V.2, № 1. P. 14-23.
2. Brooks R. Intelligence without reason // Proc. IJCAI'91, 1991.
P. 569-595.
3. Maes P. The dynamic action selection // Proc. IJCAI'89, 1989.
P. 991-997.
4. Maes P. Situated agent can have goals // Designing autonomous
agents. MIT Press, 1991. P. 49-70.
5. Ishiguro A, Ichikawa S., Uchikawa Y. A gait acquisition of 6-legged
walking robot using immune networks // J. Robotics Soc. Japan.
238 Гл. 10. Алгоритм децентрализованного выбора поведения
1995. V. 13, №3. Р. 125-128 (in Japanese); см. также Proc. IROS'94,
1994. V.2. Р. 1034-1041.
6. Ishiguro Л, Watanabe Y., Uchikawa Y. An immunological ap-
approach to dynamic behavior control for autonomous mobile robots //
Proc. IROS'95, 1995. V. 1. P. 495-500.
7. Ishiguro A., Kondo Т., Watanabe Y., Uchikawa Y. Dynamic behavior
arbitration of autonomous mobile robots using immune networks //
Proc. ICEC'95, 1995. V.2. P. 722-727.
8. Ishiguro A., Kondo Т., Watanabe Y., Uchikawa Y. Immunoid: An
immunological approach to decentralized behavior arbitration of au-
autonomous mobile robots // Lect. Notes Сотр. Sci., 1994. V. 1141.
P. 666-675.
9. Jerne N. K. The immune system // Sci. Am. 1973. V. 229, № 1. P. 52-
60.
10. Jerne N. K. The generative grammar of the immune system // EMBO
J. 1985. V.4, №4. P. 847-852.
11. Jerne N. K. Idiotypic networks and other preconceived ideas // Im-
Immunol. Rev. 1984. V. 79. P. 5-24.
12. Fujita H., Aihara K. A distributed surveillance and protection sys-
system in living organisms // Trans. IEE Japan. 1987. V. 107C, №11.
P. 1042-1048 (in Japanese).
13. Farmer J.D., Packard N.H., Perelson A. S. The immune system,
adaptation, and machine learning // Physica D. 1986. V. 22. P. 187—
204.
14. Varela F.J., Coutinho A., Dupire В., Vaz N. N. Cognitive networks:
Immune, neural, and otherwise. In: Theoretical Immunology, V. 2.
1989. P. 359-375.
15. Stewart J. The immune system: Emergent self-assertion in an au-
autonomous network // Proc. ECAL-93, 1993. P. 1012-1018.
16. Bersini H., Varela F.J. The immune learning mechanisms: Rein-
Reinforcement, recruitment and their applications // Computing with
biological metaphors / Ed. by R.Paton. Chapman and Hall, 1994.
P. 166-192.
17. Pfeifer R. The fungus eater approach to emotion: A view from
artificial intelligence. Technical Report, AI Lab, 1995, №IFIAI95.04.
Computer Science Department, University of Zurich.
18. Lambrinos D., Scheier С Extended Braltenberg architecture. Techni-
Technical Report, AI Lab, 1995, №IFIAI95.10. Computer Science Depart-
Department, University of Zurich.
19. Manderick B. The importance of selectionist systems for cognition //
Computing with biological metaphors / Ed. by R. Paton. Chapman
and Hall, 1994.
20. Farmer J. D., Kauffman S. A, Packard N. H., Perelson A. S. Adaptive
dynamic networks as models for the immune system and autocat-
alytic sets. Technical Report LA-UR-86-3287. Los Alamos, NM: Los
Alamos National Laboratory, 1986.
Список литературы 239
М-р Юджи Ватанабе родился в г. Гифу (Япония) в 1972 г. Получил сте-
степени бакалавра A994) и магистра A996) в области электронно-механического
машиностроения в университете г. Нагойя, Япония. С 1996 г. является соиска-
соискателем степени доктора философии на факультете информатики и электроники
университета г. Нагойя. Область его научных интересов включает проектирова-
проектирование искусственных иммунных систем и применение их в задачах робототехни-
робототехники. Член Японского общества по робототехнике, а также Японского общества
инженеров по управлению и контролю.
Д-р Акио Ишигуро родился в г. Коши (Япония) в 1964 г. Получил степени
бакалавра, магистра и доктора философии в области электронно-механического
машиностроения в университете г. Нагойя, Япония, в 1987, 1989 и 1991г.
соответственно. Там же работал с 1991 по 1993 гг., затем до 1997 г. был
доцентом факультета информатики и электроники. В настоящее время —
адъюнкт-профессор факультета вычислительных систем и технологий того же
университета. Его научные интересы включают эмерджентные вычисления, ро-
робототехнику, биологические системы обработки информации и искусственную
жизнь. Член Японского общества по робототехнике, Японского общества ин-
инженеров по управлению и контролю, а также Японского института инженеров
по электротехнике.
Д-р Иошики Учикава родился в г. Аиши (Япония) в 1941г. Получил
степени бакалавра, магистра и доктора философии в области электротехники
в университете г. Нагойя, Япония, в 1964, 1966 и 1971 г. соответственно.
С 1969 по 1984 г. работал в качестве доцента на факультете электротехники,
с 1985 по 1993 г. — на факультете электронно-механического машиностроения.
С 1994 по 1996 г. — профессор факультета информатики и электроники, а
с 1997 г. — профессор факультета вычислительных систем и технологий. Сфе-
Сфера его научных интересов включает электронную механику и микроскопию,
моделирование нечетких и нейронных систем. Является членом Японского
института инженеров по электротехнике, Японского общества инженеров по
управлению и контролю, Японского общества по робототехнике, Японского
общества электронной микроскопии, Японского общества прикладной физи-
физики, Японского общества прикладного электромагнетизма, Японского общества
точного машиностроения, а также Института инженеров по электротехнике и
электронике.
Глава 11
ИММУННЫЙ АЛГОРИТМ ПАРАЛЛЕЛЬНОГО
ПОИСКА ДЛЯ ОПТИМИЗАЦИИ
МУЛЬТИМОДАЛЬНЫХ ФУНКЦИЙ
Тойо Фу куда, Казуюки Мори, Макото Цукияма
Иммунная система высших млекопитающих обладает рядом интересных
свойств и возможностей обработки информации, включая способность к распо-
распознаванию антигенов, выработке антител и обучению на основе клеток памяти.
В этой главе предложен метод решения задачи оптимизации мультимодальных
функций, основанный на имитации свойств иммунной системы с использова-
использованием генетического алгоритма. Показано, что метод эффективен для нахожде-
нахождения как глобальных, так и локальных решений. Приведены примеры работы
алгоритма для двух мультимодальных функций: функции со множеством экс-
экстремумов и функции Шуберта.
11.1. Введение
Естественная иммунная система имеет уникальную способ-
способность вырабатывать новые типы антител и отбирать наиболее
подходящие из них для взаимодействия с попавшими в орга-
организм антигенами. Методом проб и ошибок иммунная система
вырабатывает огромное количество антител против бесчисленно-
бесчисленного множества неизвестных антигенов. Важной характеристикой
процесса адаптации системы иммунитета при ее взаимодействии
с поступающими из внешней среды вирусами и бактериями явля-
является обеспечение разнообразия типов антител. С математической
точки зрения поддержание разнообразия в иммунной системе
можно трактовать как задачу оптимизации мультимодальной
функции, имеющую кратное (не единственное) решение. Пред-
Предлагаемый алгоритм обеспечивает возможность одновременного
хранения нескольких векторов поиска для нахождения кратных
решений. Для этого вводится индекс разнообразия, а вектор
приближений сохраняется, аналогично механизму поддержания
клеток памяти в иммунной системе. Антиген можно рассматри-
//./. Введение
241
вать как задачу, которую необходимо решить, а антитело — как
вектор, наилучшим образом соответствующий ее решению.
Многие инженерные проблемы можно переформулировать в
виде задач оптимизации некоторых целевых функций. При этом
в большинстве случаев целевые функции оказываются мульти-
модальными. Традиционными методами такие задачи решаются
плохо. Поэтому в реальных приложениях часто бывает необ-
необходимо использовать методы, в которых рассматривается сразу
несколько возможных вариантов решения.
В процессе эволюции иммунная система высших млекопита-
млекопитающих приобрела способность уничтожать антигены при помощи
антител (рис. 11.1). В связи с тем, что структура попадающих
Клетка-
предшественник
В-лимфоциты
Р
Стволовая клетка
Т-лимфоциты
Клетка -
антитело™
продуцент
Т~клетка~
супрессор
Х*^ /штитеиш
Клетки
памяти w V^^ Антиген
Антиген
Рис. 11.1. Механизм выработки антител в иммунной системе
в организм антигенов заранее не известна, в организме в ре-
результате случайной перегруппировки генов образуется огром-
огромное количество различных типов антител. На основе анализа
соответствия биохимической структуры антигена и антител из
этого множества вариантов происходит отбор единственного типа
антител, необходимого для успешного уничтожения антигена.
Задача иммунной системы состоит в выборе среди множества
вариантов такого типа антител, который лучше всего соответ-
соответствует данному антигену. Следовательно, иммунный ответ мож-
242 Гл. 11. Оптимизация мультимодальних функций
но рассматривать как процесс решения задачи комбинаторной
оптимизации.
В этой главе предложен иммунный алгоритм (ИА), имити-
имитирующий свойства естественной иммунной системы и основанный
на принципах соматической теории [1] и сетевой гипотезы [2].
Соматическая теория утверждает, что увеличение разнообразия
антител происходит за счет соматической рекомбинации и му-
мутации генов. В рамках сетевой гипотезы обосновывается пред-
предположение, согласно которому контроль размножения клонов
осуществляется в результате взаимного распознавания антител,
функционирующих как единая сеть [1,4,6,7]. Иммунный алго-
алгоритм используется для решения задачи оптимизации функции
с пятью экстремумами и функции Шуберта.
11.2. Иммунный алгоритм оптимизации
11.2.1. Разнообразие и аффинность антител. Для опре-
определения степени разнообразия антител, продуцируемых популя-
популяцией лимфоцитов, необходимо сначала ввести меру этого разно-
разнообразия. На рис. 11.2 схематически показано множество антиген-
специфических рецепторов (антител) популяции лимфоцитов.
Информационная энтропия локуса j в популяции лимфоцитов
имеет вид
A)
г=1
где N — количество антител в популяции лимфоцитов, S —
количество аллелей, a pij — вероятность того, что локус j
представлен аллелем г.
12^ ^ y'fj\"'M_ Таким образом, средняя инфор-
информационная энтропия популяц
фоцитов представима в виде
Антитело N \_
Антитело 1 I I I I 7rii\ i I мационная энтропия популяции лим-
Антитело /
м
М
Аллель :ki,k2,...,ks
где М — общее количество генов,
кодирующих антитела. Средняя эн-
тропия характеризует разнообразие
популяции лимфоцитов. Величина ayVjW аффинности антител
v и w задается формулой
ау C)
11.2. Иммунный алгоритм оптимизации
243
Аффинность антител к антигену определяется соотношением
axv = opt v, D)
где величина optv характеризует силу химической связи между
антителом и антигеном.
11.2.2. Иммунный алгоритм. В этом параграфе предла-
предлагается иммунный алгоритм оптимизации, основанный на со-
соматической теории и сетевой гипотезе. Согласно соматической
теории, генетическая информация содержится в многочислен-
многочисленных сегментах генов, расположенных на хромосоме. В процессе
развития лимфоцитов, берущих начало в костном мозге, эти
сегменты объединяются в результате генетической рекомбинации
и формируют гены иммуноглобулинов, находящиеся у В-лим-
фоцитов в активном состоянии. Соматические мутации в ходе
иммунного ответа, происходящие с высокой частотой, создают
дополнительную изменчивость этого гена. Как представляется,
в естественной иммунной системе эти два процесса обеспечива-
обеспечивают необходимое разнообразие антител и регуляцию размножения
клонов [1].
На рис. 11.3 показана функция иммунной системы с точки
зрения процессов обработки и управления информацией. Поль-
Пользуясь этой схемой, математический метод оптимизации можно
Распознавание антигена
Выработка антител
Вычисление аффиности
Дифференцировка клеток памяти
и супрессорных клеток
Стимуляция и супрессия
размножения антител
Размножение антител
Рис. 11.3. Информационные процессы в иммунной системе
представить в виде алгоритма, показанного на рис. 11.4, который
можно реализовать следующей последовательностью шагов.
[Шаг 1] Распознавание антигена. Иммунная система распо-
распознает антигенное вторжение и определяет, связано ли оно с чу-
244
Гл. 11. Оптимизация мультимодальних функций
жеродной или с собственной клеткой организма. Этот процесс
соответствует установлению вида задачи оптимизации.
Постановка задачи
Выработка вариантов
решения
Вычисление функции и
разнообразия переменных
Сохранение локально-оптимальных
переменных как клеток памяти
j
Отбор переменных
I
Выработка новых
переменных ГА
Рис. 11.4. Иммунный алгоритм оптимизации
[Шаг 2] Выработка антител клетками памяти. Клетки
памяти активируются и вырабатывают антитела для уничтоже-
уничтожения данного антигена. Это соответствует вспоминанию успешно-
успешного решения аналогичной задачи в прошлом.
[Шаг 3] Вычисление аффинитета. На основе биохимиче-
биохимического распознавания поверхностной структуры нового антигена
происходит отбор клеток, продуцирующих наиболее подходящие
антитела. На основе формул C) и D) вычисляются величины
аффинности ayViW и axv, что соответствует поиску оптимального
решения.
[Шаг 4] Дифференцировка лимфоцитов. Некоторые В-лим-
фоциты, антитела которых соответствуют антигену, становятся
клетками памяти, а также супрессорными клетками, если кон-
концентрация антител cv превышает некоторое пороговое значение
Тс. Это можно интерпретировать как сохранение подходящего
решения для следующего шага поиска. Супрессоры необходимы
для удаления избытка кандидатов на решение.
1 N
-{?
если ayv,w
иначе.
T
ac\\
E)
F)
11.2. Иммунный алгоритм оптимизации 245
[Шаг 5] Размножение и подавление антител. Ожидаемый
масштаб ev выработки антител задается формулой
Cv Z^i = \ aXi
где
_ UyVt8,
иначе.
Соотношение G) регулирует концентрацию и разнообразие анти-
антител в популяции лимфоцитов. Если антитело приобретает более
высокий аффинитет к антигену, то оно размножается, но при
этом размножение антител, концентрация которых слишком ве-
велика, подавляется. Наряду с отслеживанием локальных макси-
максимумов это соответствует поддержанию разнообразия направле-
направлений поиска.
[Шаг 6] Размножение антител. Для ответа на ранее не
встречавшиеся антигены в костном мозге происходит образова-
образование новых лимфоцитов вместо антител, удаляемых на предыду-
предыдущем шаге. В рамках генетического алгоритма (ГА) это позволяет
генерировать разнообразие антител на основе генетических опе-
операторов репродукции [5], например, под действием операторов
мутаций или скрещивания. Необходимым условием этого являет-
является более высокая эффективность таких операторов по сравнению
с генерацией антител на чисто случайной основе.
11.2.3. Свойства иммунного алгоритма. Как уже отмеча-
отмечалось, предлагаемый нами иммунный алгоритм основан на сома-
соматической теории и сетевой гипотезе. В рамках первой показано,
что в увеличении разнообразия антител участвуют соматические
рекомбинации и мутации, в соответствии с шагом 6. Сетевая
гипотеза предполагает, что контроль и размножение клонов осу-
осуществляются в результате взаимного распознавания антител,
функционирующих как единая сеть, что соответствует шагу 5.
Следовательно, можно ожидать, что алгоритм должен обладать
следующими свойствами.
• Разнообразие кандидатов на решение. Генерация раз-
разнообразия кандидатов на решение на основе упомянутых
теорий служит механизмом параллельного поиска, позво-
позволяющим находить не только локальные, но и глобальные
решения.
• Эффективный параллельный поиск. В сравнении с други-
другими методами оптимизации параллельный поиск на множе-
множестве локальных окрестностей большого количества антител
происходит быстрее и эффективнее.
246
Гл. 11. Оптимизация мультимодальних функций
11.3. Результаты численных экспериментов
11.3.1. Пример 1: функция с убывающими максимума-
максимумами. Формула (9) определяет функцию с пятью убывающими
максимумами (рис. 11.5 и 11.6):
(9)
Fx{x) = exp f-21og2
о
О 0,2 0,4 0,6 0,8 х
Рис. 11.5. Положение клеток
памяти на функции F\ спустя
200 поколений (случай ИА)
1,2 :
1,0 -Е
0,8^
0,6^
0,4^
0,2^
Oil
А
1 )
! \
П :
7 1 :
/\ Л
1 у v у V
0 0,2 0,4 0,6 0,8 х
Рис. 11.6. Положение популя-
популяции на функции F\ спустя 200
поколений (случай ГА)
11.3.2. Пример 2: функция Шуберта. Следующая форму-
формула задает двумерную функцию Шуберта, имеющую 18 глобаль-
глобальных максимумов (рис. 11.7):
F2(x, у) = —^i cos((z + \)x
\)y
A0)
i=\
10
Рис. 11.7. Функция Шуберта
11.3. Результаты численных экспериментов 247
11.3.3. Подробности реализации алгоритмов. Для опре-
определения максимальных значений функций F\ и F2 мы провели
вычислительные эксперименты с использованием иммунного и
стандартного генетического алгоритмов. При этом предполагалось,
что в случае функции F\ гены каждого индивидуального антитела
кодируются последовательностями двоичных векторов длины 16,
а в случае F2 — двоичными векторами длины 42. В ходе вычис-
вычислений использовались следующие значения параметров и харак-
характеристики генетических операторов скрещивания и мутаций.
• F\ — иммунный алгоритм. Количество индивидуальных ан-
антител: N = 100; количество поколений: G = 200; ве-
вероятность скрещивания: Рс = 1,0; вероятность мутации:
Рт = 0,01; процесс скрещивания: одноточечный; процесс
мутации: инверсия одного (произвольно выбранного) бита;
Тс = 0,45, Тас1 = 0,5 и Тас2 = 0,5.
• F\ — стандартный генетический алгоритм. Количество ин-
индивидуальных антител: N = 100; количество поколений:
G = 200; вероятность скрещивания: Рс = 1,0; вероятность
мутации: Рш = 0,01; процесс скрещивания: одноточечный;
процесс мутации: инверсия одного (произвольно выбранно-
выбранного) бита.
• F2 — иммунный алгоритм. Количество индивидуальных ан-
антител: N = 100; количество поколений: G = 2000; ве-
вероятность скрещивания: Рс = 1,0; вероятность мутации:
Рш = 0,5; процесс скрещивания: одноточечный; процесс
мутации: инверсия одного (произвольно выбранного) бита;
Тс = 0,7, Тас1 = 0,5 и Тас2 = 0,5.
11.3.4. Результаты расчетов и обсуждение. Символом А
на рис. 11.5 обозначена аффинность клеток памяти, генерируе-
генерируемых иммунным алгоритмом для функции F\ в 200-м поколении.
Тем же символом на рис. 11.6 показаны значения приспособлен-
приспособленности индивидуальных антител, генерируемых для функции F\
генетическим алгоритмом в 200-м поколении.
На рис. 11.8 показано распределение на плоскости (ж, у) 47
координат фенотипов клеток памяти (показаны символом +) и
18 координат точек глобального максимума функции (показаны
символом х) 0.
(i) Результаты оптимизации. На рис. 11.6 видно, что боль-
большинство индивидов по мере выполнения генетического алгорит-
алгоритма сосредотачиваются в одном пике. С другой стороны, в ходе
х) Точки максимума функции Шуберта и положение клеток памяти на
рис. 11.8 практически совпадают. — Прим. перев.
248
Гл. 11. Оптимизация мультимодальних функций
выполнения иммунного алгоритма образуются клетки памяти,
распределенные по всем пикам (рис. 11.5). Далее, на рис. 11.8
видно, что в случае функции F% также образуются клетки памя-
памяти, близкие ко всем 18 пикам. Однако в каждом из этих случаев
количество образуемых клеток памяти больше количества экс-
экстремумов. Это может объясняться тем, что иммунный алгоритм
пытается максимизировать количество клеток памяти.
х: точка максимума +: клетка памяти
о .
4-
0-
-л-
9
%
%
*+
Разнообразие — ГА — ИА
1,0"
0,8-
-8-4 0 4 8 x
Рис. 11.8. Положение клеток памя-
памяти на функции F% спустя 2000 по-
поколений
50
100 150 Шаг
Рис. 11.9. Изменение разнообра-
разнообразия в процессе работы генетиче-
генетического и иммунного алгоритмов
(ii) Разнообразие. На рис. 11.9 показаны изменения разно-
разнообразия антител и индивидов для рассматриваемых двух алго-
алгоритмов. Видно, что в ходе выполнения генетического алгоритма
степень разнообразия популяции быстро снижается, а в случае
иммунного алгоритма — поддерживается на достаточно высоком
уровне в результате выработки новых антител. Это свойство
иммунного алгоритма важно для поиска глобального максимума.
11.4. Выводы
Показано, что предложенный иммунный алгоритм эффекти-
эффективен как метод параллельного поиска для решения задачи оптими-
оптимизации мультимодальных функций. Частью иммунного алгоритма
является генетический алгоритм. Таким образом, по отношению
к генетическому алгоритму искусственный иммунный алгоритм
можно рассматривать как алгоритм более высокого уровня. Его
отличительная черта заключается в наличии механизмов поддер-
поддержания разнообразия векторов решений и обучения, отсутствую-
отсутствующих в случае генетического алгоритма.
Итак, рассмотренный иммунный алгоритм обладает набором
важных свойств, включая воспроизводство кандидатов на реше-
решение, распределенных на всем пространстве параметров, массо-
массовую выработку методом проб и ошибок различных направлений
Список литературы 249
поиска вокруг наиболее подходящих начальных точек, а также
эффективный параллельный поиск, стартующий с набора точек,
запоминаемых обучающей функцией.
Список литературы
1. Atlan Я., Cohen I.R. Theories of immune networks. В.: Springer-
Verlag, 1989.
2. Bersini Я., Varela F.J. The immune recruitment mechanism: A
selective evolutionary strategy // Proc. ICGA'91, 1991. P. 520-526.
3. Farmer J.D., Packard N.H., Perelson A. S. The immune system,
adaptation, and machine learning // Physica D. 1986. V.22. P. 187-204.
4. Forrest S., Perelson A. S. Genetic algorithms and the immune sys-
system // Proc. 1st Workshop of PPSN (Eds. G.Goos, J. Hartmanis).
В.: Springer-Verlag, 1990. P. 320-325.
5. Goldberg D. Genetic algorithms in search, optimization, and machine
learning. N.Y.: Addison-Wesley, 1989.
6. Perelson A. S. Theoretical immunology, Part 1. N.Y.: Addison-
Wesley, 1988a.
7. Perelson A. S. Theoretical immunology, Part 2. N.Y.: Addison-
Wesley, 1988b.
8. Tonegawa S. Somatic generation of antibody diversity // Nature.
1983. V.302. P. 575-581.
Д-р Тойо Фукуда окончил факультет инженерных исследований Универ-
Университета Киото в 1970 г. В апреле того же года поступил на работу в корпорацию
Мицубиси. В 1975 г. окончил факультет прикладной математики Гарвардского
университета. С апреля 1995 г. становится профессором политической школы
Университета Кванзей Гэкуин. Занимался научными исследованиями в теории
систем. Защитил диссертацию по техническим наукам. Член Общества инже-
инженеров по управлению и контролю (ICE), Японского института инженеров по
электротехнике (IEEJ), а также Института инженеров по электротехнике и
электронике (IEEE). Лауреат премии IEEJ за лучшую публикацию 1994года.
М-р Казуюки Мори окончил факультет научных и инженерных исследо-
исследований Токийского университета A987г.). В апреле того же года поступил
на работу в корпорацию Мицубиси. Участвует в исследованиях лаборатории
промышленной электроники и систем по проблемам анализа и планирования
дискретно-событийных систем. Член Общества инженеров по управлению и
контролю (ICE), а также Японского института инженеров по электротехнике
(IEEJ). Лауреат премии IEEJ за лучшую публикацию 1994года.
Д-р Макото Цукияма окончил факультет инженерных исследований Техно-
Технологического института г. Куюши в 1978 г. В апреле того же года поступил
на работу в корпорацию Мицубиси. Участвует в программе исследований
лаборатории промышленной электроники и систем по проблемам дискретно-
событийных систем, а также планирования и оптимизации систем. Защитил
диссертацию по техническим наукам. Член Общества инженеров по управле-
управлению и контролю (ICE) и Японского института инженеров по электротехнике
(IEEJ). Лауреат премии IEEJ за лучшую публикацию 1994года.
Глава 12
ИММУННЫЙ АДАПТИВНЫЙ КРИТИК
В ЗАДАЧЕ АВТОНОМНОГО УПРАВЛЕНИЯ
ЛЕТАТЕЛЬНЫМИ АППАРАТАМИ
Калманджи Кришнакумар, Джеймс Нейдхофер
Иммунные вычислительные системы, объединяющие априорные знания
с адаптивными возможностями иммунной системы, представляют собой вескую
альтернативу существующим методам интеллектуального управления. В этой
главе описаны возможности интеллектуального управления на различных
уровнях, которые сопоставляются с функциями иммунной системы человека.
Представлен способ реализации иммунных вычислительных систем в виде
адаптивного критика (оценивателя), который используется для генерации тра-
траектории полета летательного аппарата в нелинейной задаче интеллектуального
управления второго уровня.
12.1. Введение
Для обеспечения робастности и адаптивности естественные
иммунные системы используют конечное число «строительных
блоков», полученных из молекулы ДНК. Эти блоки можно пред-
представлять себе как части мозаики, которая собирается для ней-
нейтрализации, удаления или разрушения каждого специфического
возмущения системы. Для построения систем интеллектуально-
интеллектуального управления необходимо определить и изучить линейные и
нелинейные модули (аналогичные строительным блокам ДНК).
В процессе адаптации системы модули преобразуются в опера-
оперативном режиме. Модули бывают линейные, нейронные и нечет-
нечеткие. Нейронные модули используются для нелинейных преобра-
преобразований и в задачах оперативного обучения. Линейные модули
применяются при доступности способов линейного управления,
использование которых является необходимым и достаточным
условием управляемости (например при малых возмущениях рав-
равновесного состояния). Линейные модули образуют основу дока-
доказательства устойчивости систем управления. Нечеткие модули
можно использовать для обслуживания волевых решений. Таким
образом, способность нейронных сетей к обучению и свойства
12.2. Уровни интеллектуального управления 251
линейного управления объединяются с адаптивными возможно-
возможностями иммунной системы для построения иммунных вычисли-
вычислительных систем (ИВС) нового поколения.
Возможности ИВС были показаны на примере решения
нескольких типов задач: а) оперативной идентификации и адап-
адаптивного управления неопределенными системами [5, 6], б) син-
синтеза контроллеров, имитирующих человека в контуре обратной
связи [7]; в) построения стабилизирующих контроллеров [8].
В настоящее время проводится экспериментальныя проверка
этой системы на испытательном стенде для интеллектуального
управления летательными аппаратами.
Одной из необходимых характеристик любой действительно
адаптивной системы является способность к прогнозу ее даль-
дальнейшей эффективности. В литературе были предложены как
адаптивные [1, 9], так и неадаптивные критики в виде нейрон-
нейронных сетей, способных к такому прогнозу. Существует несколько
способов адаптировать сети критиков. Один из способов за-
заключается в реализации метода эвристического динамическо-
динамического программирования (ЭДП), который обсуждался Вербо [9].
По существу, критик, помимо того что прогнозирует будущие
издержки, адаптируется на основе рекуррентного соотношения,
полученного с использованием приближенного решения задачи
динамического программирования. Как правило, для обновления
весового коэффициента критика применяется метод обратного
распространения ошибки. В этой главе для построения системы
адаптивной критики мы используем возможности иммунных вы-
вычислительных систем.
Сначала приводится описание возможностей различных уров-
уровней интеллектуального управления, которые сопоставляются
с функциями иммунной системы человека. Затем изложены де-
детали строения и функции иммунных вычислительных систем.
В заключение дается определение иммунного адаптивного кри-
критика, который используется для генерации траектории полетов
летательных аппаратов в нелинейной задаче интеллектуального
управления второго уровня.
12.2. Уровни интеллектуального управления
Интеллектуальное управление — чрезвычайно актуальная те-
тема у специалистов по управлению. Несмотря на признание этой
области как самостоятельного раздела теории управления, стан-
стандартное и общепринятое определение того, что же в точности
представляет собой интеллектуальное управление, в настоящее
252 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
время отсутствует. Вместо этого имеется несколько самостоя-
самостоятельных точек зрения на интеллектуальное управление, выска-
высказанных различными исследователями, и ряд соответствующих
определений. Существуют области знания, для которых эти опре-
определения согласуются, и мы можем сказать, что, вообще говоря,
интеллектуальность системы управления характеризует ее спо-
способность управлять и обрабатывать неопределенную и неточную
информацию, наличие свойств адаптируемости и памяти, а также
способность к обучению. Возможности сбора, обработки инфор-
информации и использования ее для эффективного решения старых
и новых проблем являются критическими особенностями таких
систем. С современных позиций, интеллектуальное управление
охватывает различные области, от традиционных, таких как оп-
оптимальное, робастное, стохастическое, линейное и нелинейное
управление, до более новых методов нечеткого, генетического и
нейроконтроля. Интеллектуальное управление можно рассматри-
рассматривать как область исследований, лежащую на стыке различных
хорошо сформированных дисциплин: методов вычислений, клас-
классической теории управления, исследования операций и информа-
информатики.
Интеллектуальное управление фокусируется на таких зада-
задачах, которые не могут быть удовлетворительно (или в принципе)
решены с использованием традиционных методов. Принято счи-
считать, что некоторые типы задач лучше решаются с использова-
использованием законов линейного управления, чем с нечетким или нейро-
контролем (например задача стабилизации движения при малых
возмущениях системы в окрестности равновесного состояния).
С другой стороны, нечеткие и нейронные методы позволяют
относительно легко решать задачи реализации сложной архитек-
архитектуры управления. Например, нечеткие регуляторы обеспечивают
управляемость в условиях неопределенности без необходимости
достраивания системы. Другим примером является простота вы-
вычисления функций чувствительности системы с использованием
нейронных сетей. Эти функции могут использоваться для адап-
адаптивного контроля в режиме реального времени с оптимизацией
характеристик производительности системы.
Нельзя отрицать, что необходимость улучшения методов
управления мотивируется потребностью повышения эффектив-
эффективности и производительности существующих систем. Другим не
столь очевидным фактором является необходимость сокращения
инновационного цикла (теория-моделирование-практика). В на-
настоящее время интеллектуальное управление (интеллектуальные
системы вообще) подается как способ реализации указанных по-
12.2. Уровни интеллектуального управления
253
требностей. К сожалению, понимание того, что же представляет
собой интеллект и, более точно, интеллектуальное управление,
в лучшем случае является недостаточным.
Удобно определить интеллектуальное управление на осно-
основе классификации его уровней, исходя из того, что различные
системы имеют разную способность к самосовершенствованию
(см. табл. 12.1).
Таблица 12.1
Уровни интеллектуального управления
Уровень Самосовершенствование
Описание
Динамическая погрешность
(ДП)
Робастное управление с обратной
связью: динамическая погрешность
стремится к нулю
ДП + параметры управле-
управления (ПУ)
Адаптивное управление: робаст-
робастное управление с обратной свя-
связью и адаптивными управляющи-
управляющими параметрами (для неноминаль-
неноминальных операций ДП стремится к ну-
нулю; управление по принципу обрат-
обратной связи самосовершенствуется)
ДП + ПУ + критерий каче-
качества (КК)
Оптимальное управление: робаст-
робастное адаптивное управление с об-
обратной связью, которое минимизи-
минимизирует или максимизирует функцию
качества
ДП + ПУ + КК + функция
планирования (ФП)
Плановое управление: уровень 2
+ способность планировать за-
заранее не определенные ситуа-
ситуации, имитировать и моделировать
неопределенности
Еще предстоит определить
Самосовершенствование является важной способностью че-
человеческого интеллекта. Эту характеристику можно определить
количественно и измерить разными способами. Задавая различ-
различные уровни интеллектуального управления, мы тем самым остав-
оставляем в определении место для дальнейшего совершенствования
с учетом неизбежных последующих нововведений в результате
развития когнитологии, аппаратного обеспечения ЭВМ, датчи-
датчиков и исполнительных механизмов, теории обучения и развития
структуры систем управления.
254 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
Таблица 12.2
Уровни интеллектуального управления и иммунная система
Иммунный ответ
Уровень Интеллектуальное управление
В иммунной системе присутствует
антиген
В системе имеется возмущение
Первым уровнем защиты являет-
является врожденный иммунитет, кото-
который приводит в состояние готов-
готовности следующий уровень защиты
О Робастное управление с обрат-
обратной связью (неадаптивное; по-
погрешность стремится к нулю)
Т-клетки активируют В-лимфоци-
ты (адаптация) для нейтрализации
антигена
Регулятор модифицирует управ-
управляющие параметры для нейтрали-
нейтрализации возмущений
Макрофаги передают антиген
Т-лимфоцитам с активацией
Т-клеточного ответа (адаптация)
Некоторая функция полезности
преобразует величину возмуще-
возмущения в функцию ошибки и
представляет ее управляющему
устройству
Для определенного антигена мак-
макрофаги адаптируются вместе с ко-
конечным продуктом — антителами,
которые видоизменяют специфич-
специфичность регулятора с широкой, но
низкой на узкую, но высокую
Для определенных классов возму-
возмущений (например при неисправ-
неисправности аппаратного обеспечения)
функция полезности адаптирует-
адаптируется непосредственно на основе
функции планирования
В табл. 12.2 приводится сопоставление уровней интеллекту-
интеллектуального управления с соответствующими характеристиками им-
иммунной системы. Мотивом для этого являются исследования
авторов по иммунным вычислительным системам и поиск воз-
возможностей для реализации автономных управляющих устройств.
12.3. Проблема автономного управления
летательными аппаратами
Автономные системы — это системы, способные к незави-
независимой ответной реакции, реагированию и саморазвитию. На
рис. 12.1 показана структура интеллектуальной системы для ав-
автономного управления летательными аппаратами. Она реализо-
реализована при помощи имитационной численной модели летательного
аппарата (ЛА) с шестью степенями свободы и полнодиапазонной
нелинейной аэродинамикой, кинематикой и реактивной тягой
первого порядка.
12.3. Проблема автономного управления летательными аппаратами 255
Моделируемое устройство представляет собой высокоэффек-
высокоэффективный сверхзвуковой Л А — современный истребитель [11]. Реа-
Реализация архитектуры включает в себя использование нейронных
аппроксиматоров для эмуляции нелинейного характера задачи.
Такой подход применим при наличии надежных линейных при-
приближений для конструируемой системы.
\
Система
повышения
устойчивости
Y(t)
V{t), H(t)
Инверсное
управление
(Ydot-Ay) =
iU,A,B,Y
U
момент t),
Y(t)
Оценка
коэффициента
усиления
СПУ
A {t)
Y(t)
~1 Г
Нейронный
шпроксиматор
Ait)
У
Нейронный
аппроксиматор
Bit)/
Bit)
Генератор оптимальной
траектории полета
NN:(Yd(t+l))
Численное интегрирование
Ydot=Ay + Bu
Сеть
критика
Полетное задание
Рис. 12.1. Структура интеллектуальной системы управления летательными
аппаратами
В последующих разделах детально описывается каждый из
уровней интеллектуального управления, представленных в архи-
архитектуре системы.
12.3.1. Нулевой уровень интеллектуального управле-
управления — робастное регулирование. Уменьшение динамической
погрешности — это важная цель многих задач управления.
Одним из способов этого является построение робастных
регуляторов с обратной связью и погрешностью, стремящейся
к нулю при t —> ос. Такое управление мы определяем как нулевой
уровень интеллектуального управления.
В рассматриваемом нами приложении регулятором нулево-
нулевого уровня служит система повышения устойчивости (СПУ).
256 Гл. 12. Иммунный адаптивный критик и автономное управление ЛА
Данный регулятор построен на идее нейронной аппроксимации
нелинейного управления. А именно, нейронная сеть использует-
используется для аппроксимации коэффициента усиления обратной связи
внутреннего цикла в автомате повышения устойчивости модели
ЛА. Идею такой структуры лучше всего можно уяснить, если
представить блок аппроксимации коэффициента усиления в виде
непрерывного планировщика. Фактически, блок аппроксимации
представляет собой нейронную сеть, входы которой — это пере-
переменные диспетчеризации, абсолютная высота и скорость полета,
а выходы — это функции чувствительности. Желательно, чтобы
СПУ разместила полюса замкнутого контура агрегата таким
образом, чтобы обеспечить необходимые характеристики управ-
управляемости для всего спектра эксплуатационных возможностей
ЛА [11].
12.3.2. Первый уровень интеллектуального управле-
управления — адаптивное регулирование. Самосовершенствование
управляющих параметров с целью снижения динамической
погрешности или некоторой ее функции, представляет собой
следующий этап, называемый первым уровнем интеллекту-
интеллектуального управления. Примером соответствующего регулятора
является робастный автоматический регулятор с адаптивными
параметрами (например адаптивное управление по эталонной мо-
модели или нейронное адаптивное управление), способствующими
устранению погрешности для неноминальных операций. Таким
образом, автоматическое управляющее устройство обладает
свойством адаптации.
Интеллектуальное управляющее устройство первого уровня
для задачи автономного управления ЛА показано на рис. 12.1.
Идею его конструкции лучше всего можно понять, если предста-
представить себе блок коэффициента усиления обратной связи в виде
непрерывной аппроксимации нелинейного соотношения между
различными линейными представлениями модели ЛА. По сути,
этот блок представляет собой нейронную сеть, входами которой
являются переменные диспетчеризации, а выходами — аппрокси-
аппроксимации матриц Якоби системы агрегатов ЛА (матрицы простран-
пространства состояний А и В), соответствующие текущим условиям
полета. В данной реализации, входными переменными являются
высота и скорость полета, а выходными — чувствительные эле-
элементы матриц А я В. Кроме того, к ним относятся требуемые
значения регулировки для определенных состояний и выходные
управляющие переменные нейронного аппроксиматора. Целевой
функцией производительности для регулятора первого уровня
12.4. Иммунные вычислительные системы 257
служило соблюдение полетного предписания (предполагаемой
траектории полета).
12.3.3. Второй уровень интеллектуального управле-
управления — оптимальное регулирование. Следующим, вторым,
уровнем интеллектуального управления является самосовер-
самосовершенствование оценки эффективности системы (или некоторой
характеристики ее функционирования) с целью минимизации
или максимизации функции полезности (погрешность стремится
к нулю с оптимизацией эффективности). По существу, второй
уровень соответствует робастному автоматическому регулятору
с адаптивными параметрами, изменение которых способствует
устранению погрешности для неноминальных операций, при этом
автоматическое управляющее устройство самосовершенствуется,
а эффективность оптимизируется. Примером интеллектуального
регулятора второго уровня может служить система адаптивной
критики, в которой для повышения эффективности системы
критик, как и устройство управления, обновляется.
Структура автономной системы управления второго уровня
показана на рис. 12.1. В этом случае блок генерации траектории
полета можно представлять себе как устройство, непрерывно
снабжающее регулятор первого уровня информацией об опти-
оптимальной траектории полета. Фактически генератор траектории
полета является иммунным адаптивным анализатором, оптими-
оптимизирующим функцию эффективности системы с целью использо-
использования немногочисленных заранее заданных опорных точек для
генерации непрерывной полетной информации.
12.4. Иммунные вычислительные системы
Иммунные вычислительные системы (ИВС) используют пред-
представления об иммунной системе и вычислительные методы (как
жесткие, так и мягкие вычисления) для искусственной реали-
реализации робастной и адаптивной природы естественной иммунной
системы. Любая попытка имитации функции различных блоков
и элементов иммунной системы должна содержать определение
их структуры. На рис. 12.2 показана блок-схема предлагаемой
ИВС. Опишем ее компоненты.
• Постоянная мезоструктура. Сплошными линиями на
рис. 12.2 представлена базовая вычислительная система
(ВВС). Она спроектирована для моделирования обычного
поведения системы. Поскольку эта структура реализована
в режиме офф-лайн, для ее синтеза можно использовать
9 Д. Дасгупта
258 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
любой стандартный метод. Базовая система аналогична
статической (т.е. константной) части антител.
Обучающая
система
Вычислительные
модули
Исследователь-
Исследовательская система
иве
Рис. 12.2. Иммунная вычислительная система
• Переменная мезоструктура. Пунктирные линии на
рис. 12.2 представляют изменяемую вычислительную систе-
систему (ИВС), что эквивалентно вариабельной области молекул
антител и эпитопам. Эта структура может адаптироваться
в онлайновом режиме. Для имитации врожденного
иммунитета ИВС, известные априори, могут храниться
в справочных таблицах и использоваться для выработки
новых антител и моделей ИВС.
• Вычислительные модули, описанные ниже, используются
для видоизменения ИВС.
• Система диагностики — разновидность эволюционного
алгоритма, использующего рекомбинацию, отбор и мутации
для генерации подходящего варианта ИВС.
• Обучающая система состоит из набора обучающих при-
примеров и служит для обучения и хранения вычислительных
модулей, которые заранее не известны.
• Неопределенная система. Система, которая либо эмули-
эмулируется, либо контролируется. Она находится в постоянном
изменении.
12.4.1. Вычислительные модули. Вычислительные модули
(ВМ) определяются как элементы топологии вычислительной
системы (например нейросетевая схема, или семейство схем,
с весами), полезные с точки зрения установления нужных со-
соотношений между некоторыми наборами входных и выходных
переменных. ВМ могут иметь различный порядок. Порядок вы-
вычислительного модуля определяется количеством специфических
12.4. Иммунные вычислительные системы
259
связей. Примеры ВМ, использующих нейронные связи, показаны
на рис. 12.3. ВМ задаются при помощи универсальной схемы
представлений, которая в качестве основного обрабатывающего
элемента использует нейрон. Таким образом, вычислительный
модуль первого порядка состоит из двух нейронов и отноше-
отношения между ними. В случае нейронных сетей, это соотношение
представляет собой силу взаимосвязи, а нейроны характеризу-
характеризуются своим типом (входной, скрытый, выходной), а также ти-
типом соединения и активационной функции. В случае нечетких
систем соотношениями являются логические функции и выра-
выражения И, ИЛИ или ТО, а нейроны представляют входные или
выходные переменные с соответствующими параметрами (такими
как функция нечеткой принадлежности). Определение модулей
является проблемно-зависимой задачей, для решения которой
будут полезны любые априорные знания.
CD-
Входной
блок
Нейронная сеть
Скрытые блоки
Выходной
блок
Модули искусственной нейронной сети
Рис. 12.3. Модули нейронной сети
12.4.2. Роль эволюционных алгоритмов. Подобно иммун-
иммунной системе, вычислительные модули необходимо закодировать
в виде некоторой последовательности, представляющей собой
аналог ДНК. В целях оперативной обработки данных ИВС стро-
строится путем случайного соединения отдельных модулей, образу-
образующих в результате популяцию смешанных последовательностей
(рис. 12.4). Затем на основе рекомбинации, отбора и гипермути-
гипермутирования этих последовательностей выбирается наилучшая после-
последовательность, которая будет представлять ИВС.
Типичная схема действий такова.
• Имея популяцию, состоящую из N последовательностей
модулей, приходят к близкой к оптимальной ИВС на основе
операций рекомбинации, мутации и отбора. О качестве
решения судят по оперативной оценке величины погрешно-
погрешности, которая служит мерой приспособленности вариантов
9*
260 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
решения. Мутируют лишь параметры, определяющие топо-
топологию системы (например весовые коэффициенты нейрон-
нейронной сети) в предположении о наличии некоторого вероят-
вероятностного распределения этих параметров.
Модули ИВС
Модуль 1
Модуль 2
Модуль 3
Модуль п
Модуль 1 Модуль 3
Модуль 1
Модуль 2
Модуль п
Модуль 2
Модуль п
Рис. 12.4. Генерация смешанных последовательностей из библиотеки вычисли-
вычислительных модулей
• В идеале было бы желательно иметь популяцию всех воз-
возможных ИВС, синтезированных из вычислительных моду-
модулей. Так как это невозможно, то выбирается конечная по-
популяция, состоящая из N смешанных последовательностей,
и для обеспечения разнообразия в каждом новом поколе-
поколении вводится N/2 новых смешанных последовательностей,
конструируемых на случайной основе из числа доступных
вычислительных модулей.
• Затем последовательность ИВС декодируется, и получен-
полученная вычислительная система объединяется с ВВС. Резуль-
Результат оценивается с точки зрения оптимальности. Возможны
несколько вариантов. Если ВВС близка к оптимальной,
то используется гипермутирование параметров (или другая
схема локального обучения). На этом шаге рекомбинация
не проводится и не добавляются новые строки. Действие
оператора отбора сохраняется, так как это увеличивает
количество в популяции ИВС с высокой аффинностью.
Оперативная обработка данных проводится с использовани-
использованием эволюционного алгоритма. В отличие от других методов,
эволюционный алгоритм (ЭА) достигает цели благодаря сме-
смешанной стратегии случайной перестановки данных и копиро-
копирования, в результате применения дарвиновского механизма «вы-
«выживания наиболее приспособленных». ЭА имеет много общего
с процессом эволюции биологических видов и опирается на по-
понятие стандартных блоков. Операторы, используемые на фазе
12.5. Иммунный адаптивный критик
261
рекомбинации, аналогичны использованным Гольдбергом и со-
авт. [4] — разрезание, склеивание и мутации. Операция разре-
разрезания проводится с учетом генетически обусловленной вероят-
вероятности р^, такой что фактическая вероятность разрезания есть
рс = mm{pk(L - 1), 1}, где L — текущая длина последовательно-
последовательности. Оператор склеивания соединяет две последовательности на
случайной основе с вероятностью ps. Оператор мутаций действу-
действует только на силу соединений (веса или связи), причем скорость
мутаций мала. На рис. 12.5 показан пример последовательности
операторов вычислительной системы. После каждой операции
Оператор разрезания
Модуль 1
Модуль 2 Модуль 5
Модуль 1 Модуль 3 Модуль 4 Модуль 7
Модуль 8
Оператор склеивания'
Модуль 1
Модуль 1
Модуль 2
Модуль 3
Модуль 5
Модуль 8
Модуль 4 Модуль 7
Оператор мутаций (пунктирный прямоугольник)
МодульХ1
Модуль 1
Модуль 2
Модуль 3
Модуль 5 Модуль 4 Модуль 7
¦ МодульХ8 ¦
Рис. 12.5. Операторы генетического алгоритма
разрезания и склеивания последовательности могут становиться
длиннее или короче. Далее проводится селекция с использова-
использованием бинарной схемы турнирного отбора. На фазе гипермути-
гипермутирования параметры связи мутируют с вероятностью рнт- Пред-
Предполагается, что распределение вероятностей оператора мутаций
гауссово, оно получается независимо на основе данных по стан-
стандартным блокам.
12.5. Иммунный адаптивный критик
12.5.1. Происхождение адаптивных критиков. Понятие
«адаптивный критик» возникло на стыке понятий о нейронных
сетях, динамическом программировании и обучении с подкреп-
подкреплением. Критики, как адаптивные, так и неадаптивные, были
предложены как системы, способные моделировать свои будущие
эксплуатационные параметры. Существует несколько способов
адаптировать сети критиков. Простейшей реализацией является
262 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
метод эвристического динамического программирования (ЭДП),
изученный Вербо [9]. Формулировка метода динамического про-
программирования, данная Ховардом [9], появилась под влиянием
метода ЭДП, основанного на попытке аппроксимации уравнения
Беллмана в форме Ховарда.
По существу, критики, помимо того, что могут прогнозиро-
прогнозировать будущие издержки, адаптируются на основе рекурсивного
соотношения, полученного из приближенного решения задачи
динамического программирования. Как правило, для обновления
весовых коэффициентов критиков используется метод обратного
распространения ошибки.
12.5.2. Как работает адаптивный критик. Сеть критика
адаптируется (см. рис. 12.6) и одновременно выдает оценку кри-
критерия качества, которая может использоваться для обновления
другой системы (обычно сети устройства управления). Предло-
Предложенное Ховардом определение динамического программирования
явилось стимулом для создания простейшей разновидности адап-
адаптивного критика — ЭДП-критика. ЭДП основано на попытке
аппроксимации уравнения Беллмана в форме Ховарда:
J(xi) = mm{UpM(xi) + jJ(xt+i)\xt+i = f(xi, щ, noise)},
щ
A2.1)
где xt — вектор состояния, щ — вектор управления, Upm(') ~
одноступенчатая функция критерия качества, /(-,-,•) — модель
системы, а 7 — дисконтирующий множитель.
JC(f+l)
Критик
Критик
/0+1). . -
—-И—Кн
с/РМ(х@,«@)
Рис. 12.6. Адаптивный критик эвристического динамического программиро-
программирования
12.5.3. Иммунный критик. К желательным свойствам
процесса адаптации критика относятся скорость, робастность и
способность совершать дискретные переходы из одного простран-
пространства параметров в другое, что очень важно для взаимодействия
с резко изменяющейся операционной средой. Мы утверждаем,
что адаптивный критик может быть полезен только в этом слу-
12.5. Иммунный адаптивный критик 263
чае. Для достижения этой цели в нашей работе предлагается
использовать пример обучения иммунных вычислительных си-
систем. Для улучшения качества функционирования критика мы
применяем идеи иммунного интеллектуального управления. Для
реализации этой методологии используются линейные модули.
Далее обсуждаются подробности осуществления этого подхода.
Нашей целью является реализация устройства интеллекту-
интеллектуального управления второго уровня с использованием иммун-
иммунного критика, которая осуществляется в два этапа. На первом
этапе (в автономном, т. е. оффлайновом, режиме) проводится
формирование и организация априорных модулей, а второй этап,
осуществляемый в оперативном, т. е. в онлайновом, режиме,
включает манипуляцию блоками для управления в условиях
неопределенности.
Автономный режим. Этап 1. Для построения вычислитель-
вычислительных модулей необходимо сначала задать системе спектр неопре-
неопределенностей, т. е. определить, с какими неопределенностями си-
система может столкнуться и какие из них может игнорировать.
Важно уметь классифицировать различные типы неопределенно-
неопределенности (например параметрическую, в начальных условиях, по сре-
довым факторам и т.п.) и соответствующим образом организо-
организовать априорную информацию. Это важно, поскольку метод не
применим к задачам с недоступными измерениями, оценками
или аппроксимациями неопределенности.
Этап 2. Далее, мы используем теорию линейно-квадрати-
ческих задач оптимизации для формирования предварительной
информации о структуре критика. Имея линейную систему и
квадратичную функцию стоимости,
х = Ах + Ви A2.2)
оо
J = И (xTQx + uTRu) dt, A2.3)
о
мы получаем решение задачи динамического программирования
для управления по принципу обратной связи в аналитическом
виде:
u{t) = -R-lBTSx{t), A2.4)
где S — решение уравнения Риккати для стационарного состоя-
состояния:
SA + ATS - SBR~XBTS + Q = О, A2.5)
264 Гл. 12. Иммунный адаптивный критик и автономное управление ЛА
а прогнозируемая погрешность в уравнении Беллмана имеет вид
J
= \xTSx.
A2.6)
Для обучения в режиме оффлайн имитируются многие
неопределенности из представленного выше определения, и
на основе теории линейно-квадратических задач оптимизации
генерируется матрица S (решение уравнения Риккати). Эле-
Элементы матрицы S используются в качестве предварительных
вычислительных модулей.
Оперативный режим. Для адаптации в оперативном режи-
режиме, в данной реализации используется разновидность генетиче-
генетического алгоритма для выделения критика (элементов матрицы S).
Общая идея представлена на рис. 12.7. Выполняется следующая
последовательность действий.
Обратная связь
—*~(+У
J(t) 1
U(t)+J(t+l)
U(t)+J(t+l)
i
U(t)+J(t+\)
ность
г»
о
о
с
о
а
Он
д
VO
О
Генетический алгоритм, априорные модули
и другие средства управления знаниями
Рис. 12.7. Иммунный адаптивный критик
Этап 1. Начинаем с базовой матрицы S и соответствующего
устройства управления (формулы D) и E)).
Этап 2. Генерация большого количества критиков из блоков
адаптивного критика, построенных в автономном режиме (эле-
(элементы матрицы S).
Этап 3. Адаптация критиков с использованием генетического
алгоритма (ГА). Параметры ГА представляют собой модули кри-
критика E11, S12, ...).
12.5. Иммунный адаптивный критик 265
Этап 4. Функция приспособленности определяется в виде
T-lOdt
Е= Y. [J(t)-UPN{(t)dt + J(t+l)}2, A2.7)
t=T
где
= xTQx + иТ Ru,
J{t) = l-x(t)TS(t)x(t),
J(t + 1) = l-x{t + l)TS{t + \)x(t + 1).
Замечание: определенная выше ошибка является следствием
ЭДП-аппроксимации уравнения динамического программирова-
программирования Беллмана (формула A)).
Этап 5. На каждом n-м шаге оператор управления обновля-
обновляется с использованием максимальной критической оценки вида
u(t) = K(t)x(t).
При этом матрица В не обновляется.
12.5.4. Применение ИАК для управления летательны-
летательными аппаратами. В этом разделе рассматривается применение
ИАК в задаче автономного управления летательными аппарата-
аппаратами. ИАК можно использовать для реализации принципа управле-
управления с «близкой к оптимальной» адаптивной траекторией полета.
В сочетании с нейронной аппроксимацией (НА), основанной на
интеллектуальных управляющих устройствах нулевого и первого
уровня (см. рис. 12.1), формируется архитектура мощной «почти
автономной» системы управления.
На простейшем уровне, мы хотим построить генератор тра-
траектории полетов, входы которого являются состояниями лета-
летательного аппарата (ХА/С) и заранее заданной фиксированной
траекторией в пространстве состояний (Xfixeci), а выходы —
гладкой и оптимальной допустимой траекторией движения ЛА
(см. рис. 12.8).
Генератор траектории полетов без обратной связи можно
представить в виде уравнения
SX = АрдХр + BPSUP, A2.8)
где
с лу- лу- лу-
О уур — ^*-р -^ fixed'
5Up = JVfixed - ХА/С.
266 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
Функции Ар и Вр описывают динамику генератора траекто-
траектории, a Xp(t), XA/C(t) и Xfixed(t) определяются как
XA/C(t) = [VA/c{t),HA/c(t),*A/c(t)],
где V — скорость Л А (футов в секунду), Я — высота, вы-
выраженная в футах, Ф — курсовой угол, выраженный в ради-
радианах, которые определяются в системе координат, связанной
с Землей. Заметим, что при отсутствии обратной связи величина
А/С
Генератор
траектории
Рис. 12.8. Упрощенная схема генератора траектории полетов Л А
"" ^А/с является вынуждающей функцией (или управле-
управлением). Однако генератора траектории без обратной связи недо-
недостаточно, так как нет ничего, что направляло бы траекторию Хр
к ^fixed- Для этого мы используем обратную связь. Структура
генератора траектории полетов с обратной связью показана на
рис. 12.9.
аА/С
Летательный
аппарат и блок
управления
ИАК адапти-
адаптирует генератор
траектории
Л
^А/С
Рис. 12.9. ИАК-генератор траектории как система с обратной связью
Заметим, что структуру обратной связи можно представить
уравнением
S = Лрсь^^р + v{t)i A2.9)
где
12.5. Иммунный адаптивный критик 267
— матрица системы с обратной связью, равная Ар - ВрКр,
где Кр находится путем решения линейно-квадратической зада-
задачи управления, а г\ рассматривается как возмущение системы.
12.5.5. Реализация ИАК-генератора траектории движе-
движения летательных аппаратов. Реализация ИАК-генератора тра-
траектории включает автономный и оперативный режимы работы.
Автономный режим. Этапы автономного режима работы
включают построение набора вычислительных модулей и стати-
статистических данных.
Этап 1. Определяются четыре матрицы Ар (состояния тра-
траектории) моделированием динамики системы первого порядка.
Матрица В пространства состояний выбрана постоянной (еди-
(единичная матрица), также заданы 5 матриц Q, а матрица R счи-
считается постоянной (уравнение C)). Каждая из четырех матриц
Лр соответствует одному из вариантов маневров ЛА, выполня-
выполняемых с различными временными константами. Таким образом,
матрицы Ар — это диагональные матрицы размерности 3x3,
определяемые выбором временных констант ту, тн, Тф. Матрица
/? бралась единичной, а матрицы Q выбирались как 0,001/?,
0,017?, 0,1/?, /? и 10/?. Далее матрицы Ар, Вр, Q и /? использо-
использовались для вычисления 20 различных матриц S (уравнение E)).
Отдельные элементы матриц S служат модулями ИАК.
Этап 2. Матрицы S разбиваются на модули. Так как матрицы
S имеют размерность 3 х 3 и они симметричные, то всего полу-
получается 6 блоков (S\\, S\2, S\s, S22, S32, ?33) от каждой из 20
матриц, что дает 120 априорных блоков.
Этап 3. Далее вычисляются статистики первого и второго
порядка для каждого из элементов матриц S. Другими словами,
для величин S\\, S\2, ..., ?33 вычисляются среднее значение \i
и стандартное отклонение а.
Этап 4. Затем модули упорядочиваются по величине стан-
стандартного отклонения и определяются вероятности мутаций таким
образом, чтобы модуль с наибольшим стандартным отклонением
имел наибольшую вероятность мутации, и т.д.
Оперативный режим. Реализация оперативного режима
проводилась в основной цепи управления ЛА. Для этого генера-
генератор траектории полетов обновлялся каждую (модельную) секун-
секунду, или каждый раз после 50 шагов интегрирования (dt = 0,02 с).
Этап 1. Сначала вычисляется среднее значение полученных
в автономном режиме матриц S на основе средних значений мо-
модулей. Определяется величина приспособленности усредненной
матрицы S.
268 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
Этап 2. Затем формируются N новых матриц S с использова-
использованием разновидности стандартного ГА-оператора отбора выбором
блоков из исходного множества (набора генов). Величина N —
это размер популяции в генетическом алгоритме.
Этап 3. К каждой новой матрице S применяется оператор
гипермутирования и определяется величина приспособленности
полученной матрицы с использованием уравнения динамического
программирования Беллмана (ЭДП).
Этап 4. Если максимальная величина приспособленности но-
новых матриц S выше максимальной приспособленности предыду-
предыдущего набора матриц S, то «наилучшая» матрица S заменяется на
новую с максимальной приспособленностью, которая переходит
в следующее поколение. Если не выполняется условие останова,
то процесс повторяется заново, начиная с первого этапа опера-
оперативного режима.
Этап 5. При выполнении условия останова итерационный
процесс прекращается (в нашем случае в качестве критерия
останова было выбрано фиксированное число итераций).
Реализация второго уровня интеллектуального управления
использовалась для выполнения различных маневров. Получен-
Полученные результаты показали устойчивость работы ИАК с высо-
высокой скоростью сходимости к нужному решению. На рис. 12.10
хЮ4
20 40 60 80 100
Номер поколения A поколение =
10 вычислений функции)
Рис. 12.10. Адаптация иммунной системы
показан типичный график адаптации иммунной системы, а на
рис. 12.11 и 12.12 — соответствующие траектории полета для
трехмерных маневров (показано только изменение высоты и на-
направления полета) для скоростей движения ЛА 600 и 800 футов
в секунду соответственно. Из приведенных графиков видно, что
результат реализации ИАК соответствует ожидаемому и что
адаптация системы происходит за меньшее число итераций по
сравнению с типичным генетическим алгоритмом.
12.5. Иммунный адаптивный критик
269
(гш(ф) вхоэнд
(нхАф) вхоэнд
270 Гл. 12. Иммунный адаптивный критик и автономное управление ЛЛ
12.6. Вывод
Показано, что иммунные вычислительные системы способ-
способны функционировать как адаптивные критики. Иммунные адап-
адаптивные критики (ИАК) могут применяться для решения задач
оперативного управления. При генерации траектории полетов
с помощью ИАК использовалась модельная система первого по-
порядка. Однако для описания некоторых важных режимов по-
полета ЛА имеет смысл рассмотреть также модельную систему
второго порядка. Показано, что при решении задачи генерации
траектории полетов ИАК очень быстро находит нужное решение
(см. рис. 12.10).
Материалы этой главы основаны на результатах работы,
поддержанной Национальным научным фондом США (гранты
№ECS-9415351 и ECS-9113283).
Список литературы
1. Barto A Reinforcement learning and adaptive critic methods // Hand-
Handbook of intelligent control: Neural, fuzzy, and adaptive approaches.
Van Nosttrand Reinhold, Kentucky, 1992.
2. Barto A, Benjamin E. Immunology, a short course. N.Y.: Wiley-
Liss, 1992.
3. Barto A, Bryson A.E., Ho Y. Applied optimal control. N. Y.: Hemi-
Hemisphere Publishing Corporation, 1965.
4. Barto A., Goldberg D.E., Deb K., Korb B. An investigation of messy
genetic algorithm (TCGA Report №90005), Univ. of Alabama, 1990.
5. Barto A, KrishnaKumar K. Immunized neurocontrol: Concepts and
initial results. Presented at the workshop on combinations of genetic
algorithms and neural networks, COGANN'92, Baltimore, MD, June,
1992.
6. Barto A, Krishnakumar K., Satyadas A., Neidhoefer J. An im-
immune system framework for integrating computational intelligence
paradigms with applications to adaptive control // Computational
intelligence (A dynamic system perspective), IEEE Press, 1995.
7. Barto A, KrishnaKumar K. Immunized artificial neural systems.
World Congress on Neural Networks, Portland, July 11-15, 1993.
8. Barto A, Neidhoefer /., Krishnakumar K. Neuro gain approxi-
approximation // Intelligent engineering systems through artificial neural
networks, V.6. ASME Press, 1996. P. 543-550.
9. Barto A., Werbos PJ. Approximate dynamic programming for
real-time control and neural modeling // Handbook of intelligent con-
control: Neural, fuzzy, and adaptive approaches. Van Nosttrand Reinhold,
Kentucky, 1993.
Список литературы 271
10. Barto Л, Wie Я, Bernstein D.S. Benchmark problems in ro-
robust control design // J. Guidance Control Dynamics. 1992. V. 15.
P. 1057-1059.
11. Barto A, Neidhoefer /., KrishnaKumar K. Non-linear control using
neural approximators with linear control theory // AIAA 97-3536,
AIAA Conference on Guidance, Navigation, and Control, New Or-
Orleans, LA, August 1997.
12. Barto A, Brumbaugh R. Aircraft model for the AIAA controls design
challenge // J. Guidance Control Dynamics. 1994. V. 17, №4.
Д-р Калманджи Кришнакумар является адъюнкт-профессором факуль-
факультета аэрокосмического машиностроения и механики в Университете Алабамы.
Один из организаторов научного коллектива по проблемам гибкого интел-
интеллекта в Тускалузе, штат Алабама. В настоящее время отвечает за обучение
и координацию научных исследований в области управления с применением
микропроцессорных устройств, динамики и управления полетами, а также
нейронных сетей. Сфера его научных интересов включает искусственные им-
иммунные системы, методы мягких вычислений и их приложения к задачам
адаптивного и структурного управления, оптимальное управление, оптималь-
оптимальное оценивание, проблемы имитации полетов и обучения. Его исследования,
финансируемые из других источников, включают методы иммунного нейрокон-
троля; приложение нейронных сетей к проблемам диагностики и обнаружения
неисправностей реактивных двигателей (OPAD *)), автоматического обучения
и структур большой протяженности; моделирование нечетких систем в задаче
повышения устойчивости управления самолетом F-18; приложения генетиче-
генетических алгоритмов к управлению полетами, адаптивному управлению и системам
раздельного регулирования; разработку и экспериментальную проверку новой
идеи обучения вертолета зависанию, а также решение задачи реконструкции
полета по его записи с использованием устойчивых оценок. Д-р Кришнакумар
организовал ряд учебных симпозиумов по теории и применению генетических
алгоритмов, а также методам эволюционного нечеткого моделирования для
решения задач управления, в том числе с применением микропроцессорных
устройств, вычислительным проблемам искусственного интеллекта и адап-
адаптивной критике. Председатель Технического комитета по интеллектуальным
системам Американского института аэронавтики и астронавтики (AIAA), Ко-
Комитета по информационным технологиям Общества автомобильных конструк-
конструкторов (SAE), состоит в редколлегии издаваемых AIAA журналов Journal of
Aircraft и Journal of Guidance Control and Dynamics.
М-р Джеймс Нейдхофер завершает подготовку диссертации на факуль-
факультете аэрокосмического машиностроения и механики университета Алабамы
в Тускалузе. Участвует в опытно-конструкторских разработках компании Ac-
Accurate Automation Corporation в Чаттануге, штат Тенесси. Является квали-
квалифицированным специалистом в области управления с применением микропро-
микропроцессорных устройств, которая возникла на основе сочетания идей из области
искусственного интеллекта, а также современной и классической теории управ-
управления.
От англ. Optical plume anomaly detection. — Прим. перев.
Глава 13
ПРОЕКТ СОЗДАНИЯ
КОМПЬЮТЕРНОЙ ИММУННОЙ СИСТЕМЫ )
Джеффри О. Кефарт, Грегори Б. Соркин,
Мортон Свиммер, Стив Р. Уайт
Существует обоснованная точка зрения, что в течение последующих пяти
лет Интернет будет служить благодатной почвой для взращивания новых
поколений компьютерных вирусов, способных распространяться на порядки
быстрее ныне существующих. Ввиду этой угрозы мы разработали иммунную
систему для компьютеров, способную обнаруживать присутствие ранее не
известного вируса и в течение нескольких минут автоматически вырабатывать
и запускать предписание для его распознавания и удаления. В настоящее время
эта программа интегрируется в коммерческий антивирусный пакет фирмы IBM
и станет доступной для пилотных испытаний в 1997 г.
13.1. Введение
За последние 10 лет разработчики вирусов и антивирусного
программного обеспечения оказались втянутыми в постоянно
обостряющийся конфликт. Сегодня эти силы находятся в при-
примерном равновесии: компьютерные вирусы причиняют пользова-
пользователям определенные, но вполне контролируемые неудобства. При
появлении новых вирусов эксперты-разработчики антивирусов
создают предписания для их распознавания и удаления. Эта
информация встраивается в антивирусные базы данных и рассы-
рассылается конечным пользователям. Масштаб времени глобального
распространения вирусов составляет обычно несколько месяцев,
что соизмеримо с характерной скоростью обновления программ
пользователей.
Однако стремительный рост сети Интернет и появление про-
программ, игнорирующих традиционные границы между компьюте-
компьютерами, создали угрозу резкого увеличения скорости глобально-
х) Первый вариант этой главы был опубликован в сборнике трудов 7-й Меж-
Международной конференции по систематизации компьютерных вирусов (Proc. 7th
Int. Virus Bulletin Conference. Virus Bulletin Ltd., 1997).
13.1. Введение 273
го распространения вирусов. Традиционно распространение ком-
компьютерных вирусов происходило при участии не подозревавших
об этом пользователей в результате запуска зараженных про-
программ или копирования их на другой компьютер с использо-
использованием дискеты или по ftp. Однако процесс распространения
вирусов постепенно становится автоматизированным. Проблема
усугубляется тем, что в объектах типа документов или электрон-
электронных таблиц, пересылаемых между компьютерами гораздо чаще
исполняемых программ, теперь часто скрыты машинные коды
в виде макроопределений (макросов), которые могут содержать
вирусы.
Так, например, современные программы электронной почты
дают возможность рассылать документы в виде простых фай-
файловых вложений. При открытии получателем таких сообщений
происходит распознавание типов прикрепленных файлов с воз-
возможностью автоматического запуска программ, отвечающих за
их интерпретацию и отображение на экране компьютера. При
этом макросы запускаются на исполнение, что создает возмож-
возможность распространения вирусов. Отметим, что такой сценарий
существенно снижает зависимость процесса распространения ви-
вирусов от участия человека. Несколькими нажатиями мыши от-
отправитель может, ничего не подозревая, переслать зараженный
объект, исполнение которого происходит еще проще: неискушен-
неискушенные пользователи часто даже не знают, что простое открытие
полученного сообщения может автоматически привести к запус-
запуску на исполнение содержащихся в нем макросов.
По-видимому, наступление момента полной автоматизации
процесса передачи вирусов между компьютерами уже не за го-
горами. Во всяком случае, для этого уже не нужны существенные
технологические прорывы. Некоторые программы электронной
почты позволяют создавать агенты, которые рассылают или об-
обрабатывают сообщения от имени пользователя автоматически.
Можно ожидать, что вскоре вирусы научатся использовать эти
возможности, и тогда их распространение перестанет сдержи-
сдерживаться относительной медлительностью и нерасторопностью лю-
людей. Вероятно, появятся и другие способы автоматической репли-
репликации вирусов. В результате, уже через несколько лет Интернет
может быть наводнен миллионами и миллиардами мобильных
агентов — возможных носителей и распространителей новых ти-
типов вирусов, способных заставить своих хозяев быстро посещать
большое количество сайтов и заражать новых агентов. Такие ви-
вирусы смогут размножаться со скоростью, ограничиваемой лишь
временами задержек в сети и интенсивностью обработки данных.
274 Гл. 13. Проект создания компьютерной иммунной системы
Обобщая отметим, что структура компьютерных вирусов и
их способность к распространению характеризуются фундамен-
фундаментальными качественными изменениями, требующими столь же
принципиального пересмотра способов защиты от них. Резуль-
Результаты моделирования процессов распространения компьютерных
вирусов и здравый смысл диктуют необходимость уничтожения
вирусов со скоростью, превышающей скорость их распростране-
распространения. В связи с тем, что человек вскоре окажется практически
вытесненным из цепочки вирусной репликации, единственный
способ обеспечить достаточно быстрый ответ на новые вирусы
будет состоять в исключении конечных пользователей из цепоч-
цепочки ответной реакции.
Но каким образом? К счастью, природа снабдила нас уже
готовым ответом. Иммунная система высших животных обес-
обеспечивает эффективную защиту от быстро распространяющихся
и размножающихся патогенов, таких как вирусы и бактерии.
Аналогия между компьютерными и обычными вирусами навела
нас на мысль о создании прототипа иммунной системы для ки-
берпространства, способной автоматически генерировать и рас-
распространять информацию для распознавания и удаления вирусов
в течение нескольких минут с момента их первого обнаружения.
Описание взаимосвязей предложенной нами структуры и
естественной иммунной системы можно найти в работах [1,2],
а в этой главе внимание будет сосредоточено на проблемах раз-
разработки и реализации устойчивой, практичной и промышленно-
мощной иммунной системы. В следующем параграфе обсуждается
минимальный набор критериев, которым должна удовлетворять
такая система. Далее приводится сопоставление этих критериев
со свойствами прототипа компьютерной иммунной системы,
разрабатываемой нами для фирмы IBM.
13.2. Требования, предъявляемые
к компьютерной иммунной системе
В качестве основы схематического описания функции ком-
компьютерной иммунной системы сначала дадим характеристику
некоторых важных особенностей естественной иммунной систе-
системы. Затем мы определим минимальный набор требований, кото-
которым должна удовлетворять коммерческая иммунная система для
компьютеров.
При первой встрече с патогеном иммунная система позвоноч-
позвоночных и многих беспозвоночных животных вырабатывает неадап-
неадаптивный и неспецифический ответ. Первую линию защиты фор-
13.2. Требования, предъявляемые к компьютерной иммунной системе 275
мирует врожденный иммунитет, который в случае позвоночных
также вызывает развитие адаптивной иммунной реакции — спе-
специфического иммунного ответа. Для того чтобы отличить пато-
патогены от неопасных факторов, во врожденном иммунитете знание
собственных антигенов (например белков, присутствующих на
мембранах клеток организма, но не чужеродных клеток [3]) соче-
сочетается с общими представлениями об основных признаках чуже-
чужеродных организмов (например на основе распознавания двухце-
почечных РНК, имеющихся у некоторых разновидностей вирусов
в гораздо больших концентрациях, чем у млекопитающих, или
характерных пептидов, обильно продуцируемых бактериями [4]).
Врожденный иммунитет обеспечивает постоянную защиту от
патогенов, что приводит к их ослаблению или уничтожению.
Помимо врожденного иммунитета, млекопитающие обладают
более изощренными механизмами адаптивной иммунной защи-
защиты, включающими антитела, а также В- и Т-лимфоциты. При
первой встрече с патогеном образовывать слабые связи с ним или
с его фрагментами может лишь небольшое количество антител и
рецепторов иммунокомпетентных клеток, однако через несколько
дней в результате иммунного ответа образуется большое коли-
количество лимфоцитов и антител достаточно высокой аффинности
для точного распознавания и быстрой нейтрализации патогена.
С этого момента иммунная система сохраняет память о патогене
и защищена от повторных атак [5].
Компьютерная иммунная система должна содержать компо-
компоненты как врожденной, так и адаптивной иммунной защиты.
По аналогии с врожденным иммунитетом, она должна иметь
обобщенные механизмы распознавания вредных изменений, но
этого недостаточно. Как и адаптивный иммунитет, компьютерная
иммунная система должна иметь в своем арсенале специфиче-
специфические механизмы распознавания и удаления вирусов.
Объединяя эти весьма общие положения с рядом соображе-
соображений практического характера, мы сформулировали необходимый
набор требований, которые должны быть выполнены для эффек-
эффективного предотвращения быстрого распространения вирусов.
• Врожденный иммунитет. Система должна быть способна
обнаруживать присутствие большого количества незнако-
незнакомых вирусов, а также уметь распознавать ранее не встре-
встречавшиеся вирусы всех типов, такие как файловые виру-
вирусы, вирусы загрузочного сектора и макровирусы. Особенно
важно, чтобы система была адаптирована к известным ви-
вирусам, ранее уже вызывавшим серьезные сбои в работе вы-
276 Гл. 13. Проект создания компьютерной иммунной системы
числительной техники. Меньше внимания может уделяться
вирусам с низкой способностью к распространению, таким
как перезаписывающие вирусы.
• Адаптивный иммунитет. Имея один экземпляр вируса,
система должна уметь автоматически вырабатывать пред-
предписание для его обнаружения и, если возможно, для уда-
удаления всех экземпляров вируса.
• Доставка и распространение антивирусного предписа-
предписания. Система должна уметь доставлять антивирусное пред-
предписание зараженному компьютеру и способствовать рас-
распространению соответствующей информации как в локаль-
локальной окрестности сети, так и глобально — по всему миру.
• Быстродействие. Выработка и доставка антивирусного
предписания должны осуществляться быстрее скорости
распространения вируса. В настоящее время разумной за-
задачей является выработка и доставка предписания зара-
зараженному компьютеру менее чем за 10 минут с момента
первого обнаружения вируса с последующим распростране-
распространением предписания в локальной окрестности сети не более
чем за 30 мин. Система должна быть в состоянии защитить
любой компьютер в сети от нового вируса за время, не
превышающее одних суток. С развитием новых технологий,
позволяющих вирусам распространяться быстрее, эти тре-
требования будут становиться все более жесткими.
• Модульное наращивание.
Анализ. В случае быстрого распространения нового,
особо опасного вируса его атаке может одновременно
подвергнуться большое количество компьютеров в од-
одной или нескольких окрестностях сети. Поэтому систе-
система должна иметь очень высокую производительность,
обеспечивая выполнение как минимум тысячи одно-
одновременных запросов на анализ возможных вирусных
последовательностей.
Обновление. Система должна уметь обновлять ан-
антивирусные базы данных десятков миллионов компью-
компьютеров по крайней мере на ежедневной основе.
• Сохранность и надежность. Антивирусное предписание,
вырабатываемое иммунной системой, должно быть доста-
достаточно надежным и способным распространяться в сети
без участия человека. Желательно, чтобы частота лож-
ноположительных результатов и точность информации на
удаление вирусов соответствовали уровню возможностей
13.3. Реализация иммунной системы для киберпространства 277
опытных разработчиков антивирусного программного обес-
обеспечения.
• Безопасность. В процессе передачи данных образцы виру-
вирусов должны быть защищены от перехвата и чтения третьей
стороной. Что еще более важно, должна быть обеспечена
сохранность всех предписаний, вырабатываемых иммунной
системой на машине конечного пользователя.
• Потребительский контроль. Пользователи должны иметь
возможность изменять условия отправки образцов вирусов
и другой информации с их компьютеров, а также поступле-
поступления предписаний для распознавания и уничтожения виру-
вирусов и доставки их инфицированным клиентам и, возможно,
остальным пользователям. Некоторые потребители могут
захотеть иметь возможность ручного, а другие — авто-
автоматического (в интересах быстродействия) контроля этих
процессов.
Большинство имеющихся на сегодняшний день антивирусных
программных продуктов удовлетворяет лишь малой части пере-
перечисленных требований. Для распознавания неизвестных вирусов
обычно применяются различные типы эвристических алгорит-
алгоритмов. Некоторые разработчики антивирусов используют автома-
автоматизированные процедуры анализа вирусов. Однако создание и
внедрение устойчивой системы защиты от быстро распростра-
распространяющихся вирусов представляет собой трудную задачу и требует
соблюдения всех перечисленных требований. Ни одна из ныне
существующих коммерческих антивирусных программ не обес-
обеспечивает такого уровня защиты.
Оставшаяся часть главы посвящена описанию наших усилий
по разработке в рамках проекта фирмы IBM прототипа ком-
компьютерной иммунной системы, предназначенной для защиты от
вирусов миллионов реальных потребителей.
13.3. Реализация иммунной системы
для киберпространства
Вообще говоря, реализация проекта фирмы IBM по созданию
иммунной системы для киберпространства включает следующие
этапы.
1. Обнаружение неизвестного вируса на машине пользова-
пользователя.
2. Выделение экземпляра вируса и отправка его центральному
компьютеру.
278 Гл. 13. Проект создания компьютерной иммунной системы
3. Автоматический анализ вируса и выработка предписания
для его распознавания и удаления с любого устройства,
подключенного к сети.
4. Доставка предписания компьютеру пользователя, встраи-
встраивание его в антивирусные базы данных и запуск программы
для обнаружения и удаления всех копий вируса.
5. Распространение антивирусного предписания в локальной
сети пользователя и затем по всей сети.
Опишем каждый из перечисленных этапов подробнее и дадим
характеристику соответствия нашей системы общим требовани-
требованиям, изложенным в предыдущем параграфе.
13.3.1. Обнаружение неизвестных вирусов: врожденный
иммунитет. Для эффективной работы иммунная система долж-
должна уметь обнаруживать присутствие неизвестных вирусов в за-
защищаемой ею компьютерной системе. Как и в случае естествен-
естественного врожденного иммунитета, знания компьютерной иммунной
системы о себе самой (приобретаемые, например, путем отслежи-
отслеживания и анализа происходящих изменений) должны сочетаться с
общими сведениями об основных типах потенциальных патоге-
патогенов, которые можно получить, например, в результате изучения
устойчивых свойств вирусных последовательностей. Эти и дру-
другие эвристические процедуры, некоторые из которых основаны
на анализе поведения системы, можно естественным образом
встроить в существующие антивирусные программы, запускае-
запускаемые на машинах пользователей. Далее будут приведены примеры
уже используемых в IBM-антивирусе или встраиваемых в него
основных эвристических алгоритмов распознавания файловых
вирусов, вирусов загрузочного сектора и макровирусов.
Файловые вирусы. Для обнаружения неизвестных файловых
вирусов мы применяем два основных эвристических алгоритма.
Первый из них основан на методе «общей дезинфекции» [6];
второй использует классификатор, распознающий потенциальные
вирусы на основе знания типичных особенностей машинных ко-
кодов [2,7].
Эвристика метода общей дезинфекции. Основной принцип
метода заключается в том, что, имея инфицированную вирусом
программу Т1, можно, как правило, восстановить ее исходный
вид Т. Причина этого очевидна. После заражения вирусом неко-
некоторой программы лучший способ избежать немедленного обнару-
обнаружения — разрешить программе хозяина продолжить нормальную
работу. Чаще всего это означает, что вирус должен восстановить
исходный вид программы, откуда в свою очередь следует, что
13.3. Реализация иммунной системы для киберпространства 279
в конечном итоге ни один байт исходной программы не должен
быть изменен. Другими словами, для неперезаписывающих ви-
вирусов программу Т1 можно рассматривать как результат обрати-
обратимого преобразования программы J7, т. е. исходную программу Т
можно в принципе восстановить по Т'. С другой стороны, мало-
маловероятно, чтобы легальные изменения программы, например ее
обновление до новой версии, также были обратимы: слишком
многое может измениться, и, следовательно, некоторые байты,
содержащиеся в J7, будут отсутствовать в Т1.
Таким образом, если бы на основе Т1 алгоритм общей дез-
дезинфекции смог восстановить J7, то тогда с большой степенью
уверенности мы бы заключили, что программа Т1 содержит ви-
вирус. В этом случае пользователь получает инструкцию выпол-
выполнить дезинфекцию, в результате которой происходит выделение
образца вируса.
Алгоритм общей дезинфекции в программе IBM-антивирус
устроен следующим образом. В ходе инсталляции программы в
соответствующей базе данных формируются и хранятся «отпе-
«отпечатки» всех исполняемых файлов. Каждый «отпечаток» Т имеет
объем не более 100 битов и включает размер, дату создания
файла и различные контрольные суммы. В ходе последующего
сканирования системы эта информация собирается заново и со-
сопоставляется с уже имеющейся. Если произошло изменение, то
новая версия программы Т1 проверяется на наличие известных
вирусов. Если известные вирусы не обнаружены, то алгоритм
общей дезинфекции пытается восстановить исходный вид про-
программы Т и ее «отпечаток» по Т1.
В общих чертах, восстановление исходной программы про-
происходит следующим образом. Сначала данные из «отпечатка»
используются для определения номеров ячеек начала и конца Т
в Т1, скажем, b и е. Затем в случае е — b =\Т\ (\Т\ — длина Т)
вычисляется контрольная сумма байтов, находящихся между b
и е. Если контрольная сумма совпадает с исходной, содержа-
содержащейся в «отпечатке», то последовательность байтов между b
и е используется в качестве точной реконструкции Т. Если
же е — Ь > \Т\ или е < Ь, то предпринимается ряд попыток
реконструкции путем связывания в одну цепочку блоков Т\
с началом в b и блоков Т%, оканчивающихся в е, таких что
\F\\ + 1^*21 — I-?7! • Если получаемая в результате контрольная сум-
сумма совпадает с исходной, то предполагается, что реконструкция
проведена успешно.
Реализация алгоритма общей дезинфекции. Некоторые
кандидаты на реконструкцию исходной программы Т могут
280 Гл. 13. Проект создания компьютерной иммунной системы
иметь длину того же порядка, что и длина исходной программы.
Поскольку вычисление каждой конкретной контрольной суммы
требует количества вычислений, пропорционального \F\, то для
реализации «наивной» схемы алгоритма общей дезинфекции по-
потребовалось бы время, пропорциональное квадрату длины файла,
а значит для восстановления типичного исполняемого файла на
машине средней производительности потребовалось бы несколь-
несколько дней. К счастью, в случае контроля при помощи циклического
избыточного кода (CRC, от англ. cyclic redundancy check [8])
существует весьма эффективная реализация алгоритма на основе
метода хеширования Карпа-Рабина. Для сравнения последова-
последовательностей данных в этом алгоритме вычисляются все необходи-
необходимые контрольные суммы за время порядка долей секунды с ли-
линейной зависимостью времени на исполнение от длины файлов.
Для иллюстрации работы алгоритма предположим, что
е — b > IJ7]. Будем считать, что исходный файл был разделен
в неизвестной точке на два блока, Т\ и Т%, а вирус встроился
между ними. Первая гипотеза состоит в том, что разрыв
имел место вблизи точки е (предполагаемого конца исходного
файла Т)\ это проверяется стандартным вычислением контроль-
контрольной суммы. Затем генерируются успешные кандидаты путем
последовательного сдвига начала блока Т^ на один байт назад
с соответствующим сокращением расстояния от конца блока Т\.
Важный момент заключается в том, что для каждого нового
кандидата нет необходимости вычислять контрольную сумму за-
заново, ее можно быстро определить, зная предыдущую контроль-
контрольную сумму. Предположим, что байты между ячейками 6 и е в Я
имеют вид G\a ... /3G2, где суммарная длина блоков G\ и G^
равна \Т\ — 1, а а и /3 — отдельные байты. Тогда за кандидатом
на восстановление Q\aQ2 будет следовать QifiQz c изменением
ровно в одном байте.
Контрольная сумма битовой строки &n_i,...,60 на основе
CRC есть, по определению, битовая строка коэффициентов мно-
многочлена, получаемого в виде остатка от деления многочлена
Y17=o biXl+d на фиксированный неприводимый многочлен Р(х)
степени d над полем вычетов по модулю 2. Возвращаясь к бай-
байтам, линейность контрольной суммы означает, что величина 7
разности на основе исключающего ИЛИ между двумя соседними
кандидатами составляет
7 = CRC[0ia02] 0 CRC[0i/3&] = CRC[(a 0 /3), 0^1],
где 0п — последовательность п битов, равных нулю. Представ-
Представленная в виде многочлена (снова над битами), эта разность имеет
13.3. Реализация иммунной системы для киберпространства 281
вид
7
[ 8|Gl++d mod Р(ж).
Р(хЦ
Отметим, что значение Sk(x) = a^+rf mod Р(х) можно вы-
вычислить по предыдущему значению по формуле (x5k-i(x))
mod P(x). В битовом представлении эта вычислительная опера-
операция выглядит тривиально:
5k = Левый сдвиг[5/с_1] © СКС[Старший двоичный разряд(?&_1)],
где оператор левого сдвига передвигает битовую строку на одну
ячейку влево, отбрасывая старший двоичный разряд слева и об-
обнуляя самый правый бит. Поскольку после каждой успешной по-
попытки |G2| увеличивается на единицу, можно легко определить
величину 7 и> в свою очередь, CRCf^i/?^] = CRC[Q\aQ2] ©7-
Величину 7 можно эффективно вычислить и на байтовой основе
с использованием сдвигов, исключающих ИЛИ и 256-элементной
таблицы CRC для всех значений байта.
Довольно удивительно, что аналогичный трюк можно ис-
использовать в алгоритме общей дезинфекции для восстановле-
восстановления программ, инфицированных некоторыми разновидностями
перезаписывающих вирусов, модифицирующих часть исходной
программы и оставляющих длину файла без изменений [6].
Эффективность метода общей дезинфекции. Метод имеет
крайне низкую частоту появления ложноположительных резуль-
результатов. С момента его встраивания в программу IBM-антивирус в
1994 г. не было ни одного случая подтвержденного сообщения о
таких ошибках. Частота ложноотрицательных результатов также
очень низка. В лабораторных условиях алгоритм обнаруживал
свыше 99% случаев заражения неперезаписывающими вирусами.
Доля перезаписывающих вирусов составляет около 15%, при
этом ни один из них не способен успешно распространяться вви-
ввиду высокой агрессивности и неспособности долгое время оста-
оставаться незамеченным. Таким образом, метод общей дезинфекции
на практике исключительно эффективен. Существенный недо-
недостаток метода заключается в том, что вирусы обнаруживаются
лишь в тех программах, которые были известны антивирусу
до заражения. Однако если на машине пользователя файловый
вирус размножается быстро, то алгоритм общей дезинфекции
почти наверняка его обнаружит.
Классификатор. Второй алгоритм распознавания неизвест-
неизвестных вирусов — классификатор вирусов — не требует априорного
знания незараженной программы. Задача в этом случае состо-
282 Гл. 13. Проект создания компьютерной иммунной системы
ит в классификации объекта как вирусного или не-вирусного.
Классификатор строится в результате процедуры обучения. В ка-
качестве входных данных используются наборы известных вирусов
и не-вирусов. Проблема обучения классификации является слож-
сложной как в общем виде, так и в нашем конкретном приложении,
где необходимы высокая точность и надежность принимаемых
решений.
Решения, принимаемые классификаторами, основываются на
наличии или отсутствии некоторых признаков, в данном слу-
случае — коротких последовательностей битов, общих для отдель-
отдельных разновидностей вирусов. Кандидаты в признаки ищутся на
основе массивов признаков — стандартной структуры данных
для текстовых алгоритмов [10]. Классификатор представляет со-
собой простой разделитель-гиперплоскость: подсчитывается общее
количество вхождений признаков в изучаемый образец данных,
эти величины умножаются на соответствующие веса и склады-
складываются, при этом образец считается предположительно инфици-
инфицированным, если сумма превышает некоторое пороговое значение.
Задача выбора признаков из тысяч повторяющихся последова-
последовательностей данных и определения их весов чрезвычайно сложна.
Применение стандартных методов в этом случае неэффективно
ввиду крайне низкой производительности соответствующих ал-
алгоритмов. Используемые нами способы преодоления этих труд-
трудностей будут описаны в дальнейших публикациях, в настоящее
время они оформлены в виде двух заявок на изобретение.
Классификатор файловых вирусов содержит около тысячи
5-байтовых признаков. В целях маскировки некоторые вирусы ис-
используют простой способ кодирования, состоящий в применении
операции исключающее ИЛИ к машинному коду с повторяю-
повторяющейся одно- или двухбитовой кодовой последовательностью. Для
выявления таких последовательностей используемые нами при-
признаки представляют собой преобразованные фрагменты машин-
машинного кода, причем эти преобразования инвариантны относитель-
относительно вышеупомянутого способа кодирования. Например, 5-битовый
признак, получаемый из 7-битового фрагмента F1626364656567)
есть последовательность (Ь\ © 63, 62 © 64, 63 © 65, 64 © бе, 65 © 67}.
Классификация файла осуществляется на основе вычисления
взвешенной суммы количества вхождений в него различных при-
признаков.
Предварительные испытания показывают, что классификатор
способен обнаружить около 85% вирусов, на которых он не обучал-
обучался. Предполагается, что с развитием методов проверки на ложную
положительность результатов частота обнаружения вирусов должна
13.3. Реализация иммунной системы для киберпространства 283
несколько снизиться. Однако мы ожидаем, что после объеди-
объединения методов общей дезинфекции и классификации IBM-анти-
IBM-антивирус будет способен обнаружить примерно 99% новых файло-
файловых вирусов, распространяющихся в естественных условиях.
Вирусы загрузочного сектора. Также был разработан клас-
классификатор вирусов загрузочного сектора (в действительности он
появился раньше других). Процедура обучения осуществлялась
на множестве, состоящем из нескольких сотен легальных и ин-
инфицированных загрузочных секторов [2].
Классификатор использует около 30 трех- и четырехбайтовых
незашифрованных текстовых фрагментов. Несмотря на то, что
эти фрагменты были получены автоматически, они оказались
семантически значимы. Многие из них содержались в набо-
наборе общих сигнатур загрузочного сектора, выделенных вручную
опытными экспертами.
Частота ложноположительной классификации загрузочных
секторов как зараженных вирусами очень мала, но в некоторых
случаях это все же происходит за счет специальных загрузочных
секторов, обеспечивающих повышенный уровень безопасности
компьютера и проявляющих активность, аналогичную вирусной.
С момента внедрения фирмой IBM нейросетевого детектора ви-
вирусов в 1994 г., эта программа обнаружила около 75% от всех
вирусов загрузочного сектора. Последние достижения в этом
направлении включают использование эмулятора для распозна-
распознавания любых других специальных секторов и дешифровку на-
находящихся в них данных до начала классификации. Это уже
позволило увеличить частоту обнаружения вирусов примерно до
90%, и ожидаются дальнейшие улучшения.
Макровирусы. В настоящее время большинство новых мак-
макровирусов является простой разновидностью уже известных.
Следовательно, алгоритм на основе нечеткой логики с исполь-
использованием простых сигнатур позволяет выявлять до 2/3 новых
макровирусов. Вместе с тем, мы разрабатываем и другие методы,
такие как обучение классификатора непосредственно на макро-
макровирусах. Предполагается, что это позволит увеличить частоту
выявления макровирусов до уровня, соответствующего файло-
файловым вирусам и вирусам загрузочного сектора. Для достижения
баланса между минимальной частотой ложноотрицательных и
ложноположительных результатов необходимо разработать более
эффективные алгоритмы распознавания последних.
13.3.2. Выделение и пересылка образца вируса. После
обнаружения потенциального вируса соответствующие данные
копируются и сжимаются. К этой информации присоединяются
284 Гл. 13. Проект создания компьютерной иммунной системы
сведения о разновидности вируса, о версии антивирусной про-
программы и другая информация, а полученный результат шифру-
шифруется. Затем зараженная вирусом клиентская машина отправляет
зашифрованные данные по безопасному протоколу на машину
администратора, которая проверяет легальность версии IBM-
антивируса, установленной на машине пользователя.
Администратор имеет возможность просмотра данных на
предмет отсутствия авторизованных или уязвимых данных (на-
(например паролей пользователей) или программ. По своему усмот-
усмотрению администратор может выбрать такие установки програм-
программы, при которых информация о вирусах будет отправляться
автоматически. В коммерческой версии компьютерной иммунной
системы информация будет доставляться через сеть Интернет к
концентратору, расположенному вне корпоративной сети и сети
IBM, где будут также собираться данные со всех остальных до-
доменов. Вторая машина будет обеспечивать проводку этих данных
через брандмауэр IBM, а третья — в лабораторию иммунной
системы. Затем информация о вирусе будет проанализирована
адаптивной иммунной системой, ответная реакция которой за-
заключается в выработке средств обнаружения и удаления всех
экземпляров вируса.
13.3.3. Выработка антивирусного предписания: адаптив-
адаптивная иммунная система. Адаптивную компоненту компьютер-
компьютерной иммунной системы можно представлять себе в виде аналога
совокупности антител, В- и Т-лимфоцитов, а также других эле-
элементов биологического приобретенного иммунитета. В настоящее
время она находится вне машины пользователя из соображений
быстродействия (реализация заложенных в нее алгоритмов тре-
требует большого количества ресурсов процессора и памяти), удоб-
удобства (есть возможность сосредоточить усилия на одной платфор-
платформе) и безопасности (ввиду необходимости использования базы
данных инфицированных файлов) 0.
В момент получения данных адрес отправителя регистрирует-
регистрируется, а образец вируса и сопутствующая информация извлекаются
и дешифруются. Образец вируса проверяется с использованием
последней версии файла сигнатур, так как возможно, что на
х) Со временем выгодно децентрализовать процедуру анализа вирусов
вплоть до независимого функционирования врожденной и адаптивной иммун-
иммунной систем на каждом компьютере. Это лучше соответствует биологическому
аналогу и, что более важно, дает возможность использования различными ком-
компьютерами разных сигнатур одного и того же вируса. Интересное обсуждение
преимуществ такого подхода имеется в работе Форрест и др. [11].
13.3. Реализация иммунной системы для киберпространства 285
машине пользователя он немного устарел. Этот этап особенно ва-
важен в случае быстро распространяющихся вирусов, информация
о которых может доставляться анализатору вирусов в большом
количестве и практически одновременно со многих компьютеров.
Если вирус уже известен, то соответствующие предписания для
его обнаружения и удаления могут быть отправлены зараженно-
зараженному компьютеру немедленно. В противном случае информация о
вирусе используется для подготовки соответствующей среды для
его репликации или для отправки образца вируса на машину,
где такая среда уже имеется. Таким образом, файловые вирусы
и вирусы загрузочного сектора отправляются эмулятору (или
реальной машине с соответствующей платформой), макровирусы
Microsoft Word — в среду Windows NT с установленными про-
программами Office 95 и Office 97 0, и так далее.
Как только образец вируса помещается в соответствующую
среду, создаются благоприятные условия для его размножения.
Если это действительно происходит, то в ходе последующего
анализа определяются части вирусной программы, пригодные
для выделения сигнатуры и других целей. Затем в процессе
автосеквенирования применяется метод сравнения с эталоном
для выявления особенностей процесса заражения вирусом и его
базовой структуры. Так вырабатывается предписание для обна-
обнаружения и удаления вируса и выделяется его сигнатура. В итоге,
данные о вирусе проверяются и встраиваются в файлы данных,
содержащие полную информацию обо всех известных вирусах.
Обновленные файлы отправляются зараженной машине.
Для большинства вирусов на двухпроцессорной машине Pen-
Pentium Pro PC 200 МГц с установленной операционной системой
Windows NT вся процедура занимает менее 2 минут. В оставшей-
оставшейся части параграфа ее этапы рассматриваются более подробно.
Репликация вирусов. Образец вируса помещается в соответ-
соответствующую среду с возможностью заражения множества разнооб-
разнообразных программ-приманок. Для вирусов, заражающих исполняе-
исполняемые файлы, предлагается несколько десятков программ-приманок
в форматах .com и .ехе; для вирусов загрузочного сектора имеет-
имеется несколько образов флоппи- и жестких дисков; для макрови-
макровирусов подобран ряд документов и электронных таблиц.
Некоторые вирусы заражают объект лишь при его исполь-
использовании. Поэтому иммунная система читает, запускает на ис-
1) Макроязык, используемый в программе Microsoft Office 97 (VBA5),
несколько отличается от предыдущей версии, но имеет обратную совмести-
совместимость, поэтому вирусы могут размножаться в обеих версиях программ.
286 Гл. 13. Проект создания компьютерной иммунной системы
полнение, копирует программы-приманки и выполняет другие
манипуляции с ними. Существуют вирусы, ведущие активный
поиск объектов заражения. Приманки для них помещаются в
такие участки памяти, где находятся часто используемые про-
программы. Для вирусов, заражающих исполняемые файлы, это
корневая, текущая и другие директории в открытом каталоге.
При каждом новом запуске инфицированного файла имеется
вероятность, что в качестве очередной жертвы вирус выберет
одну из программ-приманок.
Программы-приманки периодически проверяются на предмет
изменений. Если изменение произошло, то почти наверняка в
системе присутствует неизвестный вирус, и каждая из модифи-
модифицированных программ-приманок содержит образец вируса. Во
избежание случайного копирования образцы вирусов тщательно
охраняются. Так как вирусы могут проявлять избирательность
к условиям размножения, программы-приманки запускаются при
различных параметрах среды. Например, могут изменяться те-
текущая дата и версия операционной системы, а также другие
параметры. Это увеличивает шансы вирусов на размножение
и вместе с тем позволяет оценить степень изменчивости вируса
в зависимости от параметров.
Анализ поведения. Для файловых вирусов и вирусов загру-
загрузочного сектора процесс копирования происходит в режиме эму-
эмуляции. При этом эмулятор создает подробный протокол работы
системы. После создания вирусной копии протокол анализирует-
анализируется экспертной системой, которая выявляет различные особенно-
особенности поведения вируса [12, 13]. Например, в случае файловых ви-
вирусов экспертная система дает информацию о типах заражаемых
вирусом исполняемых файлов, о статусе вируса (резидентный
или нет), а также об условиях заражения вирусом своих жертв
(например, зараженный файл был только что открыт, закрыт,
запущен на исполнение и т.п.). В итоге эта информация будет
автоматически внесена в справочный файл описания вируса для
пользователей и экспертов.
Репликация вирусов в режиме эмуляции имеет то преимуще-
преимущество, что дает нам информацию о поведении вируса, позволяя
автоматизировать процесс решения задачи и изолируя вирус,
находящийся в активном состоянии, от остальной части систе-
системы. Недостаток заключается в практической неосуществимости
качественной эмуляции. В настоящее время у нас имеется эму-
эмулятор процессора 80386 в режиме реального времени. В качестве
альтернативы имеется также аппаратное решение, однако ввиду
13.3. Реализация иммунной системы для киберпространства 287
недостатка быстродействия в создаваемую автоматизированную
систему оно еще не интегрировано.
Макровирусы размножаются аналогичным образом. В случае
макровирусов Word для Windows эта программа помещается в
защищенную среду Windows NT. Word управляется программой,
написанной на макроязыке, которая запускает вирус и пытается
инфицировать различные программы-приманки. После копирова-
копирования вирусной программы результаты аккумулируются, а среда
восстанавливается.
Выделение программ и данных. Для выполнения этапов ав-
тосеквенирования и автоматического выделения сигнатуры необ-
необходимо знать, какая часть вирусов является исполняемым кодом
(программой), а какая — данными. Для файловых вирусов и
вирусов загрузочного сектора используется модифицированный
эмулятор процессора 80386. После завершения эмуляции запу-
запущенные на исполнение части вируса отождествляются с програм-
программой, а остальные помечаются как данные.
Автосеквенирование. Имея несколько пар незараженных и
зараженных вирусом программ-приманок, мы применяем алго-
алгоритмы сопоставления с эталоном для извлечения информации о
структуре вируса и способе его прикрепления к любому сетевому
устройству [14,15].
Сначала проводится сравнение программ внутри каждой пары
файлов (незараженный, зараженный) для определения вирусных
последовательностей, имеющихся лишь в зараженных файлах,
а также их локализации. Затем из таких последовательностей
выделяются структуры, постоянные для всех пар. При этом, как
и ранее, сравнение проводится с учетом возможности простого
шифрования. Наконец, делается попытка определить локали-
локализацию частей исходной программы, которые могут находиться
в одной из вариабельных областей вируса. Наглядный пример
результатов, получаемых на этом этапе, показан на рис. 13.1.
Вариабельная область
Исходна я программа
1Г
Заголовок вируса Заголовок исходной программы
Рис. 13.1. Схематическое представление способа прикрепления и структура
автоматически выделенного вируса TASH490
288 Гл. 13. Проект создания компьютерной иммунной системы
Анализ процесса автосеквенирования позволяет получить
несколько важных результатов.
1. Определить локализацию всех частей исходной программы
в инфицированном файле, независимо от ее содержания
и длины. Эта информация автоматически переводится на
используемый IBM-антивирусом язык восстановления по-
поврежденных программ.
2. Установить локализацию и строение всех частей вируса.
Информация о структуре включает содержимое тех участ-
участков вируса, которые оказались инвариантными для различ-
различных образцов одного и того же вируса на этапе выделения
программ и данных и, кроме того, были классифицированы
как программа. Полученная информация автоматически пе-
переводится на язык верификации, используемый IBM-анти-
IBM-антивирусом, и передается для дальнейшей обработки в модуль
автоматического выделения сигнатуры.
Автоматическое выделение сигнатуры. Среди всех байто-
байтовых последовательностей, генерируемых на этапе автосеквениро-
автосеквенирования, необходимо тщательно выбрать сигнатуру во избежание
как ложноотрицательных, так и ложноположительных результа-
результатов. Это означает, что такая сигнатура должна присутствовать
в каждом экземпляре вируса и практически никогда не встре-
встречаться в неинфицированных программах.
Рассмотрим сначала проблему минимизации количества лож-
ложноотрицательных результатов. Образцы вирусов, обнаруживае-
обнаруживаемые при помощи программ-приманок, могут не представлять
всего спектра изменчивости вируса. Как правило, неисполняемые
части вирусных программ («данные»), содержащие числовые кон-
константы, символьные строки и рабочие области вычислений, по
своему смыслу более изменчивы, чем «программные» последова-
последовательности, задаваемые в виде машинных команд. В целях предо-
предосторожности части вируса, интерпретируемые как «данные», ис-
исключаются из списка возможных сигнатур. Идеальные входные
данные для выделения сигнатуры — это последовательности
байтов, инвариантные в отношении процедуры автосеквенсинга
и классифицируемые как «программы».
Таким образом, перед выделителем сигнатуры остается про-
проблема минимизации частоты ложноположительных результатов.
В случае естественной иммунной системы ее элементы, взаимо-
взаимодействующие с собственными клетками и тканями организма, вы-
вызывают развитие аутоиммунных заболеваний. В случае же антиви-
антивирусных программ ложноположительные результаты их работы
13.3. Реализация иммунной системы для киберпространства 289
всегда вызывают сильное раздражение пользователей и настоль-
настолько выводят из себя производителей ложно скомпрометированного
программного обеспечения, что у всех основных разработчиков
антивирусов можно при желании всегда обнаружить как мини-
минимум одно проигранное судебное разбирательство такого рода.
Вкратце, автоматический выделитель сигнатуры изучает каж-
каждую последовательность входных данных, состоящую из S сле-
следующих друг за другом байтов (называемых «кандидатами на
сигнатуру»), и оценивает вероятность того, что данная после-
последовательность содержится в обычных неинфицированных про-
программах. Чаще всего величина S выбирается из интервала от
16 до 24. Вероятностная оценка строится на основе входных
данных путем формирования списка всех последовательностей
длиной не более 5 байт, подсчета частоты их встречаемости в
множестве данных, состоящем из примерно 20 тысяч неинфици-
неинфицированных программ общим объемом около 1 Гб, и использования
простых формул марковской модели для преобразования частот
в вероятностную оценку того, что рассматриваемый кандидат на
сигнатуру окажется в наборе программ, статистически сходном
с рассматриваемым множеством. В конечном итоге, в качестве
сигнатуры выбирается последовательность с наименьшей оцен-
оценкой вероятности ложноположительного результата.
Опыт применения данного подхода показывает, что в абсо-
абсолютном выражении вероятностные оценки получаются низкие,
так как программы лучше коррелируют между собой на последо-
последовательностях данных длиной более 5 байт. Однако относитель-
относительный порядок кандидатов на сигнатуру в получаемой классифика-
классификации часто оказывается правильным, поэтому в результате обычно
выделяется одна из лучших сигнатур [16]. До встраивания в
программу IBM-антивируса выделитель сигнатур использовался
в течение нескольких лет. Судя по низкой частоте ложнополо-
жительных результатов по сравнению с другими антивирусными
программами, способность данного алгоритма генерировать хо-
хорошие сигнатуры выше обычно достигаемой опытным экспертом.
Проверка и встраивание в антивирусную базу данных.
Выделенная сигнатура проверяется на способность обнаруживать
все имеющиеся образцы вируса (включая исходный образец)
и на отсутствие ложноположительных результатов на множе-
множестве неинфицированных программ. Для того чтобы убедиться
в правильности восстановления функционально эквивалентной
версии исходной программы, предписание на удаление вируса
проверяется на каждой инфицированной программе-приманке.
При желании этап вирусной репликации можно повторить с но-
10 Д.Дасгупта
290 Гл. 13. Проект создания компьютерной иммунной системы
вым набором программ-приманок, на котором выделенная сиг-
сигнатура проверяется вместе с информацией на удаление. Если
антивирусное предписание успешно проходит проверку, то оно
автоматически добавляется в файл данных, содержащий полную
информацию обо всех известных вирусах.
13.3.4. Доставка предписания. В конечном итоге обнов-
обновленный файл данных возвращается клиенту, от которого был
получен образец вируса. В существующем прототипе компьютер-
компьютерной иммунной системы обновление высылается непосредственно
клиентской машине. В коммерческой версии оно возвращается
по пути, пройденному образцом вируса при его получении: прово-
проводится через брандмауэр лаборатории иммунной системы, брандмау-
брандмауэр IBM, концентратор, и, наконец, — через брандмауэр и сервер
клиентской компании, с доставкой зараженному компьютеру.
13.3.5. Распространение предписания. Получив антиви-
антивирусное предписание, администратор автоматически рассылает
его всем потенциально зараженным машинам, в числе которых
находится и компьютер, на котором вирус был первоначально
обнаружен.
В существующем прототипе и планируемом коммерческом
варианте компьютерной иммунной системы после получения об-
обновления на каждом компьютере в фоновом режиме автомати-
автоматически запускается IBM-антивирус. В системе отыскиваются все
имеющиеся копии вируса, и пользователь получает возможность
удалить их.
В коммерческой версии системы основной файл данных
с информацией о вирусах может быть выставлен на сайте
www.av.ibm.com в режиме открытого доступа. В результате, при
условии достаточно частой загрузки обновлений, подписчики со
всего мира были бы защищены от новых вирусов вскоре после
их обнаружения.
13.4. Замечания и выводы
Вернемся к требованиям, рассмотренным в п. 13.2 (ниже они
перечислены курсивом), и обсудим степень соответствия описан-
описанной в п. 13.3 текущей версии искусственной иммунной системы
каждому из них.
• Врожденный иммунитет. Система должна быть спо-
способна обнаруживать присутствие большого количества
незнакомых вирусов, а также уметь распознавать ранее
не встречавшиеся вирусы всех типов, такие как файло-
13.4. Замечания и выводы 291
вые вирусы, вирусы загрузочного сектора и макровирусы.
Особенно важно, чтобы система была адаптирована
к известным вирусам, уже вызывавшим серьезные сбои
в работе вычислительной техники. Меньше внимания
может уделяться вирусам с низкой способностью к рас-
распространению, таким как перезаписывающие вирусы.
Процент выявления файловых вирусов составляет 99%, а
вирусов загрузочного сектора — 90%. Для файловых виру-
вирусов оценка получена путем усреднения данных для непе-
резаписывающих вирусов, что представляется оправдан-
оправданным, поскольку остальные вирусы не способны к широкому
распространению в обычных условиях. Частота выявления
макровирусов в настоящее время неприемлемо низкая и со-
составляет 65%, однако ожидается, что благодаря разработке
новых методов к моменту начала пилотных испытаний про-
программы в конце этого года данный показатель увеличится
как минимум до 90%.
• Адаптивный иммунитет. Имея один экземпляр вируса,
система должна уметь автоматически вырабатывать
предписание для его обнаружения и, если возможно, для
удаления всех экземпляров вируса.
Используя один экземпляр файлового вируса или макрови-
макровируса, прототип адаптивной иммунной системы может про-
продуцировать достаточный запас вирусных копий. (Меньше
внимания уделялось задаче репликации вирусов загрузоч-
загрузочного сектора, поскольку вероятность быстрого распростра-
распространения таких вирусов в сети Интернет гораздо ниже.) В слу-
случае успешного копирования вируса почти всегда удавалось
выделить его сигнатуру, в том числе даже для зашиф-
зашифрованных вирусов. Для файловых вирусов автоматическое
выделение информации на восстановление может оказаться
трудной задачей, поэтому процент успеха здесь ниже, чем
для выделения сигнатуры. Для макровирусов оба этих по-
показателя близки к 100%.
• Доставка и распространение антивирусного предписа-
предписания. Система должна уметь доставлять антивирусное
предписание зараженному компьютеру и способство-
способствовать распространению соответствующей информации
как в локальной окрестности сети, так и глобально —
по всему миру.
В существующем прототипе программы предписание отправ-
отправляется адаптивной иммунной системой непосредственно
зараженному компьютеру. Предполагается, что в коммерче-
ю*
292 Гл. 13. Проект создания компьютерной иммунной системы
ской версии программы предписание будет доставляться за-
зараженному компьютеру, распространяться исполнительным
модулем IBM-антивируса в его локальной сетевой окре-
окрестности и станет доступным для всей сети путем загруз-
загрузки обновлений с сайта www.av.ibm.com.
• Быстродействие. Выработка и доставка антивирусного
предписания должны осуществляться быстрее распро-
распространения вируса. В настоящее время разумной задачей
является выработка и доставка предписания заражен-
зараженному компьютеру менее чем за 10 минут с момента
первого обнаружения вируса с последующим распростра-
распространением предписания в локальной окрестности сети не
более чем за 30 мин. Система должна быть в состоянии
защитить любой компьютер в сети от нового вируса
за время, не превышающее одних суток. С развитием
новых технологий, позволяющих вирусам распростра-
распространяться быстрее, эти требования будут становиться все
более жесткими.
Прототип иммунной системы удовлетворяет всем перечис-
перечисленным выше требованиям быстродействия. С момента по-
получения образца вируса до выработки предписания для об-
обнаружения и удаления файлового вируса обычно проходит
менее 2 минут, и около 5 минут — для удаления макрови-
макровируса. Даже если добавить несколько минут, затрачиваемых
на доставку образца вируса на сайт IBM и отправку с него
соответствующего предписания, то указанные требования
останутся заведомо выполненными. Доставка предписания
другим машинам в локальной сетевой окрестности компью-
компьютера, распознавшего вирус, будет обеспечиваться за счет
простого расширения возможностей программного обеспе-
обеспечения IBM-антивируса, дающего возможность системным
администраторам обновлять базы данных сотен или тысяч
клиентских машин. Даже по осторожной оценке, потре-
потребуется не более четверти часа для доставки обновления,
скажем, тысяче клиентов. Наконец, обновление находяще-
находящегося в открытом доступе файла данных IBM-антивируса
позволит защитить от нового вируса большое количество
пользователей в течение нескольких часов с момента его
обнаружения.
• Модульное наращивание
Анализ. В случае быстрого распространения нового
особо опасного вируса его атаке может одновременно
подвергнуться большое количество компьютеров в одной
13.4. Замечания и выводы 293
или нескольких окрестностях сети. Поэтому система
должна иметь очень высокую производительность, обес-
обеспечивая выполнение как минимум тысячи одновремен-
одновременных запросов на анализ возможных вирусных последова-
последовательностей.
Пилотная версия программы будет одновременно справ-
справляться с ограниченным объемом запросов. По замыслу
разработчиков, конечная версия иммунной системы сможет
обрабатывать большое количество одновременных запросов.
Обновление. Система должна уметь обновлять ан-
антивирусные базы данных десятков миллионов компью-
компьютеров по крайней мере на ежедневной основе.
Пользователи смогут загружать обновления через Интер-
Интернет, что позволит защитить их компьютеры через короткое
время после обнаружения нового вируса.
Сохранность и надежность. Антивирусное предписание,
вырабатываемое иммунной системой, должно быть до-
достаточно надежным и способным распространяться в
сети без участия человека. Желательно, чтобы часто-
частота ложноположительных результатов и точность ин-
информации на удаление вирусов соответствовали уровню
возможностей опытных разработчиков антивирусного
программного обеспечения.
Результаты испытаний свидетельствуют, что алгоритм ав-
автоматического выделения сигнатуры приводит к ошибоч-
ошибочным результатам реже, чем результаты работы опытных
специалистов [16]. Автоматически получаемая информа-
информация для удаления вирусов, как правило, очень надежная.
В совокупности с точной идентификацией вируса перед
его уничтожением в зараженной программе это приводит
к очень низкой вероятности появления ошибочного восста-
восстановления данных на основе автоматически вырабатываемо-
вырабатываемого предписания. Относительная частота ошибок оказалась
много меньше 10%, получаемых при работе аналогичного
антивируса, использующего предписания, полученные че-
человеком-экспертом.
Безопасность. В процессе передачи данных образцы ви-
вирусов должны быть защищены от перехвата и чтения
третьей стороной. Что еще более важно, должна быть
обеспечена сохранность всех предписаний, вырабатыва-
вырабатываемых иммунной системой на машине конечного пользо-
пользователя.
294 Гл. 13. Проект создания компьютерной иммунной системы
Компьютерная иммунная система использует стандартные
протоколы безопасности. Для предотвращения несанкцио-
несанкционированного доступа выполняется шифрование выделен-
выделенных образцов вирусов, а для проверки легальности ис-
источников образцов вирусов, антивирусных предписаний и
обновлений используются электронные цифровые подписи.
• Потребительский контроль. Пользователи должны
иметь возможность изменять условия отправки образ-
образцов вирусов и другой информации с их компьютеров, а
также поступления предписаний для распознавания и
уничтожения вирусов и доставки их инфицированным
клиентам и, возможно, остальным пользователям. Не-
Некоторые потребители могут захотеть иметь возмож-
возможность ручного, а другие — автоматического (в интере-
интересах быстродействия) контроля этих процессов.
Во избежание неосторожного обращения с конфиден-
конфиденциальной информацией, после выхода коммерческой
версии иммунной системы администраторы могут захотеть
контролировать содержание данных об образцах вирусов,
посылаемых в IBM. Поэтому будет всегда предусмотрена
возможность ручной коррекции посылаемых сообщений,
однако по мере разработки и внедрения механизмов
контроля, снижающих вероятность подобных эффектов,
администраторы могут постепенно перейти на автомати-
автоматическую рассылку вирусов. Аналогично, должна всегда
существовать возможность ручной проверки доставки
предписания зараженному компьютеру и другим машинам
в сети, но мы полагаем, что доля системных админи-
администраторов, предпочитающих получать автоматические
обновления, будет постепенно расти.
Таким образом, существующий прототип компьютерной им-
иммунной системы удовлетворяет многим, но не всем из пере-
перечисленных требований. В связи с тем, что выпуск пилотной
версии программы планируется уже в 1997 г., наша первооче-
первоочередная задача связана с разработкой и проверкой эффективности
методов повышения частоты обнаружения новых макровирусов,
с окончательной доводкой протоколов передачи данных между
управляющим и клиентским модулями IBM-антивируса, а также
с доработкой сетевого программного обеспечения, осуществляю-
осуществляющего пересылку образцов вирусов и антивирусных предписаний.
Компьютерная иммунная система разрабатывалась нами для
фирмы IBM на протяжении нескольких лет. К настоящему вре-
Список литературы 295
мени конструкция иммунной системы и ее отдельных составляю-
составляющих защищена шестью патентами США [6,7, 15, 17-19].
Авторы благодарят своих коллег из лаборатории высокоточ-
высокоточных вычислений фирмы IBM, и лично Билла Арнольда, Дэйва
Чесса и Эда Принга, за многочисленные обсуждения проблем
автоматического анализа вирусов и строения иммунной систе-
системы. Идея использования программ-приманок принадлежит Бил-
Биллу Арнольду и Дэйву Чессу.
В разработке адаптивной иммунной системы принимали уча-
участие Джон Эвансон, Риад Суисси, Билл Шнейдер, Фредерик
Перрио, Жан-Мишель Буле, Хоман Вассеф и Август Петрилло.
Основной вклад в разработку классификатора вирусов внесли
Александр Морин и Джеральд Тезауро.
Список литературы
1. Kephart J. О. A biologically inspired immune system for computers //
Artificial Life IV. Proc. of the 4th International Workshop on the Syn-
Synthesis and Simulation of Living Systems (Eds. R. A. Brooks, P. Maes).
MIT Press, 1994. P. 130-139.
2. Kephart /. 0. et al. Biologically inspired defenses against computer
viruses // Proc. IJCAI'95, Montreal, August 19-25, 1995. P. 985-
996.
3. Janeway С A. Jr. How the immune system recognizes invaders //
Sci. Am. 1993. V.269, №3. P. 72-79.
4. Marrack P., Kappler J. W. How the immune system recognizes the
body // Sci. Am. 1993. V.269, №3. P. 81-89.
5. Paul W. E. (Ed.) Immunology: Recognition and Response... Readings
from Scientific American. N.Y.: W. H. Freeman, 1991.
6. Kephart J. 0., Sorkin G.B. Generic disinfection of programs infected
with a computer virus. US Patent 5 613002, March 1997.
7. Kephart J. 0., Sorkin G. B., Tesauro G. J., White S. R. Adaptive sta-
statistical regression and classification of data strings, with application
to the generic detection of computer viruses. US Patent 5 675 711,
October 1997.
8. Bertsekas D., Gallager R. Data networks. Englewood Cliffs, NJ:
Prentice-Hall, 1987.
9. Karp R.M., Rabin M. 0. Efficient randomized pattern-matching algo-
algorithms // IBM J. Res. Dev. 1987. V.31. P. 249-260.
10. Crochemore M., Rytter W. Text algorithms. N.Y.: Oxford University
Press, 1994.
11. Forrest S., Somayaji A., Ackley D.H. Building diverse computer
systems // Proc. 6th Workshop on Hot Topics in Operating Systems,
IEEE Computer Society Press, Los Alamitos, CA, 1997. P. 67-72.
296 Гл. 13. Проект создания компьютерной иммунной системы
12. Swimmer M. Dynamic detection and classification of computer
viruses using general behavior patterns // Proc. 5th Interna-
International Virus Bulletin Conference. Virus Bulletin Ltd., 1995.
P. 75-88.
13. Swimmer M. Fortschrittliche Virus-Analyse — Die Benutzung von
statischer und dynamischer Programm-Analyse zur Bestimmung von
Virus-Charakteristika. Master's Thesis, Fachbereich Informatik, Uni-
versitaet Hamburg, May 1995.
14. Arnold W. C, Sorkin G. B. Automated analysis of computer viruses //
Proc. 6th International Virus Bulletin Conference. Virus Bulletin Ltd.,
1996. P. 149-159.
15. Chess D.M., Kephart J.O., Sorkin G.B. Automatic analysis of a
computer virus's structure and means of attachment to its hosts. US
Patent 5485 575, September 1995.
16. Kephart J. 0., Arnold W. C. Automatic extraction of computer virus
signatures // Proc. 4th International Virus Bulletin Conference. Virus
Bulletin Ltd., 1994. P. 179-194.
17. Arnold W.C., Chess D.M., Kephart J.O., White S. R. Automatic
immune system for computers and computer networks. US Patent
5440 723, August 1995.
18. Kephart /. 0. Method and apparatus for evaluating and extracting sig-
signatures of computer viruses and other undesirable software entities.
US Patent 5452 442, September 1995.
19. Arnold W. C, Chess D.M., Kephart /. 0., Sorkin G.B., White S.R.
Searching for patterns in encrypted data. US Patent 5442 699, Au-
August 1995.
Глава 14
ИММУННЫЙ АЛГОРИТМ
ОБНАРУЖЕНИЯ АНОМАЛИЙ
Дипанкар Дасгупта, Стефани Форрест
Обнаружение аномалий в поведении системы или процессов является
важной задачей для многих приложений, таких как поточно-массовое произ-
производство, мониторинг и обработка сигналов. В этой главе представлен алго-
алгоритм обнаружения аномалий, созданный на основе представлений о механизме
отрицательного отбора в иммунной системе, способной отличать свое от чу-
чужого. В нашем случае свое определяется как нормальный образец данных,
а чужое — как любое отклонение от нормы, превышающее допустимые пре-
пределы. Описаны эксперименты по применению алгоритма для двух наборов
данных: временных рядов, генерируемых уравнением Макея-Гласса и моделью
результатов измерений. В отличие от других методов, этот метод не требует
априорной информации о всех возможных сбоях в работе системы. Приводятся
результаты, иллюстрирующие эффективность работы алгоритма.
14.1. Введение
Нормальное поведение системы часто характеризуется дис-
дискретными временными рядами наблюдений. В этом случае про-
проблему обнаружения аномалий можно сформулировать как задачу
нахождения недопустимых отклонений в характеристиках систе-
системы. Решение этой задачи имеет важное значение для многих
динамических систем и систем диагностики. В приложениях
с особыми требованиями к обеспечению безопасности для мини-
минимизации возможных ухудшений рабочих характеристик системы
важно обнаружить появление необычного события как можно
раньше. Это возможно при постоянном мониторинге структуры
и/или функции системы на предмет отклонений от нормальных
характеристик. Например, процессы сверления или высокоско-
высокоскоростного дробления требуют постоянного контроля для гаран-
гарантии качества продукции; устройства типа реактивного двигателя
требуют постоянного контроля для обеспечения безопасности
работы.
Для обнаружения аномалий и сбоев в работе мониторируе-
мых систем были предложены различные методы, включая кон-
298 Гл. 14. Иммунный алгоритм обнаружения аномалий
трольные карты [21], методы моделирования [15], использование
экспертных систем с базами знаний [13], распознавание образов
и кластеризацию [25], скрытые марковские модели [23] и нейрон-
нейронные сети [16]. Методы, основанные на использовании нейронных
сетей для обнаружения аномалий, получают в последние годы
все большее распространение [2,18], из них особое внимание
привлекли два подхода: многослойные перцептроны (MLP) [20]
и теория адаптивного резонанса (ART) [14,22].
Однако для большинства методов требуется наличие апри-
априорной информации о различных условиях возникновения ано-
аномалий [16] или точная теоретическая модель мониторируемой
системы. Но робастный метод должен выявлять любые непри-
неприемлемые (новые) изменения, а не искать их среди заранее из-
известного множества событий. В этой главе изучается один из
возможных методов, лишенных такого рода недостатков. В сле-
следующем параграфе излагаются основы иммунного алгоритма
обнаружения. Его применение для решения задачи выявления
аномалий описано в п. 14.3, включая предварительную обработку
данных и особенности процесса генерации набора детекторов
для мониторинга. В п. 14.4 приводятся результаты эксперимен-
экспериментов с характеристикой эффективности предложенного алгоритма
при различных значениях управляющих параметров. Основные
выводы сформулированы в п. 14.5.
14.2. Алгоритм отрицательного отбора
Предлагаемый подход основан на приемах обработки ин-
информации, используемых в иммунной системе. Особенностью
иммунной системы животных является способность отличать
собственные клетки от практически любых чужеродных клеток
и молекул [19]. Обнаружение чужеродных белков (антигенов)
является функцией рецепторов, расположенных на поверхности
Т-клеток иммунной системы. Эти рецепторы появляются в ре-
результате псевдослучайного процесса перестановки фрагментов
генома в ходе деления Т-лимфоцитов. Затем в тимусе Т-лим-
фоциты и их рецепторы подвергаются отрицательному отбору,
в ходе которого элиминируются клетки, реагирующие против
собственных антигенов. В результате из тимуса в организм попа-
попадают только те Т-лимфоциты, которые не реагируют на собствен-
собственные антигены. Этот процесс отбора очень важен для разделения
свой-чужой. Центральным свойством искусственной иммунной
системы [12] является обобщение сложного физико-химического
14.2. Алгоритм отрицательного отбора 299
процесса распознавания антителом антигена. Алгоритм отрица-
отрицательного отбора основывается на следующих компонентах.
• Определяется свой как нормальный паттерн активности
или устойчивого поведения контролируемой системы или
процесса. В частности, база данных, описывающих нор-
нормальную динамику процессов, представляется как множе-
множество из S строк равной длины /, составленных из букв
конечного алфавита.
• Создается набор детекторов R, ни один из которых не
совпадает с какой-либо из строк множества S. Использу-
Используется правило частичного соответствия, согласно которому
две строки совпадают тогда и только тогда, когда они иден-
идентичны в г смежных позициях, где величина г выбирается
в зависимости от решаемой задачи (как например в [12]).
• Данные контролируются путем непрерывного сопоставле-
сопоставления детекторов с новыми поступлениями в S. Обнаружение
совпадения с детектором рассматривается как изменение
(или отклонение) в поведении контролируемой системы.
Кандидаты в набор детекторов в исходном варианте алгорит-
алгоритма [12] генерируются случайно, а затем проверяются на совпа-
совпадение с собственными строками, и кандидат отвергается, если
обнаруживается совпадение. Этот процесс повторяется до тех
пор, пока не будет сгенерировано требуемое количество детекто-
детекторов. Можно получить вероятностную оценку числа детекторов,
необходимого для обеспечения заданного уровня надежности.
Главным ограничением при случайной генерации детекторов яв-
является экспоненциальный рост вычислительных затрат на гене-
генерацию адекватных детекторов при увеличении размера своего.
Кроме этого, для многих вариантов своего и сочетаний величин
/ и г случайная генерация может быть невозможна.
В этой работе наборы детекторов генерируются усовершен-
усовершенствованным алгоритмом, время работы которого растет линейно
при увеличении размера своего [10]. Работа алгоритма делится
на два этапа. На первом этапе методом динамического программи-
программирования пересчитываются все неповторяющиеся строки (то есть
все допустимые детекторы). На втором этапе из допустимых де-
детекторов случайным образом формируется множество строк де-
детектора. Другими словами, на первом этапе для данного набора
своих строк S и порога соответствия г алгоритм определяет общее
число строк, не совпадающих со строками набора S; затем, на
втором этапе, часть этих строк используется для формирования
детектора, контролирующего паттерны поступающих данных.
300 Гл. 14. Иммунный алгоритм обнаружения аномалий
14.3. Обнаружение аномалий
В данной реализации задача обнаружения аномалий сведена
к задаче обнаружения изменений в строке (совпадения с детекто-
детектором), при этом подразумевается, что это изменение (или совпаде-
совпадение) соответствует изменению паттерна нормальной активности.
14.3.1. Подготовка данных. Под подготовкой понимает-
понимается изменение формы представления данных при сохранении их
информационного содержания. Более того, любые изменения,
которые превосходят допустимые вариации паттернов данных,
должны быть полностью представлены в новой форме запи-
записи. Это может вызвать затруднения, если необходимо выявлять
очень малые изменения в потоке реальных данных. Решение
может состоять в использовании такого метода кодирования,
который достаточно точно переводит данные в дискретную фор-
форму. Для этого аналоговая величина сначала нормируется по
отношению к определенному фиксированному разбросу, что поз-
позволяет определить интервал, к которому она относится, и за-
затем принадлежность интервалу кодируется в бинарной форме.
Однако если величина оказывается за пределами интервала
(МIN, MAX), то она должна кодироваться всеми нулями или
всеми единицами, в зависимости от границы интервала, за ко-
которую она вышла. Тогда, если каждый набор данных кодируется
т двоичными числами (величина т выбирается в зависимо-
зависимости от требуемой точности), то между максимальным значе-
значением МАХ и минимальным MIN имеется 2т-2 различаю-
различающихся интервалов. Соответственно, размер интервала d равен
(МАХ — MIN)/Bm — 2). Следовательно, для аналоговой вели-
величины х MIN < х < МАХ, где МАХ = MIN + BШ - 2)d, и
она может быть отнесена к определенному интервалу (с абсолют-
абсолютной ошибкой по амплитуде d) и закодирована двоичным числом
по номеру этого интервала. Например, если амплитуда х такова,
что Ml N + nad ^ х ^ Ml N + (па + \)d, тогда она кодируется
двоичной строкой, соответствующей номеру интервала па (где
па может меняться в пределах от 1 до 2т — 2).
14.3.2. Подробности реализации. В реализованной вер-
версии системы аналоговые данные из скользящего временного окна
переводятся в двоичный код согласно описанной выше схеме.
Следовательно, каждое окно является последовательностью пор-
порций данных. Затем из последовательных по времени картинок
окна создается история процесса и выделяются его закономер-
закономерности, рассматриваемые как нормальная динамика наблюдаемого
14.3. Обнаружение аномалий 301
процесса. Необходимое для базы данных количество картинок
зависит от того, насколько сильно и продолжительно влияют
на динамику процесса вариации его характеристик. Как толь-
только временные ряды данных начинают воспроизводить сходные
паттерны, можно считать, что количество выделенных строк до-
достаточно для определения нормальной динамики процесса. Этот
набор строк является своим (S). Затем при помощи алгоритма от-
отрицательного отбора генерируются строки, не имеющие сходства
со строками из S, и из них формируется детектор. Этот процесс
является затратным по времени и поэтому обычно реализуется
в режиме офф-лайн как это делается и в случаях обучения
нейронных сетей для выявления аномалий или конструирования
правил в экспертных системах. В целом, основные этапы реали-
реализованного подхода можно описать следующим образом.
1. Собираются данные в количестве, достаточном для харак-
характеристики нормальной динамики процесса (это могут быть
или исходные данные для каждого момента времени, или
значения, усредненные на длительных интервалах наблю-
наблюдения).
2. На собранных данных оценивается диапазон изменчивости
(MAX, MIN значения) данных, и в зависимости от тре-
требуемой точности выбирается параметр кодирования га.
3. Результаты измерений переводятся в двоичную форму при
помощи описанной схемы кодирования.
4. Выбирается размер окна, позволяющий определять паттер-
паттерны данных.
5. Окно передвигается вдоль временного ряда данных, выде-
выделенные паттерны кодируются и хранятся как определение
своего. В дальнейшем они используются в алгоритме отри-
отрицательного отбора.
6. Генерируется набор детекторов, отличающихся от строк
своего. Для выбора детекторов используется алгоритм ча-
частичного сравнения, значение параметра г подбирается
в зависимости от задачи. Желательно, чтобы детекторы
покрывали все множество не своих (чужих) строк. Для
достижения требуемого уровня чувствительности к выяв-
выявлению изменений во входных сигналах необходима также
оценка размера набора детекторов [12].
7. Набор детекторов, сгенерированный по одному набору нор-
нормальных данных, может (с некоторой вероятностью) обна-
обнаруживать изменения (аномалии) в паттернах других набо-
наборов данных.
302
Гл. 14. Иммунный алгоритм обнаружения аномалий
При мониторинге процесса используются те же парамет-
параметры подготовки данных, что и при кодировании началь-
начальных паттернов нормальных данных. Активация детектора
в результате совпадения с текущим паттерном свидетель-
свидетельствует о появлении измененного паттерна, о чем сообщает
генерируемый системой сигнал тревоги. Сходные правила
контроля за состоянием используются при создании набора
детекторов.
Автономный режим
Накопление
нормальных рядов
наблюдений за
системой
Первичная обработка
и кодирование данных
Запись строк, коди-
кодирующих все окна
данных
Отрицательный
отбор
Создание детектора
своего
Оперативный режим
Мониторинг новых
паттернов данных
Первичная обработка
и кодирование данных
Проверка на совпадение
с детектором
При активации любого
детектора вырабатывание
сигнала новизны данных
Рис. 14.1. Схема работы системы обнаружения аномалий, использующей прин-
принципы иммунитета
Перечислим основные параметры процесса подготовки дан-
данных.
BIT_PER_DATA (га) — параметр, определяющий точность,
с которой данные представляются в двоичной форме. Например,
5-битовое кодирование позволяет распределить данные по 30
интервалам в диапазоне [MIN, МАХ].
WINDOW SIZE (w) — число элементов, кодируемое в каждом
паттерне (строке своего).
SHIFT — число элементов, на которое данный паттерн сдви-
сдвинут по отношению к предыдущему (величина сдвига скользя-
скользящего окна). Например, если SHIFT = 1, а размер окна равен
w, то паттерны будут иметь следующий вид: {х\, Х2,..., xw},
{x2,X2,...,X(w+i)} И Т.Д.
14.4. Эксперименты 303
14.4. Эксперименты
Результаты экспериментов по оценке эффективности алгорит-
алгоритма отрицательного отбора для обнаружения аномалий описаны
в работах [7, 9]. В ходе этих экспериментов использовались
последовательности, генерируемые уравнением Макея-Гласса,
которые моделировали динамику резца при обработке металла,
а также результаты измерений. Далее описываются два таких
эксперимента — с последовательностями Макея-Гласса и с мо-
модельными последовательностями измерений, которые в норме
характеризовались вариацией амплитуды сигнала.
В первом примере временные ряды получались с помощью
последовательностей Макея-Гласса [11, 17] и включали экспе-
эксперименты по наблюдению за динамикой процесса в различных
условиях. Рассмотрены две последовательности, одна из которых
характеризуется относительно небольшими изменениями и как
бы устойчива к дефектам, а вторая характеризуется значитель-
значительной изменчивостью.
Уравнение Макея-Гласса является нелинейным дифферен-
дифференциальным уравнением с запаздывающим аргументом. Решения
этого уравнения использовались во многих областях науки [17].
Уравнение имеет следующий вид:
бЬ _ ax(t-r)
dt ~ [\ + xc{t-r)]
Обычно используются следующие значения параметров [5]:
а = 0,2, b = 0,1, с = 10, величина параметра запаздывания г
определяет сложность вида решения уравнения. Решения этого
уравнения используются как задание для краткосрочного прогно-
прогнозирования по результатам имеющихся измерений [24]. Кроме этого,
может быть поставлена задача обнаружения изменений вели-
величины параметра г [5, 22]. Эта задача и рассматривается далее.
Для получения нормальных последовательностей использует-
используется значение т = 30, для небольших изменений — т = 27, для
получения значительных аномалий используется г = 17 (как
в [5]). Последовательности получаются численным решением
уравнения методом Рунге-Кутта 4-го порядка. Интервал выбор-
выборки на каждом шаге интегрирования ограничен величиной 6. Для
устранения влияния начальных условий, пропускаются первые
1000 измерений от начального значения 1,1. В описываемом
эксперименте для определения своего и тестируемых изменений
использовалось по 2000 измерений (см. рис. 14.2).
304
Гл. 14. Иммунный алгоритм обнаружения аномалий
Выявление новизны в данных временого ряда Макея-Гласса,
т = 30 (рассматривается как нормальный паттерн)
1,4 1
0 500 1000 1500 Время
Рис. 14.2. Решение уравнения Макея-Гласса, нормальный паттерн
Таблица 14.1
Результаты применения модели иммунной системы для обнаружения
небольших изменений в последовательностях Макея-Гласса (рис. 14.3)
Параметры кодирования
Win size = 4
Win shift = 4
Self length, / = 20
Self size,
Ns = 500
Win size = 6
Win shift = 2
Self length, / = 30
Self size,
Ns = 998
r
9
10
10
12
Nr
30
40
50
30
50
70
20
30
40
30
50
70
Выявление аномалий
Среднее (а)
11,34C,52)
14,96C,78)
16,99D,20)
4,78B,77)
7,82C,16)
11,48C,51)
8,08C,30)
12,12D,08)
14,58D,82)
5,80B,70)
9,38B,99)
14,80D,82)
Надежность
100%
100%
100%
98%
100%
100%
100%
100%
100%
96%
100%
100%
Здесь г — пороговое значение критерия сходства, Nr — число детекторов.
В колонках 4 и 5 приведены средние за 50 прогонов количества обнаружений
в успешных прогонах (среднее и стандартное отклонение) и надежности обна-
обнаружения соответственно.
Небольшое изменение величины т (с 30 до 26)
на интервале 1000-1500
1,4 I
500
1000
1500 Время
Рис. 14.3. Решение уравнения Макея-Гласса, пример незначительных измене-
изменений паттерна
14.4. Эксперименты
305
Во всех экспериментах для двоичного кодирования данных
использовали т = 5. Результаты экспериментов приведены в таб-
таблицах 14.1 и 14.2.
Таблица 14.2
Результаты выявления значительных изменений
в последовательностях Макея-Гласса (рис. 14.4)
Параметры кодирования
Win size = 4
Win shift = 4
Self length, / = 20
Self size,
Ns = 500
Win size = 6
Win shift = 2
Self length, / = 30
Self size,
Ns = 998
r
9
10
10
12
Nr
30
40
50
30
50
70
20
30
40
30
50
70
Выявление аномалий
Среднее (а)
13,24B,86)
18,35C,91)
20,65D,36)
6,10B,83)
9,62B,93)
13,66C,87)
8,34C,12)
11,22D,10)
15,98E,09)
6,84B,66)
9,34D,65)
15,34E,11)
Надежность
100%
100%
100%
98%
100%
100%
100%
100%
100%
98%
100%
100%
Здесь г — пороговое значение критерия сходства, Nr — число детекторов.
В колонках 4 и 5 приведены средние за 50 прогонов количества обнаружений
в успешных прогонах (среднее и стандартное отклонение) и надежности обна-
обнаружения соответственно.
Значительное изменение величины т (с 30 до 17)
на интервале 1000-1500
1,41
500
1000
1500 Время
Рис. 14.4. Решение уравнения Макея-Гласса, пример значительных изменений
паттерна
В каждом случае использованы два размера окна и разные
наборы параметров. В первой серии экспериментов строки своего
формируются с использованием неперекрывающегося скользяще-
скользящего окна, во второй серии использовано перекрывающееся окно.
Наборы детекторов, получившиеся в этих двух сериях, отлича-
отличаются по критерию r-смежных битов.
306
Гл. 14. Иммунный алгоритм обнаружения аномалий
Видно, что алгоритм выявляет аномалии в обоих случаях, как
при незначительных, так и при значительных изменениях паттер-
паттерна. Отметим, что незначительные изменения (табл. 14.1) выявля-
выявляются почти так же эффективно, как и значительные (табл. 14.2),
так как в закодированном виде число измененных строк в обоих
случаях примерно одинаково (в интервале от 1000 до 1500).
Удивительно, но в обоих случаях частота обнаружения близка,
хотя во втором случае изменения гораздо больше по амплитуде.
Это связано с особенностью двоичного кодирования данных,
которое не сохраняет пропорций больших и малых изменений.
Для смягчения этого ограничения можно использовать другие
методы кодирования, например двоичный циклический код (код
Грея) и др.
Рассмотрим другой вид последовательностей, типичный для
многих задач обработки сигналов (рис. 14.5). Для них в норме
характерна значительная изменчивость амплитуды сигнала при
Исходные данные, до обработки
51
20
40
60 80
Время
100
Рис. 14.5. Пример результата кодирования данных. Увеличение шума на 75-м
и 85-м интервалах времени
сохранении определенной регулярности во времени. Обнаруже-
Обнаружение в таких сигналах скрытых изменений (или шума) является
весьма трудной задачей, хотя мониторинг изменений очень важен
во многих приложениях. Наиболее распространенные порого-
пороговые методы не могут обнаруживать небольшие изменения из-за
вариации граничных условий. Мы провели ряд экспериментов
с теми же значениями параметров, как и в предыдущем примере.
На рис. 14.6 представлены типичные результаты, показывающие,
что предложенный алгоритм, используя небольшой набор де-
детекторов, легко выявляет зашумление сигнала. В частности, по
начальным данным (данные в течение первых 50 временных ин-
интервалов рассматривались как нормальные) было сгенерировано
20 детекторов. Этот набор детекторов затем был использован для
14.4. Эксперименты
307
мониторинга тестовых сигнальных последовательностей и смог
выявить изменения на 75-м по 85-м временном интервале. Это
показывает, что соответствующий набор детекторов позволяет
обнаружить постепенное изменение сигнала.
>< На интервале 0-50 создано 50 детекторов
60 80
Время
Рис. 14.6. Вертикальные линии указывают на активацию детекторов, вызван-
вызванную изменением паттерна сигнала. Детекторы активируются только в период
увеличения шума, отмеченного на рис. 14.5
Мы обнаружили, что эффективность алгоритма меняется
в зависимости от величины порога сходства г для данной длины
строки / и параметров кодирования. При увеличении г детекторы
становятся чувствительными к любым изменениям в данных, так
что для получения требуемого уровня надежности необходимо
использовать большее число детекторов. С другой стороны, если
г слишком мал, то создание достаточного набора детекторов по
данному своему может не получиться, так как при выбранном
значении г не существует отличающихся строк (чужого).
Следовательно, для оптимизации работы алгоритма необхо-
необходим выбор подходящей величины этого параметра. В частности,
величина параметра г может использоваться при настройке со-
соотношения надежности обнаружения и риска ложного положи-
положительного ответа.
14.4.1. Сравнение с нейронными сетями. Для оценки по-
полученных результатов на этих же наборах данных был проведен
ряд экспериментов с нейронной сетью (использовалась ART1
[3, 5]). Сеть ART [4] является самоорганизующейся конкурентно
обучаемой ИНС (искусственной нейронной сетью), способной
в ответ на произвольные входные паттерны генерировать распо-
распознающие их устойчивые коды.
Алгоритм ART1 является двоичной версией семейства сетей
ART. Архитектура ART включает два слоя: слой сравнения и
распознающий слой. Нейроны в этих слоях взаимодействуют
308
Гл. 14. Иммунный алгоритм обнаружения аномалий
между собой через нисходящие и восходящие соединения, ко-
которые модифицируются в фазе обучения он-лайн и сохраняют
двоичную информацию. При представлении на входе паттерна,
ART-сеть, оценивая сходство с образцами, пытается отнести его
к одной из существующих категорий. После завершения обуче-
обучения сети поведению системы создается определенное количество
стабильных образцов или категорий. Однако, если представляет-
представляется совершенно отличный (или новый) паттерн, сеть в зависимо-
зависимости от степени новизны или обновляет одну из существующих
категорий, или создает новую.
На рис. 14.7 приведен пример такого эксперимента, показы-
показывающий, как происходит создание образцов и последующее их
обновление (запись) в ходе фазы неконтролируемого обучения
сети ART. График выравнивается после 40 временных интер-
интервалов, что указывает на переход сети в состояние устойчивого
резонанса. Однако в период времени от 75-го до 85-го интервала
создаются и записываются новые образцы, на что указывают
изменения в паттерне сигнала. Хотя результаты в обоих случаях
(ИНС и ИИС) качественно совпадают, необходимо количествен-
количественное и детальное сравнение этих двух подходов, что является
важной задачей будущих исследований.
50
Время
100
Рис. 14.7. Формирование и запись новых паттернов после фазы обучения
указывает на изменчивость сигнала
Вместе с тем, результаты наших экспериментов позволяют
предварительно характеризовать сходство и различия между ал-
алгоритмом отрицательного отбора [12] и сетью ART в отношении
задачи обнаружения аномалий в последовательностях наблюде-
наблюдений [6, 7].
• Сеть ART выявляет новые паттерны детерминированно,
а в иммунологическом подходе выявление происходит на
вероятностной основе (в частности формирование детекто-
детекторов).
14.4. Эксперименты 309
Сеть ART пытается распознать (классифицировать) вход-
входной сигнал в пространстве, определенном множеством обу-
обучающих данных (пространством существующих закодиро-
закодированных данных или сигналов), в то время как алгоритм,
основанный на отрицательном отборе, распознает паттерны
как новые в дополнительном пространстве.
Механизм распознавания сети ART (двоичной версии
ART1) работает в пространстве Хемминга, а текущая
реализация алгоритма, использующего отрицательный
отбор, производит сравнение в пространстве г-смежности.
Порог чувствительности (р) сети ART определяет уровень
дискриминации входных паттернов и формирования класте-
кластеров (или классов). Значение р, близкое к нулю, дает сеть
с низким уровнем дискриминации, значение около единицы
дает сеть с высоким уровнем дискриминации (формиро-
(формирование новых кластеров). Оптимальный уровень чувстви-
чувствительности приводит к созданию разумного числа кластеров
с минимальной ошибкой. Схожие эффекты демонстрирует
алгоритм отрицательного отбора при варьировании порога
сходства г.
В сети ART эталоны кластеров (или классов) сохраняются
в нейронной памяти. Эти эталоны являются обобщением
паттернов кластеров, сформированных и модифицирован-
модифицированных в течение фазы обучения. При увеличении разнообра-
разнообразия паттернов входных данных число эталонов (при фикси-
фиксированных параметрах алгоритма) увеличивается. В случае
алгоритма отрицательного отбора увеличение разнообразия
данных приводит к противоположному эффекту; так, име-
имеются указания на то, что независимо от свойств набора
своего (обучающего набора данных), размер набора де-
детекторов при фиксированной вероятности успеха остается
практически постоянным [12].
Сеть ART изучает семантику поступающих последователь-
последовательностей данных в режиме он-лайн, и при завершении обу-
обучения скорость формирования эталонов снижается до нуля;
в алгоритме отрицательного отбора детекторы формируют-
формируются в режиме офф-лайн и больше зависят от нормальных по-
последовательностей и других параметров алгоритма. Вместе
с тем, имеется возможность генерировать детекторы в ре-
режиме он-лайн, используя для этого различные алгоритмы.
В сети ART появление новых паттернов при тестировании
(или мониторинге) данных выявляется по частоте и сте-
степени формирования эталонов. В алгоритме отрицательного
310 Гл. 14. Иммунный алгоритм обнаружения аномалий
отбора изменения в паттерне данных отражаются в акти-
активации детектора.
• В сети ART распознавание паттерна входных данных яв-
является решением всей сети (в ходе которого определяется,
к какому классу принадлежит входной объект), в то время
как распознавание нового паттерна детектором в алгоритме
отрицательного отбора является децентрализованным ло-
локальным решением, что является существенным преиму-
преимуществом по сравнению с методологией ART. Это свойство
обеспечивает быстрый ответ на любое изменение, что мо-
может быть очень полезно при мониторинге опасных явлений
и систем.
14.5. Заключение
В этой главе обсуждался новый подход к решению задачи
обнаружения аномалий. Этот подход основывается на алгорит-
алгоритме отрицательного отбора, использующем принципы работы им-
иммунной системы. Целью работы было построение эффективного
алгоритма для выявления изменений в устойчивых характери-
характеристиках мониторируемой системы и предупреждения о них опера-
оператора. Знание о нормальном поведении системы в данном подходе
извлекается из ранее собранных данных. На их основе создается
набор детекторов, которые с некоторой вероятностью выявляют
любые отклонения от нормального поведения системы. Набор
детекторов может обновляться путем создания новых детекторов,
по мере изменения нормы поведения системы при ее старении
или модификации. В работе [12] показано, что небольшой набор
детекторов может с большой вероятностью обнаруживать изме-
изменения в исходном наборе данных. Однако установлено, что кри-
критичным для успеха этого метода является создание оптимального
набора детекторов.
Эти обнадеживающие результаты показывают, что появился
метод, существенно превосходящий другие подходы. Этот метод
связан с поиском отклонений от нормы, а не тех или иных
конкретных аномалий. Другими словами, этот метод не прове-
проверяет новые паттерны данных на соответствие какому-то классу
нарушений, а отмечает, что эти паттерны являются новыми по
отношению к нормальным. Данный алгоритм может быть вклю-
включен в другие диагностические системы для дальнейшей класси-
классификации новых паттернов. В большинстве случаев мониторинга
систем обнаружение постепенных изменений в паттерне данных
является более важной задачей, чем обнаружение ложных или
14.5. Заключение 311
измененных данных, поэтому предложенный вероятностный ал-
алгоритм является полезной альтернативой существующим подхо-
подходам. Возможно, что при обработке данных с реальных сенсоров
будет необходимо выбрать соответствующий уровень порога об-
обнаружения аномалий, чтобы учесть мгновенные вариации пат-
паттернов данных.
Для настройки процессов подготовки и анализа данных мо-
может быть использован ряд параметров. На стадии подготовки
данных требуемую точность можно получить выбором метода
кодирования аналоговых данных, а выбор размера окна поможет
выделить паттерны в данных.
Отметим, что систему можно одновременно наблюдать в раз-
различных временных масштабах. Также, в зависимости от свойств
сенсора, данные, вместо прямого кодирования, можно трансфор-
трансформировать (например с помощью преобразования Фурье). В слу-
случае многомерных последовательностей данных, мониторинг си-
системы можно проводить одним набором детекторов, сцепленных
таким образом, чтобы видеть в окнах все переменные строки
своего. Уровень надежности можно выбрать, изменяя размер ок-
окна, порог сходства и количество детекторов. Остальные приемы
сравнения и особенности построения алгоритма еще предстоит
исследовать.
Для получения временных последовательностей данных ис-
использовано уравнение Макея-Гласса; в этом качестве это урав-
уравнение применяется в работах по обнаружению аномалий (в част-
частности в сетях ART) [5]. Однако непериодичность решений
ограничивает его применимость как теста в задачах продолжи-
продолжительного мониторинга.
Предложенный метод обнаружения аномалий может быть по-
полезен во многих областях. Например, на производстве повре-
повреждение резца можно обнаружить по изменению паттерна дей-
действующих сил [1, 8]. Высокая способность к распознаванию,
демонстрируемая иммунной системой животных, дает основания
предполагать, что построенная на этих принципах система смо-
сможет работать и в реальных задачах.
Дальнейшие исследования должны быть посвящены вычисли-
вычислительным аспектам иммунной системы, а также развитию и совер-
совершенствованию алгоритмов обнаружения и рассмотрению новых
приложений.
Часть этой работы была выполнена первым автором на
факультете вычислительной техники в университете штата
Нью-Мексико (г. Альбукерк). Авторы признательны Патрику
Дехазелеру, Дереку Смиту и Рону Хайтауэру за многочисленные
312 Гл. 14. Иммунный алгоритм обнаружения аномалий
советы и комментарии. Первый автор также благодарит Тома
Кауделла и Дэвида Экли. Второй автор была поддержана
грантом Национального научного фонда США (IRI-9157644).
Список литературы
1. Altintas Y., Yellowley I. In-process detection of tool failure in milling
using cutting force models // J. Eng. Industry. 1989. V. 111. P. 149—
157.
2. Bishop CM. Novelty detection and neural network validation //
Vision, Image and Signal Processing (IEE Proc), 1994. V. 141, №4.
P. 217-222.
3. Carpenter G.A., Grossberg S. A massively parallel architecture for
a self-organizing neural pattern recognition machine // Computer
Vision, Graphics, and Image Processing. 1987. V. 37. P. 54-115.
4. Carpenter G.A., Grossberg S. Competitive Learning: From Interactive
Activation to Adaptive Resonance. Cambridge: MIT Press, 1987.
Ch.5, P. 213-250.
5. Caudell T.P., Newman D.S. An adaptive resonance architecture to
define normality and detect novelties in time series and databases //
Proc. IEEE World Congress on Neural Networks, Portland, Oregon,
3-7 July 1993. P.IV166-176.
6. Dasgupta D. Artificial neural networks and artificial immune sys-
systems: similarities and differences // Proc. IEEE International Conf.
on Systems, Man and Cybernetics, Orlando, October 12-15, 1997.
7. Dasgupta D. Using immunological principles in anomaly detection //
Proc. of the Artificial Neural Networks in Engineering (ANNIE'96),
St. Louis, USA, November 10-13, 1996.
8. Dasgupta D., Forrest S. Tool breakage detection in milling operations
using a negative-selection algorithm // Technical Report №CS95-5,
Department of Computer Science, University of New Mexico, 1995.
9. Dasgupta D., Forrest S. Novelty detection in time series data using
ideas from immunology // ISCA 5th International Conf. on Intelligent
Systems, Reno, Nevada, June 19-21, 1996.
10. D'haeseleer P., Forrest S., Helman P. An immunological approach
to change detection: algorithms, analysis, and implications // Proc.
IEEE Symposium on Research in Security and Privacy, Oakland, CA,
May 1996.
11. Farmer J.D. Chaotic attractors of an infinite-dimensional dynamical
system // Physica D. 1982. P. 366-393.
12. Forrest S., Perelson A.S., Allen L., Cherukuri R. Serf-nonself dis-
discrimination in a computer // Proc. IEEE Symposium on Research in
Security and Privacy, Oakland, CA, 16-18 May, 1994. P. 202-212.
13. Frank P.M. Fault diagnosis in dynamic systems using analytical and
knowledge-based redundancy — a survey and some new results //
Automatica. 1990. V. 26, №3. P. 459-474.
Список литературы 313
14. Hwarng H.B., Chong C.W. A fast-learning identification system for
SPC: an adaptive resonance theory approach // Intelligent Engineer-
Engineering Systems Through Artificial Neural Networks, 13-16 November,
1994. V.4. P. 1097-1102.
15. Isermann R. Process fault detection based on modeling and estima-
estimation method - a survey // Automatica. 1984. V. 20. P. 387-404.
16. Kozma R., Kitamura M., Sakuma M., Yokoyama Y. Anomaly Detec-
Detection by neural network models and statistical time series analysis //
Proc. IEEE International Conference on Neural Networks, Orlando,
Florida, June 27-29, 1994.
17. Mackey M.C., Glass L. Oscillation and chaos in physiological control
systems // Science. 1977. V. 197. P. 287-289.
18. Martinelli G., Perfetti R. Generalized cellular neural networks for
novelty detection // IEEE Trans, on Circuits and Systems, I: Funda-
Fundamental theory and applications, 1994. V.41, №2. P. 187-190.
19. Percus J.K., Percus O., Person A.S. Predicting the size of the
antibody combining region from consideration of efficient self-nonself
discrimination // Proc. Natl. Acad. Sci. 1993. V. 60. P. 1691-1695.
20. Roberts S., Tarassenko L. A probabilistic resource allocating network
for novelty detection // Neural Сотр. 1994. V.6. P. 270-284.
21. Shewhart W.A. Economic Control of Quality of Manufactured Prod-
Product. 1931. Reprinted in 1980 by the American Society for Quality
Control. P. 304-318.
22. Scott D., Smith G., Escobedo R.A. Engineering and manufacturing
applications of ART-1 neural networks // Proc. IEEE International
Conference on Neural Networks, Orlando, Florida, June 27-29, 1994.
23. Smyth P. Hidden Markov Model for fault detection in dynamic system
// Pattern Recogn. 1994. V. 27, № 1. P. 149-164.
24. Tenorio M.F., Lee W.T. Serf-organizing networks for optimum su-
supervised learning // IEEE Trans. Neural Netw. 1990. V.I, №1.
P. 100-110.
25. Tzafestas S.G. Fault Detection in Dynamic Systems, Theory and Ap-
Applications. Ch.: System Fault Diagnosis Using the Knowledge-Based
Methodology. Prentice Hall, 1989.
Глава 15
МОДЕЛИ УПРАВЛЕНИЯ ПОТОЧНОЙ ЛИНИЕЙ
ДЛЯ ПРОИЗВОДСТВА ПОЛУПРОВОДНИКОВ,
ПОСТРОЕННЫЕ НА ПРИНЦИПАХ
ИММУННОЙ СИСТЕМЫ )
Тойо Фу куда, Казуюки Мори, Макото Цукияма
Поточная линия для производства полупроводников представляет собой
сложную многоуровневую систему. Управление такой системой является труд-
трудной задачей из-за большого разнообразия возможных типов сбоев работаю-
работающего оборудования, приводящих к выходу оборудования из строя, дисбалансу
незавершенного производства и, в конечном итоге, к нарушению производства
интегральных схем. Ранее для устранения таких сбоев нами применялись
подходы с использованием имитационного моделирования и экспертных систем
[2-4]. Однако ввиду сложности систем производства полупроводников и ди-
динамичного изменения их инфраструктуры указанные методы оказались неэф-
неэффективными. В этой главе приводится описание модели управления системой
производства полупроводников, основанной на использовании искусственной
иммунной системы, которая реализована в виде мультиагентной сети, способ-
способной к адаптации при изменении внешней среды.
15.1. Введение
Поточная линия для производства полупроводников пред-
представляет собой сложную многоуровневую систему. Сборка боль-
больших интегральных схем сверхвысокой плотности требует зна-
значительных временных затрат и финансовых ресурсов. Поточная
линия для производства полупроводников характеризуется боль-
большим разнообразием технических требований к выпускаемой про-
продукции, частыми сбоями в работе системы и заменами про-
производственного оборудования, а также быстрым изменением
ассортимента продукции в связи с меняющимися потребностями
рынка. Из этого следует несостоятельность ожидания ее еди-
единообразной эксплуатации и необходимость динамичных изме-
х) Краткая версия этой главы была впервые опубликована в Трудах меж-
международной конференции IEEE «Системы, человек и кибернетика», прошедшей
в октябре 1997 г. в Орландо, США (с. 363-368).
15.2. Проблема производства полупроводников 315
нений. Поэтому применение обычных методов управления про-
производством здесь не только неэффективно, но и оказывается
в принципе невозможно [2,3].
Система искусственного интеллекта, построенная на имму-
иммунологических принципах, представляет собой модель обработки
информации в естественной иммунной системе, которая служит
для обнаружения отклонений от нормы и защиты организма
человека и животных. Возможности иммунной системы, инте-
интересные с инженерной точки зрения, связаны с распознаванием
своего и чужого, адаптацией к изменениям внешней среды, а
также с наличием механизмов памяти и распределенной обра-
обработки информации [4].
На основе системы искусственного иммунитета можно до-
добиться высокой адаптируемости процесса управления поточной
линией для производства полупроводников. Основным элементом
такой системы управления является виртуальный иммунный
агент, функция которого сводится к осуществлению следующих
трех режимов работы:
1) режима распознавания (иммунный агент осуществляет по-
постоянный контроль за состоянием системы, включая отсле-
отслеживание сбоев в работе механизмов, а также изменений
потребностей и технологических процессов);
2) режима принятия решений (анализируя происходящие из-
изменения на основе генетической рекомбинации, агент реша-
решает, вызывают ли происходящие изменения необходимость
смены режима эксплуатации системы);
3) режима управления (агент выбирает наилучшее решение,
соответствующее изменению системы).
В этой главе приводится описание общей схемы обработки
информации в искусственной иммунной системе для сложной
многоуровневой системы производства полупроводников с иллю-
иллюстрацией ее на нескольких примерах.
15.2. Проблема производства полупроводников
15.2.1. Характеристики системы производства полупро-
полупроводников. Система производства полупроводников является
сложной структурой. Производство больших интегральных схем
(LSI) — модулей памяти, а также специализированных инте-
интегральных схем (ASIC) и блоков микропроцессоров (MPU) 0 —
можно характеризовать как процесс многократного обращения
х) Аббревиатуры сокращений происходят от англ. large scale integration,
applications specific integrated circuit и microprocessor unit. — Прим. перев.
316 Гл. 15. Модели управления производством полупроводников
к нескольким типам операций: очистки, диффузии, фотолито-
фотолитографии, травления, встраивания и измерения (рис. 15.1) 0. Для
производства интегральной схемы требуется свыше 200 таких
операций. Незавершенное производство 2) такой поточной линии
включает более 1000 наименований различных стадий готовно-
готовности конечного продукта [5].
15.2.2. Технические особенности производства полупро-
полупроводников. В процессе производства полупроводников необхо-
необходимо поддерживать высокую загрузку оборудования и мини-
минимизировать производственный цикл, обеспечивая согласованный
выпуск всех компонентов. Кроме того, следует вовремя менять
приоритеты и общую стратегию координации работы системы
для адаптации к непредвиденным обстоятельствам, таким как
поломка или модернизация производственного оборудования, а
также изменение объемов производства.
Перечисленные требования определяют компромиссный ха-
характер принимаемых решений. Например, повышение разнообра-
разнообразия компонентов незавершенного производства приводит к уве-
увеличению загрузки оборудования, но при этом полный цикл про-
производства становится длиннее.
15.2.3. Описание проблемы. Оптимальное планирование
и координация процесса производства полупроводников с учетом
возможности нештатных ситуаций представляет собой, как уже
отмечалось выше, сложную задачу ввиду большого количества
различных типов сбоев в работе системы. Ранее для решения
этой задачи мы применяли подходы с использованием матема-
математического моделирования и экспертных систем [2,3,4]. Однако
из-за высокой сложности производственного процесса и дина-
динамичного изменения условий производства создать на этой осно-
основе идеальную систему контроля оказалось невозможно. Далее
рассматривается метод планирования структуры незавершенного
производства и минимизации производственного цикла с ис-
использованием агентной сети, состоящей из агентов-детекторов
(распознающих нарушения в работе поточной линии), агентов-
медиаторов (распознающих агенты-детекторы), а также агентов-
ингибиторов и агентов-восстановителей.
х) См., например, Белявский В. И. Физические основы полупроводниковой
нанотехнологии // Соросовский образовательный журнал. 1998. №10. С. 92-
98. — Прим. перев.
2) Термин «незавершенное производство» (work-in-process) означает рас-
распределение продуктов производства по разным стадиям готовности — от сырья,
выданного в производство, до полностью переработанного материала, ожидаю-
ожидающего контроля качества. — Прим. перев.
15.2. Проблема производства полупроводников 317
Начало
Нане
Фотолр
xorpai
Имплантация
Очистка
_г
Измерение
Диффузия
Травление
Конец
| Химическое осаждение |
Рис. 15.1. Блок-схема процесса производства полупроводников
318
Гл. 15. Модели управления производством полупроводников
15.3. Искусственные иммунные системы
и мультиагентные сети
15.3.1. Определение мультиагентных сетей. Зададим
несколько классов мультиагентных сетей, построенных на
принципах естественной иммунной системы. Мультиагентная
сеть представляет собой разновидность раскрашенной сети
Петри [6], обобщенной Кумагаи [7] для описания автономных
распределенных систем.
Агентную сеть можно представить себе как реализацию неко-
некоторого класса агентов. В свою очередь, каждая агентная сеть
является агентом автономных распределенных систем. Таким
образом, автономная распределенная система представляет собой
некоторое множество агентных сетей.
Рассматриваемые нами мультиагентные сети обладают следу-
следующими свойствами:
• агентные сети, относящиеся к одному классу, имеют оди-
одинаковую структуру и различные идентификаторы;
• класс агентной сети идентифицируется по набору цветов;
• метки и агенты идентифицируются по набору цветов;
• метки имеют различные состояния; переход между ними
определяется агентной сетью, за исключением случая, ко-
когда метка указывает на простые данные или их сочетание.
Автономные распределенные системы, в том числе построен-
построенные на модельных представлениях о иммунной системе, можно
изучать с точки зрения указанных свойств.
15.3.2. Реализация иммунных автономных распределен-
распределенных систем в виде мультиагентных сетей. Производственный
узел системы производства полупроводников можно моделиро-
моделировать с использованием сетей
: Агент-детектор ¦
"*~ ! Петри.
I На рис. 15.2 показана мо-
шточная линия ! _*4ib ! дель сети Петри как простей-
ший пример поточной линии,
состоящей из трех единиц
оборудования, осуществляю-
щих три производственные
ОПераЦИИ.
В этой модели участки
р?? р8 и р9 ^ответствуют
буферным регистрам производственных операций, представлен-
представленных переходами t5, t6 и tl соответственно. Маркеры в участках
U Переход с временной задержкой Ц» w 31
D Переход без временной задержки
Рис. 15.2. Пример программного модуля
15.3. Искусственные иммунные системы и мулътиагентные сети 319
р18, р19 и р20 соответствуют ресурсам оборудования. Например,
переход tb может активироваться, поскольку входы р7 и р18
перехода tb имеют метку (рис. 15.2).
Метка в позиции р7 имеет специфическую раскраску. Если
переход tb активируется, то каждая метка на входах р7 и р18 пе-
перехода tb удаляется, и вместо них на выходах р8 и р18 перехода
tb появляется новая метка.
Метка 1
Новая метка наследует цвет
метки, удаленной в позиции
р7, и добавляется новая ин-
информация о том, какое пра-
правило применялось.
На рис. 15.3 показан при-
пример раскрашенного набора
меток. Метка 1 на этом ри-
рисунке содержит информацию
о том, что для активации пе-
переходов t5, t6 и tl исполь-
использовались правила г18, г19 и
г20 соответственно.
Полную структуру систе-
системы производства полупро-
Метка /
Метка k
г18
1
г2
1
г\
г19
2
ИЗ
2
И2
г20
3
г4
3
гА
1 2 3
|Н8|из|г20|
1 2 3
,.\rik\ ... [ r9\
i n
Рекомбинация
[ ril 1
I
I г8 1
п
Рис. 15.3. Пример раскрашенного набо-
набора меток
водников можно получить, комбинируя компоненты производ-
производства. Как показано далее, на основе этого механизма можно до-
дополнить автономную распределенную систему включением в нее
агентов-детекторов, агентов-медиаторов, агентов-ингибиторов и
агентов-восстановителей.
1. Агент-детектор соответствует В-лимфоцитам, имеющим
специфические рецепторы для антигена. Он обнаруживает кон-
конкретную неисправность, соответствующую антигену. На рис. 15.2
видно, что переход tA может активироваться, если сумма ко-
количества меток в буферном
I регистре р9 превышает 3.
! После активации tA метка,
! указывающая на неисправ-
¦¦¦¦¦¦¦¦¦¦¦¦¦¦: ность, записывает в пози-
: цию рЪ на рис. 15.4 новый
! набор цветов, образованный
; в результате генетической
Рис. 15.4. Пример программного модуля рекомбинации наборов цве-
цветов трех меток.
Если существует агент-медиатор, имеющий участок связы-
связывания рецептора типа р15, который, как показано на рис. 15.5,
Агент-детежтор
рб
р\%
Р\9
320
Гл. 15. Модели управления производством полупроводников
может взаимодействовать с рецептором р5, указывая на наличие
неисправности, то соответствующие агент-медиатор и агент-де-
агент-детектор взаимодействуют между собой. Если же такого агента-
медиатора не существует, то в результате активации перехода t3
может быть создан новый агент-медиатор.
2. Агент-медиатор соответствует лимфокинам, секретируе-
мым Т-лимфоцитами для активации В-клеток. Агент-медиатор
может активировать агент-ингибитор для подавления активации
конкретного перехода. Агент-медиатор на рис. 15.5 может слу-
служить связующим звеном между агентом-ингибитором и агентом-
детектором путем связывания участков рЗ и р13, рА и р14, а
также рЪ и р\Ъ. Другой тип агента-медиатора может восстанав-
восстанавливать действие агента-ингибитора.
Агент- ; ^
ингибитор :--
pi
Агент-медиатор
11
$4
:::#//;•;•
jHlpy-
til
i V—
\f
P5®
:.¦:::::::.-31
Агент-детектор i
V3 !
©^6 :
Агент-медиатор ;
ГЗ:.¦::::.¦::.¦::::.¦:.¦:.¦::::.¦::::.¦:::::
Агент-медиатор
АгеНТ- : ¦* / /VJ-f i4—'; :
ИНГИбИТОР ! /¦/¦¦/¦/¦ ¦¦¦/¦¦¦¦¦¦¦¦¦:i:::h---—-:i-
¦'; ;; ' :- ; Агент-детектор
?*3
p9f
Поточная линим
Рис. 15.5. Пример программного мо-
модуля
Поточная линия
Рис. 15.6. Пример программного мо-
модуля
3. Агент-ингибитор соответствует специфическим В-лимфо-
цитам, уничтожающим антиген. На рис. 15.5 видно, что переход
tb может активироваться, только если каждый из участков р2,
р7 и р18 имеет одну или более меток. Агент-ингибитор может
задерживать активацию перехода tb удалением метки в пози-
позиции р2. На рис. 15.6 видно, что у агента-ингибитора переход
t2 может активироваться после связывания участков рА и рЪ.
В результате активации t2 метки в участках р2 и р4 удаляются
и занимают позиции р\ и рЗ соответственно (рис. 15.7). В этих
условиях переход ?6 не может быть активирован, пока в позиции
р2 не появится метка, как результат активации перехода t\.
4. Агент-восстановитель соответствует Т-лимфоцитам-
помощникам. Агент-восстановитель указывает на нарушение
в работе системы, которое заключается в отсутствии обработки
изделий данной производственной компонентой системы. Если,
как показано на рис. 15.8, имеется метка в позициях р\ и pll,
15.3. Искусственные иммунные системы и мулътиагентные сети 321
то в позиции р2 метки нет и переход tb можно активировать
после выполнения следующих шагов.
; Агент-медиатор
Агент.
Агент-ингибитор
Агент-медиатор
р!6
рП \
ША
ЧРЪ\
JP^\ p5{
Г^6
' С*/"*
pi \
Рис.
Us
15
vt'l
}р
/>18
.7.
: : йЬ :
: ; Зн 3 "'
8 Пб\ p9fa\ pW I
\ 4l9 Чю \
Поточная линия
Пример программного мо-
модуля
Поточная линия i ^8/5^
Агент-восстановитель
Рис. 15.8. Пример программного
модуля
"Агёнт-ингибитор""„1 i Агент-медиатор
Р}__ ^Ъ: : рШ
f Агент-ингибитор"'"^'i ; Ат-ент-медиатор
р16
p\Q \
!р12
Агент- во сстановитель
Агент-восстановитель
Рис. 15.9. Пример программного Рис. 15.10. Пример программного
модуля модуля
ПерВЫЙ ШаГ СОСТОИТ В СОе- Г'Агент-ингибитсгр''; П'Агет-мёдиагор
динении позиций р\ и р16, а ; ^ ^ ^ ; ; —р1⦦
также рП и р19. После это-
этого маркировка сети будет иметь
вид, показанный на рис. 15.9.
Второй шаг — активация пе-
перехода ?10. В результате мет-
метки в позициях р16 и р19 уда-
удаляются, и появляются новые
метки в позициях рП и р18
(рис. 15.10). Третий шаг заклю-
заключается В соединении ПОЗИЦИЙ Рис. 15.11. Пример программного мо-
р18 и р2, а также рП и р12. дуля
Соответствующая маркировка сети показана на рис. 15.11. В этой
ситуации может активироваться переход tb.
Агент-восстановитель
11 Д. Дасгупта
322 Гл. 15. Модели управления производством полупроводников
15.4. Выводы
Поточная линия для производства полупроводников пред-
представляет собой сложную многоуровневую систему. Управление
такой системой является трудной задачей ввиду большого раз-
разнообразия возможных типов сбоев работающего оборудования,
приводящих к выходу оборудования из строя, дисбалансу неза-
незавершенного производства и, в конечном итоге, к нарушению
производства интегральных схем.
В этой главе предложена структура автономной распреде-
распределенной системы управления поточной линией для производства
полупроводников и описаны ее некоторые программные моду-
модули. Эта структура представляет собой искусственную иммунную
систему, состоящую из агентов-детекторов, агентов-медиаторов,
агентов-ингибиторов и агентов-восстановителей, определяемых
мультиагентной сетью. Указанные агенты соответствуют рецеп-
рецепторам, лимфокинам, уничтожающим антиген специфическим
В-лимфоцитам и Т-лимфоцитам естественной иммунной сис-
системы.
Отметим следующие важные особенности и преимущества
предложенной схемы управления:
• принятие решений в режиме реального времени;
• низкая чувствительность к изменениям внешней среды;
• возможность анализа поведения автономной распределен-
распределенной системы с использованием теории сетей Петри.
К сожалению, в настоящее время мы не можем гарантировать
эффективность применения данного подхода в реальных произ-
производственных системах. Этот вопрос является предметом даль-
дальнейших исследований.
Список литературы
1. Tonegawa S. Somatic generation of antibody diversity // Nature.
1983. V.302. P. 575-581.
2. Savell D.V., Aerez R.A., Koh S.W. Scheduling semiconductor wafer
production: An expert system implementation // IEEE EXPERT,
FALL, 1989. P. 9-15.
3. Tsukiyama M., Mori K., Fukuda T. Strategic level interactive
scheduling and operational level real-time scheduling for flexi-
flexible manufacturing systems // Applications of Artificial Intelli-
Intelligence in Engineering VIII, V. 2. Elsevier Applied Science, 1993.
P. 615-625.
Список литературы 323
4. Mori К., Tsukiyama M., Fukuda T. Immune algorithm and its
application to factory load dispatching planning // 1993 JAPAN-USA
Symp. on Flexible Automation, 1994. P. 1343-1346.
5. Castrucci P. The future fab: Changing the paradigm // Solid State
Technol. 1995. P. 49-56.
6. Jensen K. Coloured Petri Nets, V. 1. Berlin: Springer-Verlag,
1992.
7. Kumagai S., Miyamoto T. An agent net approach to autonomous
distributed systems // 1996 IEEE Int. Conf. on Systems, Man, and
Cybernetics, 1996. P. 3204-3209.
Общий список литературы
Область искусственных иммунных систем еще слишком нова и оконча-
окончательно не сформирована, а ее возможности и ограничения пока не вполне
ясны. Ввиду этого предлагаемый список литературы не претендует на пол-
полноту. В некоторых из перечисленных работ представлен комплексный подход
к анализу и моделированию иммунной системы, а в других развиваются
соответствующие вычислительные методы для решения прикладных задач.
Несмотря на то, что библиографический список составлялся с максимальной
тщательностью, редактор не несет ответственности за возможные ошибки, про-
пропущенную информацию, содержание и качество цитированных работ, а также
за последствия применения соответствующих моделей и методов.
1. Abbattista F., Di Danto G., Di Gioia C, Fanelli M. An associative
memory based on the immune networks // Proc. Int. Conf. Neural
Networks, 1996.
2. Aisu #., Mizutani H. Immunity-based learning — Integration of
distributed search and constraint relaxation. Presented at ICMAS
Workshop on Immunity-Based Systems, December 10, 1996.
3. Ballet P., Tisseau /., Harrouet F. A multi-agent system to model
an human humoral response // Proc. 1997 IEEE Int. Conf. Systems,
Man, and Cybernetics, Orlando, Florida, October 13, 1997.
4. Bersini H., Calenbuhr V. Frustrated chaos in biological networks //
J. Theor. Biol. 1996. V. 188, №2. P. 187-200.
5. Bersini Я., Calenbuhr V. Frustration induced chaos in a system of
coupled ODE's // Chaos Solit. Fract. 1995. V. 5, №8. P. 1533-1549.
6. Bersini Я., Varela F. The immune learning mechanisms: Recruit-
Recruitment reinforcement and their applications // Computing with bio-
biological metaphors (Ed. R.Patton). L.: Chapman and Hall, 1993.
7. Bersini H., Varela F. The immune recruitment mechanism: A selec-
selective evolutionary strategy // Proc. 4th International Conference on
Genetic Algorithms (Eds. R.Belew, L. Booker). Morgan Kaufmann,
1991. P. 520-526.
8. Bersini H., Varela F. Hints for adaptive problem solving gleaned
from immune network // Parallel problem solving from nature (Eds.
H.P.Schwefel, H.Mihlenbein). В.: Springer-Verlag, 1990. P. 343-
354.
9. Calenbuhr V., Varela F., Bersini H. Immune idiotypic network //
Int. J. Bifurc. Chaos. 1996. V. 6, №9. P. 1691-1702.
10. Calenbuhr V., Bersini H., Stewart /., Varela F. Natural tolerance
in a simple immune network // J. Theor. Biol. 1995. V. 177. P. 199—
213.
Общий список литературы 325
11. Calenbuhr V., Bersini Я., Varela F.J., Stewart J. The impact of the
structure of the connectivity matrix on the dynamics of a simple
model for the immune network // Proc. 1st Copenhagen Symp.
on Computer Simulation in Biology, Ecology and Medicine (Ed.
E.Mosekilde). 1993. P. 41-45.
12. Carneiro /., Faro /., Coutinho A, Stewart J. A model of the immune
network with B-T cell co-operation, I: Prototypical structures and
dynamics // J. Theor. Biol. 1996. V. 182. P. 513.
13. Carneiro /., Coutinho A, Stewart J. A model of the immune net-
network with B-T cell co-operation, II: The simulation of ontogenesis //
J. Theor. Biol. 1996. V. 182. P. 531.
14. Carneiro J. Towards a comprehensive view of the immune system.
PhD Thesis. University of Porto. Portugal, 1997.
15. Celada F., Seiden P.E. Affinity maturation and hypermutation in
a simulation of the humoral immune response // Eur. J. Immunol.
1996. V.26. P. 1350-1358.
16. Celada F., Seiden P.E. Modeling immune cognition // Proc. IEEE
Int. Conf. on Systems, Man, and Cybernetics, October 11-14, 1998.
17. Celada F., Seiden P.E. A computer model of cellular interactions in
the immune system // Immunol. Today. 1992. V. 13, №2. P. 56-62.
18. Chowdhury D., Stauffer D. Systematics of the models of immune
response and autoimmune disease // J. Stat. Phys. 1990. V. 59.
P. 1019.
19. Chowdhury D., Stauffer D., Choudary P. V. A unified discrete model
of immune response // J. Theor. Biol. 1990. V. 145. P. 207.
20. Chowdhury D., Chakrabarti B.K. Robustness of the network models
of immune response // Physica A. 1990. V. 167. P. 635.
21. Chowdhury D., Sahimi M., Stauffer D. A discrete model for im-
immune surveillance, tumor immunity and cancer // J. Theor. Biol.
1991. V. 152. P. 263.
22. Chowdhury D., Stauffer D. Statistical physics of immune net-
networks // Physica A. 1992. V. 186. P. 61-81.
23. Chowdhury D., Stauffer D. Bursting of soap films // Physica A.
1992. V. 186. P. 237-249.
24. Chowdhury D. A unified model of immune response, II: Continuum
approach // J. Theor. Biol. 1993. V. 165. P. 135.
25. Chowdhury D., Bhattacharjee J.K., Bhattacharya A. Dynamics of
crumpling of fluid-like amphiphilic membranes // J. Phys. A. 1994.
V. 27. P. 257.
26. Chowdhury D., Deshpande V., Stauffer D. Modelling immune net-
network through cellular automata: a unified mechanism of immuno-
logical memory // Int. J. Mod. Phys. С 1994. V. 5. P. 1049.
27. Chowdhury D., Stauffer D. Zellularautomaten in der Immunolo-
gie // Mag. Fuer Computer Technik. 1991. P. 204.
28. Chowdhury D. Roles of intra-clonal and inter-clonal interactions in
immunological memory: illustration with a toy model // Ind. J.
Phys. 1995. V.69B. P. 539.
326 Общий список литературы
29. Cohen I.R. The cognitive paradigm and the immunological ho-
munculus // Immunol. Today. 1992. V. 13, № 12. P. 490-494.
30. Cohen I.R. The cognitive principle challenges clonal selection //
Immunol. Today. 1992. V. 13, №. 11. P. 441-444.
31. Cooke D.E., Hunt I.E. Recognizing promoter sequences using an ar-
artificial immune system // Proc. Intel. Systems Mol. Biol. (ISMB'95).
AAAI Press, 1995. P. 89-97.
32. Coutinho J. Beyond clonal selection and network // Immunol. Rev.
1989. V. 110. P. 63.
33. Dasgupta D. An artificial immune system as a multiagent decision
support system // IEEE Int. Conf. on Systems, Man, and Cybernet-
Cybernetics, San Diego, 1998.
34. Dasgupta D. Artificial neural networks and artificial immune sys-
systems: Similarities and differences // Proc. IEEE Int. Conf. on
Systems, Man and Cybernetics, Orlando, Florida, October 12-15,
1997.
35. Dasgupta D., Attoh-Okine N. Immunity-based systems: A survey //
Proc. IEEE Int. Conf. on Systems, Man, and Cybernetics, Orlando,
Florida, October 12-15, 1997. P. 363-374.
36. Dasgupta D. Artificial neural networks vs artificial immune sys-
systems // Proc. 6th Int. Conf. on Intelligent Systems, Boston, June
11-13, 1997.
37. Dasgupta D. A new algorithm for anomaly detection in time series
data // Int. Conf. on Knowledge based Computer Systems (KBCS-
96), Bombay, India, December 16-18, 1996.
38. Dasgupta D. Using immunological principles in anomaly detection //
Proc. Artif. Neural Networks in Engineering (ANNIE'96), St. Louis,
USA, November 10-13, 1996.
39. Dasgupta D., Forrest S. Novelty detection in time series data
using ideas from immunology // ISCA 5th Int. Conf. on Intelligent
Systems, Reno, Nevada, June 19-21, 1996.
40. Dasgupta D., Forrest S. Tool breakage detection in milling op-
operations using a negative-selection algorithm. Technical Report
CS95-5, Department of Computer Science, University of New Mex-
Mexico, 1995.
41. Deaton R., Garzon M., Rose J.A., Murphy R.C., Stevens S.E. Jr,
Franceschett D.R. DNA based artificial immune system for self-
nonself discrimination // Proc. 1997 IEEE Int. Conf. on Systems,
Man, and Cybernetics, Orlando, Florida, October 13, 1997.
42. DeBoer RJ., Hogeweg P., Perelson A.S. Growth and recruitment in
the immune network // Theoretical and experimental insights into
immunology (Eds. A.S. Perelson and G. Weisbuch). В.: Springer-
Verlag, 1992. P. 223-247.
43. DeBoer R.J., Perelson A.S. Size and connectivity as emergent
properties of a developing immune network // J. Theor. Biol. 1991.
V. 149. P. 381-424.
Общий список литературы 327
44. DeBoer R.J., Segel L.A., Perelson A.S. Pattern formation in one
and two dimensional shape space models of the immune system //
J. Theor. Biol. 1992. V. 155. P. 295-333.
45. De Monvel J.H.B., Martin O.C. Memory capacity in large idiotypic
networks // Bull. Math. Biol. 1995. V. 57. P. 109.
46. Detours V., Sulzer В., Perelson A.S. Size and connectivity of the
idiotypic network are independent of the discreteness of the affinity
distribution // J. Theor. Biol. 1996. V. 183. P. 409-416.
47. Detours V. Modeles formels de la selection des cellules В et T. PhD
Thesis, University Paris 6, France, 1996.
48. Detours V., Bersini H., Stewart /., Varela F. Development of an
idiotypic network in shape space // J. Theor. Biol. 1994. V. 170.
P401-414.
49. D'haeseleer P., Forrest S., Helman P. An immunological approach
to change detection: algorithms, analysis, and implications // Proc.
1996 IEEE Symp. on Computer Security and Privacy, IEEE Com-
Computer Society Press, Los Alamitos, CA, 1996. P. 110-119.
50. D'haeseleer P., Forrest S., Helman P. A distributed approach to
anomaly detection // ACM Transactions on Information System
Security, 1997 (submitted).
51. Dilger W. Decentralized autonomous organization of the intelligent
home according to the principles of the immunity system // Proc.
1997 IEEE Int. Conf. on Systems, Man, and Cybernetics, Orlando,
Florida, October 13, 1997.
52. Farmer J.D. A rosetta stone for connectionism // Physica D. 1990.
V.42. P. 153-187.
53. Farmer J.D., Packard N.H., Perelson A.S. The immune system,
adaptation, and machine learning // Physica D. 1986. V.22. P. 187-204.
54. Faro J., Velasco S. Studies on a recent class of network models of
the immune system // J. Theor. Biol. 1993. V. 164. P. 271.
55. Fishman M.A., Perelson A.S. Modeling T cell-antigen presenting
cell interactions // J. Theor. Biol. 1993. V. 160. P. 311-342.
56. Forrest S., Somayaji A, Ackley D.H. Building diverse computer
systems // Proc. 6th Workshop on Hot Topics in Operating Systems,
IEEE Computer Society Press, Los Alamitos, CA, 1997. P. 67-72.
57. Forrest S., Hofmeyr S., Somayaji A. Computer immunology //
Comm. ACM. 1997. V.40, № 10. P. 88-96.
58. Forrest S., Javornik В., Smith R.E., Perelson A.S. Using genetic
algorithms to explore pattern recognition in the immune system //
Evol. Сотр. 1993. V. 1, №3. P. 191-211.
59. Forrest S., Hofmeyr S.A., Somayaji A., Longstaff T.A. A sense
of self for Unix processes // Proc. 1996 IEEE Symp. on Computer
Security and Privacy, IEEE Computer Society Press, Los Alamitos,
CA, 1996. P. 120-128.
60. Forrest S., Perelson A.S., Allen L., Cherukuri R. Self-nonself
discrimination in a computer // Proc. IEEE Symp. on Research in
Security and Privacy, IEEE Computer Society Press, Los Alamitos,
CA, 1994. P. 202-212.
328 Общий список литературы
61. Forrest S., Perelson A.S. Genetic algorithms and the immune
system // Parallel problem solving from nature (Eds. H. Schwefel
and R. Maenner). Berlin: Springer-Verlag, 1991 (Lecture Notes in
Computer Science).
62. Frank S.A. The design of natural and artificial adaptive systems.
N.Y.: Academic Press, 1996 (M.R.Rose and G.V. Lauder edition).
63. Fukuda Т., Mori K., Tsukiyama M. Immune networks using genetic
algorithm for adaptive production scheduling // 15th IFAC World
Congress, V.3, 1993. P. 57-60.
64. Gibert C.J., Routen T.W. Associative memory in an immune-based
system // Proc. 12th National Conference on Artificial Intelligence
(AAAI-94), Seattle, July 31 - August 4, 1994. P. 852-857.
65. Hajela P., Lee J. Constrained genetic search via schema adaptation:
An immune network solution // Struct. Optimiz. 1996. V. 12, № 1.
P. 11-15.
66. Hajela P., Yoo /., Lee J. GA based simulation of immune net-
networks — Applications in structural optimization // J. Eng. Optimiz.
1997.
67. Hart E., Ross P. Immune system for robust scheduling // ICEC'98.
68. Helman P., Forrest S. An efficient algorithm for generating random
antibody strings. Technical Report 94-07, University of New Mex-
Mexico, Albuquerque, NM, 1994.
69. Hightower R., Forrest S., Perelson A.S. The evolution of coopera-
cooperation in immune system gene libraries. Technical Report CS-92-20,
University of New Mexico, Albuquerque, NM, 1992.
70. Hightower R., Forrest S., Perelson A.S. The evolution of emergent
organization in immune system gene libraries // Proc. 6th Int. Conf.
on Genetic Algorithms (Ed. L.J.Eshelman). San Francisco: Morgan
Kaufmann, 1995. P. 344-350.
71. Hightower R., Forrest S., Perelson A.S. The Baldwin effect in the
immune system: learning by somatic hypermutation // Adaptive
individuals in evolving populations (Eds. R. K. Belew, M. Mitchell).
Reading, MA: Addison-Wesley, 1996. P. 159-167.
72. Hirayama H., Fukuyama Y. Analysis of dynamical transition of
immune reactions of idiotype network // ICMAS Workshop on
immunity-based systems, December 10, 1996.
73. Hirayama H., Fukuyama Y. A priority in immune system — A
hypothetical theoretical study // ICMAS Workshop on immunity-
based systems, December 10, 1996.
74. Hofmeyr S., Forrest S., Somayaji A. Lightweight intrusion detec-
detection for networked operating systems // J. Сотр. Security, 1997.
75. Hoffmann G. W. A neural network model based on the analogy with
the immune system // J. Theor. Biol. 1986. V. 122. P. 33-67.
76. Hunt J.E., King СМ., Cooke D.E. Immunizing against fraud // Proc.
Knowledge Discovery and Data Mining, IEE Colloquium, October
1996.
Общий список литературы 329
77. Hunt J.E., Cooke D.E. Learning using an artificial immune system //
J. Network Сотр. Appl. (Special issue on intelligent systems: design
and application). 1996. V. 19. P. 189-212.
78. Hunt J.E., Fellows A. Introducing an immune response into a CBR
system for data mining // BCS ESG'96 Conference and published as
Research and Development in Expert Systems XIII, 1996.
79. Hunt J.E., Cooke D.E., Holstein H. Case memory and retrieval based
on the immune system // First International Conference on Case
Based Reasoning, Published as Case-Based Reasoning Research
and Development (Eds. M. Weloso, A.Aamodt), Lecture Notes in
Artificial Intelligence 1010, 1995. P. 205-216.
80. Hunt J.E., Cooke D.E. An adaptive distributed learning system based
on the immune system // Proc. IEEE Int. Conf. on Systems, Man,
and Cybernetics, 1995. P. 2494-2499.
81. Hunt /., Timmis J. Evolving and visualizing a case database using an
immune network // Eur. Conf. on Artificial Intelligence (ЕСАГ98),
1998.
82. Neal M., Hunt /., Timmis J. Augmenting an artificial immune
network // IEEE Int. Conf. on Systems, Man, and Cybernetics, San
Diego, 1998.
83. Ichikawa S., Ishiguro A., Watanabe Y., Uchikawa Y. Moderationism
in the immune system: Gait acquisition of a legged robot using the
metadynamics function // IEEE Int. Conf. on Systems, Man, and
Cybernetics, San Diego, 1998.
84. Ishiguro A., Ichikawa S., Uchikawa Y. A gait acquisition of 6-
legged walking robot using immune networks // Proc. of IROS'94,
V.2, 1994. P. 1034-1041.
85. Ishiguro A., Watanabe Y., Uchikawa Y. An immunological approach
to dynamic behavior control for autonomous mobile robots // Proc.
IROS'95, V. 1, 1995. P. 495-500.
86. Ishiguro A., Kondo Т., Watanabe Y., Uchikawa Y. Dynamic be-
behavior arbitration of autonomous mobile robots using immune net-
networks // Proc. ICEC'95, V.2, 1995. P. 722-727.
87. Ishiguro A., Kondo Т., Watanabe Y., Uchikawa Y. Immunoid:
An immunological approach to decentralized behavior arbitration
of autonomous mobile robots // Lect. Notes in Computer Science,
V. 1141. Springer-Verlag, 1996. P. 666-675.
88. Ishiguro A., Kuboshiki S., Ichikawa S., Uchikawa Y. Gait control of
hexapod walking robots using mutual-coupled immune networks //
Adv. Robotics. 1996. V. 10, №2. P. 179-195.
89. Ishiguro A., Kondo Т., Watanabe Y., Shirai Y., Uchikawa Y. Emer-
Emergent construction of artificial immune networks for autonomous
mobile robots // Proc. SMC'97, 1997. P. 1222-1228.
90. Ishiguro A., Watanabe Y., Kondo Т., Shirai Y., Uchikawa Y.
Immunoid: A robot with a decentralized behavior arbitration mech-
mechanisms based on the immune system // ICMAS Workshop on
Immunity-Based Systems, December 10, 1996.
330 Общий список литературы
91. Janeway С. A. Jr. How the immune system recognizes invaders //
Sci. Am. 1993. V. 269, №3. P. 72-79.
92. Jerne N.K. The immune system // Sci. Am. 1973. V.229, №1.
P. 52-60.
93. Jerne N.K. Towards a network theory of the immune system // Ann.
Immunol. (Inst. Pasteur). 1974. V. 125C. P. 373-389.
94. Jerne N.K. The generative grammar of the immune system // EMBO
J. 1985. V.4, №4. P. 847-852.
95. Kennedy C. Evolution of self-definition // IEEE Int. Conf. on Sys-
Systems, Man, and Cybernetics, San Diego, 1998.
96. Kephart J.O. A biologically inspired immune system for comput-
computers // Artificial Life IV. Proc. of the 4th Int. Workshop on the
Synthesis and Simulation of Living Systems (Eds. R. A. Brooks and
P.Maes). MIT Press, 1994. P. 130-139.
97. Kephart J.O. et al. Biologically inspired defenses against computer
viruses // Proc. IJCAI'95, Montreal, August 19-25, 1995. P. 985-
996.
98. Kepler T.B., Perelson A.S. Modeling and optimization of popula-
populations subject to time-dependent mutation // Proc. Natl. Acad. Sci.
USA. 1995. V.92. P. 8219-8223.
99. KrishnaKumar K. An immune system framework for integrating
computational intelligence paradigms // Comput. intelligence, a dy-
dynamic perspective. IEEE Press, 1995.
100. KrishnaKumar K., Neidhoefer J.C. Immunized neurocontrol // Ex-
Expert Syst. Appl. 1997. V. 13, №3. P. 201-214.
101. KrishnaKumar K., Neidhoefer J. Immunized adaptive critics //
ICNN'97, Houston, June, 1997.
102. KrishnaKumar K. Immunized neurocontrol: concepts and initial
results // Int. Workshop on combinations of genetic algorithms and
neural networks (COGANN-92). IEEE Press, 1992. P. 146-168.
103. Marrack P., Kappler J.W. How the immune system recognizes the
body // Sci. Am. 1993. V. 269, №3. P. 81-89.
104. Marmelstein R.E., Van Veldhvizen D.A., Lamont G.B. A distributed
architecture for an adaptive computer virus immune // IEEE Int.
Conf. on Systems, Man, and Cybernetics, San Diego, October, 1998.
105. McCoy D., Devarajan V. Artificial immune systems for aerial image
segmentation // Proc. 1997 IEEE Int. Conf. on Systems, Man, and
Cybernetics, Orlando, Florida, October 13, 1997.
106. Mohler R.R., Bruni C, Gandolfi A. A system approach to immunol-
immunology // Proc. IEEE, 1980. V.68, №8. P. 964-990.
107. Morawietz D., Chowdhury D., Vollmar S., Stauffer D. Simulation
of the kinetics of the Widom model of microemulsion // Physica A.
1992. V. 187. P. 126.
108. Mori K., Tsukiyama M., Fukuda T. Immune algorithm with search-
searching diversity and its application to resource allocation problem //
Trans. Inst. Electr. Eng. Japan. 1993. V. 113C, №10. P. 872-878
(in Japanese).
Общий список литературы 331
109. Mori К., Tsukiyama М., Fukuda Т. Immune algorithm and its ap-
application to factory load dispatching planning // 1993 JAPAN-USA
Symp. on Flexible Automation, 1994. P. 1343-1346.
110. Mori K., Tsukiyama M., Fukuda T. Load dispatching planning by
immune algorithm with diversity and learning // 7th Int. Conf. on
Systems Research, Informatics and Cybernetics, V. 2, 1994. P. 136—
141.
111. Mori K., Tsukiyama M., Fukuda T. Multi-optimization by im-
immune algorithm with diversity and learning // 2nd Int. Conf. on
Multi-Agent Systems, Workshop Notes on Immunity-Based Sys-
Systems, 1996. P. 118-123.
112. Mori K., Tsukiyama M., Fukuda T. Application of an immune
algorithm to multi-optimization problems // Trans. Inst. Electr. Eng.
Japan. 1997. V. 117C, №5. P. 593-598 (in Japanese).
113. Mori K., Tsukiyama M., Fukuda T. Artificial immunity based
management system for a semiconductor production line // 1997
IEEE Int. Conf. on Systems, Man, and Cybernetics, V. 1, 1997.
P. 852-856.
114. Mori K., Tsukiyama M., Fukuda T. Adaptive scheduling system
inspired by immune system // IEEE Int. Conf. on Systems, Man,
and Cybernetics, San Diego, 1998.
115. Oprea M., Forrest S. Simulated evolution of antibody gene libraries
under pathogen selection // IEEE Int. Conf. on Systems, Man, and
Cybernetics, San Diego, 1998.
116. Paul W.E. (ed.) Immunology: Recognition and Response ... Read-
Readings from Scientific American. N.Y.: W. H. Freeman, 1991.
117. Perelson A, Hightower R., Forrest S. Evolution (and learning) of
V-region genes // Res. Immunol. 1996. V. 147. P. 202-208.
118. Perelson A.S., Weisbuch G. Immunology for physicists // Rev. Mod.
Phys. 1997. V.69. P. 1219-1267.
119. Percus J.K., Percus 0., Person A.S. Predicting the size of the an-
antibody combining region from consideration of efficient self/non-self
discrimination // Proc. Natl. Acad. Sci. 1993. V.60. P. 1691-1695.
120. Perelson A.S. Immune network theory // Immunol. Rev. 1989.
V. 10. P. 5-36.
121. Perelson A.S., Oster G.F. Theoretical studies of clonal selection:
Minimal antibody repertoire size and reliability of self/non-self
discrimination // J. Theor. Biol. 1979. P. 81. P. 645-670.
122. Pu C, Black A., Cowan C, Walpole J. A specialization toolkit to
increase the diversity in operating systems. Presented at ICMAS
Workshop on Immunity-Based Systems, December 10, 1996.
123. Potter M.A., De Jong K.A. The coevolution of antibodies for concept
learning // Proc. Parallel Problem Solving from Nature (PPSN),
Amsterdam, 1998.
124. Rome G.W. The theoretical models in biology. Oxford University
Press, 1994.
332 Общий список литературы
125. Santos R.M.Z., Bernardes A. The stable-chaotic transition on cel-
cellular automata used to model the immune repertoire // Physica A.
1995. V.219. P. 1-12.
126. Segel L.A., Perelson A.S. Computations in shape space: A new
approach to immune network theory // Theoretical immunology,
Part 2 (Ed. A. S. Perelson). SFI Studies in the Sciences of Complex-
Complexity. Reading, MA: Addison-Wesley, 1988. P. 321-343.
127. Seiden P.E., Celada F. A model for simulating cognate recognition
and response in the immune system // J. Theor. Biol. 1992. V. 158.
P. 329-357.
128. Smith D.J., Forrest S., Ackley D.H., Perelson A.S. Using lazy
evaluation to simulate realistic-size repertoires in models of the
immune system // Bull. Math. Biol. 1997.
129. Smith D.J., Forrest S., Hightower R.R., Perelson A.S. Deriving
shape-space parameters from immunological data for a model of
cross-reactive memory // J. Theor. Biol. 1997. V. 189. P. 141-150.
130. Smith R.E., Forrest S., Perelson A.S. Searching for diverse, cooper-
cooperative populations with genetic algorithms // Evol. Сотр. 1993. V. 1,
№2. P. 127-149.
131. Smith D.J., Forrest S., Perelson A.S. Immunological memory is
associative // ICMAS Worshop on Immunity-based Systems, 1996.
132. Smith R., Forrest S., Perelson A.S. An immune system model for
maintaining diversity in a genetic algorithm // Proc. Workshop on
Foundations of Genetic Algorithms (Ed. L.D. Whitley). Los Altos:
Morgan Kaufmann, 1993.
133. Smith D.J., Forrest S., Ackley D.H., Perelson A.S. Modeling the
effects of prior infection on vaccine efficacy // Proc. 1997 IEEE In-
International Conference on Systems, Man, and Cybernetics, October
12-15, 1997, Orlando, FL, 1997.
134. Somayaji A, Hofmeyr S., Forrest S. Principles of a Computer
Immune System. Presented at New Security Paradigms Workshop,
September, 1997.
135. Stauffer D., Sahimi M. High-dimensional simulation of simple im-
immunological models // J. Theor. Biol. 1994. V. 166. P. 289-297.
136. Stauffer D., Weisbuch G. High-dimensional simulation of the shape-
space model for the immune system // Physica A. 1992. V. 180.
P. 42-52.
137. Tarlinton D. Antigen presentation by memory В cells: The sting is
in the tail // Science. 1997. V.276. P. 374-375.
138. Timmis /., Hunt /., Neal M. Augmenting an artificial immune
network using ordering, self-recognition and histocompatibility op-
operators // Proc. IEEE SMC Conference, 1998.
139. Varela F.J., Stewart J. Dynamics of a class of immune networks
I. Global stability of idiotype interactions // J. Theor. Biol. 1990.
V. 144, №1. P. 93-101.
140. Vertosick F.T., Kelly R.H. Immune network theory: a role for
parallel distributed processing? // Immunology. 1989. V. 66. P. 1-7.
Общий список литературы 333
141. Vertosick F.T., Kelly R.H. The immune system as a neural network:
A multi-epitope approach // J. Theor. Biol. 1991. V. 150. P. 225-237.
142. Varela F., Coutinho A, Dupire R, Vaz N.N. Cognitive net-
networks: immune, neural and otherwise // Theoretical immunology
(Ed. A.S.Perelson), Part 2. Redwood City: Addison-Wesley, 1988.
P. 359.
143. Watanabe Y., Ishiguro A, Shirai Y., Uchikawa Y. Emergent con-
construction of behavior arbitration mechanism based on the immune
system // Adv. Robotics, 1998. V. 12. P. 227-242.
144. Weinand R.G. Somatic mutation, affinity maturation and antibody
repertoire: A computer model // J. Theor. Biol. 1990. V. 143, №3.
P.343-382.
145. Weisbuch G., Oprea M. Capacity of a model immune network //
Bull. Math. Biol. 1994. V. 56. P. 899-921.
146. Weisbuch G. A shape space approach to the dynamics of the immune
system // J. Theor. Biol. 1990. V. 143, №4. P. 507-522.
147. Ishida Y., Mizessyn F. An immune network approach for sensor-
based diagnosis with sensor faults: An experimental simulation for
cement plant. NAIST Technical Report, NAIST-IS-TR 95027, 1995.
148. Ishida Y. An immune network approach to sensor-network with
self-organization for sensor and process faults. NAIST Technical
Report, NAIST-IS-TR 95028, 1995.
149. Ishida Y., Tokimasa Y. An immune network approach for sensor-
based diagnosis with measurement noise and gross errors. NAIST
Technical Report, NAIST-IS-TR 95029, 1995.
150. Ishida Y., Adachi N. An immunological algorithm and its applica-
application to disturbance rejection. NAIST Technical Report, NAIST-IS-
TR 95030, 1995.
151. Ishida Y. Note on immune network and majority network. NAIST
Technical Report, NAIST-IS-TR 95031, 1995.
152. Ishida Y. Distributed and autonomous sensing based on immune
network // Proc. AROB'96, 1996. P. 214-217.
153. Ishida Y., Adachi N. Active noise control by an immune algorithm:
Adaptation in immune system as an evolution // Proc. ICEC'96,
1996. P. 150-153.
154. Ishida Y., Nogi A. Reasoning about structure of interval systems: An
approach by sign directed-graph // Proc. QR'96, 1996. P. 93-102.
155. Ishida Y., Tokimasa Y. Diagnosis by a dynamic network inspired
by immune network // Proc. WCNN'96, San Diego, USA, 1996.
P. 508-511.
156. Ishida Y. Active diagnosis by immunity-based agent approach //
Proc. DX'96, Val-Morin, Canada, 1996. P. 106-114.
157. Ishida Y. A model of group choice for artificial society // Proc.
DARS'96 (Ed. H.Asama). Tokyo: Springer-Verlag, 1996.
158. Ishida Y., Adachi N. An immune algorithm for multiagent: Applica-
Application to adaptive noise neutralization // Proc. IROS'96, Osaka, 1996.
P.1739-1746.
334 Общий список литературы
159. Ishida Y., Tokimasa Y. Data reconcilliation combined with data
evaluation by sensor networks with immune net metaphor // Proc.
35th IEEE Conf. on Decision and Control, 1996, in CD-ROM.
160. Ishida Y. The immune system as a self-identification process: a
survey and a proposal. Presented at ICMAS International Workshop
on Immunity-Based Systems (IMBS'96), Kyoto, December 10-13,
1996. P. 2-12.
161. Ishida Y. Agent-based architecture of selection principle in the
immune system. Presented at ICMAS International Workshop on
Immunity-Based Systems (IMBS'96), Kyoto, December 10-13,
1996. P. 92-104.
162. Ishida Y. An immune network approach to sensor-based diagnosis
by self-organization // Complex Systems. 1996. V. 10, № 1. P. 73-
90.
163. Ishida Y. The immune system as a prototype of autonomous
decentralized systems: An overview // Proc. Int. Symp. on Au-
Autonomous Decentralized Systems (ISADS'97), Berlin, April 9-11,
1997. P. 85-92.
164. Ishida Y. Active diagnosis by self-organization: An approach by
the immune network metaphor // Proc. Int. Joint Conference on
Artificial Intelligence, Nagoya, 1997. P. 1084-1089.
Авторский указатель
Альбус Дж. (Albus J.) 135, 136
Андерсон P. (Anderson R.) 72
Белл Дж. (Bell G.) 121
Берсини У. (Bersini H.) 13, 16, 31, 42,
67, 68, 74
Бар-Op Р. (Ваг-Ог R.) 13, 16, 89
Беллман P. (Bellman R.) 262
Бернет Ф. (Burnet F.) 128, 142
Брэдшоу Н. (Bradshaw N.) 50
Брукс P. (Brooks R.) 218
Варела Ф. (Varela F.) 31, 45, 51, 71,
73, 74, 78
Ватанабе Ю. (Watanabe Yu.) 14, 16,
217, 239
Вей Ж. (Wei X.) 148
Вейсбуш Г. (Weisbuch G.) 51, 71, 72,
74
Веласко С. (Velasco S.) 71
Вербо П. (Werbos Р.) 251, 262
Вертосик Ф. (Vertosick F.) 24
Вольфрам С. (Wolfram S.) 121
Гербоги К. (Gerbogi К.) 50, 61
Гильберт К. (Gilbert С.) 211
Гойо П. (Goyeau P.) 60
Гольдберг Д. (Goldberg D.) 261
Дасгупта Д. (Dasgupta D.) 15, 16, 19,
41, 297
Де Бур P. (De Boer R.) 51, 71, 72, 74,
75-77, 106
Детур В. (Detours V.) 84
Джейнвэй К. (Janeway С.) 92
Дженнер Э. (Jenner E.) 117
Дюшато A. (Duchateau A.) 50
Ерне Н. (Jerne N.) 28, 50, 51, 71, 84,
219, 220
Зульцер Б. (Sulzer В.) 71, 78
Ишигуро A. (Ishiguro A.) 16, 35, 217,
239
Ишида Ю. (Ishida Y.) 35, 37
Иерно Ж. (Hiernaux J.) 128
Йорке Дж. (Yorke J.) 50, 61
Канерва П. (Kanerva P.) 135, 136
Карнейро Й. (Carneiro J.) 16, 69, 77,
82, 83
Кауфман М. (Kaufman M.) 123
Келли P. (Kelly R.) 24
Кефарт Дж. (Kephart J.) 14, 16, 272
Кинг К. (King К.) 16, 188
Киршнер Д. (Kirschner D.) 150
Кон М. (Cohn M.) Ill
Коутиньо A. (Coutinho A.) 45, 51, 69,
75, 82, 84
Кришнакумар К. (KrishnaKumar К.)
14, 16, 250, 271
Кук Д. (Cooke D.) 17, 188
Леон К. (Leon К.) 83
Лэнгман P. (Langman R.) Ill
Марр Д. (Магг D.) 135, 136
Мейс П. (Maes P.) 107, 218
Митчелл М. (Mitchell M.) ПО
Мори К. (Mori К.) 17, 240, 249
Мюнос P. (Munos R.) 60
Нейдхофер Дж. (Neidhoefer J.) 14,
17, 250, 271
Нейман Дж. фон (Neumann J. von)
121
Нил М. (Neal M.) 17, 216
Нойман A. (Neumann A.) 72, 73
Отт Е. (Ott E.) 50, 61
Пастер Л. (Pasteur L.) 117
Патинель Ж. (Patinel J.) 60
336
Авторский указатель
Перельсон A. (Perelson A.) 17, 28, 72,
75, 135, 147, 150, 164, 177
Рихтер П. (Richter P.) 128
Роуэ Г. (Rowe G.) 22
Роутен Т. (Routen Т.) 211
Свиммер М. (Swimmer M.) 17, 272
Сигел Л. (Segel L.) 13, 17, 89, 116
Смит Д. (Smith D.) 13, 14, 17, 135,
146, 177
Соркин Г. (Sorkin G.) 17, 272
Стауффер Д. (Stauffer D.) 123
Стюарт Дж. (Stewart J.) 17, 45, 51,
69, 74, 78, 88
Сянг Ш. (Xiang Zh.) 13, 17, 148, 176
Тан В.-Ю. (Tan W.-Yu.) 13, 17, 148,
175, 176
Тиммис Дж. (Timmis J.) 18, 188, 216
Томас P. (Thomas R.) 123
Трэверс П. (Travers P.) 92
Уайт С. (White S.) 18, 272
Уоткинс К. (Watkins С.) 49, 58
Урбайн Дж. (Urbain J.) 123
Учикава И. (Uchikawa Y.) 18, 217,
239
Фальман С. (Fahlman S.) 53
Фармер Дж. (Farmer J.) 31, 128
Фаро Дж. (Faro J.) 71
Форрест С. (Forrest S.) 15, 18, 29-32,
135, 147, 177, 297
Фукуда Т. (Fukuda Т.) 15, 240, 249
Хант Дж. (Hunt J.) 14, 18, 188, 215
Хелман П. (Helman P.) 30
Хо Д. (Но D.) 148, 149
Хогевег П. (Hogeweg P.) 77
Холланд Дж. (Holland J.) 46, 47, 49,
59
Хоффман Дж. (Hoffmann G.) 30, 71,
123, 128
Цукияма М. (Tsukiyama M.) 18, 240,
249
Чоудхури Д. (Chowdhury D.) 13, 18,
118, 123, 125, 129, 130, 134,
135
Шензле Д. (Schenzle D.) 150
Экли Д. (Ackley D.) 18, 177
Предметный указатель
Автосеквенирование (autosequencing)
287
Автономная распределенная система
(autonomous distributed sys-
system) 318
Автономные агенты (autonomous
agents) 48
Автономные мобильные роботы (au-
(autonomous mobile robots) 217,
218, 222, 223
Автономный режим (off-line regimen)
263, 264, 267
Агенты (agents) 48, 218, 318-322
Адаптивная иммунная система (adap-
(adaptive immune system) 284,
291, 295
Адаптивное управление (adaptive con-
control) 256-257
Адаптивный иммунитет (adaptive im-
immunity) 23, 275, 276, 291
Адаптивный критик (adaptive critic)
250, 252, 261, 262, 264
Активно инфицированные Т-клетки
(actively infected T cells) 149
Алгоритм выделения модульной архи-
архитектуры для нейронных се-
сетей (evolving modular archi-
architecture for neural networks,
EMANN) 49, 52-56
бесполезный нейрон (useless neu-
neuron) 55
параметр терпения (patience para-
parameter) 56
порог полезности (uselessness thre-
threshold) 55, 56
порог стабилизации (settling thre-
threshold) 55
стабильный нейрон (settled neuron)
54
Алгоритм выявления поломки резца
(tool breakage detection) 35
децентрализованного выбора пове-
поведения (decentralized behavior
arbitration) 14, 217, 219, 220,
237
децентрализованной обработки
данных (decentralized pro-
processing mechanism) 220
обнаружения аномалий (anomaly
detection algorithm) 297,
300-302
обучения (learning algorithm) 56
отрицательного отбора (negative-
selection algorithm) 29, 31,
32, 34, 298-309
пожарной цепочки (bucket brigade
algorithm) 49, 60
последовательного сопоставления
(matching algorithm) 190
Q-обучения (Q-learning algorithm)
49, 57-61
метод последовательного разбие-
разбиения области (progressive par-
partition) 60
Анти-антитела (anti-antibodies) 50, 51
Антивирус (antivirus) 15, 277-279,
281, 284, 289, 293
Антивирусное программное обеспече-
обеспечение (antivirus software) 272,
277
Антивирусные лекарственные препа-
препараты (antiviral drugs) 149, 152
Антиген (antigen) 90, 225, 243
собственный (self) 275
Антигенная стимуляция (antigenic
stimulation) 72
Антигенное расстояние (antigenic dis-
distance) 180, 183, 184
338
Предметный указатель
Антиген-презентирующие клетки
(antigen-presenting cells) 20,
22, 79, 208
Антитело (antibody) 225, 243
аффинность (affinity) 50, 227, 242,
275
вариабельная область (variable re-
region) 11, 28, 90, 258
информационная энтропия и раз-
разнообразие (information en-
entropy and diversity) 242
константная область (constant re-
region) 90, 91, 258
Апоптоз (apoptosis) 221
Априорные данные/знания (apriori
data/knowledge) 14, 34, 250,
259, 263, 281, 297
Ассоциативная выборка данных (as-
(associative recall) 139-141
Ассоциативная память (associative
memory) 13, 135
Аутоиммунные заболевания (autoim-
(autoimmune diseases) 91
Блоки микропроцессоров (micropro-
(microprocessor units) 315
Большие интегральные схемы (large
scale integration) 315
Булевы автоматы (boolean automata)
121-123
Вакцинация (vaccination) 72, 74, 135,
177, 178, 185, 186
Вероятностное обнаружение (proba-
(probabilistic detection) 24
Весовой параметр нейрона (connec-
(connection strength) 54-56
Взаимное распознавание (mutual re-
recognition) 11, 35, 242, 245
Виртуальный иммунный агент (vir-
(virtual immune agent) 315
Вирус гепатита С (hepatitis С virus)
177
гриппа (influenza virus) 14, 136,
177, 178, 185
иммунодефицита (immunodefi-
(immunodeficiency virus) 13, 149, 150,
164
Вирусы загрузочного сектора (boot-
sector infectors) 275, 278,
283, 285, 287, 291
ВИЧ-инфекция, механизмы развития
(HIV infection, mechanisms of
development) 150-153
ВИЧ-инфицированный (HIV-infected)
13, 14, 123, 126, 149
Внутренний образ антигена (internal
antigenic image) 51, 128
Временные ряды (time series) 301
Выбор действия (action selection) 234
Выделение особенностей (feature ex-
extraction) 22
Генерация детекторов (detector gener-
generation) 11, 15, 29, 30, 34, 214,
298, 299, 301, 302, 306, 309,
310
Генетические алгоритмы (genetic al-
algorithms) 12, 30, 37, 43, 47,
147, 210, 247, 248
Главный комплекс гистосовместимо-
сти (major histocompatibility
complex) 91, 92
Грипп (influenza) 143, 177, 178, 186
Гуморальный иммунный ответ (humo-
(humoral immune response) 119, 179
Дерево Кэйли (Cayley tree) 72, 76, 78,
129
Дельта-функция Дирака (Dirac delta
function) 173
Дендритные клетки (dendritic cells)
105
Детекторы (detectors) 29, 30, 142,
299, 301, 307, 309
Диагностика неисправностей (fault dia-
diagnosis) 13, 19, 35, 36, 38, 271
Динамика клеточной популяции (cell
population dynamics) 71, 79,
80, 121
Динамическая защита (dynamic de-
defense) 23
Динамическое отображение (dynami-
(dynamical map) 124
Динамическое программирование
(dynamic programming) 262,
263, 265, 268, 299
Предметный указатель
339
Дифференциальное уравнение с за-
запаздывающим аргументом
(delay-differential equation)
303
Дифференцировка клеток (cell differ-
differentiation) 20, 21, 24, 90, 119,
179
Единая модель (unified model) 25
Идиотип (idiotype) 28, 71, 73-75, 80,
81, 91, 128, 131
Идиотипические сети (idiotypic net-
networks) 28, 71, 81-84
Идиотоп (idiotope) 28, 128, 219, 220,
225, 226, 229, 231, 232
Иммунитет (immunity) 70, 117, 143,
188
врожденный (innate) 254, 258, 275,
278, 290
гуморальный (humoral) 21, 179
клеточный (cellular) 21, 92
приобретенный, или адаптивный
(acquired, or adaptive) 23,
117, 119, 275, 276, 284, 291
Иммунная память (immunological
memory) 13, 50, 128, 131,
135, 139, 141, 144, 178, 194,
218
Иммунная сеть (immune network) 71,
72, 76, 78, 84, 117, 131, 210
линейная и циклическая (linear
and cyclic) 128, 129
со структурой дерева Кэйли (Cayley-
tree-like) 129
Иммунная сеть второго поколения
(second generation immune
network) 13, 69, 71, 76, 77
Иммунные вычислительные системы
(immune computational sys-
systems)
вычислительные модули (computa-
(computational modules) 258, 259
мезоструктура (mesostructure)
257, 258
роль эволюционных алгоритмов
(the role of evolutionary algo-
algorithms) 259-261
Иммунный адаптивный критик (im-
(immunized adaptive critic) 250,
261, 262, 264-270
Иммунный алгоритм (immune al-
algorithm) 14, 15, 222, 240,
242-245, 247, 248, 297
Иммунный ответ (immune response)
21, 23, 36, 70, 72, 73, 80, 97,
98, 100, 105, 111, 113, 119,
127, 138, 143, 144, 184, 210,
241, 254
Иммуноглобулины (immunoglobulins)
73, 79
Иммуноид (immunoid) 223-234, 236
Иммунологические вычисления (im-
(immunological computations)
11
Иммунология (immunology, natural
immunology) 42, 89, 90, 118
Инновационный цикл (innovation cy-
cycle) 252
Инструктивный механизм иммунного
ответа (instructive mechanism
of immune response) 33
Интеллектуальное управление (intel-
(intelligent control) 251-255
Информационная энтропия (informa-
(informative entropy) 242
Искусственная иммунная сеть (arti-
(artificial immune network) 205,
222, 219, 234
Искусственная иммунная система (ar-
(artificial immune system) 189,
207
Искусственный иммунный алгоритм
(artificial immune algorithm)
248
Искусственный интеллект (artificial
intelligence) 89, 109, 207,
217, 222, 315
Категориальная архитектура (sub-
sumption architecture) 218
Квазивиды (quasi-species) 177, 178,
185, 221
Классификатор (classifier) 46, 52,
278, 281-283, 295
Клетки памяти (memory cells) 21,
119, 127, 138, 179, 185, 248
340
Предметный указатель
Клеточные автоматы (cellular automa-
automata) 12, 25, 121, 129
Клеточный иммунитет (cellular im-
immunity) 21, 92
Клональная селекция (clonal selec-
selection) 24, 119-121, 127, 130
Клонально-селекционная теория (clo-
(clonal selection theory) 84, 117,
118, 127
Комбинаторная оптимизация (combi-
(combinatorial optimization) 43, 242
Компьютерная безопасность (compu-
(computer security) 31, 147
Компьютерные вирусы (computer vi-
viruses) 272
репликация (replication) 285, 286
Контрольная сумма (checksum) 279
Костный мозг (bone marrow) 20, 75,
82-85,91, 106, 150,219,221,
243, 245
Критерии эффективности иммунной
системы (immune system ef-
effectiveness criteria) 91
Латентно инфицированные Т-клетки
(latently infected T cells) 151
Лекарственная устойчивость (drug
resistance) 155, 158, 164, 170,
171
Лимфоциты (lymphocytes) 20, 26
Липополисахарид (lipopolysaccharide)
72
Макровирусы (macro viruses) 275,
278, 283, 285, 287, 291, 294
Макрос (macros) 273
Макрофаг (macrophage) 20, 91, 92,
94, 105, 118, 219, 254
Машинное обучение (machine learn-
learning) 12, 14, 37, 188, 211, 214
Метаболизм (metabolism) 223
Метадинамика (metadynamics) 81,
83, 221, 234
Метка (token) 318-320
Метод каскадных корреляций (cas-
(cascade correlation) 53
Монте-Карло (Monte-Carlo me-
method) 149, 161, 167, 171
Метод наименьших квадратов (least-
squares method) 159
обратного распространения ошиб-
ошибки (backpropagation algo-
algorithm) 54, 251, 262
обучения Хебба (Hebbian learning)
24
общей дезинфекции (generic disin-
disinfection) 278-281, 283
Рунге-Кутты (Runge-Kutta me-
method) 303
триграмм (trigram matching) 198,
200
хеширования Карпа-Рабина (Кагр-
Rabin hash) 280
эвристического динамического
программирования (heuristic
dynamic programming) 251,
262, 265, 268
Многослойный перцептрон (multi-
(multilayer perceptron) 298
Модели пространства состояний
(state space models) 149, 157,
158, 161, 167, 170, 171, 173,
174
Модель наблюдений (observation mo-
model) 157, 170
Мозжечковая модель арифметиче-
арифметического компьютера (cerebellar
model arithmetic computer)
135, 136
Мошенничество с закладными (mort-
(mortgage fraud) 207-209,212,214
Мультиагентные сети (multiagent
nets) 314, 318-322
Мультимодальная функция (multi-
modal function) 14, 240, 248
Незавершенное производство (work
in process) 314, 316
Нейроконтроль (neurocontrol) 252
Нейронные сети (neural networks) 21,
42, 43, 47, 207
Ненаправленная реорганизация (undi-
(undirected reorganisation) 65
Неподвижная точка (fixed point) 62,
63, 72, 73, 77, 122, 123
Нервная система (nervous system) 24,
26, 27, 37
Предметный указатель
341
Область доступа (access circle) 140,
141
Область стимуляции (ball of stimula-
stimulation) 137, 139, 141-143
Область эффективного контроля (zone
of effective control) 62-64
Обнаружение аномалий (anomaly de-
detection) 12, 15, 34, 297, 298,
300-304, 306, 308, 309
Обнаружение вирусов (virus detec-
detection) 31
Обратная связь (feedback) 35, 93, 94,
191
Обучение с подкреплением (reinforce-
(reinforcement learning) 46, 48, 49, 57,
59, 60, 68, 107-109, 231, 237
Объектно-ориентированный подход
(object oriented approach) 206
Оконные автоматы (window automata)
122
Оперативный режим (on-line regimen)
52, 263, 264, 267
Оператор (operator) безразличного
состояния (don't care opera-
operator) 59
генетического алгоритма (of ge-
genetic algorithm) 261, 268
мутации, гипермутирования (muta-
(mutation, hypermutation) 245, 247,
260, 261, 268
гистосовместимости (histocompati-
bility) 212
клонирования (cloning) 213
левого сдвига (left shift) 281
самораспознавания (self-recogni-
(self-recognition) 212
склеивания (splice) 261
скрещивания (crossover) 245, 247,
261
управления (control) 265
Определитель (выделитель) сигнатуры
(signature extractor) 34, 289
Опсонизация (opsonization) 90
Оптимальное управление (optimal
control) 253, 257
Оптимизация (optimization) 42, 94
Оптимизация функций (function opti-
optimization) 240, 247, 248
Отображение Хенона (Henon map)
50, 63
Память (memory) 23, 27, 37, 49, 51,
72, 74, 119, 135, 195
Параллельный поиск (parallel search)
245, 249
Параметрическая пластичность (para-
(parametric plasticity) 44-46, 62
Паратоп (paratope) 71, 219, 220, 225,
226, 229, 234
Патогены (pathogens) 90, 92, 100,
101, 105
Первородный антигенный грех (orig-
(original antigenic sin) 136, 182—
185
Перекрестная реактивность (cross-re-
(cross-reactivity) 177, 178, 180, 181,
185
Периферическая иммунная система
(peripheral immune system)
13, 69, 70, 73-75, 80, 82-84
Плазматическая клетка (plasma cell)
90, 119, 138, 179
Пластичность параметрическая (para-
(parametric plasticity) 44-46, 62
структурная (structural plasticity)
45, 47, 62
Плейотропия (pleiotropy) 106
Поведение системы (system behavior)
52, 113, 297
Поведенческая сеть (behavior network
system) 218
Повышение устойчивости (stability
augmentation) 255, 256, 271
Порог селекции (selection threshold)
202, 205
стимуляции (stimulation threshold)
204
Пороговые автоматы (threshold au-
automata) 121
Последовательности Макея-Гласса
(Mackey-Glass series) 303-
305
Поточная линия для производства по-
полупроводников (semiconduc-
(semiconductor production line) 15, 315,
316, 318, 322
342
Предметный указатель
Правило частичного соответствия
(partial matching rule) 29, 299
Предельный цикл (limit cycle) 122,
128, 129
Предшествующая инфекция (prior in-
infection) 14, 135, 143, 144,
177, 178, 180-186
Преобразование Фурье (Fourier trans-
transformation) 311
Прибор с зарядовой связью (charge-
coupled device) 227, 228
Приобретенный иммунитет (acquired
immunity) 117, 119, 284
Приспособленность (fitness) 93, 136,
268
Программы-приманки (decoy pro-
programs) 33, 285-290, 294
Пространственная организация (spa-
(spatial organization) 89, 90, 105,
106
Пространственно-временная динами-
динамика (spatio-temporal dynamics)
121
Пространство конфигураций (shape
space) 25, 73, 75, 76, 83, 129,
130
Радиус стимуляции (stimulation ra-
radius) 137
Разнообразие (diversity) 22, 36, 42,
105, 118, 137, 242, 243, 245,
248
Раскрашенная сеть Петри (colored
Petri net) 318
Распознавание образов (pattern recog-
recognition) 11, 13, 19, 36-38, 43,
218, 298
своего и чужого (self-nonself dis-
discrimination) 22, 29, 44, 127,
137, 220, 315
Распределение Больцмана (Boltz-
mann distribution) 58
Распределенный поиск (distributed
search) 23
Рассредоточенная память (sparse dis-
distributed memory) 13, 139,
141, 142, 144
Расстояние по Хеммингу (Hamming
distance) 139-141
Регуляция (regulation) 23
Репертуар (repertoire) 28, 70, 74, 76,
80-85, 221
Рецепторы к антигену (antigen recep-
receptors) 29, 137, 142, 298, 319
аффинность (affinity) 71, 76, 78,
79, 82, 129, 137, 138, 141,
142, 179, 181
лигирование (ligation) 71
Робастное управление (robust control)
252-255
Ряды Тейлора (Taylor series) 158, 161
Самоорганизация (self organisation)
12, 35, 69, 74, 84, ПО, 194,
214, 307
Саморегуляция (self-regulation) 23
Свободные ВИЧ (free HIV) 13,
148-153, 158, 165-170
Свое (self) 22, 29, 30, 32, 34, 44, 119,
297, 299, 301-303, 305, 307,
309, 311
Сегментация аэрофотоснимков (aerial
image segmentation) 37
Сетевая гипотеза (network hypothe-
hypothesis) 138, 220
Сетевая модель второго поколения
(second generation network
model) 69, 71, 77-79, 82-84
Сетевая модель третьего поколе-
поколения (third generation network
model) 13, 69, 84, 85
Системы классификаторов (classifier
systems) 46, 47, 49, 57, 59,
60, 64
Системы производства полупровод-
полупроводников (semiconductor produc-
production systems) 15, 314-318,
322
Скользящее окно (sliding window)
300, 305
Слабо контролируемое руководство
(weakly supervised guidance)
65
Сложные системы (complex systems)
42, 47, 64, 68, 117, 322
Соматическая теория (somatic theory)
242, 243
Предметный указатель
343
Соматическое гипермутирование (so-
(somatic hypermutation) 23, 203
Специализированные интегральные
схемы (application specific
integrated circuit) 315
Специфичность (specificity) 24
Средство визуализации (visualization
tool) 207
Стохастическая модель системы
(stochastic system model)
149, 150
Стохастические дифференциальные
уравнения (stochastic differ-
differential equations) 153, 155,
156, 170
Теория адаптивного резонанса (adap-
(adaptive resonance theory) 298
Тимус (thymus) 20, 29, 85, 91, 150,
219, 221, 234, 298
Толерантность (tolerance) 23, 70, 72,
74, 78, 80, 84, 127, 141
Удовлетворяющие критерии (satisfy-
(satisfying criteria) 65
Управление летательными аппарата-
аппаратами (aircraft control) 14, 251,
254, 255, 265
Управление хаосом (control of chaos)
42, 50, 64
Уравнение Беллмана (Bellman equa-
equation) 262, 264, 265, 268
Макея-Гласса (Mackey-Glass
equation) 297, 303, 304, 305,
311
Риккати (Riccati equation) 263, 264
Фагоцитоз (phagocytosis) 91
Фаза обучения (learning phase) 36,
190, 192, 308, 309
Файловые вирусы (file infectors) 275,
278, 285
Фиксированный приоритет (fixed pri-
priority) 218
Фильтр Калмана квадратичный (qua-
(quadratic Kalman filter) 148, 158,
169, 170, 171
Фильтр Калмана расширенный (ex-
(extended Kalman filter) 161,
167, 169, 170, 171, 173
Функция с убывающими максиму-
максимумами (decreasing peaks func-
function) 246
Шуберта (Shubert function) 240,
242, 246, 247
Хемотаксис (chemotaxis) 104, 105
Целевая функция (objective function)
46, 241, 256
и жизнеспособные цели (viable tar-
targets) 65
Центральная иммунная система (cen-
(central immune system) 13, 69,
70, 72
Циклический избыточный код (cyclic
redundancy check) 280
Цитокины (cytokines) 91, 105, 108
Число Хилла (Hill number) 125
Эволюционные алгоритмы (evolution-
(evolutionary algorithms) 21, 41, 43,
258-260
Эпидемическая инфекция (epidemic
infection) 181
Эпидемические штаммы (epidemic
strains) 177, 178, 180-186
Эпитоп (epitope) 26, 126, 128, 258
Эффективность вакцины (vaccine effi-
efficacy) 177, 182
Эффектор (effector) 89, 92, 94-101,
103-108, 111-113, 115, 123
В-клетки (В cells) 37, 79, 90, 91, 106,
133, 211
В-Т-клеточная кооперация (В-Т cell
cooperation) 69
Т-клетки (Т cells) 13, 20, 21, 29,
78-83, 91, 92, 119, 135, 144,
211, 254, 298
супрессорные (supressor) 21, 71,
123, 126
хелперные (helper) 21, 23, 71, 91,
107, 119, 123, 126
цитотоксические (cytotoxic) 91,
119, 138
Т-клеточный рецептор (TCR) 79-82,
91, 105, 137
Научное издание
ИСКУССТВЕННЫЕ ИММУННЫЕ СИСТЕМЫ И ИХ ПРИМЕНЕНИЕ
Редактор Е.Б. Гугля
Оригинал-макет: В.В. Затекин
Оформление переплета: А.Ю. Алехина
Подписано в печать 05.04.06. Формат 60x90/16. Бумага офсетная.
Печать офсетная. Усл. печ. л. 21,5. Уч.-изд. л. 23,6. Тираж 600 экз.
Заказ №
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997, Москва, ул. Профсоюзная, 90
E-mail: fizmat@maik.ru, fmlsale@maik.ru;
http://www.fml.ru
Отпечатано с готовых диапозитивов
в ОАО «Чебоксарская типография № 1»
428019, г. Чебоксары, пр. И. Яковлева, 15
ISBN 5-9221-0706-2
985922 107068