Текст
                    
.г. Нщпщя
’ЛППШТЯЭТ!


Н.Г. РАМБИДИ НАНОТЕХНОЛОГИИ И МОЛЕКУЛЯРНЫЕ КОМПЬЮТЕРЫ МОСКВА ФИЗМАТЛИТ 2007
УДК 681.3 ББК 22.36 Р21 Рамбиди Н. Г. Нанотехнологии и молекулярные компьюте- ры. - М ФИЗМАТЛИТ, 2007. - 256 с. - ISBN 978 5-9221-0869-0. Эта книга об одном из наиболее ранних и активно развивающихся направлений нанотехнологии — создании вычислительных устройств, в которых в качестве элементной базы используются отдельные моле- кулы или же их сравнительно небольшие ансамбли. Изложены основные принципы обработки информации на молеку- лярном уровне, сложная и во многом противоречивая история разработ- ки молекулярных вычислительных устройств и последние результаты, которые позволяют надеяться на новый прорыв в современной вычис- лительной технике. Рассматриваются цифровые молекулярные систе- мы, сходные по своей архитектуре с современными компьютерами, а также устройства, имитирующие биологические принципы обработки информации, которые, по-видимому, смогут эффективно решать задачи искусственного интеллекта. Для студентов, аспирантов и научных работников, создающих новые перспективные средства обработки информации, а также для широкого круга читателей, интересующихся этой проблемой. ISBN 978-5-9221-0869-0 © ФИЗМАТЛИТ, 2007 © И. Г. Рамбиди, 2007
ОГЛАВЛЕНИЕ Нвгдепие.................................................. 5 I i.i в а 1. Нанотехнология — истоки и становление ...... 9 I 1 Несколько слов о корнях нанотехнологии в человеческом сознании............................................ 9 I .2. Нанотехнология, возникшая на страницах научной фанта- стики, становится основой новой промышленной револю- ции . ............................................. 13 1.3. Нанотехнология выходит на государственный уровень . . 27 I 4 . Нанотехнология сегодня — основные принципы и их неожиданные воплощения.......... ............. 33 I и в а 2. Вычислительная техника и нанотехнология...... 39 I. Немного об истории вычислительных средств . ..... 39 2.2. Полупроводниковые приборы — революция в электронике 48 2.3. Планарная полупроводниковая технология — всеобщее признание и ограничения......... ............... 58 I 1ва 3. Молекулярная элементная база вычислительных устройств.......................................... 65 3 I. Несколько предварительных замечаний.............. 65 3.2. Первые идеи, инициировавшие становление молекулярной электроники...................................... 74 3.3. Молекулярная память на основе белка бактериородопсина 100 3.4. Запоминающие устройства на основе эффекта «выжига- ния провалов» в спектрах поглощения............... 105 3 5. Молекулярная память: надежды разработчиков или реаль- ность?............................................ 108 3.6. И еще одна попытка — хироптицен................. 118 I и в а 4. Химические реакционно-диффузионные среды и искусственный интеллект.......... ............. 121 I I. Информационные потребности постиндустриального об- щества и парадигма фон Неймана................... 121 1.2. Вычислительная техника и задачи искусственного интел- лекта ............................................ 127 1.3. Биологически инспирированные средства обработки ин- формации: нейронные сети и нейрокомпьютеры...........129 1.4. Будущее нейрокомпьютинга — сомнительное наследство цифровых компьютеров................................ 136 I 5. Реакционно-диффузионные средства обработки информа- ции............................................. 138 I 6. Среды типа Белоусова-Жаботинского — нейросетевая ар- хитектура ..................................... 141 I 7. «Возникающие» информационные механизмы......... 149 1 8. Принципы обработки информации реакционно-диффузи- онными устройствами.............................. 150
4 Оглавление Глава 5. реакционно-диффузионный процессор: возможно- сти и ограничения........... . ... 152 5.1. Реакционно-диффузионный процессор: основные принци- пы ................................................ 152 5.2. Обработка изображений средами типа Белоусова-Жабо- тинского........................................... 161 5.3. Реакционно-диффузионный процессор: определение крат- чайшего пути в лабиринте........................... 180 5.4. Системы взаимосвязанных реакционно-диффузионных ре- акторов: распознающие устройства................... 191 Глава 6. Самоорганизация — общий принцип обработки информации распределенными динамическими систе- мами ........................................... 196 6.1. Самоорганизация и особенности ее проявления в различ- ных динамических системах...........................196 6.2. Процессы самоорганизации и их особенности.......197 6.3. Синергетические принципы процессов самоорганизации. . 203 6.4. Реакционно-диффузионный процессор — самоорганизую- щаяся динамическая система..........................213 Глава 7. Новые идеи... Новые возможности?...............217 7.1. Развитие биологических принципов обработки информа- ции — аморфный компьютинг...........................217 7.2. Полупроводниковые реакционно-диффузионные устрой- ства — первые попытки...............................225 7.3. ДНК-компьютинг — изощренное сочетание принципов и «инструментов» обработки информации.................230 Глава 8. Что же дальше?. . . . ..... 235 8.1. Нужна ли молекулярная элементная база разработчикам цифровых компьютеров с фон-неймановской архитекту- рой? ............................................235 8.2. Биологические принципы обработки информации и их роль в развитии информационных технологий......241 Список литературы.......................................252
ВВЕДЕНИЕ Нанотехнология занимает особое место среди современных и.травлений человеческой деятельности. История ее возникновения и становления полна гениальных прозрений и долгого, казалось бы, пренебрежения к их реализа- ции. Полвека тому назад на годичном собрании Американского физического общества разносторонне одаренный физик Ричард Фейнман подробно изложил основы того, что сегодня называется нанотехнологией. Именно тогда были сформулированы основные нанотехнологические принципы: • миниатюризация устройств, вплоть до предельных разме- ров атомно-молекулярного уровня, принципиально улучша- ющая их функциональные возможности, • управление макросвойствами объекта за счет направленно- го заданного изменения его структуры на нано- (молеку- лярном) уровне. Тем не менее, промышленное производство, т. е. то, на что должны были быть направлены усилия этой области деятельно- । in, не было готово, в сущности, ее сознательно воспринимать. 11 только в самом конце прошлого века накопившиеся потребно- < in производства привели к нанотехнологическому буму. Нужно заметить, что сама идея создания устройств с пре- ik jii.ho миниатюрными размерами не была чуждой человеку и до ною. Достаточно вспомнить различные миниатюрные модели, и.(пример, парусных судов, заключенных в стеклянные сосуды, приветствия и целые картины на рисовых зернах в качестве подарков к знаменательным событиям и т. д. В то же время, и промышленном производстве широко использовался в прошлом • ниютии нанотехнологический принцип — управление макро- ।коническими свойствами материала за счет направленного воз- Д1ПГГВИЯ на его микроструктуру. Это лежало в основе про- мышленного производства натурального каучука, синтетических подокон заданными свойствами, и многих других промышлен- ных изделий. Но все же, среди всех направлений человеческой
6 Введение деятельности именно вычислительная техника сыграла особую роль в становлении нанотехнологии. На протяжении всей второй половины прошлого века вы- числительная техника неуклонно шла по пути миниатюризации электронных схем. Более того, в конце прошлого века она сде- лалась одним из основных оселков, на которых оттачивались и оттачиваются нанотехнологические представления. Исторически первый, интенсивный всплеск нанотехнологиче- ской активности, правда, еще не называвшейся тогда нанотехно- логией, произошел именно в вычислительной технике. Источни- ком этого и мощной движущей силой были сложности промыш- ленного становления планарной полупроводниковой технологии в микроэлектронике и острая заинтересованность оборонных ве- домств в быстром совершенствовании электронных вычислитель- ных средств. Начало было положено в США, когда талантливый физик, сотрудник Военно-морской исследовательской лаборатории США Форрест Картер пробудил в научном сообществе интерес к мо- лекулярной электронике. Деятельность Картера была многогран- ной. Он разработал несколько подходов к построению молеку- лярной элементной базы вычислительных устройств на основе не использовавшихся ранее физических эффектов. Так, он предло- жил создавать переключающиеся схемы на основе управляемого прохождения электрона через систему энергетических барьеров. Эта идея была реализована в те годы на основе твердотель- ных полупроводниковых сверхрешеток. Картер разработал раз- личные модели переключающихся устройств, с использованием молекулярных солитонов. Это явление — распространение по молекулярной цепочке возбуждения — было предложено ранее и изучено известным советским физиком А. С. Давыдовым. Но не менее важной стороной деятельности Картера была его ор- ганизационная активность. Три международные конференции по молекулярным электронным устройствам были организованы им на протяжении 80-х гг. Они собрали десятки ученых, работав- ших в областях, близких к молекулярной электронике, и способ- ствовали их.объединению. К сожалению, последняя конференция прошла в 1987 г. уже после безвременной смерти организатора. В начале 90-х гг. после периода молекулярного бума в микро- электронике наступило некоторое отрезвление. Укрепилось по- нимание того, что молекула представляет собой микрообъект, поведение которого определяется квантово-механическими прин- ципами. Переходы между отдельными энергетическими состоя- ниями молекулы носят вероятностный характер. Поэтому в каче-
Введение 1 । н<- переключающихся элементов, даже при достаточно высокой вероятности молекулярного перехода, приходится использовать не отдельную молекулу, а их совокупность, т. е. малый объем вещества. Использование такого подхода привело к созданию мо- "льпых молекулярных выпрямителей тока и простейших пере- нимающихся устройств. Наиболее перспективной разработкой '•шло создание нескольких молекулярных оперативных запоми- нающих устройств на основе белка бактериородопсина. Казалось, что молекулярная электроника вошла в стадию ।покойного развития, накопления экспериментальных фактов и поиска новых путей создания молекулярных устройств об- рлоотки информации. Но на границе прошлого и нашего ты- сячелетий в этой области снова произошел прорыв. В основе >чо лежали успехи современной синтетической органической хи- мии. Как следствие, разработка молекулярных вычислительных vi-фойств вплотную приблизилась к стадии их промышленного производства. В Советском Союзе исследования по созданию молекулярных , чройств обработки информации были организованы в конце <0 \ гг. на государственном уровне. Головной организацией был ПИИ физических проблем Министерства электронной промыш- ленности СССР, который координировал деятельность исследо- ii.ilельских групп АН СССР и некоторых высших учебных за- ведений. Работы проводились под эгидой Комиссии Президиума । М СССР, которой был создан Межведомственный совет по проблеме «молекулярная электроника», определявший основные и.травления работ. Исключительно важную роль в их разви- IIIH сыграла неуемная энергия Заместителя Председателя НТС Комиссии Президиума СМ СССР Б. А. Киясова, который, на к-не, был основным организатором работ в этой области. На протяжении десяти лет в Советском Союзе была создана дей- । ценная инфраструктура, позволившая вести сложные теорети- ческие и экспериментальные работы. В качестве примера мож- но назвать разработку запоминающих устройств сверхвысокой •мкости на основе эффекта выжигания провалов в оптических • центрах. По своему уровню эти работы, проводившиеся группа- ми Р. И. Персонова в Москве и К. К. Ребане в Тарту, не только не уступали, но скорее превосходили по своему уровню анало- iimiiue зарубежные работы. В 1989 г. была разработана перспек- । пиная программа работ по созданию молекулярных устройств, р.п (читанная на последующие пять лет. К сожалению, начиная с 1990 г. финансирование работ в этой > |.1сти (как и по другим направлениям научно-исследователь-
8 Введение ской деятельности) было практически прекращено. И на протя- жении последующих лет в России очень медленными темпами из всей разработанной программы проводились только работы по технологии бактериородопсиновых сред и обработке информации распределенными нелинейными средами. В этой небольшой книге сделана попытка рассказать о ста- новлении и развитии работ по молекулярным устройствам об- работки информации, проходивших в атмосфере, полной на- дежд, энтузиазма, взлетов и разочарований. Мне кажется, что об этом нужно писать именно сейчас, когда появилась реаль- ная возможность создавать принципиально новые вычислитель- ные и информационно-логические устройства на молекулярном уровне. Они вряд ли заменят существующую полупроводнико- вую электронику. Но эти устройства смогут существенно допол- нить ее и резко расширить возможности современной индустрии информации.
Глава 1 НАНОТЕХНОЛОГИЯ — ИСТОКИ И СТАНОВЛЕНИЕ Государь посмотрел и видит: точно, лежит на серебряном подносе самая крошечная соринка. Работники говорят: — Извольте пальчик послюнить и ее на ладошку взять. — На что же мне эта соринка? — Это, — отвечают, — не соринка, а нимфозория. — Живая она? — Никак нет, — отвечают, — не живая, а из чистой из аглицкой стали в изображении блохи нами выкована, и в середине в ней завод и пру- жина. Извольте ключиком повернуть: она сейчас начнет дансе танцевать. Н. С Лесков. Сказ о тульском косом Левше и о стальной блохе 1.1. Несколько слов о корнях нанотехнологии в человеческом сознании Говоря о нанотехнологии — основе не только технической и технологической революции последних лет, но и источнике фундаментальных сдвигов в психологии человеческого общества, не следует забывать о ее потенциальных истоках. Начиная со стародавних времен казалась совершенно естественной сама идея миниатюризации, т. е. существования или же создания объектов <• размерами намного меньшими, чем привычные для человека и, н‘м не менее, выполняющих присущие их макроаналогам функ- ции. Это проявлялось как в народных поверьях о разнообразных миниатюрных существах — эльфах и гномах, соседствующих < человеком, так и в литературе. Так, более трехсот лет тому назад великий фантаст Джо- на ган Свифт подробно описал государство лилипутов. Размеры <чо жителей были в десятки раз меньше средних человеческих, по устройство и законы общества мало отличались от господ- < 1нующих в то время в Англии. Свифт блестяще использовал кыдуманную им модель как сатирик. И именно в этом, в сущ-
10 Гл. I. Нанотехнология — истоки и становление ности, проявилась одна из основных целей использованного им нанотехнологического, как мы его понимаем сегодня, подхода — его практическая значимость. В середине XIX в. известным русским писателем Николаем Семеновичем Лесковым была написана повесть «Сказ о тульском косом Левше и о стальной блохе». В ней рассказывалось о том, как Государь Император Александр Павлович, путешествуя по- сле Венского Конгресса, получил в Англии в подарок «нинфузо- рию» — стальную блоху. Она была видна только в «мелкоскоп» и, когда заведут, шевелила усиками и танцевала. По возвращении императора в Россию это чудо для назидания было показано тульским кузнецам. Их мастер Левша не только не удивился, но и пообещал блоху модернизировать. В результате блоха усиками продолжала шевелить, но танцевать перестала. Разгневанному императору Левша объяснил, что блоху они подковали. На каж- дой подковке было выбито имя делавшего ее кузнеца, а сам Левша изготовил гвоздики, которыми эти подковки прибивались. Ближе к нашим дням, в 1963 г., польский писатель Стани- слав Лем опубликовал фантастический роман «Непобедимый». В нем он сконструировал странную механистическую цивили- зацию, обитающую на далекой планете — сложную систему, построенную из громадного числа микроскопических частиц. В каждой из них помещался простейший сенсор, логическое устройство, устройство связи с другими частицами и микроско- пический движитель для свободного перемещения. Логические возможности, минимальные для отдельной частицы, резко воз- растали при их объединении. Объединенный конгломерат, туча, как его называет Лем, представлял собой распределенную са- моорганизующуюся систему с децентрализованным управлени- ем. Оно осуществляется объединенным интеллектом системы, уровень которого определяется ее размером. В романе части- цы системы изначально находятся в россыпи на поверхности планеты. Если появляется посторонний объект, вызывающий тревогу, в воздух поднимаются несколько ближайших частиц. Обнаруженная ими угроза, приводит, по мере оценки ее степени, к присоединению к первоначальным частицам все большего их числа. Это увеличивает как возникающий интеллект системы, так и ее оперативные возможности. Сенсоры частиц реагируют на биологические белковые объекты. И основная цель популя- ции частиц заключается в борьбе за существование с биологи- ческими формами жизни. Эта популяция подавляет биоформы, окружая их тучей частиц и стирая их память направленным электромагнитным воздействием.
/. /. Несколько слов о корнях нанотехнологии в человеческом сознании И Технологический принцип «сверху-вниз» Технологический принцип «снизу-вверх» Рис. 1.1. Схема технологических принципов «сверху-вниз» и «снизу-вверх» Немного подробностей: системы микрочастиц и «возникающие» в них < нойства Удивительно, что в своем романе Станислав Лем предвосхитил нанотехно- кинческий принцип построения системы, который сегодня называется принци- пом «снизу-вверх». В современной промышленной практике господствует про- шноположный принцип «сверху-вниз», когда на основании заранее созданной юн грукции и выбранной технологии исходная болванка металла, например, последовательно обтачивается, фрезеруется, рассверливается, чтобы получить сот чный продукт — необходимую сложную деталь (рис. 1.1). В отличие от ною принцип построения «снизу-вверх» в его чистом виде подразумевает, но изделие последовательно создается из ее элементарных частей за счет процессов самоорганизации. Исходный материал для изготовления изделия представляет собой систему, состоящую из большого числа элементов (атомов, модекул или же их ансамблей), каждый из которых может выполнять некото- рые физические действия. Принципиально важным фактором, определяющим и хнологические» возможности системы, является характер взаимодействия ui\ элементов. При определенных условиях в системе возникают свойства, и, п-твующие у отдельного элемента. Подробно появление таких «возникаю- .... свойств будет описано ниже. Можно было бы приводить и другие литературные примеры, и которых в том или ином виде проявлялись бы нанотехнологиче- • кис идеи. Но и того, что уже прозвучало, достаточно для того, нпбы выявить смысл основных нанотехнологических подходов: • предельная микро- (нано-) миниатюризация макрообъек- гов, которая приводит к их микроаналогам с измененными в заранее заданном направлении свойствами;
12 Гл. 1. Нанотехнология — истоки и становление • направленное изменение структуры макрообъекта на микро- (нано-) уровне для наперед заданного изменения свойств макрообъекта; • технологический принцип «снизу-вверх». Нужно отметить, что и до наступления нанотехнологического бума исследователи, работавшие в различных областях чело- веческой деятельности, использовали эти принципы, находясь в положении известного героя пьесы Мольера, который и не подозревал, что говорит прозой. Бутадиен Стирол СН2=СН-СН=СН2 + СН2=СН -£ сн2-сн=сн- сн2 - сн2— СН }п Бутадиенстирольный каучук Изопрен СН3 (1)СН2=С(2) (3)СН=С(4)Н2 сн3 CHfl, с=с СН3- -сн2-с--- L сн=сн2 СН3 сн2=с ECH-CH2i {н2с сн Транс-1,4- полиизопрен ”1 Натуральный каучук СН, Н С=С -[н2с сн2^ Цис-1,4- полиизопрен 1,2-полиизопрен 3,4-полиизопрсн Рис. 1.2. Синтез искусственного (а) и натурального (б) каучука Немного подробностей: всего лишь один химический пример В технике первой половины прошлого века играл важную роль природный каучук, на основе которого производились разнообразные промышленные изделия. Он поступал в промышленно развитые страны из Юго-Восточной Азии. Было известно, что естественный каучук представляет собой полимер органического соединения — изопрена. Тем не менее, попытки получить
1.2. Нанотехнология — основа новой промышленной революции 13 < интетический каучук на этой основе оказались в предвоенные годы безуспеш- ными (рис 1.2). Полимеризация проходила, но полученный продукт настолько отличался от природного, что использовать его в качестве заменителя было невозможно. С началом второй мировой войны источники натурального ;..|учука были отрезаны в результате быстрого захвата Японией Юго-Восточной А ши. К этому времени в основных промышленно развитых странах было осво- ено производство заменителей натурального каучука на другой синтетической • и нове. В Советском Союзе на основании фундаментальных исследований 11 Л . Кондакова и С. В. Лебедева был создан полибутадиен. В Германии Hi.iJio организовано производство бутадиен-стирольного каучука. В США । рунной исследователей под руководством известного химика Каротерса был ннтезирован неопрен — продукт полимеризации хлорированного бутадиена. Но, несмотря на крупнотоннажное производство этих синтетических каучуков, проблема синтеза натурального каучука оставалась насущной, поскольку его нойства существенно превосходили свойства заменителей. Эта проблема была решена только в послевоенные годы, когда была определена молекулярная нруктура природного каучука. Оказалось, что только один из четырех шчможных изомеров, которые возникают в процессе полимеризации изопрена, представляет собой структуру натурального каучука. И только после этого, в । 'ище 50-х гг. удалось разработать методы стереоспецифического синтеза — южного процесса на молекулярном уровне, который позволил получить при ||||||цмеризации избирательно необходимый изомер полиизопрена. На основе и hi о было организовано и его крупнотоннажное производство. 1.2. Нанотехнология, возникшая на страницах научной фантастики, становится основой новой промышленной революции ! (ачиная с середины прошлого столетия возможности ис- шын.зования природных микрообъектов или же создания руко- шорных, способных выполнять те или иные макроскопические в нствия, активно обсуждаются на научном уровне. 11о видимому, одним из первых был знаменитый физик XX в. piiiiii Шредингер, который в феврале 1943 г. прочел в Тринити Колледже (Дублин) лекцию на тему «Что такое жизнь с точки ipriniH физики». В этой лекции, вышедшей позже в виде кни- । и и переизданной во многих странах, он впервые предложил irii iii апериодического кристалла — микросистемы большой ин- формационной емкости. В сущности, он предвосхитил принцип (нения генетической информации в структуре ДНК, говоря: Маленькую молекулу можно назвать «зародышем твердого in Исходя из такого маленького твердого зародыша, очевид-
14 Гл. I. Нанотехнология — истоки и становление но, возможно представить себе два различных пути построения все больших и больших ассоциаций. Один — это сравнительно однообразный путь повторения снова и снова одной и той же структуры в трех направлениях. Таким путем растет кристалл. Раз периодичность установилась, то уже нет определенной гра- ницы для размера такого агрегата. Другой путь — это построе- ние все более и более увеличивающегося агрегата без скучного механизма повторения. Это случай все более и более сложной органической молекулы, в которой каждый атом, каждая группа атомов играет индивидуальную роль, не вполне равнозначную роли других атомов и групп. Мы можем совершенно точно на- звать это образование апериодическим кристаллом или твердым телом и выразить нашу гипотезу словами: Мы полагаем, что ген или, может быть, целое хромосомное волокно представляет собою апериодическое твердое тело». Возникновение нанотехнологии, как самостоятельной обла- сти науки и техники, связывают обычно с выдающимся физиком XX века Ричардом Фейнманом. 29 декабря 1959 г. он прочи- тал на заседании Американского физического общества лекцию на тему «Еще много места в самом низу». В ней он обратил внимание физического сообщества на то, что среди разнооб- разных областей физических исследований существует область, которая не находится в поле зрения физиков, но которая сулит множество разнообразных научных и технических приложений. Это — детальное изучение объектов микро- и нанометрового размера. В качестве первого примера Фейнман рассмотрел про- блему компактного хранения информации — «Можно ли раз- местить 24 тома Британской энциклопедии на булавочной го- ловке?». Отвечая на этот вопрос Фейнман отметил, что, если увеличить булавочную головку (диаметр 1/16 дюйма) в 25000 раз, ее площадь будет действительно порядка площади всех страниц энциклопедии. При этом мельчайший элемент текста — точка, может быть отображен совокупностью 1000 атомов. Да- лее Фейнман остановился на целом ряде возможностей, кото- рые возникают при конструировании и использовании сверхми- ниатюрных устройств. Это и сверхплотная запись и хранение любой информации, и разработка миниатюрных компьютеров, и создание автономных инструментов, которые смогут выполнять хирургические операции непосредственно в организме человека. Фейнман говорил: «...было бы интересно для хирургии, если бы вы могли проглотить хирурга. Вы введете механического хирурга в кровеносные сосуды и он пройдет к сердцу и «осмотрится» там (рис. 1.3)... Другие маленькие машины могут быть встроены
1.2. Нанотехнология — основа новой промышленной революции 15 Рис. 1.3. Механический «хирург» в кровеносной системе '< к» для того, чтобы помочь плохо функционирующим орга- 1 В своей лекции Фейнман упоминал о возможности прямого пн к и химических соединений непосредственно из атомов, до- < uni их последовательно к создаваемой структуре. В общем, । hi о многом, что фактически осуществлено сегодня из пред- । । .пшй Ричарда Фейнмана, как-то по-новому воспринимаешь । ночигельные слова его лекции: «В 2000 г. ... люди будут in инься, почему до 1960 г. никто серьезно не продвинулся • (•м направлении».
16 Гл. 1. Нанотехнология — истоки и становление Термин «нанотехнолгия» был предложен в 1974 г. сотруд- ником Токийского университета Норио Танигучи. По своему первоначальному смыслу этот термин определял прецизионное изготовление деталей в процессе промышленного производства с предельно точно выдержанными размерами и с ультрамалыми допусками. В своей статье «Основные концепции нанотехноло- гии» Танигучи писал: «Нанотехнология — это технология про- изводства, которая позволяет добиться сверхвысокой воспроиз- водимости и точности... При обработке материалов наименьшее количество материала, которое удаляется или наращивается, со- ставляет атом или молекулу, т.е. 0,1-0,2 нанометра... Поэтому нанотехнология в целом представляет собой процессы разде- ления, объединения и деформирования материалов на уровне одного атома или же молекулы». Иной смысл, не только расширяющий это понятие, но и, в сущности, изменивший его смысл, был введен американским ученым Эриком Дрекслером. В 1981 г., будучи сотрудником Массачузеттского Технологического Института и вдохновленный идеями Ричарда Фейнмана, он опубликовал статью под назва- нием «Молекулярная инженерия: подход к разработке общих принципов манипулирования молекулами». Опираясь на разра- ботанную к тому времени технику конструирования сложных белковых макромолекул из простых молекулярных фрагментов, он рассмотрел возможности создания на молекулярном уровне различных устройств. В их число входили актюаторы, моторы, насосы и, даже, провода и подшипники. Через несколько лет после этого Дрекслер обнародовал свою основную книгу «Ма- шины создания. Грядущая эра нанотехнологии». По-видимому, лучшее компактное описание того, что содержится в этой книге, принадлежит одному из ведущих ученых в области информатики прошлого века Марвину Минскому, написавшему предисловие к этой книге. «Машины создания» начинаются с мысли о том, что наши возможности что-либо делать зависят от того, что мы можем построить. Это ведет к осторожному анализу возможных спо- собов складывать атомы. Далее Дрекслер задается вопросом: «Что мы могли бы строить с помощью таких складывающих атомы механизмов?» Для примера, мы могли бы производить сборочные машины, по размеру намного меньшие даже живых клеток, и делать материалы более прочными и легкими, чем любые имеющиеся на сегодня. А значит, — лучшие космические корабли. А значит, — крошечные устройства, которые могут путешествовать по капиллярам, чтобы входить в них и вое-
1.2. Нанотехнология — основа новой промышленной революции 17 станавливать живые клетки. Следовательно, мы получили бы способность лечить болезнь, обращать вспять разрушительное воздействие возраста или сделать наши тела более быстрыми или более сильными, чем прежде. И мы могли бы делать машины вплоть до размеров вирусов, машины, которые будут работать со скоростями, которые никто из нас не может еще оценить. А затем, как только мы научимся это делать, мы смогли бы собирать мириады таких крошечных частей в интеллектуальные машины, возможно, основанные на использовании квинтильонов ианоскопических параллельно работающих устройств, которые делают описания, сравнивают их с ранее записанными моделями и затем используют результаты всех прошлых экспериментов. Таким образом, эти новые технологии могли бы изменить не просто материалы и средства, которые мы используем, чтобы формировать нашу физическую среду, но также и действия, которые мы были бы затем способны совершать внутри любого создаваемого нами вида мира. Как мне кажется, несмотря на все, что мы слышим о со- временных технологических революциях, в действительности, они не сделали таких больших перемен в нашей жизни, какие сделали революции первой половины столетия. Действительно ли телевидение изменило наш мир? Несомненно, меньше, чем это сделало радио, и даже меньше, чем это сделал телефон. Как насчет самолетов? Они просто уменьшили время путешествия с дней до часов — в то время как железная дорога и автомобиль уже сделали большие изменения, сократив это время путеше- ствия с недель до дней! Но «Машины создания» ставят нас на порог поистине значительных перемен; нанотехнология могла бы иметь большее влияние на наше материальное существование, чем такие два последних больших изобретения этого рода — юмена палок и камней металлом и цементом и использование 1лсктричества. Точно так же мы можем сравнивать возможное воздействие искусственного интеллекта на то, как мы думаем, п на то, как мы могли бы начать думать о самих себе, толь- ко с двумя более ранними изобретениями: изобретением языка и письма. Скоро мы будем вынуждены встать перед некоторыми из этих перспектив и выборов. Как нам следует с ними поступать? Книга «Машины создания» объясняет, как эти новые альтернативы мог- ли бы затронуть многое из того, что в наибольшей степени забо- iiiT человечество: богатство и бедность, здоровье и болезни, мир и война. И Дрекслер предлагает не просто нейтральное перечис- ление возможностей, но множество идей и предложений о том,
18 Гл. 1. Нанотехнология — истоки и становление как можно было начать их оценивать. «Машины создания» — пока что наилучшая попытка подготовить нас к размышлению на тему: куда мы можем прийти и следует ли препятствовать созданию новых технологий». в Рис. 1.4. Молекулярные устройства Дрекслера: «зубчатая передача» (а), более сложная «зубчатая система» (б), подшипник (в) Эрик Дрекслер широко пропагандировал идеи создания мо- лекулярных машин в большом числе журнальных публикаций и книгах. Одна из наиболее известных среди них — книга под названием «Наносистемы: Молекулярные машины для произ- водства и вычислений». Для того, чтобы дать более наглядное представление о предлагаемых возможностях реализации идей Дрекслера, приведем несколько примеров. На рис. 1.4 показа- ны простые варианты молекулярной зубчатой передачи и бо- лее сложные аналогичные устройства. Молекулярная реализация подшипника изображена на том же рисунке. Но, в сущности, несмотря на детальное обсуждение возмож- ностей создания молекулярных устройств, все, что рассматривал Эрик Дрекслер, напоминало скорее научную фантастику типа Жюля Верна, а не обоснованное «техническое задание» на разра- ботку. Об этом писал в предисловии к книге «Машины создания» и Марвин Мински, проводя аналогию между предложениями Дрекслера и идеями Жюля Верна, Герберта Уэллса, Фредерика Пола, Роберта Хейнлайна, Айзека Азимова и Артура Кларка. Дрекслер мысленно конструировал аналоги макроскопических устройств, используя в качестве «строительного материала» на- ноэлементы, включая отдельные атомы и молекулы. Но при этом,
1.2. Нанотехнология — основа новой промышленной революции 19 находясь на уровне представлений 60-70-х гг., он не мог преду- смотреть целый ряд возможных принципиальных ограничений и наметить конкретные пути формирования устройств. Не об- суждалась практически и проблема микро- и макроинтерфейсов, г е. проблема взаимодействия человека и микроустройства. В то же время, быстрый прогресс в ряде областей чело- веческой деятельности и, прежде всего, в полупроводниковой электронике, естественным образом приводил к необходимости использовать нанотехнологические принципы. В ряде техно- логических областей начала создаваться нанотехнологическая база. И, по-видимому, наиболее важным событием явилось создание в 80-е гг. сканирующей туннельной, а затем атомной силовой микроскопии. Это дало возможность не только увидеть объект с атомным разрешением, но и манипулировать атомами и молекулами. Еще подробности: прежде чем что-то сформировать на наноуровне, нужно научиться видеть, что делаешь Для того, чтобы создавать объекты микро- и наноразмеров необходи- мо, естественно, иметь возможность определять их характеристики — форму и структуру, брутто-состав и состав их локальных областей. Возможности широко распространенной оптической микроскопии ограничены ее невысокой разрешающей способностью, которая определяется длиной волны видимого света. Поэтому предельное разрешение составляет ~ 0,0002 мм, а достигаемое увеличение не превышает 500-1000 кратного. В отличие от светового излучения электронный пучок оказывается эф- фективным средством изучения структуры вещества на микро- и наноуровне. В зависимости от энергии электрона отвечающая ему длина волны может со- ставлять 10-2-10-3 нм при не очень высоком ускоряющем электроны напряже- нии (десятки тысяч вольт). Процессы взаимодействия электронов с веществом отличаются значительным разнообразием. Пусть пучок ускоренных электронов надает на достаточно тонкий слой вещества (рис. 1.5). Часть из них упруго рассеивается. Кроме этого, в результате взаимодействия электронов с атомами вещества возникает люминесценция в видимой области спектра, рентгеновское излучение и отраженные вторичные электроны, выбитые из атомов объекта. Часть вторичных электронов, так называемые оже-электроны, дают возмож- ность определять состав приповерхностных слоев и даже найти распределение того или иного химического элемента на поверхности изучаемого объекта. Существенное количество падающих на объект электронов проходит через него не рассеиваясь и не теряя своей энергии, а часть из них при этом упруго и не упруго, т. е. с потерей энергии, рассеивается. В просвечивающем электронном микроскопе электроно-оптическая систе- ма создает монохроматизированный и сфокусированный электронный пучок, который проходит через исследуемый образец (рис. 1.6). Полученное в ре- <ультате взаимодействия электронов и образца распределение электронов фо- кусируется проекционной системой на флюоресцирующий экран или же на фотопластинку. Иногда говорят, что просвечивающий микроскоп действует как слайд-проектор, у которого роль светового потока и слайда играет пучок лектронов и исследуемый образец. Разрешающая способность просвечива-
20 Гл. I. Нанотехнология — истоки и становление Неупруго рассеянные электроны Первичный поток электронов Обрат ное рассеяние Оже-электроны Рентгеновское излучение Катодолюминисценция Вторичные электроны Упруго рассеянные электроны Нерассеянные электроны Рис. 1.5. Механизмы взаимодействия пучка электронов с веществом Просвечивающий электронный микроскоп Рис. 1.7. Изображение нанонити меди, полученное просвечивающим электрон- ным и атомно-силовым микроскопом Рис. 1.6. Принципиальная схема просвечивающего электронного микроскопа Атомно-силовой микроскоп ющего микроскопа может быть доведена до нескольких десятых нанометра. В качестве примера на рис. 1.7 изображение, полученное с помощью просве- чивающего электронного микроскопа, сравнивается с тем же изображением атомно-силового микроскопа. Но, при этом, чем выше разрешающая способ-
1.2. Нанотехнология — основа новой промышленной революции 21 иость просвечивающего микроскопа, тем меньше должна быть длина волны >лектронов, а это требует повышать их энергию. В свою очередь, повышение шергии падающих на образец электронов приводит к ослаблению их взаимо- действия с веществом и прежде всего с легкими атомами. Поэтому полученное и юбражение теряет контраст. Были разработаны различные приемы улучшить и юбражение, полученное электронами высокой энергии. Например, можно напылять на исследуемый объект тонкий слой тяжелых атомов, таких как •номы вольфрама. Но это, естественно, в общем случае искажает полученную информацию. [Электронная пушка] Рис. 1.8. Принципиальная схема растрового электронного микроскопа В существенной степени выходом из этой ситуации было создание раст- рового электронного микроскопа (рис. 1.8). В нем электронный пучок отража- ется от поверхности исследуемого образца и возникающая при этом картина регистрируется электронно-оптической системой. Растровый электронный мик- роскоп позволяет получать контрастные изображения объектов. Как типичные примеры на рис. 1.9 показаны: голова москита с увеличением в 200 (а) и 1000 (б) раз, кровь птицы (в), кристаллические дендриты серебра (г). Но разрешающая способность растровых электронных микроскопов по сравнению с просвечивающими оказывается намного ниже. Минимальные размеры регистрируемых структурных особенностей составляют всего лишь несколько нанометров. Различные варианты электронных микроскопов были доведены к 70- 8()-м гг прошлого столетия до удобных в эксплуатации коммерческих устано- вок. Тем не менее они не могли обеспечивать потребности нанотехнологиче- ских исследований. Резкий перелом произошел в начале 80-х, когда был создан сканирующий туннельный микроскоп. В 1981 г. сотрудники исследовательской лаборатории компании IBM в Цю- рихе — Герд Бинниг и Хейнрих Рорер, создали первый сканирующий тун- нельный микроскоп. О значении этой работы можно судить хотя бы по тому, что всего лишь через пять лет, в 1986 г., за нее они получили Нобелевскую премию по физике, совместно, что примечательно, с Эрнстом Руска, который был награжден «за его фундаментальные работы по электронной оптике и за разработку первого электронного микроскопа» В основу конструкции Биннига и Рорера был заложен квантово- механический принцип тунеллирования электронов через непроводящий парьер. Квантово-механический туннельный эффект — это процесс, благодаря которому частицы просачиваются через потенциальный барьер и оказываются
22 Гл. /. Нанотехнология — истоки и становление а б Рис. 1.9. Изображения, полученные (объяснения в тексте) растровым электронным микроскопом Направление движения Потенциальный Рис. 1.10. Схема туннелирования электронов через потенциальный барьер в областях, которые в классической механике были бы недоступны для них. Пусть имеется частица, удерживаемая в потенциальной яме барьером конечной высоты и ширины. Предположим, что энергия частицы такова, что, если исходить из законов классической механики, ее недостаточно, чтобы частица вышла из ямы, пройдя над потенциальным барьером. Квантово-механическое рассмотрение этой задачи показывает, что существует некоторая вероятность туннельного прохождения частицы сквозь барьер и ее выхода из ямы. Воз- можность туннельного прохождения вытекает из требования непрерывности волновой функции на стенках ямы. Если амплитуда волновой функции не равна нулю на внутренней границе барьера (а это допустимо при условии, что потенциал в этой точке не обращается в бесконечность), она не может просто так исчезнуть внутри барьера. Вместо этого она начинает более или менее быстро стремиться к нулю (рис. 1.10) Если спадание амплитуды происходит не
1.2. Нанотехнология — основа новой промышленной революции 23 слишком быстро, она может и не достигнуть нулевого значения на внешней । ранние барьера В этой точке волновая функция должна плавно переходить к функцию, характерную для свободной частицы вне барьера, и, начиная с этой точки, волна перестанет затухать. Но поскольку волновая функция не исчезла в области снаружи барьера, вероятность найти частицу в этой области отлична от нуля, т.е. частица совершает туннельное прохождение наружу из потенциальной ямы. Перемещение образца Рис 111. Принципиальная схема сканирующего туннельного микроскопа Сканирующий туннельный микроскоп представляет собой систему, состо- ящую из иглы с предельно тонким острием и исследуемого образца, к которо- му приложено постоянное напряжение (рис. 1.11). Расстояние между острием hi 1ы и образцом регулируется пьезоэлементом. Если это расстояние довести чо величины ~ 1 нм, между иглой и образцом возникает туннельный ток, который резко зависит от расстояния от иглы до образца. Поэтому, перемещая образец относительно острия иглы, можно зарегистрировать величину тока, отечающего каждой точке поверхности образца. Эта зависимость отвечает рельефу его поверхности. Недостаток такого варианта микроскопа состоит в том, что туннельный кит резко зависит от расстояния острия иглы до образца и это затрудняет и 1мерение тока Поэтому в разработанных туннельных микроскопах применя- 1с>| и другой метод записи рельефа поверхности. В этом случае туннельный юн поддерживается постоянным системой, которая управляет пьезоэлементом, шмепяя расстояние острия до поверхности образца (рис. 1.12). Создание сканирующего туннельного микроскопа было революционным |>(>ытием, позволившим изучать структуру поверхности твердых тел и обра- nianий на такой поверхности, различая отдельные атомы. О возможностях кио метода можно составить представление по изображениям поверхности । 1.ПИ11Ы. на которой наблюдаются вакансии (рис 1.13) или же отожженной и к ики декантиола на золотой подложке. Техника сканирующей туннельной микроскопии позволяет получать уникальную информацию о процессах, проте- II нищих на твердой поверхности. В частности была изучена диффузия атомов и молекул на поверхности, обнаружены новые стадии каталитических процес- “1Н В то же время возможности туннельной микроскопии значительно шире, । м юлько изучение структурных особенностей поверхностных явлений. Эта и чинка успешно используется для перемещения по поверхности отдельных помои и молекул и формирования на этой основе сложных атомных и молеку- lllpllHX структур Пусть на поверхности кристалла адсорбирован атом, вблизи которого на- и11к я острие иглы туннельного микроскопа. В поле этого острия возникает
24 Гл. 1. Нанотехнология — истоки и становление Рис, 1.12. Схема регистрации туннельного тока: постоянное расстояние острие-образец (а), постоянное значение тока (б) Рис. 1.13. Структура поверхности монокристалла платины (а) и отожженой пленки декантиола (б) на золотой подложке, полученная сканирующим элек- тронным микроскопом сила, притягивающая атом к острию. Нормальная по отношению к поверхности и тангенциальная составляющие этой силы будут различными в зависимости от взаимного расположения атома и иглы (рис. 1.14). Поэтому, если острие сдвигается вдоль поверхности, атом начинает передвигаться по поверхно- сти «скачками», из одного энергетического минимума поверхности кристалла в другой. Этот эффект использовали в 1990 г. сотрудники исследовательско- го отделения компании IBM в Сан Йозе (Калифорния) Эйглер и Швейцер. Они передвинули по поверхности монокристалла никеля-35 адсорбированных атомов ксенона так, что они образовали на поверхности три буквы — IBM (рис. 1.14). С тех пор в различных лабораториях было сформировано на твер- дых поверхностях с помощью туннельного микроскопа множество различных
1.2. Нанотехнология — основа новой промышленной революции 25 г Pin 114. Перенос молекулярных фрагментов сканирующим электронным мик- роскопом: а — принципиальная схема, б и в — передвижение отдельных ато- мов, г — первая надпись, выполненная в лаборатории IBM атомами вольфрама । рук гур (Бранденбургские ворота, загон для скота, треугольники и т. д.). II 1'191 г. Эйглер, Лунц и Рудт предложили также поверхностную конструкцию । in ыбильного элемента, в котором переключение осуществлялось за счет рсхода атома ксенона на поверхности монокристалла никеля из одного устой- пниио состояния в другое. К сожалению, наноэлементы такого типа, которые moi 'in бы быть использованы на практике, до сих пор разработаны не были. Ншможности реорганизации поверхностных атомных и молекулярных рук гур не исчерпываются пространственной перестройкой. Воздействие иглы
26 Гл. Г Нанотехнология — истоки и становление спектрометра может приводить к диссоциации молекулы на атомы или же молекулярные фрагменты. Сканирующая туннельная микроскопия играет важную роль в исследова- ниях структуры поверхности твердого тела. Но, в то же время, она обладает существенным недостатком — объектами исследования могут быть только про- водящие электрический ток материалы. Поэтому всего лишь через несколько лет после создания туннельного микроскопа, в 1985 г., сотрудники компании IBM Бинниг и Гербер в Цюрихе и Кэйт, профессор Стэнфордского университе- та в Калифорнии, разработали сканирующий микроскоп атомного разрешения, позволяющий изучать непроводящие объекты. В этом микроскопе изображе- ние создается за счет взаимодействия острия иглы с атомами поверхности исследуемого образца. Но при этом используется отличный от тунеллирования квантовый эффект взаимодействия атомов на малых расстояниях, так называ- емые дисперсионные силы. Эта сила является одной из самовозбуждающихся сил и возникает из-за корреляции флуктуаций электронной плотности атомов или молекул, Флуктуация в атоме (молекуле) может вызвать появление у него мгновенного дипольного момента. Этот диполь поляризует электронную обо- лочку соседнего атома и при малых расстояниях приводит к появлению у сосед- него атома локального дипольного момента. Взаимодействие индуцированных моментов вызывает притяжение атомов, которое подавляется при приближении атомов друг к другу из-за отталкивания их электронных оболочек. Механизм появления такой самовозбуждающейся силы был рассмотрен в начале 30-х гг. английским физиком Лондоном и получил название дисперсионного взаимо- действия. Его называют также ван-дер-ваальсовым взаимодействием. Рис. 1.15. Принципиальная схема атомно-силового микроскопа Рис. 1.16. Изображения, полученные атомно-силовым микроскопом (объясне- ния в тексте)
1.3. Нанотехнология выходит на государственный уровень 27 Атомный силовой микроскоп использует дисперсионное взаимодействие атомов острия иглы и поверхности исследуемого образца (рис. 1.15). Игла закрепляется на упругой поддержке, которую принято называть английским словом «кантеливер», хотя общеизвестны русские аналоги этого термина — «кронштейн, консоль, укосина». Смещение острия за счет дисперсионного взаимодействия описывается законом Гука, т. е. оно определяется силой дис- персионного взаимодействия и упругостью кантеливера. Один из распростра- ненных способов его регистрации основан на отражении лазерного луча от кантеливера и регистрацией его матрицей фотодиодов. Атомная силовая микроскопия представляет собой сегодня мощный метод >учения структуры разнообразных и, в том числе, биологических объектов и широко используется в исследовательской практике. Как типичные при- меры на рис. 1.16 показаны: а — углеродные нанотрубки (2 х 2мкм), б — натуральная резина (20 х 20мкм), в — кристаллиты МоОз на поверхности M0S2 (8x8 мкм), г — хроматин — комплекс, входящий в состав хромосом и состоящий из белков и ДНК (400 х 400 нм). 1.3. Нанотехнология выходит на государственный уровень Переломным, знаковым событием в становлении нанотехнологии как самостоятельной области техники и технологии была разработка и США документа, который назывался «Национальная технологиче- । кая инициатива. Путь к следующей промышленной революции». Фор- мально этот документ был отчетом Межотраслевой рабочей группы но нанонауке, инженерии и технологии Комитета по технологии при 11ациональном Совете по науке и технологии США и рассматривался как обоснование бюджета на 2001 г., внесенного в Конгресс Президен- |<>м США. В состав Рабочей группы входили представители ведущих ведомств США, включая Национальный научный фонд, министерства оГюроны, торговли, энергетики, транспорта, Национальная администра- ция по аэронавтике и космосу, Национальный институт здравоохране- ния и ряд других ведомств. По своему значению этот раздел бюджета р н сматривался на уровне высшего приоритета развития науки и тех- нологии. В сопровождающей бюджет записке Президент США Билл Клинтон писал: «Мой бюджет поддерживает расходы на Национальную Нанотех- н<| югическую Инициативу в объеме 500 миллионов долларов США... 1 к> способность манипулировать веществом на атомном и молекуляр- ном уровне. Представьте себе возможности: материалы в десять раз прочнее стали и только лишь малая доля веса стали, сжатие всей информации, хранимой в библиотеке Конгресса, до размера кубика A.ip.i обнаружение раковых опухолей, когда они содержат всего инн. несколько клеток. Что-то из этих задач потребует для своего piiiiriiiiH до 20 или более лет, но именно поэтому так важна роль Б к-ральпого правительства».
28 Гл. 1. Нанотехнология — истоки и становление Практически с того момента, когда этот документ увидел свет, он превратился в концепцию индустриального развития США. В основе этого лежит не только значительное увеличение финансирования работ, но и в не меньшей степени глубина охвата проблемы в целом. Документ определяет практически все основные аспекты дея- тельности в области нанотехнологии. Среди них можно выделить ряд принципиально важных положений. Авторы документа предлагают подробное определение сущ- ности и принципиальных задач нанотехнологии: «Сущностью нанотехнологии является возможность работать с веществом на молекулярном уровне, формируя атом за атомом молекулярную структуру, имеющую принципиально новую мо- лекулярную организацию. Поведение структурных особенностей в области от I09 до 10 7 м (от 1 до 100 нм — типичные раз- меры порядка 10 нм в 1000 раз меньше диаметра человеческого волоса) существенно отличается от поведения изолированной молекулы с размерами порядка 1 нм или же макроскопического объема материала. Нанотехнология имеет дело с материалами и системами, структура и компоненты которых проявляют новые, и значительно лучшие физические, химические и биологические свойства, явления и процессы, обусловленные наноразмерами. Целью является использование этих свойств, контролируя струк- туры и устройства на атомном, молекулярном и супрамолекуляр- ном уровне, и изучать возможности производства и применения этих устройств. Другая цель заключается в интеграции этих структур на микро- и макроуровнях». Документ выдвигает первоочередные задачи (великие вызо- вы) ближайшего времени: • резко уменьшить размеры элементов электронных устройств хранения информации и создать память много-терабитовой емкости, • разработать методы формирования материалов «снизу- вверх», т. е. начиная с атомов и молекул, что должно уменьшить расход сырья и загрязнение окружающей среды, • создать материалы, имеющие прочность на порядок выше чем прочность стали, и, в то же время, намного более легкие, что позволит разрабатывать наземные, морские, воздушные и космические объекты более легкими, с мень- шим потреблением топлива,
1.3. Нанотехнология выходит на государственный уровень 29 • поднять быстродействие и эффективность компьютеров за счет уменьшения в миллион раз размеров транзисторов и элементов чипов памяти, • использовать доставку генетических и лекарственных пре- паратов кровеносной системой в сочетании с наномодифи- цированными усилителями контраста магниторезонансных детекторов для определения раковых клеток, • удалять мельчайшие загрязнения воды и воздуха для улуч- шения состояния окружающей среды и питьевой воды, • удвоить энергетическую эффективность солнечных бата- рей. В состав документа «Национальная нанотехнологическая инициатива» были включены два приложения. Первое из них установило основные принципы финансирования в 2001 г. фун- даментальных исследований инфраструктуры, необходимой для успешного их выполнения. Определяя направления фундамен- гальных исследований, авторы документа исходили из того, что ••нанонаука находится еще в состоянии своего детства и только некоторые рудиментарные наноструктуры могут быть созданы п проконтролированы. Наука об атомах и простых молекулах, с одной стороны, и представления о веществе от микронных структур до больших размеров объекта, с другой, установлены достаточно хорошо. Остается область нано размеров, грубо го- воря, от 1 до 100 молекулярных размеров, где фундаменталь- ные свойства материалов могут быть изучены и использованы иля инженерных разработок. В науке и технологии наступает революция, основанная на появившейся в последние годы воз- можности измерять, формировать и манипулировать веществом 11 области от 1 до 100 нм (10~9-10~7м) и на понимании важно- ' III контролировать свойства вещества на уровне наноразмеров почти во всех областях человеческой деятельности. Открытые недавно организованные структуры вещества (такие как нано- । рубки, молекулярные моторы, комплексы ДНК, квантовые ямы, и молекулярные переключатели) и новые явления (магнитосо- противление и размерные ограничения) являются научными про- рывами, которые определяют потенциал дальнейшего развития ||.|цогехнологии. Они производят и используют функциональные •I ।сериалы, устройства и системы, контролируя вещество на этом > рпнне». 11а основе этих представлений в Приложении 1 деталь- п" расшифрованы конкретные направления нанотехнологических • псдований высшего приоритета (великие вызовы). Они на-
30 Гл. 1. Нанотехнология — истоки и становление правлены на создание новых материалов, развитие электрони- ки и оптоэлектроники, совершенствование медицины и охраны окружающей среды, разработку средств преобразования и сохра- нения энергии, индустриализацию космических исследований, развитие биосенсоров для диагностики болезней и биологических угроз, укрепление национальной безопасности и использование нанотехнологических идей в экономике и транспорте. Предложенная администрацией США нанотехнологическая инициатива практически удвоила финансирование этих работ в 2001 г. по сравнению с 2000 г. Основными ведомствами — исполнителями работ, были определены: • Национальный научный фонд (NSF), • Министерство обороны (DOD), • Министерство энергетики (DOE), • Национальная администрация по аэронавтике и космосу (NASA), • Национальный институт стандартов и технологии (NIST) Министерства торговли (DOC), • Национальный институт здравоохранения (NIH). Распределение финансирования по этим ведомствам показано в табл. 1.1. По сравнению с 2000 г. ($270 млн) в 2001 г. оно увеличилось более, чем вдвое, с существенным ростом в после- дующие годы. Принципиальным достижением разработанной программы были предложения по созданию инфраструктуры нанотехнологи- ческих исследований, детально рассмотренные в Приложении 1. Для этого предусматривается: • создание сети центров коллективного пользования, осна- щенных современной научно-исследовательской аппарату- рой, которая должна усилить возможности различных ис- следовательских групп и существенно облегчить их работу; • финансирование вспомогательных работ, включающих в себя метрологию, разработку новых приборов, методов и средств моделирования; • создание этической, законодательной и социологической базы и образовательных учреждений, что необходимо для привлечения квалифицированной рабочей силы в эту новую перспективную область деятельности. В табл. 1.2 приведено финансирование работ 2001 г. по раз- личным разделам Приложения 1 «Национальной нанотехнологи- ческой инициативы».
1.3. Нанотехнология выходит на государственный уровень 31 Таблица 1.1 Финансирование ведомств США в рамках программы «Национальная нанотехнологическая инициатива» ($ млн) Ведомство 2001 2002 2003 2006 2007 Национальный Научный Фонд 150 199 221 344 373 Министерство обороны 123 180 201 436 345 Министерство энергетики 88 91 139 207 258 Министерство юстиции 1,4 1,4 1,4 1 1 Министерство транспорта 0 2 2 Агентство по охране окружающей среды 5 5 5 5 9 НАСА 22 46 51 50 25 Национальный институт здоровья 40 41 43 175 173 Национальный институт стандартов и технологии 33 38 44 76 86 Министерство с ельского хозяйства 1,5 1,5 2,5 2 2 Всего 464 604 710 1301 1277 Таблица 1.2 Финансирование основных разделов программы «Национальная нанотехнологическая инициатива» ($ млн) РАЗДЕЛ 2000 2001 Фундаментальные исследования 87 170 Наиболе важные направления исследований 71 140 Центры коллективного пользования 47 77 Исследовательская инфраструктура 50 80 Правовые, социальные, этические аспекты 15 28 Итого 270 495
32 Гл. I. Нанотехнология — истоки и становление
1.4- Нанотехнология сегодня — принципы и воплощения 33 Приложение 2 к документу «Национальная нанотехнологи- ческая инициатива» посвящено нанотехнологическим устрой- ствам, разработанным на протяжении предыдущих лет. Среди них — магниторезистивные материалы для жестких дисков с вы- сокой плотностью записи информации, наноструктурированные катализаторы, средства доставки лекарственных препаратов по кровеносной системе человека, металло-полимерные композиты, биодетекторы сибирской язвы, устройства для опреснения воды, оперативная память ЭВМ на основе молекул ротаксана. Программа «Национальная Нанотехнологическая Инициати- ва» была принята Конгрессом США, и начиная с 2001 г. рез- ко возрасли ассигнования на нанотехнологические исследования п инженерные разработки (см. табл. 1.2). В 2006 г. они увели- чились более чем вдвое по сравнению с исходным 2000 г. Эта программа, к тому же, оказалась стимулом для развития анало- । ичных работ во всех промышленно развитых странах. Объем исследований, выполненных в 2002 г., и их рост в 2003 г. пока- 1.1ИЫ на рис. 1.17. Обращает на себя внимание то, что развитие работ в области нанотехнологии коррелирует с темпами техноло- |пческого развития страны. Так объем работ, выполненных в Ки- |.1пской Народной Республике, уступал в 2002-2003 гг. только США. Не менее показательны и темпы нанотехнологических работ, о которых можно судить по динамике 2002-2003 гг. 1.4. Нанотехнология сегодня — основные принципы и их неожиданные воплощения На протяжении последних лет разработка конкретных нано не гем подтвердила значимость и привлекательность этой обла- |п деятельности, предсказанную в конце прошлого века. Как " <ультат этого, современное состояние дел можно по праву а тать нанотехнологическим бумом, который охватил большин- |Ц<> областей человеческой деятельности (рис. 1.18). Возникли |‘|цые понятия — «нанохимия», «нанобиология», «наномедици- 11, в сущности, нанотехнология приобрела характер междис- п пппарного подхода, основными областями приложения кото- ”14 являются физика, химия, биология и инженерные разработ- । Одна из попыток собрать воедино основной инструментарий • г<> подхода и конкретные системы, к которым он приложим, 'иллюстрирована на рис. 1.18. Но, в силу значительной раз- И1П.1 в конкретных особенностях различных областей приложе- ц|| и ого подхода, само понятие «нанотехнология» претерпевает • пения. Прежде всего это относится к попыткам разделить 1'.1МГ>ИДИ
34 Гл. 1. Нанотехнология — истоки и становление Рис. 1.18. Структура нанотехнологических исследований технологическую и исследовательскую составляющие этого по- нятия. Так, например, в 2002 г. сотрудник отдела материало- ведения Аргоннской национальной лаборатории США Коеллинг попытался уточнить содержание этих составляющих. Согласно Коеллингу: «Наноразмеры — это не просто следующий шаг миниатюриза- ции. Это качественно новая область с характерными размерами, где свойства материала зависят от размера и формы, так же, как и от состава. Они значительно отличаются от тех же свойств самого материала в целом. «Нанонаука» пытается понять эти свойства. «Нанотехнология» пытается создать материалы и структуры, в которых проявляются новые и существенно отличные (улуч- шенные) физические, химические и трибологические свойства и функции за счет наноразмеров. Целями нанонауки и нанотех- нологии являются: • понимание и предсказание свойств материалов в области наноразмеров, • производство компонентов наноустройств, используя техно- логический подход «снизу-вверх», • интегрирование нанокомпоненты в устройства макроскопи- ческих размеров для практического использования». Подход Коеллинга — далеко не единственная попытка опре- делить содержание и границы нанотехнологии. Но, в сущности,
1.4. Нанотехнология сегодня — принципы и воплощения 35 все они включают в себя основные принципы, характеризую- щие ее. К ним следует отнести: (а) Предельную миниатюризацию изделий, в результате кото- рой микрообъект приобретает новые свойства, отличные от свойств его макроаналога. (б) Управление свойствами макрообъекта за счет направленно- го изменения его структуры на микроуровне. Это управле- ние основано на процессах самосборки и самоорганизации. Существенное значение в системе нанотехнологических цен- ностей играет экономическая привлекательность изделий. В ка- честве одного из множества примеров можно привести металло- полимерные композиты. Введение в полимерную основу нано- частиц металла приводит к сравнимой с металлами прочности материала. Но, в то же время, эти материалы значительно легче и дешевле, что делает их привлекательными для автомобильной промышленности. В этом случае, кроме удешевления автомобиля при использовании металло-композитов в качестве конструкци- онного материала, снижение веса автомобиля приводит к сниже- нию расхода топлива, что приносит дополнительные экономиче- I кис выгоды. Нетрудно заметить, что в приведенном только что опреде- к пии основных нанотехнологических принципов не использова- |<>< ь явно слово «нано». И это не случайно. Внутреннее содержа- ние этих принципов оказывается настолько многообъемлющим, ч|о сегодня они распространяются на области, которые, строго । оворя, трудно отнести к нанотехнологии. Наиболее ярким примером служат работы, выполняемые и ( 'IUA, по созданию систем «пико» и «нано» спутников. Эта си- |гмы обещают серьезный прорыв в возможностях исследования космического пространства. На протяжении последних лет резко по 1росли возможности миниатюризации космических аппаратов. ’ < рьезный прогресс полупроводниковой планарной технологии, ’ч.и ipoe развитие области МЕМС и появление новых конструк- ционных материалов обусловили появление космических аппара- 'н и широком весовом диапазоне. В связи с этим в последние годы сложилась классификация ну Iинков по весу. Стандартными спутниками называют косми- к । кие системы весом более 1000 кг, малыми — с весом от 100 • » 1000 кг, микро- — от 10 до 100 кг, нано- — от 1 до 10 кг и пнко--- весом менее 1 кг. Среди них наиболее привлекатель- iinMii оказались пико- и наноспутники, на основе которых могут ни. разработаны перспективные, новые по своей методологии
36 Гл. 1. Нанотехнология — истоки и становление Носитель наноспутников Рис. 1.19. Наноспутник и его носитель программы космических исследований. Одним из примеров таких программ может служить программа Национального управления США по аэронавтике и исследованию космического пространства (NASA) и Годдаровского космического летного центра (GSFC), направленная на детальное изучение магнитосферы земли. В ос- нове ее лежит создание «созвездия» ~ 100 одинаковых пико- спутников, которые выводятся в космос одновременно на различ- ные орбиты с одним и тем же перигеем ~ 3 земных радиуса. Апогеи орбит должны лежать в интервале от 12 до 43 земных радиусов с разницей в 3 радиуса. Каждый спутник представляет собой специализированную простую систему (рис. 1.19) с двига- телем и запасом топлива для ориентации и коррекции орбиты. В космос они выводятся на промежуточной платформе, которая распределяет их по разным орбитам (рис. 1.20). В программе NASA/GSFC предусматривается, что полученные во время изме- рений на орбите данные передаются в перигее на земной стан- ции. Спутники должны осуществлять как локальные (в текущей точке орбиты) так и дистанционные измерения. Для этого их ориентация относительно земли стабилизируется вращением или же по трем пространственным осям. Таким образом, отдельные элементы системы пикоспутников далеки по своим размерам от нанометровых. Но основные прин- ципы построения системы совпадают с нанотехнологическими. Простейшие микроэлементы составляют макросистему, выполня- ющую намного более сложные по сравнению с отдельными эле- ментами функции. При этом значительным преимуществом си- стемы, по сравнению с отдельным многофункциональным стан-
1.4. Нанотехнология сегодня — принципы и воплощения 37 Рис. 1.20. Орбиты наноспутников в проекте Национального управления США но аэронавтике и исследованию космоса и Годдаровского космического летного центра ыртным спутником, является снижение веса, выводимого на орбиту, возможность использования менее мощного носителя н, как следствие, значительное снижение стоимости программы. Система NASA/GSFC — одна из простейших, обсуждаемых сегодня в литературе, по своей структуре и функциям. Возмож- ны варианты построения систем, в которых выделенные спутни- ки собирают и обрабатывают на орбите информацию с других । путников, анализируют ее и при необходимости дают указания повторить те или иные измерения. Еще более привлекатель- ным вариантом является система пикоспутников, построенная я.। принципах самоорганизации, когда она перестраивает свою ||>уктуру и функции в зависимости от полученных каждым путником системы данных. Таким образом, система наноспутников представляет собой । .in бы макромодель системы, функционирующую на основе на- ши ихнологических принципов. И это, по-видимому, объяснимо. < >1и,гкт, макроскопические свойства которого изменяются за счет и.травленного изменения структуры на микроуровне, представ- ши! собой одну из разновидностей распределенной динамиче- |чи системы. Распределенной динамической системой называ- ..... совокупность элементарных для данной luicMbi составляющих, выполняющих определенные функции и п ыпмодействующие друг с другом. Атомы и молекулы в кри- । । и- пли же аморфном теле, микроорганизмы в биологической • , n.ivpe, отдельные молекулярные блоки в блок-сополимерах — и, ио элементарные составляющие распределенных систем на 1> пы\ уровнях структурной организации. Динамика распреде-
38 Гл. I Нанотехнология — истоки и становление ленных систем определяется не только процессами, протекаю- щими в каждом ее элементе (т. е. в каждой точке системы), но и взаимодействием этих элементов. Поэтому она оказывается принципиально отличной от процессов в ее элементарных со- ставляющих и намного более сложной. В теории распределенных систем используется даже термин «возникающие» свойства, ко- торые присущи системе в целом и не выводятся непосредственно из свойств ее элементарных составляющих. Наносистемы представляют собой в общем случае распре- деленные среды со сложными механизмами взаимодействия на наноуровне. Именно эти механизмы определяют процессы са- мосборки или самоорганизации на уровне структуры системы, которые приводят к появлению новых, возникающих свойств системы на макроуровне. В силу сходства принципов построения и функционирования распределенных систем на разных уров- нях структурной организации, возникающих в них процессов и новых свойств, проявляется и ряд аналогий между системами, построенными на уровне наноразмеров, и макроскопическими распределенными системами. Сегодня, в разгар нанотехнологического бума, принципы и методы нанотехнологии завоевывают все новые позиции в раз- личных областях человеческой деятельности. Но среди этих областей есть одна, которая была как бы «испытательным по- лигоном» для нанотехнологии, проходя последовательные ста- дии миниатюризации элементов создаваемых устройств. Начиная с 40-х гг. прошлого столетия вычислительная техника прошла удивительный путь от вакуумных электронных ламп до сверх- больших интегральных схем (СБИС) и настойчиво стремится сегодня использовать молекулярную элементную базу. В этой книге будет сделана попытка рассказать об основных принципах и путях создания молекулярной элементной базы и возможном месте молекулярных устройств обработки информации в системе информационных технологий.
Глава 2 ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И НАНОТЕХНОЛОГИЯ В те годы вычислительные машины распределя- лись решением правительства. Королев и Ми- шин лично, где только могли, пробивали решения о поставке вычислительных машин в ОКБ-1. Б. Е. Черток. Ракеты и люди. Лунная гонка Современные суперкомпьютеры близки к тому, чтобы сравняться по объему памяти с челове- ческим мозгом. Но они навряд ли заменят его. Для чего тратить двадцать миллионов долларов и получить эрзац-человека, если намного бо- лее дешевые оригиналы — живые люди, широко доступны. Такие ЭВМ нужны для сложнейших научных расчетов, физического моделирования, когда нет более дешевого пути. А искусственному интеллекту придется подождать. Г. Моравек. Когда компьютерные средства срав- няются с человеческим мозгом? 2.1. Немного об истории вычислительных средств Как только люди начали осознавать себя разумными су- ществами, у них появилась потребность описать окружающий мир — считать все, что попадается на глаза. Естественным был и выбор системы счисления. Десять пальцев на руках, десять — па ногах, были решающим доводом в пользу интуитивно выбран- iioii десятичной системы. Так осталось и до сих пор. Менялись, время от времени, знаки, обозначающие цифры, но сама система галась до сих пор практически везде именно этой, психологи- чески наиболее приемлемой для нас. По-видимому, очень скоро пальцев на руках и ногах иерее гало хватать и встал вопрос о инструментах, облег- । нищих вычисления. Развитие вычислительной техники — мши овековой процесс, в котором принимали участие гениальные ,»< нгавители человеческого общества (см. прекрасные обзоры
40 Гл. 2 Вычислительная техника и нанотехнология Б. Н. Малиновского и Б. А. Гладких). Известно, что великий Леонардо да Винчи предложил конструкцию суммирующей вычислительной машины, которая была воспроизведена в ме- талле только в наши дни и оказалась вполне работоспособной. Эта машина могла оперировать с 13-разрядными десятичными числами. Сложение производилось системой зубчатых колес. Рис. 2.1. Принципиальная схема механического вычислительного устройства Немного подробностей: механические вычислители Принципиальная идея такого устройства показана на рис. 2.1. Пусть каж- дому разряду произвольного десятичного числа отвечает ось, на которую насажены два зубчатых колеса с разным числом зубцов. Пусть на каждой оси выбрано исходное положение относительно ее поворота, отвечающее цифре «О». Остальные цифры отвечают последовательным поворотам оси на 36°. При передаточном числе пары зубчатых колес на разных соседних осях, равном 1:10, нужно 10 раз повернуть на 36° ось, отвечающую единицам, для того, что- бы ось, отвечающая десяткам, повернулась бы на одну позицию. Эта конструк- ция позволяет набрать любое, разрешаемое количеством осей системы число, прибавлять или вычитать из него любое другое. Механические системы, осно- ванные на зубчатых передачах, совершенствовались и использовались практи- чески до середины прошлого века. Еще в пятидесятых годах на вооружении Советской Армии была система ПУАЗО (прибор управления артиллерийским зенитным огнем), которая определяла поправки на скорость обстреливаемого самолета, влажность и температуру воздуха и т. д. при управлении зенитным огнем. Она представляла собой передвижной куб со сторонами порядка метра, напичканный шестернями, червячными передачами, электромоторами и т. д.
2.1. Немного об истории вычислительных средств 41 На протяжении последующих после Леонардо да Винчи ве- ков развитием вычислительной техники занимались выдающи- еся ученые разных стран — Блез Паскаль, Готфрид Лейбниц, Чарльз Бэббидж. Тем не менее, к тому времени, когда слож- ные, громоздкие вычисления оказалась жизненно необходимыми, уровень вычислительной техники оказался явно недостаточным для решения наиболее насущных задач. Этим временем была вторая мировая война, когда совершенствование и разработка новых видов оружия привели к неподъемным для того времени потребностям в вычислениях. Рис 2.2. Электронная вычислительная машина ENIAC — ввод исходных дан- ных В 1941 г. сотрудники лаборатории баллистических исследова- ний Абердинского артиллерийского полигона в США обратились н расположенную неподалеку техническую школу при Пенсиль- ванском университете за помощью в составлении таблиц стрель- <и.| для артиллерийских орудий. Они попросили использовать inn этого имевшийся в школе дифференциальный анализатор livnia — громоздкое механическое аналоговое вычислительное < гройство. Однако сотрудник школы физик Джон Мочли, пред- |" кил создать для этого мощный по тем временам компью-
42 Гл. 2. Вычислительная техника и нанотехнология тер на электронных лампах. В апреле 1943 г. был заключен контракт между полигоном и Пенсильванским университетом на создание вычислительной машины, названной электронным цифровым интегратором и компьютером (EN1AC). На это от- пускалось 400 тыс. долларов. К работе было привлечено око- ло 200 человек, в том числе несколько десятков математиков и инженеров. Руководителями работы стали Дж. Мочли и та- лантливый инженер-электронщик Преспер Эккерт. Напряженная работа завершилась в конце 1945 г. ENIAC был предъявлен на испытания и успешно их выдержал. В начале 1946 г. машина начала считать реальные задачи. По размерам она была более чем впечатляющей: 26 м в длину, 6 м в высоту, вес 35 тонн. В ней использовалась десятичная система счисления. Длина слов составляла 10 десятичных разрядов. Емкость электронной памя- ти — 20 слов. Ввод программ осуществлялся с коммутационного поля, что вызывало массу неудобств: смена программы занимала многие часы и даже дни (рис. 2.2). Поэтому в 1945 г., когда за- вершались работы по созданию ENIAC, его создатели уже разра- батывали новый электронный цифровой компьютер EDVAC. Они предлагали размещать программы вычислений непосредственно в оперативной памяти компьютера, чтобы устранить основной недостаток ENIAC — ввод с коммутационного поля. Тогда же к ним в качестве консультанта был направлен выдающийся мате- матик, участник Матхеттенского проекта по созданию атомной бомбы Джон фон Нейман. Он сразу же оценил перспективы развития новой техники и принял самое активное участие в за- вершении работ по созданию EDCVAC. Написанная им часть отчета по машине содержала общее описание EDVAC и основные принципы построения машины. Несмотря на то, что в разработке этих принципов принимал участие ряд сотрудников, работавших над ENIAC и EDVAC, позже эти принципы получили название «фон-неймановских» (парадигма фон Неймана). Как бы то ни было, создание этих принципов было революционным событием для вычислительной техники, определившим ее дальнейшее раз- витие. Не останавливаясь подробно на истории развития цифровых фон-неймановских компьютеров, отметим только несколько зна- чимых вех. В 1953 г. производство ЭВМ общего назначения начала компания IBM. Серийная IBM-701 имела оперативное запоми- нающее устройство, рассчитанное на 2000 36-разрядных слов. Быстродействие ее составляло ~ 10000 операций в секунду.
2.1. Немного об истории вычислительных средств 43 Всего лишь через 6 лет быстродействие ЭВМ IBM-7030, установленной в- ядерном центре в Лос-Аламосе, доходило до I миллиона операций в секунду. Операционная память этой машины составляла 256 тысяч 64-битовых слов. О темпах прогресса вычислительной техники на протяжении второй половины прошлого века можно судить по характери- стикам одного из наиболее мощных суперкомпьютеров нашего времени Тор-500 Earth Simulator. Он состоит из 640 модулей, каждый из которых содержит 8 процессоров. Теоретический пре- дел производительности — 40 терафлоп. Система имеет 10 тера- оайт оперативной памяти. Здесь флоп (float-point operations per second) — количество операций с плавающей запятой в секунду. В Советском Союзе первая электронная вычислительная ма- шина была создана в 1952 г. под руководством академика С. А. Лебедева. Его же первая полномасштабная ЭВМ БЭСМ имела быстродействие 8000 операций в секунду и оперативное упоминающее устройство на 1000 39-разрядных слов. Рис. 2.3. Первая отечественная серийная ЭВМ «Стрела» 11ервая отечественная серийная ЭВМ «Стрела» была постро- н.1 в 1953 г. под руководством Ю. Я. Базилевского (рис. 2.3). I । оыстродействие составляло 2000 операций в секунду, опера- luniioe запоминающее устройство было выполнено на потенциа- > копах (43-разрядные слова). Занимаемая этой машиной пло- >н.| в. составляла ~ 300 м2 без холодильного агрегата, который |рг(>овал практически такую же площадь. большой популярностью среди расчетчиков пользовалась Ч'.М С. А. Лебедева БЭСМ-6, промышленное производство кото- | 'Ц ныло начато в 1968 г. Ее оперативное запоминающее устрой- и>о (одержало от 32 до 128 тысяч ячеек (48-разрядных слов), । oi.li гродействие доходило до 1 миллиона операций в секунду. I 1987 г. было выпущено 355 экземпляров этой машины.
44 Гл. 2. Вычислительная техника и нанотехнология Знаменательным событием в истории развития вычислитель- ной техники было создание совершенно отличного от общей линии развития 40-70 гг. направления персональных компьюте- ров. Этому способствовали, по крайней мере, два обстоятель- ства. Во-первых, в разных областях человеческой деятельности ощущалась настоятельная потребность в вычислительных сред- ствах, достаточно мощных по своим возможностям, и, в то же время, простых в эксплуатации. Во-вторых, электронная про- мышленность была практически готова к этому. Ряд производ- ственных компаний выпустил на рынок компоненты электронных устройств и, в том числе, сравнительно мощные для того време- ни микропроцессоры. Первая попытка объединить компоненты в единый блок была предпринята в 1975 г. фирмой MITS. Она выпустила в продажу комплект под названием “Altair”, который представлял собой кучу деталей и ящик для корпуса. Покупателю приходилось самостоятельно паять и тестировать собранные узлы и создавать программы вычислений на машинном языке. Вслед за этим на рынке появился ряд других вариантов простейших электронных вычислительных устройств. Но начало реальной истории нового направления персональных компьюте- ров связано с именами американских инженеров-электронщиков Стива Джобса и Стива Возняка. В начале 70-х гг. Джобс работал в фирме “Atari”, где он познакомился со старшим разработчиком этой фирмы Роном Вейном. Они, вместе с Возняком, который работал в это время в компании “Hewlett-Packard”, по ночам в гараже собирали пер- сональный компьютер, который они назвали “Apple-1”. Вскоре, 1 апреля 1976 г., они создали фирму “Apple Computer”. Становле- ние этой фирмы проходило с большими трудностями. Постоянная нужда в финансировании, осторожное отношение потребителей к этому новому направлению и ряд других факторов привели к тому, что из фирмы ушел Рои Вейн. Тем не менее, после первой модели “Apple-1” , которая была встречена прохладно, Джобсом и Возняком был создан компьютер “Арр1е-2”, имевший фантасти- ческий успех. И как следствие того к производству персональных компьютеров подключились крупные компании. В начале 80-х компания IBM выпустила в продажу модель 5150, простенько назвав ее IBM рС, введя тем самым повсеместно употребляемое сегодня название «персональный компьютер». И теперь трудно найти хотя бы одну область человеческой деятельности, где не применялись бы эти удивительные вычис- лительные средства, предоставляющие пользователю широкие
2.1. Немного об истории вычислительных средств 45 возможности — от мощных вычислений до расслабляющих раз- влечений. На протяжении второй половины прошлого века вычис- лительная техника шла по пути постоянного наращивания информационной мощности. Особенностью этого процесса было сохранение основных принципов построения вычислительных устройств и неуклонного совершенствования реализующей эти принципы элементной базы. В свою очередь, развитие элементной базы сопровождалось и сменой физических прин- ципов, определявших механизмы функционирования элементов, и их последовательной миниатюризацией, в результате чего приходилось менять технологию производства. Немного подробностей: парадигма фон Неймана и ее реализация Содержание парадигмы фон Неймана сводится к шести основным положе- ниям 1. Вычислительные машины, построенные на электронных элементах, должны работать не в десятичной, а в двоичной системе счисления. 2. Программа должна размещаться в одном из блоков машины — в запо- минающем устройстве, обладающем достаточной емкостью и соответ- ствующими скоростями выборки и записи команд программы. 3. Программа так же, как и числа, с которыми оперирует машина, пред- ставляется в двоичном коде. Таким образом, по форме представления команды и числа однотипны Это обстоятельство приводит к следующим важным последствиям: • промежуточные результаты вычислений, константы и другие чис- ла могут размещаться в том же запоминающем устройстве, что и программа; • числовая форма записи программы позволяет машине производить операции над величинами, которыми закодированы команды про- граммы. 4. Трудности физической реализации запоминающего устройства, быст- родействие которого соответствовало бы скорости работы логических схем, требует иерархической организации памяти. !>. Арифметические устройства машины конструируются на основе схем, выполняющих операцию сложения. Создание специальных устройств для вычисления других операций нецелесообразно. (> В машине используется параллельный принцип выполнения операции над словами. Они производятся одновременно по всем разрядам. В то же время выполнение команд программы (операций ЭВМ) производится последовательно, одна за другой. Используемая сегодня вычислительная техника отличается большим раз- юр.нием (рис. 2.4). Это и цифровые компьютеры, в которых команды про- ммы, исходные данные для решения задач и результаты вычислений за-
46 Гл. 2. Вычислительная техника и нанотехнология Вычислительная машина Аналоговая Цифровая Фиксированные Хранимая функции программа Электронная Неэлектронная Универсальная Специализированная Рис. 2.4. Основные направления вычислительной техники писываются в памяти в виде наборов двоичных символов. Это и аналого- вые устройства, обрабатывающие непрерывные последовательности значений какой-нибудь физической величины. Это и специализированные устройства для массовых решений одной единственной задачи или группы сходных задач. Но подавляющее большинство вычислительных средств, которые нас окру- жают в повседневной жизни — универсальные цифровые ЭВМ. Рассмотрим особенности воплощения фон-неймановских принципов на примере типичного представителя этой категории устройств — персонального компьютера, Компьютеры этого типа построены по модульному принципу и представ- ляют собой набор отдельных блоков Для связи их друг с другом использу- ется специальная информационная магистраль — шина. Для создания шин используются обычно плоские многожильные кабели. Совокупность проводов шины разделяется на отдельные группы для передачи адреса кода выполняемой операции, данных, сигналов управления Основные блоки компьютера включают в себя (рис. 2.5) запоминающее устройство, арифметико-логическое устройство и устройство управления. Запоминающее устройство, или память — это совокупность ячеек, предна- значенных для хранения информации. Каждой из ячеек присвоен свой номер, называемый адресом. Информацией, записанной в ячейке, могут быть как команды в машинном виде, так и данные. Машинная команда — это двоичный код, определяющий выполняемую операцию, адреса используемых операндов (т. е. кодов чисел, над которыми производится операция) и адрес ячейки запо- минающего устройства, по которому должен быть записан результат выполнен- ной операции. Устройство памяти современного компьютера имеет иерархиче- скую структуру (рис. 2.5). Основная память — полупроводниковое оперативное запоминающее устройство, у которого скорость считывания-записи данных сопоставимо со скоростью их обработки арифметико-логическим устройством. Для того, чтобы сбалансировать разницу этих скоростей, может быть исполь- зована дополнительная, небольшая по объему быстродействующая память. Ее называют кэш-память, в процессорах типа pentium это 8 тыс. ячеек для кодов и 8 тыс для данных. В силу технических и экономических факторов емкость оперативного устройства ограничена. Сегодня она достигает нескольких гига-
2.1. Немного об истории вычислительных средств 47 Шина I'itc. 2.5. Структура современного персонального компьютера: а — блок-схема, б — пространственное размещение устройств ii.iiiT. Дальнейшее расширение памяти происходит за счет более медленных |.шоминающих устройств на магнитных дисках (до сотен гигабайт) и магнит- ных лентах, емкость которых практически не ограничена. Все действия в ЭВМ выполняются под управлением сигналов, вырабатыва- < мых устройством управления. Устройство управления формирует адрес коман- U.I. которая должна быть выполнена следующей, и выдает управляющий сиг- II.। । на чтение содержимого соответствующей ячейки запоминающего устрой- । И1.1 Считанная команда передается в устройство управления. По информации, кржащейся в адресных полях команды, устройство управления формирует । цм-са операндов и управляющие сигналы для их чтения из запоминающе- III Vi тройства и передачи в арифметико-логическое устройство. После этого ipniicTBo управления выдает в арифметико-логическое устройство сигналы и । выполнение операции. Полученный результат записывается в память ма- шины Признаки результата (знак, наличие переполнения, признак нуля и так । и <) поступают в устройство управления, где записываются в специальный pi । нс гр признаков. Эта информация может использоваться при выполнении । 1мо|цих команд программы, например команд условного перехода.
48 Гл. 2. Вычислительная техника и нанотехнология 2.2. Полупроводниковые приборы — революция в электронике Гигантский прогресс, который претерпела вычислительная техника на протяжении своего становления, был обусловлен развитием элементной базы вычислительных устройств Именно она подвергалось на протяжении последнего полувека революци- онным изменениям, которые привели к современным средствам обработки информации, охватившим сегодня практически все области человеческой жизни и деятельности. Первым крупным сдвигом в создании цифровых ЭВМ был переход от механических и релейных систем к вакуумным элек- тронным лампам. Теперь уже трудно вспоминать и как выгляде- ли электронные лампы, и что собой представляли изготовленные на их основе радиоприемники, усилители, устройства управле- ния. В стеклянном баллоне лампы, из которого был откачан воздух, впаивались в простейшем случае три электрода — катод, анод и промежуточный между ними электрод, который называл- ся сеткой. Катод нагревался электрическим током и эмитировал электроны, которые ускорялись к аноду приложенным электриче- ским полем. При этом они должны были проходить сквозь сетку. Электронная лампа, даже в этом ее наиболее простом трехэлек- тродном варианте представляет собой естественное воплощение переключающегося элемента, необходимого для создания логи- ческих схем. В зависимости от потенциала на сетке она или про- пускает, или не пропускает ток, т. е. представляет собой элемент с двумя устойчивыми состояниями. Поэтому, начиная с ENIAC, в разных странах на ламповой основе создавались вычислитель- ные системы. Тем не менее объединение тысяч электронных ламп в едином устройстве требовало больших энергетических затрат и трудоемкого высококвалифицированного обслуживания. Ламповые вычислительные системы были капризными в эксплу- атации. Для того, чтобы добиться стабильной работы, на отладку системы уходили дни. Рабочая температура в зале, где разме- щалась вычислительная машина, составляла иногда 10-15° С. Поэтому появление полупроводниковой элементной базы резко повысило надежность компьютеров и создало основу для их дальнейшего совершенствования. Полупроводники не случайно завоевали устойчивые позиции в вычислительной технике. Как известно, в отличие от индиви- дуальных квантовых объектов типа атомов и молекул, твердые тела обладают зонной электронной структурой.
2.2. Полупроводниковые приборы — революция в электронике 49 Уровень Ферми — наивысшая занятая молекулярная орбиталь при О К б 1 (>. Схема образования зон в цепочке атомов Li (и) и зонная структура проводника, изолятора и полупроводника (б) /(ля того, чтобы понять основные причины образования зон- mi структуры, рассмотрим простейшую модель — одномерную •тючку атомов (рис. 2.6, а). Если их было бы два, то электрон- уровни такой системы расщепились бы на две составляю- связывающую и разрыхляющую орбиталь (см. гл. 3). При Н1ЧСНИИ числа атомов в цепочке степень расщепления уров- н , величивается и, в пределе, возникают две энергетические ты. которые называют валентной зоной и зоной проводимости, "пн непрерывны, но содержат конечное число электронных со- шнп Для целого ряда элементов эти зоны перекрываются 1 6, б). Электроны атомов занимают нижние уровни валент- 1 юны. Остальные уровни остаются свободными, и электро- "HV г переходить из валентной зоны в зону проводимости.
50 Гл. 2. Вычислительная техника и нанотехнология В системе возникает электронная проводимость Такой вариант электронной структуры отвечает проводникам электрического тока. В общем случае свойства твердого тела определяются рас- стоянием между валентной зоной и зоной проводимости, т. е. шириной запрещенной зоны между ними, и заполнением валент- ной зоны электронами. Если ширина запрещенной зоны велика, а валентная зона заполнена полностью, твердое тело является изолятором. Наиболее интересный вариант — почти полностью заполненная валентная зона и сравнительно малая ширина за- прещенной. Он отвечает полупроводниковым свойствам. п-тип р-тип Зона проводимости Уровень__________________ Ферми Электроны Валентная зона Зона проводимости Дырки Валентная зона Уровень Ферми Дефекты-доноры Дефекты-акцепторы создают свободные создают Рис. 2.7. Полупроводники п- и р-типа Полупроводники, практически не содержащие примесей, на- зывают собственным или беспримесным. В этом случае, если возбудить электрон из валентной зоны в зону проводимости, в валентной зоне появляется положительно заряженная вакан- сия. Естественно, соседние электроны могут нейтрализовать эту вакансию, но при этом они образуют новую вакансию в дру- гом месте. Таким образом, в полупроводнике появляется поло- жительное, передвигающееся по нему положительное образова- ние — дырка. В собственных полупроводниках носители заряда должны появляться парами (электронно-дырочная пара). Ситу- ация существенно меняется, если в полупроводник специально введено некоторое количество примесей — легирующих добавок.
2.2. Полупроводниковые приборы — революция в электронике 51 будем рассматривать кремний, электронная структура и свойства которого отвечают полупроводнику. Четырехвалентный кремний образует четыре валентных связи с соседними атомами. Если в структуру кристалла кремния ввести трехвалентный бор, одна из связей остается незаполненной (рис. 2.7). Ее может заполнить >лектрон какого-либо другого соседнего атома кремния и при 1том возникает дырка. Примеси такого рода называют акцепто- рами, а возникающие дырки находятся как раз над валентной юной. Эти полупроводники называют полупроводниками р-типа. Иная ситуация возникает, когда в кремниевый полупроводник вводится пятивалентный атом легирующей добавки (фосфор или сурьма). Эти атомы имеют пять валентных электронов, — на один больше, чем у кремния. Пятый электрон легко отщепляется о г содержащего его атома. В результате появляется неподвиж- ный ионный заряд и энергетическое состояние, которое отвечает пятому электрону и лежит несколько ниже зоны проводимости. Такие примеси называются донорными, а полупроводники — полупроводниками п-типа. Замечательные свойства возникают при контакте полупро- водников р- и п-типа. В этом случае, в результате больших перепадов концентраций — море дырок с одной стороны и море >лектронов с другой, возникают большие токи диффузии дырок и электронов. Таким образом, в системе возникают неосновные носители — электроны в полупроводнике p-типа и дырки в по- |упроводнике n-типа. Но при этом по направлению к переходу ('удут подходить и ионы электрон-дырочных пар и возникнет >ш*ктрическое поле вблизи перехода (рис. 2.8). В свою очередь ио поле вызовет токи дрейфа электронов к материалу п-типа и дырок к материалу p-типа. Если внешнее напряжение отсут- • тует, токи диффузии и дрейфа будут равными по величине п противоположными по направлению. Поэтому суммарный ток пкажется нулевым. Пусть теперь к переходу приложено элек- |рпческое поле (прямое смещение — положительный потенциал приложен к полупроводнику n-типа, а отрицательный к полу- проводнику p-типа). Этот потенциал будет увеличивать концен- |р.щию неосновных носителей, которые будут проникать глубже и материал и рекомбинировать с основными носителями. Исчез- нувшие в результате рекомбинации неосновные носители будут пополняться диффузией через переход и возникнет постоянный прямой ток. Аналогичным образом легко понять, что при обрат- ном направлении приложенного поля (обратное смещение) ток । р<ч переход будет исчезающее мал (рис. 2.8). Таким образом, и переход ведет себя как полупроводниковый диод.
52 Гл. 2. Вычислительная техника и нанотехнология /7-тип л-тип Дырки Электроны ееееоеее ееееееее. assesses /J-ТИП 77-ТИП ееееее ______ ееееееее :>:и: :>оое. д еееее ееееееее еееее *— -1 Обратное смещение — ток не идёт Рис. 2.8. р- «-переход (а) и полупроводниковый диод (б) Все эти особенности полупроводниковых материалов и р - п и п-р переходов были использованы при создании уникального полупроводникового устройства — транзистора, изменившего ли- цо вычислительных устройств. Это название объединяет сегодня целую группу полупроводниковых переключающихся приборов с двумя устойчивыми состояниями. Уильям Шокли, Уолтер Браттейн, и Джон Бардин — сотруд- ники лаборатории компании Белл в Нью Джерси (АТ & Т Bell Labs) начали в 1946 г. работу над полупроводниковым прибо- ром — транзистором. В 1947 г. Бардин и Браттейн продемон- стрировали первую его модель на основе кристалла германия с р- и и-зонами, к переходу между которыми были подклю- чены металлические проводки (рис. 2.9). Шокли на основании их работы проанализировал физику устройства и несколькими месяцами позже предложил плоскостной полностью полупро- водниковый транзистор. В 1956 г. Шокли, Бардин и Бриттейн получили за эту работу Нобелевскую премию. Выступая при ее вручении с нобелевской лекцией, Джон Бардин сказал: «Я знал, что транзистор — важная вещь. Но я никогда не мог предвидеть революцию в электронике, которую он принес». В результате дальнейшего быстрого развития теории и полу проводниковой технологии были созданы разнообразные вариап ты двух основных типов транзисторов — биполярных и полевых (рис. 2.10). Они построены как комбинация полупроводниковых р-п и п-р переходов.
2.2. Полупроводниковые приборы — революция в электронике 53 Рис. 2.9. Первый транзистор Бардина и Браттейна Биполярный транзистор Эмиттер «5 т Коллектор Рис. 2.10. Биполярный (а) и полевой (б) транзисторы Биполярный транзистор представляет собой две области i\проводника одного типа (эмиттер и коллектор), разделенные
54 Гл. 2. Вычислительная техника и нанотехнология тонким слоем полупроводника другого типа (база). Его упрощен- но можно представить себе как два р-п перехода, включенные навстречу друг другу. Если приложить напряжение только между эмиттером и коллектором, то при любой полярности напряжения тока не будет. Один из двух р - гг-переходе в будет закрыт. Но когда приложено напряжение между эмиттером и базой, в цепи эмиттер-коллектор течет ток, силу которого можно регулировать значительно меньшим по величине током между эмиттером и базой. Полевой транзистор, появившийся по времени несколько поз- же, основан на идее, высказанной еще в 1925 г. американ- ским исследователем Юлиусом Лилиенфельдом. Он предложил управлять сопротивлением полупроводникового слоя в системе типа конденсатора, одна из обкладок которого металлическая, а вторая — из легированного полупроводника, с помощью напря- жения, приложенного между металлом и полупроводником. Если на металлическую обкладку подать отрицательный потенциал, поле будет вытеснять электроны из приповерхностного слоя по- лупроводника. В нем возникнет недостаток носителей тока и со- противление увеличится. При обратной полярности носителей в этой области станет больше и сопротивление увеличится. Ме- ханизм действия полевого транзистора схематически показан на рис. 2.10, б. Очень важным фактором, повлиявшим на создание полевого транзистора, было то, что удалось найти наиболее подходящие для этого материалы. Ими оказались кремний (полупроводник) и двуокись кремния (изолятор), которую легко вырастить на поверхности кремния, окисляя его. Это заложило основы со- временной МДП-технологии (металл-диэлектрик-проводник), или, как ее часто называют МОП-технологии (металл - окисел- полупроводник). Революционным шагом в развитии полупроводниковой техно- логии был переход к интегральным схемам, когда все элементы транзистора формируются на поверхности кристалла кремния или же какого-либо другого полупроводникового носителя. Их появление было обусловлено острой необходимостью повышения надежности аппаратуры и автоматизации процессов изготовле- ния и сборки электронных схем. Сборка аппаратуры в то вре- мя была преимущественно ручной — весьма трудоемкой, дли- тельной и, к тому же, очень плохо поддающейся автоматиза- ции. Многократно увеличилось число переключающих приборов в цифровом оборудовании, особенно в компьютерах. Так же рез- ко снизилась надежность и время наработки на отказ. Например,
2.2. Полупроводниковые приборы — революция в электронике 55 компьютер типа CD 1604, выпущенный в 1960 г. американской фирмой Control Data Corp., содержал около 100 тыс. диодов и 25 тыс. транзисторов и мог безотказно работать не более 2-3 часов. Первые в мире интегральные схемы были разработаны и из- готовлены в 1959 г. американцами Джеком Килби — сотрудни- ком фирмы “Texas Instruments” и Робертом Нойсом из компании "Fairchild Semiconductor” независимо друг от друга. В 1958 г. Килби начал работать над созданием интегральных схем, в которых на одной основе должны были размещаться различные элементы электронной схемы. К этому времени из полупроводниковых материалов умели изготовлять резисторы, конденсаторы и транзисторы. Резисторы изготовляли, используя омические свойства «тела» полупроводника, а для создания кон- денсаторов использовались смещенные в обратном направлении 1>- «-переходы. В 1959 г. Килби продемонстрировал конструкцию триггера на ••дном кусочке монолитного германия. Для его изготовления был применен метод фотогравировки, которым владела фирма “Texas Instruments”. Эта «твердая схема» была представлена в 1960 г. на выставке Американского Института радиоинженеров. Многие недостатки «твердых схем» были устранены позднее Робертом Нойсом, работавшим в фирме “Fairchild”. Им были разработаны технологические операции, предвосхитившие совре- менную полупроводниковую планарную технологию. Была пода- на заявка на патент, и разработчики элементов начали работать над объединением диффузионных резисторов и транзисторов на кремниевых пластинах. В 1960 г. группа исследователей компании “Fairchild”, воз- главлявшаяся Джейем Ластом, изготовила первую интегральную чему (ИС), содержавшую четыре транзистора (рис. 2.11). «И вы, и я согласитесь, что в то время как мир пред- почитает героев, прогресс полупроводников зависит от усилий и идей большого числа людей, а продвижение вперед опреде- шется нередко вкладами, которые были внесены десятилетия |<>му назад. Как и в других случаях со многими изобретениями, целый ряд тех, кто имел доступ к тем же возможностям, работал in- ынисимо в то же самое время для того, чтобы свести концы концами и создать новые пути для существующей технологии, ’in люди понимали, что настало время, когда общество примет новые концепции» — писал позже Джей Ласт в письме одному 1।еноих друзей.
56 Гл. 2. Вычислительная техника и нанотехнология Рис. 2.11. Первая планарная интегральная схема и один из современных вари- антов ИС Разработка интегральных схем начала продвигаться лихо- радочными темпами. Это было началом новой эры. Для того, чтобы хотя бы приблизительно оценить темпы развития, можно сравнить первую интегральную схему с выпущенным в 2000 г. процессором «Pentium 4», в котором на поверхности 224 мм2 разместились 4,2 х 107 транзисторов. Последним важным шагом на пути создания современной полупроводниковой планарной технологии было включение в нее группового метода производства интегральных схем, когда на одной подложке одновременно изготавливаются большое коли- чество одних и тех же схем. Этот метод был в сущности есте-
2.2. Полупроводниковые приборы — революция в электронике 57 Рис. 2.12. Кремниевая пластана на стадии производства интегральных схем < । венным и определялся достигнутыми в то время большими р юмерами и высоким качеством кремниевых пластин, освоенных н производстве (рис. 2.12). Забегая несколько вперед, отметим, что размеры доступных пластин росли быстро — от пластин ппаметром ~ 25 мм в 1960 г. до 200 мм и более в девяностых одах прошлого века. При этом, если в 1960 г. площадь пла- < П1НЫ, приходящаяся на одну схему (точнее на один прибор) ныла ~ 1 мм2, то в 90-е гг. эта площадь составляла ~ 100 мм2 110 х 10 мм) с количеством элементов в схеме до 3 млн. 11олупроводниковая планарная технология играет сегодня ве- ющую роль в производстве электронных схем (чипов), которые и< пользуются в огромном числе устройств — вычислительных, оправляющих, устройствах связи. Она включает в себя целый рил различных по своей физико-химической природе и использу- емой аппаратуре процессов с весьма специфическими условиями и» проведения. Типичным для полупроводниковой технологии in вются предельный характер требований. Это относится, преж- н псе! о, к чистоте исходных материалов, рабочих сред (во-
58 Гл. 2. Вычислительная техника и нанотехнология да, вспомогательные материалы) и атмосферы производственных помещений. В химической практике, как в исследовательской работе, так и на производстве, вещество считается чистым, ес- ли концентрация посторонних примесей в нем не превышает 0,001 %. Число атомов в 1 см3 полупроводника — 1022. При его легировании вводят обычно 1016-1019 атомов легирующей добав- ки на 1 см3, т. е. 0,0001-0,1 %. Это означает, что концентрация опасных примесей в кремнии, которые могут повлиять на полу- проводниковые свойства, должна быть меньше, чем 0,00001 %. Для планарной технологии характерен и целый ряд других важных особенностей. Тем не менее, поскольку основная цель этой книги — рассказать о взаимодействии и взаимном влиянии вычислительной техники и нанотехнологии, ограничимся наибо- лее важной с этой точки зрения проблемой — литографическим процессом и возникающими в связи с ним предельными ограни- чениями миниатюризации электронных схем. 2.3. Планарная полупроводниковая технология — всеобщее признание и ограничения Планарная технология (см. рис. 2.13) основана на последо- вательном создании на поверхности кремниевой основы тонких слоев материала, из которого формируются отдельные элементы схемы, с последующей обработкой этого слоя. По своему характеру, это последовательное выполнение опе- раций по принципу «сверху-вниз». Сущность этого принципа, ха- рактерного, например, для производства макроскопических дета- лей механического устройства, легко понять на примере изготов- ления сложной металлической детали. Исходной основой детали является заготовка. Она последовательно обтачивается, фрезе- руется, в ней растачиваются необходимые отверстия, нарезают- ся резьбы и т. д. В результате выполненных последовательных операций заготовка превращается в заданную чертежом деталь. Планарная технология использует для создания слоя необходи- мого материала различные операции. Изолирующие слои окиси кремния выращиваются в процессе контролируемого окисления поверхности кремниевой подложки. Для формирования пленок могут использоваться также напыление, осаждение из жидкой фазы и т. д. Основным инструментом для создания отдель ных элементов микросхемы является фотолитография (рис. 2.14) В ходе фотолитографического процесса на пленку материала, и i которого формируются элементы микросхемы, наносится фото
2.3. Планарная полупроводниковая технология 59 Исходные материалы Функции реализуемой ИС Цикл О Изготовление полупроводниковой пластины (диска) Разработка топологии ИС Изготовление фотошаблонов Цикл 1 Цикл 2 Полупроводниковые пластины Фотошаблоны Полупроводниковая пластина со сформированной на ней ИС Оксидирование Фотолитография Травление Эпитаксиальное выращивание Легирование Металлизация Испытания Разделение полупроводниковой пластины на отдельные кристаллы Посадка кристалла на носитель Присоединение проволочных выводов Сборка в корпусе Испытания Кристаллы ИС Рис. 2.13. Основные этапы полупроводниковой планарной технологии резист. Он представляет собой фоточувствительное соединение, которое или разлагается под действием светового излучения (по- ни ивный фоторезист), или же полимеризуется, образуя прочную пленку (негативный фоторезист). Фоторезист экспонируется че- рез фотошаблон, черно-белый рисунок которого определяет фор- му и размещение на поверхности схемы формируемых деталей. После этого пленка фоторезиста «проявляется» т. е. обрабатыва- । и я растворителем, который убирает не прореагировавшие под <ш гвием света участки пленки. В результате пленка фоторези- in превращается в прочный шаблон. Через окна, образованные и нем, можно воздействовать на находящийся под ним матери- । । окислять легировать и т. д. В качестве примера рассмотрим формирование в полупровод- нике зон n-типа, отвечающих истоку и стоку планарного транзи- inp.i (рис. 2.15). На слой окиси кремния, выращенный на крем- 111Н-11ОЙ подложке, наносится негативный фоторезист. В фото- н.юлопе, который используется для его засветки, формируемым I.U тям n-типа отвечают непрозрачные участки. В результате ип<1ки фоторезиста полимеризуется вся его поверхность за ' । почепием создаваемых областей, из которых непрореагиро-
60 Гл. 2. Вычислительная техника и нанотехнология Источник излучения Источник излучения Проекционная литография Контактная литография Рис. 2.14. Принципиальная схема литографического процесса Рис. 2.15. Последовательные стадии позитивного литографического процесса (а-е) вавший резист вымывается подходящим растворителем (бензол, толуол). После этого через окна в полимеризованной пленке резиста удаляется плавиковой кислотой окись кремния и затем новым растворителем заполимеризованный резист. Таким обра- зом, на поверхности микросхемы образуются окна в слое окиси кремния. Они используются для легирования кремния в этих окнах фосфором или сурьмой. Сам процесс легирования - это диффузия, когда на поверхность наносится легирующая добавка и затем заготовка микросхемы нагревается. Иногда используется ионное внедрение направленным воздействием ионов легирую
2.3. Планарная полупроводниковая технология 61 Алюминий Кремний j Фотошаблон SiO2 а SiO2 б SiO2 в Рис. 2.16. Последовательные стадии негативного литографического процесса (а-е) три добавки. В качестве примера позитивного литографического процесса на рис. 2.16 показано удаление слоя алюминия, напы- || иного на поверхность микросхемы, со всех ее элементов за исключением области затвора полевого транзистора. Известны различные фоторезисты, которые различаются чув- мнительностью к световому потоку и разрешающей способно- п.ю. Часто применяется как позитивный фоторезист ПММА (иилиметилметакрилат, рис. 2.17). В качестве негативного рези- । । используют КОП (полимер глицидилметакрилата и этилакри- i.na). Фотолитографическая техника позволяет формировать слож- ные полупроводниковые схемы. Но именно она является факто- рам, ограничивающим возможности планарной полу проводи ико- и|| 1СХН0Л0ГИИ. В силу своего волнового характера свет диффра- npver на элементах фотошаблона (рис. 2.18). При этом предель- разрешение экспонируемого рисунка сопоставимо с длиной • ши используемого светового излучения. Как известно, длина шы видимого света изменяется от 0,38 мкм (фиолетовая об- н. спектра) до 0,76 мкм (красная область). Это и определяет нинмальную толщину линии в полупроводниковой структуре, tnp.iii может быть получена методом оптической литографии. < < годня ведутся научные и инженерные разработки для усо- рпкпсгвования ключевого этапа производства интегральной "MI.I литографии. Именно она будет определять физические .|||||'1епия полупроводниковой технологии в обозримом буду- Как отмечают эксперты, в силу этих ограничений литогра-
62 Гл. 2. Вычислительная техника и нанотехнология Глицидилметакрилат Этилакрнлат СН3 с=сн2 нс=сн2 о с=о + с=о / \ I I СН2-СН-СН2-О . О-СН2-СН3 I СНз — С-СН-НС-СН2-~ L । । L О С=О С=О / \ I • сн2-сн-сн2-о о-сн2-сн3 а Полиметилметакрилат сн3 сн3 с-сн2-с-сн2-~ I I in с=о с=о о-сн3 о-сн3 сн3 -i- I + С=СН2 + СО2+СО+ -сн3 С = О I 2 2 I сн2 О-СН3 I Рис. 2.17. Позитивные (а) и негативные (б) фоторезисторы Интенсивность света Падающая плоская волна свет Рис. 2.18. Ограничения фотолитографии
2.3. Планарная полупроводниковая технология 63 фия может исчерпать свои возможности уже в начале нашего века. Развитие литографической технологии со времени ее появле- ния в начале 70-х гг. шло по пути сокращения используемой дли- ны световой волны. Это позволяло уменьшать размеры элементов интегральной схемы. С середины 80-х гг. в фотолитографии используется ультрафиолетовое лазерное излучение. Для того чтобы нанести рисунок схемы на пластину, служат управляемые компьютером машины (степперы). Конфигурацию «окон» задают соответствующие маски, после применения которых получен- ное изображение фокусируется с помощью специальной системы линз. Именно она уменьшает заданный на маске шаблон до микроскопических размеров схемы. Современная фотолитогра- фическая машина обрабатывает за один час несколько десятков носьмидюймовых полупроводниковых пластин. Сейчас большинство микросхем производится с помощью ультрафиолетового излучения с длиной волны 0,248 мкм. Для i издания ряда схем разработана литографическая технология, обеспечивающая длину волны 0,193 мкм. Однако когда фото- ии гография перешагнула границу 0,2 мкм, возникли серьезные проблемы, которые впервые в истории этой технологии поста- пили под сомнение возможность ее дальнейшего использования. Например, при длине волны меньше 0,2 мкм слишком много < пета поглощается светочувствительным слоем, поэтому услож- няется и замедляется процесс передачи рисунка шаблона схемы. 11<>добные проблемы побуждают исследователей и производите- it'ii искать альтернативы традиционной литографической техно- пи ии. Например, возможность замены ультрафиолетовых лучей рентгеновскими исследуется в научных лабораториях США уже шлее двух десятилетий. Одна из технологий, названная EUV (Extreme Ultra Violet) и объединившая вокруг себя несколько известных компаний, и i пелена на улучшение процесса фотолитографии при произвол- • । иг микросхем. Как уже отмечалось, современные установки с применени- ем 1лубокого ультрафиолетового излучения (Deep Ultra Vio- el DUV), которые печатают схемы на кремниевых подложках, । пользуют источники света с длиной волны 248 нм. Предпо- Ы1.п'1ся, что длина волны EUV-излучения может быть около Мим, т.е. примерно в 20 раз меньше. Переход с DUV- на I I V литографию обеспечивает более чем 10-кратное уменьше- •"< длины волны и переход в диапазон, где она сопоставима । (мерами всего нескольких десятков атомов.
64 Гл. 2. Вычислительная техника и нанотехнология Тем не менее, помимо чисто физических проблем, процесс уменьшения размеров транзисторов и увеличения степени их интеграции уже наталкивается и на другие ограничения, связан- ные с особенностями производства микросхем. Вообще говоря, свойства устройств, которые создаются на одной кремниевой пластине, равно как и на разных пластинах, не идентичны. Отклонения могут возникать на каждом из этапов производства. Характер вероятных различий между производимыми схемами и частота появления просто бракованных устройств могут стать реальной преградой на пути дальнейшей миниатюризации эле- ментов интегральной схемы. Отметим, что миниатюризация ка- сается не только длины и ширины элемента схемы, но и толщины самого кристалла. Транзисторы и соединения на нем реализу- ются с помощью серии уровней. В современных микросхемах их может быть пять или шесть. Уменьшение размеров транзи- сторов и увеличение плотности их размещения на кристалле влечет за собой увеличение числа уровней. Однако чем больше слоев в схеме, тем тщательнее должен быть контроль за ними в процессе производства, поскольку на каждый из уровней будут оказывать влияние нижележащие. Стоимость усовершенствова- ния средств контроля и создания соединений между множеством уровней может оказаться фактором, сдерживающим увеличение числа слоев. Кроме всего прочего, усложнение интегральных схем требу- ет совершенствования условий производства, к которым и так предъявляются беспрецедентно высокие требования. Необходим более точный механический контроль за позиционированием ис- ходной кремниевой пластины. Стерильное помещение (так на- зываемая чистая комната), где создаются микросхемы, должно стать еще чище, дабы исключить попадание мельчайших части чек пыли, способных разрушить сложнейшую схему. Все это, вместе взятое, приводит не только к необходимости предельно совершенствовать планарную полупроводниковую тех нологию, но и к поискам принципиально новых подходов и путей построения вычислительных устройств. Среди них, один из мно гообещающих — переход от полупроводниковой к молекулярной элементной базе.
Глава 3 МОЛЕКУЛЯРНАЯ ЭЛЕМЕНТНАЯ БАЗА ВЫЧИСЛИТЕЛЬНЫХ УСТРОЙСТВ Кто знает, сколько слов перепробовал Господь Бог, прежде чем нашел то, которое сотворило мир. Станислав Ежи Лец. Афоризмы 3.1. Несколько предварительных замечаний Молекулы и молекулярные комплексы с их дискретными уровнями энергии и возможностью переключать молекулярную (исгему из одного состояния в другое на протяжении многих десятилетий были прообразом идеальной элементной базы вы- числительных устройств. Но существовавшие в первой половине прошлого века и предвидимые в то время технологические воз- можности не позволяли даже подумать о практическом исполь- юпапии молекулярной элементной базы. К тому же, начиная i (И)-х гг., бурными темпами стала развиваться полупроводни- чв.1я планарная технология, сулившая многократное повышение । " 1можностей вычислительных устройств. Гем не менее, трудности становления полупроводниковой и и.тарной технологии в 70-80-е гг., с одной стороны, и, в то же ргмя, ее успешное становление как совершенно новой техноло- н'К’ской области, возродили идею построения вычислительных |ройств на основе молекулярной элементной базы. Достовер- п оценки, которые основывались на принципах теории моле- шрпой структуры, развитой в послевоенные годы и подтвер- иной экспериментальными исследованиями большого числа ' к'кул, показывали, что по сравнению с полупроводниковой । мен гной базой молекулярные элементы могут обеспечить: • более высокую степень интеграции, • шачительно меньшие энергии переключения, • более высокую стабильность схем по отношению к прони- кающей радиации, в особенности для схем высокой степени интеграции. Г.1Мбиди
66 Гл. 3. Молекулярная элементная база вычислительных устройств В то же время сделалось понятным и то, что молекулярная элементная база сможет привести к принципиально новым воз- можностям, таким как • полная идентичность молекулярных элементов, характери- стики которых не подвержены разбросу из-за неминуемых технологических погрешностей, • свободные от шумов одноэлектронные процессы, • специфические молекулярные процессы передачи сигнала, которые могут позволить создавать логически более слож- ные исходные элементы. Начало 70-х гг. прошлого века совпало с молекулярным бу- мом в электронике. В 1974 г. сотрудник компании IBM Ари Ави- рам и Марк Ратнер, работавший в Северо-Западном универси- тете штата Иллинойс, опубликовали работу под названием «Мо- лекулярный выпрямитель». В ней впервые была сделана попытка оценить на основе достаточно строгого физического подхода воз- можность сконструировать молекулярную систему с однонаправ- ленной электронной проводимостью. Под этим подразумевалась молекула, построенная из двух молекулярных фрагментов с раз- ным сродством к электрону и помещенная между двумя элек- тродами. Если к электродам приложен электрический потенциал, то при одном его направлении ближайший молекулярный фраг- мент захватывает из электрода электрон, передает его другому фрагменту, а тот, в свою очередь отдает его другому электроду. При обратном направлении электрического потенциала переходы электрона не наблюдаются. Авирам и Ратнер впервые предло- жили конкретную молекулу, которая, по их мнению, могла бы быть использована как один из исходных элементов электронной схемы. В начале того же 1974 г. Майкл Конрад, работавший в уни- верситете Вэйна в Детройте, рассмотрел вариант молекулярной системы обработки информации, функционирующей по типу спе- циализированной нейронной сети (см. подробнее в гл. 4). Но наибольшие заслуги в становлении этой новой области исследований, которую начали называть «молекулярная элек- троника», принадлежали сотруднику Военно-морской исследо вательской лаборатории США Форресту Картеру. На протяже нии ряда лет он рассмотрел физические принципы построения молекулярных систем, которые могли бы быть использованы в качестве элементной базы устройств обработки информации Более того, именно он попытался объединить ученых, искавших пути использования молекулярных объектов для создания элек
3.1. Несколько предварительных замечаний 67 тронных устройств. В 1982 и в 1987 гг. им были организованы две международные конференции по молекулярным электронным устройствам. К сожалению, подготовленная им третья конферен- ция прошла в июле 1988 г. уже после его смерти. Результатом работы этих конференций стало то, что ак- тивность и ожидания в этой новой области исследований бы- ли велики в восьмидесятые годы и начале девяностых. Так, например, поддерживая широко распространенное убеждение о важности молекулярной элементной базы для развития средств обработки информации, Алан Берман, один из руководителей Военно-морской исследовательской лаборатории США, говорил, выступая на Симпозиуме по молекулярным электронным устрой- ствам в 1981 г. [25]: «Я думаю, что возможные достоинства компьютеров на мо- и'кулярной элементной базе безусловно очевидны. Если кто-то оценивает, стоит ли тратить свое время, ресурсы и возможности карьеры на работу в этой области, то он может исходить из * ледующих обстоятельств: При переходе от двумерных современных интегральных схем к трехмерным молекулярным структурам стоимость создания межсоединений должна существенно уменьшиться, а процессы производства схем будут полностью автоматизированы. В про- iинном случае устройства не будут экономически выгодными. При уменьшении переключающихся элементов до молекуляр- ных размеров плотность элементов памяти может увеличиться на несколько порядков, а энерговыделение может значительно \ мепьшиться. Трехмерная архитектура совместно с молекулярными разме- рами элементов должны увеличить на несколько порядков про- н нюдительность вычислений. Для того, чтобы использовать это, |п'1жны быть разработаны быстрые средства передачи данных. Вч1 эти достоинства очень важны. Однако должны быть пре- кпц'иы технические барьеры, которые ограничивают сегодня • ыможности создания таких устройств. 80-е гг. должны быть рсмспем, когда химики, физики и инженеры начнут чувствовать ыможную пользу переключающихся элементов на молекуляр- ">м уровне». Интерес к практическому использованию молекулярных сн- ом коснулся не только области вычислительной техники. На 1'ч|яжепии последних десятилетий прошлого века сформиро- вать новая область исследований, которую принято называть (окулярная электроника». Некоторое представление об ее • ипцпых направлениях, может дать рис. 3.1. Каждому из них
68 Гл. 3. Молекулярная элементная база вычислительных устройств Рис. 3.1. Основные направления молекулярной электроники посвящены обзорные статьи и книги. И поэтому в дальней- шем предметом детального рассмотрения будут только возмож- ности использования молекулярных систем в вычислительных и информационно-логических устройствах. В конце прошлого века был выполнен целый ряд теоре- тических работ, в которых анализировались общие принципы и предлагались пути конструирования молекулярных систем, пригодных для формирования на их основе электронных схем. Были опубликованы результаты нескольких экспериментальных исследований, подтвердивших принципиальную возможность создания молекулярной элементной базы. Остановимся по- дробнее на основных работах этого периода, предварив это рассмотрение краткими сведениями об основных теоретических представлениях о структуре атомов и молекул. Немного подробностей: молекулярная структура уровни атомов и молекул электронные Теоретической основой для понимания структуры молекул и расчета их характеристик является уравнение Шредингера для волновых функций 'I',, и собственных значений Еп, описывающих электронные состояния молекуляр ной системы: д2 „ 1 г Э2 а2 а2 2 ма [ах2 + ar2 + az2
3.1. Несколько предварительных замечаний 69 г .dr2 ду2 dz2_ £а£де2 я ГаР otfi h 5десь Хп, Ya, Zn и х<, у\, Zi — пространственные координаты ядер (a) п электронов (г) молекулы; Ма, т — массы ядер атомов и электронов; rai, i„fl, Tij — расстояния между ядром и электроном, двумя ядрами и двумя >лектронами соответственно; 7г — постоянная Планка. Физическая сущность этого уравнения проста. Первый и второй члены правой части отвечают кинетической энергии ядер и электронов молеку- лярной системы. Следующие описывают электростатическое взаимодействие ядер и электронов. Квантовая система характеризуется дискретными уровня- ми энергии Еп и волновыми функциями Фп для каждого энергетического состояния. Квадрат модуля этой функции дает представление о вероятности нахождения ядер и электронов в соответствующей точке пространства. Будем рассматривать молекулы с дискретными уровнями энергии Еп, । юктронные состояния которых описываются волновыми функциями Фп. Уравнение Шредингера выведено при некоторых весьма серьезных допу- щениях. Прежде всего, оно не учитывает спина электрона, который приходится вводить дополнительно на основании физических соображений. Уравнение Шредингера представляет собой дифференциальное уравнение частных производных, точные решения которого в общем случае неизвест- ны Гем не менее практика показывает, что развитые к настоящему времени приближенные численные методы ab initio (т. е. не использующие дополнитель- ной экспериментальной информации) позволяют рассчитывать молекулярные флктеристики с погрешностью, не превышающей погрешность эксперимента. .в 3 2 Системы координат для квантово-механического расчета атома водо- рода I! случае некоторых достаточно простых систем уравнение Шредингера •I точные решения. Среди них — задача атома водорода, играющая осно- 1 н тощую роль в описании атомных и молекулярных структур. Уравнение Ч1|. штора для атома водорода (одно ядро и один электрон) записывается ы<„>р.1горной системе координат (рис. 3.2) как и э2 _д2 их?+ + sz2 h2 э2 з2 д2 2т Ох2 ду2 dz2 7е2 ) — } Ф1„ = ЕщФ1п. Г J пшике I указывает на то, что эти расстояния отсчитываются от начала г ины г (рис. 3.2), а расстояние г от ядра атома до электрона.
70 Гл. 3. Молекулярная элементная база вычислительных устройств Если перенести начало координат в центр масс, это уравнение распадается на два обыкновенных дифференциальных уравнения. Первое из них описывает движение частицы с массой М 4- т, а второе — электронные характеристики атома водорода: г д2 Г6)2 6)2 6)2 ( 2р дх2 ду2 dz2 Ф„ = ЕпФп Здесь координаты х, у, z отсчитываются от центра масс, а /1 - приведенная масса атома водорода: 1 = ± + 1 р М т Замечательным свойством атома водорода является его высокая сферическая симметрия. Переходя к сферическим координатам с началом в ядре атома водорода, можно получить точное решение уравнения Шредингера. Оно опре- деляется тремя квантовыми числами п, I, т, причем энергии электронных уровней зависят только от главного квантового числа п: п A Z2 4 Еп = ^' А = ~^те' Фп(тп = СОП817?п(г)У(т(?9,99). Таким образом, энергетические уровни атома водорода вырождены. Их степень вырождения определяется квантовыми числами I. т. В соответствии с реше- нием уравнения Шредингера на квантовые числа накладываются следующие ограничения: I < п — 1 — целое число, которое может принимать значения 0, 1, 2, ... ... (п — 1); при этом, если 1 = 0, то электронное состояние называется s- состоянием, при I = 1 — p-состоянием, при I — 2 — d-состоянием и т. Д. Квантовое число т принимает целочисленные значения от — I до +1. Оно определяет степень вырождения каждого /-подуровня. Нет вырождения при 1 = 0, трехкратное вырождение наблюдается при I = 1, пятикратное — при 1 = 2. Электронные энергетические уровни атома водорода (уровни энергии элек трона в кулоновском потенциале) показаны на рис. 3.3. Вид основных угловых функций для s- и p-состояний атома водорода изображен на рис. 3.4. Рис. 3.3. Уровни энергии атома водорода
3.1. Несколько предварительных замечаний 71 Рис. 3.4. Угловые части волновых функций атома водорода Задача атома водорода лежит фактически в основе описания молекулярных in гем. Уравнения Шредингера для многоэлектронных атомов и молекул (даже । hi простейшего двух электронного атома гелия) не имеют точного решения. 11ри этом симметрия атомов с числом электронов более одного не удовлетво- рив г, строго говоря, сферической группе симметрии, поскольку в уравнение Шредингера входит член, отвечающий взаимодействию электронов. Тем не м< нее, принимается, что по крайней мере для первой половины атомов перио- иекткой системы сферическая симметрия приближенно сохраняется. Поэтому, и» и в случае атома водорода, каждому электрону приписывается четыре mi.ii новых числа п, I, т и .s-спиновое квантовое число, принимающее только •lei шачения ±-. Сохраняется и общая структура энергетических уровней. П юоолнение к этому вводится принцип заполнения состояний, согласно кото- му в основном электронном состоянии электроны заполняют последователь- уронпи, начиная с самого низкого по два электрона с противоположными 111И1.1МИ на каждом уровне. В случае вырожденного состояния сначала на г юм уровне помещается по одному электрону и потом они достраиваются ।роками с противоположным спином. >>.| простая модель электронной структуры атомов может быть использо- ||| । н для качественного описания более сложных систем Рассмотрим два ип iKoiibix атома водорода, находящихся на достаточно большом расстоянии •и друга, таком, что их взаимодействием можно пренебречь (рис. 3.5). I и м приближать их друг к другу. При малых расстояниях между ядрами .помов их кулоновские потенциалы начинают перекрываться, образуя iiiiyio систему. При этом будут изменяться и электронные уровни. Оценим । . (iu iiiio характер этих изменений. Нычп-м систему обозначений для молекулы водорода (два ядра на рассто- друг от друга), показанную на рис. 3.6.
72 Гл. 3. Молекулярная элементная база вычислительных устройств Рис. 3.5. Принципиальная схема образования молекулы водорода Связывающая орбиталь , ^2 Ч) Разрыхляющая орбиталь Рис. 3.6. Связывающая и разрыхляющая орбитали молекулы водорода (а); обо значения расстояний между ядрами и электронами (б) и схема молекулярных орбиталей (в) в молекуле Нг
3.1. Несколько предварительных замечаний 73 В этих обозначениях уравнение Шредингера можно представить в виде Я(1,2)Ф(1,2) = £Ф(1,2), Я(1,2) = Я(1) + Я(2) + —, г12 ьI 2 * * Г <э2 а2 а21 z<? z<? . , „ 2m (дх* dyl rai гы Оно разделяется на три составляющих. Н(1) и 77(2) зависят только от координат первого и второго электронов соответственно, а взаимодействие электронов выделено в отдельный член. Это взаимодействие вносит заметный вклад в расчетную энергию молекулы водорода и поэтому пренебрегать им не представляется возможным. В то же время, поскольку точное решение уравнения Шредингера не известно и приходится использовать приближенные методы, необходимо выбрать для этого аналитический вид волновой функции. I (рактика показывает, что это может быть сделано на основе упрощенного уравнения Шредингера, где взаимодействием электронов пренебрегается: 77(1,2) -> /7(0)(1,2) = 77(1) + 77(2), Н(О)(1,2)Ф(О)(1,2) = Е(0)Ф(0)(1,2). Можно показать, что это упрощенное уравнение разделяется на два обыкно- венных диференциальных уравнения: ^(I)'T’i(I) = eiV’i (1). Я(2)^2(2) = £2^2(2), 1Ч-ЛИ принять Ф(°1(1,2) = ipi (1)932(2), Е = £| +е2. Рассмотрим решения 7/(1), когда расстояние первого электрона до ядра <i мало и, следовательно, rai <^гы. В этом случае можно пренебречь в 7/(1) Ze2 1 юном ---. Тогда 77(1) совпадает с соответствующим выражением для атома ты вц юрода с индексом а, и волновая функция уч (1) должна совпадать с волновой функцией атома водорода в точке а. Аналогично, если ты Re, то волновая ||упкция уц (1) должна совпадать с волновой функцией атома водорода в точке I, f а I Не» П>| Re, Я(1)-э h2 2m h2 2m 02 a2 dx2, dy? dz( d2 d2 dx2 dy2 dz2 7 % Zp2 —, 94(1)-э ¥>1,(1). I iKiiM образом, можно выбрать волновую функцию 991(1) в виде: 931(1) = < <>list(l)99o(l) + const(2)99b( 1). Заметим, что молекула водорода обладает достаточно высокой симметрией ।h i.ю поворотов бесконечного порядка, проходящей через два атома водорода, кроме этого, среди элементов симметрии есть плоскость, проходящая через се- |ч i.iiny расстояния между ядрами атомов и перпендикулярная к нему. Поэтому но шоную функцию </9i (1) можно записать в виде </9jS\l) = 7VS [</9о(1) + </9Ь(1)] , ^(1) = 7VOS Ы1)-^(1)] При отражении в плоскости симметрии атомы меняются местами (рис. 3.6). Но ip.iT модуля волновой функции (т. е. распределение электронной плотности)
74 Гл. 3. Молекулярная элементная база вычислительных устройств остается неизменным. Из рисунка видно, что функция y>f(l) должна отвечать связи между двумя атомами водорода, поскольку плотность вероятности на- хождения электронов в пространстве между ядрами увеличивается. Функция </?7®(1) согласно этому критерию не вносит вклада в связь. Поэтому принято называть y>f(l) и у>“®( 1) связывающей и разрыхляющей орбиталями. Численное решение подтверждает эти качественные соображения. Функция tp" (1) приво- дит к потенциальной энергии ядер молекулы с минимумом, отвечающим связи двух атомов водорода, тогда как функция у>“®(1) — к их отталкиванию. Рассмотренная простая модель, которая качественно описывает порядок относительного расположения электронных уровней в потенциальной яме, при- меняется нередко и к сложным молекулярным фрагментам. Она в особенности полезна, когда необходимо оценить процессы электронных переходов в системе, построенной из фрагментов, которые можно рассматривать как независимые. 3.2. Первые идеи, инициировавшие становление молекулярной электроники В 1974 г. Ари Авирам и Марк Ратнер рассмотрели гипотети- ческую молекулу, которую они назвали «молекулярный выпрями- тель» (рис. 3.7). Она построена как бы из двух молекул — тетра- цианохинодиметана (TCNQ)-aKuenTopa электронов, и тетратио- фульвалена (TTF), который является донором электронов. Под акцептором электронов подразумевается молекула, электронная структура которой имеет незанятую низшую молекулярную ор- биталь. Простейшим примером такой молекулы может служить BF3. Электронная структура атома бора — ls22s22p^.2p?/2pz. При образовании молекулы BF3 это распределение электронов ме- няется на ls22s*2p^.2p^2pz. Три электрона образуют три связи с атомами фтора и остается свободная орбиталь. В молекуле донора электроны находятся на наивысшей заполненной моле кулярной орбитали. Атом азота, образующий молекулу NH3, имеет электронную структуру 1ё22ё22р^2р^2р^. Три электрона образуют три связи азот - водород, но во внешней электронной оболочке остается еще два электрона. Такая электронная струк тура NH3 и BF3 приводит к тому, что они образуют стабильный молекулярный комплекс BF3NH3 за счет так называемой коорди национной (донорно-акцепторной) связи. В этом комплексе пара электронов атома азота как бы заполняет свободную орбиталь атома бора. В модели Авирама и Ратнера акцепторная и донорная труп пировки разделены непроводящим электроны углеводородным фрагментом, и вся система помещена между двумя электродами Рассмотрим подробнее, за счет чего достигается однонапраи ленное прохождение электронов в модели Авирама и Ратнера Изначально предполагается, что в отсутствие электрическом»
3.2. Первые идеи и становление молекулярной электроники 75 Акцептор Тетратиофульвален I'iii 3.7. Молекулярный выпрямитель Авирама и Ратнера: химическая струк- >ур,> (а), схема электронных уровней (б), сдвиг электронных уровней при приложении прямого (в) и обратного (г) напряжения ноля наивысший не заполненный уровень акцептора находится И1.1П1С уровня Ферми ближайшего электрода, а низший запол- ненный уровень донора — ниже уровня Ферми другого элек- ||1<п1.1. Пусть на электроды подано напряжение в направлении н ш-птор-донор. Если напряжение на катоде достаточно велико, срчпий уровень акцептора понижается и возникает возмож- но! и> захвата электрона акцептором с катода. Точно так же для шпора возникает возможность передать электрон аноду. Если «<1»н ном структура барьера между акцептором и донором такова, но между ними возможен туннельный переход сквозь барьер, к тропы будут переходить от катода к аноду. Ситуация прин- ипиллыю меняется, если напряжение на электродах имеет об- нное направление. Система уровней при этом становится такой, по вероятность перехода электрона через молекулу оказывается iii.riHicjibHo меньше, чем в предыдущем случае.
76 Гл. 3. Молекулярная элементная база вычислительных устройств Рис. 3.8. Экспериментальная модель молекулярного выпрямителя Работа Авирама и Ратнера вызвала естественное желание экспериментаторов проверить работоспособность предложенной ими модели. В 1997 г., через 23 года после выхода рабо- ты Авирама и Ратнера, американский физик Метцгер со сво- ими сотрудниками обнаружил эффект выпрямления электри- ческого тока молекулярной пленкой химического соединения донорно-акцепторного типа. Структура молекулы и схема экспе- римента показаны на рис. 3.8. Особенность этой работы заключа- ется в том, что изучалась проводимость не отдельной молекулы, а их ансамбля — упорядоченной молекулярной пленки. И это не случайно. По своей сущности модель Авирама и Ратнера описывает не прохождение через молекулу электрического тока, а одноэлектронный процесс передачи электрона по фрагментам молекулы. Это сразу же ставит под сомнение пригодность си- стем такого типа для создания молекулярных переключающихся устройств. Поскольку молекула Авирама и Ратнера — кванто вый объект, существует лишь некоторая вероятность того, что молекула переключится в проводящее состояние под действием приложенного к электродам напряжения. В противоположность этому переключающийся элемент должен однозначно реагиро вать на приложенный стимул. В связи с этим в 1988 г. Авирам предложил другой вариат молекулярного комплекса, как он определил, для «запоминаю щих, логических и выпрямляющих устройств». В основу струн туры такого комплекса были заложены протяженные молекуляр ные фрагменты (длина фрагмента ~50А). Было известно, что электронная структура этих фрагментов сходна с зонной и чти они могут быть в двух, проводящем и не проводящем электри ческий ток, состояниях, переходя из одного состояния в другое при окислительно-восстановительных процессах. Непроводящен форме отвечает наивысшая заполненная орбиталь, которая лежт ниже уровня Ферми металла. Поэтому, если такая молекула по мещена между двумя электродами, то приложенное к электродам
3.2. Первые идеи и становление молекулярной электроники 77 Рис. 3.9. Структура электронных уровней и химическая формула молекулярно- ю переключающегося устройства Авирама в непроводящей (а} и проводящей (б) форме напряжение не вызовет прохождение электронов через молеку- лярный фрагмент (рис. 3.9, а). Но этот процесс будет идти, если удалить с верхней орбитали фрагмента один электрон, т. е. пре- вратить его в положительно заряженный ион (рис. 3.9,6). Пере- ключающийся молекулярный элемент, предложенный Авирамом, показан на рис. 3.10. В этом комплексе проводящий и непро- водящий фрагменты располагаются перпендикулярно друг другу и соединяются непроводящим углеводородным фрагментом. Работоспособность такого элемента определяют три принци- пиальных особенности. Протяженность фрагментов этого элемента должна быть до- • 1 л точно велика для того, чтобы их электронная структура была ни юнной. Иными словами они должны быть сходными с прово- 1ИШНМИ полимерами. Структура молекулы в целом и непроводящего мостика меж- IV двумя фрагментами (рис. 3.9 и 3.10) должна быть такой, пчоы тунеллирование электрона происходило при достаточ- ||| малом потенциале, который превращает проводящую форму » непроводящую и наоборот. I к'реключение фрагментов из одного состояния в другое окно происходить под действием потенциала приложенного
78 Гл. 3. Молекулярная элементная база вычислительных устройств Электрод Рис. 3.10. Структура молекулярного переключающегося элемента Авирама (а) и логические элементы, построенные на основе этого устройства (б и в) к микроэлектродам, которые располагаются на центральной оси молекулярного комплекса. Таким образом, молекулярный элемент, предложенный Ави- рамом, представляет собой переключающееся устройство с двумя устойчивыми состояниями, управляемое электрическим полем. Авирам рассмотрел целый ряд логических схем, которые могут быть построены на основе предложенного молекулярного элемен- та. Два из них показаны на рис. 3.10. Желая проверить экспериментально развиваемые им идеи, Авирам предпринял две попытки создать экспериментально мо- лекулярные переключатели. В частности Авирам, Сейден и Рат- нер использовали химические реакции для того, чтобы связать с поверхностью металлического алюминия молекулы типа се- михинонов. В них атомы водорода могут находиться в одном из двух положений и переходить из одного положения в дру- гое. Было показано, что они располагаются перпендикулярно поверхности и их спектры поглощения различаются при различ- ном положении атомов водорода относительно скелета молекулы (рис. 3.11). Это позволило интегрально (т. е. для всей совокуп- ности молекул на поверхности) наблюдать переходы этих атомов
3.2. Первые идеи и становление молекулярной электроники 79 Рис. 3.11. Экспериментальная модель молекулярного переключающегося устройства при воздействии электрического поля. Позже Авирам, Иоахим и Померанц синтезировали аналогичную систему и продемон- стрировали возможность управления состоянием молекулы при помощи сканирующего туннельного микроскопа. Важную роль в развитии молекулярной электроники и 80-е гг. играли теоретические исследования Форреста Кар- гера, который детально рассмотрел различные молекулярные механизмы, которые могли бы быть использованы при создании молекулярной элементной базы электронных устройств. Исследования Форреста Картера сводились к двум основным направлениям поиска: • использованию туннельного механизма электронной прово- димости в системе последовательно расположенных потен- циальных барьеров, и управлению этим механизмом за счет сдвига уровней в одной из потенциальных ям между двумя барьерами (концепция управляющих группировок); • использованию солитонного (см. ниже) механизма переда- чи сигнала для изменения электронной структуры молеку- лярных систем и перевода тем самым молекулы из одного устойчивого состояния в другое (концепция переключаю- щихся молекул). Электронная проводимость протяженных молекулярных си- гем, т. е. процесс передачи электрона от электронодонорной । ин-ктроноакцепторной группировке по цепи атомов привлекала и послевоенные годы внимание многих исследователей. Наиболее пн п ресными с этой точки зрения являются сопряженные (по- ни ионые, полиаценовые и т. д.) системы, тг-электроны которых, in рекрываясь, образуют протяженные молекулярные орбитали. • и, молекулы представляют собой квазиодномерные системы, 1'40111,10 по своим свойствам существенно отличаются от обыч- •II о. । рехмерных систем.
80 Гл. 3. Молекулярная элементная база вычислительных устройств Не останавливаясь подробно на теории электронной проводи- мости таких молекул, рассмотрим только использованный Карте- ром механизм прохождения электрона через последовательность N одномерных барьеров V(a?) произвольной формы, разделенных (TV — 1) потенциальной ямой, причем при х —> ±оо, У(ж) —> 0. Качественные особенности этого процесса были рассчитаны аналитически для барьеров типа 5-функций. Оказалось, что они не зависят от вида потенциальной энергии. В 1962 г. советский физик Пшеничнов показал, что в квазиклассическом приближе- нии для барьеров произвольной формы при определенных усло- виях прохождение может быть аномально большим (рис. 3.12). Рис. 3.12. Туннелирование электронов в системе потенциальных барьеров Пшеничновым был рассчитан коэффициент прохождения си стемы одинаковых барьеров частицей массы ц с энергией /•’, меньшей, чем высота барьера Vo (рис. 3.12, а). Исследование показало, что при 0 < Е < Vo в каждом из минимумов возникают стационарные состояния, спектр которых представляет собой, грубо говоря, спектр одного из отдельных минимумов, все уровни которого расщеплены на (TV — 1) пол уровней: Более того, при совпадении энергии налетающей частицы / с энергией одного из подуровней коэффициент пропускания за висит от Е немонотонно и имеет (7V — 1) максимумов, значг ния коэффициента пропускания D(E) в которых равны единице (рис. 3.12, б). Таким образом, возникает возможность свободно! о прохождения электрона через последовательность барьеров. В к, же время, изменение формы хотя бы одного из барьеров прин<> дит к тому, что изменится положение уровней (по отношении' к энергии проходящей частицы) и коэффициент прохождении резко упадет. Поэтому в такой системе возможен как механи im
3.2. Первые идеи и становление молекулярной электроники 81 передачи сигнала на большие расстояния, так и эффективное прерывание сигнала. Следует отметить, что расчеты Пшеничнова не были подтвер- ждены экспериментально на примере какой-либо молекулярной системы. Однако в 1973 г. Чу и Есаки выполнили аналогич- ные расчеты применительно к многослойным полупроводнико- вым гетероструктурам, используя одномерные приближения. Их результаты полностью воспроизвели выводы Пшеничнова. Так, па полученной ими зависимости коэффициента пропускания от шергии туннелирующего электрона наблюдалось как резкое уве- ппчение пропускания при совпадении энергии электрона с одним из уровней системы прямоугольных барьеров, так и расщепление >гого пика. Позже работа Чу и Есаки была убедительно подтвер- ждена экспериментально, в частности на примере гетероструктур 1.1ЛЛИЙ - мышьяк. Отметим также, что на практике ситуация осложняется на- южением внешнего электрического поля. При этом изменяется форма барьеров У(ж),они становятся не одинаковыми и коэффи- циент прохождения электрона оказывается существенно меньше /шпицы. Поэтому, для того чтобы использовать туннелирова- ние, необходимо выбирать исходный потенциал таким, чтобы при наложении внешнего электрического поля все коефициенты прохождения электрона через барьеры были бы одинаковыми. Возможности управления молекулярными устройствами на • попе туннельных механизмов могут быть проиллюстрированы примерами молекулярных элементов НЕ-И и HE-ИЛИ, предло- женных Картером. Существенно, что даже одного из этих эле- । шов достаточно, чтобы построить любую логическую схему. На рис.3.13 показана гипотетическая структура молекуляр- ною элемента НЕ-И. В нем положительно заряженные аро- «.пические гетероциклические группировки представляют co- ni потенциальные ямы для электрона, а связывающие их । но-группировки — потенциальные барьеры. Если энергия мрона совпадает с энергией уровня ямы, то коэффициент рохождения становится равным единице и электрон свободно •»Ходит вдоль цепи потенциальных ям, как это изображено на 3 13, а. Прохождение электрона можно прервать изменением ни высоты потенциального барьера, либо глубины потенциаль- и ямы, которые изменяют положение уровня. На рис. 3.13, б ониа потенциальной ямы определяется зарядом атома азота 111 четырех управляющих группировок в двух из них — riuni и третьей, заряд, на N+ не изменяется. В то же время > шорой и четвертой управляющих группировок возможна
82 Гл. 3. Молекулярная элементная база вычислительных устройств б Рис. 3.13. Молекулярный элемент НЕ-И Картера перестройка структуры с изменением заряда на атоме азота, ко- торая может быть вызвана, например, поглощением света одной из молекулярных группировок на входе, как это изображено на рисунке (сравнить вход В и вход D). Поскольку при нейтрализа- ции ароматической группировки существенно изменятся форма ямы и расположение в ней энергетических уровней, то свобод- ное прохождение электрона будет исключено и коэффициент прохождения системы резко уменьшится. Используя молекуляр- ные фрагменты различной структуры в качестве управляющих группировок, можно добиться того, что перестройка структуры устройства будет происходить при различных энергиях фотонов на разных входах. Рассмотренный молекулярный элемент работа- ет с использованием оптического ввода информации. Возможны и другие способы воздействия на управляющие группировки, при которых на вход поступает электрон, или же происходит пе- рестройка структуры вызванная распространением заряженных солитонов. Молекулярный элемент типа HE-ИЛИ, предложенный Кар тером и действующий на тех же самых принципах, показан на рис.3.14. Он представляет собой стопку молекул — произвол ных фталоцианинов галлия (кольцо С). Потенциальные барьеры между ямами создаются за счет промежуточных атомов фтора В качестве входа сигнала используется цепочка (SN)n, по ко торой приходит электрон, чтобы нейтрализовать заряд группы C=N+. Это приводит к изменению формы потенциальной ямы и прекращению процесса туннелирования электрона вдоль стоп
3.2. Первые идеи и становление молекулярной электроники 83 Bb,^(SN)„. °iSCH£X=+ N--Ga---±N=C^2SCO3 -O,SCH2^,_+ F + ,.^HjSC(>7 Вход R-'C-N------Gdnc-r ----GF ^=cC(SN)- -OjSCH,^-----gF V!-N=C^H2SCO7 ----Ga----Vn=C^SC05' ------7—Л (SH)m Кольцо C Вход ~Б Рис. 3.14. Молекулярный элемент HE-ИЛИ Картера mi молекул. Кольца типа D по краям элемента обеспечивают выход сигнала через (5М)п-цепочку и подсоединение к разности потенциалов через Ni-S-связь. В основе этих двух примеров лежит концепция управляющих ।рунпировок, т. е. молекулярных фрагментов, электронная струк- црл которых перестраивается под действием некоторого фактора я и м самым прерывает движение электрона в основной цепи. Можно предложить и другие типы управляющих группировок. Гак, в дополнение к уже рассмотренному механизму нейтра- III 1.щии заряда на атоме азота, вызываемой передачей электрона о молекулярной цепочке, Картером было предложено использо- и hi. перестройку электронной структуры управляющих группи- |и|||<1к за счет: таутомерной перегруппировки, управляемой изменением нт iiiiiero электрического поля (рис. 3.15, а и б); внутримолекулярного фотопереноса заряда (рис. 3.15, в) « । д. Па рис. 3.15, г представлен также пример более сложной мо- । \ пирной управляющей группировки, на которую можно воз-
84 Гл. 3. Молекулярная элементная база вычислительных устройств Рис. 3.15. Молекулярные управляющие группировки Картера действовать как внешним электрическим полем, так и световым излучением. Среди процессов передачи энергии возбуждения в квазиод номерных молекулярных цепочках особое значение имеют кол лективные процессы, в частности солитонные механизмы. Под солитоном (его называют также уединенной волной) подразуме вается энергетическое возбуждение среды, распространяющееся вдоль среды на большие расстояния. Основополагающую роль в изучении этих механизмов в молекулярных системах и в ис- пользовании их для объяснения ряда биологических явлении сыграли известный советский физик А. С. Давыдов и его школа В основе концепции солитонного переключения, развитой Картером, лежит перестройка электронной структуры, иницин руемая коллективными процессами этого типа. Опишем вкратцг эти интересные молекулярные образования. Еще подробности: молекулярная структура — пространственная коп фигурация ядер молекулы Под молекулярной структурой будем понимать набор констант и функпн ональных характеристик, описывающих взаимное расположение и относится!, ное движение ядер и электронов молекулы. Исходя из этого, рассматриваю н ч обычно три основные группы молекулярных характеристик:
3.2. Первые идеи и становление молекулярной электроники 85 • параметры геометрической конфигурации ядер молекулы (полный набор межъядерных расстояний и валентных углов нередко называют струк- турой молекулы, понимая ее в этом узком смысле); • динамические характеристики, определяющие относительное движение ядер молекулы (уровни энергии, частоты колебаний, средние смешения ядер из положений равновесия и т. д.); • электронные характеристики (уровни энергии электронов молекулы, распределение электронной плотности и такие ее характеристики, как электрические дипольные и квадрупольные моменты молекулы и т. д.). Относительное расположение ядер молекулы принято характеризовать их равновесной конфигурацией, отвечающей минимуму потенциальной энергии ее и дер. Рис. 3.16. Основные структурные формы соединений углерода Среди огромного числа известных сегодня молекул наибольшим разнообра- зии отличаются молекулы соединений углерода — органические. Уникальная ........ углерода состоит в том, что его атомы объединяются в цепочки ииоряющихся звеньев различной длины. Таким образом, образуются мо- iiv'iiJ, объединяющиеся в классы органических соединений — предельные и in предельные углеводороды, ароматические соединения и т. д. Атомы угле- 11 образующие органические соединения, могут находиться в трех струк- .....lx состояниях (рис. 3.16). В тетраэдрическом состоянии атом углерода 1Ч1ДИ1СЯ как бы в центре тетраэдра, а его связи с другими атомами направ- И1.1 к псршинам тетраэдра. В тригональном состоянии связи атома углерода iip.iKцепы от центра плоского треугольника к его вершинам. И, наконец, niKi-iiiioM состоянии все три атома — углерода и двух связанных с ним, лежат цини прямой. Поскольку в подавляющем числе органических соединений Kiiiiiocrb углерода равна четырем, тригональные состояния проявляются • и кулах с двойными связями углерод-углерод, а линейные — в молекулах
86 Гл. 3. Молекулярная элементная база вычислительных устройств с тройными связями. При этом различные структурные звенья могут объеди- няться в одной и той же молекуле. Эти структурные особенности молекул соединений углерода могут быть объяснены, исходя из свойств их электронной структуры. Сегодня геометриче- ская конфигурация ядер сравнительно больших органических молекул может быть определена с точностью эксперимента решением уравнения Шредингера. Но это — трудоемкий и дорогостоящий путь. Поэтому еще в ЗО-е гг. про- шлого века, когда расчетные квантово-механические методы находились еще в зачаточном состоянии, известный химик-теоретик Лайнус Полинг предложил полуэмпирический метод объяснения. Исходя из экспериментально установлен- ных вариантов расположения связей атома углерода, он предложил в качестве объяснения принцип гибридизации атомных орбиталей. Рис. 3.17. вр3-гибридизация атомных орбиталей Как известно, валентные электроны атома углерода находятся на атом ных 2s- и 2р-орбиталях. 2»-орбитали имеют сферическую симметрию, а 2р орбитали располагаются в пространстве перпендикулярно друг другу. Посколь ку линейные комбинации решений уравнения Шредингера являются также его решениями, Полинг ввел понятие гибридных орбиталей — линейных комбина ций s- и /(-орбиталей атома углерода. Если при этом наложить на эти комби нации симметрийные ограничения, то оказывается, что они правильно описи вают пространственное расположение связей атома углерода (рис. 3.17-3.19) В случае тетраэдрической симметрии, например, если поворачивать гибридные орбитали на 120° относительно одной из них, они после поворотов совпадаю, друг с другом. Учет симметрийных принципов показал, что в случае тетра эдрической симметрии во все четыре гибридные орбитали входят атомные я и все р-орбитали углерода. Этот вариант называют зр-гибридизация. В то ж, время, тригональные (sp2) и линейные (sp) гибридные орбитали в соответствии с симметрийными требованиями должны строиться из з- и двух р- и я и одной р-орбиталей соответственно. Таким образом, остаются не вошедшие в гибридные — одна р-орбиталь в случае sp2-гибридизации и две в случае
3.2. Первые идеи и становление молекулярной электроники 87 Расположение Геометрическое Примеры гибридных орбит представление Основные типы гибридизации Рис. 3.18. Различные варианты гибридизации атомных орбиталей •у гибридизации. Их перекрыванием Полинг объяснил образование двойных и тройных связей углерод-углерод. Позже Джиллеспи и Найхолм предложили еще один полуэмпирический путь определения структуры простых молекул, который применим не только соединениям углерода, но и молекулам, построенным на основе всех ато- мов периодической системы. Они предположили, что взаимное расположение помов в молекуле определяется электростатическим отталкиванием связей о пеподеленных пар электронов. Несмотря на свою исключительную простоту, ю предположение удивительно правильно описывает структуру простых мо- к-кул (рис. 3.20). Характерной особенностью больших молекул является то, что при увеличе- нии числа ядер в молекуле возрастает вероятность существования изомеров — молекулярных форм с одной и той же стехиометрией (т. е. атомным соста- вом молекулы), но с различными равновесными конфигурациями ядер. Таким пиратом, на поверхности потенциальной энергии ядер многоатомной молеку- U.I появляется несколько минимумов, отвечающих каждому изомеру. Иными воками, молекула в этом случае представляет собой систему с несколькими и питиями, переходы между которыми (изомеризация) могут осуществлять- и под действием физических факторов. В литературе принято называть их • информерами. В качестве примера можно привести молекулу циклогексана (pm 3.21). Ее наиболее низкое энергетическое состояние называют «кресло». Чио лежит ниже чем конформация, называемая «ванна», на ~ 22кДж-моль. Переходы «кресло» - «ванна» осуществляются через промежуточные конформа- ции ища «полукресло». В общем случае, переход из одной конформации в дру- iio сопровождается перестройкой электронной структуры молекулы. Поэтому пн pieгические затраты на эти переходы велики и приходится использовать « ицюскопические воздействия (а не отдельные кванты излучения) и считаться и м. что часть энергии воздействия рассеивается в конечном счете в тепло.
88 Гл. 3. Молекулярная элементная база вычислительных устройств sp2 -гибридизация Перекрывающиеся негибридизирован! иле 2р-орбитали СС л-связь Рис. 3.19. Схема образования молекулы этилена по Полингу Поскольку барьеры между минимумами, отвечающие отдельным конфор мациям достаточно велики, этим конформациям отвечают большие времена жизни. Поэтому электронно-конформационные переходы активно используют ся в последние годы для создания на их основе молекулярных переключаю щихся устройств. Известны по крайней мере два типа нелинейных систем в которых могут распространяться солитоны. Первый — это мо лекулярные цепочки, построенные из взаимодействующих фра! ментов, которые дополнительно связаны слабыми взаимодействп ями (например, водородной связью), т. е. электронные и коле бательные свойства фрагментов в цепочке мало отличаются oi свойств индивидуальных молекул. Примером такой системы ян ляется цепочка пептидных групп, связанных водородными свя зями в а-спиральном белковом фрагменте. В пептидной труп
3.2. Первые идеи и становление молекулярной электроники 89 Рис. 3.20. Структура простых молекул по Джиллеспи и Найхолму Рис. 3.21. Конформации циклогексана Кресло» «Полукресло» «Ванна» «Полукресло» «Кресло» возможно внутримолекулярное колебательное возбуждение раннительно большим дипольным моментом перехода. Он почивает сильное взаимодействие между соседними молеку- |и. которое приводит к коллективному сравнительно быстро
90 Гл. 3. Молекулярная элементная база вычислительных устройств затухающему возбуждению. Его называют экситоном. Другое коллективное возбуждение образуется в этих молекулярных це- почках в результате взаимодействия внутримолекулярных воз- буждений (колебаний) и нелинейности, вызванной связью этих колебаний с локальными смещениями равновесных положений молекул. Солитоны представляют собой устойчивые образования и распространяются вдоль цепочки без диссипации энергии на большие расстояния. Вторым типом систем, в которых прояв- ляются коллективные эффекты, являются сопряженные полиме- ры, например транс-полиацетилен, возможность существования солитонного возбуждения в которых обусловлена вырождением основного электронного состояния. Рис. 3.22. Конформации полиацетилена Полиацетилен (рис. 3.22) представляет собой простейший и" своей структуре сопряженный углеводород (СН)П. Как известно атом углерода содержит четыре валентных электрона. В cooi ветствии с общепринятыми полуэмпирическими представлспп ями, в молекулярных фрагментах типа этилена (структур!пл основной фрагмент полиацетиленовой цепи) три из них р,к полагаются на четырех яр2-гибридных орбиталях и образу ни одинарные сг-связи с соседними атомами водорода и углерода лежащими в одной плоскости. Эти связи отвечают целики заполненным глубоко лежащим зонам. Четвертому валентном
3.2. Первые идеи и становление молекулярной электроники 91 электрону атома углерода (тг-электрон) отвечает волновая функ- ция 2р2, перпендикулярная плоскости молекулы. Функции сосед- них атомов этого типа перекрываются, что приводит к образова- нию 7г-орбиталей. Характерные свойства сопряженных молекул определяются именно этими делокализованными электронами, и то время как ст-электроны образуют жесткий остов молекулы п поле, в котором движутся подвижные л-электроны. Поэтому ооычным приближением для сопряженных систем является раз- ш-ление энергии на две части: Е - Еа + Еп, те Еа— энергия сг-остова молекулы при отсутствии взаимодей- । тмя с тг-электронами, а Еп — энергия тг-электронов в эффек- ।инном поле сг-остова. Полиацетилен существует в виде двух изомеров: транс- Hll)„ и цис-(СН)п (рис. 3.22). При выполнении квантово- механических расчетов обычно принимают, что в транс-(СН)п м-лету ст-остова отвечают одинаковые расстояния между СН- । руинами, в то время как в цис-(СН)п проявляется альтерни- роплпие ст-связей. Это следует прежде всего из общих сооб- p.i/кепий — симметричное относительно атомов углерода рас- '|<>ш>жение соседних атомов водорода в транс-(СН)п и несим- *к |ричное в цис-(СН)п, которое вследствие стерических вза- пмилействий Н...Н приводит к чередующимся укороченным и удлиненным расстояниям между СН-группами. К аналогич- >му выводу можно прийти и на основании неэмпирических ппово-механических расчетов. i олитонные решения (точнее топологические дефекты) воз- |ц пог при детальном рассмотрении электронной структуры >п системы сопряженных связей достаточно большой дли- Прежде всего, исходя из очевидных геометрических сооб- >|<1шй, нетрудно видеть, что цепи сопряженных связей ти- ip.inc-(CH)n могут существовать в двух вырожденных по pi пи формах. Их взаимодействие приводит к возможности •пикновения топологического дефекта электронной структуры in 1 17), который является одним из элементарных возбужде- и чой сопряженной системы. Иппл и Уолмсли в 1962 г. исследовали этот тип дефекта । простейших предположениях, что дефект локализован на и < II группе и что только две одинарные связи окружают ш фект (как и изображено на рис. 3.23) и имеются только И1П.1 связей: одинарная и двойная. В результате ими было ню, чго в дополнение к валентной зоне, которая образуется
92 Гл. 3. Молекулярная элементная база вычислительных устройств Зона проводимости н н н н н I I I I I \С/С\®/СЧС/СЧС/СЧС/СЧСХ I I I I I I н и н н н н Валентная зона Зона проводимости Валентная зона « Рис. 3.23. Схема образования солитона в полиацетиленовой цепи (а); разлпч ные типы солитонов возбуждений (а-в); пространственный характер солитон него возбуждения (г) из связывающих орбиталей, и зоне проводимости, образованно!! разрыхляющими орбиталями, возникают две локализованньк несвязывающие орбитали, отвечающие двум рассматриваемым дефектам. Они лежат в середине щели между валентной зоной и зоной проводимости (рис. 3.23). Солитон в транс-полиацетилене является топологическим ун фектом, который соединяет две геометрически неэквивалсп!
3.2. Первые идеи и становление молекулярной электроники 93 Рис. 3.24. Возбуждение солитона в полиацетиленовой цепи iii.li*. конфигурации (А и В, рис. 3.23) вырожденного основного км гояния и целиком обусловлен этим вырождением. В длин- ных сопряженных цепях за образование дефектов типа солито- |н>|| могут быть ответственны различные механизмы. В частно- 1н, поглощение кванта света молекулой полиацетилена может принести к возникновению парных дефектов. Нетрудно видеть 1pm 3.24), что дефект, возникший на нечетном (четном) атоме uni.щетиленовой цепи, может распространяться далее только нечетным (четным) узлам. В зависимости от этого дефект 11 п.1вают солитоном или антисолитоном. При разрыве одной из ионных связей в полиацетилене образуется расходящаяся пара hiioii-антисолитон. В то же время два движущихся навстречу ни другому дефекта, солитон и антисолитон, способны к ре- чмоппации. I'. основе концепции солитонного переключения, развитой пером, лежит перстройка электронной структуры молекуляр- < не гемы, вызванная коллективными процессами этого ти- !'кпространение солитона в квазиодномерной сопряженной h*mi* связано с заменой двойных связей на одинарные и на- 1><и Это можно использовать для создания переключателя, р.ппыя в исходную сопряженную систему переключаемый " купярный фрагмент, обладающий возможностью перестра-
94 Гл. 3. Молекулярная элементная база вычислительных устройств ивать цепь сопряжения. В качестве такого фрагмента можно представить себе молекулу 1,1-М,Н-диметил-2-нитроэтенамина, которая, будучи встроенной в цепь транс-полиацетилена, может, поглощая свет, претерпевать фотопревращения и перестраивать цепь сопряжения (рис. 3.25, а). При этом: • после прохождения солитона в основной цепи и замены двойных связей на одинарные и наоборот не будет осу- ществляться фотоизомеризация, что может служить инди- катором прохождения солитона; • реакция изомеризации, инициированная до прохождения солитона в основной цепи, изменяет электронную структу- ру не только переключающегося фрагмента, но и прилега- ющего участка цепи (разрывает цепь сопряжения) и тем самым делает невозможным последующее прохождение со- литона. Концепцию солитонного переключения можно обобщить и на несколько сопряженных квазиодномерных цепочек, по которым могут распространяться солитоны. Такой пример приведен на рис. 3.25, а, на котором изображены две сопряженные цепочки и два различных хромофора. Конфигурация цепочки 1 такова, что первый хромофор не поглощает света, в то время как вто рой может быть фотовозбужден. Прохождение солитона вдоль цепи 1 включит первый хромофор и выключит второй. Солитон, прошедший по цепи 2, выключит оба хромофора. На аналогичных принципах могут быть построены и более сложные переключающие системы с достаточно большим числом входов и выходов. На рис. 3.25, в показан пример подобной си стемы, построенной на основе нескольких цепей объединенных в общую систему цепочками сопряженных свя зей. Здесь Л, С и D — электронный акцептор, промежуточная группировка и донор электрона соответственно. В этой системе как и в случае рассмотренного выше элемента НЕ-И, Картер предлагает использовать туннельный переход электрона. Соли тонное переключение каналов (I—IV) может осуществляться ин трем каналам полиеновых цепей (горизонтальные направления на рисунке). Отметим, что каждой группировке (Л, С, 1>) отделенной одна от другой линией из точек, могут быть си поставлены различные состояния, зависящие от распределепи одинарных и двойных связей между ними. Варианты состоянии системы показаны в табл. 3.1. Здесь единицей обозначается ня личие двойной связи углерод - углерод между А и С, С и ( С и D в соответствующем канале. Нетрудно видеть, что при
3.2. Первые идеи и становление молекулярной электроники 95 1 '.’5 Различные варианты переключающихся элементов на основе соли- тонов • п ине электрона по вертикально расположенной на рис. 3.25 "ин 1. .1) возможно лишь при всех единицах в соответству- ем столбце таблицы. Например, фрагмент С отключен от А iii.uie И цепочкой 1, в то время как фрагмент С отключен от 1»п<> фрагмента С в канале III второй цепочкой. Состояние • 1ГМЫ существенно меняется при прохождении солитона па иячсгвующей цепочке. । ппопные механизмы переключения могут обеспечить осу- в iciine более сложных логических функций. Так, системы,
96 Гл. 3. Молекулярная элементная база вычислительных устройств Таблица 3.1 Состояние логической схемы с несколькими входами и выходами, управ- ляемой за счет солитонного переключения Канал 1 2 3 4 Цепочка 1 1 0 1 1 Цепочка 2 1 1 0 1 Цепочка 3 1 1 1 0 изображенные на рис. 3.26, могут выполнять достаточно слож- ные операции. Изображенная на рис. 3.26, а структура состоит из атома углерода, связывающего три полубесконечные цепоч- ки транс-полиацетилена. Предположив, что присутствие подряд двух одинарных связей блокирует дальнейшее распространение солитона, можно видеть, что распространение солитона вдоль одной из цепочек будет сдвигать и перераспределять единичные и двойные связи, как бы вращая систему вокруг центрального атома углерода. При этом каждое распространение солитона соответствует групповой операции — повороту на 120°, бло кируя распространение солитона в другую цепочку. Цикличе ская система, объединяющая три фрагмента типа а (рис. 3.26, б) обеспечивает выполнение групповых операций, соответствующих точечной группе D%. Такие же операции выполняет система, изображенная на рис. 3.26, в. Рис. 3.26. Циклические элементы на основе солитонов В то время как простая система рис. 3.26, а имеет три p.i t личных состояния, циклическая конфигурация из трех таки* систем рис. 3.26, бив имеет четыре различных состояния, а коп
3.2. Первые идеи и становление молекулярной электроники 97 фигурация, изображенная на рис. 3.26, г имеет пять состояний; н'м самым они могут использоваться в машинах, выполняющих операции в недвоичной системе счисления. Конфигурация, изоб- раженная на рис. 3.26, д, имеет десять состояний и может пред- г.шлять интерес в системах, выполняющих вычисления в деся- тиной системе счисления. Таким образом, эти элементы можно I.U1O бы использовать и как элементы в небинарных машинах, и как элементы, выполняющие сложные групповые операции. В принципе, такие солитонные структуры, скомбинированные । р.щиционным образом, можно использовать, чтобы сконстру- ировать элементы, которые как выполняют функции булевой нижи, так и являются элементами памяти. Пионерские исследования Авирама и Ратнера, а также Кар- пр,1 инициировали изучение различных аспектов обработки информации на молекулярном уровне. В течение нескольких последующих лет был опубликован ряд теоретических работ, которых предлагались возможные пути использования молеку- ирпой элементной базы. Было выполнено несколько интересных i псриментальных работ. Тем не менее, следует признать, что они продемонстрировали лишь достаточно тривиальные факты. К основном то, что молекулы определенной структуры могут реключаться из одного устойчивого состояния в другое и то, ио ни переходы могут быть зафиксированы. Но в то же время < оде этих работ возникло и реальное понимание особенностей м । к'кулярной электроники. Прежде всего стало ясно, что трудно ожидать, что малые мо- кулы, построенные из сравнительно небольшого числа атомов, । кугся в силу своей квантовой природы однозначно действу- 1ППМН переключателями, такими как аналогичные полупровод- niniiwe устройства. Принципиальная осуществимость информационно-логичес- устройств на молекулярном уровне определяет лишь общие ин рни, а не конкретные правила выбора исходных молекуляр- «. »лсментов, на базе которых может быть построено устрой- । ( ыданными функциями. /1ля того, чтобы очертить специфику и основные трудности и проблемы, рассмотрим один из возможных умозрительных рп.пнон, когда отдельные молекулы рассматриваются в каче- । ни нчсских элементов, а управление ими и передача инфор- •< inn осуществляется за счет оптических монохроматических 14111.14 воздействий и оптической связи.
98 Гл. 3. Молекулярная элементная база вычислительных устройств НЕ а---и---а' а О О 1 1 b О 1 О 1 с* О 1 1 1 а О О 1 1 b О 1 О 1 с' О О О 1 Рис. 3.27. Логические возможности молекулярных систем Как известно, систему переработки информации любой слож- ности можно построить исходя из логических элементов трех типов НЕ, И и ИЛИ. На первый взгляд, многие атомные или молекулярные си стемы с их дискретными уровнями энергии идеально подходят в качестве основных логических элементов. Пусть это будут, например, процессы селективного возбуждения электронных или колебательных состояний атома (иона) или многоатомной моле кулы монохроматическим излучением. При этом предположим, что в исходном атоме или молекуле заселено только основное состояние и что возбуждение того или иного уровня квантом излучения происходит с высокой (практически полной) вероятно стыо. Естественно, будем исходить из того, что переходы между рассматриваемыми состояниями разрешены. На рис. 3.27 показаны примитивные примеры возможной рс.ч лизации на молекулярном уровне основных логических функци(( Нетрудно видеть (рис. 3.27), что возможности возбуждении молекулы СО2, находящейся в основном колебательном состоя нии (0, 0, 0), в одно из возбужденных состояний (0, I, 0) иля (0, 0, 1) являются взаимоисключающими на протяжении время ни жизни возбужденного состояния. Этот процесс можно сопи ставить с операцией НЕ, рис. 3.27, а. Возбуждение иона хромл в кристалле рубина излучением с частотой и\ или с частотой / приводит к испусканию кванта частоты (элемент типа ИЛИ рис. 3.27, б). Селективное двухступенчатое возбуждение основ ного синглетного электронного состояния Sq молекулы родамин >
3.2. Первые идеи и становление молекулярной электроники 99 В совместным действием двух ультракоротких импульсов с ча- стотами М) и ^2 имитирует логическую операцию И (рис. 3.27, в). Тем не менее, несмотря на то, что возможности использова- ния отдельных атомов и молекул в качестве исходных элементов вычислительных схемах кажутся очевидными, достаточно про- 1ые соображения выявляют ряд несоответствий характеристик оомных и молекулярных систем следующим требованиям, кото- ' предъявляются к исходным элементам. 1. Для исходного элемента должна быть характерна высокая надежность (вероятность) срабатывания, когда на элемент подается управляющее воздействие. 2. Средняя мощность реакции элемента, передаваемая друго- му элементу, не должна быть намного меньше, чем сред- няя мощность входного воздействия на элемент. В нашем случае это означает, что количество квантов излучения на входе элемента в единицу времени не должно быть намного больше, чем на выходе. В противном случае вероятность срабатывания элемента при объединении их в цепь будет падать по мере удаления от начала цепи. 3. КПД преобразования сигнала отдельным элементом дол- жен быть близок единице. Это значит, что реакция мо- лекулы при ее возбуждении должна быть однозначной и что возбужденная молекула должна далее отреагировать однозначным образом, не рассеивая энергию возбуждения за счет ее внутримолекулярной диссипации. 1 Элемент должен переводиться управляющим воздействием в любое необходимое его состояние. !> При переходе элемента из одного состояния в другое он должен оставаться в нем достаточно долго для того, чтобы следующее управляющее воздействие могло бы однозначно перевести элемент в новое состояние. ь Состояние элемента должно быть считываемым, т. е. долж- на существовать возможность однозначно определить, в ка- ком состоянии элемент находится. Детальный анализ этих требований показывает, что в случае ем ровных состояний эти требования, хотя бы частично, не •ыиолпяются. В дальнейшем будет показано, что конформаци- iiiii.ie переходы, когда меняется конфигурация ядерного остова пинаются пригодными для создания молекулярных переклю- • шпппхся элементов. I’, io же время на протяжении 80-90-х гг. было показано, ансамбли молекул, обладающих определенными характери-
100 Гл. 3. Молекулярная элементная база вычислительных устройств стиками, являются перспективными объектами для разработки устройств обработки и хранения информации, т. е. химические среды, могут быть использованы в вычислительных или же запо- минающих устройствах. В сущности это был переход от идеоло- гии молекулярных устройств (т. е. систем, в которых элементной базой служат отдельные молекулы) к устройствам, построенным на основе химических сред, т. е. макрообъектов, сохраняющих в то же самое время отдельные преимущества молекулярных объектов. Эти две основные тенденции (использование моле- кулярных сред и синтез крупных переключающихся молекул) привели во второй половине 90-х гг. к созданию действующих молекулярных устройств обработки информации. 3.3. Молекулярная память на основе белка бактериородопсина В спектрах поглощения различных соединений проявляют- ся полосы, отвечающие переходу молекул вещества в одно из возбужденных состояний. Если при этом время жизни возбуж- денного состояния достаточно велико и если его можно перс вести каким-либо физическим воздействием обратно в основное состояние молекулы, такие химические соединения могут быть использованы для записи и хранения информации. Технически наиболее простой путь — использовать для запн си квази-двумерные пленки подходящего вещества. Это можно сделать, например, лазером с частотой равной частоте молеку лярного перехода. В этом случае, лазерный луч, сканирующий поверхность пленки и записывающий информацию, может быть сфокусирован до пятна диаметром ~ 1 мкм. Но такая фокусирон ка требует сложной и дорогостоящей аппаратуры. Поэтому обыч но используют системы фокусировки лазерного луча до диаметра на порядок больше. Таким образом, плотность записи информ., ции в пленке вещества будет составлять 106-108 бит/см2. Работы в этой области привели к созданию ряда действую щих макетов устройств памяти. По-видимому, наиболее важны ми среди них и наиболее близкими к практическому примет- нию были различные варианты оперативной памяти для ЭВМ разработанные Робертом Берджем на основе уникального бел к., бактериородопсина. Бактериородопсин представляет собой светочувствительны,, белок, который содержится в пурпурных мембранах галобакк- рий Halobacterium Halobium. Места обитания галобактерий соленые водоемы или источники, где добывают соль. Они им,-
3.3. Молекулярная память на основе белка бактериородопсина 101 Рис. 3.28. Структура и фотоцикл молекулы бактериородопсина Рис. 3.29. Спектры конформеров бактериородопсина ип красноватый оттенок именно благодаря галобактериям. Этот • и епок придают клеткам желтые каротиноиды и фиолетовый 1кк'риородопсин. Молекулы бактериородопсина образуют фо- вп питетический центр галобактерий. Поглощая квант света, Hi действует как протонный насос, способствуя синтезу АТФ. । рук гура молекулы бактериородопсина детально определена 1рш 3.28). Она представляет собой циклическую комбинацию • мп иолипептидных спиралей, внутри которой находится свето- |« пепельный фрагмент — хромофор. При поглощении света |чик ходят структурные перестройки молекулы.
102 Гл. 3. Молекулярная элементная база вычислительных устройств Бактериородопсин обладает уникальной для белков стабиль- ностью. Он способен в течение многих лет сохранять неизмен- ными свои свойства и в виде сухого образца, и в полимерных пленках, от монослоя толщиной 5 нм до нескольких десятков микрон. Фундаментальное свойство молекулы бактериородопсина — фотохимический цикл — последовательность возбужденных со- стояний (интермедиатов), которую проходит молекула после ее возбуждения световым излучением. Спектры интермедиатов зна- чительно отличаются друг от друга (рис. 3.29). В ходе фото- цикла происходят также изменения оптических характеристик белка — показателей поглощения и преломления. Таким образом, природный бактериородопсин при комнатной температуре ведет себя как фотохромная среда с малым временем хранения ин- формации. Основное состояние молекулы бактериородопсина — bR(570). После возбуждения световым излучением в состояние К(610) молекула бактериородопсина самопроизвольно проходит через ряд интермедиатов и возвращается в исходную форму. Но в ходе этого процесса возникает дополнительная возмож- ность перевести молекулу селективным излучением из состояния 0(640) в еще одно долгоживущее состояние Q(380). Механизмы переходов между возбужденными состояниями молекулы различ- ны и по-разному зависят от температуры. При температуре 77 К фотоцикл природного бактериородопсина разрывается и молеку- ла ведет себя как система с двумя устойчивыми состояниями bR(570) и К(610), переходы между которыми инициируются све- том в видимом диапазоне спектра. В начале 90-х гг. Роберт Бердж, основываясь на этой осо бенности бактериородопсина, разработал криогенное оптическое оперативное запоминающее устройство для цифровых ЭВМ В нем информация записывалась на пленку бактериородопсип- содержащего полимера и считывалась с нее лазерными лучами с различными частотами излучения (рис. 3.30). Память емкостью 25 Мбайт с временем обращения 10-100 нс функционировал.) при температуре 77 К. Одновременно с этим был разработан вариант кэш-памяти емкостью 25 Мб, работающий при темне ратуре близкой к комнатной, в котором использовалось друго< возбужденное состояние молекулы бактериородопсина. На протяжении 90-х гг. и в начале нашего века групп.) Берджа разработала также голографическую ассоциативную пл мять, которая позволяла считывать информацию, имея лишь е< ограниченную часть (например, восстанавливать изображение пн
3.3. Молекулярная память на основе белка бактериородопсина 103 Дефлекторы лазерных лучей Рис. 3.30. Схема планарного молекулярного запоминающего устройства на основе белка бактериородопсина его фрагменту). Но основные усилия группы были направлены на разработку объемной оперативной памяти сверхвысокой емкости. В отличие от предыдущих вариантов запоминающих устройств, в которых информация записывается на плоской пленке бактериородопсина, в объемной памяти, как это следует m ее названия, информация хранится во всем объеме среды. Нужно сказать, что объемная память на основе бактериоро- лонсина — технически сложное электронно-оптическое устрой- । во. Оно включает в себя несколько лазеров с излучением и различных областях спектра, оптические (рис. 3.31). В запоминающем устройстве значению бита информации «0» швечает основное bR-состояние молекулы бактериородопсина, качению «1» — Q-состояние. Эти долгоживущие состояния могут оставаться неизменными несколько лет. Запоминающая рода представляет собой кювету размером 1x1x2 дюйма, пшлненную полиакриламидным гелем с внедренными в него молекулами бактериородопсина. Вокруг кюветы располагаются и.шоры лазеров и устройства, преобразующие и регистрирующие । истовую информацию. Рассмотрим несколько упрощенно процесс записи и счита- вши информации в объемной памяти (рис. 3.32). Процесс за- iiiii и начинается с выбора и активации тонкого слоя (страни- ы) внутри объема запоминающей среды. Толщина страницы «иже г изменяться от 15 до 100 мкм. С информационной точ- п фения страница представляет собой квазиплоский носитель информации объемом 4096 х 4096 бит. Активация производит- 't иг темой зеленых лазеров. Они возбуждают все молекулы и к рпородопсина, находящиеся в слое среды страницы. Че-
104 Гл. 3. Молекулярная элементная база вычислительных устройств 570-630 нм лазер Фотодетектор Запись—считывание Рис. 3.31. Схема объемного молекулярного запоминающего устройства на ос- нове бактериородопсина Активирование странны Рис. 3.32. Запись и считывание информации в объемном запоминающем устройстве на основе бактериородопсина Запись информации Считывание информации рез ~ 2 мс концентрация молекул на странице, находящихся в О-состоянии, достигает максимума. В этот момент вклю чается система красных лазеров, направление излучения ко торых перпендикулярно плоскости страницы. Оно засвечиваем страницу через ЖК-транспарант, который позволяет переводин, в Q-состояние только выбранные элементы плоскости страницы Они будут отвечать битам «1». Все остальные молекулы бакте риородопсина переходят в исходное состояние, т.е. сохраняю! значения битов «0».
3.4. Запоминающие устройства 105 Для того, чтобы считать данные, страница снова активиру- ется системой зеленых лазеров. При этом молекулы бактериоро- допсина, которые находились в основном состоянии (биты «0») через ~ 2 мс переходят в О-состояние. После этого страница освещается красными лазерами, излучение которых поглоща- ется молекулами в О-состоянии и не поглощается молекулами в Q-состоянии. Поэтому положение элементов среды, содержа- щих молекулы в Q-состоянии, на странице будут фиксироваться, если зарегистрировать прошедшее через кювету красное излуче- ние ПЗС-матрицей. Полная очистка памяти, т. е. перевод всех молекул бакте- риородопсина в основное состояние может быть сделана синим лазером. Малые времена жизни интермедиатов бактериородопсина и параллельная одновременная обработка информации на стра- нице приводят к тому, что время записи считывания может ныть доведено до нескольких десятков Гбит/с. Оценки также показывают, что в объеме Зсм2 может храниться гигантская информация, объемом в сотни гигабайт. Нужно все же подчеркнуть, что создание такой системы представляет собой сложнейшую научную и техническую задачу, п поэтому до настоящего времени основные решения отрабаты- н.потся на действующих макетах с емкостью памяти не превы- шающей десятки кбит. Разработка устройств на основе бактериородопсина и неко- шрые другие исследования 90-х гг. приблизили промышленное ш пользование молекулярных сред в вычислительной технике. 3.4. Запоминающие устройства на основе эффекта «выжигания провалов» в спектрах поглощения Наряду с молекулярной объемной памятью нужно отметить и другой путь создания запоминающих устройств сверхвысокой мкости. В его основе лежит принцип частотно-селективной за- писи информации. Механизм оптической частотно-селективной записи осно- ii.ui па явлении «выжигания провала» в широких неоднородно- > ширенных полосах поглощения органических молекул в твер- ич ельных матрицах. Суть явления, открытого и изученного .|||ч»лой К. К. Ребане, группой Р. И. Персонова и рядом других ипорон, состоит в том, что если узкой лазерной линией осветить чНр.нец, то в спектре поглощения образуется узкий провал, ко- чрый в темноте и при низких (гелиевых) температурах сохрани-
106 Гл. 3. Молекулярная элементная база вычислительных устройств Рис. 3.33. Запись и считывание информации в объемном запоминающем устройстве на основе бактериородопсина ется достаточно долгое время. Для практической реализации оп- тической частотно-селективной записи информации необходимо иметь ответы на два вопроса: каково время выжигания провала, и каково время его жизни. Обширный экспериментальный материал свидетельствует, что многие органические молекулы не имеют структурного оп- тического спектра. Для объяснения этого обычно высказыва ется предположение, что молекулы в аморфном теле или же в твердом растворе располагаются в произвольных ориентаци ях, что приводит к различным по величине взаимодействиям с окружением. В результате, частоты электронно-колебательных переходов несколько сдвигаются по сравнению с молекулой, не взаимодействующей с окружением. Этим переходам отвеча- ют узкие однородно-уширенные полосы Го- Всей совокупности молекул отвечает широкая неоднородно-уширенная полоса Г„ (рис. 3.33, а), в которой накладываются индивидуальные полосы конкретных молекул. В каждой неоднородно-уширенной полосе можно выделить 102-103 компонент. Их использование для за- писи информации дает возможность довести плотность записи до 109-10* бит/см2. Каждому электронно-колебательному состоянию молекулы будет соответствовать полоса, которую можно представить в вид< суммы двух членов: 7(ш) = 7(ш) + Ф(ш), где функция J(w), имеющая вид острого пика, описывает бес фононную линию, которая отвечает непосредственно колебаниям атомов молекулы. Функция Ф(ш) описывает фононное крыло, со провождающее бесфононную линию. Оно возникает вследствие коллективных молекулярных колебаний в твердом теле. Пуси широкая полоса в спектре химического соединения являете я результатом наложения бесфононных линий, отвечающих pa е
3.4. Запоминающие устройства 107 личным локальным условиям для отдельных молекул в матрице. Это возможно, когда молекула обладает спектром, состоящим из бесфононной линии и слабого фононного крыла. Именно в этом случае можно выжечь монохроматическим лазерным излучением провал в полосе поглощения. Это явление возникает благодаря высокой интенсивности бесфононной линии, если после поглощения света имеется ненулевая вероятность того, что с молекулой что-либо произойдет и она не вернется точно в исходное состояние. Независимо от конкретной приро- ды фотопревращения необходимо, чтобы энергетический переход либо вообще исчезал, либо в спектре фотопродукта имел место сдвиг, превышающий однородную ширину исходного перехода (рис. 3.33, б). Дополнительным условием для наблюдения эффек- та выжигания провала является требование, чтобы фотопревра- щение было необратимым в масштабе времени, необходимом для регистрации спектра. Экспериментальные опре- деления показывают, что для ряда исследованных молекул времена жизни провалов из- меряются по крайней мере часами (в темноте, при гели- евой температуре). Что каса- ется времени выжигания про- вала, то в известных в на- । юящее время эксперимен- ыльных работах оно состав- 1яет секунды или десят- ки секунд. Естественно, что ио исключает возможность и писи достаточно больших иТч.емов информации (прав- i.i, при сравнительно невысо- 1 их интенсивностях лазерно- |о излучения, используемых жспери ментальных иссле- ннтлниях). Тем не менее, бы- |о высказано предположение, •ПО I опт. Лазерная запись — считывание информации Рис. 3.34. Запоминающее устройство на основе эффекта «выжигания прова- лов» время записи информации может быть доведено до 30 нс на В 80-х годах прошлого века в Исследовательской лаборато- Н1Н компании IBM в Сан Йозе (Калифорния, США) проводились > < исриментальные исследования и технические и материале-
108 Гл. 3. Молекулярная элементная база вычислительных устройств ведческие оценки возможности создания памяти сверхбольшой емкости на эффекте «выжигания провалов» (рис. 3.34). Рассмат- ривался вариант, в котором чипы размером 1 см2 с плотностью записи 106 бит/см2 группировались в подсистемы, содержащие 16-64 чипов (общая емкость 2-8 Гб). В свою очередь от 50 до 1000 подсистем образовывали память емкостью до 8 Тб. Предполагалось использовать кристалл фторида натрия с центрами окраски, в котором в полосе с максимумом 575 нм и шириной 100 ГГц (~ 0,1 нм) можно выжигать провалы шири- ной 50 МГц. Позже была опубликована информация о том, что обнаружена новая группа материалов для частотно-селективной записи информации — кристаллы фторидов щелочных элементов, в которые введены ионы редкоземельных элементов и специаль- ные стекла на основе одной из борных кислот, с внедренными молекулами карбазола. При этом носители информации должны были находиться при температуре жидкого гелия. В ходе исследований было показано, что нет технических ограничений, препятствующих созданию такой системы, обладавшей в те годы рекордными характеристиками. Однако эксплуатационные характеристики этого устройства были неудовлетворительны. Прежде всего — это гелиевые температуры, необходимые для хранения информации. Кроме того скорость записи-считывания информации не отвечала требованиям даже того времени. При максимальной скорости записи одного провала 30нс объем информации в 1 Гб записывается 30 с. Тем не менее, сама идея частотно-селективной записи инфор мации не утратила своей привлекательности до сих пор. Активно ведутся поиски новых архитектур памяти и новых материалов, которые смогут в будущем создавать запоминающие устройства гигантской емкости. 3.5. Молекулярная память: надежды разработчиков или реальность? Вернемся к молекулам, в которых переключение из одного устойчивого состояния в другое происходит за счет электронно конформационного перехода. Понимание того, что именно они могут оказаться перспективными элементами электронных схем, возникло еще в 80-90-е гг. прошлого века как результат бурного развития теоретических основ молекулярной электроники. Оста валось сделать, практически, последний шаг - найти конкретные
3.5. Молекулярная память 109 молекулы этого типа, которые оправдали бы ожидания теорети- ков. Возможности синтетических методов органической химии резко возросли во второй половине прошлого века. Развитие теории химического строения на основе квантово-химических представлений, резко возросшие технические возможности как синтеза новых соединений, так и установления их строения — все это вместе взятое позволило осуществить синтез ряда мо- лекул, о которых химики-синтетики мечтали на протяжении де- сятилетий. Среди них были молекулы, построенные из продетых друг в друга циклов, т. е. соединения циклических фрагментов, которые связаны подобно звеньям цепи (рис. 3.35). В основу их названия — катенаны, было заложено латинское слово catena (цепь). Близкими к катенанам по структурным особенностям являются ротаксаны. Это химические соединения, в которых циклическую группировку (или группировки) пронизывает ли- нейная цепочка молекулярных фрагментов. Объемные молеку- шрные группы на концах цепочки исключают развал молекулы и счет ухода циклического фрагмента с цепи. Подобные струк- |уры, построенные по принципу чисто механического соединения фрагментов, получили название молекул «без химической связи». Катенаны Псевдоротаксан Ротаксаны Рис. 3.35. Принципы структуры катенанов и ротаксанов Трудности синтеза таких молекул, как это легко представить, пыли велики. И только в начале 80-х гг. прошлого века груп- и.। французских химиков-синтетиков предложила принципиально новые пути синтеза. Не останавливаясь на деталях, отметим Юльке, что в основе синтеза лежала идея самоорганизации ||>уктуры молекулы и аналогии с биологическими принципами ни геза больших молекул. Именно эти молекулы катенанов и ротаксанов оказались । ноной прорыва в создании молекулярных электронных схем, |н» вошедшего на границе прошлого и начала нашего ве- пн Произошел он по инициативе известной американской чми.шии “Hewlett-Packard” и Калифорнийского университета Чос-Анжелесе.
110 Гл. 3. Молекулярная элементная база вычислительных устройств Компания “Hewlett-Packard” на протяжении последних деся- тилетий проявляла интерес к разработкам в области молекуляр- ных технологий. Этот интерес резко усилился в конце 90-х гг., в особенности после того, как сотрудник исследовательской ла- боратории компании физик Стан Уильямс организовал группу из 15 человек, которые занимались только проблемами молекуляр- ных переключающихся элементов. Уильямс говорил в одном из своих интервью: «Я хотел бы сказать, что пусть кто-нибудь другой, работаю- щий в этой области, говорит «Давайте делать диоды и транзисто- ры». Вместо того, чтобы переизобретать кремниевую электрони- ку на уровне отдельных элементов, мы пойдем в атаку на более высоком уровне. То, что мы хотим, должно выглядеть как полно- стью интегрированное устройство». Компания “Hewlett-Packard” начала работу в области молекулярной элементной базы в тес- ном сотрудничестве с химиками Калифорнийского университе- та в Лос-Анжелесе Фрэзером Стоддартом и Джеймсом Хитом В это время они изучали возможности использования молекул катенанов для создания молекулярного переключателя. Они вы брали молекулу, которая была комбинацией циклической молеку- лы циклофана (рис. 3.36), в которой содержатся две бипиридино вые группировки, зацепленной за сложную молекулу краунэфи ра. Краунэфиры — это хорошо известные циклические неплоские молекулы, в центральную полость которых могут встраиваться другие, сравнительно небольшие атомные фрагменты. В частно сти, краунэфиры хорошо удерживают ионы металлов, что широко используется на практике. В краунэфир, использованный для формирования молекулы катенана, встроены на противополож ных сторонах кольца крауна тетрафульваленовая группировка и диоксинеафталиновый фрагмент. Таким образом, молекула ка тенана представляет собой зацепленные циклические фрагменты один из которых содержит донор электронов — тетратиофульва лен, а второй — циклофановое кольцо с акцептором электроноп (бипиридином). Переход электрона от донора к акцептору при водит к кулоновскому отталкиванию фрагментов колец и моле кула претерпевает конформационную перестройку, в результат которой увеличивается расстояние между заряженными групп» ровками. Процесс конформационной перестройки становится более по нятным, если обратиться к объемной структурной модели моле кулы катенана (рис. 3.36). Ее компактность и сильная нежесг кость краунэфирного кольца должны значительно облегчать это1 процесс.
3.5. Молекулярная память 111 Рис. 3.36. Основные состояния молекул катенанов Управляющий Рис. 3.37. Переключающийся элемент на основе молекулы катенана 1 1а основе рассмотренной молекулы катенана был создан к рсключатель электрического тока. Молекула была помещена к ну поликристаллическим слоем кремния n-типа и металличе-
112 Гл. 3. Молекулярная элементная база вычислительных устройств Рис. 3.38. Молекулы ротаксанов ским электродом. Переключатель открывался при приложенном потенциале 2 В, закрывался при —2 В, его состояние можно было считывать при 0,1 В (рис. 3.37). В конце 90-х гг. группа “Hewlett-Packard” - Калифорнийскип университет поставила перед собой задачу разработать действу ющую модель молекулярного запоминающего устройства бол, шой емкости. В качестве молекулярного запоминающего элемен та была выбрана молекула [2] ротаксана R (рис. 3.38).
3.5. Молекулярная память 113 Ti/Pt Поликристаллический кремний и-типа Рис. 3.39. Переключающийся элемент на основе молекулы ротаксана Молекула типичного ротаксана представляет собой поли- и|)ирную цепочку, на которую, как бусинка на струну, насажен циклический молекулярный фрагмент. Этот фрагмент, в который истроены электроноакцепторные группировки, может передви- । иться вдоль цепи. Для того, чтобы циклический фрагмент не соскочил бы при внешнем воздействии с цепи, на ее концах имеются объемные молекулярные группировки — стопперы. Осо- бенность цепочки состоит в том, что в нее включены электроно- юнорные группы. За счет их взаимодействия с электроноакцеп- шрными группами циклического фрагмента в молекуле ротак- ша возникают преимущественные конформации. Это взаимное расположение цикла и цепи, которым отвечают минимумы потен- циальной энергии системы. Замечательным свойством молекул ротаксанов является то, что переходами из одной конформации • крутую можно управлять как химическими (протонирование руипировок), так и электрическими (передача электрона) сти- г.лами. В молекуле [2] ротаксана R, выбранной группой I lewlett-Packard” - Калифорнийский университет, в основную ш. встроена электронодонорная группировка — тетратиофуль- ।ш'п, а в передвигающийся по цепи цикл — электроноакцеп- ||>пая тетракатионная азотная группа. Конформационная пере- рупнировка молекулы происходит, когда донор теряет электрон (piii 3.39). В результате этого возникает электростатическое । ипкивание цикла от донорной группировки с последующей
114 Гл. 3 Молекулярная элементная база вычислительных устройств Рис. 3.40. Принципиальная схема формирования молекулярных слоев методом Ленгмюра-Блоджетт: а — амфифильные молекулы на поверхности воды, б — сжатие пленки амфифильных молекул, в — перенос пленки на носитель перестройкой структуры молекулы ротаксана. Особенностью этой молекулы является ее амфифильный характер. Этот термин подразумевает, что молекула представляет со бой длинную молекулярную цепочку, обладающую ярко выра- женными гидрофобными свойствами. Но на одном из концов этой цепочки имеется гидрофильная группа. Эта специфическая структура амфифильных молекул лежит в основе формирования структурно-упорядоченных мономолекулярных пленок методом Лен гм юра-Блоджетт. В этом методе раствор амфифильного соединения выливается на поверхность воды в устройстве, которое называют ваннов Ленгмюра-Блоджетт (рис. 3.40). Молекулы в силу гидрофобно сти цепочек располагаются на поверхности воды произвольным образом, но при этом концевые гидрофильные группировки ак тивно взаимодействуют с водой. По поверхности воды передви гается так называемый поршень, который сжимает пленку. При этом гидрофильные группировки остаются в воде, а гид рофобные «хвосты» выстраиваются перпендикулярно поверхно сти воды. Если в сжимаемую пленку ввести твердую подлож ку, которая извлекается из ванны по мере сжатия пленки, n.i подложку переходит мономолекулярный слой амфифильного вс
3.5. Молекулярная память 115 Рис. 3.41. Переключение молекулы ротаксана электрическим потенциалом шества. Повторяя этот процесс многократно, можно получать и мультимолекулярные слои. Электрические характеристики мономолекулярных пленок [2] ротаксана R, измеренные в ходе работы, показали, что вы- бранная молекула переключается из одного состояния в другое и счет приложенного к пленке напряжения в области —2 В... I 2 В (рис. 3.41).Для формирования запоминающего устрой- 11 на на основе молекул [2] ротаксана R была использована (шкальная техника, основанная на технологическом принципе < низу-вверх». В основу этой техники были заложены: • так называемая перекрестная (crossbar) архитектура запо- минающего устройства, • импринт-литография, позволяющая формировать на по- верхности подложки элементы нанометровых размеров, • метод Ленгмюра-Блоджетт для формирования мономолеку- лярных пленок ориентированных молекул [2] ротаксана R. Нижние Верхние слой Рис. 3.42 «Перекрестная» архитектура запоминающего устройства
116 Гл. 3. Молекулярная элементная база вычислительных устройств - Штамп - Резист Подложка Рис. 3.43. Принципиальная схема импринт-литографии Перекрестная архитектура (рис. 3.42) представляет собой два набора линейных электродов, расположенных перпендикулярно друг другу. Между ними находятся молекулы ротаксана. Таким образом, г, j-й запоминающий элемент — это совокупность мо лекул между г-м и j-м электродом. Совокупность электродов на носится на поверхность подложки методом импринт-литографии (рис. 3.43). Для этого на подложку наносится тонкий слой по лимера, в котором твердым штампом выдавливается систем.) канавок для формируемых электродов. После удаления штамп.) и остатков полимера напыляется металл, заполняющий канавки На заключительном этапе с подложки снимается слой полимера Для сборки запоминающего устройства на подложку с сфор мированной совокупностью электродов наносилась мономолеку лярная пленка ротаксана, а на ней размещалась вторая подложка с электродами, перпендикулярными электродам первой совокуи ности (рис. 3.44). В целом, результаты, полученные группой “Hewlel! Packard”-Калифорнийский университет, точно сформулироваа один из участников работы Ионг Чен: «... сформирован базовын элемент устройства — Р1/молекулы/Т1, который действует юн переключающееся устройство. На основе 64 переключателей были сформированы перекрестные 8х8-модули памяти. Были также продемонстрированы схемы управления памятью на основ) сформированных модулей». Естественно, что выполненную работу ее участники рассма, ривают только как начало сложных научных и технологии ских исследований, которые должны привести к промышленному
3 5. Молекулярная память 117 1'ис 3.44. Схема формирования молекулярного устройства на основе ротаксана: ч г — последовательные этапы формирования переключающегося элемента роизводству принципиально новых цифровых вычислительных ,i тройств. Естественный интерес вызывают в связи с этим оцен- 1 и самих разработчиков, то, как они представляют себе будущее чих устройств. В 1996 г., сразу же после публикации первых результатов, руководитель группы Калифорнийского университета Джеймс \пт в одном из интервью рассказывал о выясненных в ре- ультате выполненных работ особенностях молекулярных схем. 1 hi обратил прежде всего внимание на то, что молекулярные м мы выполняют те же самые функции, что и кремниевые, но ап много раз лучше. Прежде всего они намного миниатюрнее, рошводительнее (быстрее) и дешевле. Более того, в молеку- 1рпых схемах отсутствуют технологические дефекты, которые чпчяются существенной проблемой при производстве полупро- шиковых интегральных схем. В особенности Хит подчеркивал, ни шергопотребление молекулярных схем на порядки меньше, м полупроводниковых. 11есмотря на то, что остается достаточное количество слож- •ы\ проблем, таких как оптимальная архитектура огромных и i инов молекулярных элементов, Хит убежден, что первые ниотипы молекулярных логических схем и схем памяти по- чин я через несколько лет. По его мнению, в конце первого । чгнлетия появится и первый гибридный компьютер, в котором игнчкие элементы и элементы памяти будут молекулярными.
118 Гл. 3. Молекулярная элементная база вычислительных устройств 3.6. И еще одна попытка — хироптицен Но может ли все-таки отдельная молекула использоваться как переключающийся элемент в интегральных схемах? В марте 1997 г. была создана Калифорнийская молекулярно электронная корпорация (California Molecular Electronics Cor- poration, CALMEC). Основателями корпорации были ведущие ученые в области разработки переключающихся и проводящих молекул: Майкл Кава, Роберт Метцгер, Джозеф Михл, Чад Миркин, Марк Ратнер, Роберт Шумейкер и Фред Вудл. Прези дентом корпорации стал Джеймс Марек, обладающий большим опытом инженерной и организационной работы в крупных элек тронных компаниях. Основной целью корпорации, как отмечал Марек в своем ин тервью компьютерному журналу “Nanomagazine” является про верка концепций построения молекулярных устройств обработки информации, создание прототипов устройств с их последующим лицензированием и коммерциализацией с помощью других ком паний. Организовывать у себя или же у выбранных партнеров производство молекулярных объектов, которые являются ком мерческим лицом корпорации, оставаясь их ведущим распростри нителем. Исходным «ноу-хау» корпорации было создание «хироптицс на» — переключающейся молекулы, структура которой вобрали в себя бесценный опыт инициаторов организации корпорации и которая обладает классическими переключающимся свойства ми. Схема структуры этой молекулы (точная структура является коммерческой тайной корпорации) показана на рис. 3.45. Эта он тически активная молекула была не найдена, а придумана. Ее дни оптических изомера — два устойчивых состояния молекулы С — атом углерода S — атом серы N — атом азота R— заменитель (коммерческая тайна) Ch — хромофор А— анион (произвольный) Рис. 3.45. Молекула хироптицена
3.6. И еще одна попытка — хироптицен 119 Рис. 3.46. Схема внутримолекулярных переходов в молекуле хироптицена имеют противоположно направленные дипольные моменты. Это и дает возможность использовать для переключения электриче- ские сигналы. Барьер между конформациями достаточно велик, иля того чтобы исключить самопроизвольные переключения, вы- шивные случайными флюктуациями, но при этом затрудняется переключение электрическим сигналом. Поэтому в структуру молекулы введена светочувствительная группировка, а характе- ристики молекулярной системы выбраны таким образом, чтобы шергетический барьер между конформациями молекулы в ее возбужденном состоянии был бы значительно меньше, чем в ос- новном (рис. 3.46). Таким образом, необходимое переключение молекулы производится одновременным воздействием светового и (лучения и электрического поля. Полоса поглощения светочув- иштельной группировки, структура которой является коммерче- кой тайной, совпадает с длиной волны излучения He-Ne-лазера. При такой схеме время переключения лежит в фемтосекундном п.шазоне и хироптицен является быстрым переключающимся 1'к'ментом. Корпорацией (точнее, Робертом Шумейкером при поддержке корпорации) было получено два патента: один определяющий • |(>уктуру молекулы хироптицена, другой — технологию фор- мирования трехмерных систем на основе этих молекул. В тех- нологии используются современные химические методы форми- юп.шия молекулярных сред, включая технологию Ленгмюра- |оюджетт. Джеймс Марек определяет перспективы использования хи- ||о|цццена, как возможность создавать устройства памяти емко- U.IO порядка 16 Тбит в объеме одного кубического дюйма. Это чшблизительно два триллиона единиц данных. Согласно Маре-
120 Гл. 3. Молекулярная элементная база вычислительных устройств ку разработанная молекулярная память хранит в одном и том же объеме в 34 раза большую информацию, чем современная полупроводниковая память. Конструкция устройства памяти да- ет возможность параллельной записи-считывания данных. Она позволяет считывать миллион бит информации за одно считы вание с 2000 считываний в секунду, т. е. достигать скорости считывания-записи порядка 2 Гбит в секунду. Удивительные успехи разработчиков как хироптицена, так и памяти на основе ротаксана представляют собой «высший пилотаж» современных технологий. Но потребуется еще немало времени и сил, пока эти устройства окажутся на прилавке.
Глава 4 ХИМИЧЕСКИЕ РЕАКЦИОННО-ДИФФУЗИОННЫЕ СРЕДЫ И ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ Поистине поразительно, как много разнообраз- нейших явлений описывает реакционно-диффу- зионное уравнение И. Пригожин. От существующего к взникающе- му 4.1. Информационные потребности постиндустриального общества и парадигма фон Неймана В начале 40-х гг. прошлого века человечество столкнулось необходимостью решения грандиозных технических и техно- югических проблем, которые были связаны с колоссальными ioревностями в вычислениях. Предложенная в эти годы Джо- ||iM фон Нейманом парадигма, которая была заложена в основу шструирования цифровых ЭВМ, позволила создать эффектив- । io вычислительные средства для решения наиболее насущных пженерных задач и успешно совершенствовать их до насте- нного времени. В основе успеха парадигмы фон Неймана ле- |..1ло то, что она оказалась пригодной для решения массовых (целительных задач, к которым сводились наиболее важные инженерные проблемы. Обсуждавшийся в те же сороковые го- 1.1 «человекоподобный» стиль обработки информации — нейро- гц-вой подход МакКаллоха и Питтса, оказался, в сущности, pi ждевременным, поскольку основные направления развития (формационно-логических средств определялись в те годы ин- нерными и технологическими вычислительными задачами, ко- i|ii.ie эффективно решались цифровыми ЭВМ. 11риоритеты развития и потребности человеческого общества (снялись на протяжении второй половины прошлого века. II ппчиная с 80-90-х гг., наряду с инженерными проблемами (копится все более и более актуальным понимание динамики ' и.ших динамических систем и разработки методов управления
122 Гл. 4. Казалось бы несовместимое ими. Это широкий круг объектов, начиная с сообществ биоло гических особей (коллектив человекообразных обезьян, волчья стая, муравейник) и вплоть до физико-химических сред со слож ными нелинейными взаимодействиями компонентов. Процессы, протекающие в таких системах, играют важную роль в природе и в человеческом обществе. Они проявляются на уровне раз нообразных физических, химических и биологических объектов, и в больших транспортных системах, в сообществах людей, в частности, в виде различных экономических и социологических явлений. Их изучение позволяет понять и предотвращать эпи демические заболевания, создавать автономные средства, заме няющие человека в критических для него условиях, достоверно предсказывать погоду, регулировать экономику и социальные проблемы. Исследование механизмов функионирования больших дина мических систем и их внешних проявлений включает в себя в общем случае, решение целого ряда информационных задач таких как: • распознавание образов, сцен и ситуаций, что может быть несколько условно сведено к: - классификации объектов по заданной системе призна ков, - сегментации объекта, т. е. разделения его на совокун ность более простых фрагментов, - распознаванию фрагментов в контексте и последующе му конструированию на этой основе исходного объекы (все это играет важную роль в таких областях дея тельности, как медицина, материаловедение и т. д.), • изучение эволюции систем со сложной динамикой пот дения (например, решение задач типа «хищник-жертва» изучение эволюции биологических клеточных популяций и т. д.); • выбор оптимальной (в некотором заданном смысле) струи туры или поведения сложной многофакторной системы <<> сложным деревом целей («проблема коммивояжера», стрд тегические и тактические решения, игры); • проблемы управления, которые включают в себя: неп|» рывное распознавание ситуаций, непрерывный выбор ошв мальной стратегии (навигация автономных роботов, фуш ционирующих в сложном меняющемся окружении, и др\ гих аналогичных устройств).
4.1. Парадигма фон Неймана 123 Фундаментальная особенность больших динамических си- стем заключается в их распределенном характере. Это означает, что система представляет собой огромную совокупность простей- ших (для этой системы) элементов, взаимодействующих друг с другом. На уровне человеческого общества такой элемент — это отдельная личность в толпе, в физико-химичесих реакционных средах — отдельные молекулярные компоненты протекающих в системе реакций. Но, независимо от уровня сложности поведе- ния отдельного элемента, для распределенной системы характер- ны общие структурные и поведенческие особенности. Процессы в распределенной системе (среде) протекают од- новременно в каждой ее точке. Иными словами, для нее ха- рактерен высокий (точнее гигантский по сравнению, например, i современными параллельными цифровыми ЭВМ) параллелизм иыполняемых системой действий. В большом числе распределенных систем проявляются нели- нейные взаимодействия между отдельными элементами системы, 'го приводит к тому, что поведение системы в целом оказы- вается намного более сложным, чем поведение ее отдельного пимента. Простым, но впечатляющим примером, часто исполь- <уемым в последние годы, может служить деятельность сооб- щества муравьев. Одна из основных функций сообщества — поиск и доставка в муравейник пищи. Элементарные действия ндельной особи просты: случайный поиск, выделение специ- ии.ных химических веществ — феромонов, когда особь нашла н несет в муравейник пищу и направленное следование по запаху феромона. Эти простые механизмы обеспечивают запоминание троги к случайно найденной пище, привлечение других особей и ному процессу, оптимизацию путей доставки и т.д. При этом |рактерной особенностью распределенных систем с нелиней- ными взаимодействиями элементов является то, что поведение иг гемы в целом оказывается значительно сложнее поведения ее (дельного элемента. Более того, оно не выводится прямым об- । ЮМ из поведения элемента. Так, например, оптимизация путей к’дования муравьев при доставке пищи в муравейник сложным ш инным образом зависит от механизмов поведения отдельного муравья. Этот эффект, который принято называть возникающими х.ншзмами (emerging mechanisms в англоязычной литературе), пк-г подробнее рассмотрен ниже. Для распределенных систем характерно многоуровневое >чкционирование. В том же сообществе муравьев существует poioe дифференцирование особей по выполняемым действи- । поиск пищи, защита от врагов и т. д. Эта дифференциация
124 Гл. 4. Казалось бы несовместимое существенно повышает эффективность функционирования системы по отношению к основной цели — выживанию в сложной, опасной для системы, меняющейся во времени окружающей среде. Решение информационных задач, необходимых для понима ния процессов, происходящих в больших динамических систс мах, и управления ими, оказалось, в общем случае, камнем преткновения для цифровых вычислительных машин с архи тектурой фон Неймана. Причина этого заключается в высокой вычислительной сложности этих задач. При увеличении разме ра задачи (требуемой точности вычислений, размерности базиса и т. д.) резко, во многих случаях экспоненциально, растут ресур сы, необходимые для ее решения, т. е. необходимое число тактов ЭВМ или же количество ячеек памяти. Впечатляющим примером может служить известная «задача коммивояжера» (рис. 4.1). Рис. 4.1. «Задача коммивояжера» Пусть имеется некоторо! количество городов, кото рые необходимо посетить Если наложить при этом ограничения — в каждом городе можно побывяи только один раз и вы бранный маршрут должен быть кратчайшим из всех возможных, определен и, такого маршрута и составляет задачу коммивояжера. Выделим среди городов начальную и конечную точки маршрута — 7V((i) и TV(max). Исходный простейший путь можно записать к.и. N(fi) — I — 2 — ... — N — TV(max). Нетрудно видеть, что числи всех возможных путей будет составлять 7V!. Пусть задач.! решается перебором, т. е. сравнением длин каждого пути. В этом случае, если N — 4, нужно сравнивать 24 маршрута. Если я» увеличить число городов всего лишь до 10, число маршрут! превращается в фантастическую величину 3628800. Немного подробностей: структурная, поведенческая, вычислителыы. сложность Окружающий нас мир сложен. И это — реальность, определяющая или понимание явлений, с которыми приходится сталкиваться каждый день. < >п проявляются в самых различных областях человеческой деятельности, и.ни мая с отдельных, казалось бы, простых инженерных задач и до изощренно' экономических и социальных проблем. Стаффорд Бир, бывший Президент Общества по Исследованию Болыш Систем США, рассматривал сложность как неотъемлемое свойство и;.....
4.1. Парадигма фон Неймана 125 мира. Он утверждал: «Существует реальный мир, который можно наблюдать и мерить, и реальность, в которой мертвец — это мертвый человек, а не объект статистики. Существует также и та реальность, с которой мы имеем дело повседневно. Она не разложена по полочкам и не снабжена для соответствую- щих принимающих решения чиновников ярлычками. Сутью такой реальности является сложность». Среди многочисленных аспектов сложности окружающего нас мира мож- но выделить три основных понятия, которые являются фундаментальными л концепции сложности. Определяя их, известный американский математик Дж. Каста считал, что: «Статическая сложность описывает формирование си- стемы из ее составляющих подсистем, динамическая сложность основана на вычислительной длине, которая требуется для описания поведения системы, ложность управления представляет собой меру вычислительных ресурсов, необходимых для детального расчета особенностей динамики системы». Сохраняя сущность этих определений, введем в дальнейшем несколько отличную терминологию, в большей степени принятую сегодня для описания физических, химических и биологических систем. Будем использовать понятия: • структурная сложность системы (статическая), • поведенческая сложность (динамическая), которая определяет пространственно-временную эволюцию системы, выполняющей операции обработки информации, • вычислительная сложность алгоритма (сложность управления), описы- вающего выполняемые операции обработки информации. Большой вклад в концепцию сложности внес академик А. Н. Колмогоров, м>горый создал основы ее количественного описания. Введенное им понятие гпоритмической сложности оказывается, по-видимому, наиболее адекватным •писанию эволюции динамических систем. Пусть имеется некоторая система, которая преобразует информацию на \оде в систему х € X в информацию на ее выходе у € ¥ по заданной программе р. Здесь X и ¥ — множества значений х и у. Структура системы иределяется как описание ее аппаратурных характеристик, т. е. некоторой \ нкцией <р(р/х) = у, которая может быть использована программой р. Суще- иенно, что это описание не зависит от выбора входных данных. Алгоритмическая сложность процесса, который протекает в системе, име- • iu-й структуру <р(р/х) = у, т. е. поведенческая сложность системы, опреде- гея как минимальная длинна программы 1(р) из множества программ S, |<>рые адекватно описывают процесс: rz = Г minZ(p) : <р(р/х) = у, <АУ/ ) у оо р Е S <р(р/х) у. • идя из определения структуры системы, можно ввести также определение » |руктурной сложности, как сложности К(х/у) при фиксированных значе- " \ .г = xq: К (п./тп} = J min : = Уо, v(yo/ о) I со :\/р е S <р(р/хо) уо- числительная сложность алгоритма, описывающего поведение системы ./кность проблемы), характеризует практическую возможность понять де- .но поведение системы. Она может быть сведена к зависимости вычисли- .ных возможностей (ресурсов вычислительной системы), необходимых для шрования поведения системы, от специфической характеристики зада- размера проблемы.
126 Гл. 4. Казалось бы несовместимое Различные варианты функций, характеризующих вычислительную слож- ность (так называемых сигнализирующих функций), используются для ее количественной оценки. Наиболее употребительны для этой цели временная и пространственная функции. Временная функция имеет вид ^л(п) ~ max 4д(гс). |i|=n Здесь 4д(ж) — число шагов программы, реализующей алгоритм А для решения индивидуальной проблемы х, размер которой определяется длиной слова |з| равной п. Пространственная функция может быть представлена в виде 5л(п) = max Sa(x), |ас|=п где Sa(x) — число ячеек памяти, необходимое для решения проблемы А. Алгоритм решения массовой проблемы называют полиномиальным, если сигнализирующая функция полиномиально зависит от размера задачи. Если же сигнализирующая функция экспоненциально зависит от размера, то проблема определяется как труднорешаемая. В настоящее время широко используется детальная классификация труднорешаемых проблем (NP, NP-полные и т. д.) Говоря о структурной и поведенческой сложности системы обработки информации и вычислительной сложности решаемых этой системой задач следует подчеркнуть особенности используемой концепции. К сожалению, в на стоящее время не удается установить достаточно строгой корреляции между этими характеристиками. Так, нередко считают (в основном в связи с практикой создания радиотех нических устройств), что повышение сложности структуры устройства ведет к усложнению его поведения. Тем не менее, сегодня известно большое число объектов, в которых простая структура сосуществует с очень сложным повед< нием. Наиболее известный пример — задача Хенона, описывающая динамику двух гармонических осцилляторов с нелинейной связью. Эта, казалось бы простая система, демонстрирует большую совокупность различных режимов, начиная с тривиальных гармонических колебаний и кончая состоянием хаоса Еще более неопределенной оказывается связь между вычислительны! сложностью задач и структурой используемого для ее решения устройства что в особенности важно для конструирования вычислительных средств, оптп мально решающих задачи высокой вычислительной сложности. По-видимому, одна из наиболее перспективных возможностей найти кон структивные принципы создания этих устройств — эвристические подходы В частности, можно исходить из того, что способностью эффективно выпал нять операции высокой вычислительной сложности обладают системы с вьк< кой сложностью поведения. Поэтому проблема конструирования эффективны устройств для решения задач высокой вычислительной сложности переходи в проблему поиска принципов построения систем, в которых проявляется вы сокая поведенческая сложность. Исходя из основных факторов, определяющих функционирование распределенных систем, в качестве этих принципов можп выбрать следующие: • распределенный характер системы, определяющий высокий параллели t процессов в системе, • сложность ее динамики, которая приводит к логически сложному ju кальному поведению, • многоуровневую архитектуру системы.
4.2. Вычислительная техника и задачи искусственного интеллекта 127 Ниже будет сделана попытка показать, что последовательное использо- вание этих принципов при конструировании средств обработки информации приводит к новой системе представлений, принципиально отличной от парадиг- мы фон Неймана и оптимальной для решения задач высокой вычислительной сложности. 4.2. Вычислительная техника и задачи искусственного интеллекта Современная цифровая вычислительная техника, принципы обработки информации и информационные технологии карди- нально изменили окружающий нас мир. И, как следствие, гос- подствующая фон-неймановская парадигма построения средств обработки информации казалась во второй половине прошло- 1о века если не единственно возможной, то, по крайней мере, наиболее оптимальной. Явно или неявно подразумевалось, что прогресс полупроводниковой технологии, в сочетании с новыми физическими идеями, приведет к дальнейшему росту производи- и'льности цифровых (в сущности, фон-неймановских) устройств, которые смогут решать все или почти все насущные инфор- мационные задачи. Тем не менее, все возрастающее значение информационного обеспечения больших динамических систем i ущественно пошатнули это во многом общепринятое мнение. В 80-х гг. прошлого века известный американский киберне- шк Майкл Арбиб высказал свое убеждение в том, что даль- ш'пшее развитие концепций вычислений пойдет по пути имита- ции стиля обработки информации человеческим мозгом. «Мозг шляется метафорой следующего (шестого) поколения компьюте- ров» — писал он — «Его стиль определяется взаимодействием иг тем, многие из которых отвечают совместному функциониро- п.инпо пространственно-временных структур в многоуровневых (руктурах нейронов». (Основа понимания важности этого подхода, как отмечал Ар- •iifi заключается в следующем: «Мозг является ориентированным на действие вычислителем, но подразумевает, что такие системы (человека, животного । in управляемого робота) должны коррелировать само действие io результат так, чтобы построить внутреннюю «модель» яв- 1’ИНЯ. Мозг имеет иерархическую многоуровневую организацию, lb ключительно важно то, что ни одна одноуровневая модель не гобна воспроизвести его функции.
128 Гл. 4. Казалось бы несовместимое Мозг не является системой обработки информации с после- довательным выполнением операций». В конце 90-х гг. прошлого века Г. Моравек опубликовал прогноз развития вычислительной техники, названный им «Ко гда действующие компьютеры сравняются с человеческим моз гом?». Исходя из числа нейронов головного мозга и числа си напсов (1011 и 1014 соответственно) и базируясь на анализе возможностей игры в шахматы «человек-машина», он пришел к выводу о том, что производительность цифрового компьютера ~ 108 MIPS, будет достаточна для имитации функций головного мозга человека. По его оценке подобные вычислительные систе- мы должны появиться в первой половине нашего века, не ранее 2020 г. В этой статье было обращено внимание на три особенности современных средств обработки информации, важные для пони мания рассматриваемой проблемы. Прежде всего, практически все обсуждение путей развития цифровой техники рассматривается в связи с решением Интел лектуальных задач (проблем искусственного интеллекта). Дей ствительно, это направление приобрело исключительную важ ность на протяжении последних десятилетий в связи необходи мостью понимать и эффективно управлять большими динамичс скими системами. Среди насущных задач, как отмечалось выше, оказались экономические и социальные проблемы, управленш транспортными потоками, глобальная связь, предсказание пого ды, оценка загрязнения окружающей среды и целый ряд других не менее важных аспектов деятельности современного общества Практически все эти задачи более эффективно решаются человс ком, чем современными цифровыми ЭВМ, и могут быть отнесены к проблемам искусственного интеллекта. Кроме того, Моравек отмечает, что некоторые пользователи суперкомпьютеров, включая Г. Каспарова, «чувствуют» зачатки интеллекта ЭВМ. Но это скорее можно отнести к самовнуню нию. Сами конструкторы “Deep Blue” — ЭВМ, игравшей с Kacn.i ровым, отрицают машинный интеллект, считая, что это «тольм большая база данных по дебютам и эндшпилям, включеншл и углубленные функции, которые предлагаются шахматными гроссмейстерами, и, в особенности, высокая производительноеп позволяющая просматривать текущую ситуацию на 14 ходси вперед». Третье существенное замечание заключается в том, что цнф ровой компьютер, близкий по своим возможностям к человек скому мозгу, будет представлять собой сложнейшую систему
1.3. Биологически инспирированные средства обработки информации 129 требующую грандиозных затрат на ее создание и эксплуатацию. Поэтому создаваемые ЭВМ принципиально проигрывают челове- ку в эффективности, простоте и затратам на решение интеллек- туальных проблем. В целом, решение задач высокой вычислительной сложности, к которым в основном сводятся проблемы искусственного интел- лекта приводит к многократному росту вычислительных ресур- сов, необходимых для их решения и вынуждает разработчиков вычислительных средств все более и более наращивать объем памяти и скорость выполнения элементарных операций. Тем не менее, решение этих задач современными цифровыми ЭВМ пказывается мало эффективным, а нередко и полностью невоз- можным. Альтернативой этой гонки «вычислительная сложность идачи — производительность ЭВМ» явилось в конце прошлого in ка дальнейшее развитие идей МакКаллоха и Питтса. 4.3, Биологически инспирированные средства обработки информации: нейронные сети и нейрокомпьютеры В 1943 г. МакКаллох и Питтс, основываясь на известных к тому времени данных о структуре коры головного мозга, пред- южили нейросетевой подход к обработке информации. К тому времени было уже известно, что кора головного мозга представляет собой сложную систему соединенных друг с дру- гом нервных клеток — нейронную сеть (рис. 4.2, а). У каждого нейрона есть ответвления — дендриты, по которым в нейрон осгупают сигналы от других нейронов. Они алгебраически (т. е. учетом знака пришедшего сигнала) суммируются и, если эта у мма превышает некоторое предельное значение, нейрон пере- мет по выходному ответвлению (аксону) сигнал, который дохо- |||I, в принципе до всех остальных сигналов сети. Сигналы на <>де каждого нейрона регулируются группировками клеток — нпапсами. Именно они определяют структуру нейронной сети, <- характер соединения нейронов. А это, в свою очередь, опре- || лист, какую конкретно задачу решает кора головного мозга. 1 ипапсы играют основную роль в процессах обучения. Их число •< распределение значительно меняется с рождения ребенка по ре его становления. Модель нейронной сети МакКаллоха и Питтса описывает • упрощенном виде структуру коры головного мозга. Нейрон- ш сеть представляет собой систему элементарных процессо- формальных нейронов (рис.рис. 4.2, б и в). Каждый из п I Рамбиди
130 Гл. 4. Казалось бы несовместимое Рис. 4.2. Природные (а) и «формальные» (6, в) нейронные сети них получает положительный или отрицательный сигнал oi всех нейронов сети с некоторыми варьируемыми весами, ими тирующими синаптические соединения. Нейрон алгебраически суммирует эти сигналы и, если их сумма превышает задании' пороговое значение, генерирует импульс, распространяющийся по сети. Исходное состояние сети задается варьируемыми вс сами. Их набор определяет структуру решаемой сетью задачи После того, как начальное состояние сети задано, структура сети эволюционирует во времени и ее конечное состояние является решением выбранной задачи. Замечательное свойство нейронной сети заключается в том, что обработка информации осущесш ляется одновременно всеми нейронами сети, т. е. с грандиозным параллелизмом, не идущим в сравнение с степенью параллели i ма даже современных полупроводниковых многопроцессорпы ЭВМ. В отличие от фон-неймановского компьютера, переход ot решения сетью одной задачи к другой определяется не вводимое программой, а начальными состояниями нейронов и структуро! сети — заданием системы весов, с которыми сигналы каждон» нейрона передаются по сети.
1.3. Биологически инспирированные средства обработки информации 131 Крупный шаг в развитии представлений о нейронных сетях < делал в 1962 г. американский нейрофизиолог Френк Розенблатт. Им была предложена структура произвольной нейронной сети, названная персептроном, которая была основана на трех типах нейронов (рис. 4.2, в). Сенсорные нейроны рассматривались как чувствительные элементы, которые вырабатывают и посылают нгнал в сеть под воздействием какого-либо внешнего стимула ктрического сигнала, света, звука и т. д.). Ассоциативные нейроны определялись как логические элементы, которые выда- »»г выходной сигнал, если алгебраическая сумма входных сиг- налов превышает некоторую пороговую величину. Реагирующие ейроны представляли собой элементы, получающие входной нгнал от сенсорных нейронов и формирующие управляющее ^действие во внешнем окружении. Розенблаттом было постро- ив также действующее устройство — однослойный персептрон, вгорое классифицировало поступающие сигналы в один из двух I.1CCOB. Подход Розенблатта использовался в начале 60-х гг. для объ- >и пения различных психологических и физиологических явле- ний. Но, в целом, интерес к ним вскоре существенно уменьшился и । за практической невостребованности в те годы нейросетевых и к'й. К тому же работа Розенблатта была подвергнута в 1969 г. критике Марвином Минским — основателем научного подхода к искусственному интеллекту, в книге «Персептроны», написанной им совместно с Сеймуром Пейпертом. И только почти двадцать > 1 спустя, в 1982 г., американский физик Хопфилд снова про- чил интерес к нейронным сетям, разработав названную его именем нейросетевую модель. 1 3. Нейронная сеть Хопфилда: а — структура сети, б — поверхность потенциала сети
132 Гл. 4. Казалось бы несовместимое Нейронная сеть Хопфилда представляет собой двумерный массив формальных нейронов, попарно связанных друг с другом (рис. 4.3). Каждый нейрон рассматривается как элемент с двумя возможными состояниями, которым отвечает бинарная перемен- ная s. Одно из состояний отвечает «возбужденному» нейрону (.s = 1), второе — состоянию «покоя» (s = 0). В общем случае нейрон характеризуется функцией /(«), определяющей его дина- мику. Состояние сети N нейронов в момент времени t определяется как конфигурация всех переменных Si в этот момент времени. Эволюция этого состояния в фазовом пространстве определяется взаимодействием нейронов. Нейроны связаны друг с другом си наптическими связями. Сила связи между z-м и j-м нейронами характеризуется величиной Tj. Эта матрица называется матри- цей весов (иногда ее называют матрицей долговременной памяти. Состояние нейронов в начальный момент времени называют за данием образа. Образ, заданный в сети, преобразуется ею в соответствии с определенным правилом. Но среди правил, определяющих эво люцию различных моделей сетей, одно свойство остается общим изменение состояния нейрона определяется суммарным возбуж дением, приходящим к нейрону от всех остальных в соответ ствии с синаптическими весами. В сети Хопфилда все нейроны попарно связаны. Матрица памяти Т симметрична = Tji) и имеет нулевые диагональные элементы. Функция /(s) бинарна. Нелинейное преобразование исходного образа А = {si, ...,.s/v} происходит по правилу N = fC£Ti^- J=1 Последовательное повторение этого преобразования приводит к последовательному изменению исходного образа. Это преобразование можно выполнять различным образом Можно выбрать случайно один нейрон, пересчитать его состоя ние, затем случайным образом выбрать второй нейрон и произ вести ту же операцию и т. д. Такой процесс преобразования се т и называют асинхронным. Если же преобразование сети выпил няется «тактами» одновременно для всех нейронов, то процетч называется синхронным. Динамическая эволюция модели Хопфилда, для которой Tij = Tji и Тц — 0 и преобразование образа принято синхронным
4 3. Биологически инспирированные средства обработки информации 133 соответствует уменьшению функции, которую принято называть «энергия»: К = — - TijSiSj. Локальному минимуму этой функции отвечает стационарное состояние сети. А последовательное преобразование исходного образа — движение по фазовой поверхности к точке (точнее к одной из точек) локального минимума, отвечающего решению заданной задачи (рис. 4.3). Особенности и вычислительные и информационно-логические позможности модели Хопфилда детально изучались в 80-е годы прошлого века. Более того, эта модель инициировала разработку широкого круга вариантов как однослойных, так и многослойных нейронных сетей. Но, по-видимому, наиболее важным следстви- ем быстрого развития теории нейронных сетей были начавшиеся инженерные разработки коммерческих устройств обработки ин- формации — нейрокомпьютеров. Попробуем понять, что же лежало в основе этого, какие преимущества нейронных сетей казались перспективными раз- работчикам нейрокомпьютеров. В основе нейросетевого подхода лежат биологические прин- ципы обработки информации и, прежде всего, общие принципы функционирования коры головного мозга. Поэтому можно было ожидать, что устройства, имитирующие биологические нейроны, будут воспроизводить, хотя бы частично, их особенности. Грандиозный период биологической эволюции выработал и мозге человека качества, недоступные современным цифровым компьютерам с архитектурой фон Неймана. К ним относятся: • распределенное представление информации и параллелизм вычислений, • способность к обучению и обобщениям, • адаптивность, • толерантность к ошибкам и погрешностям в структуре, Низкое энергопотребление. Приборы, построенные на биологических принципах обработ- ки информации, должны обладать этими возможностями, что будет иметь огромное значение для индустрии обработки инфор- м щии. Не пытаясь изложить в деталях историю создания ней- рокомпьютеров, подробно описанную в монографии под ред. А II. Галушкина, остановимся только на основных факторах, ха-
134 Гл. 4. Казалось бы несовместимое растеризующих это важное и быстро развивающееся направле- ние. Сегодня активно развиваются три линии разработки нейро- компьютеров. Прежде всего, это эмуляторы, т. е. системы на основе циф- ровых фон-неймановских компьютеров, реализующие типовые нейросетевые операции на программном уровне. Нейросетевые системы, реализованные на базе универсаль- ных цифровых компьютеров в виде плат расширения, назы- вают нейроускорителями. Они могут быть как «виртуальные» (вставляемые в слот расширения стандартного компьютера), так и «внешние», соединяющиеся с управляющим компьютером по конкретному интерфейсу или шине. И, наконец, третью линию развития представляют нейро- компьютеры, построенные из специализированных нейрочипов, в которых все операции выполняются в нейросетевом логическом базисе. Не останавливаясь на нейроэмуляторах и нейроускорите- лях, упомянем вкратце только основные принципы построения и функциональные характеристики нейрокомпьютеров. Для описания алгоритмов и конструирования устройств в нейроинформатике выработана специальная схемотехника, в которой элементарные устройства объединяются в сети, предназначенные для решения конкретных задач. Входной сигнал х Выходной сигнал п (х,а) = Е х(а( 1=1 Адаптивный сумматор Нелинейный преобразователь сигнала Точка ветвления ^471 Входной а1 , L сигнал а сы Точка ветвления Нелинейный преобразователь Формальный нейрон Рис. 4.4. Схемотехника нейрокомпьютинга
4.3. Биологически инспирированные средства обработки информации 135 В качестве основных элементарных устройств используются (рис. 4.4): • адаптивный сумматор, который вычисляет скалярное про- изведение вектора входного сигнала х (т.е. информацию, поступающую со всех нейронов) на вектор параметров, • нелинейный преобразователь сигнала, который получает скалярный сигнал х и преобразует его в заданную функцию /(*). • точка ветвления, которая служит для рассылки поступаю- щего сигнала по нескольким адресам, • стандартный формальный нейрон, являющийся комбина- цией входного сумматора, нелинейного преобразователя и точки ветвления на выходе. На основе этих элементов производятся нейрочипы, из кото- рых можно набрать необходимую нейронную сеть. В настоящее время промышленность разных стран выпус- кает десятки цифровых, аналоговых и гибридных нейрочипов. Среди них нейрочипы с жесткой структурой нейронов (аппа- ратно реализованной) и нейрочипы с настраиваемой структу- рой (перепрограммируемые). В основном на чипах формируется 32-256 нейронов при разрядности переменных 16-8 бит. Они изготавливаются по кремниевой планарной полупроводниковой технологии. В качестве примера приведем нейрочипы с перестраиваемы- ми весовыми коэффициентами, разработанные компанией “Bell Laboratories” в 1987 г. Для обеспечения возможности перестройки весовых коэффи- циентов нейронной сети была разработана схема, при изготовле- нии которой была применена комбинированная технология. С ее помощью на одном кристалле были размещены и нейронная сеть, и память для управления перестройкой весовых коэффициентов нейронной сети. В схеме использованы цифровые входные и вы- ходные сигналы. Для вычисления выходного сигнала нейронной • еги применялись аналоговые схемы перемножения и суммиро- вания Для управления работой схемы использовались цифровые i hi палы. Эта интегральная схема была изготовлена с помощью 2,5 мкм 1\МОП-технологии и содержала примерно 75 000 транзисторов. На кристалле размером 6,7 х 7 мм размещены 54 операционных yi илителя, выполняющих функции нейронов, и 5 Кбайт стати- нч кой памяти для программирования кристалла для изменения оных коэффициентов. Схема позволяла реализовать нейрон-
136 Гл 4. Казалось бы несовместимое ную сеть с полными связями. Матрица коэффициентов связей 54 х 54 занимала примерно 90 % площади кристалла и позволяла соединить выход любого нейрона с входом любого другого ней- рона. 4.4. Будущее нейрокомпьютинга — сомнительное наследство цифровых компьютеров Интенсивное возрождение нейросетевых представлений и разработка нейрокомпьютеров сделалось реальностью по- следних лет. Тем не менее, несмотря на то, что нейросетевая парадигма уходит своими корнями в 40-е гг. прошлого столетия, пути ее оптимальной практической реализации, т. е. проблема «железа» (материального воплощения нейросетевых представ- лений), оставалась на протяжении многих лет практически вне рассмотрения. И поэтому создание нейрокомпьютеров пошло по наиболее «укатанному» пути — использованию полупро- водниковой схемотехники и планарной технологии, прекрасно зарекомендовавших себя в разнообразных микроэлектронных устройствах. Нужно признать, что до сих пор, в сущности, нет альтернати- вы полупроводниковой схемотехнике и технологии, которые ис- пользуются для имитации нейрона и нейронных сетей. Это лег- ко объяснимо, поскольку в силу фантастических преимуществ планарной технологии она вытеснила практически все предла- гавшиеся ранее технологические воплощения вычислительных устройств. Более того, дискретная схемотехника создавалась для реализации фон-неймановской архитектуры. В этом смысле фон-неймановская архитектура оптимальна и, что не менее важ- но, она далеко не исчерпала своих возможностей. Ситуация принципиально меняется, когда речь идет о разра- ботке нейросетевых информационно-логических средств. Основные принципы нейросетевой парадигмы фундаменталь- но отличны от принципов парадигмы фон Неймана. В основе парадигмы фон Неймана лежит понятие неизменной по своей структуре программы. Изменение в программе хотя бы одного оператора приводит к распаду программы, которая становится неспособной выполнять свои функции. Принципиально отлично от этого, в идеологии нейронной сети, даже в первоначальном подходе МакКаллоха и Питтса, заложена возможность малых изменений структуры сети. Коп цепция переменных весов нейронов позволяет варьировать их
4.4 Будущее нейрокомпьютинга 137 в некоторой области значений, не вызывая качественных изме- нений режима функционирования сети. Именно в этом полупроводниковая дискретная реализация нейронных сетей принципиально противоречит их сущности. Удаление или добавление хотя бы одного транзистора в пла- нарной схеме, в общем случае, приводит к потере ее работо- способности (здесь не рассматриваются варианты дублирования информационных режимов, что не меняет общих выводов). По- этому постепенная адаптация схемы к наиболее эффективному решению конкретной задачи встречает принципиальные трудно- сти при использовании полупроводниковой планарной техноло- гии. В то же время известные биологические системы с архи- тектурой нейронных сетей построены из исходных молекуляр- ных фрагментов, качественно отличных от полупроводниковых элементов (транзисторов). Одной из основных и, по-видимому, наиболее важных их особенностей является структурная избы- точность молекулярного объекта по отношению к его функциям. Так, биополимерные молекулы белков ферментов играют важную роль в функционировании биологических систем. Их структу- ра представляет собой сочетание функциональной группировки, определяющей функции фермента, и протяженного (полипептид- пого) «хвоста». Замечательным свойством этой структуры явля- ется то, что отщепление даже сравнительно больших фрагментов лого хвоста приводит лишь к несущественному малому измене- нию функций фермента. В биологических системах проявляется и функциональная избыточность, когда изменение динамических характеристик си- стемы в достаточно широких пределах не приводит к качествен- ным изменениям динамики, т. е. к переходу к другому режиму. )го можно определить как динамическую избыточность системы (см. ниже). В общем случае структурная и (или) динамическая избыточ- ность элементов (молекулярных фрагментов), исходных для по- IIроения информационно-логических систем, является основой их изменчивости. А это, в свою очередь, должно лежать в основе нюлюционного отбора. Поэтому из таких исходных элементов могут быть, в принципе, построены информационно-логические устройства, постепенно обучающиеся наиболее эффективному решению задачи в процессе самого решения.
138 Гл. 4. Казалось бы несовместимое 4.5. Реакционно-диффузионные средства обработки информации Одной из наиболее важных разновидностей природных объек- тов, обладающих высокой сложностью поведения и проявляющих целенаправленные действия, являются распределенные (непре- рывные и дискретные) системы. Именно они привлекают к себе внимание в последние годы как перспективная основа создания эффективных биологически-мотивированных средств обработки информации. В этом случае обработка информации происходит в каждой физической точке среды, что приводит к высокой степени параллелизма, не сравнимой с возможностями постро- ения параллельных вычислений на базе цифровых дискретных процессоров. Динамика распределенных сред описывается системами диф- ференциальных уравнений, отражающих локальные изменения концентраций компонентов среды ('</./) в процессе пространствен- но-временной эволюции системы: = Fi (tzi,w2,«3...W7v) + з Здесь функции Fi (щ, it2, из ... им) описывают локальную дина- мику взаимодействия компонентов среды, а второй член правой части отвечает диффузии ее компонентов. В пространстве состояний, отвечающем реакционно-диффу- зионной системе, проявляются бассейны аттракторов, т. е. обла- сти определенных динамических режимов, в которых система самопроизвольно переходит в стационарное состояние. Но при этом движение в пределах бассейна не приводит к качественным изменениям динамики, т. е. к переходу к другому режиму (бас- сейну другого аттрактора). Это можно определить как динами- ческую избыточность системы. Поэтому существует принципи- альная возможность создавать на основе реакционно-диффузи- онных сред устройства, которые в некоторых пределах изменяют свои функции под действием внешних факторов, т. е. способные к обучению. Уравнения существенно упрощаются в случае непрерывного полного перемешивания компонентов системы. При этом в силу равномерного распределения компонентов среды не проявляются диффузионные механизмы, и динамика определяется только ме-
4.5. Реакционно-диффузионные средства обработки информации 139 ханизмами взаимодействия компонентов: = Fi (ui,u2,u3...uN) . Среды, описываемые подобными системами уравнений, назы- вают реакционно-диффузионными. Режимы функционирования реакционно-диффузионных сред определяются видом функции Fi (tzi, и2, и3.. .un). Наиболее интересными с точки зрения об- работки информации являются среды с нелинейными механиз- мами взаимодействия компонентов. Они демонстрируют высокую сложность поведения. Выполняемые ими элементарные операции обработки информации представляют собой логически сложные Зрение Слух Мышление Активность коры мозга (РЕТ-томография) Эволюция колоний бактерий Реакция Белоусова—Жаботинского мм Волна в сегнетоэлектрике Рис. 4.5. Коллективные процессы в сложных динамических системах
140 Гл. 4. Казалось бы несовместимое действия, эквивалентные десяткам, а иногда и сотням элемен- тарных двоичных операций цифрового компьютера. В природе реакционно-диффузионные среды встречаются на самых разных уровнях структурной организации (рис. 4.5). Так сложное поведение проявляется на уровне колоний одноклеточ- ных организмов в процессах их роста, приводя к нетривиальным пространственным структурам (концентрические круговые или спиральные образования). На уровне тканей организма естественно назвать прежде всего функции коры головного мозга. В то же время, реакци- онно-диффузионные явления характерны и для других органов. Так нарушение сердечных ритмов и феномен внезапной смер- ти возникают в результате патологических волновых режимов в миокарде. Широко известны режимы концентрационных колебаний в химических и биохимических системах, в биологических мембранах и клетках, т. е. на супра молекулярном уровне. И, наконец, нелинейная динамика может приводить к кол- лективным возбуждениям, так называемым солитонам — волнам, распространяющимся на большие расстояния вдоль молекуляр- ного остова, т. е. на молекулярном уровне. Рис. 4.6. Триггерный режим (а) и режим «ведущего центра» (б) в среде Бело- усова-Жаботинского Замечательным свойством этих сред является то, что незави- симо от физического воплощения в них проявляются одни и те же макроскопические формы поведения: • локальные или глобальные (во всем объеме среды) колеба- ния концентраций компонентов среды,
4.6. Среды типа Белоусова-Жаботинского — нейросетевая архитектура141 • распространяющиеся в объеме среды локальные области высоких концентраций (концентрационные импульсы), • триггерные режимы распространяющегося в среде пере- ключения из одного ее состояния в другое, • образование устойчивых стабильных во времени диссипа- тивных структур с неоднородным распределением концен- траций компонентов среды. По-видимому, наиболее перспективными для создания ней- роподбных средств обработки информации оказались химиче- ские реакционно-диффузионные системы и, прежде всего среды, в которых протекают реакции Белоусова-Жаботинского. Триг- герный режим и режим «ведущего центра» этих сред показаны на рис. 4.6. 4.6. Среды типа Белоусова-Жаботинского — нейросетевая архитектура Наиболее известными среди химических реакционно-диф- фузионных сред, использующихся в попытках создания устройств обработки информации, являются среды типа Белоусова-Жаботинского. В основе динамики такой среды лежит окисление органического соединения (малоновой кислоты С3Н4О4) каким-либо неорганическим окислителем (броматом натрия или калия), катализируемое ионами переходного металла (в основном железа). Схематически реакцию можно описать орутто-уравнением: С3Н4О4 + NaBrO3 + Н+ - Fe > С3 H3BrO4+ Н2О + СО2. В действительности, процесс Белоусова-Жаботинского пред- ставляет собой совокупность промежуточных реакций, точное число которых до конца до сих пор не установлено. Будем рассматривать простейший вариант химической реак- ционно-диффузионной среды — плоский квазидвумерный слой (рис. 4.7). Для более ясного понимания информационных свойств 1икой системы удобно разбить ее на микрообъемы с линейными размерами меньше диффузионной длины среды. Эта величина Id = (DtY2 определяется средним коэффициентом диффузии компонентов < реды D и периодом т протекающих в среде процессов. ('.остояние среды внутри такого элементарного объема отвечает
142 Гл. 4. Казалось бы несовместимое полному перемешиванию. Динамика среды в таких объемах сравнительно проста. В то же время взаимодействие их за счет диффузии приводит к сложным пространственно-временным режимам. Рис. 4.7. Нейросетевая архитектура среды Белоусова-Жаботинского Немного подробностей Известны различные подходы к описанию реакции Белоусова-Жабо- тинского . Общепринятая модель процесса (приближение Филда-Короша- Нойеса — ФКН-приближение) основана на 11 стадиях, динамика которых сводится к двум кинетическим уравнениям для ингибитора реакции и (НВгОс) и активатора v (высшая валентность иона металла — Fe3+): = , Л + У>] + w( 1 - tz) + DuAu, at (д + и) = и — Xv + DvAv. Здесь е, q и ц — параметры, определяющиеся начальными концентрация ми компонентов реакции и константами скоростей протекающих в системе промежуточных реакций. К сожалению, эти константы не известны сегодня с необходимой для практики точностью. Но на протяжении ряда лет были определены составы сред, отвечающие конкретным динамическим режимам Тем самым были установлены эмпирические связи значений параметров е, q и ц с относительным содержанием молекулярных компонентов в среде Величина <р вводится в кинетические уравнения только в случае использования светочувствительного катализатора реакции. Она учитывает влияние светового излучения на динамику среды (см. следующую главу) Для систем с полным перемешиванием в кинетических уравнениях отбра сывается член, учитывающий диффузию компонентов среды. В этом случае нетрудно качественно описать основные динамические режимы среды. Пусть
4.6. Среды типа Белоусова-Жаботинского — нейросетевая архитектурах43 начальное состояние среды Белоусова-Жаботинского отвечает произвольным концентрациям ее компонентов. Тогда протекающие в среде реакции должны привести ее к стационарному состоянию или состояниям, которым отвечают точки пересечения кривых Эти кривые, которые называют нуль-изоклинами, представляют собой удобный инструмент для качественного описания динамических режимов сред Белоусо- ва-Жаботинского. Исходя из кинетических уравнений и приравнивая их правые части нулю, легко получить два уравнения для нуль-изоклин: _ и(и— 1)(и + р) <р (и - p)q q Первое из них представляет собой S-образную кривую, второе — линейную зависимость концентраций активатора реакции от концентрации ингибитора (рис. 4.8). Рис 4.8. Нуль-изоклины реакции Белоусова-Жаботинского для колебатель- ного (а) и возбудимого (б) режимов; ниже показаны изменения во времени концентраций активатора (и) и ингибитора (и) Теоретическое рассмотрение показывает, что точки пересечения нуль- токлин могут отвечать как устойчивым, так и неустойчивым состояниям. В первом случае производная в точке пересечения должна быть отрицательной, повтором — положительной. Рассмотрим случай устойчивой точки пересечения (рис. 4.8, б). На рисунке показаны три возможных варианта, которые отвечают постепенному прибли- жению среды к стационарному состоянию, исходя из произвольных концен- । р.щий молекулярных компонентов среды. После этого среда остается в этом < 1 ационарном состоянии пока какое-либо возмущение не выведет ее из этого «стоянии. Детальное рассмотрение показывает, что в случае учета диффузии
144 Гл. 4. Казалось бы несовместимое компонентов среды этот вариант пересечения изоклин отвечает концентрацион- ным импульсам, распространяющимся в среде. Его принято называть возбуди- мым режимом. Движущиеся концентрационные импульсы в реакционно-диф- фузионной среде — автоволновые структуры, свойства которых отличаются от свойств, характерных для привычных физических волновых явлений. Они не отражаются, а гаснут на непроницаемой границе. При встрече концентраци- онные импульсы аннигилируют. На рис 4.9 показано, как концентрационные импульсы огибают препятствие и проходят сквозь малые отверстия. Рис. 4.9. Возбудимый режим среды Белоусова-Жаботинского. Концентрацион- ный импульс огибает препятствие и проходит через отверстия Рис. 4.10. Колебательный режим среды Белоусова-Жаботинского Динамический режим оказывается существенно более сложным — колеба тельным, если пересечение нуль-изоклин отвечает неустойчивому состоянию. В этом случае эволюция среды, находящейся изначально в точке а (рис. 4.8, а), доходит по устойчивой ветви S-образной изоклины до точки (м01,ц01). Здесь устойчивость теряется и среда самопроизвольно перескакивает на противопо
4.6. Среды типа Белоусова-Жаботинского — нейросетевая архитектурах №> ложную устойчивую ветвь и снова стремится к точке пересечения изоклин. В ходе этого процесса периодически изменяются концентрации как активатора реакции, так и ингибитора. При учете диффузии колебательный характер режима сохраняется, но при этом эволюция среды становится более сложной (см. следующую главу). Сравнительно простой пример проявления колебатель- ного режима среды Белоусова-Жаботинского, в которую введено произвольное изображение, показан на рис. 4.10. Исходное изображение последовательно проходит в среде через стадии «негатив-позитив-негатив...» и т. д. Важная информационная особенность среды типа Белоусова- Жаботинского — ее нейросетевая архитектура. Качественно среду Белоусова-Жаботинского можно рассмат- ривать как реализацию нейронной сети (см. рис. 4.7), где: • каждый элементарный объем среды представляет собой элементарный процессор; • динамика этого процессора и выполняемые им операции определяются только нелинейной кинетикой протекающих в микрообъеме реакций; • процессы, протекающие в микрообъемах, связаны коротко- действующими (диффузионными) взаимодействиями (точ- нее, каждый микрообъем связан диффузией с любым дру- гим микрообъемом среды, но, в силу малой скорости диф- фузии, взаимодействие объемов происходит с задержкой и ослаблением, пропорциональными расстоянию между ни- ми); • в зависимости от состояния среды (концентрации компо- нентов реакции и температуры) и внешнего возбуждения система, описываемая реакционно-диффузионными уравне- ниями с учетом диффузии, может функционировать в раз- личных динамических режимах. Следует отметить, что более строго распределенные ней- ронные сети описываются системой интегро-дифференциальных уравнений. Они не могут быть, в общем случае, сведены к ре- акционно-диффузионным уравнениям. Тем не менее, при некото- рых, не очень жестких предположениях эти две модели оказы- ваются адекватными. Интересное подтверждение нейросетевой архитектуры сред Белоусова-Жаботинского было получено на основе нейросетей, описывающих особенности человеческого зрения. Зрение млекопитающих и, в особенности, человека пред- ставляет собой сложный фотобиологический процесс. Изобра- жение окружающей обстановки проецируется оптический са- морегулирующейся системой глаза, преобразуется и сжимается совокупностью горизонтальных амакриновых и ганглиозных кле-
146 Гл. 4. Казалось бы несовместимое ток, и передается далее зрительным нервом. Зрительные нервы двух глаз пересекаются, обмениваясь частично информацией, и передают ее через латеральное коленчатое тело в зрительный кортекс, где изображение собирается в единое целое. Соглас- но общепринятым представлениям кортекс производит предва- рительную обработку информации: выделят контуры фрагмен- тов изображения, линии одной направленности, границы между отдельными блоками и т. д. Дальнейшая интерпретация внеш- ней информации представляет собой сложный психофизиологи- ческий процесс, осуществляемый корой головного мозга. Отличительной чертой человеческого зрения являются зри- тельные поля, в которых информация может усиливаться в цен- тре поля и гаситься на периферии («on center — off surround») или же наоборот подавляться в центре и усиливаться на пери- ферии («off center — on surround»). Благодаря этому сетчатка не воспринимает равномерное диффузное освещение, но фиксирует точечные и кольцевые структуры, границы темного и светлого. Среди двумерных нейронных сетей с латеральным (боковым) взаимодействием особое место принадлежит вариантам, которые позволяют моделировать отдельные функции человеческого моз- га и, в частности, особенности человеческого зрения. В конце 60-х гг. Позин со своими сотрудниками выполнил де- тальное изучение нейронных сетей, описываемых кинетическими уравнениями типа = -asi + F(pi) + li. Здесь Sj — состояние (потенциал) ?-го нейрона, F(pi) — ступен- чатая функция, описывающая состояние нейрона в зависимости от суммы сигналов, поступающих от всех остальных нейронов: Pi — TjjSj, 3 li — внешнее воздействие на ?-й нейрон. Эта модель (рис. 4.11) представляет собой нейронные се- ти с возбуждающими и ингибирующими воздействиями. Более точно, распределение возбуждающих и ингибирующих сигналов описывается функцией связи д(ж), зависящей от расстояния меж- ду нейтронами на поверхности сети. Рассматривались протяжен- ные пространственные одномерные и двумерные воздействия на нейронную сеть. При этом размеры воздействий были существен- но больше, чем расстояния между нейронами в сети. Поэтому
4.6. Среды типа Белоусова-Жаботинского — нейросетевая архитектура^? Рис 4.11. Нейронные сети Позина (а) и Гроссберга (б) Рис. 4.12. Обработка информации нейронной сетью Позина нейронную сеть можно было рассматривать как непрерывную, однородную среду. Основной результат, который был получен в этих исследова- ниях, состоял в том, что прямоугольный импульс мог обострять- ся или уширяться, или же выделялся его контур в сети в зави- симости от вида функции связи F(pj). Численное моделирова- ние этих эффектов с использованием техники Позина показано на рис. 4.12. Рассчитывались интегралы свертки прямоугольного распределения с функцией связи, которая аппроксимировалась выражением = Al ехр(-ж2/В1) - А2ехр(—ж2/В2). константы Д1, А2, Bl, В2 заданы на рис. 4.12.
148 Гл. 4. Казалось бы несовместимое j/i В конце 60-х гг. прошлого века американский математик Стивен Гроссберг начал цикл исследований нейронных сетей, сходных в своей основе с сетями Позина. Для того, чтобы объяснить механизмы обработки информа- ции зрительным кортексом, Стивен Гроссберг предложил концеп- цию специализированных нейронных сетей, включающую в себя особенности зрительных полей. Основываясь на психобиологических и нейробиологических данных, Гроссберг пришел к выводу о том, что нейронные сети с центральным активированием и латеральным ингибировани- ем (см. рис. 4.11) могут быть использованы для интерпретации целого ряда феноменов человеческого зрения и, в том числе, оптических иллюзий. Нейронные сети этого типа описываются кинетическими уравнениями = -asi + (В - Si) [Ц + f (Si)] - Si Здесь основные обозначения совпадают с обозначениями, приня- тыми для уравнения Позина, Д и Jt — внешние воздействия на возбудимые и ингибирующие нейроны. В этом уравнении первый член правой части описывает ско- рость затухания возбуждения г-го нейрона, второй ограничива- ет величину его возбуждения некоторой предельной величиной, а третий отвечает воздействию на г-й нейрон его ингибирующего окружения. Гроссбергом было показано, что нейронные сети этого типа обладают кратковременной памятью. Кроме этого, в зависимости от вида функции /($г) эта сеть обостряет или уширяет воздей- ствующий на нее пространственный сигнал, или же выделяет его контур (рис. 4.13). Гроссбергом отмечалась аналогия между динамикой предло- женных им нейронных сетей и реакционно-диффузионных си- стем, использованных Гирером и Мейнхардтом для объяснения образования окраски животных. Позже эта аналогия была показана и для химических ре- акционно-диффузионных систем типа Белоусова-Жаботинского. Нетрудно видеть, что эта аналогия имеет реальную физико химическую основу. Для химических нелинейных систем харак- терны автокаталитические механизмы (активирование в элемен- тарном микрообъеме) и существенно большие значения коэффи- циентов диффузии ингибитора по сравнению с активатором.
4.7. «Возникающие» информационные механизмы 149 По-видимому, нейросетевая архитектура сред типа Белоусо- ва-Жаботинского объясняет специфику элементарных операций обработки изображений средой (выделение контура изображе- ния, усиление или ослабление его особенностей), совпадающих с элементарными операциями сетей Гроссберга. 4.7. «Возникающие» информационные механизмы Возможность обработки информации реакционно-диффузи- онными средами может быть понята на основе концепции «воз- никающих» (в англоязычной литературе “emerging”) информа- ционных механизмов, активно разрабатываемой в последние го- ды. реакционно-диффузионная среда может рассматриваться как многоуровневая система. Исходный уровень рассмотрения — кинетика химических реакций между компонентами среды. Изменение концентраций компонентов среды во времени определяется, в основном, их начальными значениями, температурой среды и константами ско- ростей протекающих в среде реакций. Это представляет собой как бы нижний уровень динамики среды. В то же время, рас- сматривая среду как единое целое и решая реакционно-диф- фузионные уравнения можно перейти к следующему уровню динамики реакционно-диффузионной среды — совокупности ее стационарных режимов. Для систем с полным перемешиванием характерны бистабильный режим (система может переходить из Рис 4.13. Обработка информации нейронной сетью Гроссберга: а — исходный сигнал, б — функция /(s), в — результат преобразования
150 Гл. 4. Казалось бы несовместимое одного стационарного состояния в другое), ждущий (устойчивое стационарное состояние) и режим концентрационных колебаний. Если же в среде может осуществляться диффузия ее компо- нентов, то к этим режимам добавляются триггерное переклю- чение из одного устойчивого состояния в другое, движущиеся концентрационные импульсы, спиральные структуры, ведущие центры и целый ряд других динамических состояний. Все эти режимы образуют базис для следующего уровня динамики — взаимодействия стационарных структур. Принципы этого вза- имодействия специфичны и не схожи с принципами, казалось бы, аналогичных физических объектов. Так концентрационные волны, в отличие от физических волновых процессов, хотя и оги- бают препятствия, но не отражаются от них, а аннигилируют. Аннигиляция происходит и при взаимном столкновении концен- трационных волн. Эта динамика как бы возникает на основе предшествующих динамических уровней и в тоже время не мо- жет быть сведена к ним. Подобная «возникающая» динамика является характерной особенностью биологических нелинейных распределенных систем, возникающей в результате протекающих в этих системах процессов самоорганизации. Таким образом, в реакционно-диффузионной системе можно выделить три уровня динамики: • уровень взаимодействия элементов среды, т. е. характер их межсоединений (микроуровень), • уровень, на котором система может находиться в том или ином стационарном состоянии (мезоуровень), • уровень взаимодействия состояний системы с ее окружени- ем (макроуровень). При этом именно динамика макроуровня ответственна за обработку информации реакционно-диффузионными средами. 4.8. Принципы обработки информации реакционно-диффузионными устройствами Нелинейные реакционно-диффузионные среды представляю! собой средства обработки информации, принципиально отлич ные от цифровых фон-неймановских вычислителей. Распреде ленный характер среды приводит к высокому параллелизму об работки информации, многократно превышающему возможности многопроцессорных цифровых систем. Нелинейные механизмы
4.8. Принципы обработки информации 151 динамики реакционно-диффузионных сред обусловливают вы- сокую логическую сложность выполняемых элементарных опе- раций. Поэтому производительность реакционно-диффузионного устройства определяется не повышением быстродействия эле- ментов (микроминиатюризацией схем), а усложнением динамики устройства, которая приводит к повышению логической сложно- сти элементарных операций. Естественным продолжением этого подхода должно быть создание многоуровневых сред с высокой сложностью поведения.
Глава 5 РЕАКЦИОННО-ДИФФУЗИОННЫЙ ПРОЦЕССОР: ВОЗМОЖНОСТИ И ОГРАНИЧЕНИЯ Будущее аналоговых вычислений безгранично. Будучи мечтателем, я вижу, как они, в конеч- ном счете, заменяют цифровые, в особенности, сначала для решения дифференциальных уравне- ний в частных производных и для моделирования в нейробиологии. Понадобится несколько десяти- летий для того, чтобы это произошло. А тем вре- менем, я верю, это очень плодотворная и бросаю- щая вызов область исследований, хотя (а может быть и потому) она не популярна сегодня. Ли А. Рубель. Из письма к другу 5.1. Реакционно-диффузионный процессор: основные принципы В основе обработки информации реакционно-диффузион ними системами лежит концепция реакционно-диффузионного процессора. Принципиальная схема этого устройства, основой которого является химическая или биохимическая система, по казана на рис. 5.1. Химические реакционно-диффузионные сре- Ввод данных Результаты Рис. 5.1. Принципиальная схема реакционно-диффузионного процессора ды типа Белоусова -Жаботинского представляют собой удобныи исходный материал для создания устройств обработки информ* ции. Они стабильны и не токсичны. Температурный диапазон и временные масштабы процессов в них удобны для регистрации характеристик этих сред доступными физическими методами
5.1. Реакционно-диффузионный процессор: основные принципы 153 Химические компоненты, необходимые для формирования этих сред доступны, стоимость их невысока. В то же время, наиболее важные для обработки информации динамические режимы про- являются, когда среда функционирует в стационарном (далеком от равновесного) состоянии. Поэтому в среду должны непрерыв- но вводиться исходные компоненты реакции, поддерживая их начальные концентрации постоянными, и выводиться продукты протекающих в среде реакций. Динамические режимы сред Бе- лоусова-Жаботинского чувствительны к изменениям температу- ры. Поэтому среда, обрабатывающая информацию должна быть гермостатирована. Обработка информации процессором включает в себя нес- колько уровней, характерных для этой системы. 5.1.1. Ввод информации. Для ввода данных в реакцион- но-диффузионную среду необходим «макро-микро»-интерфейс. Он преобразует входную информацию (некоторое пространствен- ное распределение физических стимулов) в соответствующее пространственное распределение молекулярных компонентов среды. Наиболее удобными для ввода информации являются светочувствительные среды. В этом случае вводимая инфор- мация представляет собой некоторое изображение (в общем случае, произвольное распределение интенсивности света), проецируемое оптической системой на поверхность слоя или и объем среды. А сама среда содержит светочувствительный катализатор реакции Белоусова-Жаботинского Ви(Ьру)зС1г, инициирующий последовательность фотохимических реакций, которые приводят к изменению содержания основных ее составляющих: Ru +2 + hi/ -» *Ru +2, ' Rti +2 + С3Н3ВГО4 —» Ru +3 + Вг ~+органические продукты, Ru +3 + С3Н3ВГО4 —> Ru +2 + Вг ~+ органические продукты. В результате в каждой точке среды происходят изменения концентраций ее компонентов, определяющиеся интенсивностью i кетового излучения в этой точке. Иными словами, в среде воз- никает химическая реализация образа вводимого изображения. Перед вводом в среду исходных данных для решения вы- бранной задачи среда должна быть приведена к некоторому начальному виду, не содержащему значимой информации. Для и ого удобно использовать освещение среды интенсивным све-
154 Гл. 5. Реакционно-диффузионный процессор Рис 5.2. Нуль-изоклины свето- чувствительной реакции Бело- усова-Жаботинского в темно- те и под воздействием света. v и и — активатор и ингибитор товым излучением. Рассмотрим этот процесс подробнее и вер- немся для этого к нуль-изоклинам светочувствительной среды Белоусова-Жаботинского (рис. 5.2). В аналитическое выраже- ние для S-образной изоклины входит параметр, описывающий влияние светового излучения на динамику среды (см. преды- дущую главу). Нетрудно видеть, что это воздействие приводит к сдвигу S-образной изоклины вдоль оси ординат. При этом световое излучение не влияет на вторую — линейную изоклину (рис. 5.2). В результате точки пересечения изоклин сдвигаются по S-образной кривой в область высоких концентраций актива- тора реакции и предельно малых концентраций ингибитора. Рассмотрим качественно про- цесс ввода информации. Пусть черно-белое изображение проеци- руется на среду, состав которой отвечает колебательному режиму. В этом случае пространственные области среды, на которые попада- ет интенсивное излучение, перево- дятся в состояние с высоким содер- жанием активатора реакции. В то же время пространственные обла- сти, на которые не попадает свет, не меняют своего состояния. Когда экспозиция светового излучения за канчивается, в среде начинается эволюция введенного изобра- жения, обусловленная протекающими в среде реакциями. При этом области среды, на которые не попадало световое излучение, сразу же входят в колебательный процесс, а областям, подвергав- шимся засветке, понадобится некоторое время, пока химические реакции не переведут их в колебательный режим. Высокому содержанию активатора в среде отвечает оранже- во-красный цвет реагента, высокому содержанию ингибитора — синий. На практике, при регистрации эволюции изображения, для того, чтобы увеличить его контраст, используются синие светофильтры. В результате, регистрация эволюции изображения черно-белой видеокамерой приводит к тому, что области сре ды с высоким содержанием активатора оказываются темными, а с высоким содержанием ингибитора — светлыми. Таким образом, в ходе эволюции черно-белого изображения, введенного в колеблющуюся среду, на темном фоне, отвечающе- му засвеченным (светлым на исходном вводимом изображении) появляются светлые фрагменты (темные на вводимом изображе
5.1. Реакционно-диффузионный процессор: основные принципы 155 нии). Иными словами в начальной стадии эволюции появляется негативная форма введенного изображения. Этот процесс пока- зан на рис. 4.10. Возможности светового варианта ввода информации могут быть существенно расширены, если использовать набор молеку- лярных компонентов среды селективно чувствительных к излу- чению в различных областях спектра. Для ввода информации в реакционно-диффузионную среду могут использоваться и дру- гие физические стимулы. Это электрические поля, электрохими- ческие процессы, локальные изменения температуры среды и т. д. 5.1.2. Обработка информации. Для того, чтобы выпол- нить конкретную выбранную операцию обработки информа- ции, необходимо задать отвечающий ей динамический режим пространственно-временной эволюции среды. Среда преобразует исходное, сформированное в ней распределение концентраций реагентов в некоторое его конечное состояние, которое рассмат- ривается как решение задачи. В свою очередь, динамический режим задается состоянием среды, т. е. ее составом (относитель- ными концентрациями ее молекулярных компонентов) и темпе- ратурой. Как будет показано ниже, существенное значение играют и особенности вводимой информации. Поскольку оптический ее ввод наиболее удобен, исходные данные представляют собой некоторые изображения. При этом изображение может быть в двух, адекватных с точки зрения содержащейся в нем инфор- мации формах — позитивной и негативной. Тем не менее, эти варианты по разному ведут себя в ходе их эволюции в реакци- онно-диффузионной среде. Существует некоторый произвол в определении позитивной и негативной формы изображения. Для определенности будем называть позитивным изображение, отвечающее естественному восприятию его человеческим зрением. Однако, в некоторых слу- чаях трудно определить какое восприятие следует называть есте- ственным. В этом случае будем называть черное изображение, несущее информацию, на белом фоне позитивным изображением. II любом случае вводимое изображение может быть сведено к на- пору величин — оптических плотностей Di (Z?o < Di < D^, где /)0 и jDto — минимальное и максимальное значения оптической плотности). Под негативным изображением будем понимать со- ответствующий набор инвертированных оптических плотностей I >Ki — Doo — Di.
156 Гл. 5. Реакционно-диффузионный процессор Рис. 5.3. Изменение колебательного режима среды Белоусова-Жаботинско- го (а) под воздействием светового излучения (б) Оптический ввод информации определяет еще одну особен- ность функционирования реакционно-диффузионного процессо- ра. Решение задачи основано на непрерывной регистрации эво- люции изображения в среде, например, видео-камерой. Но это возможно только в том случае, если процесс эволюции виден. То есть среда должна непрерывно освещаться светом. Эта дополни- тельная «технологическая» освещенность светочувствительной среды, естественно может воздействовать на ее динамический режим (см. нуль-изоклины на рис. 5.2). Пусть состояние среды отвечает колебательному режиму. Если после ввода изображения подсвечивать его в процессе регистрации минимальной допус- кающей регистрацию интенсивностью света, в среде протекает типичный колебательный процесс (рис. 5.3). Но, если та же самая среда при тех же экспозициях вводимого изображения подсвечивается в ходе регистрации достаточно интенсивным све- товым излучением, в среде возникает и развивается процесс, отвечающий возбудимому режиму среды. В то же время эволюцию исходного распределения кон- центраций можно изменять, воздействуя на среду различными управляющими физическими и химическими стимулами и (или) конструируя сложные по своей структуре среды. Все это во много раз увеличивает информационные возможности реакцион- но-диффузионных сред. 5.1.3. Вывод результатов решения задачи. Для того, что- бы вывести результаты решения задачи реакционно-диффузион- ной средой необходимо преобразовать распределение концентра- ций компонентов среды, отвечающее этому решению, в соот- ветствующее распределение каких-либо макроскопических физи- ческих величин («микро-макро»-интерфейс). Наиболее удобным способом является регистрация пространственного распределе-
5.1. Реакционно-диффузионный процессор: основные принципы 157 ния оптических характеристик среды. В качестве этих харак- теристик могут быть использованы изменения окраски среды, спектрального поглощения и т. д. В процессе реакции, когда среда переходит из одного состо- яния в другое, катализатор реакции изменяет свое электронное состояние. Как следствие, реагенты меняют свой цвет (от красно- го к синему и наоборот). Таким образом, легко визуализировать процесс и наблюдать пространственно-временную эволюцию си- стемы. В этом случае доступные оптические средства, такие как, например, видеокамера, позволяют легко ввести зарегистриро- ванное распределение в память компьютера для его дальнейшей обработки. 5.1.4. Управление и энергетическое питание процессора. Управляющими воздействиями могут быть те же самые физиче- ские стимулы, которые используются для ввода информации. Так под управлением можно понимать изменение состояния среды (относительных концентраций ее компонентов) заданным воздей- ствием, которое приводит к локальному изменению динамиче- ского режима в выбранных областях среды. В качестве примера можно привести организацию процесса огибания концентрацион- ным импульсом препятствия и прохождение его сквозь отверстия (см. рис. 4.9). В этом случае использовалась однородная среда Белоусова-Жаботинского, в которой сначала возбуждались два расходящихся линейных импульса. После этого на поверхность среды проецировалось интенсивным излучением препятствие, которое должно было огибаться левым импульсом, и полоса с двумя отверстиями, через которые должен был проходить пра- вый импульс. Интенсивное излучение, проецируемое на протя- жении всего времени прохождения импульсов, переводило среду в этих областях в неактивное состояние (см. нуль-изоклины на рис. 5.2), что было адекватно твердому непроницаемому препят- ствию, введенному в среду. Вторым примером может служить создание в реакцион- но-диффузионной среде конфигурации так называемого химиче- ского диода. В 1996 г. японский исследователь проф. Иошикава с группой сотрудников выдвинули идею устройства, в котором осуществляется однонаправленное прохождение концентрацион- ной волны, генерируемой в реакции Белоусова-Жаботинского. Устройство, названное химическим диодом, представляло собой гонкую, неактивную для реакции Белоусова-Жаботинского пе- ремычку между линейной, с одной стороны (P-сторона), и схо- дящейся к перемычке с другой (С-сторона) границами (рис. 5.4).
158 Гл. 5. Реакционно-диффузионный процессор с сотрудниками показали химических диодов могут ческие схемы. Промежуток Рис. 5.4. Схема химического диода Экспериментально эта система была реализована как совокуп- ность двух квадратных пластин из микропористого стекла, од- на из которых своей вершиной направлена к середине стороны другой пластины. Пластины были пропитаны раствором катали- затора реакции — ферроином, и помешены в раствор остальных компонентов реакции. Поскольку ферроин содержался только в пористом стекле, реакция могла идти исключительно на по- верхности пластин. Было показано, что прохождение концентра- ционной волны в направлении Р—>С и С—>Р неадекватно. При некоторой ширине перемычки волна проходит по направлению Р—>С и не проходит в обратном направлении С^Р. К. Иошикава также, что на основе элементарных быть построены разнообразные логи- Существенным недостатком ис- пользованного в этой работе экс- периментального устройства была большая трудоемкость его изготов- ления и не очень высокая надеж- ность. Но, используя управление режимами реакции Белоусова-Жа- ботинского световым излучением, может быть предложена простая схема эксперимента, позволяющая легко формировать как гео- метрически произвольную структуру диода, так и разнообразные устройства на его основе. В однородной светочувствительной среде может быть возбуждена концентрационная волна и на протяжении всего времени ее прохождения через устройство структура диода может формироваться интенсивным световым излучением, проецируемым на поверхность среды. Основные ва- рианты прохождения волны через такую систему показаны на рис. 5.5. Нужно отметить, что при исключительной простоте, разработанная техника позволяет оперативно и с высокой точно- стью менять геометрические параметры диода и организовывать их различные комбинации. Управляющие воздействия могут быть и комплексными. Если, например, в реакционно-диффузионную среду введена пленка белка бактериородопсина, то локальное освещение пленки при- водит к повышению концентрации водородных ионов около осве- щаемых участков пленки. В свою очередь, локальное изменение кислотности среды может привести к локальному изменению ее состояния.
5.1. Реакционно-диффузионный процессор: основные принципы 159 Рис. 5.5. Моделирование химического диода на основе среды Белоусова-Жабо- тинского: а и б — импульс проходит через отверстие, в — импульс не проходит (гасится) Энергетическое питание биомолекулярного процессора должно быть, естественно, химическим. Это означает, что среда, работающая продолжительное время должна представлять собой проточный химический реактор. В него должны непрерывно поступать субстраты реакции и удаляться реакционные продукты. Немного подробностей: технические характеристики реакционно- диффузионного процессора Блок схема установки и основные режимы ее работы показаны на рис. 5.6. Для ввода изображения в среду используется управляемый персональным компьютером видеопроектор SANYO PLC-510M (VGA-совместимый, 279 ANSI люмен). Высокая однородность фона светового излучения этого проектора су- щественно уменьшала погрешности эксперимента. В то же время, управляемый компьютером проектор позволял существенно расширить возможности управ- ления вводимой информацией (менять яркость и контраст изображения, добав- лять или удалять некоторые детали вводимой информации, управлять состо- янием среды во время эволюции изображения). Регистрация эволюции изоб- ражения в среде производилась черно-белой видеокамерой Mintron OS-045D (чувствительность 0,02 люкс, разрешение 600 TV-линий) в сочетании с синими фильтрами, повышавшими контраст изображения. Оцифрованные изображения вписывались в память персонального компьютера (пакет VidCap) в режиме произвольно выбранных отдельных слайдов или же в режиме видеофильма. В работе использовался замкнутый, непроточный реактор на основе тер- мостатированной чашки Петри диаметром 80-120 мм. Использовались три конструктивных варианта сред:
160 Гл. 5. Реакционно-диффузионный процессор Видео- камера _ Затвор гН Видео- У проектор Видео- камера „ Затвор гН Видео- проектор Полу- прозрачное зеркало БЖ-реактор а Вводимое изображение Полу- прозрачное j зеркало / БЖ-реактор б Вводимое изображение Видео- камера Затвор Видео- камера Затвор Полу- прозрачное зеркало БЖ-реактор Видео- проектор Вводимое изображение Полу- прозрачное зеркало БЖ-реактор Видео- проектор изображение Рис. 5.6. Режимы реакционно-диффузионного процессора • Слой жидкого реагента толщиной 0,5-1,5 мм, включающий в себя ката- лизатор реакции, использовался для предварительного изучения опера- ций обработки изображений. При этом экспериментально было установ- лено, что режим, отвечающий исходному составу реагента, сохраняется в реакторе в течение 15-20 мин. • Среда, в которой катализатор реакции был иммобилизован в тонком (~ 0,2 мм) слое твердого силикагеля, нанесенного на алюминиевую фольгу (стандартные пластины для жидкостной хроматографии погру- жались в 0,0001 М раствор катализатора на 40-50 мин); остальные компоненты реакции находились в растворе и реакция протекала в при- граничном слое над поверхностью силикагеля. • Среда, в которой катализатор был иммобилизован в слое гидрогеля си- ликагеля толщиной 1,0-1,5 мм. Катализатор вводился в слой силикагеля в процессе его формирования, остальные компоненты реакции диффун- дировали в слой из раствора над силикагелем и реакция проходила в объеме слоя. Реакторы с иммобилизованным катализатором исключают искажения кар- тины, вызываемые посторонними физическими воздействиями (вибрации, слу- чайные толчки и т. д.). В них может быть помещено значительно большее (по сравнению с жидкофазным реактором) количество исходного реагента. Поэтому время работы замкнутого реактора без изменения характера режима за счет выработки компонентов реакции составляло 1-2 часа. Использовались светочувствительные среды (катализатор Ни(Ьру)зС/г), функционировавшие в возбудимом и колебательном режимах. Исходный состав возбудимой среды: H2SO4 — 0,3 М, КВгОз — 0,3 М. малоновая кислота — 0,2 М, КВг — 0,05 М. Исходный состав колебательной среды: H2SO4 — 0,6-0,8 М, КВгОз - 0,4 М, малоновая кислота — 0,2 М, КВг — 0,075 М.
5.2. Обработка изображений средами типа Белоусова-Жаботинского 161 В установке для изучения операций обработки изображений средами типа Белоусова-Жаботинского предусмотрены четыре основных режима ее работы. При многократном использовании реакционно-диффузионной среды необ- ходимо перед началом каждого варианта удалять следы предшествующих экс- периментов. Для этого среда освещалась интенсивным (белым) излучением в течение 1,0-1,5 мин (рис. 5.6, а) Для ввода исходной информации световое изображение проецировалось на поверхность среды. Использование в оптической схеме полупрозрачного зеркала позволяло наблюдать и контролировать процесс ввода информации видео камерой (рис 5.6, б). Запись эволюции введенного изображения производилась видеокамерой. При этом, поскольку посторонние источники света были исключены, для равномерной подсветки изображения использовался видеопроектор. Спектраль- ный состав и интенсивность подсветки задавались программой Photoshop 7.0 (рис. 5.6, в). Использованная оптическая схема позволяла эффективно управлять про- цессом эволюции введенного изображения. Проецируя во время эволюции исходного изображения на поверхность среды другое, задающее конфигурацию среды изображение, легко исключить из процесса эволюции отдельные участки среды или же замедлить процесс (рис. 5.6, г). На рис 4.9 показан процесс огибания препятствия концентрационным импульсом, аннигиляция импульсов и прохождение импульса через отверстия (трансформация линейной волны в круговую). Наряду с экспериментальным изучением операций обработки изображений было разработано и использовалось программное обеспечение, позволившее выполнять их численное моделирование. Оно было выполнено в виде двух независимых блоков. Первый из них предназначен для ввода начальных дан- ных и визуализации результатов вычислений, второй — собственно для вы- полнения расчетов. Такая компоновка упрощает добавление новых вариантов обработки данных за счет изменения конфигурационных файлов без переком- пиляции визуализирующего модуля. Расчетные модули не используют графический интерфейс и не требуют вмешательства пользователя в ходе вычислений. Это позволяет запускать их па удаленных серверах, а при необходимости перекомпилировать под дру- I не платформы. Модули написаны на языке C++, скомпилированы для PC компилятором Microsoft Visual C++ 6.0 Общий объем исполняемых файлов около 1 Мбайт. 5.2. Обработка изображений средами типа Белоусова-Жаботинского 5.2.1. Что такое обработка изображений. В современной исследовательской и промышленной практике приходится неред- ко сталкиваться с тем, что исходная информация, на которой основано решение какой-либо поставленной задачи, представляет гобой изображения. Это некоторые двумерные (реже трехмер- ные) распределения оптических характеристик — цвета, яркости и г. д., описывающие физическую ситуацию, характерную для ‘II Г. Рамбиди
162 Гл. 5 Реакционно-диффузионный процессор рассматриваемой задачи. Они могут отображать срезы тканей в медицине, шлифы в материаловедении или геологии, окру- жающую среду, в которой функционирует автономный робот, последовательно рассматриваемые детали на конвейере в ходе автоматизированной проверки качества продукции. Все это лишь наугад взятые примеры из огромной совокупности ситуаций, характерных для современной человеческой деятельности. В си- лу этого обработка и распознавание изображений превратилась сегодня в самостоятельную практически важную область. Всеобъемлющее проникновение цифровой вычислительной техники практически во все области современной деятельности обусловило, естественно, и использование этой техники для ра- боты с изображениями. Тем не менее, высокая вычислительная сложность связанных с изображениями проблем и глубокая есте- ственная связь их с человеческим зрением достаточно давно при- вели к стремлению создавать подходы и средства, основанные на биологических принципах обработки информации. Передача, хранение и обработка информации биологическими системами принципиально отличается от тех же операций, про- изводимых современными цифровыми ЭВМ. В качестве исход- ных элементарных единиц информации в этом случае выступают достаточно сложные фрагменты, а не побитово передаваемые структуры простейших символов. Это могут быть фонемы при обработке речевой информации, изображения, которыми опери- рует зрение и т. д. Первые, по-видимому, попытки использовать эту принципиальную особенность биологических систем были предприняты еще в 50-е гг. прошлого века. Одной из основ- ных среди них было создание «клеточной логики» — области вычислительной геометрии, которая представляет собой алгебру бинарных изображений, заданную на матрицах бинарных чисел. Позже, в 60-е гг. Бламом была предложена идеология «степного пожара», основанная на волновых принципах одновременной об- работки изображения в целом. Так, например, возбуждая волну во всех точках контура произвольного замкнутого многоуголь- ника и измеряя временную зависимость площади возникающем в процессе движения контура фигуры, можно определить число ее углов. Позже было показано, что алгоритм Блама оказывается достаточно эффективным для выполнения ряда операций обра ботки изображений. В последние годы были разработаны математические основы и техника обработки изображений, названная «математическая морфология». Эта техника, ориентированная на современные
5.2. Обработка изображений средами типа Белоусова-Жаботинского 163 Исходное изображение Рис. 5.7. Основные операции метода математической морфологии цифровые компьютеры, успешно используется для решения це- лого ряда задач. Бинарная математическая морфология оперирует со слож- ными двумерными (в принципе и с многомерными) объектами, определенными в дискретном пространстве с дискретными коор- динатами (точки-пиксели). Объект «А» — набор пикселей «а», удовлетворяющих условию; А= {а | свойство (а) = TRUE}. Несмотря на цифровое представление исходных данных, ма- гматическая морфология оперирует с изображениями в целом. >лементарными операциями в бинарной математической морфо- югии являются наслаивание (dilation) и эрозия (erosion). При пом вводятся понятия изображения (объект А) и структурного >лсмента (объект В), который определяет характер изменения формы объекта А на его границах (рис. 5.7). В общем случае операция наслаивания Dilation А ф В = {ж : (В)ж П А / о| увеличивает изображение, а операция эрозии
164 Гл. 5. Реакционно-диффузионный процессор Erosion ЛОВ = {ж : (В)ж С А} уменьшает его. На этих элементарных операциях строятся две основные опе- рации математической морфологии — «открыть» (opening): Opening А о В = (А©В) ф В и «закрыть» — (closing): Closing А • В — (А ф В)©В. Детальное рассмотрение показывает, что совокупность опера- ций «открыть» и «закрыть» позволяет произвести все основные операции обработки изображений — выделение контура изоб- ражения, его скелета, разделить изображение на его простей- шие фрагменты и т. д. В качестве примеров показаны некоторые операции, выполняемые техникой математической морфологии: сглаживание изображения и выделение его отдельных областей и границ между ними (рис. 5.8) и разделение объектов по вели- чине (рис. 5.9). Общей чертой всех этих явных или неявных попыток модели- ровать биологические особенность обработки информации было то, что они развивались как численные вычислительные мето- ды обработки информации. Предпринимались и попытки скон- Рис. 5.8. Обработка изображений методом математической морфологии
5.2. Обработка изображений средами типа Белоусова-Жаботинского 165 Исходное изображение Рис. 5.9. Разделение объектов по величине методом математической морфоло- гии Результат обработки струировать цифровые вычислительные системы максимально адаптированные к этим вычислительным подходам, в частности для выполнения операций клеточной логики. Тем не менее, они не привели к существенным результатам, по-видимому, в силу принципиальных различий дискретной цифровой методологии и биологических принципов. 5.2.2. Обработка изображений: реакционно-диффузион- ные среды и математическая морфология. Реакционно-диф- фузионная среда — это материальное устройство обработки ин- формации, принципиально отличающееся от цифровых средств. Информация вводится в среду в виде естественных фрагмен- тов — изображений, и обрабатывается средой без их дискрети- зации и перевода в цифровую форму. В сущности, это аналого- вая форма обработки информации, где в качестве имитируемого процесса можно рассматривать функции обработки информации корой головного мозга человека. Нужно отметить, что основная методологическая трудность использования реакционно-диффузионных устройств заключает- ся в том, что понимание механизмов решения тех или иных конкретных задач мозгом оставляет желать лучшего. Если бы они были известны, моделирование этих механизмов средами, архитектура которых сходна с нейросетями Гроссберга, позво- лило бы создавать эффективные устройства, подобные по своим функциям коре головного мозга. Незнание этих механизмов, в сочетании с укрепившимися в сознании фон-неймановскими принципами обработки информации приводят нередко к неэф- фективным алгоритмам. Поэтому построенные на их основе устройства не используют основных принципиальных преиму- ществ реакционно-диффузионных сред. В то же время, угадан- ный алгоритм обработки информации реакционно-диффузионной । редой приводит, с одной стороны, к эффективному устройству и,
166 Гл. 5. Реакционно-диффузионный процессор в то же время, позволяет надеяться, что он проясняет механизмы функционирования коры головного мозга. В 1986 г. немецкий исследователь Лотар Кунерт обнару- жил замечательное свойство светочувствительных сред Бело- усова-Жаботинского. Они сохраняли достаточно долгое время (минуты) изображение, которое появляется в среде, если это изображение спроецировано на ее поверхность. Оказалось так- же, что за время своего существования в среде введенное изоб- ражение претерпевает эволюцию, в ходе которой периодически выделяется его контур и происходят переходы между негативной и позитивной формами изображения. Этот эффект был описан в статье, опубликованной Л. Кунертом совместно с сотрудниками Научного центра в Пущино К. И. Агладзе и В. И. Кринским, ко- торую авторы назвали «Обработка изображений с использовани- ем светочувствительных химических волн». Позже физические и информационные аспекты этой проблемы детально изучались в Международном НИИ проблем управления и на физическом факультете МГУ. В ходе этих исследований было показано, что, действительно, во многих случаях результаты эволюции изображения в сре- де адекватны одной из операций обработки изображений, ис- пользуемой на практике. Тем не менее, оставался открытым ряд вопросов, играющих важную роль в практическом примене- нии химических реакционно-диффузионных сред для обработки изображений: • Что лежит в основе сходства результатов эволюции изоб- ражения в среде и операции его обработки? • Всегда ли эта эволюция выделяет только элементы изоб- ражения введенного ранее в среду, или же в ходе его эволюции могут возникнуть особенности, не содержащиеся вообще в исходном изображении? Ответ на эти вопросы оказался возможным на основе де- тального сравнительного анализа обработки изображений хими- ческими реакционно-диффузионными средами и методом мате- матической морфологии. Рассмотрим результаты этого анализа, начиная с обработ- ки черно-белых изображений средой Белоусова-Жаботинского, состав которой отвечает ее функционированию в возбудимом режиме. Возбудимый режим. Основными элементарными операци ями обработки изображений реакционно-диффузионной средой, функционирующей в возбудимом режиме можно считать две
5.2 Обработка изображений средами типа Белоусова-Жаботинского 167 Операция «Контур(+\> Операция «Контур-'» Определение формы фигуры Сегментация изображения Детали изображения, усиливаемые средой Рис. 5.10. Исходные элементарные операции среды Белоусова-Жаботинского операции выделения контура введенного изображения, которые можно определить как «Контур1-4’» и «Контур^-’» (рис. 5.10). 11етрудно видеть, что всегда контур, выделившийся на границе и юбражения, распространяется в области, засвеченной световым шлучением. Поэтому в случае «Контур(+’» контур изображения расходится в процессе эволюции изображения в среде от его цен- ipa, а во втором случае контур сходится к центру изображения. Выбор той или иной операции определяется вводом в среду по- 1ИТИВНОЙ или негативной формы обрабатываемого изображения.
168 Гл. 5. Реакционно-диффузионный процессор Открыть Закрыть Рис. 5.11. Моделирование операций математической морфологии средой Бело- усова-Жаботинского Результаты экспериментального выполнения этих операций хо- рошо согласуются с численным моделированием этих операций. Нетрудно видеть, что эти операции адекватны операциям «наслаивания» и «эрозии» математической морфологии. Есте- ственно, они не совпадают полностью. Эволюция изображения в реакционно-диффузионной среде отвечает частному случаю, когда преобразующий структурный элемент математической мор- фологии имеет форму круга. В этом приближении реакцион- но-диффузионная среда легко воспроизводит основные операции математической морфологии «открыть» и «закрыть». На рис. 5.11 показано выполнение этих операций над простыми изображе- ниями методом математической морфологии и эволюция этих же изображений в реакционно-диффузионной среде. И в том, и в другом случае результаты обработки практически совпадают, и реакционно-диффузионная среда как бы моделирует процесс выполнения этих операций. В силу сходства исходных операций, выполняемых методом математической морфологии и реакционно-диффузионными сре- дами, эти среды дают возможность выполнить все используе- мые на практике операции обработки изображений. На рис. 5.10 показана операция определения формы сложной фигуры, когда исключаются малые по сравнению с размерами фигуры особен- ности изображения и проявляется основа его формы. Утоньшение элементов изображения приведено на том же рисунке. Различные направления движения контуров отдельных фрагментов изобра
5.2. Обработка изображений средами типа Белоусова-Жаботинского 169 Рис. 5.12. Восстановление изображений и удаление шумов средой Белоусо- ва-Жаботинского, функционирующей в возбудимом режиме: а — удаление негауссовых шумов, б — восстановление изображения жения приводят к тому, что среда исключает, или же наоборот увеличивает отдельные детали изображения. Выполнение реакционно-диффузионной средой операций «от- крыть» и «закрыть» позволяет производить над изображениями более сложные действия. На рис. 5.12 показано восстановление изображения, в котором образовались случайные дефекты, и уда- ление негауссовых шумов, засоряющих изображение. Отметим, что в возбудимом режиме функционирования среды определение скелета изображения оказалось возможным только для ограниченного класса протяженных изображений, образо- ванных достаточно тонкими фрагментами. В общем случае эта операция выполняется средой, функционирующей в триггерном режиме. Численное моделирование этой операции показано на рис. 5.6. К сожалению, среда типа Белоусова-Жаботинского в триггерном режиме нечувствительна к световому излучению, что не позволяет определять экспериментально скелет фигуры произвольной формы. Более полное сравнение результатов обработки изображе- ний методом математической морфологии и эволюции изображе- ний в реакционно-диффузионной среде Белоусова-Жаботинско- го приведены в табл. 5.1. Первый и основной вывод, вытекающий из этого сравнения, заключается в том, что результаты эволюции изображения в среде действительно совпадают с операциями обработки изображений. В основе этого лежат, по-видимому, нелинейные механизмы, присущие и тому, и другому подходу.
170 Гл. 5. Реакционно-диффузионный процессор Таблица 5.1 Сравнение обработки изображений методом математической морфологии и реакционно-диффузионными средами Белоусова-Жаботинского Математическая морфология Химическая реакционно-диффузионная среда Численный метод обработки изоб- ражений, основанный на нелиней- ных преобразованиях их формы Обработка изображений химиче- ской реакционно-диффузионной средой, основанная на нелинейных динамических механизмах Объект обработки — изображение, представленное набором пикселей Объект обработки — изображение, вводимое как единое целое в среду Обработка изображения пиксель за пикселем последовательно цифро- вым компьютером Параллельная обработка изображе- ния одновременно во всех его точках распределенной химической средой Различные режимы обработки изоб- ражений на основе структурных элементов произвольной формы Используется практически только один круговой структурный элемент «Наслаивание» и «эрозия» — исход- ные элементарные операции обра- ботки изображений. Две основные операции — «от- крыть» и «закрыть», сводятся к сов- местному применению элементар- ных операций «Контур и «Контур (-)» — ис- ходные элементарные операции об- работки изображений. Операции «открыть» и «закрыть» могут быть сведены к совместно- му применению этих элементарных операций Могут быть выполнены практиче- ски все операции обработки черно-белых изображений Могут быть выполнены практиче- ски все операции обработки черно-белых изображений Может быть выполнено большое число операций обработки полуто- новых изображений Может быть выполнено большое число операций обработки полуто- новых изображений, эквивалентных операциям математической морфо- логии
5.2. Обработка изображений средами типа Белоусова-Жаботинского 171 Тем не менее, следует подчеркнуть и различия этих подходов, хотя они и не разрушают основных выводов. Метод математической морфологии позволяет работать с раз- личными по своей форме структурными элементами. Это дает возможность зафиксировать более тонкие особенности обрабаты- ваемого изображения, что является его явным преимуществом. В то же время, сложность поведения сред Белоусова-Жа- ботинского очень велика. С одной стороны, как будет показано ниже, это может привести при обработке изображений к арте- фактам, не отвечающим реальным структурным особенностям изображения. Для того, чтобы избежать этого, приходится тща- тельно выбирать режимы обработки изображения средой Бело- усова-Жаботинского. С другой стороны, в результате высокой сложности поведения среды возникают новые возможности выде- ления информации о структуре изображения, которые слишком сложно, или же попросту невозможно получить методом матема- тической морфологии. В целом, не вызывает сомнения то, что реакционно-диффу- зионные среды (и в частности среды Белоусова-Жаботинского) позволяют надежно и достаточно просто получать информацию о структуре изображения. Колебательный режим. Эволюция изображений в среде ти- па Белоусова-Жаботинского, функционирующей в колебатель- ном режиме, оказывается существенно более сложной по сравне- нию с возбудимым режимом. Большие возможности детального анализа возникают в случае обработки полутоновых изображе- ний. В этом случае позитивное полутоновое изображение преоб- разуется средой сначала в негативное черно-белое изображение. После этого, в общем случае, происходит выделение контуров отдельных фрагментов и далее изображение преобразуется в ис- ходное полутоновое. Продолжительность каждого этапа этой эволюции и проявляющаяся при этом информация о структурных особенностях изображения может быть различной в зависимости от контраста исходного изображения (рис. 5.13). При появлении негативной формы изображения его полутоновые фрагменты, по- чернения которых меняются от точки к точке, проявляются как непрерывная последовательность деталей фрагмента с различны- ми почернениями, начиная с самых темных деталей. Детальная регистрация этого процесса (рис. 5.14) дает возможность строить гистограммы распределения почернений в каждом из фрагментов изображения.
172 Гл. 5. Реакционно-диффузионный процессор Рис. 5.13. Обработка полутоновых изображений средой Белоусова-Жаботин- ского, функционирующей в колебательном режиме: а — исходное изображение, б-г — зависимость эволюции от экспозиции изображения Эволюция полутонового изображения Начальная стадия эволюции Рис. 5.14. Детали обработки изображений средой Белоусова-Жаботинского. функционирующей в колебательном режиме
5.2. Обработка изображений средами типа Белоусова-Жаботинского 173 Рис. 5.15. Колебательный режим среды Белоусова-Жаботинского в условиях сильной освещенности Эволюция изображения в процессе ввода в среду Исходное изображение Интенсивная освещённость 1 Низкая освещенность (эволюция контуров) (колебания) Рис. 5.16. Переключение режимов среды Белоусова-Жаботинского световым излучением
174 Гл. 5. Реакционно-диффузионный процессор Среды Белоусова-Жаботинского, функционирующие в коле- бательном режиме, отличаются высокой сложностью поведения. Прежде всего это проявляется при оптическом вводе изображе- ния. Если экспозиция изображения превышает некоторую, зави- сящую от состава среды и интенсивности излучения величину, среда начинает функционировать в режиме, сходном с режимом ведущего центра. При вводе черно-белого изображения на гра- ницах его фрагментов возникают контуры, распространяющиеся по засвечивающимся областям изображения (рис. 5.15). Контуры появляются последовательно, с интервалами 20-40 секунд и не подавляются световым излучением. Замечательной особенностью этого процесса оказывается то, что если засветку (ввод изобра- жения) в какой то момент прекратить, среда сразу же начинает функционировать в колебательном режиме (рис. 5.16). При этом все появившиеся контуры участвуют в колебаниях. При повтор- ном включении засветки среда снова начинает функционировать в режиме ведущего центра. Качественно процесс оптического ввода информации мож- но описать как перемещение точки пересечения нуль-изоклин (см. рис. 5.2) при сдвиге изоклины ингибитора под действием светового излучения. При определенной величине засветки эта точка переходит из области колебательного режима в область возбудимого и, по-видимому, в область ведущего центра. Эта особенность среды, функционирующей в колебательном режиме, играет важную роль при обработке изображений. Коли- чество появившихся контуров не связано со структурой изобра- жения и определяется только особенностями динамики среды — составом и экспозицией изображения. Поэтому при выполнении операций обработки изображений средой в колебательном ре- жиме необходимо предварительно определять ту максимальную величину экспозиции, когда среда еще остается в колебательном режиме. Вернемся к обработке изображений средами Белоусова-Жа- ботинского в колебательном режиме. Ими могут быть выполнены практически все операции обработки черно-белых изображений. Но наиболее интересные возможности возникают в случае по- лутоновых изображений. Как было видно из приведенных уже примеров, уникальное свойство сред Белоусова-Жаботинского заключается в том, что они преобразуют пространственное рас- пределение сложной информации во временную последователь- ность фрагментов этой информации, на каждом этапе которой выделяются некоторые части фрагментов с одним и тем же по- чернением изображения. Иными словами, среда Белоусова-Жа
5.2. Обработка изображений средами типа Белоусова-Жаботинского 175 Рис. 5.17. Выделение «скрытого» изображения средой Белоусова-Жаботин- ского ботинского в колебательном режиме представляет собой есте- ственную реализацию пространственно-временного процессора. Это позволяет использовать их для выполнения сложных задач обработки изображений. Приведем несколько примеров. «Скрытое изображение» — это фрагмент картины, яркость которого незначительно отличается от яркости фона картины. Пример такой ситуации показан на рис. 5.17. Разница в яр- кости между изображением орла и фоном (5.17, а) составляет 10 единиц модели HSB программы Photoshop. Многократное увеличение яркости и контраста этого изображения не приводит к существенному улучшению ситуации (5.17,6). В то же время эволюция изображения в среде Белоусова-Жаботинского поз- воляет выделить изображение орла, несмотря на очень малую разницу яркости этого фрагмента и фона (рис. 5.17, в). Рис. 5.18. Колебательный режим среды Белоусова-Жаботинского в условиях сильной освещенности
176 Гл. 5. Реакционно-диффузионный процессор Рис. 5.19. Операция «водораздела», выполняемая средой Белоусова-Жаботин- ского Рис. 5.20. Обработка аэрофотоснимков средой Белоусова-Жаботинского: по- зитивный (я) и негативный (б) снимки а б в Рис. 5.21. Выделение сети дорог (а) методом математической морфологии (б) и средой Белоусова-Жаботинского (в)
5.2. Обработка изображений средами типа Белоусова-Жаботинского 177 Важную роль в медицине, материаловедении, геологии и дру- гих областях деятельности играет выделение фрагментов изоб- ражений одной и той же яркости. На рис. 5.18 показан пример решения такой задачи для позитивной (а) и негативной (б) формы изображения. Одной из встречающихся на практике задач для полутоновых изображений являются «операции водораздела», которые позво- ляют получить информацию о форме изображенного на рисунке рельефа. Пример решения такой задачи показан на рис. 5.19. Анализ и дешифровка изображений, полученных со спут- ников, представляет собой важную проблему, решение которой находит важное применение в различных областях человеческой деятельности. Эволюция изображений такого типа (рис. 5.20) в среде Белоусова-Жаботинского позволяет разделить его на отдельные фрагменты и упростить его анализ. Близкая к этому задача — определение сети дорог на аэрофо- тоснимке. Известны попытки использовать технику математиче- ской морфологии для выделения сети дорог на аэрофотоснимке города. Эту же задачу можно решить средами Белоусова-Жа- ботинского. На рис. 5.21 показаны исходное изображение центра города (рис. 5.21, а), предварительное выделение сети дорог ме- тодом математической морфологии (рис. 5.21,6) и аналогичная операция, выполненная средой типа Белоусова-Жаботинского (рис. 5.21, в). 5.2.3. Изображения, оптические иллюзии и реакци- онно-диффузионные среды. Зрение млекопитающих и, в особенности, человека представляет собой наиболее сложное и изощренное явление активности коры головного мозга. Изображение окружающей человека реальности проецируется на сетчатку глаза, и после ряда преобразований в зрительном тракте попадает в зрительный кортекс (рис. 5.22). Это отдел коры головного мозга, который производит первичную обработку изображения. Считается, что зрительный кортекс выполняет простейшие операции — выделение контуров фрагментов изображения, границ фрагментов, линий одного направления и т.д. Выше было обращено внимание на то, что именно для объяс- нения отдельных функций коры головного мозга, прежде всего связанных со зрением, Стивеном Гроссбергом была предложена концепция специализированных нейронных сетей. При этом, со- 1ласно Гроссбергу, их функциональные особенности во многом адекватны особенностям химических реакционно-диффузионных
178 Гл. 5. Реакционно-диффузионный процессор Зрительный кортекс Рис. 5.22. Схема обработки изображений человеческим мозгом в Рис. 5.23. Моделирование иллюзий Канисы (а, б) и точек-фантомов (е) средой Белоусова-Жаботинского сред, в частности сред Белоусова-Жаботинского. В силу этого возникает желание понять, можно ли моделировать отдельные функции человеческого зрения, используя для этого химические реакционно-диффузионные среды. Одна из особенностей человеческого взаимодействия с окру- жающим миром заключается в ложном восприятии его отдель- ных явлений — иллюзиях. Известно большое количество разно-
5.2. Обработка изображений средами типа Белоусова-Жаботинского 179 Рис. 5.24. Моделирование иллюзий «вазы Рубина» (а), «саксофониста» (б) и «Иисуса Христа» (в) средой Белоусова-Жаботинского образных иллюзий, связанных со слухом и осязанием. Но наибо- лее интересными среди них оказываются оптические иллюзии. Одна из них, часто упоминаемая — иллюзия Канисы. На фигуре, изображенной на рис. 5.23 человек ясно видит треуголь- ник, которого на самом деле на рисунке нет. В случае системы черных квадратов в промежутках между их углами появляют- ся кажущиеся темные расплывчатые образования — иллюзия гочек-фантомов. Если ввести эти изображения в среду Бело- усова-Жаботинского, функционирующую в возбудимом режиме,
180 Гл. 5. Реакционно-диффузионный процессор то оказывается, что в результате эволюции выделившихся кон- туров изображений появляется треугольник (иллюзия Канисы) или же система точек в промежутках между углами квадратов (иллюзия точек-фантомов). Поэтому хотелось бы предположить, что информационные возможности зрительного кортекса, моде- лируемые нейросетями Гроссберга и, как следствие, динамикой реакционно-диффузионных сред, включают в себя не только простейшие операции обработки изображений. Колебательный режим химических сред Белоусова-Жабо- тинского позволяет, по-видимому, сделать предположения о ме- ханизмах других оптических иллюзий. Иллюзия, которую назы- вают «вазой Рубина», заключается в том, что человеческий глаз видит или вазу, или же два человеческих профиля (рис. 5.24, а). При этом восприятие нередко оказывается размытым — на- блюдателю трудно выбрать между этими двумя возможностями (по-видимому, темная центральная часть изображения ближе по восприятию к вазе, а темная периферия — к двум профилям). В процессе эволюции в реакционно-диффузионной среде эти два изображения становятся равноправными и постоянно заменяют одно на другое. Это, по-видимому, может объяснить неопреде- ленность восприятия вазы Рубина. И, наконец, преобразование изображения в колебательной среде Белоусова-Жаботинского, может объяснить, почему дли- тельное наблюдение изображения, не вызывающего разумных ассоциаций, приводит, если посмотреть после этого на белую поверхность, к имеющей смысл фигуре (иллюзия «Иисуса Хри- ста»). 5.3. Реакционно-диффузионный процессор: определение кратчайшего пути в лабиринте 5.3.1. Особенности проблемы поиска кратчайшего пути в лабиринте. Проблема поиска кратчайшего пути в лабиринте, заданного некоторыми условиями, является одной из наиболее известных современных задач высокой вычислительной слож- ности. Целый ряд попыток найти эффективные алгоритмы их решения был предпринят начиная с 60-х гг. прошлого века. Среди них были и предложения использовать для решения ла- биринтных задач нелинейные реакционно-диффузионные среды (преимущественно среды типа Белоусова-Жаботинского). Наи- более важной была работа американских исследователей Стейн- бока, Тота и Шовалтера, которые предложили способ определе-
5.3. Кратчайший путь в лабиринте 181 ния кратчайшего пути в сложных лабиринтах, основанный на использовании триггерных волн, распространяющихся в среде Белоусова-Жаботинского. Тем не менее выводы о возможности практического примене- ния реакционно-диффузионных сред долгое время были весьма пессимистическими, поскольку скорость распространения воз- буждаемых в этих средах триггерных волн мала (~ 3 мм/мин) при характерных размерах лабиринта порядка сантиметров. И только сравнительно недавно было показано, что: • известные светочувствительные реакционно-диффузион- ные среды типа Белоусова-Жаботинского могут быть эффективно использованы для решения, по крайней мере, не очень сложных лабиринтных задач; • может быть разработана эффективная техника для нахож- дения пути в лабиринте, исходя из информации о последо- вательных стадиях распространения через него волны. 5.3.2. Основные принципы решения задачи о нахожде- нии кратчайшего пути в лабиринте. Определим лабиринт как объект, топологические свойства которого могут быть описаны при помощи ограниченного ориентированного графа. Это озна- чает, что объект составлен из произвольного количества вер- шин и соединяющих их ребер. В соответствии со спецификой лабиринта разделим вершины на четыре типа: точки старта, которые являются точками входа в лабиринт (индекс таких вер- шин равен 1), промежуточные точки (индекс вершины больше или равен 2, тупики и точки назначения (индекс таких точек равен 1). Простейшими по структуре графами являются деревья, пред- ставленные на рис. 5.25, а. Они имеют одну стартовую точку и произвольное количество ветвей и точек назначения. Бо- лее сложными являются мультиграфы, содержащие циклические комбинации ребер. В этом случае могут быть определены по крайней мере два маршрута, соединяющие выбранные точки парта и назначения (рис. 5.25, б и в). При разработке техники определения кратчайшего пути в ла- гщринте на основе реакционно-диффузионных сред на физиче- ском факультете МГУ были использованы три основных прин- ципа. 1. Информационные системы, функционирующие на основе реакционно-диффузионных сред и способные решать лабиринт- ные проблемы, должны быть гибридными по своей архитектуре, । с. быть комбинацией реакционно-диффузионной среды и уни-
182 Гл. 5. Реакционно-диффузионный процессор Рис. 5.25. Лабиринты различной сложности: а — простой древовидный; б — древовидный, содержащий циклы; в — сложный лабиринт с циклами и произ- вольным числом входов и выходов версального цифрового компьютера. В этом случае операции высокой вычислительной сложности, такие как параллельное распространение волны в лабиринте, осуществляются средой, а последующая обработка данных достаточно низкой вычисли- тельной сложности производится универсальным компьютером. Сделаем несколько замечаний, важных для дальнейшего по- нимания возможности создания эффективной вычислительной процедуры нахождения кратчайшего пути в лабиринте. В основе процедуры лежит представление лабиринта в ре- акционно-диффузионной среде и в памяти компьютера в виде его образа (в простейшем случае — черно-белого изображения, рис. 5.26). Предположим, что определена только точка входа в лабиринт и существует техника, позволяющая записывать по- следовательные стадии распространения волны, инициируемой в точке входа, в память компьютера. При распространении волны вдоль любого пути в лабиринте черный цвет лабиринта меняется на цвет фона (белый). После записи движения волны в память компьютера может быть применена более или менее сложная рас- четная методика, позволяющая проследить за движением фронта волны и определить точку, в которой черное изображение пути в лабиринте исчезнет. Но в этом случае невозможно однозначно определить путь от входа в лабиринт до его выхода, поскольку нет критерия, который позволил бы отличить тупики от точек выхода из лабиринта.
5.3. Кратчайший путь в лабиринте 183 Рис. 5.26. Организация прохождения волны по лабиринту: а — исходное изоб- ражение лабиринта; б — равномерное изменение интенсивности фона пути в исходном изображении; в-д — эволюция изображения б в среде Белоусо- ва-Жаботинского Таким образом, для того, чтобы найти путь в лабиринте, необходимо изначально задать точку старта и точки назначения. Точнее, изображение лабиринта должно обладать структурой, которая выделяет точки назначения и помогает определить мо- мент, когда волна доходит до них. Предположим далее, что точки старта и назначения заданы. Предположим также, что триггерная волна распространяется по лабиринту. Через некоторое время волна достигнет первой точки назначения, ближайшей ко входу в лабиринт. После этого волна будет последовательно доходить до остальных точек назначения. Легко видеть, что в этом случае по времени прохождения полны могут быть определены относительные длины путей, а не сами пути. Поэтому для нахождения кратчайшего пути в лаби- ринте должен быть задан дополнительный алгоритм. Эти соображения определяют принципиальные черты вычис- пительной процедуры для нахождения пути в лабиринте, осно- ванной на волновых процессах, присущих нелинейным реакци- онно-диффузионным средам. Распространение волны через лабиринт — параллельная опе- рация высокой вычислительной сложности. Реакционно-диффу- шонная среда может эффективно выполнять подобную операцию
184 Гл. 5. Реакционно-диффузионный процессор и ее последовательные стадии могут быть запомнены в памяти цифровой вычислительной системы. Ниже будет показано, что для нахождения кратчайшего пути в лабиринте между заданными точками входа и выхода может быть предложена процедура низкой вычислительной сложности, реализуемая цифровым компьютером. В основе этой процедуры лежит обработка изображений, описывающих распространение волны по лабиринту, записанных в памяти компьютера. 2. Принципиально важной проблемой является формирование и хранение изображения лабиринта в среде в процессе прохож- дения по нему волны. Известны попытки решить ее, вырезая об- раз заданного лабиринта из ионообменной мембраны, в которой иммобилизован катализатор реакции Белоусова-Жаботинского. Предпринимались также попытки формировать лабиринт, печа- тая его рисунок на поверхности мембраны и используя раствор катализатора вместо чернил принтера. Тем не менее эти методы не эффективны для создания устройства обработки информации, которое должно быть способно оперативно переходить от одного типа лабиринта к другому, и преобразовывать лабиринт в ходе поиска кратчайшего пути. Возбуждаемые световым излучением среды типа Белоусова-Жаботинского являются, по-видимому, наиболее пригодными для решения лабиринтных задач. Основ- ная их особенность заключается в том, что они хранят доста- точно продолжительное время введенную в них информацию. Поэтому появление изображения лабиринта в среде и процесс его эволюции при прохождении волны могут быть записаны видеокамерой и введены в цифровой компьютер. После этого нахождение кратчайшего пути от входа в лабиринт к выбранному выходу может быть сведено к стандартным цифровым операциям обработки изображений. 3. Решающим моментом в решении лабиринтных задач на основе реакционно-диффузионных сред является возбуждение достаточно быстрого волнового процесса. Известны два вида волновых процессов, распространяющихся в реакционно-диффузионных средах. Первый из них — триггерные волны, возникающие как ре- зультат взаимодействия химических процессов и диффузии ком понентов среды. Скорость распространения триггерных волн невелика: ~ 0,05 мм/с. Второй из них, фазовые волны, которые распространяется независимо от диффузии вдоль созданного каким-либо образом фазового градиента. Фазовые волны быстры, но трудно управля емы.
5.3. Кратчайший путь в лабиринте 185 Для определения пути в лабиринте были использованы воз- буждаемые световым излучением фазовые волны. Если спроеци- ровать на поверхность слоя среды рисунок, интенсивность кото- рого монотонно изменяется по поверхности среды, то эволюция этого изображения будет происходить последовательно, со сдви- гом по времени, начиная с наиболее темных фрагментов изоб- ражения. Поэтому, накладывая на исходное черно-белое изоб- ражение лабиринта дополнительный монотонно изменяющийся световой фон заданной формы, легко возбудить фазовую волну в нужной точке лабиринта. Процедура нахождения кратчайшего пути в лабиринте была реализована в виде двух основных стадий. На первой из них негативное — белое на черном фоне, изображение лабиринта вводилось в реакционно-диффузионную среду (точнее, изображение «лабиринт + монотонно меняющийся вдоль лабиринта фон» проецировалось на поверхность среды с некоторой выбранной экспозицией, рис. 5.26). В среде возникал позитивный образ введенного изображения, по которому в ходе дальнейшей его эволюции с некоторой задержкой начинала рас- пространяться волна (изменение цвета пути в лабиринте с чер- ного на белый). Последовательные стадии ее распространения фиксировались видеокамерой и вводились затем в память персо- нального компьютера. Изображения, записанные в память компьютера, использо- вались далее для нахождения кратчайшего пути, что было ре- ализовано в виде последовательности стандартных цифровых операций выполняемых персональным компьютером. Разработанная методика оказалась быстрой и эффективной в случае линейных лабиринтов, когда один вход соединен с про- извольным числом выходов, а направление пути меняется не более, чем на 90°. 5.3.3. Процедура нахождения кратчайшего пути в лаби- ринте. Процедура нахождения кратчайшего пути в лабиринте состоит из двух основных стадий. Первой из них является возбуждение фазовой волны в вы- бранной точке лабиринта и запись последовательных шагов про- хождения волны через лабиринт в памяти компьютера. Вторая стадия — численная обработка этих изображений для определения кратчайшего пути между начальной и конечной точкой лабиринта.
186 Гл. 5. Реакционно-диффузионный процессор Обсудим эту процедуру, начиная со случая простого, линей- ного, древовидного лабиринта, имеющего один вход и несколько точек выхода (рис. 5.27). Исходное изображение Эволюция изображения в среде: волна идет из входа в лабиринт MO = LO-L1 Ml М2 = LI-Ml Кратчайший путь в лабиринте Рис. 5.27. Определение кратчайшего пути в простом древовидном лабиринте Пусть заданный монотонно спадающий фон наложен на ис- ходное изображение в выбранной точке входа в лабиринт. После проецирования этого комбинированного изображения на плос- кость реагента Белоусова-Жаботинского в среде появляется негативное изображение. В первый момент появляется изображе- ние исходного лабиринта (черное изображение на белом фоне). После этого возникает распространяющаяся фазовая волна, ко- торая последовательно изменяет черный цвет лабиринта на цвет фона. Время прохождения волны через лабиринт зависит от гради- ента интенсивности наложенного фона. Изменяя величину гради- ента легко сделать это время достаточно малым (порядка 3-5 с), т. е. меньшим чем время жизни негативной фазы изображения в процессе его эволюции в среде. Прохождение волны через лабиринт от начальной точки ла- биринта до его конечной точки показано на рис. 5.27. Так как этот процесс занимает около 3-5 с, то легко записать последова- тельные стадии прохождения волны видеокамерой и сохранить
5.3. Кратчайший путь в лабиринте 187 их в памяти компьютера. Некоторые из этих последовательных изображений представлены на рис. 5.27. Цифровая обработка записанных в памяти изображений ис- пользовалась для нахождение кратчайшего пути от точки входа в лабиринт до точки назначения. Известны различные алгоритмы определения кратчайшего пути от входа в лабиринт до его выхода. В настоящей работе использовалась отличная от этих алгоритмов процедура, которая, по-видимому, более эффективна для методики, основанной на .распространении волны в лабиринте. Исходный лабиринт Операция Распространение волны Проверка на связность Определение пути Рис. 5.28. Основные этапы алгоритма определения кратчайшего пути в лаби- ринте В процессе прохождения волны через точки ветвления, ла- биринт разделялся на два (или более) фрагмента (рис. 5.28). Один их них связан с выходом из лабиринта, тогда как другой не связан. Легко определить фрагмент, связанный с конечной точкой лабиринта, если инициировать обратную волну из выхода чабиринта. В результате фрагменты, связанные с выходом меня- ют свой цвет (черный на цвет фона), в то время как цвет не связанных с выходом фрагментов остается неизменным. Если лабиринт не очень сложен, то возможна замена это- го вспомогательного реакционно-диффузионного процесса стан- дартной процедурой обработки изображений, то есть использо- вать «заливку» черных фрагментов цветом фона (Paint Bucket операция пакета Photoshop), инициированную в точке выхода из лабиринта. Вычитание изображения, полученного после Paint
188 Гл. 5. Реакционно-диффузионный процессор Bucket-операции из начального изображения лабиринта, позво- ляет удалить фрагмент, не связанный с выходом. Все операции обработки изображения, используемые для осуществления обсуждаемой процедуры, могут быть выполнены с помощью программного пакета Adobe Photoshop 5.0. Последовательное повторение этой процедуры при каждом прохождении точки ветвления дает возможность исключить все тупиковые ветви (и пути к другим возможным конечным точкам) и определить путь от входа в лабиринт до выбранной конечной точки. Сделаем замечание, касающееся применимости процедуры нахождения кратчайших путей в линейных древовидных лаби- ринтах. Преимущество этой процедуры заключается в том, что нет небходимости, определять положение точки ветвления с помо- щью человека-оператора. Кратчайший путь может быть найден как результат обработки отдельных изображений, последователь- но записываемых в процессе прохождения волны. При этом для каждого изображения выполняется следующая последовательность операций (предположим, что процесс записи начинается с первого из них L1, см. рис. 5.27): • вычитание изображения L1 из начального изображения ла- биринта L0, для определения пути, который волна проходит от начала до рассматриваемой точки распространения вол- ны (L0-1), • заполнение фрагментов L1, связанных с конечной точкой цветом фона (L1-1), • вычитание L1-1 из L1, т. е. отсечение путей, не связанных с конечной точкой (L1-2), при этом вычитание любого фраг- мента из интенсивности фона должно отвечать нулевому уровню интенсивности, • сложение L0-1 и L1-2, для определения текущего изобра- жение лабиринта (L01), которое используется на следую- щем шаге вместо L0, • изменение L0 на L01. Результат операции, соответствующей каждому шагу, т. е. каждому текущему изображению лабиринта, будет: • таким же, как текущее изображение на предыдущем шаге, если волна не проходит через точку ветвления, • измененное текущее изображение, где отброшены некото- рые части лабиринта, если волна проходит точку ветвле- ния.
5.3. Кратчайший путь в лабиринте 189 Вообще говоря, инициирование обратной волны с помощью операции Paint Bucket для определения части лабиринта, не связанной с конечной точкой, не вполне корректен. Однако пред- ставляется возможным использовать эту операцию, если лаби- ринт не очень сложен и время прохождения лабиринта не очень велико. Описанная процедура проста и эффективна в случае линей- ных древовидных лабиринтов, где все возможные пути от точки входа до точки назначения имеют примерно одинаковые направ- ления, совпадающие с направлением распространения волны. В общем случае эта процедура должна быть изменена, пото- му что инициируемые светом фазовые волны распространяются вдоль градиента фоновой интенсивности, а не вдоль пути в ла- биринте, который может менять свое направление. Изменение предложенной процедуры дает возможность ис- пользовать ее основные принципы и разработать технику, подхо- дящую даже для очень сложных лабиринтов. Такая пошаговая техника основана на делении лабиринта на линейные древовидные фрагменты и последовательной обработке каждого из них. Элементарный шаг этой техники состоит из следующих операций: • определение направления пути в лабиринте в выбранной начальной точке; • возбуждение фазовой волны в этой начальной точке, кото- рая распространяется вдоль градиента фона (в этом слу- чае градиент совпадает с направлением пути в выбранном фрагменте лабиринта) и запись последовательных шагов распространения волны; • отсечение возможных тупиковых ветвей; • определение точек поворота пути. Элементарный шаг заканчивается на точке поворота пути в лабиринте, которая используется далее в качестве следующей исходной точки. 5.3.4. Эффективность метода. Существуют достаточно жесткие условия практической реализации разработанной техни- ки поиска кратчайшего пути в лабиринте. Основным отличительным свойством системы Белоусова- Жаботинского, основанной на Ru-катализаторе, является высо- кая чувствительность к небольшим изменениям условий экспе- римента. Поэтому качество оптической системы, используемой для ввода начальных данных, должно быть высоким. Более того,
190 Гл. 5. Реакционно-диффузионный, процессор реакционная кювета должна быть тщательно защищена от по- стороннего светового излучения. Более того, сложность экспериментальной задачи вынудила разработать реакционно-диффузионную среду, структура кото- рой была оптимальной для этой задачи. Была сформирована двухуровневая реакционно-диффузион- ная система. Катализатор в такой системе иммобилизован на поверхности твердой подложки (тонкого слоя силикагеля), а все другие компоненты реакции находятся в жидкой фазе и реакция проходит на границе раздела фаз. В этом случае реакция типа Белоусова-Жаботинского протекает на границе раздела жидкой фазы и силикагеля, что позволило существенно повысить каче- ство изображения лабиринта (резкость, разрешение и т. д.). Им- мобилизация катализатора предохраняла изображение от иска- жений, которые могли бы быть вызваны случайными внешними воздействиями (толчки, вибрации и т. д.) Сделаем некоторые замечания, касающиеся эффективности предлагаемой методики. Когда волна проходит через точку ветвления, некоторая часть лабиринта не связанная с его выходом, отбрасывается и не участ- вует в дальнейших шагах процедуры. Чем сложнее лабиринт, тем большие его фрагменты отсекаются в процессе нахождения кратчайшего пути. Поэтому замечательным свойством предло- женного метода является увеличение его эффективности при усложнении лабиринта. Пошаговая процедура значительно увеличивает время, необ- ходимое для нахождения кратчайшего пути в лабиринте. Эффек- тивность процедуры зависит от быстродействия реакционно-диф- фузионной среды и от числа точек поворота в лабиринте. Тем не менее, она оказывается более высокой, чем эффективность про- цедуры, использующей триггерные волны. Время, необходимое для обработки лабиринта средней сложности составляет пример- но 5 мин при времени одного цикла среды около 40 с. Это время на порядок меньше, чем время процедуры с использованием триггерных волн. Важным свойством предлагаемого метода является также то, что время определения кратчайшего пути линейно зависит от числа точек ветвления лабиринта.
5.4. Системы взаимосвязанных реакционно-диффузионных реакторов 191 5.4. Системы взаимосвязанных реакционно-диффузионных реакторов: распознающие устройства Большинство экспериментальных и теоретических исследо- ваний реакционно-диффузионных систем были посвящены на протяжении последних десятилетий сложным процессам, проте- кающим в непрерывных однородных средах. Существенно бо- лее сложная динамика отвечает совокупности взаимосвязанных реакционно-диффузионных подсистем, функционирующих, в об- щем случае, в различных динамических режимах. Предположим, что система построена из простейших химиче- ских фрагментов (подсистем) с полным перемешиванием, каждая из которых описывается одномерным кинетическим уравнением: dxi/dt = f(xi). Аттракторы этой системы — стационарные состояния, отве- чают пересечениям нуль-изоклины f(xi) = 0 с осью абсцисс (рис. 5.29). Эти состояния могут быть устойчивыми и неустой- чивыми. Возможны три варианта динамики системы, которая описывается рассматриваемым одномерным уравнением. Два из них — когда система имеет одно стационарное состоя- ние, третий — система с тремя состояниями. Простой анализ устойчивости системы пока- зывает, что если /(ж) при- нимает только одно нуле- вое значение, стационарное состояние устойчиво. Если же /(ж) отвечают три нуле- вых точки, то два стационар- ных состояния (df(x)/dx < < 0) устойчивы, а третье (df(x)/dx > 0) — неустойчи- во. В этом случае система яв- ляется бистабильной,т. е. она может находиться в двух раз- личных состояниях. Рассмотрим сеть, состоя- щую из подсистем этого ти- па, которые связаны диффу- зией, массопереносом или же каким-либо другим механизмом. Тогда если все подсистемы моностабильны, т. е. имеют по одному устойчивому состоянию, сеть также имеет только одно устой- Рис. 5.29. Нуль-изоклины одномерного реакционно-диффузионного уравнения
192 Гл. 5. Реакционно-диффузионный процессор + 212 + Рис. 5.30. Схема проточной системы реакторов для вза- имодействующих реакцион- но-диффузионных систем чивое состояние, которое является однородным. Если же подси- стемы обладают тремя состояниями, то сеть может иметь до 2Л устойчивых состояний. Каждая подсистема может в принципе иметь два состояния, и структура сети задается различными распределениями состояний всех подсистем. В последние годы экспериментально исследовались стацио- нарные структуры в связанных реакционно-диффузионных си- стемах. В частности была изучена система, построенная на основе 16 реакторов полного перемешивания, линейно связан- ных друг с другом. Динамика среды определялась известной хлорит-иодатной реакцией: 2Н2О -> 5СГ +4107 + 4Н+. Это бистабильная система, состояния которой зависят от скорости течения реагента в проточном реакторе. Двум состояниям системы Отвечают высокая и низкая концентрации йода. Состоя- ние каждого реактора определялось по цвету реагента. Для визуализации со- стояния в поток внутри реактора вво- дился крахмал, комплекс которого с йодом имеет глубокую синюю окраску. Два 16-канальных перистальтических насоса (для хлоритных и йодатных сме- сей отдельно) использовались для за- полнения всех реакторов идентичной смесью компонентов. Еще два 16-канальных перисталь- тических насоса осуществляли мас- соперенос. Реакторы были разделены на две группы, четные и нечетные для преодоления экспериментальных помех. Принципиальная схема взаимо- связи реакторов показана на рис. 5.30. Были исследованы два различных варианта динамики имитируемой нейронной сети. Первый из них заключался в том, что один реактор запол- нялся только раствором хлорита натрия, а остальные находились в состояниях с высокой концентрацией йода и были окрашены в синий цвет (несимметричные граничные условия). В результате последующей эволюции системы после включения связей между реакторами наблюдалось распространение волны переключения
5.4. Системы взаимосвязанных реакционно-диффузионных реакторов 193 0,9(+)mL/min l,8(+)mL/min 3,5(+)mL/min II III llllll 4.4(+)mL/min 5,3(+)mL/min 4,4(-)mL/min Illi 'III llllll lllllllll Рис. 5.31. Стационарные структуры, появляющиеся в системе связанных реак- ционно-диффузионных реакторов из состояния с высоким содержанием йода в состояние с низким его содержанием (т. е. изменение цвета от синего к бесцветному). Во втором варианте граничные условия были симметричными (то есть первый и последний реакторы заполнялись изначаль- но раствором хлорита натрия). В этом случае можно было на- блюдать последовательное проявление различных стационарных структур в зависимости от скорости потоков в системе реакторов (рис. 5.31). В начале 90-х гг. прошлого века группа известного физи- ко-химика Джона Росса в Стэнфордском университете (США) сделала важный шаг в понимании значимости связанных реак- ционно-диффузионных систем для обработки информации. Они использовали сетевую архитектуру этих систем для того, чтобы теоретически рассмотреть возможности создавать на их основе информационно-логические устройства и, в частности, реализа- ции машины Тьюринга и нейронные сети типа Хопфилда. Позже Росс с сотрудниками экспериментально показали, что нейронные сети на основе химических систем обладают способ- ностью распознавать простейшие образы. Ими была использова- на бистабильная среда, основанная на реакции 2 Юз + 5 H3AsO3 + 2 Н+ --> 12 |- 5 H3AsO4 + Н2О. будем называть начальное распределение состояний нейронов и сети начальным образом. Он преобразуется сетью в процессе ее < II Г. Рамбиди
194 Гл. 5. Реакционно-диффузионный процессор эволюции в соответствии с правилами, определенными матрицей нейронных связей. Нейронная сеть может запомнить некоторое количество обра- зов, число которых определяется структурой сети. Одна из наи- более известных схем запоминания — так называемое «правило Хебба». Предположим, что запоминаются следующие образы: У'1 = {У^ , ...,у$ ) р = 1, 2, ..., М. Тогда для бинарных векторов правило Хебба определяется сле- дующим образом: ^ = £(2У-1)(21А-1). Как можно показать, это означает, что: • два элемента матрицы связей нейронов Тч, находящиеся в одном и том же состоянии, в большинстве запоминаемых структур связаны, и сила связи зависит от количества структур, в которых эти элементы находятся в одном и том же состоянии; • элементы, которые находятся в различных состояниях в большинстве запоминаемых структур, не связаны. В случае химических нейронных сетей группа Росса исполь- зовала модифицирванное правило Хебба. В этом случае сила связи между элементами i и j определяется как ^ = А1?|^(2^-1)(2^-1) L где А — константа связи, которая определяется в случае химиче- ских сетей как скорость течения реагентов через реактор, 1?{ж} = х, если х О, i9{s} = 0, если х < 0. Было показано, что при использовании этого правила генери- руются устойчивые состояния, соответствующие сохраняемым структурам. Эти теоретические соображения явились основой для экспе- риментальной реализации химических нейронных сетей. Набор из восьми реакторов полного перемешивания с непрерывным по- током реагентов использовался для хранения трех образов (они представляли собой некоторые произвольные наборы чисел). Эти
5.4. Системы взаимосвязанных реакционно-диффузионных реакторов 195 а Рис. 5.32. Матрица связи для химической нейронной сети (а) и процесс распо- знавания числовой последовательности (б) реакторы были связаны массопереносом. Матрица связей для этой системы показана на рис. 5.32. Предположим, что в систему введено некоторое начальное распределение концентраций, отличное от хранимого состояния реакторов при отключенных их связях. Тогда после включения связей возникают две возможности: • сеть реакторов будет иметь однородное (гомогенное) рас- пределение состояний, если картина на входе значительно отличается от сохраненной, • один из хранимых образов проявляется в сети, если вводи- мый образ близок к одному из хранимых. Работоспособность такой химической сети была протестиро- вана набором трех различных образов, которые имели небольшие отличия от хранимых в сети структур. Было при этом показано, что эффективность распознавания структур достаточно высока (см. рис. 5.32). Изучение возможностей распознавания образов химическими сетями, выполненное группой Росса, было первым эксперимен- тальным исследованием в этой области. Следует все же заме- тить, что, несмотря на несомненную значимость этой работы, ее техническое решение было слишком сложным. Установка, использованная для распознавания образов, была громоздкой и неудобной для эффективной работы. Предлагаются также и другие возможности создания химиче- ских многоуровневых систем для решения задач распознавания. Многообещающим, например, является предложение использо- вать электрохимическую связь подсистем. В целом, возможно- сти этого подхода далеко не исчерпаны и можно ожидать уже в ближайшем будущем появления новых вариантов химических распознающих систем.
Глава 6 САМООРГАНИЗАЦИЯ - ОБЩИЙ ПРИНЦИП ОБРАБОТКИ ИНФОРМАЦИИ РАСПРЕДЕЛЕННЫМИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ За последние несколько десятилетий родилась новая наука — физика неравновесных процессов, развитие которой привело к возникновению та- ких новых понятий, как самоорганизация и дис- сипативные структуры, повсеместно используе- мые ныне в широком спектре дисциплин от кос- мологии, химии и биологии до экологии и соци- альных наук. И. Пригожин. Конец определенности 6.1. Самоорганизация и особенности ее проявления в различных динамических системах Понятие, а скорее термин «самоорганизация», широко ис- пользуется в последние годы для того, чтобы описать и объяс- нить сходные явления в физических, химических, биологических и даже экономических и социологических системах. Все они заключаются в том, что, казалось бы, вопреки общепринятым термодинамическим закономерностям в распределенной динами- ческой системе, состоящей из присущих ей простых элементов, возникает упорядоченность — сложные структуры, сложное по- ведение или же сложные пространственно-временные явления. При этом свойства возникающих структур принципиально от- личаются от свойств исходных элементов системы. И наиболее удивительно то, что самоорганизация в системе появляется спон- танно из однородного состояния. Яркие и непротиворечивые примеры самоорганизации были обнаружены среди физических систем. Понятие самоорганиза- ции распространилось и на химические явления, где наряду с ним достаточно широко использовался термин «самосборка». А в биологии самоорганизация на протяжении второй половины
6.2. Процессы самоорганизации и их особенности 197 прошлого века сделалась центральным понятием при описании динамики биологических систем, начиная с внутриклеточных процессов и до эволюции экзосистем. Сегодня примеры самоор- ганизации можно найти и в социологии, и в экономике, и, даже, среди чисто математических объектов. В то же время, по мере того, как идея самоорганизации, так, как она понимается физиками, переходила с физических на другие естественно-научные и социальные объекты, она стано- вилась все более неопределенной. Даже когда процессы само- организации действительно протекают в системе, попытки объ- яснить их в физических и статистических терминах не всегда могут вызвать удовлетворение. Нередко они оказываются в до- статочной степени примитивными и не могут объяснить всего разнообразия процессов, протекающих в сложных динамических системах. В результате в литературе возникает ряд новых тер- минов, которые, по замыслу их авторов, раскрывают или допол- няют отдельные аспекты этого сложного явления. Кроме уже упомянутого термина «самосборка» можно встретить и такие названия, как «стигмергия», «консервативная самоорганизация», «диссипативная самоорганизация» и т. д. В силу всего этого, прежде, чем рассматривать детально сущность явления самоорганизации и механизмы процессов, от- ветственных за упорядочение системы, обратимся к нескольким конкретным примерам, относящимся как к естественнонаучным, так и к социальным проблемам. 6.2. Процессы самоорганизации и их особенности 1. Сольем в сосуде два раствора, содержащих нитрат серебра и хлорид натрия. Ион Ag+, как известно, является индикатором содержания ионов галоидов. Поэтому после смешивания этих двух растворов самопроизвольно выпадает плотный белый оса- док хлорида серебра. 2. Пусть синтезируется полимер на основе двух различных блоков, олигомеров А и В, так, чтобы эти олигомеры последова- тельно чередовались бы в полимерной цепи. Этот процесс назы- вается блок-сополимеризацией. Б результате в синтезированном полимере возникают структуры микрофазного разделения. Эти структуры различны (рис. 6.1), в зависимости как от относитель- ного содержания олигомеров А и В в синтезированном полимере, так и от величины параметра Флори-Хиггинса (х). Он опреде- ляется характером взаимодействия олигомеров и температурой.
198 Гл. 6. Самоорганизация О 0,2 0,4 0,6 0,8 1 Относительное содержание блоков в полимере Рис. 6.1. Структуры микрофазного разделения в ди-блок-сополимерах в зави- симости от относительного содержания блоков в полимере Повышение температуры приводит к уменьшению параметра х и к исчезновению микрофазного разделения. 3. Среди огромного числа органических молекул выделяются так называемые амфифильные соединения. Их молекулы пред- ставляют собой сочетание противоположных по своим свойствам фрагментов — гидрофильной группировки (например, кислотного остатка) и гидрофобного фрагмента, такого как, например, длин- ная углеводородная цепь. В силу своей структуры амфифильные молекулы в полярном растворителе (воде) стремятся находить- ся на поверхности раздела жидкость - газ, где гидрофильные «головы» находятся в воде, а гидрофобные «хвосты» выталки- ваются в газовую фазу. Некоторое количество амфифильных Мицеллы Липосомы Бислои Рис. 6.2. Надмолекулярные структуры амфифильных молекул
6.2. Процессы самоорганизации и их особенности 199 молекул, разное, в зависимости от структуры молекулы, нахо- дится в растворе. При этом возникает тенденция к уменьшению энергии взаимодействия молекул с растворителем за счет са- мопроизвольного образования структурных агрегатов (рис. 6.2). В сферических мицеллах гидрофильные группировки находятся на поверхности сферы, а гидрофобные внутри нее. В результа- те уменьшается отталкивательное взаимодействие гидрофобных хвостов с растворителем. В неполярном растворителе (масле) возникают обратные мицеллы, в которых гидрофильные головы собраны в центре сферического образования. Известно большое число различных надмолекулярных структур — бислои, везику- лы и т. д. Принципиально важные биологические амфифильные молекулы — липиды, образуют основы клеточных мембран. г1>22 Рис. 6.3. Ячейки Бекара (а) и схема движения в них жидкости (б) 4. Нальем на сковороду тонкий слой вязкой жидкости (напри- мер, растительного масла) и нагреем сковороду на огне, поддер- живая температуру поверхности постоянной. Если нагрев слаб, жидкость остается неподвижной. Если же сделать огонь сильнее, увеличивая тепловой поток, то совершенно неожиданно, само- произвольно вся поверхность масла разбивается на правильные шестигранные или цилиндрические ячейки (рис. 6.3, а). Струк- тура на сковороде становится похожей на пчелиные соты. В 1900 г. была опубликована статья французского учено- го Бенара. Он показал, что при нагревании снизу слоя ртути, налитой в плоский широкий сосуд, весь слой самопроизвольно распадался на одинаковые вертикальные шестигранные призмы. В центральной части каждой ячейки жидкость поднимается, а вблизи вертикальных граней опускается (рис. 6.3, б). Т. е. в со- суде возникают конвективные потоки, которые поднимают нагре- тую жидкость вверх, а холодную опускают вниз. Впоследствии эти ячейки были названы ячейками Бенара. 5. Интересные явления самопроизвольного развития структу- ры наблюдаются в бактериальных средах. В качестве одного из
200 Гл. 6. Самоорганизация Рис. 6.4. Фрактальные структуры, возникающие в процессе роста колоний Paenibacillum alvei (а) и распределение в них бактерий в зависимости от концентраций агара и пептона (б) Агар ОД 1,0 10,0 Пептон примеров можно привести изучение эволюции колоний бактерий Paenibacillus alvei. Колонии выращивались в чашках Петри в среде агара, куда добавлялось определенное количество пепто- на. Пептон представляет собой продукт, полученный частичным гидролизом белка, который используется в качестве питания бактериальных сред. В ходе эволюции бактериальные среды са- мопроизвольно образовывали сложные пространственные распре- деления бактерий (рис. 6.4). При этом характер распределения изменялся в зависимости от концентраций агара и пептона. 6. Пусть в замкнутом ареале (например, на острове, не имеющем связи с материком) проживает популяция живых су- ществ, Эволюция ее численности во времени будет определяться, прежде всего, величиной параметра воспроизводимости а, т. е. средним количеством детенышей, производимых одной особью. Будем использовать дискретную временную шкалу. Тогда число особей в момент tn+i должно быть пропорционально коли- честву особей Хп в предыдущий момент tn- -^п+1 &Хп. Но, поскольку ареал ограничен, перенаселенность, возникающая при неконтролируемой рождаемости, должна привести к умень- шению популяции, хотя бы из-за недостатка пищи. Поэтому, вво- дя как ограничение предельную численность популяции, можно описать ее эволюцию так называемым логистическим уравнени- ем X,i+1 = aXn(N-Xn).
6.2. Процессы самоорганизации и их особенности 201 а = 3,54 а = 2,75 а= 1,0 а= 1,25 Рис. 6.5. Решения логистического уравнения в зависимости от воспроизводи- мости популяции Переходя к относительным величинам хп = Xn/N, получим бо- лее удобное выражение = ОХп(1 Хп). Исходя из структуры задачи, первое, что приходит на ум, это то, что в пределе при больших п решение этого уравнения стремится к некоторому пределу. Но логистическое уравнение нелинейно относительно хп и его решение демонстрирует типич- ные нелинейные особенности — бифуркации. Под этим термином подразумевается расщепление зависимости решения от некото- рого параметра на две (или несколько) ветви. Характер поведе- ния решений логистического уравнения определяется величиной параметра а. Нетрудно видеть, что при а < 1 популяция ис- чезает. Непосредственными вычислениями легко показать, что, если значение а находится между I и 3, решение действительно стремится к некоторому асимптотическому значению (рис. 6.5). Но в интервале 3 < а < 3,45 решение колеблется между дву- мя значениями, в интервале 3,45 < а < 3,54 между четырьмя
202 Гл. 6. Самоорганизация Рис. 6.6. Динамика изменения численности рысей и зайцев-беляков в ограни- ченном ареале и далее попадает в область хаоса, когда предсказать значение решения не представляется возможным. Физически поведение решения можно качественно объяс- нить, если принять во внимание, что процессы воспроизводства популяции и ее деградации должны происходить с некоторым временным сдвигом. Все же следует заметить, что используемое для решения разнообразных задач логистическое уравнение представляет со- бой идеальную модель, которая не всегда отвечает реальным процессам эволюции сложной системы. Сходная с логистической, но более сложная проблема на- зывается задачей «хищник-жертва». Она описывает изменение численности двух популяций, когда в дополнение к условиям логистической задачи одна из популяций (жертвы) уничтожается другой (хищники). Этой задаче также отвечают периодические решения. В качестве практического примера эволюции такой си- стемы на рис. 6.6 показано изменение числа рысей и зайцев-беля- ков, установленная по числу заготовленных шкурок, полученных компанией “Hadson Bey” на протяжении 90 лет. 7. В общественных науках самоорганизация, как явление, определяющее происходящие в обществе процессы, привлекала внимание более, чем 150 лет тому назад. Еще основоположник классической политической экономии Адам Смит в своей работе «Исследование о природе и причинах богатства народов» пришел к выводу о том, что спонтанный порядок на рынке является результатом взаимодействия различных, часто противоположных стремлений, целей и интересов его участников. Такое взаимо- действие приводит к установлению никем не запланированного порядка, который выражается в равновесии спроса и предложе- ния.
6 3. Синергетические принципы процессов самоорганизации 203 Высококачественные товары, пользующиеся большим спро- сом и производящиеся в большем объеме (работает положи- тельная обратная связь), напротив, увеличивают порядок, т. е. уменьшают энтропию, так как ускоряются процессы производ- ства и обмена. А они, в свою очередь, повышают занятость, полнее удовлетворяют потребности общества, приводят к росту жизненного уровня людей. Через некоторое время по мере рас- ширения выпуска происходит насыщение рынка этим товаром, наступает момент равновесия между спросом и предложением, но конкурирующие фирмы уже освоили к этому времени новые изделия, поставили на рынок новые товары, с более высокими качествами. Товарно-денежные отношения снова активизируют- ся. И когда производителей достаточно много, новые предло- жения поступают непрерывно. Так поддерживается неравновес- ность рынка и эффективность функционирования экономической системы. Аналогичные идеи высказывались в то время и относительно самоорганизации норм нравственности в обществе. При этом идеи самоорганизации, самосовершенствования деятельности со- циальных систем связывались с эволюционными процессами А в конце XX в. ответ на многие поставленные вопросы пришел из естественных наук, когда было обнаружено поразительное сходство процессов самоорганизации на самых различных струк- турных уровнях материи. 6.3. Синергетические принципы процессов самоорганизации Самоорганизация — явление самопроизвольного образования структуры в различных по своей физической природе системах. Под самопроизвольным возникновением структуры будем под- разумевать появление упорядоченного состояния в изначально случайном распределении компонентов системы без видимого внешнего воздействия. Упорядоченными состояниями в общем случае могут быть сохраняющееся во времени пространственно неравномерное распределение материальных компонентов систе- мы, незатухающие колебания концентраций компонентов систе- мы, когда они осциллируют между двумя или более значениями, более сложные формы упорядоченного коллективного поведения компонентов. Образование структуры одинаково присуще как физическим устройствам типа лазеров и химическим реакцион- ным средам, так и биологическим тканям, сообществам живых организмов, геологическим и метеорологическим процессам, со-
204 Гл. 6. Самоорганизация циальным феноменам человеческого общества. Механизмы са- моорганизации оказываются различными для разных по своей природе систем, но тем не менее всем им присущи некоторые общие структурные и динамические характеристики. Различным по своей природе системам могут отвечать раз- личные, нередко резко отличающиеся друг от друга, уровни сложности самоорганизации. Эта сложность определяется харак- тером самоорганизующейся системы — сложностью ее структуры и поведения, динамических механизмов взаимодействия компо- нентов. Так намного более сложное поведение коллективных на- секомых (пчел, термитов, муравьев) по сравнению с бактериями и вирусами лежит в основе намного более сложных процессов самоорганизации поведения в сообществе коллективных насеко- мых. При этом конкретные проявления процессов самоорганизации на сравнительно простых уровнях ее сложности могут выступать как составная часть явлений на более сложном уровне. В достаточно сложном по своей структуре сообществе му- равьев можно выделить несколько аспектов самоорганизации различного уровня. Прежде всего это относится к строительству жилища — муравьиной кучи. Как известно, особи муравьев выделяют в процессах жизнедеятельности сильно пахнущие ве- щества — феромоны. Они привлекают других муравьев и тем самым служат , в частности, средством управления процессом строительства. Располагая более или менее случайным образом начальный материал для строительства, первые особи оставляют Рис. 6.7. Строительство в сообществе муравьев
6.3. Синергетические принципы процессов самоорганизации 205 Рис. 6.8. Самоорганизация процесса доставки пищи в муравейник на нем следы феромонов. Именно они служат ориентиром для следующих особей, также выделяющих феромоны. В результате возникает сложная по своей структуре конструкция (рис. 6.7). Особи, которые отправляются из муравейника в поисках пи- щи, изначально двигаются случайным образом, выделяя сла- бые следы феромонов. Но, когда особь находит еду и несет ее часть к муравейнику, выделение феромонов резко усиливается. Запах привлекает другие, находящиеся поблизости особи, кото- рые включаются в доставку пищи и еще более усиливают запах проложенного следа. Таким образом самоорганизуется процесс доставки пищи, т. е. целенаправленное поведение в сообществе (рис. 6.8). И, наконец, можно выделить еще один результат самооргани- зации с более сложными механизмами. В процессе эволюции му- равьев происходили случайные мутации особей, которые, в сущ- ности, аналогичны бифуркациям в ходе эволюции физических систем. В ходе естественного отбора мутировавшие экземпляры или вымирали, или становились первоисточником новой линии развития, способствующей продолжению рода. По-видимому, ос- нованное на этом разделение труда в сообществе муравьев мож- но рассматривать как появление структуры в ходе самооргани- зации системы. Нужно отметить, что особенности самооргани-
206 Гл. 6. Самоорганизация зации в сообществе муравьев полностью относятся и другим коллективным насекомым — пчелам, термитам и т. д. Таким образом, самоорганизация представляет собой явление междисциплинарного характера и принадлежит к области зна- ний, которую обычно называют кибернетикой, или более узко синергетикой. Поэтому любой конкретный процесс самооргани- зации основан на некотором дуализме. С одной стороны, самоор- ганизация системы осуществляется конкретными физическими, химическими или какими-то иными механизмами. С другой сто- роны, для того, чтобы система была бы самоорганизующейся, необходимо выполнение общих для всех самоорганизующихся систем кибернетических условий — общих принципов самоорга- низации. Рассмотрим эти принципы подробнее. 1. Процессы самоорганизации возникают в распределен- ных динамических системах. Распределенная система должна представлять собой совокупность большого числа отдельных компонентов, элементов, составляющих систему. К ним мо- гут относиться отдельные молекулы в химических реакционно- диффузионных системах Белоусова-Жаботинского, особи в ко- сяке рыб, отдельные люди в толпе, собравшейся на площади. Эти компоненты должны взаимодействовать друг с другом, т. е. си- стема должна быть динамической, функционирующей на основе динамических механизмов. 2. Важная особенность процессов самоорганизации заключа- ется в том, что они осуществляются в открытых системах. В термодинамически замкнутой системе эволюция во вре- мени приводит к состоянию равновесия. Ему отвечает макси- мальное значение энтропии системы. И, согласно Больцману, это состояние с максимальной степенью хаотичности. В открытых системах возможны два варианта эволюционных процессов: • временная эволюция к равновесному состоянию (вообще говоря, это может быть и эволюция к неравновесному, но стационарному состоянию), • эволюция через последовательность стационарных состоя- ний; при этом смена стационарных состояний происходит благодаря медленному изменению так называемых управ- ляющих параметров (например, температуры среды при об- разовании ячеек Бенара). Известный российский физик-теоретик Ю. Л. Климентович приводил в качестве наглядного примера теорию эволюции Чарльза Дарвина. Она основана на принципе естественного от-
6.3. Синергетические принципы процессов самоорганизации 207 бора. При этом эволюция может вести либо к деградации, либо представлять собой процесс самоорганизации, в ходе которого возникают более сложные и более совершенные структуры. Са- моорганизация является поэтому не единственным результатом эволюции. Ни в физических, ни даже в биологических систе- мах не заложено «внутреннее стремление» к самоорганизации. Альтернативным путем может быть и деградация, физическим примером которой может служить временная эволюция к равно- весному состоянию замкнутой системы. Таким образом, самоор- ганизация — лишь один из возможных путей эволюции. И для того, чтобы понять, по какому пути будет развиваться система, необходим критерий самоорганизации. Известно достаточное количество систем, для которых та- кой критерий очевиден. Так, в случае химической реакционно- диффузионной системы Белоусова-Жаботинского начальное со- стояние отвечает равномерному, т. е. хаотическому, распреде- лению молекулярных компонентов среды. И порядок, т. е. са- моорганизация, отвечает образованию диссипативных структур. Казалось бы, самоорганизация должна отвечать максимальной степени упорядоченности. Но в общем случае ситуация становится существенно бо- лее сложной. Ю. Л. Климентович приводит в качестве примера человеческий организм. Его стационарное состояние отвечает некоторой степени хаотичности, поскольку равновесное состоя- ние (полная хаотичность) в принципе отличается от состояния жизнедеятельности. А именно его нужно считать упорядочен- ным. Таким образом, порядку должна отвечать некоторая норма хаоса, и отклонения от нее и в ту, и в другую сторону нарушают процесс жизнедеятельности, т. е. степень порядка в системе. Основа понимания самопроизвольного возникновения поряд- ка была заложена великим математиком прошлого века Ала- ном Тьюрингом в его работе «Химические основы морфоге- неза». Он показал, что нелинейные динамические механизмы в изначально однородной среде приводят к появлению в ней упорядоченной структуры. Несколько позже основоположник неравновесной термодинамики И. Пригожин детально рассмот- рел процессы образования упорядоченных структур в среде Белоусова-Жаботинского. Поскольку эти процессы требуют при- тока энергии или оттока энтропии (ее диссипации) Пригожин назвал такие системы и образующиеся в них структуры дис- сипативными. Эти процессы называют также неравновесными фазовыми переходами.
208 Гл. 6. Самоорганизация Для возникновения неравновесных фазовых переходов, кото- рые выражаются в образовании новых диссипативных структур, необходимы определенные условия. А. Диссипативные структуры могут образовываться только в открытых системах. Только в них возможен приток энер- гии, компенсирующий потери за счет диссипации и обеспе- чивающий существование более упорядоченных состояний. Б. Диссипативные структуры возникают в макроскопических системах, т. е. в системах, состоящих из большого числа элементов (атомов, молекул, макромолекул, клеток и т. д.). Благодаря этому возможны коллективные взаимодействия. В. Диссипативные структуры возникают лишь в системах, описываемых нелинейными уравнениями для макроскопи- ческих функций. Примерами могут служить кинетические уравнения, например уравнение Больцмана, уравнения га- зовой динамики и гидродинамики. Г. Для возникновения диссипативных структур нелинейные уравнения должны при определенных значениях управляю- щих параметров допускать изменение симметрии решения. Такое изменение выражается, например, в переходе от мо- лекулярного теплопереноса к конвективному теплопереносу по ячейкам Бенара. 3. В системе должны проявляться положительные и отри- цательные обратные связи. Процессы, протекающие в дина- мической системе, стремятся изменить исходные соотношения между вовлеченными в эти процессы компонентами системы. Это условно можно назвать изменениями на выходе системы. В то же время, эти компоненты являются исходными для протекающих в системе процессов, они являются и параметрами на входе в систему. Если изменения на выходе системы влияют на входные параметры так, что изменения на выходе усиливаются, это называется положительной обратной связью или автокаталитическим ростом. Под отрицательной обратной связью подразумевается ситуация, когда динамические процессы в системе поддерживают постоянное состояние на выходе. В общем случае динамические системы с положительными и от- рицательными обратными связями моделируются нелинейными дифференциальными уравнениями. Это является отражением нелинейного характера систем, способных к самоорганизации — основного, по-видимому, свойства системы, определяющего ее способность к самоорганизации.
6.3. Синергетические принципы процессов самоорганизации 209 Немного подробностей: нелинейность окружающего нас мира Окружающий нас мир сложен. Эта сложность проявляется в научных исследованиях, технике, повседневной жизни. В то же время для человече- ского сознания всегда было характерно стремление выделить в этом сложном простую, но отражающую при этом основную сущность часть Рис. 6.9. Зависимость потенциальной энергии ядер двухатомной молекулы от расстояния между ядрами. Различия между гармонической (По) и ангармони- ческой (U) функциями (верх) Обратимся к простейшему физическому примеру — описанию динамки произвольной двухатомной молекулы. Потенциальная энергия взаимодействия ядер молекулы представляет собой достаточно сложную по своей форме функ- цию, которая резко возрастает при малых расстояниях между ядрами, проходит через минимум в точке равновесного межъядерного расстояния и асимптоти- чески приближается к нулю по мере увеличения межъядерного расстояния (рис. 6.9). Нетрудно видеть, что вблизи минимума эта функция может быть аппроксимирована с небольшими отклонениями параболой, которая отвечает так называемому гармоническому приближению для потенциальной энергии ядер молекулы у _ fce(r -Ге)2 ~ 2 А это, в свою очередь, предполагает, что сила, действующая между ядрами молекулы, линейно зависит от изменения расстояния между ними F - -fce(r - Ге). Это приближение играет важную роль, поскольку величина ке определяет частоту колебаний ядер где р — приведенная масса ядер молекулы. Таким образом, три величины: равновесное расстояние между ядрами ге, глубина минимума — энергия диссоциации De и вторая производная энергии ядер молекулы в в точке равновесия ке позволяют описать основные свойства двухатомной молекулы. Минимум на кривой потенциальной энергии ядер отвечает связанному состоянию молекулы. Поэтому решение уравнения Шредингера показывает, что ядра молекулы в основном находятся в окрестности ге и рассмотренная простая модель хорошо описывает динамику ядер молекулы. Влияние же асим-
210 Гл. 6. Самоорганизация метрии функции потенциальной энергии сравнительно невелико. Оно может быть учтено, если в выражение для силы, действующей между ядрами, после- довательно вводить квадратичный, кубический и т. д. члены. Иными словами, переходить от линейной зависимости силы от смещений ядер к нелинейной. В этом простом примере проявляются основные особенности физики про- шлого столетия: • понимание высокой сложности физических явлений, • стремление, если возможно, использовать линейную модель явления, • убежденность в том, что учет нелинейности только несколько уточняет выводы линейной модели. Тем не менее, развитие физического понимания природных явлений при- вело во второй половине прошлого века к постепенному пониманию намного более сложной роли и возможностей проявления нелинейных процессов. Нач- нем изложение особенностей этой ситуации с нескольких простых и очевидных примеров, с которыми приходится сталкиваться в повседневной жизни. Покупая на рынке яблоки, никто не задумывается о линейности процесса, когда решив приобрести четыре килограмма вместо 'двух покупатель подразу- мевает, что будет иметь вдвое большее количество (штук) яблок. В то же время мало кто принимает во внимание то, что увеличивая вдвое, например с 50 до 100 км/час, скорость автомобиля, водитель резко усугубляет последствия возможной аварии, поскольку кинетическая энергия движения автомобиля пропорциональна квадрату его скорости. Эти примеры показывают, что для повседневной жизни характерны как линейные, так и нелинейные явления, о сущности которых никто, вообще говоря, не задумывается Рис. 6.10. Схема построения простейшего фрактала Примеры нелинейных явлений легко найти среди биологических объектов. Для лиственных деревьев характерно большое число разветвлений веток, резко увеличивающее количество листвы. Это называют фрактальной структурой. Само понятие фрактала определяет математический объект, в котором при за- данном последовательном его преобразовании нелинейно увеличивается коли- чество его характерных деталей. Рассмотрим как один из возможных примеров геометрическую структуру, исходное состояние которой, включающее в себя три отрезка, показано на рис. 6.10. Определим в качестве преобразования объекта проведение через середины каждого отрезка перпендикулярной ему линии. При этом в результате каждого последовательного преобразования
6.3. Синергетические принципы процессов самоорганизации 211 отрезок переходит в крестообразную структура с равными лучами. Нетрудно видеть, что в результате каждого преобразования нелинейно растет как число пересечений, так и количество отрезков. Известно большое число фрактальных структур, отличающихся как исходным состоянием, так и правилами его пре- образования. К фрактальным структурам можно отнести и деревья, в том числе лиственные. Для них фрактальная структура была, по-видимому, решающем фактором при выживании в ходе эволюции растительного мира. Первые растения появились около 500 миллионов лет тому назад в па- леозойскую эру. Все началось с риниофитов, которые произошли от зеленых водорослей и первыми заселили сушу. В каменноугольный период на земле произрастали гигантские плауновидные, каламиты и хвощи. Все они отлича- лись малой степенью фрактальности стволов, стеблей, листьев, усваивающих солнечную энергию. В ходе эволюции должны были прогрессировать растения с высокой степенью фрактальности, которая резко повышает количество ли- стьев и, следовательно, количество усвояемой солнечной энергии. Примером фрактальной структуры является и кровеносная система чело- века. В ней насыщенная кислородом кровь проходит через последовательность все более разветвляющихся сосудов. Это дает возможность осуществлять пи- тание всех тканей организма. По-видимому, впервые нелинейные явления привлекли внимание специа- листов более 150 лет тому назад. Джон Скотт Рассел, морской инженер и пре- подаватель Эдинбургского университета, проводил наблюдения передвижения по каналу барж на конной тяге. В своем докладе Скотт Рассел писал, что он об- наружил, что при резкой остановке баржи, передвигавшейся при помощи пары лошадей, от нее отделилась часть воды: «Неистово бурля, она стала собираться вокруг носовой части баржи, а затем вдруг, покинув ее, с огромной скоро- стью покатила вперед, приняв форму обособленного крупного возвышения — округлого, гладкого и резко очерченного скопления воды, которое продолжало свой путь по каналу без сколько-нибудь заметного изменения формы и умень- шения скорости». Скотт Рассел скакал за ним верхом на лошади несколько километров, пока не потерял из виду. Только через 50 лет Д. Дж. Кортвег и Г де Вриз вывели нелинейное уравнение, которое имело решение в виде уединенной волны колоколообразной формы, перемещающейся с постоянной скоростью по поверхности воды в неглубоком канале прямоугольного сечения Интерес к нелинейным явлениям возобновился в 50-е годы в связи с ис- следованиями по физике плазмы. Этому во многом способствовало появление возможности решать нелинейные уравнения с помощью мощных электронных вычислительных машин. Изучение нелинейных явлений на протяжении последних десятилетий про- шлого века привело к фундаментальным результатам. Утвердилось понимание того, что они не только отличаются высокой сложностью, но и, в общем случае, не могут рассматриваться как некоторое уточнение линейных моделей. 4. Важное следствие нелинейности динамических механиз- мов в распределенных системах — проявление так называе- мых «возникающих» свойств и «возникающих» механизмов. Они были подробно рассмотрены в гл. 4 на примере химических реакционно-диффузионных сред. Также, как и в этих средах, в произвольной распределенной динамической системе можно выделить три уровня динамики:
212 Гл. 6. Самоорганизация • уровень взаимодействия элементов среды, т. е. характер их межсоединений (микроуровень), • уровень, на котором система может находиться в том или ином стационарном состоянии (мезоуровень), • уровень взаимодействия состояний системы с ее окружени- ем (макроуровень). При этом именно динамика макроуровня ответственна за проявляющиеся свойства системы. Немного подробностей: диссипативная и консервативная, самоорга- низация, самосборка, стигмергия, и т.д. Остановимся на некоторых понятиях, которые используются наряду с по- нятием «самоорганизация» и, в отдельных случаях, противопоставляются ему. Наиболее употребительным из них сделалось понятие «самосборка». Понятие «самосборка» имеет химическое происхождение. Его ввел в 1987 г. известный французский химик, нобелевский лауреат Жан-Мари Лен для того, чтобы выделить среди многочисленных явлений самоорганизации процессы самопроизвольного структурообразования в системах, которые находятся в состоянии термодинамического равновесия. Действительно, известно большое число таких процессов структурообразования в равновесных, а точнее близких к равновесию условиях. Среди них, например, переходы «спираль-клубок» в полимерных молекулах, образование надмолекулярных структур амфифильных молекул (мицеллы, липосомы, бислои) и т.д., вплоть до процессов кристаллизации. В основном, термин «самосборка» используют по отношению к молекулярным системам. Тем не менее, процессы, относимые к самосборке, были обнаружены и в случае других, микрометровые образований. Так, электрохимическими процессами на границе радела гептан — водный раствор сульфата меди были сформированы, со стороны гептана — прозрачные пленки меди толщиной порядка 1 мкм, со стороны сульфата меди — дендритообразные образования меди. Тем не менее, несмотря на кажущуюся разумность, противопоставление равновесных и неравновесных процессов самопроизвольного структурообразо- вания не кажется оправданным. Прежде всего, строго равновесные процессы на практике встречаются достаточно редко. Хорошо известно, насколько техниче- ски сложно растить большие монокристаллы в изотермических условиях, под- держивая малые скорости роста. Химические процессы осуществляются обыч- но в условиях, близких к равновесным. И критерием этой близости служит обратимость процесса — непременное условие равновесия. Понимание этого позволяет избежать неопределенности, возникающей в отдельных случаях, при описании одинаковых по своим физико-химическим механизмам, но различа- ющихся своей сложностью процессов. Так формирование супрамолекулярных агрегатов амфифильных молекул — например, мицеллообразование в раство- ре, несомненно относится к области самосборки согласно определению этого термина. Но, в то же время, липидные бислои — основа клеточных мембран, с трудом, по-видимому, можно отнести к этой категории. В последнее время, для того, чтобы избежать излишней путаницы, явление самопроизвольного структурообразования в равновесных системах начали называть консерватив- ной самоорганизацией.
6.4 Реакционно-диффузионный процессор 213 В силу всего этого противопоставление понятия «самоорганизация» и це- лого ряда таких понятий как самосборка, диссипативная и консервативная самоорганизация и т.д. вряд ли имеет смысл. Эти понятия, естественно, можно использовать как ограниченные, выделяющие некоторую часть сущности явле- ния термины В целом же все они отвечают скорее отдельным уровням общего понятия «самоорганизация», которые различаются сложностью (структурной и поведенческой) отвечающих рассматриваемому уровню процесса и его дина- мическими механизмами. 6.4. Реакционно-диффузионный процессор — самоорганизующаяся динамическая система Самоорганизация играет определяющую роль в обработке информации биологическими объектами на разных уровнях их сложности. Поэтому устройства, реализующие биологические принципы обработки информации, по своей физической сущно- сти принципиально отличаются от фон-неймановских устройств, которые повсеместно используется сегодня. Рассмотрим в качестве примера возможный вариант про- цессора на основе химической реакционно-диффузионной сре- ды Белоусова-Жаботинского. Не привязываясь к конкретным техническим решениям, будем обращать внимание на основные принципы построения и механизмы функционирования процессо- ра. При этом будем использовать конкретный опыт, полученный при экспериментальном изучении информационных возможно- стей прототипов подобных устройств, описанных в гл. 5. Определим исходные характеристики процессора, которые задают его информационные возможности. Процессор должен представлять собой протяженную реакционно-диффузионную среду, в простейшем случае квазидвумерную, т. е. слой, толщина которого мала по сравнению с его длиной и шириной. Динами- ческие режимы реакционно-диффузионной среды определяются ее состоянием — химическим составом и температурой. Поэтому среда должна быть термостатирована. Должно быть обеспечено также сохранение ее исходных составов в каждом режиме, так как компоненты среды в замкнутом объеме вырабатываются в ходе реакции. Одним из наиболее простых способов выполнения этого условия является использование проточного реактора, в котором состав среды непрерывно поддерживается постоянным. Будем исходить также из того, что среда Белоусова-Жаботинского светочувствительна. Поэтому освещенность среды должна жестко регулироваться. Пусть исходное состояние процессора задано определенным выбором
214 Гл. 6. Самоорганизация концентраций компонентов среды. Ниже будет показано, что наиболее удобно выбирать это состояние так, чтобы концентра- ция компонентов среды отвечала бы колебательному режиму при нулевой освещенности среды (рис. 6.11). Будем предполагать, что катализатор реакции находится в реакторе, иммобилизо- ванный на подходящем носителе. При этих условиях среда, компоненты которой равномерно распределены в системе подачи среды в реактор, попадая в реактор самопроизвольно переходит в динамическое состояние концентрационных колебаний. Таким образом, исходное рабочее состояние реактора создается за счет процесса самоорганизации в среде Белоусова-Жаботинского. Рис. 6.11. Изменение стационарно- го состояния светочувствительной среды Белоусова-Жаботинского в зависимости от ее освещенности Это исходное состояние ре- актора, естественно, может быть использовано для обработки информации, т. е. выполнения операций, инициируемых ко- лебательным режимом среды. Они были подробно рассмотрены в гл. 5. В то же время, возможности процессора могут быть значительно расширены за счет переключения среды в другие динамические режимы, которые позволяют выполнять операции обработки информа- ции, отличные от выполняемых в колебательном режиме. Казалось бы, наиболее естественный путь переключения ре- жима — изменение состава среды, который определяется задани- ем параметров системы заполнения реактора. Тем не менее, этот вариант обладает значительным недостатком. Время переключе- ния динамических режимов среды, в этом случае, оказывается слишком велико — десятки секунд. Состав смеси задается про- изводительностью насосов, поставляющих в среду отдельные ее компоненты, и поэтому система заполнения реактора обладает существенной инерцией. Более удобный и быстрый вариант пере- ключения режимов может быть обеспечен изменением освещен- ности светочувствительной среды Белоусова-Жаботинского. Вернемся к нуль-изоклинам этой системы (рис. 6.11). Ис- ходное состояние среды в реакторе на этом рисунке отвеча- ет полному отсутствию засветки. Это одно из стационарных состояний, отвечающее колебательному режиму среды. Будем освещать среду равномерным световым излучением в видимом
6.4. Реакционно-диффузионный процессор 215 диапазоне спектра. Тогда последовательное повышение интен- сивности излучения приведет к тому, что среда будет проходить через последовательность стационарных состояний. При этом время переключения составляет десятые дли секунды. После переключения среда может находится в каждом из стационар- ных состояний как угодно долго при сохранении химического состава, температуры и интенсивности засвечивающего излуче- ния. Выполняемые средой операции в ее различных состояниях различны, что существенно увеличивает информационные воз- можности реакционно-диффузионного процессора (рис. 6.12). Наряду со световым из- лучением управляемое пере- ключение режимов среды мо- жет осуществляться локаль- ным или глобальным элек- трическим полем. В этом случае возникают разнооб- разные возможности возбуж- дения динамических режи- мов среды и локального воз- действия на них — расщеп- ления волн, их аннигиляции, образования сложных авто- волновых структур. Как отмечалось выше в гл. 5, интенсивное световое излучение переводит среду в инертное состояние. Это AvO £1 Е2 Рис. 6.12. Принципиальная схема дина мики реакционно-диффузионного про- цессора создает целый ряд дополнительных вариантов построения системы обработки информации. Постоянно проецируя на среду заданное распределение интенсивности излучения высокой интенсивности, можно выделять в среде заданные по форме и размеру области. Эволюция среды будет происходить только в этих областях. При этом необходимый динамический режим может быть выбран индивидуально в каждой области заданной степенью ее освещенности (рис. 6.11). Этот технический прием - выделение рабочей области среды интенсивным световым излучением, был использован, например, для поиска кратчайшего пути в лабиринте и формирования «химического диода», подробно рассмотренных в гл. 5. Пусть два пространственных распределения реакционно- диффузионной среды, функционирующие в различных динами- ческих режимах, разделены тонкой перегородкой, проницаемой
216 Гл . 6. Самоорганизация для некоторых компонентов среды. В этом случае возникает самопроизвольный процесс взаимодействия сред, в результате которого изменяются режимы их функционирования. Этот эффект может быть использован для создания многоуровневых устройств, способных выполнять сложные логические функции. Таким образом, реакционно-диффузионный процессор пред- ставляет собой сложную динамическую систему, в которой из химической среды переменного и даже одного и того же состава могут быть сформированы подсистемы, выполняющие различ- ные по своему характеру операции. Формирование их происхо- дит за счет процессов самоорганизации среды, инициируемых управляющими воздействиями. Диффузионные взаимодействия могут объединять отдельные подсистемы, связывая их в единое информационно-логическое устройство.
Глава 7 НОВЫЕ ИДЕИ... НОВЫЕ ВОЗМОЖНОСТИ? Всему свое время, и время всякой вещи под небом... Время разбрасывать камни, и время собирать камни... Время искать, и время терять. Книга Екклесиаста или проповедника Предыдущая глава была посвящена исследованиям послед- них лет в области информационных технологий, основанных на двух, общепринятых сегодня, подходах — парадигме фон Нейма- на и биологических принципах обработки информации. Однако, в тоже самое время предпринимались попытки найти новые пути обработки информации, в чем то отличные от традиционных и обладающие некоторыми преимуществами перед ними. Нельзя сказать, что при этом предлагались какие-либо принципиально новые идеи. Скорее все они использовали некоторое сочетание цифровых фон-неймановских и биологических принципов. 7.1. Развитие биологических принципов обработки информации — аморфный компьютинг На рубеже двух столетий, в самом конце последнего десяти- летия прошлого века, группа исследователей Массачузеттского Технологического Института (знаменитого MIT), несомненным лидером которой был физик Харолд Эйблсон, предложили кон- цепцию «аморфного компьютинга». Эта концепция была поддер- жана Агенством Министерства обороны США по перспектив- ным исследовательским проектам (DARPA — Defence Advanced Research Project Agency) и привлекла к ее разработке значи- тельное число ученых — физиков, химиков и биологов. Авторы концепции рассматривают ее как дальнейшую, более глубокую детализацию биологических принципов обработки информации биологическими системами, построенными из огромного числа локально взаимодействующих элементов. Основная цель аморф-
218 Гл. 7. Новые идеи... Новые возможности? ного компьютинга заключается в разработке таких элементов и способов управления ими, которые могли бы обеспечить их заданное коллективное взаимодействие. При этом предполагает- ся, что для этих объектов характерны проявляющиеся на прак- тике особенности — разброс характеристик, не всегда точно известный характер взаимодействия, изменяющийся во време- ни способ межсоединений. Взаимодействие элементов считается локальным. В сущности аморфный компьютинг в своих исход- ных посылках противоположен идее использования в качестве элементной базы молекулярных образований. Молекулярные эле- менты исходно одинаковы и среди них нет «бракованных» за счет несовершенства технологического процесса. Авторы концепции подчеркивают, что в результате совершен- ствования различных технологических процессов в последние годы создана реальная основа для развития аморфного компью- тинга. Современные технологии создания механо-электронных мик- росистем позволяют формировать чипы, на которых одновремен- но размещаются логические схемы, сенсоры, актюаторы и сред- ства связи между элементами. Авторы концепции отмечают, что сегодня существуют реальные возможности смешать такие чипы со строительными материалами или красками. Поэтому мысли- ма ситуация, когда краска покрывающая стену, чувствительна к вибрациям и предупреждает о вторжении грабителей или же снижает внешний шум. Еще более существенные возможности открывает намного возросшее сегодня понимание биохимических механизмов про- цессов в живых клетках. Это может быть использовано для того, чтобы на основе методов клеточной инженерии созда- вать клетки-сенсоры, клетки-актюаторы, программируемые клет- ки, доставляющие лекарственные препараты в заданные ткани или органы человеческого тела в нужное время и т.д. Основное понятие аморфного компьютинга — элемент систе- мы, частица, обладающая некоторой совокупностью характери- стик (свойств). Изначально предполагается, что для аморфной системы характерен разброс значений свойств в некоторых пре- делах. Предполагается также, что частицы распределены произ- вольным образом на поверхности или в объеме. Частицы вза- имодействуют друг с другом на основе локальных механизмов, которые в общем случае должны быть нелинейными. В резуль- тате этого взаимодействия внутреннее состояние частицы может быть изменено, как это делается, например, методами клеточной инженерии.
7Л. Развитие биологических принципов обработки информации 219 Нетрудно видеть, что основные характеристики аморфной системы повторяют характеристики распределенных реакционно- диффузионных сред. Поэтому, естественно, в аморфной си- стеме могут возникать распространяющиеся волны переклю- чения свойств частиц, образование сложных пространственно- временных структур. Для того, чтобы детально изучать свойства и динамику аморфных систем, авторы концепции выбрали нетрадиционный, своеобразный путь. Были предприняты попытки разработать аб- страктный язык программирования эволюции аморфных систем. При этом разработка языка заключалась, в сущности, в выборе характеристик частиц и операций над ними, которые необходимо задать, для того, чтобы система осуществляла предусмотренное концепцией поведение. Совокупность найденных характеристик должна в последствии быть заложена в создаваемые практиче- ски частицы. Проиллюстрируем этот подход примером, который часто повторяется в литературных источниках описывающих ос- новы подхода аморфного компьютинга. Рис. 7.1. Принципиальная схема полупроводникового инвертора (а), зависи- мость напряжения на его выходе от напряжения на входе (б) и схема форми- рования инвертора методами аморфного компьютинга (в)
220 Гл. 7. Новые идеи... Новые возможности? Одним из основных устройств планарной полупроводниковой технологии является инвертор. Типичный вариант такой схемы, выполненный по КМОП-технологии, показан на рис. 7.1. Сигнал, поступающий на вход такого устройства, удаляет сигнал на его выходе, и наоборот отсутствие сигнала на входе приводит к по- явлению сигнала на выходе (рис. 7.1). Рассмотрим формирование такого устройства в аморфной системе. Язык программирования аморфных систем был разработан Даниэлом Куром и был назван «языком точки роста» (GPL — Growing Point Language). Этот язык применяется по отноше- нию к частицам, которым приписываются определенные свой- ства. Предполагается, что каждая частица обладает сравнитель- но небольшими логическими возможностями и небольшой памя- тью. Частицы функционируют асинхронно. Но, в тоже время их информационная производительность приблизительно одинакова, поскольку они создаются по одной и той же технологии. Все частицы программируются одинаково. Но каждая из них помнит свое состояние и может генерировать последовательность слу- чайных чисел. В общем случае частицы не запоминают свое ме- стоположение и ориентацию. Каждая частица может передавать информацию некоторому числу своих соседей. Это может быть осуществлено радиосигналами или же химическими факторами. При этом предполагается, что существует некоторый радиус свя- зи г, который существенно больше размера частицы, и, в то же время, существенно меньше пространственных размеров аморф- ной среды. Основное понятие GPL — точки роста. Пусть имеется боль- шое число частиц, обладающих одинаковыми свойствами. Вве- дем в их совокупность случайным образом или же по какому-то правилу частицу со свойствами, отличными от окружения. Эта частица — точка роста, инициирует волну переключения со- стояния соседних частиц в пределах радиуса связи. Переклю- чение инициируется сигналами (радио-, химическими), которые посылает точка роста. Этот процесс предполагается по-шаговым, и волна переключения распространяется по полю частиц, если не заданы ограничения ее распространения. В качестве такого ограничения, расширяющего возможности GPL, вводится биологическое понятие тропизма. Оно предпола- гает направленное взаимодействие волн, инициируемых точками роста. Рассмотрим пару примеров. Пусть имеются две точки роста, находящиеся на некотором расстоянии друг от друга и инициирующие волны переключения. При этом будем считать, что волна, исходящая из точки В может переключать только
7.1. Развитие биологических принципов обработки информации 221 частицы, не затронутые волной А. Тогда распространение волны А ингибирует распространение волны В. В качестве второго при- мера рассмотрим ситуацию, когда волна В может переключаться только частицами, расположенными поблизости от А. В этом случае волна В как бы притягивается к точке А. В общем случае можно по аналогии с биологическими явлениями можно ввести понятие феромонов, которые испускает каждая точка роста и концентрация которых монотонно уменьшается по мере удаления от точки роста. Концентрация феромона определяет степень тропизма, т. е. силу отталкивания от этой точки роста или же притяжения к ней. На языке JPL в своем активном состоянии точка роста закладывает материал и выделяет феро- моны. Фактически эти оба процесса реализуются переключением состояния соседней точки, т. е. заданием ее новых конкретных параметров. а б в г 7> е Л Рис. 7.2. Схема формирования последовательности инвертора методами аморф- ного компьютинга, (а)-(е) — последовательности шагов Вернемся к примеру — созданию инвертора сигнала, схема которого была показана на рис. 7.2. Принципиальная схема его на основе элементов, которые формируются в аморфной среде, показана на том же рисунке. Формирование инвертора осуществляется на протяжении нескольких стадий, в ходе которых создаются основные элементы устройства частицами одного типа. Эти стадии показаны на рис. 7.2. Для того, чтобы проиллюстрировать основные особенности GPL, рассмотрим про- грамму первых стадий формирования инвертора (рис. 7.2, а-в): (define -growing-point (make-red-branch length) (matrial red-stuff) (sixe 5) (tropism (and (away-from red-pheromone) (and (keep-constant pheromone-1)
222 Гл. 7. Новые идеи... Новые возможности? (keep-constant pheromone-2) ) ) ) (avoids green-pheromone) (actions (secrete 2 red-pheromone) (when ((clength 1) (terminate)) (defolt) (propagate (- length 1) ))))) В этой программе исходная точка роста обозначается как «красная» (red). В результате процесса, определяемого програм- мой, должна быть выращена ветвь частиц красного цвета (ma- terial red stuff). Направление, по которому осуществляется рост ветви, определяется тропизмом — отталкиванием от красной на- чальной точки, отталкиванием от верхней (pheramonl) и нижней (pheramon2) магистралей, которые предполагаются уже сформи- рованными. По тому же принципу происходит и формирование и осталь- ных элементов инвертора, показанное на рис. 7.2. На основе инверторных схем могут быть созданы различные логические устройства. Поэтому авторы концепции считают, что техника аморфного компьютинга может быть эффективно использована для разработки устройств обработки информации на основе про- мышленно производимых частиц с заданными свойствами. В то же время, наибольшие надежды возлагаются авторами концепции на симбиоз идей аморфного компьютинга и клеточной инженерии. Немного подробностей Генетическая информация, которая определяет структуру, функции, пути эволюции живого организма, закодирована в молекулах дезоксирибонуклеино- вой кислоты — ДНК, которые находятся в ядрах клеток. Основа молекулы ДНК — полимерные цепи, в которых чередуются группировки фосфорной кислоты и одного из сахаров — дезоксирибозы (рис. 7.3). В силу структурных особенностей этих молекулярных групп (т е. величин валентных углов между связями входящих в них атомов) эти полимерные цепи завиваются в спиральные структуры. К каждой рибозной группировке присоединено одно из четырех азотистых оснований: аденин (А), тимин (Т), гуанин (G) или цитозин (С). В целом группировка остатка фосфорной кислоты, дезоксирибозы и основания называется нуклеотидом. Замечательным свой- ством этих оснований являеьтся то, что пары А-Т и G-С могут образовывать за счет водородных связей устойчивые группировки, размеры которых по одной из осей удивительно близки (рис. 7.4). Поэтому эти пары образуют мостики, которые связывают цепи ДНК в устойчивую двойную спираль. Пары А-Т и G-C и построенные на их основе структуры называют комплементарными. При
7.1. Развитие биологических принципов обработки информации 223 Основание Рис. 7.3. Структура молекулы ДНК, строение нуклеотида (а) и объединение нуклеотидов в двойную цепь (б) Рис. 7.4. Комплементарные основания молекулы ДНК размножении (репликации) молекулы ДНК двойная спираль разворачивается. К каждой цепи присоединяется молекула фермента ДНК-полимеразы. Этот фермент.определяет тип основания, захватывает из окружающей среды компле- ментарное ему основание, присоединяет его к формируемой ферментом цепи и переходит к следующему основанию воспроизводимой ДНК. Таким образом, образуется еще одна пара цепей, комплементарных исходным цепям ДНК, которые могут образовывать еще одну двойную спираль ДНК, полностью идентичную исходной.
224 Гл. 7. Новые идеи... Новые возможности? Процессы синтеза белков, постоянно протекающие в клетке и поддержи вающие ее жизнедеятельность, определяются информацией, которая записана тройками оснований (кодонами) в цепи ДНК. Структура синтезируемого белю определяется частью генома — соответствующим этому белку участком ДНК, находящейся в ядре клетки. А синтез белка разделен в прострочен клетки и происходит в других клеточных образованиях — рибосома' Информация о структуре, которая должна быть синтезирована, переносится в рибосому дру- гой молекулой — РНК, структура которой точно отвечает структуре соответ- ствующего участка ДНК. Синтез молекулы РНК, т.е. считывание (транскрип- ция) информации производится ферментом РНК-полимераза. Он расщепляет двухцепочечную молекулу ДНК и на ее основе синтезирует копию участка ДНК — молекулу РНК, отвечающую синтезируемому белку. Этот участок распознается ферментом РНК-полимеразой по специфической метке в цепи ДНК — молекулярной группировке, которую называют промотором. Фериент присоединяется к промотору и начинает транскрипцию с этого места в цепи. В то же время, внутриклеточные процессы в самоорганизующейся системе клетки сложны и многофункциональны. В частности, начало транскрипции зависит еще и от присутствия или отсутствия еще одного белка, который называют оператором. Он может блокировать промотор, что препятствует РНК-полимеразе присоединяться к цепи ДНК и произвести транскрипцию РНК. Клетки живых существ представляют собой сложнейшие биологические устройства, жизнедеятельность которых основана на множестве протекающих в них биохимических реакций. Клетки самопроизвольно делятся, воспроизводя себя в в множестве идентичных копий. В то же время, методы клеточной инже- нерии, развитые на протяжении последних десятилетий, позволяют изменять программу функционирования клетки, воздействуя на ее генетический аппарат. Это создает принципиальную возможность использовать клетки в качестве частиц аморфных систем, способных выполнять сложные функции. Можно представить себе клетки-сенсоры, клетки-актюаторы, и т. д. Существенный интерес для аморфного компьютинга представляет исполь- зование клеточного материала для формирования устройств обработки ин- формации. В качестве одной из возможностей активно обсуждается сегодня создание клеток — инверторов сигналов. Рис. 7.5. Принципиальная схема биомолекулярного инвертора
7.2. Полупроводниковые реакционно-диффузионные устройства 225 Как известно, жизнедеятельность клетки обеспечивается постоянным син- тезом белков, участвующих в ее метаболизме. Синтез происходит в специа- лизированных структурах клетки — рибосомах. Основываясь на этих меха- низмах синтеза белков в клетке, участники проекта «аморфный компьютинг» Зуссман и Т. Найт предложили биохимический подход для создания цифровых устройств обработки информации. В его основе лежит идея биохимического инвертора сигнала (рис. 7.5). Пусть синтезируется белок Z, в процессе синтеза которого РНК-полимераза считывает его структуру с соответствующего участ- ка цепи ДНК В то же время, если существует белок А, который является оператором процесса, синтез белка Z может быть прекращен. Таким образом, система транскрипции представляет собой инвертер, управляемый белком А. Авторы этой идеи считают, что, конструируя взаимосвязанные цепочки синтеза белков в клетке, можно построить цифровые логические устройства достаточно высокой сложности. Рассмотренные возможности создания цифровых устройств являются ос- новными предполагаемыми практическими приложениями принципов и тех- ники аморфного компьютинга, обсуждаемыми сегодня в литературе. Нужно заметить, что в целом они производят неоднозначное впечатление. Исходная точка концепции — распределенная динамическая система частиц. Подобные системы функционируют с высокой степенью параллелизма выполнения опе- раций. Тем не менее, на основе аморфных систем предлагается создавать цифровые устройства с последовательным выполнением операций. Сами авторы концепции отмечают, что скорость функционирования био- химических цифровых устройств должна быть мала. И поэтому навряд ли они могут использоваться для решения проблем высокой вычислительной сложно- сти. Тем не менее, они считают, что принципиальная возможность создания больших надмолекулярных систем заданной структуры открывает новые пути молекулярной инженерии. Так, основная публикация, описывающая принципы и разрабатываемую технику аморфного компьютинга, заканчивается словами: «В целом, мы находимся в примитивной стадии развития клеточного и аморфного компьютинга, аналогично ранним стадиям электроники в начале XX в. Дальнейшее развитие откроет новые границы инженерии, которая будет доминировать в информационных технологиях следующего века». 7.2. Полупроводниковые реакционно-диффузионные устройства — первые попытки Автоволновые процессы, протекающие в химических реакци- онно-диффузионных системах (не говоря уже о биологических), намного медленнее, чем те же процессы в твердотельных полу- проводниковых средах. И, несмотря на то, что быстродействие химических сред достаточно для решения многих практически важных задач, на протяжении последних лет предпринимались попытки создания твердотельных автоволновых систем. Одна из первых экспериментальных работ была выполнена советски- ми физиками Л. Л. Голиком, В. Н. Неменущим, М. И. Елинсоном, и Ю. И. Балкареем еще в 1981 г. 8 Н. Г. Рамбиди
226 Гл. 7. Новые идеи... Новые возможности? Рис 7.6. Автоволновые процессы в сегнетоэлектрике: распространение тепло- вой волны переключения состояний Они использовали пластины сегнетоэлектрического кристал- ла (триглицинсульфата) при температуре несколько ниже тем- пературы Кюри сегнетоэлектрика. Напряжение, приложенное к электодам на плоскостях пластины сегнетоэлектрика с часто- той 103-105 Гц, вызывает нагревание среды. Теоретические оцен- ки показывают, что в этой системе могут возникать стационар- ные состояния при трех различных температурах Т\ <Т% < Т^. При этом два из них (7) и Тз) устойчивы, а одно Тг — неустой- чиво. Исходно среда находится в одном из устойчивых состоя- ний. Локальным нагревом или охлаждением в ней может быть возбуждено другое состояние, которое распространяется в среде как тепловая волна переключения (рис. 7.6). Для того, чтобы визуализировать этот процесс, одна из плоскостей пластины по- крывалась слоем холестерического жидкого кристалла, который изменял свой цвет при изменении температуры. Скорость распро- странения волн в такой системе менялась в пределах 0-1 см/с. Впоследствии изучение автоволновых процессов в полупроводни- ках проводилось по большей части физиками-теоретиками. Так, в 1990 г. советские физики Б. С. Кернер и В. В. Осипов опуб- ликовали в журнале «Успехи физических наук» исчерпывающее
7.2. Полупроводниковые реакционно-диффузионные устройства 227 описание спонтанного образования и эволюции диссипативных структур. К сожалению, до сих пор не было даже попыток использовать автоволновые свойства полупроводников для созда- ния устройств обработки информации. Отличный от этого подход к созданию информационно- логических полупроводниковых устройств был предложен в на- чале нашего века японскими исследователями Тетсуя Ойяма, Иошихито Амемия, и их сотрудниками в университете Хоккай- до. Они начали разработку полупроводниковых планарных схем (чипов), моделирующих химические реакционно-диффузионные среды Белоусова-Жаботинского. Было предложено несколько вариантов схемотехники, реализующих эти модели. Среди них наиболее, по-видимому, интересным является использование од- ноэлектронных осцилляторов. Ранее, в гл. 4 отмечалось, что качественно среда Белоусова- Жаботинского может быть представлена как совокупность эле- ментарных ячеек с размерами менее диффузионной длины, вза- имодействующих за счет диффузии компонентов среды друг с другом. Основными режимами элементарных ячеек являются концентрационные колебания и возбудимый режим. При полу- проводниковом моделировании среды Белоусова-Жаботинского в качестве элементарной ячейки был выбран одноэлектронный осциллятор, построенный на основе туннельного перехода и об- ладающий аналогичными свойствами. Пусть имеется туннельный переход — тонкий слой непрово- дящего материала между двумя электродами. Подадим на элек- троды небольшое постоянное напряжение. Поскольку переход, как простейший конденсатор, имеет электрическую емкость, он начинает заряжаться и при некоторой величине напряжения на электродах происходит туннелирование электрона. После это- го процесс повторяется снова и снова (рис. 7.7). Этот процесс уменьшения сопротивления устройства при малых напряжениях смещения называют «кулоновской блокадой». Нередко такой про- цесс, протекающий в туннельном переходе, сравнивают с после- довательным образованием капель в неплотно закрытом водяном кране. На рис. 7.8 показаны принципиальная схема такого осцил- лятора и и его режимы, для которых характерны наносекундные времена. Для создания модели реакционно-диффузионной среды эти осцилляторы были объединены емкостной связью (рис. 7.8), которая играет роль диффузии. Реальные чипы, отвечающие такой схеме, не были изготовлены. Их функциональные возмож- ности были определены компьютерным моделированием. Оказа- лось, что в устройстве, содержащем 100 х 100 осцилляторов, 8*
228 Гл. 7. Новые идеи... Новые возможности? Электрод Электрод Уровень Ферми металла Уровень Ферми металла Рис. 7.7. Принципиальная схема эффекта «кулоновской блокады» качество регистрируемого волнового процесса оставляет желать лучшего (рис. 7.9). Результаты существенно улучшились, когда схема была модифицирована. В ней использовались осциллято- ры, построенные на нескольких последовательно соединенных туннельных переходах. Разработанный реакционно-диффузионный чип представляет собой квази-плоскую структуру — слой, содержащий осцил- ляторы и элементы их связи. Авторами разработки был сде- лан и следующий шаг. Они попытались создать многоуровневое устройство, в котором квази-плоские структуры были объедине- ны в объемную схему. Компьютерное моделирование функцио- нальных возможностей этого устройства привело к интересным результатам. Качество диаграммы Вороного, инициированной и рассчитанной на первом уровне устройства, резко улучшилось на связанном с этим уровнем третьем слое устройства (рис. 7.10). Это хорошо согласуется с представлениями о важности много- уровневой обработки информации реакционно-диффузионными системами. Сегодня трудно определить практическое значение работы, выполненной японскими исследователями. Необходимо еще мно- го сделать, чтобы понять реальные функциональные возможно-
7.2. Полупроводниковые реакционно-диффузионные устройства 229 С | У ~ Источник тока Vs Q| — Нано-точка 1 Туннельный переход Рис. 7.8. Полупроводниковая реакционно-диффузионная схема на основе ячеек одноэлектронных осцилляторов Рис. 7.9. Эволюция автоволновой спиральной структуры в полупроводниковой реакционно-диффузионной схеме
230 Гл. 7 Новые идеи... Новые возможности? Рис. 7.10 Определение диаграммы Вороного многоуровневым полупроводни- ковым реакционно-диффузионным устройством (а — верхний уровень, б — нижний) сти разработанных полупроводниковых устройств и технологиче- ские особенности их призводства. 7.3. ДНК-компьютинг — изощренное сочетание принципов и «инструментов» обработки информации Девяностые годы прошлого века ознаменовались неожи- данным появлением нового информационного подхода, не имевшего до этого предшественников. В 1994 г. Леонард Эдлмен, профессор информатики и молекулярной биологии университета Южной Калифорнии в Лос Анжелесе опубликовал в журнале «Science» статью под названием «Молекулярные вычисления для решения комбинаторных проблем». Эта статья сразу же завоевала многочисленных сторонников и последователей и сделалась отправной точкой целого ряда развивавших ее работ. Немного подробностей В юности Лен Эдлмен долго не мог найти дело, которым он хотел бы заниматься. Поступив в Калифорнийский университет в Беркли, он сначала выбрал в качестве своей специальности химию, потом медицину и, в конце концов, математику. «Я прошел через множество вещей и, наконец, последнее, что оставалось, для того, чтобы закончить во время, была математика» — писал он позже. Поступив после окончания университета в банк программистом, он продолжал поиски. Снова попытка найти себя в медицине, затем в физике — одновременно с работой в банке. После этого он вернулся в Беркли, где подготовил и защитил диссертацию, посвященную теоретическим аспектам вычислительной сложности. И сразу же после этого он получил должность доцента математики в Массачузеттском Технологическом Институте (МТИ).
7.3 ДНК-компьютинг 231 В это время его коллеги по МТИ Рональд Ривест и Ади Шамир, работали над проблемой защиты информации. Они разрабатывали систему кодирования, так называемый «ключ», представляющий собой математическую формулу для шифровки и дешифровки данных. К этой работе они привлекли Эдлмена. В результате ими была создана система кодирования, получившая по первым буквам их фамилий название RAS-система. Она принесла им известность и, как следствие, деньги. Несмотря на прекрасные условия работы в МТИ, в 1980 г. Эдлмен вер- нулся в Калифорнию, в Университет Южной Калифорнии в Лое Анжелесе. Именно там он почувствовал склонность сначала к иммунологии, а затем к молекулярной биологии, нерешенные проблемы которой, по его мнению, «отличались такой же красотой, как и математические». В особенности его привлекали проблемы хранения генетической информации молекулами ДНК, транскрипция этой информации и ее передача. Уникальной особенностью Эдлмена было то, что интерес к информаци- онным проблемам молекулярной биологии сочетался в нем с глубоким пони- манием проблем высокой вычислительной сложности. Разрабатывая систему кодирования, он исчерпывюще понимал недостаточность традиционных мате- матических методов. Все это вместе взятое привело его к разработке подхода, который был назван ДНК-компьютингом. В качестве конкретной задачи высокой вычислительной сложности, на которой можно было отработать основные принципы подхода, Эдлмен вы- брал проблему нахождения гамильтоновых путей — составную часть «пробле- мы коммивояжера». Проблема нахождения гамильтоновых путей заключается в том, чтобы определить все возможные пути, которые проходят через каждую точку (город, который нужно посетить коммивояжеру) совокупности, содержа- щей N точек. В этой совокупности задаются начальная и конечная точки и, при этом, через каждую точку можно проходить только один раз. Эдлмен выбрал в качестве объекта систему из семи точек (рис 7.11). Его подход заключался в том, чтобы решить задачу в два этапа. Первый из них — одновременное определение всех возможных путей для этой совокупности точек, проходящих и не проходящих через все точки, проходящих через некоторые точки несколь- ко раз и однократно и т. д. Именно этот этап вызывает экспоненциальное время вычислений в общепринятых численных методиках решения проблемы. Второй этап заключается в анализе полученной смеси всех возможных путей. Эдлмен показал, что этот процесс может быть выполнен методами современной генной инженерии с полиномиальным, а не экспоненциальным временем. Техническая сторона подхода заключалась в том, что каждая точка си- стемы «моделировалась» отрезком одноцепочечной молекулы ДНК (рис. 7.11). В методике Эдлмена каждой точке (городу) отвечает отрезок, содержащий 20 различных нуклеотидов. Поскольку каждая точка пути соединена с двумя другими, отрезок ДНК подразделяется на две части, отвечающих правому и левому соседу точки. Кроме этого синтезируются 20-нуклеотидные после- довательности одноцепочечной ДНК, отвечающие всем возможным вариантам расстояний между точками (1-2, 1-3 ... 1-N, ... 2-1, 2-3, 2-4 и т.д.). Каждый отрезок, отвечающий расстоянию между г-й и j-й точками, представляет со- бой последовательность 10 нуклеотидов, комплементарных правой части кода точки i, и 10 нуклеотидов, комплементарных левой части кода точки j. Все отрезки нуклеотидов, отвечающие как точкам, так и возможным расстояниям между ними, сливаются в реактор. В результате между отвечающими друг другу комплементарными кодами ДНК образуются водородные связи. Иными
232 Гл. 7. Новые идеи... Новые возможности? Кодирование вершин графа (х) и их комплиментарные коды (х') рО1 = cgtcAGCC; р12 = tgacGGCT р02 = cgtcGGCT............... р05=.......; р15 =...... Рис. 7.11. Кодирование элементов графа в задаче определения гамильтоновых путей словами, протекает процесс, который называют гибридизацией. После этого специальный фермент (лигаза) сшивает соединенные водородными связями отрезки в одноцепочечные фрагменты ДНК. Таким образом, исходя из самого способа синтеза понятно, что образуется грандиозное количество молекул ДНК, отвечающих всем возможным вариантам путей между точками. При этом все они синтезируются одновременно, т. е. с гигантской степенью парал- лелизма. Вторым этапом решения проблемы гамильтоновых путей, разработанного Эдлменом, было использование техники генной инженерии для того, чтобы определить, есть ли среди компонентов полученной смеси одноцепочечных ДНК экземпляры отвечающие этим путям. При этом Эдлмен посторил технику анализа по принципу последовательного удаления всего, что не относится к решению проблемы. Для того, чтобы осуществить это, Эдлмен предложил следющую схему анализа (рис. 7.12): (шаг!) — выделить цепочки, начальные нуклеотиды которых отвечают начальной точке всех маршрутов, а конечные нуклеотиды — конечной точке, (шаг2) — выделить цепочки длины, отвечающей заданному количеству путей, (шагЗ) — определить, все ли точки путей включены в цепочки нуклеотидов оставшихся ДНК. Если в результате выполненных действий остаются не удаленные молекулы ДНК, то можно считать, что: • решения проблемы гамильтоновых путей существуют, • все решения находятся в оставшихся молекулах ДНК. Следует сразу же отметить, что искомые последовательности нуклеотидов составляют лишь малую часть полученного на первом этапе материала. Поэто- му на первом шаге анализа Эдлмен использовал технику, которая позволила многократно увеличить число молекул ДНК, остающихся для последующих шагов анализа — ПЦР, т. е. полимеразные цепные реакции. Использование этих реакций начинается с того, что к молекулам ДНК присоединяются прай- меры — 20-нуклеотидные последовательности, отвечающие начальной и конеч-
7.3. ДНК-компьютинг 233 ВершинахО вершинах! ACTTgcag TCGGactg cgtcAGCC путь pOI ACTTGCAG TCGGACTG CGTCAGCC Шаг! - гибридизация ACTTGCAGTCGGACTG CGTCAGCC Шаг2 - легирование II 111! 56 bp 16 bp Шаг4 - гель электрофорез Вершина хО ACTTGCAGTCGGACTG.. TGAACGTC О Сенсор для вершины хО шаг 5 разделение магнитными бкеинками Вершина хО Вершина х5 ACTTGCAGTCGGACTG....CCGATGCATGGC TGAACGTC ACGTACCG ШагЗ - полимерная цепная реакция Рис. 7.12. Основные этапы решения задачи определения гамильтоновых путей методом ДНК-компьютинга ной точкам гамильтоновых путей. После этого фермент ДНК-полимераза вос- производит последовательности нуклеотидов, находящихся между праймерами. Этот процесс повторяется многократно с исходными и вновь полученными молекулами. В результате число этих молекул после 30-40 циклов может уве- личиться в 1027 раз. Этот процесс обладает также высокой чувствительностью и позволяет выявить 10—100 копий ДНК в смеси. В основе второго шага анализа лежит жидкостный гель-электрофорез, который позволяет разделить полученную в результате применения ПЦР смесь на отдельные компоненты с различными молекулярными массами. На третьем шаге анализа использовалось аффинное разделение на магнит- ных бусинках. В анализируемую смесь вводились микрочастицы парамагнит- ного материала, к которым химически были присоединены цепочки нуклеоти- дов, отвечающие отдельным точкам гамильтонова пути. После того, как они присоединялись к соответствующим молекулам ДНК, полученные комплексы экстрагировались магнитным полем. Сам Эдлмен отмечал, что по его оценкам: • производительность предложенных устройств составляет 10м операций в секунду; • энергетическая эффективность — 2 - I О19 операций/джоуль; • подход может быть использован для решения не очень сложных комби- наторных проблем; • в то же время, область проблем, где подход может быть использован, существенно ограничена; • результаты вычислений резко зависят от точного выполнения условий предложенного подхода. Вскоре после появления работы Эдлмена американский математик Ричард Липтон из Принстона показал, как, используя ДНК, кодировать двоичные числа и решать проблему удовлетворения логического выражения. Суть ее заключается в том, что, имея некоторое логическое выражение, включающее п логических переменных, нужно найти все комбинации значений переменных,
234 Гл. 7. Новые идеи... Новые возможности? делающих выражение истинным. Традиционные методики сводят эту задачу к перебору 2п комбинаций. Липтон показал, Что все эти комбинации легко закодировать с помощью ДНК, а дальше действовать по методике Эдлмена. Липтон предложил также способ взлома шифра DES (американский крипто- графический), трактуемого как своеобразное логическое выражение Кроме этого было предложено и несколько других применений ДНК- компыотинга. В университете штата Висконсин была решена с помощью ДНК задача доставки четырех сортов пиццы по четырем адресам, которая подразу- мевала 16 вариантов ответа. Ученые из Принстонского университета решили комбинаторную шахматную задачу: при помощи РНК нашли правильный ход шахматного коня на доске из девяти клеток (всего 512 вариантов). В целом будущее ДНК-компьютинга остается неопределенным То, что за более чем 10 лет со дня появления работы Эдлмена не создано на осно- ве этих предложений работоспособного вычислительного устройства, говорит, по-видимому, о серьезных трудностях практической реализации этого подхода. В то же время оригинальность этого подхода привлекает к нему новых иссле- дователей и обеспечивает поддержку его Агентством DARPA Министерства обороны США.
Глава 8 ЧТО ЖЕ ДАЛЬШЕ? Ремесло предсказания изобилует множеством подводных камней. Иногда его даже считают ан- тинаучным занятием. На самом деле, выявление неумолимых тенденций грядущего может быть предметом очень хорошей науки. Стаффорд Бир. Мы и сложность нашего мира Предсказание будущего — сомнительное и неблагодарное де- ло. Слишком большое число факторов, которые не лежат сегодня на поверхности, могут неожиданно изменить известные, казалось бы очевидные тенденции. И все же хотелось бы попытаться заглянуть хотя бы немно- го вперед, несколько расширив рамки обсуждаемых проблем и представить себе будущее молекулярных устройств обработки информации. Начнем с цифровых вычислительных устройств. 8.1. Нужна ли молекулярная элементная база разработчикам цифровых компьютеров с фон-неймановской архитектурой? Становление и развитие постиндустриального общества со- провождается появлением серьезных проблем, которые могут быть решены только на основе сложных, более чем трудоемких вычислений. Вычислительная мощность современных коммер- ческих вычислительных машин не идет ни в какое сравнение с тем, что необходимо в таких случаях. Поэтому в промышленно- развитых странах создаются уникальные вычислительные систе- мы — суперкомпьютеры. Одна из таких наиболее известных и важных проблем — сохранение и развитие ядерного оружия сдерживания в услови- ях международного запрета на проведение ядерных испытаний. В конце последнего десятилетия прошлого века Отделение воен- ных приложений (DAM) Комиссии по атомной энергии Франции (СЕА) начала разработку программы численного моделирования
236 Гл. 8. Что же дальше? Рис. 8.1. Небольшой фрагмент суперомпьютера Тега-10 ядерных процессов, необходимую для выработки решений о сро- ках хранения ядерного оружия и его совершенствования. В про- грамме было предусмотрено создание суперкомпьютера Тега, вы- числительная мощность которого должна последовательно нара- щиваться. Согласно программе она должна была составлять 1, 10 и 100 терафлоп (1 терафлоп равен 109 операций с плавающей запятой в секунду) в 2001, 2005 и 2009 гг. соответственно. В настоящее время вариант Тега-10 — наиболее мощный евро- пейский и пятый по мощности в мире суперкомпьютер, пред- ставляет собой вычислительную систему, построенную на основе 4352 двухъядерных процессоров Intel Itanium 2. Оперативная память Тега-10 составляет 27 терабайт, дисковое пространство — 1 петабайт (1 петабайт = 1000 терабайт = 1000000 гигабайт = = 109 мегабайт = 1012 байт). Некоторое впечатление об этом суперкомпьютере может дать фотография его небольшой части на рис. 8.1. К сожалению, финансовая сторона проекта не раз- глашается компанией “Bull” — разработчиком суперкомпьютера. Но нельзя забывать и о том, что помимо стоимости, которая должна составлять не один десяток миллионов долларов, плата
8.1. Нужна ли молекулярная элементная база? 237 за уникальные возможности оказывается чрезвычайно высокой. Для размещения Тега-10 необходимо специализированное поме- щение ~ 2000 м2, не считая помещений для вспомогательного оборудования. А эти помещения должны быть значительными, поскольку только для охлаждения компьютера требуется мощ- ность порядка 3 МВт (уже сегодня предусматривается ее увели- чение до 5 МВт). Электропитание Тега-10 составляет 1,8 МВт. Тепловыделение — серьезная проблема при эксплуатации суперкомпьютеров. Впечатляющие примеры ее следствий были приведены создателями менее мощной суперкомпьютерной си- стемы — сотрудниками ВирджинияТех (Virginia Polytechnic In- stitute and State University, Blacksbury, Virginia, USA), которые создали суперкомпьютер всего лишь, как они сами определили, за 5 миллионов долларов. Система была собрана из 1100 кластеров компании “Ap- ple” (система G5, производительность 2 ГГц, память 4 Гбайт). Производительность суперкомпьютера составляла 17,6 терафлоп, память 176 Тбайт. Но, несмотря на менее впечатляющие харак- теристики, ее электропитание, как пишут разработчики, было бы достаточным для 3000 жилых домов средней величины. Именно эти проблемы — электропитание и тепловыделение, резко повышают интерес к молекулярной элементной базе, ис- пользование которой приведет к намного меньшим энергозатра- там и выделению тепла. Полупроводниковая электроника глубоко вросла сегодня в промышленную инфраструктуру. Она тесно увязана с другими ее областями. Более того, она оптимально отвечает многим по- требностям современного общества. Тем не менее, такие отрасли, как производство суперкомпьютеров, намного выиграли бы от практического использования молекулярной элементной базы. Нужно, однако, заметить, что у молекулярных элементов есть и полупроводниковые соперники на том же уровне размеров эле- ментов. Прежде всего — это устройства на основе квантовых ям. Немного подробностей: квантовые точки и клеточные автоматы В начале 70-х гг. прошлого века в физике полупроводников появилось новое направление — изучение гетероструктур, образованных различными по своему составу и свойствам полупроводниками. В особенности интересными оказались гетероструктуры, в которых пространственная размерность отлича- ется от трехмерной, т. е. от обычного твердого тела. Это могут быть тонкие пленки нанометровой толщины, такой же толщины тонкие нити и наномет- ровые ансамбли атомов. Поскольку на нанометровых размерах проявляются квантовые эффекты, эти системы были названы квантовыми ямами, квантовы- ми нитями и квантовыми точками. Их замечательная особенность заключается
238 Гл. 8. Что же дальше? 2D (Квантовая яма) ID (Квантовая нить) 0D (Квантовая точка) Рис. 8.2. Плотность энергетических состояний для трехмерного твердого тела, квантовой ямы, нити и точки в том, что наноразмеры полупроводниковых структур ограничивают движение электронов и поэтому плотность электронных состояний в них принципиально отличается от макроскопического тела. Нетрудно видеть (рис. 8.2), что кван- товые эффекты проявляются, начиная с квантовых ям, т. е. когда движение электронов ограничено нанометровыми размерами, хотя бы в одном измерении. Не останавливаясь на интереснейших свойствах и практических приложе- ниях квантовых ям и квантовых нитей, поговорим о квантовых точках, которые рассматриваются сегодня как одна из возможных альтернатив молекулярной элементной базе вычислительных устройств. Квантовые точки называют иногда, чаще в популярных изданиях, искус- ственными атомами. Но квантовая точка — это совокупность атомов с на- норазмерами по всем трем пространственным измерениям. Движение элек- тронов в такой системе может быть аппроксимировано простейшей квантово- механической моделью, известной под названием «частица в прямоугольном потенциальном поле». Эта модель описывается уравнением Шредингера [А+ + -С1 ~и(х,у,г)]ч> = ЕЧ>, [ 2m [дх2 ду2 dz2\ ) где потенциальная энергия в ящике со сторонами а, Ь, с U(x, у, z) — U(x) + U(y) + U(z). При этом гг/ \ гт/ \ тт/ \ л а " Ь Ь с С U(x) = U(y) = U(z) = 0, если - - х у -- < z - или U(x) = U(y) = U(z) = (7q при всех других значениях х,у, z. Решением этого уравнения является 2+2 /2 2 2\ 7Г П I Щ Щ По \ 1 п о ЕП1,П2,ПЗ = —— I 4 + 72 + 2 ) ’ где ПьП2,Пз= 1,2,3,... Таким образом, квантовой точке отвечает дискретный спектр, сходный по общему виду со спектром атомной системы.
8.1. Нужна ли молекулярная элементная база? 239 © - Пирамида In As © - «Смачивающий» слой ^) - Матрица GaAs Рис. 8.3. Экспериментальная полупроводниковая реализация квантовой точки В квантовой точке могут находиться от одного до большого количества электронов, распределение которых определяется принципом Паули. Квантовые точки могут быть созданы методом молекулярно-лучевой эпи- таксии. На хорошо подготовленную поверхность напыляется другое вещество со структурой, близкой к структуре подложки. При этом все должно происхо- дить в высоком вакууме, чтобы избежать включения в формируемый объект посторонних примесей. Скорость напыления должна тщательно регулироваться для того, чтобы исключить образование дефектов структуры. Спонтанное фор- мирование квантовых точек в так называемом режиме Странского-Крастанова хорошо изучено на примере системы InAs/GaAs. При росте первого моно- молекулярного слоя InAs на поверхности GaAs из-за различия постоянных кристаллических решеток возникают упругие напряжения. Если напыление продолжается, они увеличиваются и становится выгодным не равномерное распределение вещества по поверхности первого слоя, а образование отдель- ных «капель» на поверхности первого слоя (его называют «смачивающим» слоем). Таким образом возникают «пирамидки» со свойствами квантовых точек (рис. 8.3). Электрон Дырка Рис. 8.4. Зонная структура полупроводника, содержащего квантовую точку
240 Гл. 8. Что же дальше? Качественно эти пирамидки можно рассматривать как дефекты на поверх- ности основного полупроводника. В этом случае в зонной структуре появля- ются примесные уровни (рис. 8.4) — несколько выше валентной зоны (дырки) и несколько ниже зоны проводимости (электроны). Уровни, отвечающие при- месному уровню зоны проводимости, характеризуются дискретным спектром, т. е. они отвечают квантовой точке. Уникальные свойства квантовых точек легли в основу концепции построе- ния полупроводниковых средств обработки информации — клеточных автома- тов, разработанной коллективом физиков Университета Нотр Дам (Франция). Квантовые точки г О Пустая ' Содержит L электрон Тунеллирование электронов между точками Рис. 8.5. Основные элементы клеточного автомата на квантовых точках Рис. 8.6. Перестройка линейных фрагментов клеточного автомата на квантовых точках Элементарная ячейка клеточного автомата представляет собой систему четырех квантовых точек (рис. 8.5). На двух из них находится по электрону, причем электроны могут перемещаться от одной точки к другой. Расстояния между квантовыми точками должны быть достаточно малы, чтобы электро- ны взаимодействовали друг с другом. Тогда электроны из-за их взаимного отталкивания будут располагаться на наиболее удаленных друг от друга точ- ках. Будем считать, что одной из возникающих в этом случае конфигураций можно приписать состояние «0», а другой — состояние «1» (рис. 8.5). Таким образом, можно построить клеточный автомат с элементами, которые могут находиться в двух состояниях. Из-за слабого взаимодействия элементов авто- мату отвечает радиус взаимодействия, равный I. Нетрудно видеть, что если задать определенное распределение электронов в исходном элементе (левый элемент рис. 8.6), то из-за электростатического взаимодействия их электронов в соседних элементах произойдет перестройка состояний. На основе такого эффекта могут быть построены сложные логические схемы, одна из которых, в качестве примера, приведена на рис. 8.7. Таким образом, клеточные автоматы
8.2. Биоиогчческие принципы обработки информации 241 Входы Рис. 8.7. Логический элемент на основе квантовых точек a h с 0 0 0 0 0 0 1 0 0 1 0 0 0 1 1 1 1 0 0 0 1 0 1 1 1 1 0 1 на основе квантовых точек, если будет разработана надежная технология их промышленного формирования, могут стать родоначальниками устройств обработки информации с высокой степенью интеграции элементов. 8.2. Биологические принципы обработки информации и их роль в развитии информационных технологий Будем исходить из того, что одна из основных проблем, сдерживающих сегодня дальнейший прогресс информационных технологий, заключается в необходимости создания интеллекту- альных систем сбора и обработки информации и систем управ- ления, которые были бы массовыми и эффективно решали бы задачи искусственного интеллекта. Рассмотрим подробнее основ- ные факторы, определяющие возможности их разработки на базе химических реакционно-диффузионных сред. 8.2.1. Некоторые эксплуатационные требования к реак- ционно-диффузионному процессору. Исходя из специфики рассматриваемых задач, средства обработки информации долж- ны быть, прежде всего, мобильными, с высокой степенью надеж- ности. Поскольку по своему характеру они должны быть массо- выми, стоимость их не должна быть велика. Они должны решать поставленные задачи в реальном масштабе времени. В большом числе приложений этот масштаб должен определяться временем реакции человека, т. е. 0,1-1,0 секунд. В значительном числе разработок (например, в автономных системах наведения) не требуется и большой ресурс устройства. Химические реакционно-диффузионные среды в основном удовлетворяют этим требованиям. В то же время, они позволяют осуществить на практике принципиально новый, отличный от
242 Гл. 8. Что же дальше? общепринятого подход к созданию информационно-логических устройств, облегчающий их практическую реализацию. Высокая производительность устройства достигается не за счет предель- ной миниатюризации увеличения быстродействия, а за счет мак- симально высокой логической сложности элементарных опера- ций, оптимально отвечающих решению интеллектуальных про- блем. В основе высокой эффективности реакционно-диффузионных устройств лежат характерные, присущие им особенности обра- ботки информации. Высокий естественный параллелизм. Распределенная ре- акционно-диффузионная система представляет собой непрерыв- ную биохимическую, химическую или физическую среду, в каж- дом микрообъеме которой параллельно (одновременно) проис- ходит обработка информации по одному и тому же алгоритму. Величину типичного микрообъема можно определить порядка диффузионной длины, т. е. 0,01-0,1 мм. Поэтому самому прими- тивному устройству — плоскому слою среды (линейные размеры 100 х 100 мм, толщина 1мм) отвечает степень параллелизма 108—106. При этом степень параллелизма может быть резко уве- личена при переходе к трехмерной конструкции устройства. Нелинейные механизмы обработки информации. Нели- нейные механизмы динамики распределенных реакционно-диф- фузионных систем приводят к тому, что они выполняют в каче- стве элементарных не простейшие двоичные (как в современных цифровых ЭВМ), а сложные логические операции. Пусть, например, задана достаточно простая геометрическая фигура на сетке 103 х 103 элементов, контур которой необходи- мо выделить. Численная методика выделения контура, реализо- ванная на современной персональной ЭВМ, подразумевает, что необходимо в общем случае произвести в каждой точке сетки 3-5 операций с плавающей запятой. Итого: 3 • 106—5 • 106 элемен- тарных операций, эквивалентных одной элементарной операции реакционно-диффузионной среды. Количество операций цифрового компьютера резко возраста- ет при усложнении контура фигуры, что требует перехода к более частой сетке 104 х 104, 105 х Кг и т. д. Фундаментальным достоинством реакционно-диффузионной среды в этом случае является то, что усложнение контура может потребовать увеличения линейных размеров среды (при этом разрешающая способность среды не меняется), но время выделе- ния контура останется тем же самым.
8.2. Биологические принципы обработки информации 243 Быстродействие реакционно-диффузионных устройств обработки информации. Время выполнения элементарных операций используемыми в настоящее время биохимическими и химическими средами достаточно велико, как и времена реакций биологических организмов, действующих по сходным информационным принципам. Тем не менее, высокая логическая сложность выполняемых средами элементарных операций резко повышает вычислительные возможности. Рассмотрим снова одну из наиболее простых операций высо- кой вычислительной сложности — выделение контура произволь- ной фигуры, которая выполняется средой за 1-5 с. Сравним это время со временем выполнения этой же операции персональным цифровым компьютером. Пусть необходимая погрешность воспроизведения контура фигуры обеспечивается сеткой 103 х 103 точек. Примем, что, в общем случае, число необходимых операций составляет ~ 5 х х 106. Время выполнения сложения с плавающей запятой персо- нальным компьютером на базе процессора Pentium III с частотой 600 МГц составляет ~ (2,5-3) • 10-9с. Отсюда время выделения контура ~ 10“2 с, т. е. на сетке 103 х 103, время выделения контура персональным компьютером на два порядка меньше, чем в случае реакционно-диффузионной среды. Если же выделяется контур сложной фигуры, что требует повышения точности его выделения, то ситуация принципиально меняется. Время выпол- нения этой операции средой остается тем же самым, т. е. 1-5 с. В случае же персонального компьютера оно увеличивается до 1 с (для сетки 104 х 104) и 100с (для сетки 103 х 105). В этом примере проявляется фундаментальная особенность реакционно-диффузионных сред. Их преимущества становятся тем более ощутимыми, чем сложнее задача. Отметим, что выделение контура фигуры — одна из самых простых операций высокой вычислительной сложности. В случае других элементарных операций, выполняемых средами, их пре- имущества становятся более явными. Быстродействие реакционно-диффузионных сред определя- ется спецификой химических реакций протекающих в среде. Предварительный анализ показывает, что, по-видимому, могут быть разработаны среды со временем выполнения элементарных операций 10_ 1 -1 с, что существенно повысит их быстродействие. Хотелось бы также подчеркнуть, что наиболее перспектив- ными областями возможного применения рассматриваемых сред могут быть технические устройства, для которых реальный мае-
244 Гл. 8. Что же дальше? штаб времени сравнительно велик. Анализ изображений в ме- дицине и материаловедении не требует высокой скорости вы- полнения операций. Управление движением автономного робота, двигающегося по пересеченной местности, можно осуществлять при времени реакции системы управления ~ 1 с. Многоуровневая архитектура. Многоуровневая архитекту- ра не использовалась до сих пор при разработке макетов ре- акционно-диффузионных устройств обработки информации. Тем не менее, из общих соображений следует, что она является значительным резервом повышения производительности этих устройств. Многоуровневая архитектура позволит более эффективно ре- ализовать биологически мотивированные принципы обработки информации. В общем случае для многоуровневых устройств должны быть характерны: • обработка и сжатие информации на каждом уровне обра- ботки, • передача на следующий уровень аттракторов предыдущего, т. е. результатов сжатия информации. Это может многократно повысить информационные возмож- ности реакционно-диффузионных устройств. 8.2.2. Технологические особенности производства ре- акционно-диффузионных устройств. Геометрические разме- ры реакционно-диффузионного устройства должны определять- ся размерами действующих элементов среды (10 *-10~2 мм). Поэтому устройство, содержащее 106 действующих элементов, может представлять собой в простейшем случае квазиплоский слой реагента с размерами 100 х 100 мм (10 х 10 мм). Микромет- ровые размеры действующих элементов и сравнительно низкая чувствительность среды к посторонним примесям позволит: • резко уменьшить стоимость исходных материалов для про- изводства устройств по сравнению с полупроводниковыми, поскольку они не требуют сверхвысокой очистки от приме- сей, • резко упростить и удешевить промышленную технологию производства устройств, поскольку она не потребует пре- дельно высокой степени очистки как газовых, так и жидких сред от пыли и микровключений. Выполняемые таким устройством операции определяются спецификой протекающих в активной среде химических реак- ций, пространственной структурой устройства, управляющими
8 2. Биологические принципы обработки информации 245 стимулами. На основании накопленного опыта можно предпо- ложить, что вместо сложной миниатюрной системы транзисто- ров и межсоединений на кристалле многоуровневое реакцион- но-диффузионное устройство будет представлять собой систе- му активных слоев с линейными размерами порядка десятков миллиметров на полимерной основе и с размерами структурных особенностей в слое ~ О,1мм, разделенных полупроницаемыми мембранами. Таким образом, сложность производства реакционно-диффу- зионных устройств должна быть значительно ниже, а техно- логическое оборудование намного проще, чем при производстве современных полупроводниковых интегральных схем. 8.2.3. Ближе к природе — наступление полимерных ма- териалов. Объем и достоверность данных, которые могут быть получены в результате экспериментального изучения процессов в реакционно-диффузионных средах, многократно возросли на протяжении последнего десятилетия. И решающую роль в этом сыграли два основных направления развития техники экспери- мента. Одно из них — работа со светочувствительными среда- ми — детально обсуждалось выше. Остановимся подробнее на втором, не менее важном направлении — использовании поли- мерных материалов для формирования реакционно-диффузион- ных сред. Известны различные варианты использования полимерных материалов при изучении процессов, протекающих в реакци- онно-диффузионных средах. Они определяются, естественно, поставленной задачей, особенностями ввода и вывода данных и способами управления средой. Оптические методы являются сегодня основным спосо- бом ввода и вывода информации при работе с реакционно- диффузионными средами. В этом случае проецируемое световое изображение преоб- разуется в распределение химических компонентов среды. Два основных фактора определяют адекватность распределения кон- центраций компонентов среды исходной световой картине. Во-первых, это минимальная величина и, главное, однород- ность светового фона оптического устройства, используемого для ввода исходного изображения. Любая неоднородность может вы- звать динамический процесс в среде, не связанный с исходными данными.
246 Гл. 8. Что же дальше? Во-вторых, это постоянство толщины слоя среды, которое может нарушаться за счет погрешностей изготовления реактора, в котором протекает процесс, его неточного горизонтирования и т.д. В результате этого возникают дополнительные гради- енты концентраций химических компонентов среды, что также приводит к возникновению случайных динамических процессов, накладывающихся на изучаемую динамику. Плоский слой полимера заданной толщины, химически не взаимодействующий с компонентами среды, представляет со- бой пространственную матрицу полимерного вещества, содер- жащую 80-90% воды. Если заменить эту воду реагентом реакционно-диффузионной системы, то толщина слоя реагента будет поддерживаться полимерной матрицей. В результате на слой реагента не будут влиять погрешности реактора и горизон- тирования, а также случайные механические воздействия (толч- ки, вибрации и т.д.) Полимерные материалы позволяют создавать простран- ственно неоднородные среды с заданной структурой. Рассмотрим только два примера формирования таких систем. Выше рассматривалась задача о нахождении кратчайшего пути в лабиринте. Особенностью формирования использованной для этого среды была иммобилизация катализатора химической реакции в тонком слое силикагеля. Это дало возможность за- фиксировать распределение компонентов реакции, отвечающее лабиринту, и организовать распространяющийся по нему волно- вой процесс. Несколько более сложная конструкция среды была исполь- зована Стейнбоком с сотудниками, которые моделировали ло- гические устройства, переключаемые волновым процессом в ре- акционно-диффузионной среде. Рисунок устройства наносился принтером на поверхность тонкой ионообменной мембраны рас- твором катализатора реакции, который использовался вместо чернил в принтере. Сама мембрана помещалась на слой геля агара, в котором находились остальные компоненты химического реагента. Полимерные матрицы могут управлять процессами, про- текающими в среде. Н. Казанская с сотрудниками разработала две системы, в ко- торых полимерная матрица играет активную роль. Первая из них представляет собой сочетание двух поли- мерных мембран. Одна из них содержала фоточувствительную
8.2. Биологические принципы обработки информации 247 компоненту — спирониран. Дополнительно в мембрану вводился ионофор нонактин, который позволял связать фотоотклик мем- браны с гидролизом мочевины, происходившим в другой мем- бране и катализируемом ферментом уреазой. Вторая система была двухуровневой и пространственно- совмещенной. Она представляла собой полимерную матрицу, на- сыщенную ферментом уреазой, в которой происходил гидролиз мочевины. Активность фермента могла управляться изменением температуры матрицы вблизи точки обратимого коллапса геля матрицы. Существует возможность конструирования полимерных матриц, в которых фрагменты полимера служили бы од- ним из компонентов химической реакции, протекающей в реакционно-диффузионной системе. В этом случае могут быть сформированы системы, обладаю- щие долговременной памятью. Так, например, если ингибировать светочувствительную реакцию излучением в каких-либо фраг- ментах среды и проводить реакцию в остальных фрагментах по- лимерной матрицы, компонент, связанный с матрицей, будет вы- рабатываться только в неосвещенных областях. При повторном использовании системы эти области окажутся не активными, т. е. будут хранить память о предыдущем процессе. Хотелось бы подчеркнуть, что рассмотренные примеры — только часть возможностей, которые открываются при формиро- вании реакционно-диффузионных систем на основе полимерных матриц. Быстрое развитие этой техники несомненно расширит экспериментальные возможности, в особенности при конструи- ровании перспективных многоуровневых систем. 8.2.4. Мозг и реакционно-диффузионный компьютер. Как уже отмечалось выше, одна из основных задач этой книги — рассказать о том, что реально представляет собой сегодняшнее воплощение биологических принципов обработки информации. Естественно, наиболее весомыми доводами в их пользу явля- ются экспериментальные работы, выполненные в последние годы, в сущности за последнее десятилетие. Становится ясным, даже на основании этих первых робких попыток, что биологические принципы — не система некоторых схоластических рассуждений, а практически направленная концепция, находящаяся в процессе своего развития, возможности которой далеко не исчерпаны.
248 Гл. 8. Что же дальше? Поэтому возникает важный вопрос — каковы предельные информационные возможности устройств обработки информа- ции, построенных на биологических принципах? Где их возмож- ное место в будущей перспективной системе вычислительных и информационно-логических средств? Для того, чтобы попытаться найти ответ на этот вопрос, вернемся назад в 90-е гг. прошлого уже столетия. В конце 80-х гг. один из ведущих теоретиков в области информатики Майкл Арбиб выступил с предложением расши- рить концепцию вычислений так, чтобы в нее органично вошел «стиль» обработки информации человеческим мозгом. В своей статье «Мозг, как метафора компьютинга VI поколения» он писал: «Этот стиль основан на постоянном совместном взаимо- действии систем, активность которых выражается как взаимо- действие пространственно-временных образов в многоуровневой системе нейронов». Замечательные особенности подхода Арбиба заключались в следующих положениях. • Мозг является компьютером, ориентированным на дей- ствие. Это выражается в том, что система, представляю- щая собой человека, животное или робота, должна быть в состоянии коррелировать внутренние действия и взаимо- действие с окружением так, чтобы построить «внутреннюю модель» окружающего мира. • Мозг — иерархическая многоуровневая организация. Наи- более важный факт заключается в том, что ни одна од- ноуровневая модель не способна воспроизвести функции мозга. • Мозг не является системой с последовательной обработкой информации. В сущности идеи Арбиба лежали в основе возродившегося в те годы интереса к нейронным сетям. Более того, интереса к сложным вариантам полупроводниковой компьютерной архи- тектуры, которая позволяла бы во много раз увеличить паралле- лизм вычислений. В те же годы Майкл Конрад, ведущий специалист США в об- ласти молекулярной электроники, опубликовал детальный срав- нительный анализ информационных особенностей мозга и фон- неймановского компьютера. Замечательной особенностью подхо- да Конрада было то, что он исходил из общих информационных представлений, не привязывая их к каким-либо физическим во- площениям устройств. Конрад сравнивал фундаментальные раз-
8.2. Биологические принципы обработки информации 249 Таблица 8.1 Информационные характеристики средств обработки информации, основанных на различных принципах Парадигма фон-Неймана Реакционно-диффузи- онная парадигма Биологическая обра- ботка информации Программирование извне Самоорганизация Самоорганизация Структурно програм- мируемо Структурно не про- граммируемо Структурно не про- граммируемо Последовательное ис- пользование ресурсов Высокий параллелизм Гигантский паралле- лизм Дискретная динамика Непрерывная и дис- кретная динамика Дискретная и непре- рывная динамика Высокая связность Высокая интерактив- ность Высокая интерактив- ность Горизонтальные пото ки информации Вертикальные потоки информации Вертикальные потоки информации личия в обработке информации мозгом и компьютером, основы- ваясь на введенном им ранее принципе исключения, выражаю- щемся в том, что: «Система не может быть одновременно эффективно програм- мируемой, способной к изменениям и селекции и вычислительно эффективной». Эти различия сведены воедино в табл. 8.1. К ним относят- ся: возможность структурного программирования системы, па- раллельный или последовательный характер обработки инфор- мации, вертикальные или горизонтальные потоки информации и т. д. В сущности, этим анализом Конрад показал, что мозг и фон-неймановский компьютер являются двумя предельными альтернативами систем обработки информации. Поскольку подход Конрада является общим, не привязан- ным к какому-либо физическому воплощению, представлялось привлекательным использовать его для оценки места распреде- ленных реакционно-диффузионных устройств в общей системе средств обработки информации. Рассмотрим основные информа- ционные характеристики реакционно-диффузионных устройств.
250 Гл. 8. Что же дальше? В отличие от фон-неймановского компьютера реакционно-диф- фузионные устройства не являются программируемыми извне. Их динамика определяется состоянием (и структурой) среды и воздействиями управляющих факторов. Даже простейшие устройства демонстрируют очень высокую степень параллелизма, смешанную непрерывно-дискретную ди- намику и вертикальные потоки передачи и обработки информа- ции. Даже в простейшей системе можно выделить: • уровень макро-микро-преобразования информации, т. е. уровень ввода исходных данных, • динамику на молекулярном (микро) уровне, реализующую способ обработки информации, • уровень микро-макро-преобразования информации, т. е. физико-химическое считывание результатов решения задачи. Степень самоорганизации химических реакционно-диффузи- онных устройств велика. Более того, в них проявляется градуа- лизм, т. е. малые изменения состояния среды (концентраций ее компонентов и температуры) приводят в определенной области состояний только к сравнительно небольшим количественным, а не к резким качественным изменениям динамических режимов. Эта особенность, в сущности, лежит в основе построения систем с обучением. И, наконец, реакционно-диффузионные системы обладают и другими особенностями, которые определяют способность си- стемы к адаптивному поведению. Среди них — характер взаимо- действия с окружением, глубокие обратные связи и т. д. Таким образом, реакционно-диффузионные среды облада- ют практически всеми характеристиками, необходимыми для того, чтобы на их базе строить устройства, обладаю- щие высокой поведенческой сложностью, способные к обуче- нию и к решению задач высокой вычислительной сложности. В общем, сравнение информационных характеристик фон- неймановского компьютера, мозга и реакционно-диффузионного устройства приводит к выводу о том, что по своим информаци- онным характеристикам реакционно-диффузионные устройства существенно ближе к мозгу, чем к цифровому устройству (даже если цифровое устройство реализовано на уровне многопроцес- сорной параллельной системы).
8.2. Биологические принципы обработки информации 251 Мозг по своим информационным характеристикам неизме- римо богаче, чем любое рукотворное устройство. Полнота ре- шения им интеллектуальных проблем (проблем высокой вычис- лительной сложности) поразительна. Тем не менее, удивитель- ное сходство информационных характеристик распределенных систем, функционирующих на основе нелинейных динамических механизмов, позволяет предположить, что могут быть созданы устройства, имитирующие функции мозга, пусть даже в каких-то ограниченных областях интеллектуальной активности мозга.
Список литературы Глава 1 1. Шредингер Э. Что такое жизнь с точки зрения физики. — М.: ИЛ, 1947. 2. Feynman R.P. There’s plenty of room at the bottom, Miniaturization I Gilbert, H.D., Ed. — N.-Y.: Reinhold, 1961. 3. Drexler K. Eric. Engines of Creation. — Anchor Books, 1986. 4. National Nanotechnology Initiative, http://www.nano.gov 5. Murday J.S. Nanotechnology, www.onr.navy.mil/about/conferences/ rd_partner/2005/docs/past/2004/2004_murday_impact_nano_market place.pdf 6. NASA-GSFC Nano-Satellite Technology. www.smallsat.org/proceedings/12/ssc98/6/sscvi5.pdf 7. Introduction to Nanotechnology. www.nanoforum.org/content/educational tree.pdf 8. Сканирующая микроскопия, www.cs.cmu.edu/afs/cs/academic/class/ 15398-f04/www/lectures/lect05.pdf 9. AFM. www.physick.uni-augsburg.de 10. STM. www.almaden.ibm.com 11. stm. www.physics.louisville.edu 12. AFM-STM. www.courses.vcu.edu/PHYS661/pdf/06TechMicroscopy041.ppt 13. Головин Ю.И. Введение в нанотехнологию. — М.: Машиностроение-1, 2003. Глава 2 1. Малиновский Б.Н. Из мировой истории цифровой вычислительной тех- ники. www.computer-museum.ru/frgnhist/malinovs.htm 2. Гладких Б.А. Информатика. Историческое введение в специальность, гл. 2. www.inf.tsu.ru/Library/Edu/Gladkikh/chapter2.ppt 3. Устриков С. История развития персональных компьютеров, phan- tom.sannata.ru/articles/phistory.shtml 4. История Apple Computer Inc. mymac.ru/legends 5. High Performance Computing, www.itap.purdue.edu/presentations/ 2003/ Faisal Saied ITAP Lunch Presentation 8 22 2006.pdf 6. Тилл У., Лаксон Дж. Интегральные схемы. — М.: Мир, 1985.
Список литературы 253 Глава 3 1. Molecular Electronic devices / Carter, Forrest L., Ed. — N.-Y., Basel: Marcel Dekker, Inc., 1982. 2. Molecular Electronic Devices II / Carter, Forrest L., Ed. — N.-Y., Basel: Marcel Dekker, Inc., 1987. 3. Molecular Electronics. Biosensors and Biocomputers. — N.-Y.: Plenum Pressn, 1989. 4. Aviram A., Ratner M.A. Molecular rectifiers // Chem. Phys. Lett. 1974. V. 29. P. 277-283. 5. Metzger R.M. Electrical rectification by the molecule. The advent of uni- molecular electronic devices // Acc. Chem. Res. 1999. V. 32. P. 950-957, 6. Stuart J.A., Marcy D.L., Wise KJ., Birge R.R. Volumetric optical memory based on bacteriorhodopsin // Synthetic Metals. 2002. V. 127. P. 3-15 7. HP-UCLA Collaboration. http://www.hp.com/hpinfo/newsroom/press/23jan02b.htm 8. HP-UCLA Quantum Science Research. asia.stanford.edu/events/spring02/slides/WilliamsSlides.ppt 9. California Molecular Electronics Corporation (CALMEC). http://www.calmec.com 10. Chiropticene Molecular Switch. http://www.calmec.com/chiropticene.htm Глава 4 1. McCulloch W.J., Pitts W. A logical calculus of the ideas immanent in nervous activity // Bull, of Math Biophys. 1943. V. 5. P. 115-133. 2. Розенблатт Ф. Принципы нейродинамики. Перцептроны и теория ме- хагнизмов мозга. — М.: Мир, 1965. 3. Hopfield J.J. Neural networks and physical systems with emergent col- lective computational abilities // Proc. Natl. Acad.Sci. USA. 1982. V. 79. P. 2554-2558. 4. Галушкин А.И., Цыпкин Я.З. История развития нейрокомпьютеров. — М : ИПРЖР, 2000. Глава 5 1. Филд Р., Бургер М. Колебания и бегущие волны в химических систе- мах. — М.: Мир, 1988. 2. Rambidi N.G., Chernavskii D.S., Krinsky V.I. Information processing and computing devices based on biomolecular nonlinear dynamic systems // Molecular Electronics and Molecular Electronic Devices / Sienicki K., Ed , Boca Raton-Ann Arbor-London-Tokyo: CRC Press, 1993. 3. Conrad M. Molecular information processing in the central nervous system. Part I. Selection circuits in the brain, Lecture Notes in Biomathematics, Physics and Mathematics of Nervous System. — Berlin-Heidelberg-New York: Springer Verlag. 1974. P. 82-127.
254 Список литературы 4. Рамбиди НЕ, Гребенников Е.П., Адамацкий А.И., Девятков А.Г., Яко- венчук Д.В. Биомолекулярные нейросетевые устройства. — М.: ИПР- ЖР, 2002. 5. Amorphous and cellular computing, http://dstn.darpa.com/ixo/psum 2001/E569-0.html 6. Rambidi N.G., Yakovenchuk D.V. Chemical reaction-diffusion implemen- tation of finding the shortest paths in a labyrinth // Phys.Rev. E. 2001. V. 63 P. 0266X.X. Глава 6 1. Климонтович IO.Л. Введение в физику открытых систем. http://www.issep.rssi.ru/pdf/9608 109.pdf 2. Осипов А.И. Термодинамика вчера, сегодня, завтра. http://www.pereplet.ru/obrazovanie/stsoros/779.html 3. Данилов Ю.А., Кадомцев Б.Б. Что такое синергетика. http://kirsoft.com.ru/freedom/KSNews 227.htm 4. Macroscopic Dynamics. Self-Organizing Systems. http://algodones.unm.edu/~bmilne/bio576/instr/htm/SOS/sos.html 5. Мучник Г. Порядок и хаос, http://n-t.ru/tp/mr/ph.htm 6. Митина О.В., Петренко В.Ф. Синергетическая модель динамики поли- тического сознания, http://www.psychology.ru/library/00076.shtml 7. Предсказуем ли рынок? http://franklin-grant.ru/ru/pr/pdf/vsp 2002 12.pdf Глава 7 1. Аморфный компьютинг, www-swiss.ai.mit.edu/projects/amorphous/ 2. Abelson Н., Don Allen, et al // Communication of the ACM. 2000. V. 43. №. 5. P. 74-82. 3. Балкарей IO. И., Голик Л.Л., Елинсон М.И. Автоволновые среды (ис- пользование в электронике). — М.: Знание, 1985. 4. Takahide О., Tetsuya A., Takashi F., Yoshihito A. Reaction-Diffusion Systems Consisting of Single-Electron Oscillators // Int. Journ. of Uncon- ventional Computing. 2005. V. 1. №.2. P. 179-196. 5. Tetsuya A., Yusuke K., Tetsuya H., Yoshihito A. Analog Reaction- Diffusion Chip Imitating Belousov-Zhabotinsky Reaction with Hardware Oregonator Model // Int. Journ. of Unconventional Computing. 2005. V. 1. №.2. P. 123-148. 6. Adleman L.M. Molecular computation of solutions to combinatorial prob- lems // Science. 1994. V. 266. P. 1021-1024. 7. Maley C.C. DNA Computing and Its Frontiers, Molecular Computing, (Tanya Sienko et al, Eds). — Cambridge, Massachusetts, London: The MIT Press, 2003.
Список литературы 255 Глава 8 I. Arbib М.Л. Schemas and neural networks for sixth generation computing, J. of parallel and distributed computing. 1989. V.6. P. 185-216. 2. Arbib M A. The brain as a metaphor for sixth generation computing, in Computing with Biological Metaphors I Ray Paton, Ed. London: Chapman & hall, P. 107-123, 1994 3. Conrad M. The brain-machine disanalogy // BioSystems. 1989. V. 22. P. 197-213. 4. Rambidi N.G. Biomolecular computing: from the brain-machine disanalogy to the brain-machine analogy // BioSystems. 1994. V. 33. P. 45-54. 5. Ashby W.R. Design for a Brain. — London: Chapman & Hall, 1960. 6. Rambidi N.G. Biologically inspired information processing technologies: reaction-diffusion paradigm // Int. J. of Unconventional Computing. 2005. V. 1. P. 101-121. 7. Квантовые нити, ямы, точки. http://nature.web.ru/db/msg.htmPmidM 182788&uri=page2.html
Научное издание РАМБИДИ Николай Георгиевич НАНОТЕХНОЛОГИИ И МОЛЕКУЛЯРНЫЕ КОМПЬЮТЕРЫ Редактор О. В. Салецкая Оригинал-макет: Е.В. Макеев Оформление переплета: Н.В. Гршиина Подписано в печать 27.07.07. Формат 60x90/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 16. Уч.-изд. л. 17. Тираж 1600 экз. Заказ № 1034 Издательская фирма «Физико-математическая литература» МАИК «Наука/Интерпериодика» 117997, Москва, ул. Профсоюзная, 90 E-mail: fizmat@maik.ru, fmlsale@maik.ru; http://www.fml.ru Отпечатано с готовых диапозитивов в ООО «Чебоксарская типография № 1» 428019, г. Чебоксары, пр. И. Яковлева, 15 ISBN 978-5-9221-0869-0 785922 108690

РАМБИДИ Николаи Георгиевич Профессор кафедры физики полимеров и кристаллов физического факультета МГУ. Основным направлением его деятельности было создание техники измерения характеристик микроструктур, пла- нарной технологии микроэлектроники. С конца 80-х годов областью научных интересов Н.Г. Рамбиди является молекулярная электроника - разработка биологически инспирированных вычислительных и логи- ческих устройств. «Я не знаю, как это сделать в миниатюрных размерах на практике, но я хорошо знаю, что вычислительные машины очень велики, они занимают целые комнаты. Почему же нельзя сделать их очень маленькими, из маленьких элементов, маленьких межсоединений - и под словом «маленький» я понимаю действительно малые размеры... Они будут быстрее считать, и так будет проще выполнять расчеты, которые мы сегодня едва ли можем делать. Они смогут выбирать методы анализа, которые, исходя из опыта, будут лучше, чем те, что мы знаем. И во многих отношениях они будут обладать качественно новыми свойствами». Ричард Ф. Фейнман «Есть еще много места в самом низу». 1959 г.