Текст
                    А.Н.ЧЕТАЕВ
НЕЙРОННЫЕ СЕТИ
и
ЦЕПИ МАРКОВА

А.Н.ЧЕТАЕВ НЕЙРОННЫЕ СЕТИ ЦЕПИ МАРКОВА МОСКВА ’’НАУКА” ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1985
32.81 4-52 УДК519.217 +519.95 + 612 Четаев АЛ. Нейронные сети и цепи Маркова. — М.: Наука. Главная редакция физико-математической литературы, 1985. - 128 с. В книге излагаются результаты, полученные при исследовании и моде- лировании нейрофизиологических процессов теоретико-вероятностными методами. Здесь изложен принадлежащий автору вариант математичес- кой теории стационарной активности нейронных сетей. Предложена удоб- ная система понятий для описания характеристик активности в зависи- мости от структуры межнейронных связей. Получены точные (не асимп- тотические) оценки характеристик активности сети. Поставлена и решена задача о зависимости уровня возбуждения сети от характеристик элемен- тов. Для решения этой задачи развивается теория марковских цепей с частично упорядоченным: пространством состояний. Рассматриваются смежные проблемы статистической механики и теории дифференциаль- ных уравнений. Рассмотрена проблема нейронной организации дыхатель- ного центра продолговатого мозга и предложена его детальная модель. Книга предназначена для математиков и физиков, интересующихся математическими проблемами в биологии, и для биологрв. имеющих достаточную физико-математическую подготовку. Табл. 1. Ил. 2.Библиогр. 68 назв. Рецензент академик ИМ. Гельфанд 1502000000-071 05 3(02)-85 162-85 Ч © Издательство "Наука". Главная редакция физи ко-мате мати чес кой литературы, 1985
ОГЛАВЛЕНИЕ Предисловие............................................................. 5 От автора..................................................................... 8 Глава I. Основные определения............................................ 12 § 1. Определение возбудимого элемента............................. 12 § 2. Определение сети............................................. 14 Глава 11. Локально однородные сет................................. 15 § 1. Локальная однородность...................................... 15 § 2. Сет из линейных возбудимых элементов....................... 18 § 3. Величины» эквивалентные дисперсии ......................... 22 § 4. Экстремальные сет.......................................... 27 Глава 111. Зависимость уровня возбуждения от возбудимост элемента.... 33 § 1. Постановка задачи...................... 33 § 2. Сет из линейных элементов.............. 33 § 3. Возбудимые среды. Теория Ставской........... 34 § 4. Элементы без рефрактерност. Теория Митюшина. 35 § 5. Сет из элементов-счетчиков................. 36 § 6. Обсуждение....... 39 Глава IV. Ансамбль сетей и сеть-газ................... 41 § 1. Ансамбль сетей и его рандомизация........... 41 § 2. Сет из линейных элементов................... 44 § 3. Сет из элементов с одной связью....... 46 § 4. Обсуждение......................................................... 48 § 5. Доказательство утверждений (А)-(Г)................................. *9 Глава V. Случайные сет................................................. 54 § 1. Постановка задачи............................................ 54 § 2. Теорема о представительност............................... 57 § 3. Доказательство неравенства Смита-Дэвидсона................ 66 § 4. Сравнение марковских операторов........................... 68 § 5. Обсуждение................................................ 69 § 6. Резюме..................................................... 69 Глава VI. Аксиоматика возбудимого элемента........................... 70 Глава VII. О блуждании по части ««о упорядоченному множеству......... 73 § 1. Монотонные функции....................... 74 § 2. Мажорирование мер......................... 75 § 3. Треугольные операторы................. 76 3
§ 4. Монотонные меры.......................................... § 5. Две леммы о частных...................................... § 6. Операторы................................................ § 7. Семейство операторов Р^д................................. § 8. Операторы, касательные к порядку......................... § 9. Удерживающие области..................................... § 10. Согласованные пары....................................... §11. Согласованные четверки................................... §12. Одно свойство функции Х(Л)............................... § 13. Заключение............................................... Глава VIII. Долгоживущие состояния конечных систем............. § 1. Метастабильные состояния и конечные системы............. § 2. Фазы и фазовые переходы................................. § 3. Теорема о максимуме..................................... § 4. Структура "болота"...................................... § 5. Медленные процессы...................................... § 6. Обобщения............................................... Глава IX. Моделирование нейронной организации дыхательного центра.... § 1. Детерминированность поведения сети........................ § 2. Сети на окружности........................................ § 3. Дисперсия периода колебаний............................... § 4. Гипотеза об архитектуре связей дыхательного центра........ § 5. Круговая модель дыхательного центра....................... § 6. Уравнения активности...................................... § 7. Основные свойства решений уравнений активности............ § 8. Режим бегущей волны....................................... § 9. Круговая модель дыхательного центра с окнами.............. Глава X. О размерности аттракторов для одного класса диссипативных систем.............................................................. § 1. Постановка задачи. Аттракторы и размерность............... § 2. Формулировка результатов.................................. § 3. Хаусдорфова и энтропийная размерности..................... § 4. Искажение объемов под действием фазового потока слабо сжимаю- щей системы..................................................... § 5. Оценка хаусдорфовой размерности аттрактора................ § 6. Доказательство теоремы 2.................................. Список литературы.................................................... Summary.............................................................. The Contents......................................................... 77 78 81 82 83 84 85 87 89 89 90 90 91 93 95 96 98 99 99 100 102 102 103 104 105 106 107 113 113 114 116 117 118 121 122 124 125
ПРЕДИСЛОВИЕ В предлагаемой читателю монографии А.Н. Четаева излагаются резуль- таты исследований систем, состоящих из большого числа взаимодействую- щих между собой сравнительно простых элементов. Такого рода системы изучались и изучаются до настоящего времени главным образом в связи с математическими моделями совокупностей взаимодействующих нервных клеток - ’’нейронных сетей”. С электрофизиологической точки зрения отдельная нервная клетка представляет собой сравнительно простой эле- мент, который сам по себе ’’умеет очень мало”: в первом приближении его даже описывают законом ’’все или ничего”, считая при этом, что он имеет лишь два состояния (’’покой - импульс”). Поэтому естественно возникает мысль, что сложность и потрясающее воображение многообразие явлений в нервной системе обусловлены не отдельными нейронами, а их взаимодей- ствием в больших совокупностях связанных между собой клеток — в нейронных сетях (’’тайна мозга - тайна нейронной сети”). Здесь не место подробно обсуждать, насколько такая точка зрения обоснована. Отметим только, что даже чисто электрофизиологически отдельный нейрон не так прост, как он представляется в обычных моделях, не говоря уже о том, что дальнейшие исследования биохимии нервной клетки могут заставить пол- ностью пересмотреть вопрос о роли отдельного нейрона в переработке ин- формации в нервной системе. Однако, даже имея в виду ограниченность упомянутого подхода, следует со всей определенностью подчеркнуть, что изучение моделей нейронных сетей во многих случаях имеет несомненный нейрофизиологический смысл. Такие сравнительно простые функции нерв- ной системы, как надежная передача сигнала, обеспечение заданного уровня возбуждения, генерирование периодических колебаний и т.п., хорошо воспроизводятся на моделях нейронных сетей. Очень возможно, что по мере дальнейшего изучения таких моделей будут выявляться все новые возможности нейрофизиологических интерпретаций. Кроме того, смысл и значение исследований моделей нейронных сетей не ограничивается лишь нейрофизиологическими приложениями. Близкие по характеру задачи возникают в ряде проблем коллективного поведения, при моделировании эпидемиологических процессов, при изучении некоторых моделей статисти- ческой физики и т.п. Таким образом, модели нейронных сетей имеют мно- жество различных возможных применений, да и в чисто математическом отношении возникающие здесь задачи представляют значительный интерес. Поэтому актуальность проблематики, связанной с нейронными сетями, несомненна. Понятно, что особое отношение эта проблематика вызывает у исследова- телей, совмещающих интерес к нейрофизиологии с математическим стилем 5
мышления. А.Н. Четаев как раз и является исследователем такого склада. Будучи соавтором ряда экспериментальных работ по физиологии дыхатель- ного центра продолговатого мозга, он сочетает некнижное знакомство с ней- рофизиологией со свободным владением необходимым математическим аппаратом. В своей монографии А.Н. Четаев сопоставляет известные из литературы и свои собственные, оригинальные результаты модельного ис- следования нейронных сетей и, рассмотрев их с единой точки зрения, вы- деляет важнейшие моменты общей теории сетей из возбудимых элементов. Большое внимание в книге уделяется поиску адекватных и естественных в математическом отношении общих определений, строгой постановке математических задач, а также указанию частных типов моделей, допускаю- щих достаточно полное аналитическое исследование. Главным направлением оригинальных исследований А.Н. Четаева являет- ся поиск условий ’’структурности” сети, т.е. таких условий, при которых отдельные нейроны работают в определенном смысле согласованно, ’’ко- герентно”. В этом отношении устремления автора полностью созвучны тому направлению исследований, которое в последнее время получило наименование ’’синергетики” и в рамках которого опубликовано большое число работ. Однако подход А.Н. Четаева к этой проблеме совершенно отличен от ’’синергетического”. Именно, А.Н. Четаев стремится выявить признаки ’’самоорганизации” сети не путем детального анализа ее поведе- ния (’’решения уравнений”), а с помощью исследования некоторых гло- бальных (хотя, возможно, и косвенных) ’’показателей самоорганизации”- таких, например, как дисперсия общего уровня возбуждения. Этот подход, разработка которого находится лишь в самой начальной стадии, выглядит многообещающим, в первую очередь с точки зрения связи теории и экспери- мента: сравнение теоретических и экспериментальных знаний ’’глобальных показателей” является несравненно более простой задачей, чем сопоставле- ние деталей функционирования. Некоторые идеи указанного подхода удач- но использованы автором при построении модели дыхательного центра. Подобными же соображениями А.Н. Четаев руководствуется при срав- нении поведения случайного ансамбля сетей с ’’сетью-газом” (модифика- цией ансамбля, описываемой марковским случайным процессом). В том обстоятельстве, что типичные сети ансамбля характеризуются более высо- ким уровнем возбуждения, чем ”сеть-газ” (неравенство Смита — Дэвид- сона) , автор видит признак ’’самоорганизации” процесса в типичных сетях ансамбля. С этой точки зрения А.Н. Четаев весьма последователен, когда он характеризует результаты об асимптотическом совпадении финальных уровней активности ансамбля и ’’сети-газа” и о представительности сред- них значений, установленные для определенного класса моделей, как ре- зультаты отрицательные (т.е. свидетельствующие об отсутствии признаков ’’самоорганизации”). Задачи, рассмотренные в монографии А.Н. Четаева, с математической точки зрения являются в своем большинстве задачами о марковских цепях специального вида. Поэтому существенное место в ней занимают матема- тические результаты, касающиеся свойств и оценок марковских цепей, а также ряд других примыкающих сюда исследований. Следует специально остановиться на научном стиле исследований А.Н. Че- таева, получившем прямое отражение в стиле изложения материала моно- 6
графин. А.Н. Четаева интересуют не только конкретные результаты сами по себе — они рассматриваются им и как иллюстрации общих концепций, и как материал для обобщений. Поэтому особую роль в монографии иг- рают гипотезы, которые автор рассматривает как ’’едва ли не центральную часть работы”. Для того чтобы выдвигаемые гипотезы имели точный мате- матический смысл, необходима адекватная система определений. Естествен- но, что эти общие определения также рассматриваются автором ’’как су- щественная часть работы”. Отмеченные особенности научного стиля А.Н. Че- таева сильно влияют как на выбор материала монографии, так и на расста- новку основных акцентов. Они также предопределяют и стиль изложения. А.Н. Четаев свободно переходит от точных формулировок к неформальным обсуждениям (и обратно), часто не приводя подробной аргументации и тем самым толкая читателя на самостоятельные размышения. Поэтому назвать монографию легкой для чтения нельзя, но, на мой взгляд, это полностью компенсируется оригинальностью и свежестью как основных идей, так и их изложения. Монография А.Н. Четаева не только подводит определенные итоги изу- чения нейронных сетей, но и поднимает новые проблемы, и это, пожалуй, наиболее сильная ее сторона. Книга особенно интересна для тех, кто непо- средственно занимается моделированием нейронных сетей, но она может быть использована также и широким кругом лиц (математиков, биологов, инженеров), впервые сталкивающихся с этой интересной и перспективной областью исследований. ЛИ Розоноэр
ОТ АВТОРА Наша книга посвящена математической теории возбудимых (нервных) сетей. Такая сеть состоит из множества возбудимых элементов — нейро- нов, соединяющихся между собой связями таким образом, что вероятность возбуждения каждого нейрона зависит от состояния других нейронов сети, и, с другой стороны, каждый нейрон, возбуждаясь, изменяет вероятность возбуждения других нейронов. Примером однородной сети (т.е. сети, состоящей из более или менее равноправных нейронов) является ретику- лярная формация ствола мозга и ряд других структур. При эксперимен- тальном исследовании таких сетей точно установить структуру их связей не представляется возможным. Определению доступны, во-первых, ло- кальные свойства сети (среднее количество приходящих к нейрону и исхо- дящих от него связей), во-вторых, характеристики активности одного или пары одновременно работающих нейронов и, в-третьих, усредненные харак- теристики активности всей сети. В связи с этим возникает вопрос о возмож- ности описания сети и процессов в ней по этим экспериментальным данным. При математической формулировке возникающих при этом задач есть опасность слишком упростить модель, сделать ее удобной для математичес- кого описания за счет адекватности этой модели реальным задачам; с дру- гой стороны, стараясь как можно более приблизиться к реальности, можно переусложнить модель настолько, что она не будет поддаваться анализу. Задача исследователя состоит в том, чтобы избежать обеих крайностей и существенно расширить круг моделей, которые и поддаются аналитическо- му описанию, и близки к реально существующим нервным сетям. Моделирование объектов нейрофизиологии возникло и развивалось поч- ти одновременно с развитием самой нейрофизиологии в ее электрофизиоло- гическом аспекте. Закон ’’все или ничего” был первой моделью нейрона. Теперь имеется широкий спектр работ по моделированию нейронных сетей? Они выполнены аналитически или с помощью ЦВМ, посвящены от- дельным центрам или определенным механизмам, встречающимся во мно- гих отделах нервной системы. С увеличением числа более или менее конкретных моделей приобрело вполне определенный смысл понятие нейронной сети самой по себе. Стало ясно, что есть задачи или классы задач, которые возникают, как только в моделировании обращаются к сетям. Так постепенно начала складываться теория, во многом берущая за обра- зец статистическую физику, но посвященная иному объекту — не газу или кристаллу, а нейронной сети. Эта параллель статистической физики и теории сетей всегда имелась в виду с тех пор, как впервые в 1946 году Н.Винер при- влек аппарат марковских цепей к рассмотрению задач о поведении сетей, е
В статистической физике и теории сетей рассматриваются системы, в конструкции которых ясно видны две ’’составляющие” Первая - элементы, из которых составлена система. В физике элементы суть атомы или молекулы. Свойства элементов описываются в ней потен- циалом парного взаимодействия. В физиологии элементы суть нейроны, а их свойства описываются тем, как импульсация одного нейрона влияет на другой. Вторая часть конструкции - способ, которым задается совокупность взаимодействий всех элементов системы. Некоторые черты отличия систем физических и систем физиологических видны сразу. Перечислим их. 1°. Разные атомы, например, в кристалле, взаимодействуют с разной силой, но взаимодействие это постоянно во времени. Нейроны, напротив, взаимодействуют только в отдельные моменты вре- мени - тогда, когда один из них возбужден. 2°. Взаимодействие атомов согласно закону Ньютона симметрично. При взаимодействии же нейронов всегда один из них действует на другой, т.е. их взаимодействие есть воздействие одного нейрона на другой. 3°. Нейрон обладает свойством рефрактерности, т.е. становится времен- но неспособным к восприятию воздействий после того, как сам воздейство- вал на других. Это свойство не имеет аналогий в статистической физике. 4°. Взаимодействия атомов определяются их взаимным расположением в пространстве. Расположение всех атомов системы в одном и том же пространстве задает сразу всю совокупность взаимодействий. Нейроны же ЦНС связаны друг с другом в сеть каким-то более сложным образом, не отражающим столь непосредственно расположение в пространстве. Перечисленные отличия при всем прочем сходстве обусловливают сле- дующее характерное положение. Две вполне аналогичные по постановке задачи — одна из статистической физики, а другая из теории сетей - могут иметь совершенно разные степе- ни сложности. Одна из них может быть интересной и естественной в своей теории, а другая — неинтересной и надуманной в своей. Может быть и такое положение, когда для задачи из одной теории вообще трудно придумать аналог, имеющий смысл в другой теории. Такого рода отличия двух теорий мы рассматриваем не как очевидное следствие несовпадения исследуемых объектов, а как содержательное и важное для моделирования проявление особенностей нейрофизиологических систем, устанавливаемое в сравнении с теорией, относящейся к системам другого класса. С другой стороны, сопоставление двух теорий не является для нас само- целью, но средством косвенной проверки задач на адекватность объекту. Одна из специфических задач теории сетей состоит в исследовании пове- дения сети в целом, например, уровня ее возбуждения, в зависимости от структуры связей при неизменных свойствах составляющих ее элементов. В физике нельзя изменить взаимодействия атомов, не меняя потенциала. Указанная задача рассматривается в книге. Другие задачи не обладают столь ярко выраженной специфичностью уже в самой постановке. Тогда специфическим оказывается "ответ”. 9
Собственно математические задачи, рассматриваемые в книге, - это задачи о конечных марковских цепях специального вида. Они касаются свойств финального распределения. Задачи решаются при наложении огра* ничений разной степени жесткости. Однако всегда в форме гипотез форму- лируются постановка задачи и соображения о характере ее решения для максимально общего случая. При обилии работ по нейронному моделированию, использующих язык марковских цепей, только работы Л.И. Розоноэра и А.Р. Ротенберга яв- ляются математическими по существу. Работы О.Н. Ставской, Н.Б. Василье- ва, А.Л. Тоома и др. находятся в непосредственной близи к нашим зада- чам, хотя в большей степени тяготеют к задачам статистической фи- зики. Перейдем к более подробному описанию содержания работы. Первая глава содержит определение возбудимого элемента и нервных сетей. В частности, вводится в рассмотрение класс локально однородных сетей, в которых каждый нейрон принимает столько же связей, сколько образует сам с другими нейронами. Далее в монографии рассматриваются только такие сети. Во второй главе вводится понятие локальной функции, т.е. функ- ции активности среды, зависящей только от локальных свойств связей каждого нейрона. Показано, что для линейных возбудимых элементов сред- ний уровень возбуждения является локальной функцией, а дисперсия этого уровня — нет. Показано также, что многие характеристики активности сети, имеющие наглядный физиологический смысл (дисперсия входных сигна- лов, выраженность волн возбуждения и т.п.), с точностью до локальной функции выражаются через дисперсию уровня возбуждения сети. Далее рассматривается вопрос об организации распространения возбуж- дения в сети. Оказывается, что мера этой организации — величина, проти- воположная дисперсии. Чем более хаотично распространяется возбуждение по сети, тем меньше дисперсия общего уровня активности. Далее ставится вопрос об экстремальных сетях, в которых возбуждение распространяется наиболее организованным образом, т.е. дисперсия имеет максимальную величину. Для одного частного случая возбудимого элемента эта задача получает полное решение. В третьей главе рассматривается вопрос о зависимости среднего уровня возбуждения сети от возбудимости каждого элемента. Указаны достаточно общие примеры возбудимых элементов, для которых эта за- висимость имеет естественный характер: с увеличением возбудимости каж- дого элемента общий уровень возбуждения в сети повышается. При всей интуитивной ясности этого утверждения оно не всегда оказывается вер- ным; в книге приведен пример сети, в которой при увеличении возбуди- мости отдельных элементов общий уровень возбуждения падает. Поскольку изучение конкретной сети с заданной структурой связей представляет значительные аналитические трудности, получили распростра- нение более простые модели (модели "сеть-газ”), в которых при каждом такте возбуждения связи назначаются заново более или менее случайным образом. Такого типа модели проще для аналитического описания, но оста- ется открытым вопрос о применимости полученных на этих моделях ре- 10
зультатов к реальным ситуациям. Еще в 1962 году в работах Смита и Дэвидсона было обнаружено, что замена детерминированной сети на сеть* газ приводит к понижению среднего уровня активности (для детермини- рованной сети расчет проводился на ЭВМ, для сети-газа - аналитически). В четвертой главе приведено строгое доказательство соответствую- щих результатов для некоторого класса моделей. В пятой главе рассматриваются ансамбли сетей. Каждая сеть задает- ся матрицей связей, и задано вероятностное распределение матриц в ансамб- ле. Возникает задача об аппроксимации среднего уровня активности в та- ком ансамбле уровнем активности какой-либо фиксированной сети, т.е. вопрос о том, можно ли считать, что большинство сетей из ансамбля ведет себя так же, как эта избранная сеть. В книге данный вопрос решается асимптотически. Дается определение ансамбля, зависящее от числа п элементов сети, и доказывается, что для рассматриваемого автором ансамбля имеет место теорема о представитель- ности: большинство сетей из ансамбля действительно ведет себя таким же образом, как и детерминированная сеть со связями ’’все на всех”. В шестой главе формулируется аксиоматика возбудимого элемента, которая может быть полезна для дальнейших исследований в этой области. Главы V11-X посвящены обобщениям и приложениям основных резуль- татов глав I-VI. Глава седьмая посвящена доказательству ряда неравенств, касаю- щихся условных вероятностей для марковских цепей, описывающих блуж- дание по счетному частично упорядоченному множеству. Результаты, изло- женные здесь, обобщают и расширяют результаты главы III. В восьмой главе рассматривается вопрос об одном из возможных определений понятия фазы для конечных систем, описываемых марковс- кими цепями в дискретном времени. Глава девятая посвящена физиологическим приложениям — иссле- дованию модели нейронной организации дыхательного центра продолгова- того мозга. Десятая глава не связана непосредственно с общей темой книги, но она возникла как естественное развитие представлений, связанных с моде- лированием дыхательного центра. Результаты главы IX получены в соавторстве с А.А. Честновой [48,49], главы X - с Ю.С. Ильяшенко [17]. При подготовке рукописи книги большую помощь автору оказал В.Л. Дунин-Барковский. Книга не могла бы увидеть свет без существенной поддержки И.М. Гель- фанда.
ГЛАВА 1 ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ Первая модель нейрона - формальный нейрон Мак-Каллока и Пит- са [29] — по существу была иной формулировкой закона ’’все или ничего”. Современные представления о нейроне, полученные на основе электрофи- зиологических методов исследования, значительно более детальны. Соот- ветственно в моделях используется ряд различных по степени сходства со своим реальным прототипом возбудимых элементов. Опыт моделирования привел, как нам кажется, к негласно принятому в литературе убеждению, что в моделях сетей решающим является не столько степень сходства модельного нейрона с реальным, сколько тфа- вильное воспроизведение структуры связей в системе. Таким образом, присутствие ряда основных свойств в возбудимом элементе достаточно для признания его похожим на нейрон. Вообще говоря, электрофизиологи описывают нейрон как объект де- терминированный. Однако в моделях он обычно представлен как вероят- ностный. Этим учитывается влияние не включенных в модель факторов. Более того, В.Л. Дунин-Барковский [13-15] показал, что с точки зре- ния функциональйого использования нейронных конструкций более при- годны как раз те, которые работают на фоне некоторого стохастического шума. Поэтому мы сразу начинаем с вероятностной модели нейрона. Реальный нейрон функционирует в непрерывном времени. Таковы же наиболее подробные его модели. Однако при исследовании сетей ис- пользуются обычно модели в дискретном времени. Они удобнее в анали- тическом отношении и неизбежны при моделировании на ЦВМ методом Монте-Карло. § 1. Определение возбудамого элемента Используемые нами марковские цепи принадлежат классу, промежуточ- ному между конечными цепями и тем общим классом цепей, для опреде- ления которых необходимо использование понятий теории меры. Поэтому для удобства и во избежание неясностей начнем с используемого опреде- ления марковской цепи. Определение. Марковской цепью называется пара (X Р), в кото- рой X - множество, аР = Р(х | х) - действительная неотрицательная функ- ция, определенная на X X X, При всех х' G X SP(x|x')=l. X Множество X называется пространством состояний цепи. Число Р(х |х') есть вероятность перехода из состояния х в состояние х 12
В обозначении (X Р) в зависимости от контекста мы будем понимать Р как матрицу переходных вероятностей, или как ядро оператора, или как марковский оператор. О пределение. Возбудимым элементом называется тройка (У, Р(т), У). Здесь (У, Р(т)) - семейство марковских цепей, зависящее от действительного параметра т, с общим пространством состояний У. Через V обозначено отображение V: У -* { 0,1}. Множество У называется пространством состояний элемента, функ- ция V - знаком или индикатором возбуждения. Состояние у G У называет- ся возбужденным, если K(j)= 1, и невозбужденным, если И(у) = 0. При интерпретации возбудимого элемента как стохастического автома- та параметр m имеет смысл входной величины, а И(у) - выходной. Приведем несколько примеров частных типов возбудимых элементов. Пример 1. Линейным называется возбудимый элемент, у которого У = {0,1}, отображение V — тождество, и Р(1 | у, т) = 6 + Ху + т. (1) Здесь 0 - некоторое положительное число, X - число неположительное. Вся строчка (1) имеет смысл, если О<0 + Х + т< О + т <1. (2) При данных 0, X неравенства (2) суть условия на допустимые значения входного сигнала т. Строчка (1), если рассматривать элемент функционирующим во време- ни; может быть записана как Pr { V(t) = 1} = в + ЛГ(г - 1) + т(г). В этом случае она называется правилом возбуждения. Если параметр X отрицателен, то возбуждение элемента уменьшает вероятность повтор- ного возбуждения в следующий такт времени. В этом смысле мы мо- жем говорить о существовании у элемента относительной рефрак- терное™. Пример 2. Рассмотрим возбудимый элемент с У = {0, 1} и правилом возбуждения Рг{У(г)=1} = ^(/и(г))[1 - Г(г - 1)]. Здесь — неотрицательная действительная функция, < 1, а второй множи- тель гарантирует невозбуждение элемента в момент, непосредственно сле- дующий за возбуждением. Таким образом, этот элемент обладает абсо- лютной рефрактерностью, длящейся ровно один такт. Пример 3. Рассмотрим элемент, заданный правилом Рг {И(О = 1} = ^(1/(0), где U(t) = yU(t — + 0<7<1. Величина U может быть названа потенциалом элемента Так как через по- тенциал осуществляется зависимость от прошлого входного сигнала, мы имеем модель, в которой присутствует временная суммация. 13
Замечание. Напомним, что определение возбудимого элемента уточ- няется в гл. VI наложением ряда дополнительных условии. Нигде, кроме формулировок гипотез, эти условия явным образом не используются. § 2. Определение сети Сетью называется конечное множество возбудимых элементов, взаимо- действующих друг с другом. Для удобства мы считаем элементы занумерованными числами 1,2, ... ..., и, и величины, относящиеся к элементу с номером s, снабжаем соот- ветствующим индексом. Состояние сети есть набор Х = <У1,У2,...,Уп) состояний ее элементов. По нему в соответствии с правилами взаимодейст- вия вычисляются входные сигналы т2, .. ., тп. После этого по набо- рам {>\} и {ms} находятся вероятности состояний сети в следующий такт времени. Таким образом строится марковская цепь, соответствующая сети. Определение. Сетью называется пара (Л, П), где h — функция це- лочисленного аргумента s, принимающая значения в множестве возбуди* мых элементов, иными словами, это - список элементов сети; П — дейст- вительная квадратная матрица порядка п. Она называется матрицей весов связей, и ее элемент интерпретируется как вес связи, идущей от эле- мента к к элементу s. Естественно считать, что = 0, s = 1, 2,.. ., п. Марковская цепь, соответствующая сети (Л, П), имеет пространством со- стояний множество Х= Yi X Y2 X ... X Yn. Ее ядро записывается в виде произведения Qsityi.yi-- • • \У1,У2. -- )= ПР,(у,|^т,), (3) где ms = ZaskVk(y'k). (4) к Строчка (3) имеет вероятностный смысл: после того как величины т5 вычислены по формулам (4), элементы независимо переходят в но- вые состояния, соответствующие следующему такту времени. Эти переходы совершаются так, как полагается в цепях (У,, Ps(ms)). Как правило, в рассматриваемых ниже задачах цепь (X Qn) конечна и эргодична. Финальные вероятности ее состояний обозначаются через р(х). Замечание. Объект статистической физики есть система динамичес- кая (кинетическая). Однако существенной особенностью этой теории яв- ляется то обстоятельство, что финальное распределение, грубо говоря, из- вестно заранее. Оно имеет особую форму гиббсовского распределения. Поэтому во многих задачах динамические уравнения не рассматриваются. В теории сетей ничего подобного, во всяком случае до сих пор, не уста- новлено, и в каждой задаче нужно заново по своей цепи исследовать фи- нальное распределение.
ГЛАВА И ЛОКАЛЬНО ОДНОРОДНЫЕ СЕТИ Всякая характеристика сети или ее активности есть функция (функцио- нал) F(h, О). В.Л. Дунин-Барковский первым занялся исследованием ха- рактеристик активности как функций О при неизменном аргументе h [14]. Он же первым обратил внимание на дисперсию уровня возбуждения как на содержательную характеристику активности. В.Л. Дунин-Барковский проводил исследование, моделируя сеть на ЦВМ и сравнивая значения дисперсии при разных П. В настоящей главе нами предпринята попытка подойти к аналогичным задачам аналитически. Ос- новное внимание при этом уделяется поиску удобной и адекватной системы определений. § 1. Локальная однородность Рассматриваются сети, которые считаются аналогами более или менее однородных реальных сетей. Поэтому налагается условие идентичности элементов сети. Это означает, что h(s) = Я для всех s. Соответственно сеть теперь обозначается (Я, О) или совсем кратко: (П). 1. Определения. Начнем с обычного определения однородности. На множестве квадратных матриц порядка п действует группа пере- становок п элементов — SH. Именно, с перестановкой я связано отобра- жение II &sk II*-* II &sk И» &sk = Q-nsitk • Определение. Подгруппа — I тг* = О } С S„ называется группой автоморфизмов сети (О). Определение. (Ставская, Пятецкий-Шапиро [40].) Сеть (О) од- нородна, если транзитивно действует на множестве {1, 2,..., п}. Определение локальной однородности менее жестко. Определение. Сеть (О) называется локально однородной, если 2п наборов (а1 s» &2S* • • • ’ лл$)» ................. $=1,2,...,л, (1) .....^л), составлены из одних и тех же чисел. Поясним определение. 15
Представим сеть как радиотехническое устройство. В нем идентичные модули изображают элементы сети. Входы и выходы модулей соединены в соответствии с Я проводами, цвета которых однозначно соответствуют весам связей. Локальная однородность такой схемы означает, что разрезав посередине все провода, мы получим п идентичных модулей с кусками про- водов, припаянных к входам и выходам, причем набор цветов на всех вхо- дах и выходах будет один и тот же. Вернемся к формальному о пре делению. Если взять какую-либо симметрическую функцию п переменных и под- ставить в нее один из наборов (1), отвечающих локально однородной сети, то получится число, зависящее от Я, но не от того, какой из наборов мы взяли. Если в качестве этой функции взять элементарный симметрический полином степени т, то полученное число удобно обозначить через от(Я). Очевидно, числа (Я), о2 (Я),..., оп _ 1 (Я) однозначно определяют неупорядоченные наборы (1), если сеть (Я) ло- кально однородна. Определение. Функции f(H, Я) и g (Н, Я) при фиксированном Н называются эквивалентными на множестве сетей М, если существует моно- тонно возрастающая по первому аргументу функция Hi, Пг, • • • > Пя -1) такая, что /(Я, Я) = <p(g(H, Я), Oi (Я), а2 (Я).оп _ j (Я)) для всех Я G М. Разумеется, сети, входящие в М, все локально одно- родны. Определение. Функция F(Ht Я) называется локальной на М, если она эквивалентна константе на М. Если функция локальна на М, то на нем она может быть записана как ^(oi, о2,..., ^и-1)* Если при всех Я6К функция локальна на М, то на VXAf она может быть записана как ф(Я, о2,... , ол_1). В выкладках удобно следующее обозначение. Запись ЯЯЯ)=НЯ, Я) modloc означает, что разность \f - g] есть функция, локальная на множестве всех локально однородных сетей с весами связей, удовлетворяющими нера- венствам I ask | < ct s, k = 1, 2...., п, при каком-либо с > 0. 2. Обсуждение. Утверждение 1. На множестве Миз одного элемен- та все функции локальны. Это очевидное утверждение показывает, что для того, чтобы быть нело- кальной, функция должна быть определена и рассматриваться на достаточ- но ’’богатом” множестве сетей. Рассмотрим этот вопрос подробнее. Очевидно Утверждение 2. Для того чтобы на М все функции были локальны, необходимо и достаточно, чтобы ot (Я),. .., t (Я) однозначно определя- ли Я6М 16
Определение. Множество сетей М называется простым, если су- ществует По и для каждой ПЕЛ/ существует действительная функ- ция действительного аргумента (£) такая, что ask = * Кроме то- го, все функции фп суть функции монотонно возрастающие. Утверждение 3. На простом множестве сетей все функции ло- кальны. Перед доказательством этого утверждения введем одно определение, позволяющее уточнить утверждение 3. Определение. По сети (П) для каждой пары пар ((s, к), (i, /)), в которой s^k и i^j, выписываем то из отношений <*sk < <*ij ’ ask = a3k > aij> которое справедливо. Вся их совокупность называется схемой сети и обо- значается Гп. Утверждение 4. Посхеме Гп и О1(П),ал_ 1(П) сеть (П) вос- станавливается однозначно. Это очевидное утверждение влечет Утверждение 5. На множестве локально однородных сетей всякая функция может быть записана как ф (Н, Гп, Qj, а2»• • •, аи -1) • Доказательство утверждения 3. Достаточно заметить, что в силу монотонности функций фа все сети из простого множества имеют одну и ту же схему. 3. Статистическая физика. Рассмотрим статистическую физику как тео- рию, к которой приложимы введенные выше понятия. Точнее говоря, мы имеем в виду только математическую теорию, основанную на распределе- нии Гиббса (см., например, [35, 42]). Ее начальные определения можно ввести так, что получится некоторый частный вид сети из возбудимых элементов. В этом мы следуем О.Н. Ставской [39]. Так как нас не интересуют тонкости, возникающие в термодинамичес- ком идеальном переходе или при рассмотрении бесконечных систем, мы будем определять систему из конечного числа частиц. Возбудимый элемент задается правилом возбуждения Рг{И,(Г)=1} = exp(0+ms) 1 + ехр(0 + ms) Здесь VJt) не зависит от V/t - 1) В терминах физики К, = 1 означает наличие частицы в ячейке (состоянии) г, а К, = 0 - отсутствие. Элементы сети, соответствующей так называемой решетчатой системе, считаются расположенными в узлах ограниченной области целочисленной решетки размерности 1,2 или 3. В статистической физике влияние границ области в конечном итоге (при термодинамическом предельном переходе) оказывается несущественным. Поэтому сразу избавимся от них, взяв об- ласть в виде отрезка, квадрата или куба и отождествив границы так, чтобы получился ’’дискретный тор” соответствующей размерности. Итак, теперь s у нас есть номер узла на дискретном торе. Сам соответ- ствующий узел обозначим через Между узлами на торе естественным образом определено расстояние р(£, Вес связи определяется через 2. А.Н. Четаев 17
расстояние и потенциал парного взаимодействия: а,к = и(р&Лк)>- Потенциал U — функция, монотонно убывающая. Если потенциал парного взаимодействия считать характеристикой самих частиц, то рассматриваемые в статистической физике множества Мсведутся, вообще говоря, к множествам из трех элементов - решеток трех размерно- стей. На самом же деле они редко рассматриваются одновременно, т.е. обычный случай соответствует множеству М из одного элемента. Пусть потенциал взаимодействия не входит в число характеристик части- цы, а относится к системе взаимодействий (связей). Тогда каждая решетка при разных потенциалах порождает простое множество сетей. Это сле- дует из монотонности потенциала как функции расстояния. Из всего сказанного ясно, что статистическая физика имеет дело по су- ществу только с функциями, локальными по нашему определению. § 2. Сети из линейных возбудимых элементов Линейные возбудимые элементы были введены выше в гл. I, § 1, при- мер 1. В настоящем параграфе будет выведен ряд нужных для дальнейшего формул и доказана нелокалъность дисперсии уровня возбуждения рассмат- риваемых сетей. 1. Основные формулы. Для удобства допустим связь ”на себя” с весом ass = X. Тогда правило возбуждения (1.1) *) запишем в виде Рг{ИХО= 1} = ^ + S^Mr-l). (2) к Далее потребуем, чтобы эта вероятность всегда была заключена между ну- лем и единицей. Тогда матрица переходных вероятностей Qn не содержит нулевых элементов. Следовательно, цепь (X Qn) эргодична, и существуют финальные вероятности р(х). Поэтому существуют средние от функций со- стояния, взятые по финальным вероятностям. В силу (2) для некоторых средних выписываются уравнения, не вклю- чающие самих финальных вероятностей. Например, для средних Ps = 2 У(у*)р(х) X получается система ps = в + Zaskpk, s=l,2....п. (3) к В случае локально однородных сетей она сразу дает ответ Замечание. Так как мы ввели aw в число весов связей, возникло две возможности определять ат (П): старым способом, считая = 0, и ' Здесь и далее при ссылке на формулы другой главы указывается сначала номер главы, а потом номер формулы. 18
новым - с аи = X. Зная X, нетрудно ’’старые” И ’’новые” Qi, — выра- зить друг через друга. Поэтому разница между способами несущественна с точки зрения предыдущего параграфа. В вычислениях же удобнее пользо- ваться новым способом. Так и сделано в формуле (4). Аналогичным образом для средних Psk = 2 X в случае локально однородных сетей из (2) следует система Psk = ®(2р - 0) + 2 asiakjPij, s*k, (5) в которой положено pss = р. Таким образом, числа pss не входят в число неизвестных системы (5). Существование решения системы (5) следует из эргодичности цепи (X 0п). Единственность доказывается отдельно. Утверждение. Решение системы (5) единственно. Доказательство. Выше было принято, что в нашей сети неравен- ства (1.2) - строгие. Это означает: о<0 + е + s + < 1 * к 2 при всех s. Следовательно, при всех $ 2 I ask I = < 1. (6) к к В силу этих неравенств оператор Vsic = S &si<*kj%ij, (7) i * i переводящий {$,,} в {rjsk}9 оказывается сжимающим в норме II {u } II = max IUI. s Ф к Действительно, I risk | < S| asi II akj II | < U < ll{f//}ll(S|a,/l)2 < II Ш = 0- i Утверждение доказано. Так как оператор (7) сжимающий, решение системы (5) можно записать в виде абсолютно сходящегося ряда Неймана. Этот ряд мы выпишем после предварительной замены переменных, упрощающей вид свободных членов. Итак, положим Psk =Р(1 -Р)Я5к +р2- 2* 19
Для переменных qsk система (5) приобретает вид qsk= X аз(ак^ц + lamakm, s*k. i* j т Ее решение записывается рядом о . = X X X Ч,к „-ami t i • -hm ' v - о m ta =f /fl (8) (9) в котором ... rn = ••• m ••• a/j m )• (10) Дальнейшее исследование сетей из линейных возбудимых элементов осно- вано на использовании полученной выше явной записи решения системы (5) в форме ряда Неймана. 2. Нелокальность дисперсии. Уровнем возбуждения сети в состоянии х называется доля возбужденных элементов И(х) = л'1 X V(ys). 3 Средним уровнем возбуждения называется среднее Г(Я)=Х И(х)р(х). X Из (4) следует т.е. средний уровень возбуждения К(П) есть функция, локальная на множе- стве всех локально однородных сетей. Утверждение. Дисперсия уровня возбуждения D(Sl) = Х[К(х)-Г(Я)]2р(х) X не есть величина, локальная на множестве локально однородных сетей из линейных элементов. Доказательство. Начиная с этого места, используются вычисле- ния ”по модулю локальных величин” (см. § 1, п. 1). Равенством D(Sl) = n~2 X psk=n~2p(\ -р) X qsk modloc (11) з, к s # к дело сводится к доказательству нелокальное™ величины 0= X qsk= X X X (12) s * к v = i т ia Ф ja В этом мы убеждаемся из примера. 20
Пример. Рассмотрим две сети из четырех элементов каждая. Пусть / 0 77 0 17 \ / 0 0 т? 17 | 77 0 77 0 1 I 17 0 0 1? П1=1 О I? О П ]> ПП = 1 J? о о \ 1? О 77 О / \ О 1? 17 о Величины <71,02,03 для них совпадают, а ряды (12) начинаются с членов Qi = 4 т?2 + 8tj4 + ..., Qn = 4т?2 + 12т?4 + ..., т.е. не совпадают уже во втором члене. Следовательно, Qi Ф Q\\ при неко- тором 77. Этим доказана нелокальность дисперсии для сетей из четырех эле- ментов (л = 4). Нейронные схемы 1 и II изображены на обложке книги. Пусть п > 7. Построим две сети — (П\) и (Пц) — из п элементов каж- дая. Обе эти сети будут распадающимися на несвязанные друг с другом под- сети. Сеть (О|) распадается на (S2j) и сеть (По) из (п — 4) элементов. Аналогично сеть (Иц) распадается на (Пп) и (По). Сеть (По) может быть любой сетью, у которой всякий элемент испускает и принимает ровно по две связи ненулевого веса, и веса эти равны 17. Очевидно, сети (Hj), (Ц']) обе локально однородны и от ) = 0т (Пц). Так как подсети не связаны, то , 16 (л-4)2 ZX п!)=—ад) + —D(Oo), л2 л2 , 16 (Л-4)2 адо =—адо + —~ ад). л2 л2 Отсюда нелокальность дисперсии очевидна и при л > 7. Замечание 1. Можно было бы доказать нелокальность для л = 5,6. Тогда она была бы установлена для л > 4. При л = 1, 2, 3 ’’сигмы” опреде- ляют сеть с точностью до автоморфизма (гл. II, § 1, п. 1), т.е. условие л > 4 - точное. Замечание 2. Совпадение коэффициентов при 172 в рядах для и Qu не случайно, так как ряд (12) начинается с локальной величины 2 S Ctsm 01/ст = 2 Л (72(0). (13) т s # к Доказательством нелокальное™ дисперсии завершена вводная часть главы II. 3. Некоторые вспомогательные соотношения. Рассмотрим систему Кзк = ^si^kj^ij + CLsm OLjcm • (14) i *j m Она отличается от системы (8) только включением в число неизвестных величин с совпадающим индексом. Очевидно, что q5k = к5к при s # к. Обозначим К = Z к55. 21
Далее выкладки К + Q= S = s, к - S ( S + S ) = а](£2)2 + ла 1(П) з, к i Ф j т дают соотношение 0 = (1 - о>)"1(—АГ) modloc. (15) Из (9), (10) и (14) получаем К - Ъ S asiasjQij* (16) s i ± j а в переменных pZ/ - —- Е asiaSjPij modloc. р(1 -р) j /*/ Для величины ? “ ^si^sjPij з, i, j получаем К =--------Р modloc. (17) Р(1 -Р) Вспомогательные вычисления окончены. Полученные соотношения используются в следующем параграфе. § 3. Величины, эквивалентные дисперсии В настоящем параграфе делается попытка придать точный смысл некото- рому эвристическому (интуитивному, образному) представлению о процес- сах, происходящих в сети и их проявлениях в значениях дисперсии уровня возбуждения. Выделим и отметим элементы сети, возбужденные в последовательные моменты времени. Так мы получим картину распространения возбуждения. В отличие от известных моделей [8, 9] возбудимых сред, используемых при изучении фибрилляции, распространение не будет детерминированным, но вероятностным. При этом с течением времени будущее положение воз- бужденных элементов все меньше будет зависеть от их исходного располо- жения в сети. Интуитивно такое вероятностное ’’размазывание” картины распространяющегося возбуждения допускает аналогию с затуханием обычных волн. Происходящее в сети мы уподобляем распространению волн на поверх- ности озера. Они возникают, распространяются, сталкиваются, взаимно гасятся или сливаются, затухают и рождаются вновь. В терминах этой аналогии делается высказывание: дисперсия уровня возбуждения тем меньше, чем больше волны. Некоторая парадоксальность 22
этого утверждения снимается в другом варианте формулировки. Он звучит так: дисперсия уровня возбуждения тем меньше, чем меньше затухание, ’’размазывание”, ’’хаотичность”. Высказанная мысль формализуется следующим приемом. Рассматриваются все локально однородные сети с данными значениями О] (П), о2 (П), ..., составленные из линейных элементов с данными парамет- рами О, X. Вводится ряд величин, с интуитивной точки зрения характери- зующих затухание ’’волн возбуждения”, хаотичность и т.п. Далее доказы- вается эквивалентность этих величин дисперсии уровня возбуждения в смысле определения эквивалентности из § 1, п. 1. 1. Синхронность и синергичность. Число р5к можно понимать как меру синхронности активностей элементов s и к. Величину $зк = атзатк т можно интерпретировать как меру синергичности элементов s и к, т.е. как меру одинаковости их воздействий на другие элементы сети. Мерой совпадения (согласованности) синхронности и синергичности во всей сети будет = S Sskpsk =р(1 — р)к modloc. s # к Из (11), (12), (15) получаем ZX^) = w”2(l -Oi)e|(-En) modloc. Синергичность есть характеристика ’’конструктивных” свойств сети, синхронность — свойств распространения возбуждения по ней. Дисперсия уменьшается с ростом их согласованности - таков смысл последнего соотношения. 2. Дисперсия входных сигналов. Входной сигнал на элемент s в состоя- нии сети х определяется как ms(x) = S ask V(yk). к Его среднее значение находится из (4): т5 = (ц (П)р. Рассмотрим диспер- сию отдельного сигнала d, = S [w/x) - тх ]2р(х) .V и усредним дисперсии ds по всем элементам сети. Вычисляя по mod 1ос, получаем d = п Zds = n~lP mod 1ос s Отсюда и из (И), (12), (15), (17) находим соотношение d = n(\ — OiX-^0 modloc. Из него следует 23
Утверждение. Если при переходе от одной сети к другой с теми же значениями , ... уменьшилась дисперсия уровня возбуждения, то одно- временно дисперсии входных величин т5 в среднем увеличились. Получилось, что в пределах класса сетей с данными Oj, ... сеть с наи- менее колеблющимся уровнем возбуждения имеет входные для ее элемен- тов сигналы, колеблющиеся с наибольшей амплитудой. Такой же результат получается при вычислении сначала дисперсии в наборе {т5(х)} и последующем усреднении по состояниям сети. 3. Потерянное взаимодействие. Построение этого пункта исходит из известных общих соображений И.М. Гельфанда и М.Л.Цетлина о взаимодей- ствиях в реальных биологических системах [10]. Рассмотрим связь, идущую от элемента к к элементу s. Пусть она воз- буждающая, т.е. ask > 0. Если в течение Долгого времени наблюдать элемен- ты s и к, то в качестве меры неэффективности действия к на s естественно выбрать величину (1 - 1))Г*(0 >. Здесь угловые скобки означают усреднение по времени. Для реальной сети эту величину можно интерпретировать как истраченную впустую энергию на проведение возбуждения — как потерянное взаимодействие. Аналогичное рассуждение приводит к определению потерянного взаимо- действия для тормозной связи (а5к < 0) в виде *,*=-<>!* <W+l)rk(d>. Суммарное потерянное по всей сети за единицу времени взаимодействие Na удовлетворяет соотношению 1 Na = S Nslc = л2(1 - ai)D(Q) mod loc. s, к Следовательно, в сети с относительно малыми потерями взаимодействия относительно мала дисперсия уровня возбуждения. 4. Детерминированность. Измерим детерминированность, с которой происходят переходы в марковской цепи (X, Qq) . Определение. Пусть х', хп — два состояния, т.е. два набора из ну- лей и единиц (определение дается для рассматриваемого частного случая возбудимых элементов). Хэмминговским расстоянием hg (х', х") между ними называется количество мест в наборах, на которых в них стоят разные числа. О п ределение. Детерминированностью перехода за такт времени при начальном состоянии х называется величина Hg(x) = S hg(x’,x'')Qn(x' |x)Gn(x" |х). X X ” Если Hg (х) = л, то переход детерминирован в обычном смысле этого слова. Определение. Детерминированностью цепи (X, Q&) называется среднее Hg(en) = 2Hg(x)p(x). 24
Если Hg (Q&) = л, то сеть представляет некоторый конечный автомат (не стохастический). Для локально однородных сетей из линейных элементов нетрудно дока* зать соотношение Щ(Ся) = 2л2(1 -a2i)D(Q) modloc. Итак, чем детерминированнее ведет себя сеть, тем меньше дисперсия ее уровня возбуждения. 5. Ответ сети на возбуждение. Запишем правило возбуждения (2) в виде Рг{к,(О=1} = MO + w,(O и положим 0s(t) = 6 при t > 0. На вероятность возбуждения элемента s в момент t будем смотреть как на функцию начальных условий т f (0), Qi (0). Функцию g(s, к, t) = дРг{И,(р=1} эе*(О) будем интерпретировать как ’’вероятностную волну”, следующую за возму* щением элемента к в момент t = 0. Степень выраженности волны будем измерять величиной t > о $ Для всей сети характеристикой будет сумма g = ^gk- к У тверждение. Функции g и -D эквивалентны на множестве однородных (§ 1, п. 1) сетей. Доказательство. Величина g(s, к, t) удовлетворяет соотношению g(s, fc, Г + 1)= Sotj/g(/, М) i и начальным условиям g(st к, 0) = 6^. Отсюда видно, что она есть матричный элемент с индексами s и к матрицы О'. Из этого для# находится выражение в виде ряда * = Z Е [Z asi,atii2 ...aZpJJ= Z Е Z г/' 'г *. V = 0 J, к ia v = 0 s, к ia,ia Выпишем теперь ряд для величины К. Из (9), (16) получаем К= Z Z Z Г "* . J/i/2 ••• Ь р = о з, к ia*ja ,,/2 Эти два ряда отличаются только условиями суммирования по i, j. 25
Перегруппируем члены рядов: g= zgsk, gsk= s s г;-;. s,k p=0 ia,ja к= E Ksk, Ksk= s s r/;;;*. s, к V = 0 ia* ja Введем матрицы A =11^11, Я = ||^|Ь Возьмем вектор е = (1,1, •••> 1). С использованием естественного скаляр- ного произведения можно написать К = (е, Ле), g = (е, Be). Если сеть (О) однородна, то величины Eg sk, ^Ksk ots не зависят. Следо- к к вательно, вектор е - собственный у матриц Л и В, а К и g суть умноженные на п собственные значения этих матриц. Лемма. Имеет место соотношение АВ = В-А. (18) Доказательство леммы будет дано позже. Из матричного соотношения (18) имеем (е, АВе) = (е, (В - Л». В силу сказанного перед леммой об А, В, К, g и е последнее соотношение влечет Kg = (g-K)n, откуда или _ р(1 -р) /, п \ -D =------— 11-------I mod юс. п(1 - of) \ g + n/ Так как g > 0, величины g и —Dэквивалентны. Доказательство леммы. Назовем выражение рЯ, ... ivk l ... ijk s Ic допустимым,если ia^ja при всех а. Всякое выражение Г ”’к либо допусти- мо, либо однозначно разлагается в произведение Г1 “ Г ™ *, в котором левый множитель допустим. 26
Если взять всю совокупность выражений и умножить каждое из них слева на каждое допустимое, то снова получится вся совокупность таких выражении, за исключением допустимых. В силу однозначности разложения на множители, указанной выше, при перемножении каждое выражение будет получено не более одного раза. Сказанное в точности эквивалентно матричному соотношению (18). Лемма доказана. § 4. Экстремальные сети Из рассуждений предыдущего параграфа естественно возникает вопрос об организации сети с минимальной дисперсией уровня возбуждения. Этот вопрос вдвойне интересен тем, что дает повод задуматься над самой постановкой экстремальных задач о сетях. Дело здесь не в том, что воз- можны какие-либо тонкости относительно существования экстремума, а в том, какие постановки дадут ’’осмысленные” ответы. На наш взгляд, задача: ’’найти сеть с минимальной дисперсией уровня возбуждения в классе сетей из п элементов Н и данными значениями 01,02» •••» ап-1 ” — задача бессмысленная. Почему мы придерживаемся этого взгляда, будет ясно после предъявления ’’правильной постановки”. 1. Вспомогательные определения. В следующих пунктах одновременно будут рассматриваться сети из разного числа элементов. Поэтому удобно внести в некоторые определения поправки, после которых л в них не будет входить вовсе. В настоящем параграфе мы пользуемся исходным определением величин от (О) (гл. II, § 1, п. 1), уточненным следующим образом. Определение. Пусть п - число элементов в локально однородной сети (П). Доопределим величины от (П) для всех т > л, положив их рав- ными нулю. Это изменение эквивалентно добавлению нулей в наборы (1). Если от(П) ¥= 0, то в сети (П) не меньше чем (т + 1) элемент. Однако по данным Oi, о2, • • • нельзя оценить число элементов в сети сверху. При рассмотрении сетей из данного числа элементов мы не будем считать разными сети,-отличающиеся только нумерацией элементов. Иными слова- ми, мы отождествим сети (П) и (П*), если П' = яПдля некоторой пере- становки л G S„. Такое отождествление требует ограничить рассмотрение функциями, не зависящими от нумерации. Определение. Функция F(H, П) называется не зависящей от нуме- рации (элементов сети), если F(H, П) = F(Ht яП) для всех я G S„. Дальше будут рассматриваться функции, определенные на сетях из лю- бого числа элементов. Приведем два примера. Пример I. Функции V(H, Q) и £>(Я, П) исходно определены для сетей из любого числа элементов. Пример 2. Функция F(H, О) равна V(H, П), если в сети (П) - чет- ное число элементов, и равна D(H, П), если в сети (S2) - нечетное число элементов. 27
Следующими определениями мы исключаем из рассмотрения функ- ции F, ’’склеенные из разных кусков”. В примере 2 указана как раз такая функция. Пусть в сети (П) ровно п элементов. Возьмем элементарный симметри- ческий полином степени т от п переменных: £2, • • •» £л)- Введем среднее (Я, П) = S ат (ГО!), V(y2 X ... , V(yn))p(x). Здесь р(х) - финальная вероятность состояния х = (ylt у2, ...) в цепи (X Сп )• Доопределяем величины ЕШ(Я, П) для всех т> п, положив их равными нулю. Рассмотрим все функции F(H, Q)5^(SbS2,...,Sp) и равномерные пределы последовательностей таких функций (у не ограни- чено). Назовем их характеристиками активности. Только они будут рас- сматриваться в следующих пунктах. 2. Постановка задачи. Нелокальность F(H, П) означает, что у сетей из п элементов Н при данных значениях Oi, о2, ... значения F могут быть различными. Задача об организации сети с экстремальным значением F при данных л, Я, Qi, а2> ... состоит в нахождении схемы этой сети. Следовательно, экс- тремум ищется у функции, определенной на конечном множестве, и потому существует всегда. Построения, к которым мы сейчас переходим, могут пониматься двояко: 1. Как решение одной конкретной задачи, начинающееся здесь и гфо- дрлжающееся в следующем пункте, или 2. Как общая постановка задачи, для которой конкретная постановка составляет частный пример. Конкретная задача состоит в поиске сетей, доставляющих максимум величине g(Н, П). Напомним, что для однородных сетей из линейных эле- ментов g и -D эквивалентны. В экстремальной задаче также рассматри- ваются линейные элементы. Вместо того чтобы описывать числа ат, ска- жем прямо о весах связей: каждый элемент рассматриваемых сетей испус- кает и принимает ровно г связей веса 1? > 0, остальные связи имеют нуле- вые веса. В общем случае F удовлетворяет условиям из предыдущего пункта, Я удовлетворяет аксиомам из гл. VI, числа от суть нули при достаточно больших т. Итак, переходим к самой задаче. Задача 1. Экстремальная сеть ищется в классе сетей с данными п, Н, 01,02♦• • • Определение. Все сети, являющиеся решениями задачи 1, называ- ются п-экстремальными. Для того чтобы описать организацию л-экстремальных сетей, необходимо рассмотреть серию задач 1 для всех достаточно больших л. Задача 2. Для данных Я, Qi, а2> ... ищутся все л-экстремальные сети для всех л > л0. 28
Каждая ^-экстремальная сеть может быть нераспадающейся или распа- даться на несвязные подсети. Определение. Нераспадающаяся далее подсеть л-экстремалыюй сети называется элементарной. Элементарная подсеть рассматривается как подсеть экстремальной и сама по себе. Во втором случае ее элементы заново перенумерованы числа- ми 1, 2, .. . без пропусков, а между элементами установлены связи с теми весами, какие были при рассмотрении элементов в составе л-экстремаль- ной сети. Мы не будем различать элементарные сети, если разница сводится к нумерации элементов. Очевидно, у элементарной сети значения ап а2, ... те же, что и у всех рассматриваемых в задаче сетей. Иными словами, элементарные сети вхо- дят в класс рассматриваемых сетей и как самостоятельные сети. Данная элементарная сеть может не быть подсетью данной л-экстремаль- ной сети или быть ею. Во втором случае элементарная сеть может входить в л-экстремальную в качестве подсети один или несколько раз. Таким обра- зом, имеет смысл понятие, кратности, с которой элементарная сеть входит в экстремальную. Кратность принимает значения 0,1,2,... Распадение экстремальной сети на подсети означает существование ’’оп- тимального размера” сети в данной экстремальной задаче. Поэтому естест- венна задача 3. Задача 3. Для данных Н, Qi, а2,... ищутся все экстремальные сети. Среди экстремальных сетей могут оказаться ’’типичные” и ’’редкие”. Проведем это разделение строго. Возьмем элементарную сеть (П). В каждую л-экстремальную сеть она входит с некоторой кратностью. Максимум кратности, взятый по всем л-экстремальным сетям, обозначим через /(л, О). Определение. Элементарная сеть (П) называется существенной, если — /(л, П) lim —------->0. п -+ °° л В следующем пункте высказывается гипотеза, согласно которой указа- ние существенных сетей дает достаточно полное описание л-экстремальных. Поэтому постановка экстремальной задачи принимает такой окончатель- ный вид: Задача 4. Для данных Н, Qi, о2,... ищутся все существенные сети. 3. Гипотеза и утверждение. Гипотеза. Пусть F удовлетворяет усло- виям из п. 1, Я удовлетворяет аксиомам из гл. VI. Рассматривается задача о максимуме F. Тогда 1 °. Элементарных сетей конечное число. 2°. Всякая л-экстремальная сеть распадается на некоторое количество существенных сетей и ’’остаток” из ограниченного сверху (равномерно по л) числа элементов. 3°. Существенная сеть единственна. Утверждение. Пусть возбудимый элемент - линейный, X < 0. Каж- дый элемент рассматриваемых сетей испускает и принимает ровно г связей веса п > 0, остальные веса нулевые. Для F = g(H, И) высказанная выше ги- потеза полностью справедлива. 29
Доказательство этого утверждения дано в следующем пункте. Замечание. Разумеется, гипотеза не может быть справедлива всегда. Например, если Н - линейный, F= V(Ht £2), то Г(Я, £2) = е 1 -X-MQ) и все рассматриваемые нераспадающиеся сети суть элементарные. Поэтому следует ожидать справедливости гипотезы не во всем простран* стве (F, Н, О\, о2,...), но на всюду плотном множестве относительно лю- бой ’’естественной” топологии в нем. После сказанного уточнения продолжим гипотезу. Гипотеза (продолжение). Пусть (£2 ) - единственная сущест- венная сеть и в ней ровно п элементов. Тогда группа автоморфизмов сети (£2) (гл. II, § 1, п. 1) содержит циклическую группу порядка и в качестве своей подгруппы. 4. Доказательство утверждения изп. 3°. Определение. Введем сети, обозначаемые в дальнейшем как (к, г). Сеть (к, г) состоит из к групп по г элементов в каждой. Группы не пересекаются. Все связи от элементов одной группы идут ко всем элементам какой-либо другой группы. При этом группы посылают связи друг на друга в циклическом порядке*). В сети (к, г) содержится ровно кг элементов. Группа автоморфизмов сети (к, г) есть произведение ZK на (Sr)“. Элементы сети занумеруем так, чтобы остаток при делении s на г был номером группы, в которую входит элемент s, а связь между группами соответствовала циклическому порядку их номеров. Отсюда сразу видно, что^к ry D ZKr. Ниже мы докажем, что всякая ^-экстремальная сеть в нашей задаче рас- падается на некоторое число сетей (2, г) и ’’остаток” не более чем из N элементов. Здесь N- число, зависящее только от 0, X, i?, г. Функция g(H, £2) есть сумма величин gk (гл. II, § 3, п. 5). Так как сей- час мы не включаем X в число весов связей и ass = 0, нужно заново ввести обозначения. Обозначим через h(s,k,t) матричный элемент с индексом sk матри- цы £2г. Тогда g(s, к, г)= 2 СТ'Х'-ТЛ($, к,т\ 7 = 0 где g(s, к, t) - функция, определенная в § 3, п. 5. Следовательно, gk(Q)= 2 S[ £ Cftf-'hbk, т)]2. (19) t>0 S 7=0 Лемма 1. Рассмотрим нераспадающиеся сети из числа тех, для кото- рых мы рассматриваем сейчас задачу на максимум. Величинаg*(£2) прини- мает максимальное значение для элементов из сети (2, г ) и только для та- ких элементов. *) В сети (к, г ) элементы испускают и принимают ровно г связей нулевого веса П > 0, как и полагается сетям, которых касается доказываемое в этом пункте ут- верждение. 30
Доказательство. О функциях h(s, к, t) известно: во-первых, h(s, к, t) > О, во-вторых, к, r) = (rri)T, s в-третьих, maxh(s, к, 1) = тц S в-четвертых, max h(s, к, г) < S asi max h(i, к, t - 1). j i j Из этого, в частности, следует h(s, к, f) < 1. Посмотрим на выражение (19). Очевидно, для максимальности gk достаточ- но максимальности суммы S[ £ C'\r~Kh(s,k,r)]2 (20) 7 = 0 при каждом t. Для этого достаточно, чтобы: 1) функции h(s, к, Г) при каждом t приняли два значения: Л($, к, 2) множество {s: h(s, к, t) = 0} зависело только от четности t (к фиксировано), 3) при данном s все слагаемые суммы, заключенной в квадратные скоб- ки, были одного знака. В случае сети (2, г) это, очевидно, так. С другой стороны, экстремальность сумм (20) при t < 3 уже обеспечивает структуру сети (2, г). Действительно, из максимальности этих трех выражений следует h(s,k, 3) = (rxi)2h(s, к, 1), что в свою очередь означает принадлежность к сети (2, г). Лемма 1 до- казана. Лемма 2. Обозначим через А максимальное значение величины gk (достигающееся в сети (2, г)) и через а - максимальное значение величи- ны gk для всех рассматриваемых сетей, кроме сети (2,г). Оно может и не достигаться и понимается как супремум. Имеет место строгое нера- венство А>а. Доказательство. Разность A -gk(£2 ) при (П) #= (2, г ) не мень- ше, чем разность первых трех членов соответствующих рядов (19). В силу леммы 1 и соображений, использованных при ее доказательстве, эта раз- ность строго положительна. Лемма доказана. Следствие. Если к не лежит в сети (2, г), то 0 <B<gk <А. 31
Перейдем к собственно доказательству утверждения о справедливости гипотезы для рассматриваемого класса сетей. Если у нас п элементов, то мы можем собрать из них [п/2г ] - 1 экземп- ляр сети (2, г ), а из остальных элементов - что выйдет. Для получившейся сети имеет место оценка /Г п I \ / /Г п ] \\ g>2rl — - 1 |Л +(и- 2г( I— — 1 1)2?. \l 2r I / \ \l 2r I // Пусть для еще одной сети (О') справедливоg' >g. Тогда обозначим число компонент (2, г ) в ней через v и запишем очевидное неравенство: 2rvA + (п — 2rv)a >g. Из двух записанных неравенств число не вошедших в подсети (2, г ) эле- ментов сети (П') оцениваются так: п - 2rv< А-В А - а А-В А - а (4r-1). Стоящую справа величину можно принять за Af. Утверждение доказано. Замечание. Точно таким способом можно доказать, что сеть (2, г ) есть единственная существенная сеть в задаче о минимуме дисперсии в рас- сматриваемом классе сетей.
ГЛАВА HI ЗАВИСИМОСТЬ УРОВНЯ ВОЗБУЖДЕНИЯ ОТ ВОЗБУДИМОСТИ ЭЛЕМЕНТА В предыдущей главе функции F(H, О) рассматривались как функции ар- гумента П. В настоящей главе будет рассмотрена одна задача о зависимости от аргумента Н. Именно она аналогична задачам статистической физики, в которых что-либо исследуется в зависимости от потенциала парного взаи- модействия (гл. II, § 1, п. 3). Хотя в литературе рассмотрено и промоделировано множество конкрет- ных сетей, до сих пор строгая постановка и решение интересующих нас за- дач как математических известны в ничтожном числе случаев. Сложность этих задач порождена существованием рефрактерности у элемента и нетри- виальной структурой связей в сети. Ниже приведен краткий обзор случаев, в которых доказано увеличение среднего уровня возбуждения при увеличении возбудимости элементов. Здесь изложены результаты О.Н. Ставской [39] и Л.Г. Митюшина [30]. В оригинальной части (§5) используется построенная Митюшиным теория марковских цепей с частично упорядоченным пространством состояний. § 1. Постановка задачи Рассматриваются сети без тормозных связей: ask > 0 для всех s Ф к. Условия однородности, если и накладываются (как в гл. II, § 3, п. 5), то более слабые, чем локальная однородность. Общее определение ’’увеличение возбудимости элемента” дано в гл. VI. В рассматриваемых ниже конкретных моделях и без него ясен смысл этого термина. Для этих моделей, как было сказано выше, доказывается, что увеличение возбудимости элемента приводит к увеличению среднего уровня возбуждения сети. Однако это верно не всегда, так как имеется пример сети, в которой увеличение возбудимости элементов приводит к снижению уровня возбуждения. Этот пример приведен в последнем пункте главы. § 2. Сети из линейных элементов Систему уравнений (3) (гл. II, § 2, п. 1) запишем в форме Р, = 7-Ц- (Os + Zaskpk). (1) 1 - X, * Ее решение записывается рядом Pj = G+ S S 0j/,0/,/2 (2) 3. А.Н. Четаев 33
в котором G(1-X,) = 0„ Psk О — Xj) = ask. Сходимость ряда (2) следует из неравенства (2.6). Увеличение возбудимости элемента i в модели означает увеличение и X/ (гл. I, § 1). Так как веса связей в сети неотрицательны, все слагаемые рядов (2) - неубывающие функции X,-. А так как И(Я, П)= К( 0, X, П)- среднее арифметическое чисел ps (гл. II, § 2, п. 1,2), то справедливо Утверждение. Для среднего уровня возбуждения сети из линейных элементов в предположении об отсутствии тормозных связей имеют место неравенства ЭГ(0, X. П) 30/ >0. ЗГ(0,Х, П) ЭХ^ (3) В следующих пунктах доказываются аналогичные утверждения для сетей из иных элементов. § 3. Возбудимые среды. Теория Ставской О.Н. Ставская [39] нашла еще один класс элементов и сетей из них, для которых есть удобные формулы. Финальное распределение для этих се- тей имеет форму распределения Гиббса. Эти сети составляют ’’конечную модель статистической физики” (гл. II, § 2, п. 1). Из работы Ставской мы приведем только результат, непосредственно относящийся к нашей задаче. Итак, рассмотрим элементы с вероятностью возбуждения exp(0x + SaJk Kk(r)) к ---------------------. (4) 1 +exp(0j + SaJkr*(O) к Величины 0^, ask и а„ = X имеют тот же смысл, что и для линейных эле- ментов. Отсутствует условие положительности 05 и, разумеется, не нужны условия, аналогичные (1.2). Определение. Сети с симметричной Пи неотрицательными весами связей называются возбудимыми средами. Утверждение. Для среднего уровня возбуждения К(0, П), 0 = = (01,..., 0л) возбудимой среды из элементов (4) справедливо нера- венство $ дв5 Итак, для сред удается установить меньшее, чем для сетей из линейных элементов: доказана монотонная зависимость только при одновременном изменении параметров 05 у всех элементов сети. 34
§ 4. Элементы без рефрактерности. Теория Митюшина Л.Г. Митюшину [30] принадлежит теория марковских цепей с частично упорядоченным пространством состоянии. В частном случае использован- ные в ней соображения известны в классической теории неравенств [43]. Ниже теория Митюшина применяется к сетям из элементов без рефрак- терности (в этом параграфе) и к сетям из элементов-счетчиков (§ 5). Возбудимые элементы, для которых Рг{И,(Г+1)= 1} = Д(2 а,*Ик(0) (5) к и otss = 0, составляют частный случай элементов без рефрактерности. Мы им и ограничимся. Общее определение дано в гл. VI. Для элементов (5), очевидно, Ys = {0,1}. Определение. Пространство состояний сети упорядочивается так, что х > х означает: ys > у5 при всех 5. Относительно введенного порядка уровень возбуждения V(x) (гл. II, § 2, п. 2) будет монотонно возрастающей функцией состояниях Определение. Оператор (цепь, матрица) Q называется треуголь- ной, если** > х влечет Q(x | х' ) = 0. Иными словами, в треугольной цепи отличны от нуля лишь вероят- ности перехода в состояния, большие исходного относительного рассмат- риваемого порядка. Определение. Пусть /, g - вероятностные меры на X. Отношение / > g означает, что существует треугольный оператор Q, переводящий g Иными словами, если / > g, то f можно записать как Qg, где Q — тре- угольный оператор. Лемма 1. Если f > g,ro (И, /) е 2 К(х)Дх) > (К, g). Доказательство. В-силутреугольностиоператораQ (V,f-g)= 2, [V{x) - V(x')]Q(x\x,)g(X')> 0. X, X Лемма доказана. Определение. Пусть Q, Q' — марковские операторы. Отношение Q' > Q означает, что Q’ f > Qf для всякой вероятностной меры/. Определение. Оператор Q называется монотонным, если / > g влечет Qf > Qg. Лемма 2. Если Q' > Q и один из операторов монотонен, то [Q' ]m > > [Q]m при любом натуральном т. Доказательство. Пусть монотонен оператор Q. Проводим индук- цию по т. Пусть [Qf ]т > Qm. Тогда [2']w + 1 = Q' Q\Q']m>QQm = 2W + 1. Лемма доказана. Из лемм 1, 2 следует Лемма 3. В условиях леммы 2 (И, [G‘]m/)> (К Qmf) для всех вероятностных мер f. 3* 35
Теорема. Если в дополнение к условиям лемм 2, 3 марковские цепи (X, 0), (X, Q1) эргодичны и р, р - их финальные вероятности, то (И,р')> (Г,р). Доказательство. Теорема следует из леммы 3, так как (V, р), (У,р) суть пределы (К, [О'}m f), (У ,Qm f) при Теперь применим теорему к задаче о сети. Утверждение. Если 0 < fs (£) < 1, то марковская цепь, соответ- ствующая сети, эргодична и финальные вероятности существуют. Утверждение. Если функция fs(£) не убывают с ростом £, то эта марковская цепь монотонна. Утверждение. Если // ($) > fs (5), то для соответствующих мар- ковских операторов имеет место Qn > Qn- Первое из этих трех утверждений очевидно. Следующие два доказывают- ся одним приемом. Ниже доказывается последнее. Доказательство. По определению Q’ > Q означает существование семейства вспомогательных треугольных операторов Ри, удовлетворяющих соотношению e'(xfa)= S Ри(х I v)Q(y I и). (6) и Равенство (6) разлагает переход из состояния и в состояние х для второй цепи в переход из и в и для первой цепи и переход из и в х с вероятностью Рм(х | v ). Семейство Ри легко строится. Обозначим х = (П,..., У%), (И,..., УЦ), v = (Г^,..., У„). Переход из и в v задан вероятностями Pr № = 1} = fs (2 <4* *7) = Л (и) • (7) к Таким образом, V ” суть случайные величины, зависящие от и. Считая v заданным, далее положим Рг {и/ = 1} = V» + (1 - К” ) . (8) 1 -Л(“) Легко проверить, что (7), (8) вместе дают Рг{К* = 1} =Л», т.е. оператор, удовлетворяющий соотношению (6). Его треугольность сле- дует из (8), где с вероятностью единица К / не меньше, чем Vvs. Итак, три сформулированных выше утверждения можно считать дока- занными. Из них и теоремы следует Утверждение. Если fs, fs' удовлетворяют всем перечисленным выше условиям, то V ({f ’}, П) > V ([f5}, П). § 5. Сети из элементов-счетчиков Монотонную зависимость среднего уровня возбуждения от возбуди- мости элементов в случае элементов без рефрактерности удалось дока- зать благодаря монотонности операторов Q&. Эта монотонность устано- 36
влена относительно порядка в пространстве состояний сети, который вполне можно считать ’’естественным”. Аналогичный результат для сетей из элементов-счетчиков получается, так как нашелся ’’искусственный” порядок, относительно которого имеет место монотонность операторов. Итак, пусть Рг{И,(г)= 1} где М0 = С4(Г - 1) + X askVk(t-\). (9) к Величина Us называется потенциалом элемента. В силу (9) потенциал — это сумма входных сигналов (и величин а^ГДт)) по всему про- шлому. Это обусловливает название ’’элемент-счетчик”. Относительно весов связей приняты обычные у нас условия ass = X < 0; а5к >0, s ¥= к, и два новых. Пусть, во-первых, 2 «й = 0, к = 1,2,..., п. (10) Из этого условия следует S Us(t) = S ^(г-1), (11) * s т.е. сумма потенциалов остается неизменной во времени. Второе новое условие на веса связей состоит в их соизмеримости. Поэ- тому U 5 (/) может принимать значения только из семейства U5 = Уз + (12) где Uf = Уз (0), 0 ~ константа, v — произвольное неотрицательное целое число. Наложим одно условие наД. Пусть fs ($) = 0 при % < 0. Тогда множество состояний сети, выделенное условиями Us > X, s = 1,2,.... л, (13) - поглощающее. Будем рассматривать только его. Из (13) следует Us(t) <2 (/?-! af7 < -2иХ. (14) / i *з Из (12), (13), (14) мы получаем конечность множества состояний, дости- жимых с положительной вероятностью из начального состояния м° =(£/?, (Л.....Ut). Для рассматриваемых марковских цепей неизвестно, эргодичны ли они. Однако конечность пространства состояний влечет существование среднего уровня возбуждения как функции начального состояния. Именно, введем величину т И(м°, Г) = 2 М К (г). г=о 37
Здесь м° - начальное состояние, V(г) — уровень возбуждения (доля воз- бужденных элементов) в момент г. Очевидно, V(г) есть случайная вели- чина, зависящая от и 0. Буква М обозначает взятие математического ожи- дания. Далее определяем: П, м°) = lim T'V(u*t Г). Т -* оо Для описания состояния сети достаточно вектора и = (СЛ, С/2,..., Un). По нему находятся вероятности возбуждения элементов и значения по- тенциалов в следующий такт времени. Однако, пользуясь только потен- циалами, мы формально не удовлетворяем определению возбудимого эле- мента (гл. I, § 1). Сейчас мы сделаем необходимое дополнение и достигнем согласия с формальным определением возбудимого элемента. Именно, так как оно нигде нами в явном виде не используется, его можно сделать произволь- ным образом, например, считая (Us (г), Vs (t - 1)) состоянием элемента s в момент t. Забудем сказанное в предыдущем абзаце. Введем еще один вектор X = (е,, €2,..., €и). Его координаты - неотрицательные целые числа. Если величина Us имеет смысл потенциала элемента s в настоящий момент, то число истолко- вывается сложнее. Число е5 имеет смысл числа возбуждений элемента $ за время, протек- шее от некоторого фиксированного момента в прошлом и до момента, предшествующего настоящему. Таким образом, вероятность перехода из состояния (и9, х’) в состоя- ние (и, х) определяется в два шага. Если забыть об ’’иксах”, то она зависит только от и и и . Относительно ’’иксов” дополнительно нужно наложить условие: х отличается от х9 только на возбуждения, происшедшие во время этого перехода. Введем векторы = (а15» = (^15» и операторы As\ (и, х)»(и + as, х + ds). Проведем частичное упорядочение, положив As (и, х) > (и, х) и распространив далее порядок ”по транзитивности”. Утверждение. Если функции Л (О не убывают с ростом £, то оператор Q q — монотонный. Утверждение. Если fs9(i) > fs(£)> то Для соответствующих марковских операторов имеет место Q& > Qn- Эти утверждения доказываются методом, использованным в доказа- тельстве аналогичных утверждений в § 4. 38
Теперь мы имеем возможность применить лемму 3 из § 4. Рассмотрим функцию S(u, х) = S es. 3 Примем сокращенное обозначение V? = V (и, Т). Очевидно, (S. Qnf) = n(Kr,r) + С(Г). Следовательно, И ({/,}. Si, u) = lira (пТ)’1 (S, QTM, где 6и — мера, сосредоточенная в состоянии (и, х) (значение координа- ты х, очевидно, несущественно и не включено в обозначение). Из леммы 3 (§4) следует неравенство ($, QTnf)< (S, lG’n]rr). Оно влечет К({/,}, П, ц)< Г ({//}, И, и), чем доказана монотонная зависимость среднего уровня возбуждения от возбудимости элемента-счетчика. § 6. Обсуждение Пример. Рассмотрим сеть из двух элементов с правилом возбуждения Рг(М'+1)= О = ЛМО, М')). Здесь Г=2, 2=1. Пусть /(О, 0) = а, /(0, 1) = Л, /(1, 0) = д, /(1, 1) = В и выполнены очевидные по смыслу неравенства А > а > Ь, А > В > b. Чтобы избежать ненужных выкладок, будем считать, что А * 1, а, В, b * 0. Очевидно, сеть большую часть времени проводит в периодах (сериях) попеременного возбуждения элементов или в периодах невозбуж- дения. Обозначим состояние сети парой (И, К2) • Увеличим параметр Ь. Тогда увеличится вероятность переходов (1,0)-* -►(1, 1) и (0, 1) -* (1, 1). За состоянием (1, 1) почти наверняка следует (0, 0), и начинается новый период невозбуждения. Иными словами, период попеременного возбуждения переходит в период невозбуждения из-за однократного ’’лишнего” возбуждения одного элемента. Сле- довательно, средний уровень возбуждения снизится. Однако увеличение b есть увеличение возбудимости элемента. 39
Итак, возникают задачи: Задачи 1А и 1Б. Выделить классы сетей, для которых рост возбу- димости элемента приводит к росту (А) или убыванию (Б) среднего уровня возбуждения. Задача 2. Установить, играет ли какую-нибудь роль в нейрофизиоло- гии эффект снижения уровня возбуждения сети при росте возбудимости элементов или росте внешнего возбуждающего сигнала. Задача 3. Исследовать, в какой мере зависимость уровня активности сети от порога и силы связей между элементами определяется геометриче- скими свойствами матрицы связей. В частности, представляют интерес мат- рицы связей, близкие к диагональным (в этом случае существует такая нумерация элементов сети, при которой ненулевые элементы матрицы связей сосредоточены в основном вблизи главной диагонали). Подобные матрицы межнейронных соединений характерны, например, для связей между мшистыми волокнами и зернистыми клетками коры мозжечка. Их наличие, по-видимому, обусловлено трудностями, возникающими при реа- лизации, так сказать, случайных связей между большими ансамблями нейронов [15].
ГЛАВА IV АНСАМБЛЬ СЕТЕЙ И СЕТЬ-ГАЗ Большинство работ, посвященных марковским цепям, связанным с сетями, имеет дело не с индивидуальной сетью, но с ансамблем. Это моти- вируется двумя соображениями. Первое. По данным гистологии и физиологического эксперимента вос- станавливается некоторое количество усредненных характеристик органи- зации связей в сети. По ним, в свою очередь, нельзя восстановить всю сеть, а можно лишь определить некий класс сетей. Так что рассмотрение ансамбля вроде бы адекватно характеру экспериментальных данных. Второе. Рассмотрение ансамблей ’’освящено” традицией статистической физики и дает возможность применить уже испробованные приемы иссле- дования. Первый аргумент не вызывает никаких возражений, и мы примем рас- смотрение ансамблей как данное. В настоящей и следующих главах рассматривается ’’ходовой” в литера- туре прием исследования ансамблей, который может пониматься как приближенный (гл. IV) или асимптотический (гл. V) метод. § 1. Ансамбль сетей и его рандомизация ’’Ансамблевое направление” в теории сетей часто использует метод больцмановой теории газа. При этом ансамбль заменяется некоторой искусственной конструкцией, среди различных названий которой есть очень наглядное — ’’нейронный газ”. Это, так сказать, модель модели, или модель второго порядка по отношению к реальным сетям. Замена ансамбля сетью-газом мотивируется некоторой ’’гипотезой хаоса” [33], относительно которой мы ограничимся приведенной ссылкой. Эффективность замены в задаче о среднем уровне возбуждения рассмат- ривалась в 1962 г. Д. Смитом и С. Дэвидсоном. При помощи моделирова- ния на ЦВМ они показали существенное несовпадение значений, получаю- щихся для ансамбля и ’’газа” [38]. Они же дали интерпретацию несовпадения, согласно которой оно само по себе становится интересным объектом исследования. 1. Определения. Ансамбль (д) задается вероятностной мерой дна мно- жестве действительных квадратных матриц порядка п. Если F(H, П) - функция, определенная на множестве сетей из п элемен- тов, то с ансамблем (д) связывается среднее F(H, ц) = fF(Ht 41
С ансамблем можно связать марковскую цепь. Ее пространство состоя* ний есть произведение Л X X, где Л — множество матриц порядка и, а X - пространство состояний сети из п элементов Н (оно, как легко за- метить, зависит от п и Н, но не от Q). Переходы не меняют координаты ПЕЛ,а координата х ЕХ меняется так же, как в цепи (X, Q&). Построенная сеть неэргодична и средний уровень ее возбуждения можно понимать только как функцию начального состояния или как функционал от распределения начальных состояний. Роль этого распределения как раз и играет мера д. В форме такой цепи ансамбли сетей впервые появились в работе Н. Ви- нера и А. Розенблюта в 1948 г. [8]. Напомним: эта была первая работа, в которой с сетями связывались марковские цепи. Конструкция ’'нейронный газ” вводится с тем, чтобы получить более простую модель. Здесь мы имеем дело с оператором, ставящим в соответ- ствие ансамблю новый объект. Точные определения здесь принадлежат Л.И. Розо но эру [33], как и большинство других, относящихся к ансамблям. Определение. Пусть (Н, ц) — ансамбль. Его марковской модифи- кацией называется цепь (X, Q*), где Q*(xlx') = fQn(x\x')dfi. Продукт модификации - "газ” - можно интерпретировать как сеть, в которой связи каждый такт времени назначаются заново в соответствии с вероятностной мерой д. В сети-газе естественно определены уровень возбуждения и его среднее значение (если цепь (X, Q*) эргодична). Точно так очевидным образом определены для сети-газа характеристики активности (гл. II, §4, п. 1). Итак, характеристика активности F записывается как F(Ht О) для сети (Я, П), как /’(Я, д) для ансамбля (Я, д) и как F*(Ht д)для соответствую- щей ему сети-газа. 2. Понятие однородности ансамбля. По аналогии с группой автоморфиз- мов сети (гл. II, § 1, п. 1) определяется группа автоморфизмов ансамбля. Группа перестановок S„ описанным в гл. II, § 1, п. 1 образом действует на А. формулой яд(П)=д(яП) задается действие я на меры, определен- ные на А. Определение. Подгруппа = {it: 7гд = д)С8л называется группой автоморфизмов ансамбля (д). Определение (Розоноэр [33]). Ансамбль называется симметрич- ным, если совпадаете S„. Это определение не накладывает никаких ограничений на сети, состав- ляющие ансамбль. Действительно, возьмем любую матрицу П и рассмот- рим меру, сосредоточенную на U {яП}, относительно которой все элементы этого множества равновероятны. Очевидно, полученный ансамбль симметричен. Следующее определение вводит свойство ’’статистической однород- ности” сетей ансамбля. 42
Определение. Мера д имеет форму произведения, если д(Я) = П R(ask). з, к з*к Такие ансамбли как раз и рассматривал Н. Винер [8]. Если мера имеет вид произведения, то в соответствующей сети-газе связи можно считать назначаемыми независимо. Наконец, если продолжать действовать в духе понятий локальной одно- родности (глдоа U), то естественно рассматривать ансамбли (д), для кото- рых мера д сосредоточена на локально однородных сетях с данными зна- чениями от(П). В этом случае понятный смысл приобретает обозначе- ние аш(д). Из перечисленных выше условий однородности условие симметрии при- нимается для всех рассматриваемых ниже ансамблей. 3. Симметричная сеть-газ. Определение. Сеть-газ симметрична, если порождена симметричным ансамблем. Если нам нужно вычислить значение F*, то вместо сети-газа — цепи (X Q*) — можно использовать еще более простую конструкцию. Она есть фактор-цепь цепи (X, Q*). Определение. Цепь (X3 * * * * В 9, Р9) называется фактор-цепъю цепи (X Р), если существует отображение -у: Х-*Х' такое, что SP(x|x0) = ^'(* 1т*о), хЕ { х: ух=х’}. Рассмотрим цепь (X С*), соответствующую симметричному ан- самблю (д). Ограничимся рассмотрением элементов, у которых простран- ство состояний Y = {0, 1}. Обозначим через К(г) ненормированный уро- вень возбуждения, т.е. число элементов сети, возбужденных в момент t. В силу симметрии Рг {V(t + 1) = к} зависит только от V(t), но не от пол- ного описания состояния сети х(г) = (у 1 (г), У2(0, •.., ) • Поэтому отображение у: X -► {0, 1,... п} = 1п, действующее, как Т (Хь Уъ- •., Уп) 2 У(Уз)= у(х), 3 порождает на 1п фактор-цепь цепи (X Q*)- Далее из равенства 3 видно, что вычисление функций 2^(Я,д) (гл. II, § 4, п. 1) сводится к усреднению функций <рт по финальным вероятностям фактор-цепи. Проведенная редукция может давать существенные упрощения. Действи- тельно, у цепи (X С*) имеется |Х| = | Y\n состояний. В общем случае у фактор-цепи не более чем и,У| состояний. Так как в обычных моделях |У|<л, мы получаем л1 Y1 < | Y|л. В общем виде (и впервые) процедура факторизации цепи (X Q*) изло- жена Л.И. Розоноэром [33] и АТ. Ротенбергом [34]. Там она интерпрети- руется как описание цепи в терминах ”чисел заполнения”. 43
4. Характеристики активности ансамбля и сети-газа. В предыдущем пункте показано, что сеть-газ обычно есть объект более простой, чем одна сеть. Поэтому очень привлекательна мысль о том, что рандомизация, прев- ращающая ансамбль в сеть-газ, не слишком сильно изменяет характеристи- ки активности. Иными словами, очень привлекательна мысль о справедли- вости приближенного равенства F(Ht р) ~ F*(H, р) и вытекающей из него возможности использовать сеть-газ для вычисления (приближенного) величины F(H, р). Разумеется, нет никаких оснований ожидать справедливости точного ра- венства F= F*. По этому поводу может быть сформулирована следующая гипотеза. Гипотеза. Если для всех возбудимых элементов Г(Я, д) = Д), то д сосредоточена ровно на одной сети и сеть эта есть сеть ’’все на всех” по следующему определению. Определение. Сеть (П), О = || ask ||, называется сетью "все на всех" если <*Sk =(1 ~&sk)- const. Итак, если д сосредоточена на сети ’’все на всех”, то марковская цепь, соответствующая ансамблю (д) (гл. IV, § 1, п. 1), есть цепь (Я, П) и эта цепь совпадает с (X, С*). Хотя до сих пор замена F(H, р) на F*(Ht р) используется во многих ра- ботах без обоснования ее законности, еще в 1962 г. Д. Смит и С. Дэвидсон провели сопоставление величин V(Ht р) и V*(Ht р) и нашли в ряде слу- чаев их существенное несовпадение. В этой работе V* вычислялось анали- тически, а V находилось при помощи моделирования на ЦВМ [38]. Кроме этого отрицательного результата, авторы в своей работе обнару- жили некоторый новый факт. Именно, в исследованных ими случаях имело место неравенство V\Ht р) < V(Ht р). (1) В работах [1, 53] это же неравенство получено для еще нескольких моделей. Неравенство (1) мы будем называть неравенством Смита-Дэвидсона. 5. Резюме. Величины F*(H,p) можно использовать как приближения для величин F(Ht р) далеко не всегда. Величина К* (Я, д) для широкого круга сетей может использоваться в качестве оценки снизу величины К(д, Я). Это высказывание имеет смысл гипотезы, которая подтверждается в следующих параграфах и уточ- няется в конце главы. § 2. Сети из линейных элементов В настоящем параграфе рассматриваются ансамбли сетей из линейных элементов с мерой д, имеющей вид произведения (§ 1, п. 2). Кроме того, все веса связей неотрицательны. 44
1. Модель. Мы ограничимся простейшей из указанных выше мер. Соот- ветствующий результат для общего случая получается тем же способом. Когда ц имеет вид произведения, связи в сети можно считать назна- чаемыми независимо. Пусть каждая из них принимает значения 17 > 0 и О с вероятностями q и (1 — q) соответственно. Сейчас мы полагаем ам = 0. Для средних вероятностей возбуждения элементов сети (П) имеет место система (II.. 3), которую удобнее записать в форме В ней ttj* = 0, 17. Для средних вероятностей возбуждения элементов сети-газа имеют место такая же система, но в ней ask = QQ. s*k. Следовательно, вместо сети-газа мы можем рассматривать сеть ’’все на всех” (Яо), Г2о~ Наша конструкция задается параметрами п, X, 0, 1?, q. Легко заметить, что в аналогичной конструкции с параметрами и, 0, 0(1 - X)’1, э?(1 — X)”1, q величины р5 для сетей (О) и сети-газа будут теми же. Поэтому мы ограни- чимся случаем с X = 0. Итак, Рз = 9+ Zaskpk, (2) к где ask = 0, Xi для сети (П) и ask = qq для недиагональных элементов се- ти (По) (сети-газа). 2. Доказательство неравенства Смита — Дэвидсона. Утверждение. В рассматриваемой модели имеет место неравенство Смита-Дэвидсона (1). Доказательство. Решение системы (2) дается рядом оо р, = 0( 1+ S S 1 .....'р Следовательно, 0 K(S2) = — [ и + X S °VS • • П v-2 . iv В случае (По), соответствующей сети-газу, а>1 Ч • • • aiv- Vv У V ’ если ia Ф ia + 1, a = 1,2...., (v - 1). Теперь пронумеруем ряды (3) для всех (П) из ансамбля, взяв их с весами д(П) = /’(1-<7)("2 где a = и-1 • S ask. Сумма одночленов afi .. . a/p_ t будет равна 5. к qr(i'....I?"-1, 45
где Г(/......i„) - количество различных пар в наборе { (»ь 6). (6. 6), • • • .(4-ь «!>)}• Очевидно неравенство Г(п, /2....Zp)C(P-l). Оно влечет <, • • • <-1 iv < 2 16» ’ где индекс 0 указывает принадлежность сети (По). Утверждение доказано. § 3. Сети из элементов с одной связью В настоящем параграфе рассматриваются предельно простые сети. Таков единственный случай, в котором для нелинейных элементов доказано неравенство Смита-Дэвидсона. 1. Модель. Рассмотрим возбудимый элемент, заданный правилом воз- буждения Рг{кАг+ 1)= 1} = = + 1)] [1 - И,(0]. Рассмотрим семейство ансамблей (д„). Здесь индекс п означает число элементов в сетях ансамбля (д„). Мера сосредоточена на сетях, в которых каждый элемент испускает и принимает ровно по одной связи веса т?= 1 -0. Разумеется, все остальные связи имеют нулевые веса и связи ”на себя” в том числе. Все такие сети равновероятны. Очевидно, сети из введенных ансамблей распадаются на кольца цикли- чески связанных элементов - сети (г, 1) по определению из гл. II, § 4, п. 3. Вероятность возбуждения принимает три значения: Рг{И$(г) = 1} = 0, в, 1. 2. Набросок доказательства. Утверждение. Неравенство Смита— Дэвидсона имеет место для введения в п. 1 ансамблей (дл) при всех л, больших некоторого N. Идея доказательства. Неравенство получается как след- ствие несовпадения предельных значений К(рл) и И*(дл) при л “►«>. Эти значения можно найти. Для сети-газа можно ожидать асимптотической справедливости равенства м v(t + 1) = [о + (1 - W01 [1 - И(ОЬ Предполагая представительность среднего значения, заменим здесь МИ(г + 1) на И(г+ 1). Допустив справедливость этого соотношения и для финального состояния, получаем уравнение относительно К*(д): И* = (0 + (1 - 0)И*)(1 - И). 46
Отбросив отрицательный корень, получаем гипотетический ответ Примем его как верный. Обратимся теперь к ансамблю. Уровень возбуждения сети из ансамбля есть сумма Г(П) = и"1 Е г -р(г, П)иг, г= 2 где п - число элементов в сети, v(rt И) - число компонент (г, 1) в ней, vr — средний уровень возбуждения сети (г, 1), нормированный по числу элементов г, как и полагается. Легко заметить, что 1 1 1 < vr < - . (4) 2 г------------------------------------------------------------2 Действительно, если г четно, то в цепи, соответствующей сети (г, 1), име- ется поглощающее множество из двух состояний. В них возбужденные эле- менты чередуются через один с невозбужденными по длине кольца. В это множество цепь ’’скатывается” из остальных состояний с вероятностью единица. Итак, vr = 1/2 при четном г Если г нечетно, то поглощающее множество содержит 2г состояний. Каждое из них характеризуется строгим чередованием возбужденных и невозбужденных элементов, которое нарушается ровно один раз, когда рядом стоят два элемента в одном — возбужденном или невозбужденном — состоянии. Следовательно, и для нечетных г справедливы неравенства (4). При больших п в ’’типичной” сети ансамбля ”большинство” элементов входит в кольца ’’большой” длины. Это почти очевидно. А если так, то 1 lim Ид„) = ->---------= lim Г(д„), (5) м-*«> 2 l+v“ n-*°° что и составляет наше утверждение. План доказательства. В проведении доказательства по изло- женной идее имеется одно затруднение: мера цп не удобна в обращении из-за условия ам 0. Поэтому вводятся вспомогательные ансамбли, для которых доказательство проводится по приведенной схеме, а потом дока- зывается ”предельная эквивалентность” ансамблей. Вспомогательный ансамбль (рл) задается мерой рп, сосредоточенной на матрицах П таких, что ask = 0,17 и только раз ask =tj в каждой строке или столбце. Иными словами, в сетях вспомогательного ансамбля связи ”йа себя” ничем не отличаются от других. Для доказательства строчки (5) нам придется установить справедли- вость соотношений lim Г(р„) = 2-, (А) п 2 47
1йпГ(р„)= > (Б) lim К(р„) = Нт Идя). (В) Л-*оо П”“*,ов lim К*(р„) = lim И’(д„). (Г) и-*°® п -► <*» Чтобы не прерывать изложение доказательствами соотношении (А)-(Г), которые не добавляют ничего к существу дела, мы вынесли их в § 5, поме- щенный в конце главы. 3. Дополнения. Кажется вероятной справедливость неравенства Смита- Дэвидсона для введенной модели и при 1? < 1 - 6- Еще один пример неравенства мы получим, взяв тот же эле- мент, что и выше, а меру дл определив сосредоточенной на всех сетях (и, 1). При rj = 1 - 6 справедливы неравенства (5). Их дока- зательство несложно. § 4. Обсуждение Смит и Дэвидсон приводят в своей работе примеры, в которых разность (И- И*) имеет порядок И Подобные примеры есть в работе [53]. С дру- гой стороны, в [1, 38, 53] указаны случаи, когда (К - К*)< И. Итак, остается Задача. Выяснить условия, при которых К* есть хорошее приближе- ние для И Согласно Смиту и Дэвидсону интересна еще одна сторона сравнения ансамбля и сети-газа. Из их неравенства следует, что поведение сети вовсе не хаотично. Различные критерии (меры) нехаотичности приведены в гл. II, § 3, пп. 1-5. Разность (К- К*) дает ещё один критерий, отлича- ющийся от наших по своему ’Устройству”. В-третьих, есть основания предпологать, что неравенство Смита — Дэ- видсона имеет место для широкого класса элементов и ансамблей. Точная гипотеза звучит так: Гипотеза. Для всех ансамблей (д) с имеющей вид произведения и сосредоточенной на неотрицательных матрицах мерой д имеет место не- равенство Смита — Дэвидсона. Оно же имеет место, если симметричная мера д порождена как условная при помощи До, имеющей вид произве- дения и ограниченной на некоторое подмножество, содержащее все локаль- но однородные сети. Элементы сетей, разумеется, удовлетворяют акси- омам из главы VI. Замечание. Существует некоторая аналогия между неравенством Смита — Дэвидсона и неравенствами Гриффитса [35]. Скажем чуть под- робнее. Аналог неравенств Гриффитса справедлив для сетей из элементов без рефрактерности (см. гл. VI), из него следует неравенство, сходное с неравенством Смита — Дэвидсона [40]. При этом, как и в теории Митюшина, основную роль играют монотонные операторы. 48
§ 5. Доказательство утверждений (А) — (Г) Утверждение А. Справедливо равенство: lim Г(рл) = -. (6) П~~* ОО 2 Доказательство. Матрицы из ансамбля (р„) (т.е. матрицы Пта- кие, что р„(П) > 0) сопоставим взаимно однозначно элементам группы Sn. Именно, Й и я G S„ соответствуют друг другу, если = т? при всех s. Следовательно, число матриц в (рп) ровно л! штук. Обозначим через N(r, п) число элементов во всех и! сетях ансамбля (Рп), лежащих в компонентах (г, 1). Мы докажем оценку Мг,и)<Сг(и!), (7) и из нее (6) будет следовать непосредственно. Введем соотношения, определяющие N(r, п). Для этого построим про- цедуру, порождающую ансамбль (рл+1) из ансамбля (рл). Возьмем сеть (П) из (р„) в числе (л + 1) экземпляра. Возьмем экземпляр с номером $ и превратим (П) в (О') из (л+ 1) элемента. Процедура. В П и SI' совпадают все а# и а'ц при 2, ... ..., л, кроме ask = т/, которому в (О') соответствует asfc = 0. При этом а$(и+1) = а(и+1)£ “ V- Из определения процедуры сразу получаются соотношения N(r, л + 1) = (г - 1 )N(r - 1, л) + N(r, лХл + 1 — г), г > 1, М1,л + 1) = л!+лУ(1,л), М1,1)=1. Здесь ML и), очевидно, есть число изолированных элементов, т.е. таких элементов $, для которых ам = 17. Обозначив N(rt п)= т(г,п)(п - 1)!, имеем лт(г, л + 1) = (г - 1 )т(г - 1, л) + т(г, лХл + 1 - г), г > 1, т(1,Л + 1)= 1 +т(л), т(1,1)=1. Из последней строчки оценка (7) для Ml,п) очевидна. Ведем индукцию по г. Пусть Х(г, л + 1) = Сг-1 + Х(г, л), Х(г, г) = т(г, г). Так как Х(г, л) > т(г, л) и Х(г, л + 1) < Cr(n + 1), оценка (7) полностью доказана. Из нее и (4) следует (6). Утверждение А доказано. Утверждение Б. 4. А.Н. Четаев 49
Доказательство несложно и проводится рассуждениями, намеченными в п. 2, § 3. Утверждение В. lim И(д„)= Пт И(р„). (9) и-* ОО м~* оо Доказательство. Будет доказано соотношение О п — 2 V(pn) = an— + X ЬкпУ(цп_к), (10) 1 +0 *=о причем ап, Ьк„>0, ап+ ЪЬкп = \> (11) к и существуют с>0 и N такие, что всякое среднее при?и>#вхо дит в одну из сумм (10) с коэффициентом Ьк(т +ку>с. Из всего этого, (6) и очевидного неравенства И(Мт)< 1/2 сразу получается (9). Итак, докажем (10). По смыслу К(рл) есть вероятность в случайный момент, случайно выб- рав сеть из ансамбля (рл) и элемент из нее, найти его в возбужденном состоянии. Эту вероятность мы разложим в произведение трех условных и получим (10), (11) как следствия формулы полной вероятности. Первая вероятность. Вероятность случайно выбранному эле- менту быть или не быть изолированным элементом в сети. Первая возможность (быть изолированным) имеет вероятность и'1 для ан- самбля (рп). Случай изолированности сразу рассмотрим до конца. Изолированность влечет вероятность возбуждения, равную О /(1 +0). Это легко проверить. Итак, мы установили, что ап = п1. Вторая вероятность. Для неизолированного элемента опре- делена вероятность принадлежать сети с ровно к изолированными элемен- тами. Обозначим ее через скп. Третья вероятность. Вероятность возбуждения неизолирован- ного элемента сети с ровно к изолированными элементами. Очевидно, она равна К(дл_*). Положив п - 1 Ькп ~ скп’ П мы получаем доказательство соотношений (10), (11). Перейдем к доказательству существования с, Nc указанными выше свойствами. 50
По определению bkn есть вероятность случайно выбранному элементу быть неизолированным элементом сети с ровно к изолированными эле- ментами. Эта вероятность равна произведению вероятности dkn случайно выбранной сети иметь ровно к изолированных элементов и доли неизо- лированных элементов в ней: п - к Ькп = П Поэтому lim [bkn-dkn]=0, п-* 00 и нам достаточно доказать, что существует с > 0 и N такие, что для вся- кого m>N есть к, при котором dk(m+k) Используя вероятностную процедуру, порождающую ансамбль (рл + i) по ансамблю (рл), мы выпишем соотношения, определяющие dkn. С их помощью будет доказано существование искомых сии. Определение. Сеть с ровно к изолированными элементами мы назовем сетью сорта к независимо от общего их числа. При переходе от (рл) к (рл+1) сеть сорта k>Q с вероятностью (л + 1)'1 превращается в сеть сорта (fc + 1), с вероятностью Лг(л1 + 1)-1 — в сеть сорта (fc — 1) и сохраняет свой сорт с вероятностью (лГ1 • Если к = 0, то превращение возможно только в сеть сорта 1. Таким об- разом, мы получаем соотношения 1 &к(п+1) ~+ J) fcQfc _ 1 )и +(и — k)dkn + (к + 1)б/л+1 л], (12) 1 ^0(и + 1) ~“7Г + п ] » (13) (и + 1) и начальное условие dki = &kl- Рассмотрим систему чисел Okn = <wy'- Она удовлетворяет (12), (13) при к^п, a Dn(n + Xy <Dnn. Так как dki< <D*i, числа Dkn будут оценками сверху для dkn. Из сходимости оценочного ряда 1 Dkn ~ — е к к к\ по произвольному 5 > 0 находим К такое, что к S dkn>\ -Ь k-Q при всех л. 4* 51
Зададимся т и оценим величину min {^Om + • • • »^K(m+K)} Так как 1-5 max {dQnt, d । m,. .., d^m } > “ < Л +1 при некотором s,O<s<X, имеем dJW>(l -5)/(A + l). А так как v - s ^s(p+ 1 ) V + 1 получаем /m-s\s 1-5 /m -K\K 1-5 </,('"+,)>\m+s / K + 1 \zn+X / K + l ’ Поэтому / 1 \K 1-5 A>[------------------ =C6 X 2Л + 1 / X + l и можно положить C = C^,N-K + 1. Утверждение доказано. Замечание. Кажется правдоподобной справедливость равенств 1 lim dkn =---. n^oo e(fc!) Утверждение. lim K*(p„)= lim И*(р„). (14) Л~*°° Л~*°° Доказательство. Из рассуждений предыдущего доказательства следует, что для всякого 5 > 0 существует пара чисел К и N таких, что случайно выбранная сеть Пб(рп) при n>N с вероятностью не менее (1-5) будет иметь не больше К изолированных элементов. Обозначим через Ж(Л) множество сетей, в которых элементы из {1,2,..., п} = 1п не изолированы, а элементы из 1п\А изолированы Итак, Рл( и ®(Л))>1-5. А : \А |> л — к Определим процедуры Rs. Пусть Пб 91(Л) и sEA. Пусть элемент s входит в подсеть (г, 1). Если г =2, то оба элемента этой подсети становятся изолированными. Если г >2, то элемент s становится изолированным, а ”разорвавшееся” кольцо ’’сшивается” с сохранением старого циклического порядка. Та- ким образом, из Ш?(Л) можно получить по одному разу все сети мно- 52
жеств Ж(Л') с Л'СЛ\ {$}, ц'|= MI-2 и по HI — 1 разу — сети множества Ж(Л\ {$ }). Обозначим Жр = U Ж(Л). \А | = v К каждой сети (16®(Л)С Жр применим с вероятностью ИГ’каждую из процедур RS4s€A. Таким образом, мы получим сети множеств Жр_1 и Жу_2, причем в каждом из них кратность для всех сетей одна и та же. Такую редукцию обозначим через Lv. Возьмем Ж = и Жр. п-к Как было сказано выше, с точностью до 6 мера (рл) сосредоточена на Ж. Мера же (рл) сосредоточена на Жл = Ж(/л). Следующей нашей целью будет построение марковского отображения Жл на Ж, причем равновероятность сетей из Ж будет порождать ’’почти” равновероят- ность сетей из Ж. Для этого мы построим отображения Жр,р = п-^л, на Ж с этим же свойством. Возьмем Ж и к Жл применим редукцию Ln. Получим совокупность множеств Жл-1, Жл_2, • •» Жл_&, взятых с весами, сети же внутри множеств равновероятны. Применим далее последовательно Ln_x,Ln_2. ... ,Ln_k + \- После этого у нас получатся множества Жл_* и Жл_^_1 Если считать, что в Ж все веса были равновероятны, то вероятность по- пасть при этих редукциях в Жл_^_1 мала при больших и. Итак, постро- енное отображение есть отображение ’’почти только на Жл_к”, и входя- щие в него сети равновероятны. Рассмотрев обратную процедуру только на множестве Жл_*, мы получим то, что требовалось. Теперь переосмыслим Жл_^ как Ж(/л_*) (взятое Сл_* раз), т.е. мы получили отображение области определения (цп+к) на ’’почти всю” область определения рп. Это отображение выглядит так. Берется сеть из (дл_л), прибавляется К элементов, они понимают- ся как изолированные, т.е. получается сеть из Жл_^. Далее, переменив не более 2К связей, мы получаем с некоторыми вероятностями сети из (рл). Если исходные сети равновероятны, то полученное распределение близко к рл. Проведенного построения достаточно, чтобы завершить доказательст- во указанным в § 3 методом. Подробности несложны, и мы не будем их излагать.
ГЛАВА V СЛУЧАЙНЫЕ СЕТИ В литературе употребление термина ’’случайная сеть” означает рассмотре- ние какого-либо ансамбля сетей. Он означает, что предъявление сети из ансамбля связано с вероятностной процедурой. В работах по моделирова- нию сетей на ЦВМ эта процедура реализуется при помощи датчика псевдо- случайных чисел, и вероятность, с которой возникает та или иная сеть, принимается за определяющую ансамбль. Применение термина случайная сеть при рассмотрении ансамбля сетей, т.е. совмещение единственного и множественного числа, есть отраже- ние концепции об эквивалентности сетей ансамбля — о совпадении тех их свойств, которые интересны в приложениях. Например, ожидается, что К(П) « И(д) для большинства сетей из ансамбля. Эта обычная в физике точка зрения статистического описания впервые явно и детально была развита применительно к сетям Л.И. Розоноэром [33]. Им же были сформулированы и доказаны первые теоремы о предста- вительности. Они все относились к поведению сетей на конечных отрез- ках времени. В настоящей главе мы доказываем аналогичное утверждение для финального по. времени поведения. Полученный в главе результат показывает, что И*(Я, д)дает хорошее приближение К(Я, д), когда большинство сетей из ансамбля ведут себя как некоторая сеть ’’все на всех”. § 1. Постановка задачи Аналогом результатов Л.И. Розоноэра у нас будет равенство lim S[V(H, Я) - V(H, UnWdUn = 0. (1) оо В нем фигурирует семейство ансамблей (дл). Ниже мы обсудим принцип выбора семейства ансамблей и форму соотношения (1). 1. Предельный переход. Необходимо сразу напомнить, что 1°. Статистическое описание всегда обосновывается при помощи пре- дельного перехода. 2°. Предельный переход есть только средство для исследования конеч- ного объекта. 3°. При проведении предельного перехода должно быть указано свойство конечных систем, остающееся неизменным. По поводу этих трех пунктов следует сделать три замечания: 1°. Обоснование при помощи предельного перехода не есть необходимый атрибут статистического описания, а только единственная известная сейчас форма обоснования. 54
2°. Асимптотическое рассмотрение редко доходит до получения оценок относительно конечных (допредельных) объектов и поэтому имеет качест- венный или эвристический характер. 3°. Выбор свойств систем (ансамблей), неизменных при предельном переходе, определяет ценность рассмотрения с точки зрения соответствую- щей естественной науки (физики, физиологии). 2. Семейства ансамблей. В статистической физике в термодинамическом предельном переходе рассматриваются ансамбли, у которых остаются неиз- менными 1) потенциал парного взаимодействия, 2) макроскопические параметры (плотность, температура), 3) размерность пространства (решетки). Другой пример предельного рассмотрения мы возьмем из постановки задачи на экстремум в гл. II, § 4. Там неизменными были 1) возбудимый элемент, 2) величины от(дл), m = 1,2,... В этой задаче не рассматривалась какая-либо мера. Те же самые свойства сети оставались неизменными в семействе ансам- блей, рассматривавшихся в связи с неравенством Смита — Дэвидсона в гл. IV, § 3. Итак, рассмотрим предельный переход с сохранением указанных пара- метров сети. Согласно современным приемам статистической физики (см., например, [35]) исследование предельного перехода связано с рассмотрением некото- рого предельного объекта. В нашем случае это будет сеть из бесконечного числа тех же самых элементов. Опишем ее подробно. Пусть(а!,а2,... ,ар)~ набор ненулевых весов связей, испускаемых одним элементом сетей из допредельного ансамбля. Рассмотрим группу $(, заданную образующими а ।, д2»* • * » b i» ^2»• • • > и соотношениями atbi = e, i= 1,2,... ,р. Элементы группы й есть номера элементов предельной сети. Веса связей определяются так: ( 0, s^atkt / = 1,2,... ,р, 1 ait s ¥= afk. Пример. Если сети из ансамблей есть (к, 1), то предельной сетью будет ’’сеть из целочисленной прямой”, номера элементов — целыми числа- ми и О, s-k*l, ~SK | I 1?, s - ^ = 1. Такого рода бесконечными сетями занимались в группе И.И. Пятецкого- Шапиро [5]. Эти занятия показали, что исследования бесконечных сетей связано с такими трудностями, что использовать их для изучения конечных сетей пока не представляется возможным.
Л.И. Роэоноэр рассмотрел более простой предельный переход. В нем 1) неизменен возбудимый элемент, 2) для ансамбля (д„) средняя сумма весов связей, испускаемых одним элементом, не зависит от п. Именно, ансамбли (д„) задавались мерами, имеющими вид произведения, веса свя- зей принимали значения и"1 т? и 0 с вероятностями q и (1 — q) соответст- венно. Мы будем рассматривать такие же ансамбли. 3. Упрощенное описание. Предельный переход возникает как один из шагов в цепи попыток так изменить постановку задачи о сети, чтобы она стала достаточно простой. В изложении Л.И. Рйэоноэра эта цепочка после установления равенства (1) дополняется равенством lim K(M„)=lim У(цп). (2) п -*<*> п->°° Его нужно доказывать отдельно. В свою очередь, вычисление К*(д„) существенно упрощается при помо- щи факторизации, описанной в главе IV (§ 1, п. 3). В частном случае У = {0,1} фактор-цепь описывается вероятностью (для сети-газа) Рг {Г’(' + 1) = «1 K‘(z) = u} = F„(u |и). Здесь уровень возбуждения берется нормированным: п — число элементов. Отсюда для предельного значения К*(дл) возникает уравнение VZ = lim S uFn(u | К,* )du, И “♦ «> справедливость которого в ряде случаев устанавливается сравнительно просто. (Пример такого рассмотрения — в гл. IV, § 3.) Итак, два основных шага в построении упрощенного описания выража- ются соотношениями (1) и (2). Пример!. Как и в гл. 4, § 2, рассмотрим линейный возбудимый элемент с X = 0 и семейство мер = П Fn(ask), s* к где ЛЯ(О = (1 + - ri/n). Нетрудно проверить, что в этом случае (1) и (2) имееют место. П ри м е р 2. Возьмем семейство ансамблей из гл. IV, § 3. Выполнение соотношения (1) для них очевидно, а (2) не справедливо. Этот пример показывает, что в общем случае (2) не следует из (1), но он не имеет силы для того класса ансамблей, которым мы ограничились. Теорема, которую мы докажем в этой, главе, п о смыслу похожа на соединение (1) и (2) - lim f [Г(Я,П)-И*(Я,дл)]^дл = 0 и дает некоторое простое (приближенное) описание ’’типичной” сети из ансамбля при большом и. Однако форма, в которой высказывается наше утверждение, существенно иная. Рассматривается некоторое семейство метрик определенных на пространстве марковских операторов Qn, соответствующих сетям из п элементов Н. Через со обозначен еще один параметр метрики, с п никак не 56
связанный. Для всех со доказывается,.что lim fpUtn(Qa,Qa )dii„ = O, (3) и ->оо где (По) — сеть ” все на всех”, соответствующая ансамблю (дл): |т? (1 — &sk) • П Соотношения (1) и (2) выводятся из (3) сравнительно просто. § 2. Теорема о представительности В настоящем параграфе для одного семейства ансамблей доказывается соотношение (3). 1. Модель. Рассмотрим возбудимый элемент, заданный правилом воз- буждения Рг {К/Г) = 1} = + TjsgfmXO — Л)] [1 - КХг - 1)], где 0,т?>О, 0+т?<1 и Рассмотрим меры Дп(П) = П я„(а,*) j # к С ^n(O = (l-<7)5(O + ^5a-l/w). Индекс п указывает на число элементов в сети. На параметры 0, т?, h, q накладывается ограничение (<?-А)(0+г?)<А, (4А) либо ограничение (<7-Л)0>Л. (4Б) Их смысл сводится к следующему. Нетрудно доказать, что для сети (По) в пределе при п -+ °° справедливо уравнение V(t + 1) = [0 + nsg(g Ф) - А)] [ 1 - И(г)] и каждое из условий (4А), (4Б) гарантирует единственность стационарного решения И(г) = Ко, которое в этом случае равно предельному среднему уровню возбуждения: Го = lim К(П0). оо Замечание. При (не рассматриваемых нами) значениях параметров 0 = 0,1? = 1 введенный элемент есть детерминированный пороговый элемент с порогом h. 57
2. Метрика. Вводимые ниже определения годятся для всех возбудимых элементов с У= {0,1}. Возьмем сеть (П)и соответствующую ей марковскую цепь (X, Qn). Состояние сети (цепи) х можно описывать указанием множества у={*: yt= 1}, чем мы и будем пользоваться. Обозначим множество {1, 2,..., п} через /л. По ядру и w С 1п строится целочисленная случайная величина, принимающая значение к с вероятностью Ra, w(k) = Е GnC'l*')- I V | = к Иными словами, есть вероятность возбуждения ровно к элементов сети (П) в момент, следующий за возбуждением всех элементов w и только их. Определение. Пусть ф и ф' - две вероятностные меры на мно- жестве неотрицательных целых чисел. Рассмотрим бесконечные стохасти- ческие матрицы llfl/y II,преобразующие ф в ф': Шириной d И ati II матрицы II ац II назовем число sup l'-/|sg(a/z). Определим метрику A(i/S ’/'*) = mind lla/z- II. Замечание. Так как мы рассматриваем только ф, сосредоченные в конечной части {0,1,2,...}, определение вполне корректно. Покажем, что ф') — действительно метрика. Вместо матриц II ац II рассмотрим распределение вероятностей на неотри- цательном квадранте двумерной целочисленной решетки. Пусть d/Z — веро- ятность узла (/, /). Если распределение b таково, что ЪЪ^ФЦ), ЪЬ^ф'Ц), i i то числа bjf имеют смысл ац ф(/). Определим d(Z>)= sup |Z-/|sg(Z>/Z). ij Далее A(i//, ф’) определяется (как и раньше) взятием минимума по всем b с указанными свойствами. Из симметрии по отношению к фи ф' новой фор- мы определения очевидно выполнение аксиом метрики. Смысл определения состоит в следующем. Будем понимать фиф1 как распределение масс, || a/z || — как запись процедуры перемещения масс, превращающей одно распределение в другое. Тогда d|| a/z || указывает максимальную длину, на которую может быть перенесена определенная часть вещества в этой процедуре. 58
3. Формулировка теоремы. Введем семейство метрик, участвующих в теореме. Рассмотрим все сети ансамбля (д л). Пусть во всех них в данный момент возбуждено множество w С 1п элементов. Очевидно <7l vv | S( S ask)n(tl)=--------. п п Сейчас мы надолго исключим из рассмотрения те w, для которых выпи- санное среднее близко к h. Пусть е >0; на [0,1] выделим множество ие ={$: 1^-Л|>е}. Определение. Pe(Gn.en )= max л_1Д(Яп,».Яя’, w)- I w| w:----eae n Теорема 1. Для ансамбля, определенного в п. 1, Um /pe(en.Gno)^=0 (5) п °° при всех е > 0. В следующих двух пунктах проводится доказательство теоремы 1. Оно состоит из редукций и оценок. Редукции касаются формы левой части равенства (5) и подготавливают проведение оценок, которые и дают собст- венно доказательство. 4. Редукции. Первая редукция. Нам нужно доказать равенство (5). Сейчас мы заменим семейство ре семейством рсб с 5 > 0. Обозначим = 6 <£< 1 -5} и определим I w | рсб = max/Г1 Д(ЯПи,,ЯПн,), такчто w: -----^U€b. п Вместо (5) рассмотрим равенство lim /Рс6(бя> <?п0)^Ди =0. (6) л -♦ °° Из справедливости (6) при всех е, 6 следует (5) при всех е. Доказав это утверждение, мы исключим из рассмотрения те множества w, которые состоят из слишком большого или из слишком малого числа элементов. Уточним обозначение. Ниже через ms(w) или ms будет обозначаться Е ask = ZaikV(yk), kGw к где х = (уь у2, ..., уп) — ’’старое” обозначение состояния сети, соответ- ствующее теперешнему w. Доказываем справедливость редукции (5) - (6). Пусть I w | < дп. Тогда maxт5 <Ь, 5 59
Если же 5 < Л, то ms < h при всех s. Следовательно R^w и R& о w сов- падают. Пусть | w | > п - к. Тогда R& w и 0 wсосредоточены на (0, 1,.. ., к} И w> 0 w) < Следовательно, если 5 < h и Реб(Сп> С?П0)< то Ре(Сп» (?о0) < в- По определению Д( .,.) < п, т.е. р < 1. Отсюда следует неравенство (с по- нятным упрощением обозначений) fpe <5(1 — Jpe*] +JPe6- Оно доказывает первую редукцию. Вторая редукция. Зафиксируем е, 5 и будем доказывать (6) при этих значениях параметров. Введем множества ^пс = Реб((?Г2> Сп 0 ) < с) • В обозначении Апс параметры е, 5 не упоминаются, так как они зафикси- рованы. Очевидно, (6) эквивалентно справедливости равенств lim рп(Апс)=1 (7) и-* °° при всех с > 0. После этой редукции можно изложить План доказательства теоремы. Чтобы проверить факт принадлежности сети (П) множеству Апс, нужно для всех w таких, что I w \/п G 1/е6, убедиться в справедливости неравенства Д(ЯПи,,ЯПоЧ,)<™. (8) Обозначим W={w: |и>|/и££/е6}. Очевидно I W | <2N4 и 1—ДиС4пс)< U- w) < СИ })] < wG W <2п max [1-Дл({П: Д(ЯП„,ЯПон.)<еи})]. wG W Если же получить оценку 1 -дл({П: Д(ЯШу,/?qoVJ<си}) <(const)"’ с const <1, то (7) будет доказано. Этот план реализуется ниже, но рассматриваются меры других мно- жеств. Третья редукция. Возьмем П = II ask || из ансамбля и некото- рое w G 1п. Рассмотрим множество ( , / I w J \] sign (лиs - h) = sign [q-h Ik I \ и /J Оно состоит из тех элементов $ сети О, которые не входят вши для кото- рых разность (т5 — h) имеет тот же знак, что и в сети По. 60
Лемма. Если t I ^*£2 w I . 1-----------< Cf П - | W | то справедливо неравенство (8). Доказательство. Так как утверждение леммы почти что очевид- но, ее доказательство не полностью формализовано. По условию леммы элементы из в случае сети (П) ив случае сети (О0) возбуждаются с одними и теми же вероятностями. Следовательно, чтобы ’’исправить” w Д° *£20 w, нужно учесть несовпадения в возбуждении элементов из In\ (wUEn w). Их число не превосходит (1 - Ь)пс, что меньше ле. Итак, при одинаковых исходах возбуждения элементов из Eqw возбуждения остальных элементов дадут поправку, меньшую сп. Лемма доказана. В силу леммы Г / I ^£2 w I \ ] А'пс = Ш: дл(П)>0, max I 1---------—-|<НСЛлс, ( wew \ п-1wI/ J и поэтому lim рп (А'пс) = 1 (9) п 00 влечет (7). Четвертая редукция. Введем множества = s^Eaw, | ms - h | > v}. Очевидно Fsiwv С£Пи, при всех v>0. Относительно v нужно наложить одно условие. Так как , I W I fmsdiin = q---- п и inf | q$ - h | = eq, для больших п неравенство | ms - h | > eq выполняется для ’’большинства” сетей из ансамбля. Поэтому входящее в определение условие | ms - h | > v будет достаточно слабым, если v < eq. Рассмотрим множества ( / I ^£2 м>р I \ 1 BncP = Я: Дя(Я)>0, max I 1---------—— )<с . ( wG И' \ П - I W I / J Из Впс1> САпс следует: справедливость lim ДЛ(ВЛСР)=1 (Ю) п -*• 00 при каком-либо v влечет (9). 61
Bw ~ I • Мл (^) > 0, В конце концов мы положим v = е^/2. Поэтому индекс v часто будет опускаться. Например, вместо Bncv мы будем писать Впс. Пятая редукция. Введем множества I ^*£2 w v I 1----------------------------<С п - | W | Здесь в дополнение к е, 5 опущены индексы л, с, v. Очевидно Впс = • w G W Так как 1-Дл(*лс)< 2 (1-Дл(Вн,)), н« е. w из lim S (1-Ми(^)) = 0 (11) и -* оо и» е w следует (10). Шестая редукция. Так как S (1-M„(5W))<2" тах(1-д„(Вш)), w е w w g w из lim 2" max (1 - д„ (Bw)) = 0 (12) п -» <*> w G W следует (И). Седьмая редукция. По определению д ) есть вероятность случайно (т.е. в соответствии мере д„), выбирая сеть из ансамбля, выбрать ее удовлетворяющей условию ( / / I w | \ | $g(ms - Л) = sg I q--h I, |т,-Л|>р> > I X n / J >(1-c)(h-|w|). (13) Определим новую вероятность используя вместо (13) новые чуть более жесткие условия: / . I w | s: s$w, ms<q------+ р п >(1 -с)(п - | w |) (13А) при I W I q------<h п A I I I s: s w, т5 > q-------------v । > (1 - с) (и - | w |) (13Б) при I W I q------->h. п 62
Легко убедиться в том, что при v = eq/2 выполнено неравенство 0W < < (Bw) (ср. четвертую редукцию). Следовательно, 1 -p„(Bw)<l-&w. Поэтому lim 2" max (1-0W) = O (14) п -* °° w е w влечет (12). Далее мы рассматриваем только случаи (13Б). Другой во всем подо- бен ему. Восьмая редукция. По определению есть вероятность, слу- чайно выбирая сеть из ансамбля, выбрать ее удовлетворяющей усло- вию (13Б). Случайный выбор сети из ансамбля есть не что иное, как результат не- зависимого случайного назначения весов связей (гл. IV, § 1, гл. V, § 2). Так как условие (13Б) касается только весов при s w и к G ш,мы можем назначать только их. Далее, с этой точки зрения т5 суть независимые случайные величины. Принимая выполнение неравенства I w | т5 > q------v п за успех, мы получаем (п - | w|) испытаний Бернулли с вероятностью ус- пеха в одном испытании ( I w | ] Рг\ms>q---------= MW. I п J После этого 0W записывается так: = Рг{$„_ । w |(MU.)>(1 -c)(n - | w I)}, где SN(p) — обычное обозначение [41] числа успехов в N испытанных Бернулли при вероятности единичного успеха р. Так как 1 -0W = Рг (5„_ |W|(MW)<(1 -с)(п - | W |)}, (15) равенство (14) приобретает вид lim 2” max Рг {S„_ । w\(MW) <(1 - с) (п - | w |)) = 0. (16) и оо w G W По аналогичным соображениям мы получаем выражение Mw = Pr {S|W ,(<?)> (17) Теперь все подготовлено для проведения несложной оценки, являю- щейся одним из вариантов известного экспоненциального неравенства С.Н. Бернштейна [4]. 5. Оценки. Лемма. Если L/N < X < р, то Pr {SN(p)<L}<[d(\,p)]N (18) при №*> N0(k,p), причем 0<d(X, р)<1. 63
Доказательство леммы. Для оценки вероятности Pr{SN(p)<L}= Z Ckpk(l-p)N-k к = 0 оценим сначала слагаемые правой части: ЛИ СД<?к(1 -q)N~k = ------qk{\ -q)N~k ~ N (N-k)\k\ Nn 24 г, . . . лг ъ. / N (N-k)k2ir (N-k)(N-k}kk N -\N~k Г Nq 1 * N-к J I к J N где a = k/N. Осталось доказать неравенство /1 и \ а \ Q а остальное будет совсем просто. Рассмотрим обратную величину и найдем ее стационарные точки, считая а аргументом, ар- параметром. Диффе- ренцируем: d / 1 \ 1 , /а(1-р)\ -- /-------j = -------1П f--------1 da \ p) ) <p(a, p) \ p(l - a) / Отсюда находится единственная стационарная точка a = р. В ней = 1. При р = 1/2 имеем In = - In 2 - [(1 - a)ln(l - a) + a In a], и из известных свойств энтропии [57] видим, что стационарная точка - максимум, т.е. <p(a, р) < <р(р, р) = 1. Теперь из <р(а, р) < <р(Х, р) получаем оценку Pr {Sn(p)CL} <(£ + 1) [<Р(К P)]N В ней знак ~~ ’’наследуется” от использования формулы Стирлинга. Поло- жив ее t/(X,P)=[^(X,p)]1“e, мы завершим доказательство леммы. Следствие. Из доказательства леммы следует оценка Pr {SN(p) <L} < ф(7Л1 - P)(,-7)(1 -e)N, в которой у = L/N и *(7) = 1(1 - У)у~ '° > 1- (19) 64
Доказательство следствия. Таккакр<1, 1 -Р Р \“ —-] (—) <(1-р)1“Л[(1-а)а"1«-Л], 1 - а/ \ а/ что остается подставить в оценку леммы. Теперь мы последовательно применим оценки (18), (19) к Afw, 0W. Из (17) следует 1 -Mw = Pr {Siwi(q)<q |w|-p„), и (18) дает / Vn \|w| 1 —Mw<d q- — ,<?) . (20) k I wl / Из (15), (19) получаем 1 -PW<M1 -c)"-|w|(l - Mw)c(l-<K"-rw|). Используя (20), продолжаем: (у . c( 1-е)(л-|w|)|w| <7-—Y<7) I w| / Из условия I w \/n G С/еб следует n - | w | > 5и, | w | > 5л. Обозначим с(1 - е)52л2 =л(е, с, 5)л2 > 0. Наконец, получаем (у \а(с, €,6)и2 Q-— <?) (21) с / V \ [q \ d\q----, q I = , <7 ) < 1. \ e / \ 2 / Доказательство теоремы. В силу (21) и из очевидного г а(С, €, 6)иа X 2яф(1 -с)п<И — , (?) )=0 \ 2 / / следует (14). б. Полный вариант теоремы. Метрики р были построены на сравнении будущего состояния цепей (X Он ) и (X Qn *) при данном настоящем состоянии vv0. Плохо то, что эти будущие состояния w и w' сравнивались не сами, но опосредованно - через сравнение количества элементов в них- через | w | и I w' |. Сейчас мы избавимся от этого недостатка. Изменим определение метрики из пп. 2-4. Определение. Введем метрику в пространство вероятностных мер на X. Пусть ф, - две из них. Рассмотрим стохастическое ядро A (w|w'), 5. А.Н. Четаев 65
удовлетворяющее условию ^'(w) = Z A(w I w')i//(w'). (22) w' Его шириной назовем число d(A) = max I (w\w') U (и/\ w)| sg(>4 (w | w')). W, IV* Определим метрику AiCtfS ^’)s mind(y4), где минимум берется по всем А, удовлетворяющим (22). Очевидно А(*я w, W < А1 (2я ( ‘ I *0, Gn (• I w)), Далее р€ и ре6 и Апс определяются по старым формулам (§ 2, п. 4) с за- меной Дна Др С этими новыми определениями теорема о представительности сохра- няет старую формулировку и доказательство. Иными словами, верна Теорема 2. Для ансамбля, введенного в п. 1, и метрики, введенной в пп, 6, 3, lim /ре(0я.ея)<*Дп=О (23) и-* 00 при всех е > 0. § 3. Доказательство неравенства Смита — Дэвидсона Доказательство этих утверждений несложно и будет проведено с мень- шей подробностью. Для проведения этих доказательств нам не хватает сведений о распре- делениях ( • I w) при | w |, близких к hn/q. 1. Поведение на исключительном подмножестве. Зафиксируем е > 0. Пусть \q | w | - hn | <eqn. Рассмотрим w' и w" такие, что w С w С w An - eqn 1 f hn + eqn 1 --------- , I w | = ----------- + 1. Q J L q J Таким образом, множество w заключено между ’’границами” w' и vvw, которые сами уже считаются входящими в область действия теоремы о представительности. Мы покажем, что состояние цепи в следующий такт времени в определенном смысле тоже заключено в некоторых границах. Элементы множества In\ w" = Ж в следующий такт времени возбуж- даются с вероятностями соответствующими настоящим со- состояниям м/, w, w". Так как ф’5 < ф5 < , то для трех процессов возбуж- дения можно принять процедуру, которая была использована в гл. Ill, § 4. Пишем рг {r;=o} =(i - vs)+ , рг {r;= n = vs + (i - vsy . i i - 66 и |w'| =
Теперь всякому исходу возбуждения при начальном состоянии w соот- ветствуют исходы возбуждения при начальных состояниях и/ и w" такие, что на 9( сохраняется порядок по включению (§ 1, п. 6). Ограничение рассмотрения на множество Ж означает пренебрежение 2eqn элементами. Из всего сказанного непосредственно следует Лемма. Справедливо равенство: lim /Se2n(H»v)dju„ = 1, И ”♦ 00 и где е при знаке суммы означает, что суммирование распространено на все v, удовлетворяющие условию h | и | h — 6-е <--------<— [0 +1?] + е. Q п q Легко заметить, что при достаточно малом е обе крайние величины лежат по одну сторону от hjq, именно с той стороны, что и Ко (§ 2, п. 1), и в области U€ (§2, п. 3). Это означает, что ’’типичная” сеть ансамбля при ’’большом” п задерживается в окрестности | w | = hnfq, ’’как прави- ло”, не более, чем на один такт. 2. Доказательство. Соображения, используемые в доказательстве соот- ношений (1), (2), одни и те же. Мы приведем доказательство первого. Соотношение (1) - lim / [ V(H, SI) - V(H, M„)]2dp„ = 0 (1) n -* 00 — есть следствие двух других: lim J [ V(H, SI) - V(H, fio )]2dnn = 0 (24) n -* 00 И lim V(H,pn)= lim V(H, Do), n-* 00 n-* 00 Опять-таки ограничимся первым из них. Марковская цепь, соответствующая сети (Я, По), имеет своим прост- ранством состояний произведение п двуточий. Но в задаче об уровне воз- буждения мы можем вместо цепи (X, Qn о) рассматривать ее фактор-цепь (гл. IV, § 1, п. 3) с пространством состояний (0, 1/л, 2/л, ...»1} и пере- ходными вероятностями Рг {Г(г + 1) = а| И(0 = Ь}. В пределе при п -► °° получается уравнение V(t + 1)= [0 + т? sg(K(r)<7 - h)] [1- Г(г)]. В силу условий (4А), (4Б) (гл.У, § 2, п. 1) это уравнение имеет единст- венное стационарное решение V(t) = Ко. Рассмотрим отображение отрезка [0,1] [0 + п - h)] [1 - $]. 67 5*
Легко проверить, что для всякого е > 0 существует такое N, что /[0,1] с (5: Ц- К,|<е) для всех k>N. Используя это свойство отображения устанавливаем lim У(Н, П0)=И0. п -» 00 Для того чтобы завершить доказательство, достаточно воспользоваться теоремой о представительности, леммой из п. 1 и техникой сравнения мар* ковских операторов, изложенной в § 4 или (несколько иным образом) В [51]. § 4. Сравнение марковских операторов Рассмотрим стохастические матрицы данного порядка, соответствующие эргодическим марковским цепям. Все такие матрицы А имеют в качест- ве образа оператора (Е - А) одно и то же подпространство S. Оно состо- ит из векторов, ортогональных (относительно очевидного скалярного произведения) к вектору, все координаты которого единицы. На S опре- делены все операторы (Е - Л)"1. Каждой рассматриваемой матрице А соответствует проектор (не ор- тогональный) РА = lim Ап. п -♦ 00 Справедливы соотношения РАА=АРа= Ра, (Е - А)~* (Е - А) = Е—Рл, (25) РЛВ = РАРВ = РА, (Е-Ра)РВ = Рв~Ра- (26) Из (25), (26) следует (Е - Ау'(Е-А)Рв=Рв - РЛ9 (Е-Ау'(В - А)РВ=РВ - РА. (27) С цепью у нас связываются средние по финальным вероятностям, т.е. величины вида FA =(f,PA), где РА — вектор финальных вероятностей. Из (27) получается равенство FB - Fa ~ (wa>(B - А)РВ), (28) в котором wA es определяется из условия: для всех# G S. Когда сравнивается пара операторов А и Е, их отношение задается следу- ющим образом. Рассматривается линейное отображение пространства мат- риц в себя, переводящее стохастические матрицы в стохастические. При помощи такого отображения Г записывается: В = ГЛ. После этого (28) приобретает вид Fb-Ja = №аЛ(У-Е)А]Рв). Здесь Е — тождественное отображение матриц. Вывод о величине разности (FB -FA) делается по данным о wA, (Г - Е )и Арв. 68
Примером отображения Г может служить формула (22), в которой фи ф надо понимать как Qn( • I w) и (• I w) соответственно. § 5. Обсуждение Вернемся к теоремам 1.2. Не представляет труда убедиться в справедли- вости аналогичных теорем для элементов с правилом возбуждения Рг{КХг)=1}=<р(т,(г))[1-Г,(г-1)], где — ступенчатая функция. Соответствующим ей образом придется ис- ключить окрестности точек разрыва. Кроме того, разумеётоя, сохранится условие единственности решения уравнения £ = (1-П^«). (29) Если рассмотреть элементы с правилом возбуждения Рг {ИХО= 1} =(1 - и,(г - 1))(1 - Mr - 2)Мт,(0) и ступенчатой функцией <р, то с небольшим трудом можно убедиться в спра- ведливости теорем и для них. Единственное усложнение связано с двумер- ностью предельной системы К(0 = (1 - V(t - 1) - V(t - 2)) *(V(t - 1)), усложнением обозначений и условий. Если же в (29) функция у монотонна, но не ступенчата, то можно попы- таться приблизить ее ступенчатыми и использовать полученный для них ре- зультат. При рассмотрении такого подхода виден недостаток рассмотрен- ных метрик ре - они определены как равномерные при искусственном ог- раничении на w. Поэтому они годятся только для ступенчатых, а для обще- го случая нужно ввести метрики, построенные на вычислении каких-либо средних. Касаться этого мы здесь не можем. Пока рассматриваются ансамбли, заданные мерой, имеющей вид произ- ведения, переход от случая, рассмотренного выше (гл. V, § 2, ft. 1), к бо- лее общему, не принесет ничего нового. Это очевидно. Рассмотрение мер, сосредоточенных на локально однородных сетях, представляет существенно больший интерес. Но этот случай сложнее, так как не переносятся соображения, использованные в последних редукциях до- казательства теоремы 1. Гипотеза; Аналог теоремы 2 справедлив для всех ансамблей с мера- ми, имеющими вид произведения, и элементами, удовлетворяющими ак- сиомам из гл. VI. § 6. Резюме С точки зрения сетевого подхода (введение, гл. П) утверждение сформу- лированной гипотезы и теорем 1, 2 может быть расценено только как ре- зультат ’’отрицательный”: предельный переход рассмотренного типа пол- ностью тривиализует сети и уничтожает ту структурность, которая составля- ет предмет теории сетей. Поэтому использование результатов асимптотичес- кого исследования в теории сетей должно в каждой конкретной модели пре- дваряться специальным обсуждением, имеющим цель выяснить, допускает ли моделируемая реальная сеть представление о ней как о сети ’’все на всех”. 69
ГЛАВА VI АКСИОМАТИКА ВОЗБУДИМОГО ЭЛЕМЕНТА Аксиоматика необходима в двух отношениях. Во-первых, она показывает простейшие составляющие чрезвычайно слож- ной реальной картины, которую едва ли можно удержать в уме в виде мо- дели, претендующей на абсолютно подробное изображение нейрона. Ана- логичные в некоторой степени системы "элементарных” представлений вы- работаны эпектрофизиологами и биохимиками, но их системы дают анализ реальности с другой точки зрения. Во-вторых, аксиоматика является необходимой предпосылкой развития действительно широкой и глубокой математической теории, без которой одно цифровое моделирование на ЭВМ едва ли может принести существен- ные результаты. Если иметь в виду эти весьма далекие цели, то приводимую ниже аксио- матику можно оценить только как набросок, эскиз. Напомним: в книге аксиоматика используется только как список усло- вий, при выполнении которых ожидается справедливость гипотез, сформу- лированных в тексте глав. 1. Достаточность внешнего описания. В этом пункте аксиоматизируется следующее соображение: текущая импульсация нейрона полностью опреде- ляется его прошлой активностью и приходившим к нему до настоящего времени (включительно) сигналом. Иными словами, нейрон не имеет "свободной воли" по отношению к своей импульсации. Эта основная мысль будет формализована в несколько шагов. Возбудимый элемент понимается как функционирующий "от минус бесконечности". Поэтому существенны только те его состояния, которые могут возникнуть в результате бесконечной предыстории. Приводимые ниже определения и аксиомы являются дополнениями к определениям гл. I. § 1. Определение. Пара последовательностей { от,}, от, € R; { у,- }, у,- € Y, называется предысторией состояния у =у0, если sup Iot.-K», i для всех i = 0, 1, 2 ... Ограничение I mf I G Y соответствует функционированию в составе од- ной системы. Аксиома I. Для всякого;’ G Y существует предыстория. Определение. Пара последовательностей (т, }> от, GR; { е,}, е,е{0.1}, 70
называется внешней предысторией состояния.)’, если существует его же пре- дыстория } ,{yt} такая, что е/ = K0’z) при всех i = 0, 1, 2 ... Аксиома II. Если у двух состояний совпадают внешние предыстории, то они сами совпадают. Следствие. Для любых г' тп и е существует не более одного у такого, что Р 0’ । у\ m) > 0 и К 00 = е. Теперь мы дадим определение возбудимого элемента в форме, отличаю- щейся от использовавшейся раньше. Определение. Возбудимым элементом называется пятерка (У, 7о 0*0,71 ^)» в которой У - множество; у€(т) - отображе- ние У в У, зависящее от действительного параметра m ; f (у, m) - действи- тельная функция, удовлетворяющая неравенствам 0</(v,m) <1 • - отображение К: У -* {0, 1} , и выполнено соотношение К(уеу) = е. С прежним определением новое согласуется так: Р(У1 yjn) = f(yt m). Р(Уоу\у, = 1 — f(y, m). Формализуем еще одно требование к элементу: два состояния, внешние предыстории которых отличаются только в очень далеком прошлом, сами мало отличаются. Различие между состояниями мы устанавливаем, сравни- вая их поведение в будущем. Аксиома III. Пусть у,уЕ У и для их внешних предысторий имеет место совпадение mf=mj. Q = eJ, i<N. Тогда I f(yt m) — f(y't m) \ <f(yt m)Cx exp[-C2?V], где G > 0, C2 > 0 и C2 = sup {I mt\, Imjl} . 2. Монотонность, Определение. Частично упорядочим внешние предыстории, по- ложив { mh в/ } < {mJ, е\}, если mJ > mh ej < Определение. Положим у < у' если такое отношение имеет место для каких-либо их внешних предысторий. Аксиома IV. Из у <уъу <у следует у-у'. Аксиома V. Из у < у и m Cm' следует/О, m) m'). Удобно и в силу аксиомы II корректно обозначение у его предысторией. Этот смысл имеет запись /(у, m) =f(mQ, т е0, е,,...; т). Аксиома VI. Значение /(0,m0,m;т) лежит между /(m0,mi,...; е0,еь ... ;т) и ДО, 0,... ;е0, ej,... ;т). Аксиома VII. Значение /(то,т!,... ;0,ео, еп... ;т) 71
лежит между ... ;е0, €j,... ;m) и f(mQt ,...; О,О,... \т). Аксиома VIII. При всяком т марковская цепь (У,Р(т)) (эрго- дачная в силу аксиомы III) имеет однозначно определенный средний уро- вень возбуждения и (т), для которого >0. dm 3. Импульсность. Для элементов в дискретном времени важно иметь аксиому об импульсности элемента, т.е. о расположении отдельных воз- буждений среда обычного невозбуждения. В каких терминах нужно накла- дывать это условие, нам совсем не ясно. Поэтому аксиома IX остается не сформулированной. 4. Два определения. Определение. Возбудимый элемент называется элементом без рефрактерности, если Y = Z Х{ 0,1} и P(yiy,m)=Pi(z lz'm)P2(elz',m), где z,z'G Z и е, е €{0, 1}суть координаты у,у' соответственно; кроме того, V(у) = K(z, € ) s €. Определение. Отношение большей возбудимости Н' > Н означает /'(тоэ/Их,... ;е0,ех,... .. ;е0,... ;m) для всех внешних предысторий.
ГЛАВА VII О БЛУЖДАНИИ ПО ЧАСТИЧНО УПОРЯДОЧЕННОМУ МНОЖЕСТВУ Результаты, полученные в данной главе, обобщают результаты главы Ш. Неформальное описание задачи удобнее излагать не для той конструк- ции, для которой будут получены результаты. Такое описание здесь будет дано на примере одномерного броуновского движения. Поступая так, мы будем в этом примере рассуждать, не заботясь о строгости. Итак, рассмотрим одномерную диффузию на фоне сноса. Поведение во времени плотности вероятности £/(х, г) описывается уравнением dU _ d2U dt € dx2 dx (1) где e (x) - коэффициент диффузии, a (x) — скорость сноса в точке х. Блуж- дание, описываемое уравнением (1), рассматривается или на всей прямой, или в области (6, °°), ограниченной поглощающей границей в точке Ь. По- следнее соответствует краевому условию U(b, t) = 0. Левее границы (при х<Ь) функция Uдоопределяется нулем. Пусть b< Ь'- два положения границы и С/(х, г), и U'(x91) есть соответ- ствующие им решения уравнения (1) при одних и тех же начальных усло- виях: U(x, 0) = £/'(х, 0) = 5(х-с), где с > Ь'. Интуитивно (более или менее) ясно, что если блуждающая части- ца вышла в момент t = 0 из точки х = с и не поглотилась до данного t > О, то она в среднем будет расположена левее при блуждании с границей Ь, чем при блуждании с границей Ь9. Иными словами, перемещение границы вызывает перемещение в ту же сторону среднего положения непоглощен- ной частицы. Формально эта мысль может быть выражена, непример, так: / xU'(x, t)dx f xU(x, t)dx ZZ------------- > ZT------------------- (2) f l/'(x,t)dx f U(xtt)dx — oo —oo Доказываемые ниже неравенства по смыслу и форме похожи на это . Воп- рос же о справедливости самого неравенства (2) остается открытым. Метод, который применяется нами для доказательств, основан на извест- ной идее использования отношения частичного порядка для получения чис- ловых неравенств [28, 30, 60, 61]. Наше построение во многом следует 73
конструкции Митюшина (см. также § 4 гл. III) и более ранней, принадле- жащей, судя по всему, Мюрхеду [61]. (Набросок изложения [30] в терми- нах [61] дан в [52].) Из работы [30] нами заимствованы все результаты, формулируемые в ’’слабых” понятиях. Понятие монотонной меры введено в работе [60]. Однако, по крайней мере неявно, оно содержится и в более ранних публикациях. Более подробно (и в другом отношении, чем здесь) эти понятия и их приложения разбираются в обзоре [5 ]. В основном нас будут занимать соотношения, имеющие в большей или меньшей степени алгебраическую природу. Поэтому вопросы анализа (т.е. вопросы, тривиальные в случае конечного пространства состояний мар- ковской цепи) в настоящей главе обходятся тем или иным способом. Предложения, доказательства которых непосредственно следуют из оп- ределений понятий, употребленных в формулировке, или из непосредствен- но предшествующих предложений, приводятся, как правило, без доказа- тельства. § 1. Монотонные функции Рассмотрим счетное частично упорядоченное множество X. Определение 1. Подмножество А СХ называется полным сверху, если (и только если) из хЕ А и у > х ыеттуету € А. Множество всех полных сверху подмножеств множества X обозначается через X. Оно естественно упорядочено отношением А > С, обозначающим ССА. При этом А > С всегда предполагает Л, СЕ Ж . Замечание. Ниже в определениях сочетание ’’называется..., если” всегда имеет смысл ’’если и только если”, как в предыдущем и следующем определениях. Определение. Счетное частично упорядоченное множество Xконеч- но заполнено, если (и только если) для любых х, уЕ X множество {z: х> >z>y} конечно (или пусто). Условие конечной заполненности непосредственно используется только при доказательстве леммы 1 (хотя и там, вероятно, можно обойтись без него), а в остальном - лишь через посредство этой леммы. Счетно-аддитивная мера /, определенная на X, задается значениями /({х}), хЕХ, для которых будет употребляться обозначение /(х). Рас- сматриваемые ниже меры всегда неотрицательны, т.е. f(A) > 0 для всех подмножеств А СХ, и конечны, т.е. f(X) < °®. Употребляется обозначение (^,/)Е2 ^(Х)/(Х), в котором - функция на X Предложение 1. Если F'(x) > F (х) при всех хЕ X, то (F9, f) > > Определение 2. Отображение я частично упорядоченного множест- ва X в частично упорядоченное множество Y называется монотонным, если х '> х влечет ях' > ях. В множестве действительных чисел существует естественный порядок а>Ь» означающий а > Ь. Поэтому действительные функции на X, не убы- вающие относительно порядка в X, и есть, собственно, монотонные. 74
Определение. Действительная функция F называется монотонной на X, если из х> х следует Г(х) > Г(х). Предложение 2. Если действительная функция F(х) монотонна на X, то каждое множество {х: Г(х) >а} полно сверху, т.е. принадле- жит Ж. Предложение 3. Если функция F на X неотрицательна, монотонна на X и принимает конечное число значений, то она может быть представлена как конечное произведение неотрицательных, монотонных на X и прини- мающих только два значения функций. Доказательство. Ведем индукцию по числу принимаемых функ- цией F значений. Итак, пусть ax,a2i... ,as — значения функции F, выпи- санные в порядке их возрастания. Переопределим F, заменив as наа,_1. Полученную так новую функцию обозначим через р. Она неотрицательна, монотонна m Хи принимает (s — 1) значение. Очевидно, F = где функ- ция неотрицательна, монотонна на X и принимает лишь два значения: 1 И § 2. Мажорирование мер Определение 3. Пусть f,g - меры на X. Отношение слабого мажо- рирования f>g означает, что /(Л) > g (Л) для всех Л G Ж. Предложение 4. Если функция F на X монотонна на X и /> g, то (Г,/) > (F,g). Доказательство предложения дано в [52] (см. также ни- же § 3). Предложение. Если f>g и g>f, то f -g. Для доказательства достаточно заметить, что (F,g) = (F.f) п^и любой функции F, монотонной на X. Взяв в качестве F характеристические функ- ции множеств {х: х>^}и{х: x>^)\{j}, мы получим равенство /*(у) = =g(y)« Введем обозначение: [а 1 а — = lim ----- . b J €-*о b + е Через Na обозначим (нелинейный) оператор, переводящий меру/в меру ^=^лЛгде Г f(A П В) 1 *'4^4 Если функция f - вероятностная, т.е. нормированная (f (X) = 1) мера, то применение оператора NA состоит в переходе к условной вероятности, которую мера f порождает на множестве Л, и продолжении ее нулем вне Л. На этом основании естественно обозначение: f(B\А) = (NAf)(B). Очевидно 0 (В | Л) < 1. Предложение 5. Если число р лежит строго между 0 и °°, ioNAf = -NA (рП Определение 4. Пусть g - меры на X. Отношение сильного мажо- рирования f> g означает, что NAf> NA g при всех Л G Ж. 75
Итак,/>£ означает, что для любых Ж ДВ\A)>g(B 1Л) или, что то же самое, для любых А, С G Ж, А > С, Г/(Я) 1 > Г £(Л2 1 I /(О 1 " J Замечание. Из f>g вовсе не следует f>g, более того, f>g не исключает g >f. Предложение. Если/ >fng'>g, то (/'+g')> (f + g). Замечание. Из f'> f,g> g> вообще говоря, не следует (f'+g) > > (f + g). Это связано с тем, что отношение сильного мажорирования не согласовано с линейной структурой (но с проективной). Предложение 6. Если/>£ и/*(х) > g(X),Tof>g. Предложение 7. Eoni/>g и 0<p,q < °°, то (pf) > (qg), Следствие. Ecnn/>g,то g(X)f>f (X}g. Введем обозначения: (al a + e Г d 1 j — | = lim --- = — , I b J e-*o b L a J где положено О"1 = °° и /(*ия) = (Г(Дпл)| I Г(Я) Г Очевидно, f(B IIA) (В I А) может быть лишь, когда /(Л) =0, что влечет/(Я | Л) = 0и/(Я IIЛ) =«>. Замечание. При каждом Л функция f(B I Л ) есть мера на X, функ- ция *ef(B II Л) - только если/(Л) > 0. Предложение 8. Если f > g, то функция (вообще говоря, неограни- ченная) монотонна на Ж. Предложение 8' Если определенная выше функция не есть тож- дественный нуль и монотонна на Ж, то f>g. Предложения 8, 8' наводят на мысль, что из монотонности на X неотри- цательной функции ф должно было бы следовать (^/) >/. Однако без дополнительных условий на меру / это неверно (см. § 4). Позже будет введено еще одно отношение мажорирования, обозначаемое |/, g]. Оно сильнее сильного, т.е. влечет f>g (см. § 10). § 3. Треугольные операторы Понятие мажорирования были выше введены по Митюшину через понятие полного сверху подмножества. Другой способ принадлежит Мюрхеду и осно- ван на понятии треугольного (или повышающего) оператора. В следующих параграфах главы это понятие не используется, но приводится здесь как имеющее самостоятельный интерес. 76
Рассмотрим марковские операторы p:/^g(x) = S P(x\y)f(y), у т.е. такие, для которыхР (х I у) > 0 и Z Р (х I у) = 1. X Определение 5. Марковский операторР называется треугольным, если из Р (х I у) > следует х>у. Теорема. Отношение f>g эквивалентно существованию треугольно- го оператора Р такого, что S P{x\y)g(y)<f(x) у при всех xG X. Определение. Пусть f>g. Оператор Р, о котором говорится в теореме, называется осуществляющим отношение f>g. Предложение 9. Если f>g, и неотрицательная функция р монотон- на на X, то (pf) > (pg). До к а за тел ьс тв о. Пусть оператор Р осуществляет отношение f>g. Тогда из треугольное™ оператора Р и монотонности функции р следу- ет неравенство Р(Х I у)р(у) < Р<х)Р(х I у), (3) и в силу него, как легко проверить, оператор Р осуществляет отношение (pf)>(pg)- Так как теорема приведена у нас без доказательства, наметим доказа-. тельство предложения 9, не использующее теоремы. Это будет сделано в предложении о конечности множества значении, принимаемых функцией р. Согласно предложению 3, задача сводится к случаю функции р, принимаю- щей ровно два значения, когда она совсем проста. Еще одну иллюстрацию применения теоремы (или удобства системы определений Мюрхеда) дает Доказательство предложения 4. Пусть отношение f > g осуществляется оператором Р. Тогда S [F(x)-F(y)]P(x|y)g(y)>0, х,у что и требовалось доказать. § 4. Монотонные меры Определение 6. Мера / называется FKg-мерой, если f(A)f(B)<f(AC\B)f(A UЯ) для всех A, BE V . Определение 6'. Мера f называется монотонной, если функция f(B I А) при каждом BE А как функция А монотонна на Ж . Предложение. Свойства быть FKg-мерой или мерой монотонной эквивалентны. Доказательство. Пусть f — FKg-мера, т.е. для любых А, В Е И f(B \\A)>f(B ПЛОД). 77
Пусть А > С. Тогда f(B II Л) = f(B П С IIА) > f(B П С IIA U (В П Q) >f(B П С II O ±f(B I С), где используется неравенство /(^HA')>/(Fllg), в котором F, К, G G S( ,G> K,FC\K=FC\ G. Итак, монотонность меры f доказана. Обратное следование очевидно. Предложение. Пусть мера f такова, что из А > С следует NAf> > Ncf (или, что то же самое, NA/> Ncf} * Тогда мера f монотонна. Обратное, вообще говоря, неверно. Действительно, мера 6Х (вероятност- ная мера, сосредоточенная в точке х) монотонна. Но, как только х Л, сразу же 6Х = Nx Ьх > NA Ьх = 0. Предложение!0. На линейно упорядоченном множестве веб меры монотонны. Действительно, для любой пары подмножеств Л, В G Л имеет место либо ЛСВ, либо В С Л. Пусть Л СВ. Тогда (Л А В) =В,(Л UB) = Л и /•(Л)/(Я)=/(ЛПВ)Г(ЛиВ). Предложение!!. Если множество X линейно упорядочено, неотри- цательная функция р монотонна на X, то (pf) > f для всякой ме- ры /. Доказательство. Очевидно, доказательство достаточно провести для случая конечного множества X. Тогда функция р принимает конечное число значений. Следовательно (в силу предложения 3), осталось доказать предложение 11 для функции р, принимающей два значения. Пусть они суть а < Ь. Обозначим с = {х: р (х) = b} . Запишем (pf)(A ПЯ) j _ Гaf(A С\В) + (Ь- a)f(A С\ВС\С) 1 (Р/)(Л) J ’ laf(A) + (b - а)/(Л П С) J Выражение, стоящее справа, не меньше /(В|Л), так как в силу монотон- ности и меры / справедливо неравенство f(B\\A ПС)>/(^11Л). Предложение доказано. Замечание. Если мера f монотонна, а неотрицательная функция р монотонна на X, то в общем случае мерар/не обязана быть монотонной. Поэтому, не будь множество X в предложении 11 линейно упорядоченным, отношение (р/) >/ не следовало бы из монотонности на X функции р. § 5. Две леммы о частных Лемма 1. Пусть функции p(x),q(x), [р(х)/«?(х)] неотрицательны, ограничены и монотонны на X и f>g. Тогда (р/)1 Г(Р. <?) 1 (<7,-01 I (<7,*)Г (4) 78
Замечание. Лемму 1 можно понимать как аналог предложения 4 для сильного мажорирования. Доказательство. В силу конечной заполненности множества X существует представление X = U Yf, где все подмножества YfGX конечны; У/ = Д/\Л/ и Ш ; Л/+ 1 С Л/С BjG j. Например, в качестве этих подмножеств можно взять 5 Bs= V {x:x>xf}t t= 1 У5= U {x:x{>x>Xj} = Bs П U {х:х(>х} , /,/=1 /=1 AS = BS\YS, где индексы i, j взяты из какой-либо нумерации элементов счетного мно- жества X. При данных Л/, Bi, Yi переопределим функции р и q, положив Pfa) = 4i(x) = 0, если х е В,; Pt(x) = р(х), qt(x) = q(x), если х G Yb <7z(x) = sup q(x), x&Aj Г p(x) 1 Pi(x) = qi(x) sup —— , если xGA(. X(EAi[q(x) J Очевидно, функции pit qit [pf/qi] обладают прежними свойствами и ограни- чены сверху константами, не зависящими о) i . Из справедливости леммы для всех таких pb qt предельным переходом выводится справедливость леммы для самих р, q. Итак, зафиксируем /. Станем опускать индекс i. Левая верхняя сумма из формулы (4) примет вид (я/) = Рл/’(Я)+ 2 Р(х)/(х), (5) х G Y где Ра - значение функции р на множестве Л. По аналогии с (5) преобразу- ются остальные три суммы из формулы (4). Переосмыслим их, считая с этого момента Л обозначением точки, присоединенной к множеству Y в качестве максимального элемента относительно порядка в множестве Уи{Л) (порядок внутри множества Y — прежний). Этим проведена редукция к случаю конечного множества X. Итак, пусть множество X конечно. Отождествим его с множеством In = {1,2,...,п), где п = |Х|. Теперь для элементов х (как элементов /л), кроме отношения х>у9 определено отношение х>у. Выберем отождествление так, чтобы функция [p/q] была монотонна на /п относи- тельно порядка в нем. В силу монотонности функции [p/q] тХ множества Ак = {х: х>к} полны сверху как подмножества X. Следовательно, меры / и g находятся в отношении /> g как меры на 1п. 79
(6) 2 <7(xW) Продолжим доказательство индукцией по (и - £), т.е. доказывая нера- венство г Е р(х)/(х) х > к 2 <7(х)/(х) х > к для последовательно уменьшающихся к. Для к = (л - 1) оно верно по условию. Пусть неравенство (6) выполнено для к = з, докажем его для k = s— 1. Ограничим рассмотрение множеством t. В силу предложения 7 можно считать, что/(ЛСледовательно (по предложению 6), f>g. Тогда, согласно предложению 4, r'= S p(x)f(x)> Е p(x)g(x) = r; X > 3 X > 3 R'= Е q(x)f(x)> E q(x)g(x) = R. X > 3 X > s По предложению же индукции Кроме того, из f>g и f(As_i)=g(As_i) следует f(s- l)<£(s-l), а из монотонности функции [p/q] - 'Г . RJ q&-) (7а) (76) (8) (9) (Ю) Из неравенств (7) - (10) элементарно выводится неравенство: ГР($- 0/0- O + r* I >Гр(*~ l)g(s- l) + r 1 I q(s - l)/(s - 1) + R 'J b(s - l)g(s - 1) + R J ’ которое оставалось доказать. Лемма 1 доказана. Лемма 2. Пусть множество X линейно упорядочено, функции Pt4,\plq], [q'lq], р',q' неотрицательны и ограничены, причем четыре пер- вые из них к тому же монотонны на X, и, наконец, при всех хЕХ спра- ведливо Р'(х)1 >Г Р(х) 1 л'(*)Г w(*> Г Тогда Г(Р,.Г)1>Г(Р,/)1 LGr./n 1(<7.Г)1 (Н) для любой меры f. Замечание. Лемму 2 можно понимать как аналог предложения 1. 80
Доказательство. Определим новую меру Г q '(х)1 1л(*) J В силу условии леммы и предложения 11 справедливо отношение g > /. Согласно лемме 1 оно влечет r(P,g)l J (Р.Г) 1 (12) Заметим теперь, что при всех х е X Г Я '(*) 1 Я(х) ——- =<? (х). L Я(х) J Следовательно, (q, g) = (qf). Кроме того, нетрудно проверить, что в силу условии при всех х G X q'(x) , <?(*)• <?(*) Поэтому (p,g)<(p',/) ииз (12) следует (11). § 6. Операторы Рассматриваются два частично упорядоченных множества М и М* и отображения одного в другое. Определение?. Пусть я, я' - отображения множества М' в мно- жество М. Отношение я' > я означает, что п 'т > ят для всех т G М'. Л е м м а 3. Если я' > я, т' > т и одно из отображений я, я' монотонно, то ir'm'>irm. Важен случай, когда множествам, М' совпадают. Лемма 3*. Пусть я,я' - отображения множества Мв себя. Если я' > я и одно из отображений я, я1 монотонно, то (я ')* > (я)* при всех натураль- ных к. Доказательство леммы проводится индукцией по к и в предло- жении о монотонности отображения я сводится к следующей строчке: (я')* + 1 >я'(я')*> я(я')*> яя*=я* + Лемма 3 доказана. Пусть М — множество неотрицательных мер на множестве X, Оно упоря- дочено отношением либо слабого, либо сильного мажорирования. Соот- ветственно слабому или сильному мажорированию, принятому в простран- стве мер, для отношений операторов будут употребляться обозначения P>Q или Р> Q и термины ’’оператор слабо монотонен” или ’’сильно моно- тонен”. Например, предложение 9 означает, что умножение на неотрицательную монотонную функцию есть слабо монотонный оператор. Треугольный же операторР может быть охарактеризован отношением Р> Е, где Е — тождест- венный оператор (определение 5). 6. А.Н. Четаев 81
Основной наш объект - линейные операторы, действующие по формуле: P-f^g(x)^ZP(x\y)f(x)9 о с неотрицательным ядром Р(х |j), удовлетворяющим условию: S Р(х |у) < const < <». х Предложение 12. Если оператор Р слабо монотонен, то Р(А |х) как функция х монотонна на X при любом подмножестве A Е Ж . Доказательство. Так как оператор слабо монотонен, из х' > х следует >Р5Х. А так как Р(А\х) = (Р5Х) (Л), осталось применить определение слабого мажорирования (определение 3). Предложение! 3. Если марковский оператор сильно монотонен, то он и слабо монотонен. Доказательство следует из предложения 6. ’’Сильные” понятия будут использоваться еще в одном варианте. Имен- но, операторы будут рассматриваться как отображающие множество М' монотонных мер в множество М всех неотрицательных мер на X. Соответст- венно модифицируется терминология. Очевидный смысл имеет отношение условного сильного мажорирования P(>)Q и свойство условной сильной монотонности. В них термин ’’условное” означает, что понятие характеризу- ет действие операторов на монотонные меры. Опре дел е ни е 8. Оператор называется консервативным, если он сохраняет свойство монотонности мер. § 7. Семейство операторов Ра Как правило, будет рассматриваться семейство операторов РА, получаю- щихся из одного оператора А добавлением поглощения вне множества ЛЕЯ . Итак, РЛ{х\у) = О, хел, хех\А. Легко видеть, что поглощение происходит после применения оператора Р. Иными словами, оператор РА можно представить как суперпозицию ЕА Р, где через Е обозначен тождественный оператор. Начнем с указания свойств операторов ЕА. Предложением. Оператор ЕА, если ЛЕЯ, слабо и сильно моно- тонен и консервативен. Предложение 15. Если Л > С, то ЕС>ЕА. Предложение 16. Если Л > С и мера / монотонна, то ЕА f> Ecf, т.е. из Л > С следует ЕА (>) Ес. Предложением*. Оператор РА, где ЛЕЯ, наследует от операто- ра Р свойства консервативности, слабой и сильной монотонности. Предложение^'. Если Л >С,тоРс>РА. Предложение^'. Если А>С и оператор Р консервативен, то Рл (>) Рс 82
Т е о р е м a 1. Пусть марковский оператор Р консервативен и сильно монотонен и А> С. Тогда pkA^)pkc>pkA при всех натуральных к. Для доказательства теоремы достаточно последовательно воспользовать- ся предложениями 13,15', 16'и (дважды) леммой 3. Замечание. Сочетание теоремы 1 и предложения 4 дает неравенства, соответствующие неравенствам (2). Теорема 2. Пусть марковский оператор Р сильно монотонен и А Е И . Тогда при любом натуральном к функция ( } РкА(А\х) (если дробь имеет смысл) монотонна на X. Доказательство. Запишем Pj (у|х) у ^лС4!*) В силу предложения 13 оператор Р слабо монотонен и, следовательно, функция F(y)=P(A\y) монотонна на X. Операторы Р, Рл, РА сильно монотонны. Последнее означает, что (нелинейный) оператор Я =NaP* слабо монотонен. Поэтому (в силу предложения 4) (Р,я5х)>(Р,7гМ, как только х' > х. Что и требовалось доказать. § 8. Операторы, касательные к порядку В настоящем параграфе будет рассмотрено поведение блуждания, описы- ваемого оператором Р, ”на границе” подмножества Л СХ. Определение. Оператор Р называется правильным на подмножест- ве А СХ изнутри, если функция Г(х) = Р(Л|х) монотонна на Л. Предложение 17. Если оператор Р слабо монотонен и Л Е Ж , то оператор Р правилен на Л изнутри. Определение. Оператор Р называется правильным на подмножест- ве Л С X снаружи, если РА Ьх > б* для всех тех х Е (Х\Л), для которых Р(А |х) > 0. Предложение 18. Если Л Е Ж и оператор Р сильно монотонен и правилен на Л снаружи, то Р* + 1 всех натуральных к и тех хЕ (Х\Л), для которыхР(Л |х) >0. Определение 9. Оператор Р называется касательным к порядку (или просто касательным), если {х: P(x|j9> 0} С {х:х>у} U{x:y>x} , т.е. если Р(х |j) > 0 влечет либо х > у, либо у > х. 6* 83
Замечание. Степень оператора, касательного к порядку, не обяза- тельно есть оператор с тем же свойством. Предложение. Если множество X линейно упорядочено, то все операторы в пространстве мер на нем касательны к порядку. Замечание (для знакомых с работами по теории взаимодействую- щих марковских процессов). Понятие касательного оператора более естест- венно в случае непрерывного времени. Предложение 19. Если оператор Р слабо и сильно монотонен и касателен к порядку, то на всяком подмножестве A G Ж он правилен снаружи и изнутри. § 9. Удерживающие области Определение. Подмножество А С X называется поглощающим для оператора Р, если Рк (А |х) не убывает с ростом к. Удерживающие области — ослабленное подобие поглощающих множеств. Определение! 0. Подмножество А С X называется удерживающей областью для оператора Р, если из х £ А следует: функция '(Л|х) я(Л,х;&) = (В) монотонно не убывает как функция натурального к. Очевидно, 0<я(Л, х, к)< 1. Смысл определения 10 таков. Пусть оператор Р марковский. Рассмотрим описываемое им движение частицы по множеству X, Знаменатель дроби из формулы (13) есть вероятность, попав извне в область Л, не покинуть ее за время t = к. Числитель этой дроби имеет тот же смысл при t = к + 1. Итак, их отношение есть условная вероятность, попав извне в область А и пробыв безвыходно в ней до t = k, не покинуть ее еще одну единицу времени. Монотонность же я означает, что чем дольше блуждающая точка пребывает в области Л, тем меньше вероятность выхода наружу. (Послед- нее не означает, что я -► 1 при к -> °°.) Данная сейчас интерпретация показыва- ет, что, хотя понятие удерживающей области определено через оператор РА, оно характеризует сам оператор Р. Теорема 3. Пусть марковский оператор Р сильно монотонен и каса- телен к порядку, а подмножество А С X полно сверху. Тогда А - удержи- вающая область для оператора Р. Доказательство. Согласно предложению 13 оператор Р слабо монотонен. По предложению 19, он правилен на Л изнутри и снаружи. В силу предложения 18, Р^ЬХ>РА~ХЬХ и, следовательно, > для всех хб (Х\Л). Отсюда следует справедливость нера- венства: (/•-. Na , РАЬХ ) > (F, Na ,Р*~'Ьх) для любой монотонной на X функции F. Возьмем в качестве F функцию РА (А |х). Она монотонна на X, так как оператор?слабо монотонен. Теоре- ма доказана. 84
Для удерживающей области А и любого х Е (Х\Л) существует предел: lim я(А, х, к) = я(Л, х), к -♦ оо и мы сразу примем предположения, обеспечивающие независимость функ- ции я • (А, х) от х. Определение II. Оператор Р называется эргодическим на Ж , если I) любые два непустые, полные сверху подмножества множества X имеют непустое пересечение: 2) Р(А |х)> 0 для всех Л С Ж ихЕЛ; 3) для всех Л Е Ж функция я (Л, х) не зависит от х на множестве {х: Р(А\х)>0}. В этом случае вводится обозначение я (Л, х) = Х(Л). Величина X (Л) имеет смысл максимального по модулю собственного числа оператора РА и совпадает с ним, если оно существует. Вероятностный смысл Х(Л) - вероятность, пробыв в области Л бесконечное время, про- быть в ней еще единицу времени. П р е дл о ж е н и е 20. Пусть оператор? эргодичен на Ж и Л Е Ж , тогда функция X (Л) не возрастает на Ж . Доказательство сразу следует из строчки неравенств: Р*(Л |х)>Р*(С|х)> const (Х(С) - е)*, в которых О А. § 10. Согласованные пары Ниже вводится определение, которое одновременно является обобще- нием определения монотонной меры и определения сильного мажори- рования. Определение 12. Пара мер f,g называется согласованной, что записывается как \f, #],если f{X)>0 и при всех Л, В, СЕЖ, Л > С, справедливо неравенство: f(AOB)g(C)> f(COB)g(A), или, что то же самое, при всяком ?ЕЖ функция ... _/Г(лпв)| I g(A) J монотонна на Ж. Предложение. Отношение \f,f\ означает мотонность меры /. П р е д л о ж е н и е. Из [/, g] и [g, h] следует [/, Л]. Доказательство. Из определения отношения \ft g] возьмем неравенство: f(AOB)g(C) > f (СО B)g(A\ (14) в котором Л, В, СЕЖ, Л > С, а из определения [g,h] - неравенство: g(A)h(C) >g(C)/i^), (15) в котором Л >С. Перемножив неравенства (14), (15), получим к (Я)g<Q] f(A OB)h(Q >f(C OB)h (A) [g (A )g (O1, 85
где в силу неравенства (14), (15) допустимо ’’сокращение на [g(A)X X g(C)] ”. Предложение доказано. Предложение. Из \ft g] следует / > g0 Для доказательства во втором варианте определения 12 достаточно подставить В = X и воспользоваться предложением 8' . Замечание. Из />g не следует \ft g], так как отношение f > f справедливо всегда, a \f, f\ означает монотонность меры /. Предложение. Если мера f монотонна и f>g, то \f g]. Доказательство. Пусть Л, В, СЕ Ж и Л СС. В силу монотон- ности меры / справедливо неравенство: А так как f>g и Л > С, справедливо еще одно: f(Og(A)<f(A)g(C). Следовательно: [f (A)f (С}] f (С ^B)g (A) <f(A nS)g(C)[/(O/^)]. (16) Неравенства О < /(Л ПВ) < /(Л), 0 < /(СПЯ) < /(С) очевидны. Благодаря им мы имеем право сократить обе части неравенства (16) на [ДЛУ(С)], что даст неравенство, означающее справедливость отношения \ft g]. Итак, надо доказать, что для любого подмножества справедливо нера- венство fa/) I (<д 0 г где *(*) =Р(Л|х). Неотрицательная функция монотонна на X, и в этих предположениях о ней мы будет доказывать неравенство (17). Сведем эту задачу к случаю функции <р, принимающей конечное число значений. Рассмотрим неотрицательные неубывающие ступенчатые функции фа неотрицательного аргумента £. Функции не- отрицательны, монотонны на X и принимают конечное число значений. Если доказать лемму для всех то переходом к пределу по последова- тельности функций фа, сходящейся к Фо (£) - будет получено доказа- тельство для исходной функции <р. Итак, пусть функция принимает конечное число значений. Пусть они, расположенные в порядке возрастания, суть ait а2, . . . , ап. Вве- дем дополнительно а0 = 0. Тогда, например, (<&/) = S (а,-(Л,), 1=1 где Л,- = (х:<р(х) > а/}. Аналогично преобразуются выражения для Mepg, Л, /. 86
Следствие. Отношения [/, g] и />g совпадают на множестве моно- тонных мер. § 11. Согласованные четверки Определение 13. Четверка мер а = (/, g, h, Г) называется со- гласованной, если 1) все четыре меры монотонны, 2) справедливы отношения f > Л, f> g, g>lt h>l, и, следовательно, пары (f, g), (g, Z), (f, h), (h, l) согласованы, 3) для любого A G V справедливо неравенство Г(Л)/(Л) >h(A)g(A). Замечание. Очевидно, определение 13 ’’симметрично относительно диагонали/-/”, т.е. относительно перестановкиg и h. Определение 14. Четверка операторов а = (F, G, Н, L) называет- ся согласованной, если любую согласованную четверку мер а она перево- дит в согласованную четверку: а а = (F/Gg, Hh, LI). Лемма 4. Пусть оператор Р консервативен и слабо и сильно моно- тонен. Тогда четверка а = (Р, Р, Р, Р) согласована. Доказательство. Пусть четверка мер а согласована. Тогда для четверки мер а а условия 1, 2 определения 13 очевидно выполнены. Оста- ется проверить выполнение условия 3. Рассмотрим множество /„ = = {1,2,...,//} и меру р на нем: Д(0 = Д/- а/-1. Так как 1п линейно упорядочено отношением i > j, мера р монотонна. Введем функции: f(An^) = q (У), Л(Лл_/) = q'(i\ g(An-i) =P(i), НЛп-i) = р'(0- Так как D4„_z, функции p,q,p\q монотонны на 1п. Отно- шения \p/q] и [^] также монотонны на7„,так как убывают с ростом / (возрастают с ростом (л-Z)) в силу отношений / >g к/>//. Подготовка окончена. Применение леммы 2 дает неравенство: Г(р'м) 1 > Г (р. д) 1 LGz'm) J 1(<7,Д) J’ которое эквивалентно неравенству (17). Лемма доказана. 87
Для четверки операторов a - (F.G.H.L) введем еще одно обозна- чение: [F Н] Л L G L ] Лемма 5. Пусть АЕ Ж. Тогда четверки операторов \Еа Е1 ГЕЛ ЕА] ГЕл ЕЛ 1Ел d’ L Е Е J’ 1.ЕЛ Еа\ согласованы. Доказательство. Пусть а - согласованная четверка мер. Выпол- нение условия (13) для четверки мер а а следует из консервативности операторов Е и ЕА. Выполнение условия 2 следует из сильной монотон- ности операторов Е и ЕА, отношения ЕА(>)Е и леммы 3. Условие 3 достаточно проверить для первой и третьей четверок операто- ров, так как вторая превращается в первую при перестановке g и h. Начнем с третьей четверки. Так как (EAf}(B) = ДЛАВ), согласован- ность четверки мер а а сразу следует из согласованности четверки мер а. В случае первой четверки надо доказать, что /(ЛПВ)/(В) > h(B)g(A ПВ). (18) Согласованность четверки а означает, что f (В) 1(B) > h (В)g(В), a vaf>g следует неравенство: Г/(ЛПВ)1 рг(ЛПВ)1 L Г(*) J L J Из двух последних неравенств следует неравенство (18), что завершает доказательство. Следствие. Четверка операторов b = \ЕА п в» ЕА, Ес^в, Ес], где А, В, С G Ж, А > С, согласована. Доказательство. Разложим четверку операторов b в суперпози- цию трех четверок, упомянутых в лемме 5: \ЕА Е1 ГЕд Ев] ГЕС £с1 о - I II II |. L Еа Е J LE Е J [Ес Е(7 J Это соотношение справедливо в силу равенства ЕуЕу = Еуи у. Следствие доказано. Предложение 21. Пусть А, В, С G Ж, А > С, оператор Р консерва- тивен и слабо и сильно монотонен. Тогда четверка а = [РЛпв,Рл,Рвпс»^с] согласована. - Доказательство сразу следует из представления ГР Р1 а = Ь [Р PJ (где b - упомянутая в следствии четверка операторов), лемм 4,5 и следствия. 88
$ 12. Одно свойство функции Х(Л) Определение 15. Консервативный, сильно монотонный, касатель- ный к порядку марковский оператор называется оператором блуждания по частично упорядоченному множеству. Теорема 4. Пусть Р - оператор блуждания, эргодичный на И . Тогда функция X удовлетворяет неравенству: < Х(ЛПВ)Х(ЛиВ), в котором А,В&1 произвольны. Доказательство. Теорема следует из справедливости неравенства: Р * (Л | х) Р* (Я | х) < п В(Л П В | х) Р* ПВ(Л U В | х), (19) в котором А, В G V и к — любое натуральное число. Действительно, для этого достаточно применить рассуждение из доказательства предложе- ния 20. Преобразуем неравенство (19), используя равенство: Py{U\x)-Pky{X\x). Теперь нам достаточно доказать согласованность четверки мер (РА пв Ра Ввдх, РА и в &*)• Это, в свою очередь следует из согласован- ности четверки мер (6Х, 6Х, 5Х), условий теоремы и предложения 21, в обозначениях которого надо положить С = A U В. Теорема доказана. § 13. Заключение Начав с задач о неравенствах типа неравенства (2), мы столкнулись с отношением сильного мажорирования. Оно интересно само по себе как пример нелинейной вероятностной конструкции. После этого открылись задачи о функции Х(Л). Ее физический смысл ясен из вероятностной интер- претации, приведенной рядом с определением. Однако нелишне было бы когда-нибудь обсудить его более детально. Быть может, введение этих двух понятий составляет основное неформальное содержание данной главы. Приложения полученных в главе результатов подробно освещено в работах сборника ’’Взаимодействующие марковские процессы в биологии” [7], а также в главе IX.
ГЛАВА VIII ДОЛГОЖИВУЩИЕ СОСТОЯНИЯ КОНЕЧНЫХ СИСТЕМ Настоящая глава посвящена построению понятия фазы для конечных систем. Определения формально не апеллируют к физической интерпрета- ции и поэтому приложимы к любым марковским цепям. Однако для яс- ности изложения и контроля за содержательностью понятий будут исполь- зоваться физические образы и аргументы. Кроме физических примеров [42], для нас был важен математический пример, разобранный в [6], и пример из области физиологического моделирования [46]. § 1. Метастабильные состояния и конечные системы Мы рассматриваем конечные системы, поведение которых во времени описывается вероятностным образом - марковской цепью в дискретном времени. Состояния системы составляют конечное множество X. Для каж- дого у G X заданы вероятности Р(у I х) переходов за единицу времени в состояния х G X. Если система в данный момент пребывает в состоянии х с вероятностью /(х), то распределение по состояниям g(y) в следующий момент задается ({юрмулой gO) = SP(y|x)/(x) (1) х или - в векторных обозначениях — g = Pf. Условимся, что оператор Р не вырожден (т.е. Pf = 0) влечет/ = 0 и каждое состояние системы достижимо в процессе Р из каждого за конечное время с положительной вероятностью. Для равновесной статистической физики [34] основной интерес пред- ставляет стационарное распределение р (х), т.е. распределение, удовлетво- ряющее уравнению р = Рр. Стационарное распределение как математический объект соответствует физической процедуре наблюдения системы в случай- ный момент или, что то же самое, процедуре взятия среднего результата по многим наблюдениям, моменты проведения которых не зависят от резуль- татов друг друга. Так называемые метастабильные состояния вещества [4] требуют для своего обнаружения принципиально иного способа наблюдения. Именно, вещество надо непрерывно наблюдать сразу после его перехода в такое состояние и до тех пор, пока оно его не покинет. Для марковской цепи можно ввести понятие, соответствующее этому способу наблюдения. Пусть в пространстве X состояний цепи выделено подмножество А, которое условно считается некоторым метастабильным состоянием. Его наблюдаемость означает, что если сейчас цепь пребывает в некотором состоянии х G А, то велика вероятность цепи безвыходно оставаться в под- множестве А еще весьма долгое время. Итак, нужно охарактеризовать под- 90
множество А С X временем безвыходного пребывания попавшей в него цепи. В качестве такой меры естественна (условная) вероятность Х(Л), пробыв в подмножестве А все прошлое (бесконечное) время до настояще- го момента включительно, не покинуть А еще одну единицу времени. В си- лу известной теоремы Перрона - Фробениуса Х(Л) есть наибольшее по мо- дулю собственное число оператора РА, действующего по формуле (1), в которой х, у G Л. Наблюдаемости метастабильного состояния в марковской цепи соответствует большая (близкая к единице) величина Х(Л). Заметим, что у конечной системы фазовые состояния могут мыслиться только как метастабильные. Равновесная характеристика подмножества А - вероятность р(А) = = Е р(х) - не связана с величиной Х(Л) никакими априорными оценка- х ел ми вида Ф(р) <Х<Ф(р) с универсальными, т.е. не зависящими отр, функ- циями Ф и Ф (кроме тривиальных Ф = 0 и Ф= 1). Итак, р(Л) и Х(Л) - независимые характеристики подмножества в пространстве состояний системы. Наличие у системы двух фазовых состояний выражается в терминах функции X. Именно оно означает существование пары подмножеств Л и Л = = Х\ Л такой, что Х(Л) и Х(Л) оба близки к единице. То же можно выра- зить иначе: А(Л) = Х(Л) Х(Л) ~ 1. Чтобы выбор подмножеств не был ак- том произвола, их надо не выбирать, а определять. Это естественно осущест- вить, требуя, чтобы функция А принимала максимальное значение на Л. Данные определения требуют небольшого изменения математического характера, не меняющего их физического смысла. Во-первых, функция А определена на множестве из 2" элементов, где п = |х | - число состояний цепи. Этим функция А ’’жестко привязана” к данной цепи и не позволяет, например, сопоставить функции А] и Ап двух систем с разным числом состояний. Во-вторых, функция А определена на конечном, т.е. дискретном множестве. Процедура же взятия максимума более естественна, когда мно- жество есть многообразие. В-третьих, процесс Р может обладать некоторы- ми дополнительными свойствами (например, быть обратимым), которые пока не учитываются при определении подмножества А. В-четвертых, опре- деление сразу именно подмножеств делает всю конструкцию ’’застывшей”. Лучше было бы сделать ее более ’’мягкой” с тем, чтобы подмножества возникли позже ’’сами собой”. ' § 2. Фазы и фазовые переходы Кроме процесса Р, введем в рассмотрение процедуру, которая решает, пребывает ли система в данной фазе. Пусть процедура может допускать неоднозначность или ошибки, т.е. давать ответ вероятностным образом. Процедура дает свой ответ во время перехода из состояния х в состояние у, и он есть ”ДА” с вероятностью D(y, х). Зависимость D от двух аргумен- тов — существенная деталь. Ее значение объясняется позже. При рассмотрении какого-либо класса цепей заранее следует выделить класс процедур П. Далее будут рассматриваться процедуры трех классов: 1. Произвольные процедуры, зависящие от двух состояний. 91
2. Обратимые процедуры, у которых D(x, у) = D(y, х). Они не зависят от направления времени. 3. Процедуры, которые судят только по конечному состоянию у. Процедура D из первых двух классов определена на множестве М = = (О', *): Р(У- х) > 0}, а из третьего - на X Общим для нихюбозначе- нием аргумента функции D будет £. Состояния из пар (х, у) G М называют* ся соседними. По марковскому процессу Р и процедуре D строится вспомогательный процесс, в котором вероятность перейти из состояния х в состояние у за единицу времени выражается формулой: RD<y\x) = D(ytx)P(y\xY (2) С ненулевой вероятностью происходит обрыв (остановка) процесса. Это происходит после решения "НЕТ” процедуры. Наибольшее по модулю собственное значение оператора RD обозначается через X(D), а соответ- ствующий ему собственный вектор яр нормируется для определенности так, чтобы быть вероятностным распределением на X. Вводится функция A(D) = X(D) X(D), где дополнительная по отношению к D процедура D оп- ределена равенством D(£) = 1 -£($•)• Здесь D,X(D);Rd вполне аналогич- ны Л, Х(Л), Рл соответственно. Замечание 1. Функция А определена на кубе [0, 1 ] ” . Возьмем множество замкнутых подмножеств этого куба с обычной топологией в нем. Множество Cd = (D: A(D) = d } есть подмножество линий уровня функции А. Разложим каждое Cd в объединение непересекающихся связ- ных подмножеств Cds, где s G Sd - параметр. Подмножество Г = = UU(Cds, d) С L X [0, 1] называется деревом линий уровня функции А [27]. Топология в Г индуцирована вложением в L X [0, 1]. Дерево Г можно изобразить на квадрате, т.е. построить Г" G [0, I]2 и гомеоморфизм <р: Г -► Г\ при котором у образа и прообраза каждой точ- ки совпадают значения второй координаты. Очевидно, Г' характеризует систему в терминах, не зависящих от числа ее состояний. До сих пор рас- сматривалась индивидуальная система и ее поведение во времени. Реальные же системы зависят от параметров (например, температуры). Для этой ситуации введенная конструкция дает два естественных понятия области Кюри и точки фазового перехода. Мы изложим их, не прибегая к полной формализации и не разбирая их связь с известными физическими понятия- ми. Итак, областью Кюри называется область в пространстве параметров, для всех точек которой дерево Г имеет один и тот же тип. При данном значении параметра абсолютный максимум функции А достигается в неко- торой точке 5 дерева Г. При изменении параметра внутри области Кюри точка 5 может ’’перепрыгивать с ветки на ветку” дерева Г. Момент ’’прыж- ка” называется точкой фазового перехода. Определение 1. ^.-разделением пространства расстояний на фазы называется процедура D G П, доставляющая функции А локальный на П максимум, если функция D(£) не равна тождественно 1/2. (В последнем случае процедура сводится к бросанию монеты.) Если процедура D есть разделение, то фазами называются подмножества А = {$: D(£) = 1) и 92
A = lf:,D(£) = 0}, а подмножество Ж = {$: 0 < £)($) > 1} - их грани- цей или, как говорят физики, болотом. Замечание 2. Обозначения А, Ж , А будут использоваться и для про- цедур, не являющихся разделениями, но без употребления терминов ’’фаза, граница, болото”. Определение 2. Система называется О,-однофазной, если все ло- кальные максимумы функции Л на О достигаются на процедурах, значения функции Z)(£) которых заключены строго между 0 и 1. Итак, разделение фаз определено условием достижения локального мак- симума функции Л. Если он не изолирован, то фактически определение дает сразу семейство процедур, семейство фаз и границ. Быть может, для цепей, моделирующих реальные системы, разделения D всегда расположены только в изолированных максимумах функции Л. Как бы то ни было, естественно ввести Определение 3. Процедура D, являющаяся П-разделением, назы- вается строгим разделением, если доставляет изолированный локальный макисум функции Л в классе всех процедур, зависящих от двух состояний. Непустота границы Ж означает, что у цепи есть состояния, о которых процедура D ”не знает”, к какой фазе их следует отнести, и ’’колеблется” в своем решении. Возможно, существование состояний, которые вообще нельзя никаким осмысленным образом отнести к одной из фаз, есть физи- чески содержательное обстоятельство, а вовсе не частная особенность оп- ределения 1. Гипотеза (эвристическая). У систем, моделирующих реальные систе- мы, болото обычно мало по сравнению с фазами. Следующий пример показывает, что непустые границы бывают по край- ней мере у формальных (не модельных) систем. Пример. Процедура ’’судит” rtb конечному состоянию. Х= {1,2,3), Р(1 I 1) =Р(3|3) = 1 — а, Р(2|1)=Р(2|3)=а, Р(1 | 2) =Р(3 | 2) = 1/2, прочие вероятности переходов суть нули. Если процедура D есть разделе- ние, то граница либо пуста, либо Ж = {2). Рассмотрим два варианта D\(1) = = D1(2)=1, Dj(3) = 0 и D2(l)= 1/2, D2(3) = 0. Легко находятся значения 2Xi - А + \/а, 2X1 = j4x/JT и 2Х2 = 2Х2 = = А + \/(а + 0)/2» где А = (1 - а), а = 1 + а2, 0 = (1 - а)2. Используя выпуклость квадратного корня и неравенство Коши — Буня- ковского, убеждаемся в том, что Ai < Л2. Следовательно, существуетDo, дающее абсолютный максимум Л, причем в этом случае Ж = { 2). В следующих двух параграфах исследуется структура болота. Основной результат — теорема 3. В ней реальные процессы считаются обратимыми и медленными (Р(х |х) >0). Теорема не доказывает высказанную выше гипотезу о малой величине болота, а оставляет, кроме нее, одну возмож- ность (рыхлая оболочка ядра), которая, вероятно, невозможна для решет- чатых моделей. § 3. Теорема о максимуме Рассматриваются процедуры, судящие по конечному состоянию. Леммы, приводимые ниже без доказательств, либо известны, либо тривиальны. Аргумент или индекс D обычно будет опускаться там, где процедура не есть 93
переменная. Черта сверху превращает что-либо связанное с процедурой D в аналогичную величину, функцию, оператор и тому подобное, связанные с процедурой D. Лемма 1. Если процедура D есть разделение, то A U Ж совпадает с множеством { х: я(х) > 0). Обозначим через N оператор нормировки, переводящий неотрицатель- ную функцию на X в пропорциональное ей вероятностное распределение; через Н - собственный вектор оператора R * (сопряженного R) при собст- венном значении X, нормированный так, чтобы H-NH. Лемма 2. Множество {х . Н(х) >0} содержит множество {х: я(х) > > 0}, а в условиях леммы 1 эти множества не совпадают. Обозначим через р(х0, xit ... , xv) вероятность того, что, начав из со- стояния xq, процесс R последовательно пройдет через состояниях), х2,... ..., хр. Состояние у встречается среди них М(у\ хь ... , хр) = |{i: i >0, X/ =у }| раз. Нормируем: к(у;хь ... , хр) = v~lM(y;xi,... , хр). Лемма 3 (эргодическая теорема). Если оператор R к при некотором к задается положительным ядром, то для всех у и х0 G A U Ж _ р(хо, ХЬ. . . ,Хр) lim Z |к(у;хь.. . ,Хр)-<р(у)| —------------------- =0, Р-* 00 хх ... xv h(XQ, v) где = N (Hit), a h(x, р) есть вероятность, начав процесс R из состояния х, не прервать его за v единиц времени. Лемма 4. Пусть Rt(x | у) = D,(x) Р(х | у), i = 1, 2. Тогда P(x0,Xt....JCp) = Pi(xo.Xi...х„) n[D2(y)lDi(y)]M(y'x..............Xv\ у Лемма 5. Пусть процедура D доставляет локальный максимум функ- ции А. Тогда <p(x)D (х) = £(x)Z)(x). (3) Доказательство. Соотношение (3) на Л ил выполнено всегда. Веделим в Ж состояние и обозначим его через а. Обозначим D через Di и введем процедуру D2, отличающуюся от только в точке а. Так как (е, Rkf)^k X при к -► °°, сравнение А) и А2 сводится к сравнению (е, R(f)= 2 р/(«;лг1...хк) 2 Pi(a,Xi..........^) = X,....Xfr Х|, . . . , Xfr = 2 Р,(«; х,......xu)Pi(a,xi.....х„) X/, X/ при разных i. Здесь ( •, •) - скалярное произведение, е = (1, 1, ..., 1), f - мера, сосредоточенная в точке а. Последнюю сумму разложим на две: на сумму Si (к, е) по { (хь... , хр; хь..., хр): | к(у\ хь..., хр) - (у) | < <е, I к(у; хь... ,Хр)-£1001 <е, V.P}, и на сумму Sj(k, е) оставшихся слагаемых. В силу леммы 3 Si (к, e)/Si<£, е) -► 0 при к -► Если [D2(ayDt(a)r« (в)р2(ауЬ,(а)]*><в> > 1, (4) то S2(k, е) > S\(k, е) при достаточно больших £ и достаточно малых е. Поэтому Л2 > А) независимо от сравнительных величин $1 и$2. Положим D2(a) = Z>i(a) + г?. Условие невозможности неравенства (4) при малом 17 94
и есть соотношение (3), в котором* = а. Произвольность a G Ж доказывает лемму. Л е м м а 6. Если оператор Р обратим, а процедура D доставляет локаль- ный максимум функции А, то H(x)D(x)p(x) = const я(х). Теорема 1. Если обратимая цепь однофазна, то у функции есть толь- ко один локальный максимум, достигающийся на процедуре с D(y) = 1/2. Доказательство. Из лемм 5, 6 получаем: Н2 = const Я2, откуда Н = Н. Из невырожденности Р * получаем \DH = ХЛЯ и \D = №. Склады- вая уравнения^для Н и Н (= Я), получаем уравнение на р (= Я). Это озна- чает, что X + X = 1. Итак, D и D - константы, равные соответственно X и X. Доказательство теоремы завершается вариацией X. § 4. Структура ’’болота” Опишем теперь структуру болота в случае обратимых процедур и цепей. Введем обозначение рг Ж = {х: Зу, (х,у) ЕЖ} . Продолжим отношение (х, у) € Ж по транзитивности до отношения эквивалентности на множест- ве рг Ж . Классы эквивалентности назовем компонентами множества рг Ж (или просто компонентами). На множестве рг Ж введем отношение х($)» .У с е, принимающим значе- ния ± 1. Оно определяется тем, что О влечет х(-1)у; 2) х(е)у, у(Ь)г влечет х(б6)г. Данное отношение означает существование цепочки пар (xix2) (х2хз) ... ... (хлхл+1), где *1 = х, х = у, G Ж , а п нечетно при е = -1 и четно при 6 = 1. Компонента множества рг Ж называется сплошной, если *(-1)* для всех составляющих ее состояний х. Чтобы компонента была сплошной, достаточно, чтобы одно состояние а из нее удовлетворяло а(—1)а Тогда в силу обратимости цепи и все остальные состояния компо- ненты удовлетворяют этому отношению. Ядром множества рг Ж (и его компонент) называется множество тех его элементов х, для которых (х, у) G М влечет (х, у) € Ж . Обозначим ядро множества рг Ж через X. Процесс Р назовем медленным, если Р(х | х) >0 для всех состояний цепи. Цепи, моделирующие реальные системы, очевидно, все медленные. Если процесс Р медленный, то всякая компонента с непустым ядром сплош- ная. Действительно, если состояние а входит в ядро, то (я, a) G М в силу медленности Р и (а, а) G Ж в силу a G К. Следовательно, справедливо а(-1)а Слабым ядром множества рг Ж (и его компонент) называется множест- во тех его элементов х, для которых (х, у) G М влечет у е рг Ж . Трясиной назовем множество тех пар (х, у), входящих в болото, хотя бы один из элементов которых входит в ядро К. Обозначим трясину че- рез 0 . Ядро К и трясина 0 одновременно бывают пусты или не пусты. Замыканием ядра К называется множество всех состояний цепи, входящих в пары из трясины. Обозначим замыкание ядра через рг $5 . Множество с = рг ® - К назовем оболочкой ядра. 95
Назовем состояние х Е С крайним со стороны фазы А, если все пары (х, у) принадлежат либо трясине, либо фазе А и множества {у: (х, у) Е ®}, {у: (*> У) е А ) оба не пусты. Аналогично определяются состояния, край- ние со стороны фазы А, Оболочка ядра называется рыхлой, если не содер- жит крайних точек. § 5. Медленные процессы Далее рассматриваются медленные процессы, у которых Р(х|у) = = Р(у I х), т.е. обратимые процедуры. Процесс Р индуцирует процесс П, в котором состояниями служат пары состояний из, X, последовательно проходимые системой в процессе Р. Ве- роятности перехода в нем суть П((х, у) | (и, и)) = Р(х |у) 6уи, а прост- ранство состояний - М. Процессу R (см. § 2) будет соответствовать про- цесс к с ядром | (') = D($) П(£ | {'). С ним связано квазистационарное распределение pD(x, у), удовлетворяющее уравнению XPd = кР£>.Оно прос- то выражается через ttd: pD (х, у) = const R(x | у)яп(у). Лемма 7. Пусть процедура D - разделение. Тогда {(х.у): pD(x, у)>0} = А„ М . Лемма 8. Пусть процедура Do - разделение. Тогда х/х||я|| я(х)= VTH 1Г II я(х) на сплошных компонентах. (Здесь || • II - норма 12 и все, связанное с про- цедурой Do, дано в кратких обозначениях, см. § 3.) Доказательство. Так как оператор Р самосопряжен, X = IIR II. Справедливы равенства X(D) = ||*d ll = max|| WH/H/II > II II/II я II, и такие же равенства для D. Следовательно, Следовательно, A„I|*Z,H ||/^I| A(D) >---------z------• При D = Dq это неравенство обращается в равенство. Поэтому правая его часть вместе с левой имеют локальный максимум в точке Do, и г Э Э I <5) при всех (а, Ь) из болота. (D(a, b) - точное, но несколько громоздкое обозначение переменной, по которой берется производная.) Перепишем (5), используя явное выражение нормы, и продифференцируем. Получим _ Г я(а)яф)Х ||я || я(а)я(/>)Х||я|| 1 л 2Р(а | b)-------------------------------------= 0. L 11я|| ||я|| 1 Так как (a, b) Е Ж СМ, на 2Р(а | Ь) можно сократить и записать последнее 96
равенство как «р(д) = <р~1 (Ь) с <Р(х) = —--------. \/Х|| Я || Я(х) Если х(е)у, то <р(х) = </?с (у). Поэтому для состоянии х сплошных компо- нент <р(х)=1. Это и составляет утверждение леммы. Теорема 2. Пусть процедура D доставляет локальный максимум функции Л, X = рг И и все его компоненты сплошные. Тогда itD совпадает со стационарным распределением р процесса Р и A(D) = 1/4. Если же мак- симум, кроме того, и изолированный, то D(f) = 1/2. Доказательство. В силу леммы 8 получаем последовательно я = я, II я || = II я || и X = X. Поэтому, складывая уравнения Хя = и X™ = R*, получаем уравнение, определяющее р. Следовательно, я = я=риХ + Х = 1. Последнее дает X = X = 1/2 и A(D) = 1/4. Очевидно, что процедура D\x, у) = = (i?/2) + (1 - т?) D (х, у) при любом 1? G [0, 1] приводит к тому же значе- нию Л, что и D. Изолированность же максимума означает, что D и О* сов- падают, т.е. D(%) = 1/2. Замечание 3. В отличие от теоремы 1 равенство £>($) = 1/2 в теоре- ме 2 не утверждается без предложения об изолированности максимума. Оно, быть может, и не имеет без него места. Лемма 9. Пусть D - строгое разделение и все компоненты множества ргЖ сплошные. Тогда D(x, >0®Х/(Х + Х) для всех пар (х,у) изихтрясины. Доказательство. В силу леммы 8 распределения я и я пропор- циональны на рг М . Из Хя(х) = S Я(х|.у)я(у) и Хя(х) = S Л(х|^)я(у), у g ргШ у е ргЦ гдех^Я, поэтому следует (Х+Х)я(х) = S P(x\y)it(y) у G prtl для тех же х. Следовательно, процедура D\ совпадающая с D всюду, кроме тех (х, у), для которых х G К, когда D*(x, у) = Х/Х + X, порождает операто- ры R* и R' с теми же квазистационарными распределениями я и я и собст- венными значениями X и X, что и D. Процедуры ц£)' + (1 — т?) D при всех i? G [0, 1 ] дают одно и то же значение функции А. Из-за предположенной изолированности максимума процедуры D и D' полностью совпадают. Так как процедура D полностью обратима, лемма доказана полностью. Следствие 1.В условиях леммы 9 слабое ядро и (просто) ядро мно- жества рг И совпадают. Следствие 2. В условиях леммы 9 для всех пар (х, у) из трясины XD(x, y)=XD(x, у). Лемма 10. Пусть D - строгое разделение. Тогда оболочка сплошной компоненты не содержит состояний, крайних со стороны какой-либо фазы. До к а з а т е ль с т в о. Пусть точка а, крайняя со стороны фазы А, при- надлежит оболочке сплошной компоненты. Тогда Хя(а)= S Я(л|у)я(у)+ S Л(л|у)я(у), уек уех\к *7. А.Н. Четаев 97
где вторая (правая) сумма положительна. В первой сумме заменим я на я, используя лемму 8, и D на D, используя следствие 2. После этого первая сумма не изменится, если суммирование в ней распространить на все у G G рг 5(. Действительно, D(a, у)Р(а |у) > 0 возможно лишь, когда (а, у) G 6 0 . Тогда в силу леммы 9 первая сумма окажется пропорциональ- ной я(л). Множитель при этом будет таков, что, используя снова лемму 8, значение этой суммы преобразуется в Хя (а). Итак, вторая сумма оказыва- ется нулем. Это составляет противоречие, которое доказывает лемму. Установленные уже факты можно собрать в форме теоремы. Теорема 3. Пусть разделение D строгое, а процесс Р медленный. Тог- да либо трясина пуста, либо оболочка ядра рыхлая. § 6. Обобщешя Определение 1 построено для случая двухфазных цепей. Для общего случая естественно Определение 4. (П, к)-разделением пространства состояний на фазы называется семейство А, состоящее из к процедур Dt G П таких, что 1) SAG)^1; i 2) функция Л(Д) = ПХ(£\) достигает на Д локального максимума; I 3) ни у одной из функций Did) значения не заключены строго меж- ду 0 и 1. Если семейство Д — разделение, то фазой i называется множество = = {$: Л/($) =1)и для всякого у С {1, 2, ..., к} границей между фазами i G у называется множество 7 = { $: 0 < Df ($) < 1, i G у}.
ГЛАВА IX МОДЕЛИРОВАНИЕ НЕЙРОННОЙ ОРГАНИЗАЦИИ ДЫХАТЕЛЬНОГО ЦЕНТРА Целью моделирования какого-либо реального объекта является не толь- ко построение модели, наиболее близкой к нему во всех отношениях, но и построение моделей, выпукло демонстрирующих те или иные отдельные аспекты его организации и функционирования. Если система достаточно сложна, то полный набор информации о ней столь же необозрим, как и она сама, и ровным счетом ничего не даст нам, пока не будет организован так, что станет доступным для нашего целостного восприятия. Эту цель как раз и преследует настоящая глава. Выяснение структуры связей в нейронном генераторе периодического сигнала с минимальной флуктуацией периода используется потом для построения ’’нулевого приближения” модели дыха- тельного центра. Работы ИА. Ке дер-С те пановой и ее группы по физиологии дыхательного центра продолговатого мозга [18-26] содержат материал и общие пред- ставления, позволяющие всерьез заняться моделированием. Однако после первых попыток автора, упомянутых в [18]. стало ясно, что имевшийся уровень понимания происходящего в больших нейронных системах (сетях) недостаточен для нейронного моделирования дыхательного центра. С одной стороны, принципиальная возможность построения ’’нейронных генераторов” периодических колебаний была уже установлена в работах [11, 12, 31, 62]. С другой стороны, период колебания в схемах, выполнен- ных ’’натуральнее”, чем в упомянутых работах, не поддерживается строго, а флуктуирует. Величина флуктуации никем специально не исследовалась, но соображения В.Л. Дунин-Барковского и В.С. Якобсона [16] говорят о том, что она может быть значительной. Учитывая подобные соображения, в беседах И.А. Кедер-Степановой, В.А. Пономарева, В.Л. Дунин-Барковско- го и автора сложилось решение оставить на время частное, так сказать, моделирование дыхательного центра и заняться выяснением общих свойств сетевых конструкций. На пути исследования общих свойств сетей из возбудимых элементов недавно получен результат, имеющий прямое отношение к моделированию дыхательного центра [46]. Он состоит в выяснении принципа организации системы, обеспечивающей наименьшие из возможных при определенных ограничениях флуктуации периода. Сопоставлению этого принципа с данны- ми ИА'Ке дер-Степанов ой посвящена настоящая глава. § 1. Детерминированность поведения сети Рассмотрим генератор периодического сигнала f(t). Пусть сигнал сину- соидальный. Тогда запись f(t) = А sincor содержит в себе все, что можно знать о сигнале. 7* 99
Рассмотрим чуть более сложную ситуацию. Пусть наш генератор дает сигнал, сложенный с шумом. Тогда /(/) - не синусоида. В описании теперь необходимо указывать не только ’’закономерную” составляющую, но и оценку шума. Например, знать среднее значение величины [f(t)-Л sin со/]2. Пусть нам теперь дан ’’шумящий” генератор некоторого неизвестного периодического сигнала и требуется найти величину его шума. Для этого нам придется искать, например, минимум среднего значения [/ (г) - F (г) ]2, взятый по всем периодическим функциям времени F(r). Усложняя далее задачу, мы приходим к вопросу об измерении стохасти- ческой и детерминированной ’’компонент” в активности некоторой вероят- ностной системы, о которой нам не сообщено, что есть каждая из них. Такого рода задачам в значительной мере посвящена теория информации [57]. Сейчас мы дадим еще одно определение для этого же случая. Пусть в сети из п возбудимых элементов У5(г) = 1 означает, что эле- мент s возбужден в момент t. Все остальное время Vs(t) = 0. Пусть вероят- ность Pr {Vs (t + 1) = 1) зависит только от набора x(t) = { И (f), (г),... ..„ Уп (0 } , и есть функция Нам нужно ввести меру случайности (и дополнительно детерминированности), с которой набор x(t) определяет набор x(t + 1) (см. также гл. II, § 3, п. 4). Пусть х, х - два набора. Хемминговским расстоянием между ними hg(x, х) называется [57] число мест, на которых в них стоят разные числа. Возьмем состояние сети x(t) и пары наборов х',х", понимаемые как воз- можные состояния в следующий момент времени, и определим Hg(x)= S h%(x,x')P(x7x)P(x'7x), Z. х" где Р(х7х)= П [И^(х) + (1 - и;)(1 -^(х))]. S Если обозначить через р(х) финальную вероятность состояния х сети S2, то среднему Hg(Q)= S Hg(x)p(x) .V можно приписать смысл меры случайности поведения сети. § 2. Сети на окружности Теперь в терминах величины Hg(Q) мы по-новому изложим результат работы [46]. Он касается сетей из линейных возбудимых элементов, т.е. таких, у которых Рг {М'+1)= О = 0+ 2 ask к Здесь числа ask суть веса связей, =0. Матрица llaJjk II, задающая сеть, обозначается через £2. Рассмотрим сети со связями обоих знаков и разложим матрицу Q в сумму двух: с неотрицательными элементами и Г2_ с неположительны- ми элементами. Пусть матрица £2+ содержит в каждой строке и каждом 100
столбце только один ненулевой элемент, равный а. Элементы сети зануме- руем так, чтобы возбуждающие связи шли в циклическом порядке. При этом очевидный смысл приобретают слова о том, что наша сеть есть сеть на окружности. На элементы матрицы наложим условия = (s = 1’2’ Тогда при четном п экстремальной будет сеть, у которой каждый элемент испускает ровно одну тормозную связь и связи, идущие от одного элемента (тормозная и возбуждающая), направлены к ’’центрально симметричным” элементам. Сеть с наименьшим значением Hg(£2), очевидно, та, которая наиболее детерминированно делает ” то, что она делает”. Выясним, что же она делает. Состояние сети у нас задается вектором (набор х). Перейдем к более простому описанию. Представим сеть расположенной на комплексной плоскости так, что элемент s лежит в точке es9 где I е I = 1, Arge = 2я/л. Если элемент $ возбужден, будем считать, что в соответствующей точке помещена единичная масса. Центр тяжести масс, отвечающих состоянию х, обозначим z (х). Рассмотрим сети на окружности в следующем смысле. Потребуем, чтобы ask было равно а($ — к) при некоторой периодической с периодом п функ- ции а(£). Тогда математическое ожидание z (х(1)) при заданном z (х(0)) записывается формулой п - 1 Mz(l)=z(0)S = &z(Q). i= О Из естественного условия 0 < Pr { Vs (t) = 1 } < 1 следует 10 I < 1. Поэтому Mz (г) ->0 при t -►«>. Это вовсе не означает, что z(r) ->0, так как мы имеем дело только с математическими ожиданиями. Для предела lim M|z(r)|2=S |z(x)|2p(x) = W мы получим, разумеется, значение, отличное от нуля. Очевидно, ArgMz(r) = t Arg0 + Argz(O). Иными словами, вектор z(r) с точностью до случайных отклонений детерминированно вращается с постоянной угловой скоростью. Рассмотрим I 0 I и Arg0 как функции а($)- Наложим на веса связей условия п - 1 п - 1 S а+(/)=а, S <*_(/)= ij. (1) /=о /=о Тогда максимум 101 достигается у сети, описанной выше, причем 101/f1 1а(/)|. (2) i =0 Как показано в [46], тогда же достигается и максимум величины W, если на а+ наложено дополнительное условие (/) = «51 /. Поэтому естественна следующая гипотеза. 101
Гипотеза. В классе сетей, стесненных условиями (1), максимум Щ максимум I 0 I и минимум Hg достигаются одновременно. Заметим, что 0 есть собственное число матрицы П. Когда имеет место (2), оно может быть определно как собственное число с наибольшим модулем при условии, что он меньше единицы. Для произвольной матри- цы П модуль собственного числа, удовлетворяющего такому условию, обозначим через 0 (П). Гипотеза. В классе сетей с данной суммой весов возбуждающих связей и данной суммой весов тормозных связей максимум 0(П) и мини- мум Hg (О) достигаются одновременно. § 3. Дисперсия периода колебаний Естественно предположить, что у сетей на окружности периодический процесс с периодом,# близким к максимальному значению (2), протекает почти с таким же ’’размыванием”, как у сети экстремальной. Поэтому интересно представить возможности изменения периода колебаний при незначительной потере его стабильности. Рассмотрим сеть экстремальную и еще две с ненулевыми весами, запи- санными в следующих двух строках: а / п \ «(О = а(-О = — , «(--)“ п; 2 \ 2 / а / п \ а(1) =а(2) = а(3)= - , <^-+2^ = 7?. Периоды в этих сетях равны соответственно л, 00, /?/2. Таким образом, мы можем менять период около значения Т = п, почти не меняя 101. Следова- тельно, нужно ожидать, что дисперсия фазы z(t) как функция времени будет для всех периодов примерно одной и той же: 10% отличия дисперсии при 2—3-кратном отличии периода. Относительно абсолютного значения дисперсии фазы вряд ли можно сказать что-нибудь определенное, исходя из линейной модели. Основной ее результат - свойство экстремальности. Оно, видимо, переносится на сети из других элементов. Аргументы, приведенные в свое время В.Л. Дунин- Барковским и В.С. Якобсоном [16] и указывавшие на большое ожидаемое значение дисперсии фазы, были интерполяцией результатов о сетях со связями типа ’’все на всех”. Теперь же известно [46, 50], что эти сети далеко отстоят от сетей с экстремальными свойствами типа рассмотренных выше. Поэтому можно надеяться, что модели генераторов, построенных по экстремальной схеме, будут достаточно стабильны. § 4. Гипотеза об архитектуре связей дыхательного центра Перейдем к сопоставлению построенной выше экстремальной сети с данными о нейронной организации дыхательного центра. В работе [23] дыхательные нейроны продолговатого мозга систематизи- рованы в виде однопараметрического семейства. Параметризация состоит в следующем. Внешнее дыхание рассматривается как строго периодический 102
процесс и относительно него определяется фаза ф (0 < ф < 2 п). В начале вдоха ф = 0. С каждым нейроном (в данных условиях) связана функция v fa, Ф), равная средней частоте импульсации нейрона в фазе ф. Параметр есть параметр нейрона в систематизации. Его значение определяется так: 2 я <р = Arg/ pfa, ф)е'* с1ф, о т.е. по v fa, ф) для данного нейрона вычисляется его параметр. В настоящее время эта система параметризации принята большинством отечественных физиологов [37]. Параметризация фазовым параметром эквивалентна расположению дыхательных нейронов на окружности. Существенно то обстоятельство, что это расположение не зависит от состояния препарата, в котором были измерены функции pfa, ф), т.е. оно может весьма надежно по- ниматься как действительное свойство системы, а не как произвол сис- тематизатора. Расположение нейронов на окружности согласуется с их активностью точно так же, как у элементов рассмотренной модели. Именно, при увели- чении параметра мы переходим к нейрону, в среднем активному в более поздние фазы дыхательного цикла. Совпадение ’’внешних” описаний дыхательного центра и экстремальной сети приводит нас к гипотезе о совпадении архитектуры связей в этих системах. Разумеется, здесь нет буквального совпадения. Например, экст- ремальная сеть инвариантна относительно вращений окружности, а дыхатель- ные нейроны отличаются даже по активностям больше,’чем просто сдвигом по фазе. Поэтому относительно архитектуры связей в дыхательном центре можно предполагать только существование возбуждающих связей между нейронами с близкими значениями параметра и тормозных между нейро- нами ’’центрально симметричными”. По существу сформулированные принципы организации выполняются в моделях [11, 12, 31, 62] и последующих за ними работах, ссылки на кото- рые можно найти в [37, 59]. Поэтому мы не претендуем на анонсирование гипотезы о знаках связей внутри дыхательного центра, а только объясняем смысл такой организации, как обеспечивающей точное поддержание перио- да. При этом мы настаиваем на естественности непрерывного ’’спектра” нейронов в их расположении по фазам § 5. Круговая модель дыхательного центра Далее мы подробно рассматриваем модель, названную выше круговой. Круговая модель понимается как ’’нулевое приближение”. Она интересна тем, что допускает достаточно полное аналитическое исследование. Его результаты позволяют составить качественное представление о поведении более сложных моделей и дают оценки ряда их параметров. Эти оценки в свою очередь упрощают подбор параметров, неизбежный при моделирова- нии на ЦВМ. Следует отметить, что принцип построения моделей, основанный на рассмотрении замкнутых нейронных сетей с возбуждающими и тормозны- ми связями, использовался рядом авторов для объяснения механизмов 103
возникновения ритмических колебаний в живых системах и, в частности, в дыхательном центре [12,31, 36,59,64-66]. Основная величина в модели — функция До, г) - описывает среднюю мгно- венную частоту импульсации (в момент г) группы нейронов, имеющих в классификации дыхательных нейронов параметр а. Группы мыслятся рас- положенными на окружности и параметризуются углом, т.е. О < а < 2я. Разумеется, рассматриваемые функции принимают только неотрицательные значения. Суммарный, внешний по отношению к группе нейронов с параметром а сигнал в момент t обозначается через (a, t). Величина Х(а, г) изменяется во времени в силу уравнения dX(a, г) ---у—1 =ФМ<М),Х(а,г)), (3) at где Ф(^,Х)= (°’ *<*=0; (4) I у — аХ во всех прочих случаях и а > 0. Эти уравнения означают, что (при каждом а) X экспоненциально стремится к всегда, кроме случая у < Х= 0, когда X остается нулем. Взаимодействия групп нейронов введены в модели заданием через X: 2 1Г ^(ct,t) = c + b f cos(a-0-0)jr(0,r)d0. (5) о Здесь b и с - неотрицательные константы модели, с можно понимать как сигнал, общий для всех групп и внешний для всей модели, а число cos (а — 0 - 0) - как вес связи, идущей от группы 0 (в целом) к группе а. Число 0 есть параметр модели. При 0=0 всякая группа посылает наиболее сильные возбуждающие связи к ближайшим к ней на окружности нейро- нам, а тормозные - к ’’диаметрально противоположным”. При 0^0 рас- пределение связей сдвигается на угол 0, но области наиболее сильных тор- мозных и возбуждающих связей, исходящих от данной группы, остаются центрально симметричными (аналогичная организация связей рассматри- валась в [24]). Легко видеть, что получившаяся конструкция в целом инвариантна от- носительно вращения окружности. Замена переменных т -act, Y = 0Х сводит модель с параметрами а, Ь, с,0 к модели с параметрами а = с = 1, b' = bfa, 0' = 0. Поэтому с матема- тической точки зрения достаточно рассмотреть случай с а = с = 1 и произ- вольными b и 0. Если параметрам а, Ь, с, 0 будет придан конкретный физиологический смысл и будет рассматриваться зависимость поведения модели от них, тогда нетрудно будет результаты для случая а = с = 1 пере- осмыслить и для общего. § 6. Уравнения активности Формулы (3), (4), (5) вместе составляют одно интегро-дифференциаль- ное уравнение относительно функции Х(а, t). Так как при каждом t функ- ция Х(а, t) как функция а изображает распределение активности нейронов 104
в нашей модели (это, собственно, нас и интересует), полученное уравнение естественно понимать как задающее изменение во времени распределения активности, т.е. как обыкновенное дифференциальное уравнение в некото- ром банаховом пространстве. В качестве распределения активности, как было сказано, может рассматриваться любая неотрицательная интегрируе- мая функция Х(а). В силу особого вида нелинейности функции Ф (см. (4)) удобно выделить множество строго положительных функций Х(а). Это множество мы назовем областью линейности, так как в ней (3) — (5) сво- дится к линейному уравнению dX(a9t) ** ----\+b f cos(a-0-0)X(0,r)d0-X(ot,r). dt о Разложим (при каждом г) функциюX(а,г) в сумму трех:Х(а, г) = У(а,г) + + Л/(г) cosa + /V(r) sin а. Здесь (при каждом г) первое слагаемое ортого- нально каждому из двух остальных, а второе и третье суть проекции X(a, г) на cos а и sin a. Нетрудно проверить, что в линейной области уравнение (6) распадается на уравнение для У (а, /) и независимую от него систему для M(t) (6) dY (а91) —7— =i-y(a,O; dr dM —— = (nbcosO - 1) M - Ordsin0)2V, dN = (irbsinO)M + (irbcosO - 1) N. (7) § 7. Основные свойства решений уравнений активности Для модели (3)- (5) нам нужно найти условия на параметры b и 0 , при которых единственным устойчивым режимом будет периодический, в об- ласть притяжения которого входят все распределения (неотрицательные Х(а)). Только в этом случае наша конструкция может рассматриваться как модель генератора периодики. При этом необходимы следующие два условия: Г. Все стационарные режимы Х(а9 t) = х(а) в модели неустойчивы. 2°. Все решения X(a, г) ограничены при г -*00. Ниже мы укажем ограничения на b и в, обеспечивающие выполнение условии 1,2. В линейной области уравнение (3) имеет стационарное решение X(a9t) = 1. (8) Утверждение 1. Если 0 =# 0, то решение (8) - единственное ста- ционарное решение уравнения (3). Доказательство. Пусть X (a, г) = х (а) есть стационарное реше- ние, не совпадающее с (8). В силу (3), (4) и предложения а = с = 1, если 105
x (a) > 0, то х (a) = ф (a). В силу (5) ^(a) =1 + bR cos (a - 6 - 7), где 7 = = arccos (M/R), R 2 = hfi + N2 > 0. Следовательно, x (a) и (a) достигают максимума при a = 0 + 7. С другой стороны, непосредственно из (5) видно, что (а) достигает максимума в точкеа= «о, для которой cos (a0 — Д — 0 ) = = cos (0 — 0 — 7) при всех р. Отсюда мы получаем 0 = 0, что противоречит предложению О Ф 0. Утверждение доказано. Обычными методами устанавливается Утверждение 2. Для неустойчивости решения (8) достаточно вы- полнения неравенства яд cos 0 > 1. (9) Следствие. Если 0 # 0, ттЬ cos 0 > 1, то решение X (a, г) = 1 есть единственный стационарный режим в модели и он неустойчив. Найдем условие на параметры b и 0, которое обеспечивает ограничен- ность при t -►«> всех решений уравнения (3)-(5). Из (5) следует: я/2 тах<р(о, 1J cosada • тах Х(0, 7\ <г< Т2» а -я/2 0 а при достаточно большом (для каждого решения своем) из (3) сле- дует шах Х(а, г)<тах О» Т\ <t< Т2. Поэтому при достаточно боль- at а ших t : х(г), ^)< —— (Ю) 1 — 20 Итак, доказано Утверждение 3. При t -+<*> все решения уравнения (3) — (5) огра- ничены, если b < 1/2. Неравенства (9), (10) вместе дают неравенство на 0 : cos 0 > 2/я. Замечание. Так как оценка (10) получена грубым способом, усло- вие b < 1/2 гарантирует ограниченность решений с некоторым ’’запасом” и, вообще говоря, может быть ослаблено. Например, необосновываемое здесь соображение о том, что ограниченность решений при данном b и 0 = 0 гарантирует ограниченность при том же b и любом 0 , дает вместо неравенст- ва b < 1/2 неравенство b < 2/я, а вместо 2/я < cos 0 - неравенство |0|<я/3. § 8. Режим бегущей волны В области линейности интегро-дифференциальное уравнение (3), (4), (5) преобразуется в уравнение для У (о, г) и систему двух обыкновенных уравнений. Мы думаем, что это справедливо для всех распределений. Су- ществует двумерное многообразие, на котором лежат все ограниченные при t G (-°°, 00) решения. Это составляет гипотезу, которая остается недока- занной. Однако дальнейший анализ основывается в основном на ней. При справедливости гипотезы справедливо Утверждение 4. Всякое периодическое решение уравнения (3)- (5) имеет вид ’’бегущей” волны Х(а, r)= х(а —соГ). (11) 106
Таблица 1 ь | 9 = 10° | I 20° I 30° J 40° 34,6 16,4 10,2 7,2 0,45 25,6 12,9 8,9 6,9 П 34,2 15,9 9,7 6,7 20,9 10,6 7,3 5,7 Схема доказательства. Как было сказано, уравнение (3)- (5) инвариантно относительно вращения окружности, т.е. замены а = = а + a0(mod 2я). Поэтому периодическое решение, не имеющее вида (11), входило бы в семейство несовпадающих предельных циклов, зависящих от поворота окружности как от параметра. Однако таких семейств у двумер- ных систем быть не может. Единственность периодического решения предельного цикла нами не установлена, но, судя по всему, она имеет место. Заметим, что единствен- ность периодического решения гарантирует его устойчивость. Исследуем период бегущей волны. Рассмотрим вырожденный случай, когда бегущая волна бежит в линейной области (см. [54]). Тогда имеется целое семейство волн вида Х(а, г) = 1 + rjy(a - с*я), где т? - параметр се- мейства. Все волны устойчивы, но не асимптотически. Этот случай предста- вится, если nb cos 0 =1. Тогда, как это видно из системы (8) для функ- ций М hjV, W „ 2 cj =---- , Т =------. 2я b sin О Отсюда видно, что для всякого w, 0 < со < °°, найдется 0 нЬ= (я cos 0 )"', при которых в модели волна будет бежать с данной круговой частотой со. Формула (12) дает неплохое приближение и для волн, бегущих вне области линейности. В приводимой таблице 1 в каждой клетке верхняя цифра получена при моделировании системы на ЦВМ, а нижняя - из фор- мулы (12). (12) § 9. Круговая модель дыхательного центра с окнами Теперь мы сделаем следующий шаг, описав результаты исследования на ЭЦВМ более точной модели. В ней, как и в модели нулевого приближе- ния, дыхательный центр (точнее, та зона дыхательного центра, где генери- руется ритмика) представляет собой однопараметржеское семейство групп нейронов, характеризующихся распределением активности по фазам дыха- тельного цикла (имеется в виду средняя активность нейронов группы или активность группы в целом). Импульсная активность отдельных нейронов в модели не рассматри- вается. Активность (средняя частота импульсации) одной группы нейронов с параметром а в момент t обозначается через Х(а, г). В модели нулевого 107
Рис. 1. Организация связей между группами нейронов: а, б, в, г - в модели без окон, д, е, ж, з, и, к - в модели с окнами.
приближения поведение X (a, t) описывается уравнением dX 2я —-=Ф(с+* / cos(a-0-0)X(/U) (13) at о Здесь 10, если i < т? = 0; Фа,п)=к I? - ат) - во всех прочих случаях. Параметр a G [0, 2 я] имеет математический смысл угла, число cos (а - 0 - 0 ) - смысл веса связи, идущей от группы с параметром 0 к группе с параметром о. Параметр с моделирует некоторый (пока постоян- ный) внешний приток импульсации, а параметр b можно интерпретировать как чувствительность группы нейронов или как коэффициент усиления суммарного сигнала, приходящего от других групп. Параметр 0 характе- ризует асимметрию связей между группами (0 >0). Предполагается, что все группы связаны между собой, причем геометрия связей одной группы с остальными одинакова для всех групп. Сила связей между группами меняется по закону косинуса. Если нет асимметрии связей (0 = 0), каждая группа сильнее всего возбуждает своих ближайших соседей (как слева, так и справа), по мере удаления эта связь ослабевает. С груп- пами, расположенными на расстоянии ±я/4, вес связи равен нулю, а с ней- ронами другой половины окружности рассматриваемая группа образует тормозные связи, причем максимальная отрицательная связь приходится на долю диаметрально противоположной группы. При моделировании на ЭЦВМ конструкция (13) заменяется дискретной по а и Г: 2кк ак =----- , к = 1,2,... ,7V, N где N — число групп нейронов. Интеграл в первом аргументе Ф заменяется суммой, а дифференциаль- ное уравнение для каждой группы — разностным. Геометрия связей для произвольно выбранной группы показана на рис. 1, а, б. На рис. 1, а изображены связи, приводящие к группе о,*, на рис. 1,6 — исходящие от нее. Внутри окружности показаны отрицательные (тормозные) связи, снаружи - положительные (возбуждающие). Оси на рисунках проходят через группы, вес связи с которыми равен нулю. Связи с максимальным весом (и возбуждающие, и тормозные) обозначены вол- нистыми линиями. Общее число групп N = 32. Характерно, что при 0=0 для произвольных а, и ц вес связи, идущей от группы ц к оу, равен весу связи, идущей от ц к ц (рис. 1, а, б). Если 0 ¥= 0 (рис. 1, в, г), то группа с параметром о,- сильнее других воз- буждает группу, находящуюся от нее на расстоянии 0, т.е. группу с парамет- ром + 0 , и тормозит группу ctf + 0 + я. В то же время максимальная возбуждающая связь приходит к ней от группы с^.— 0 , а максимальная тор- мозная — от группы Щ — 0 + я. 4 Отметим, что наличие в системе асимметрии связей (0 # 0) приводит к тому, что веса связей между двумя группами могут не совпадать не только 109
по величине, но и по знаку, т.е. группа а< может возбуждать а группа otic - тормозить Of (рис. 1, в, г). Однако, поскольку параметр 0одинаков для всех групп, они остаются равноправными, иначе говоря, модель инва- риантна относительно вращения окружности. Система из N дифференциальных уравнений была решена на ЭЦВМ методом Рунге - Кутта. Решение представляет собой совокупность N функций, описывающих распределение средней мгновенной частоты им пульсации каждой группы нейронов по фазам дыхательного цикла. В каж- дый момент времени существует группа нейронов, которая возбуждена сильнее других. В течение дыхательного цикла максимум возбуждения пе- ремещается последовательно от одной группы к другой. Время, необходи- мое для того, чтобы волна возбуждения сделала полный оборот, равно длительности дыхательного цикла. На рис. 2, а приведено изменение активности групп нейронов в течение дыхательного цикла (а = я/4, а = с 3 1, b = 0,55). Из рисунка следует, что кривые отличаются друг от друга лишь сдвигом по времени. &9 <*25 в) Рис. 2. Распределение активности дыхательных нейронов по фазам дыхательного цик- ла: а - в модели без окон, б - в экспериментах на животных (толстая линия по оси абсцисс - длительность активности диафрагмы), в - в модели с окнами. 110
Если рассмотреть кривые активности нейронов дыхательного центра, полученные в экспериментах на животных [21], то мы увидим картину, схематически изображенную на рис. 2, б. По распределению своей актив- ности нейроны четко распадаются на два класса - инспираторные и экспира- торные. Каждый из классов составляет непрерывное однопараметрическое семейство, и они не перекрываются. Так, например, в дыхательном центре продолговатого мозга нет нейронов с максимумом активности на отрез- ках АВ и CD. Отсутствие нейронов промежуточных типов наводит на мысль о неслож- ной модификации круговой модели путем изъятия из нее двух зон нейро- нов. Исключим из модели группы с параметрами 0 < а < 7 и п<а<л + 7. Осуществим это, сделав коэффициенты b и с функциями а и положив их нулями на указанных отрезках. Тогда для этих а величины Х(а, г) будут постоянно нулями. Назовем области выброшенных нейронов ’’окнами”. Появление окон приводит к тому, что суммарный вес связей, приходящих к группе а, бу- дет зависеть от а. Пусть система состоит по-прежнему из 32 групп нейронов. Выбросим несколько из них (например, 14), образовав два симметричных и одина- ковых по размерам окна, и пронумеруем оставшиеся группы. На рис. 1,д-к представлены связи трех групп нейронов (аь а5, а9) при том же значении 0 = я/4. Из рис. 1, д, и видно, что у группы otj отсутствуют сильные связи и сохраняются слабые, а у группы а9 - наоборот. Это значит, что суммарный вес связей, приходящих к группе at, будет меньше, чем у группы а9. Введем нормирующий множитель о (а) в виде коэффициента перед ин- тегралом в уравнении (13), выравнивающий суммарные веса связей 2ir f I cos 0| dp a(a) =------------------------------------------ . я 2ir f I cos (a - 0 - 0)1 dp + f 1 cos (a - 0- 0)| d0 0 ir+т Для расчетов на машине эта формула, как и предыдущие, была преобра- зована в дискретную форму. Теперь посмотрим, каким образом окна влияют на геометрию связей между группами. Хотя чйсло связей у каждой из оставшихся групп уменьшается, оно остается одним и тем же для всех групп. Распределение связей отдельных групп (как приходящих, так и исходящих) становится различным. Так, у группы Oi нет возбуждающих ее связей с ближайшими соседними груп- пами слева, так как слева находится окно (рис. 1, д), а у группы они сохранились (рис. 1, ж). При этом нужно учесть, что группы возбуждают- ся последовательно одна за другой (рис. 2, а), поэтому момент ’’включе- ния” группы определяется соседями слева, а соседи справа могут только поддерживать ее активность. Сравнивая преходящие и исходящие связи групп Qi, а5 и а9 (рис. 1, d-к), можно заметить, что группы afi и а9 обра- зуют два рода связей: а) взаимно возбуждающие и взаимно тормозящие; 111
б) на приходящую тормозную связь они отвечают возбуждающей, а на воз- буждающую — тормозной связью. Группа ots возбуждает только те группы, которые возбуждают ее, и тормозит только те, которые ее тормозят, т.е. второй вид связей у нее отсутствует. Таким образом, с появлением окон группы в системе стано- вятся неравнозначными, что должно сказываться на распределении их активности по фазам дыхательного цикла. На рис. 2, в приведены кривые распределения активности групп нейро- нов по фазам дыхательного цикла в случае, когда из 32 групп К выбро- шено, 0 = 40°, а = с = 1, b = 0,55. Из рисунка следует, что, во-первых, вся совокупность групп нейронов распадается на два класса; группы, начи- ная с Qi и кончая 09, входят в один класс, симметричные им группы (от Oi 7 до о2 $) образуют другой класс. Во-вторых, наблюдается перераспределение активности среди групп одного класса. Если раньше все характеристики групп нейронов отлича- лись друг от друга только сдвигом по времени, то теперь очевидны их раз- личия по форме и амплитуде. Группы, расположенные сразу после окон, начинают работать в то время, когда максимальной активности достигают нейроны противоположного класса. Кроме того, они отличаются меньшей по сравнению с остальными максимальной частотой импульсации. Работу группы Qi можно объяснить, пользуясь рис. 1, д, е. Видно, что ее возбуждают четыре группы нейронов противоположного класса, поэтому она начинает работать, когда они сильно возбуждены. Начав работать, груп- па at затормаживает их и возбуждает все группы своего класса. Некоторое время ее активность поддерживают соседние с ней группы, однако среди ’’своих” есть такие группы, которые ее тормозят (например, а9). Поэтому активность группы at быстро гаснет. Те группы, возбуждающие связи к которым приходят от групп своего класса (например, а5 и а9), начинают работать несколько позже и их мак- симальная активность больше, так как тормозят их только группы проти- воположного класса. Следует отметить, что отлжие характеристик отдельных групп обуслов- лено изменением структуры связей между ними. Перераспределение актив- ности групп нейронов в модели с окнами говорит о неравнозначности групп в такой системе, а это в свою очередь может привести к тому, что их функ- циональный вклад в ритмогенез окажется различным.
ГЛАВА X О РАЗМЕРНОСТИ АТТРАКТОРОВ ДЛЯ ОДНОГО КЛАССА ДИССИПАТИВНЫХ СИСТЕМ В главе оценивается хаусдорфова размерность глобального притягиваю- щего множества в многомерной задаче преследования через размерность преследуемого многообразия. Кроме того, доказан общий результат об оценке сверху хаусдорфовой и энтропийной размерностей аттрактора для одного широкого класса диссипативных систем. § 1. Постановка задачи. Аттракторы и размерность Многомерная задача преследования возникает в теории больших биоло- гических систем, в частности при моделировании дыхательного центра [46, 47, 54]. Мотивировка этой задачи содержится в предыдущей главе. Формальная постановка задачи состоит в следующем. Пусть - евклидово пространство, А С RN - компактное и-мерное многообразие, может быть, с краем, f — С1 - гладкое отображение R*-> А. Динамическая система х=/(х)-х (1) называется многомерной задачей преследования. Название объясняется тем, что точка х(г), движущаяся по фазовой кривой, в каждый момент времени преследует свою ”тень”/(х(г)) на мно- гообразии А. Оказывается, что все решения системы (1) притягиваются к некоторому компактному множеству - аттрактору. Сложность ’’установившихся ре- жимов” в системе (1) естественно характеризовать размерностью аттракто ра. Основным результатом главы является оценка сверху для размерности аттрактора, зависящая только от п (размерности многообразия — цели) и от константы Липшица отображения f и не зависящая от размерности N фазового пространства. Аналогичный результат получен для широкого класса так называемых слабо сжимающих систем. К числу таких систем относятся, помимо многомерной задачи преследования, галеркинские при- ближения разладных эволюционных уравнений, в частности уравнение Навье - Стокса на двумерном торе. Структура притягивающих множеств для системы (1) может быть столь же патологической, как и для самых общих динамических систем. Действительно, рассмотрим произвольную систему х = v (х), х G RW, имеющую поглощающий шар В. Ее можно модифицировать вне шара В так, что она превратится в систему вида (1). Для этого в шаре В положим: f (х) = v (х) + х; пусть А = / (В). Отображение/гладко продолжим до ото- s. А.Н. Четаев 113
бражения R7V -► Л и рассмотрим соответствующую систему (1). В шаре В эта система совпадает с исходной. Тем самым патологии, которые могут встретиться в произвольных динамических системах с поглощающим ша- ром, появляются и в многомерной задаче преследования. Итак, аттрактор системы (1) может не быть многообразием и не иметь размерности в классическом смысле. Существуют разные определения раз- мерности, применимые к любому (или любому компактному) подмно- жеству евклидова пространства: топологическая (или индуктивная, вве- денная ПС. Урысоном), метрическая (или хаусдорфова) и энтропийная (введенная JIC. Понтрягиным и Л.Г. Шнирельманом и названная ими ’Метрический порядок компакта”). Отвлечемся на время от точных опре- делений. С точки зрения физических приложений желательно выбрать такое определение размерности, которое для любого компакта X, принадлежаще- го Ryv, позволяло бы, зная размерность X, оценить сверху число парамет- ров, однозначно задающих положение точки на X. При этом R^v интерпре- тируется как фазовое пространство физического процесса, и параметры — как функции на всем R . Тем самым размерность должна характеризовать не только внутренние свойства множества X, но и расположение X в R^ Сузим проблему, рассматривая в качестве параметров только координатные функции X/ на пространстве R^; получим следующую формулировку: Какова минимальная размерность плоскости общего положения, на которую множество X проектируется взаимно однозначно? Ответ должен быть выражен через размерность X и зависит от того, в каком смысле понимается эта размерность. Если X — гладкое много- образие, все перечисленные выше размерности совпадают с классической. В этом случае ответ дает Лемма Уитни [44]. Гладкое многообразие размерности л, вложен- ное в , гомеоморфно проектируется на плоскость общего положения размерности 2п + 1. Эта лемма остается справедливой, если многообразие размерности п заменить на компакт энтропийной размерности п. Для компакта топологи- ческой размерности п лемма Уитни очевидным образом неверна. Например, множество всех точек числового пространства R\ имеющих только ирра- циональные координаты, имеет топологическую размерность нуль и тем не менее не проектируется взаимно однозначно ни на какую гиперплоскость. Интересно выяснить, верна ли лемма Уитни для множеств хаусдорфовой размерности п. Заметим еще, что при численных оценках размерности странных аттрак- торов (такие оценки сделались в последнее время весьма многочисленны- ми) речь идет, как правило, именно об энтропийной размерности. Ниже мы дадим одновременную оценку хаусдорфовой и энтропийной размерностей аттракторов слабо сжимающих систем. § 2. Формулировка результатов Определение. Система х = и(х), xGR^ (2) в евклидовом фазовом пространстве называется слабо сжимающей, если 114
1) она имеет поглощающую область В с компактным замыкани- ем в которую за положительное время попадают все фазовые кривые сис- темы; 2) div v < 0 в В. Системы, удовлетворяющие требованию 1), часто называют диссипа- тивными. Пусть собственные значения квадратичной формы (и*(х)£, £), и** = = (dvi/bxj\ хЕВ, $ G ТХВ, равны Xj (х) > .. . > XN (х). Определение. Система (2) называется слабо сжимающей с кон- стантами (X, а, п) (X - вещественное, а - положительное, п - натураль- ное) , если она удовлетворяет требованиям 1) и 2) предыдущего опреде- ления, и для всех х из В (х) < X, Х„ +1 < -а. Определения хаусдорфовой и энтропийной размерностей приведе- ны в § 3. Теорема 1. Слабо сжимающая динамическая система с константами (X, а, п) имеет глобальное притягивающее множество, хаусдорфова и энтро- пийная размерности которого не превосходят величины С(\сцп)\ С(\сцп)< 16и(Х + а)(Х + 5а)а"2, р) С(Х, а и) < 4и X2 (1 + ф(X)) а’2, где ф(Х)->0 при X Теорема 2. Система (1) в любом шаре В D ^является слабо сжимаю- щей с константами (L - 1, 1, л), где L = LipB f. Для хаусдорфовой размерности dimНМ аттрактора М эту оценку удается улучшить; если Xi(x) + ... + X* (х) <0 для всех х G В, то <k\ для системы (1) это дает оценку dim//Л/ < £л. Родственный результат, но без количественной оценки, получен в работе [61 ]. Следствие. Система (1) имеет глобально притягивающее множест- во, хаусдорфова и энтропийная размерности которого не превосходят величины C(L - 1, 1, л); в частности, C(L - 1, 1,л)< 16л£(£ + 4). Многомерная задача преследования весьма специфична; есть надежда, что размерность аттрактора в этой задаче оценивается лучше, чем для общих слабо сжимающих систем. Гипотеза. Хаусдорфова размерность dimHM аттрактора М в много- мерной задаче преследования оценивается сверху константой, зависящей только от размерности п ’’преследуемого” многообразия и не зависящей от константы Липшица отображения f. Может быть, <Кп для некото- рого К> 0. Учениками В.И. Арнольда построены примеры многомерной задачи пре- следования, в которых аттрактор содержит область пространства R , а размерность преследуемого многообразия равна 2lsN (Д.Н. Бернштейн) и (В.А. Васильев). Тем самым в предыдущей гипотезе К > 2. Линейная замена времени t9 = at превращает систему слабо сжимающую с константами (X, а, п) в аналогичную систему с константами (Х/а, 1, л). Поэтому ниже рассматривается только случай а = 1. 8* 115
§ 3. Хаусдррфова и энтропийная размерности Обе размерности определены для любого компактного подмножества числового пространства. Для подмножеств положительной Л-мерной лебего- вой меры ^-мерных многообразий обе размерности равны к. В общем слу- чае они могут выражаться нецелым числом. Так, хаусдррфова и энтропий- ная размерности канторова совершенного множества совпадают и равны In 2/1п 3. В общем случае энтропийная размерность может быть боль- ше хаусдорфовой и не может быть меньше. Перейдем к точным опреде- лениям. Пусть К С - компакт. Под покрытием компакта К будем в дальней- шем понимать конечный набор шаров, объединение которых содержит К. Обозначим через Ue(£) класс покрытий компакта К, состоящих из шаров радиуса не больше е. Пусть UG Ue(tf), U = {Bv}, Bv - шар радиуса rp. Для любого d > 0 определен d-мерный объем покрытия U Vd(U)=Zrdv. V Фиксируем d и е и положим mfd(K) = inf Vd(U). иеие(К) Определение. Хаусдорфовой d-мерной мерой множества К на- зывается предел md(K} = lim med(K). е-> oo Замечание. Для любого компакта К величина >d(K) при фикси- рованном d монотонно не убывает при убывании е: инфимум берется по все более бедному классу покрытий. Поэтому мера определена при любом d > 0; она может быть равна положительному числу, нулю или бесконечности. Определение. Хаусдорфова размерность компактного подмно- жества К С обозначается dim/y^ и определяется следующим образом. Если md(K) = 0 для всех d > 0, то = 0. В противном случае dim//# = sup {d | md(K) ¥=0}. Энтропийная размерность определяется точно так же, как хаусдорфова, только вместо покрытий К произвольными шарами рассматриваются по- крытия К, состоящие из равных между собой шаров. Класс всех покрытий компакта К одинаковыми шарами радиуса не больше е обозначим Ve (К). (Каждое покрытие класса У€(К) состоит из равных шаров; разные покры- тия одного класса могут состоять из разных шаров.) Определение энтро- пийной размерности получится, если всюду в определении хаусдорфовой размерности заменить класс Ue (К) на Ve (К). Все доказательства ниже про- водятся только для хаусдорфовой размерности; доказательство теоремы 1 для энтропийной размерности получится, если заменить класс покрытий U€(tf) на Ve(*). 116
§ 4. Искажение объемов под действием фазового потока слабо сжимающей системы Ниже At-мерный объем гладких At-мерных подмногообразий Мк С (с краем или без края) понимается в классическом смысле и обозначает- ся У(Мк). Если П* С TXRN — Ar-мерный параллелепипед, то К(Пк) — его Ar-мерный объем. Лемма 1. Пусть векторное поле и удовлетворяет всем условиям тео- ремы 1 при а = 1 и g: В -+В - сдвиг по фазовым кривым этого поля за еди- ничное время. Тогда для любого k-мерного многообразия Мк С В, к > п (может быть, с краем), V(gMk)<en{K*v>~k V(Mk) (4) и для каждого х Е В II Мх) 11<е\ (5) Доказательство. Фиксируем произвольное х Е В и пусть П* С CTXRN — произвольный А:-мерный параллелепипед. Неравенство (4) будет доказано, если установить, что И(?.(х)П*)<е"<х + ,)-*И(П*). (6) Ниже явное указание на зависимость от х опускается. Предложение 1. В условиях теоремы! V(g! П k ) < (1 - t + о (г))п - k( 1 + X/ + о (t))n Г(П к), t (7) llgl II < 1 + \t + o(r). Доказательство предложения. Рассмотрим плоскость Рк, натянутую на П\ и ограничение квадратичной формы (и*, $, $) на эту плоскость. Пусть {т?1, ..., rik) СРк - нормированный базис из собствен- ных векторов этой формы - ограничения, д,- - собственное значение, со- ответствующее т?7; Д1 > Дз > ... > g/t, Z* - куб с ребрами т?1, ... , rik. Очевидно, неравенство (6) достаточно доказать для частного случая П* = = 1к. В этом случае V(Ik) = 1 и V(g*Ik) СП |#'т/ | (объем параллелепи- педа не превосходит произведения длин сторон). Далее g, = Е + + o(t), следовательно, 1= 1 т?,) + о(0= 1 +ГД/ + о(г). По теореме Релея - Куранта - Фишера [2], д,- СХ,-. Следовательно, I < 1 + гХ + о(Г), /Си, \g.Ti’ | < 1 — t + о(0< /> п. Отсюда немедленно следуют неравенства (7). Предложение доказано. Лемма 1 немедленно следует из следующего предложения. Положим t = 1/р, v - натуральное. Поскольку# = (g 1/р)р и искажения объемов при 117
суперпозиции перемножаются, получаем Ик.П*)<1 1 -- + о(—]) I1 + —+ о(—П И(П‘). \ V \ v // \ v \ v // Переходя к пределу при v -►<», получаем отсюда неравенство (6). Нера- венство (5) аналогичным образом выводится из оценки <Х($,$). Лемма 1 доказана. Замечание. Из второго утверждения леммы следует, что при X < О преобразование фазового потока системы (2) g: В -+В - сжимающее. В этом случае множество М состоит из одной точки, dim^M = 0, и теорема 1 тривиальным образом верна. В дальнейшем X >0. § 5. Оценка хаусдорфовой размерности аттрактора Теорема 1 немедленно следует теперь из леммы: Лемма 2. Пусть g - преобразование шара В в себя, причем производ- ное отображение g*(x) удовлетворяет неравенствам (5) и (6) для каждо- го х В. Тогда множество М = В П gB C\g2B О. .. непусто, компактно, и dm НМ оценивается неравенствами (3), если положить в них а = 1. Замечание. Компактность и непустотаМ очевидны. Если предполо- жить дополнительно, что М - гладкое многообразие, может быть, с краем, то dimAf<л(Х+ 1). Действительно, gM = М\ следовательно, V(gM) = V(M). С другой сторо- ны, если d = dim М, то в силу неравенства (4) V(gM)<e(K+l)n~dV(M). Следовательно, (X + 1 )п - d > 0, что и требовалось доказать. Доказательство леммы 2 следует из двух предложений. Предложение 2. Пусть выполнены условия леммы. Пусть d - по- ложительное число, х G В и Q - единичный шар в Тх В. Пусть существует такое R < 1, что для каждого х G В можно построить покрытие U эллипсои- да шарами радиуса R, причем Vd(U)<R. Тогда dimHAf<d. Доказател ьство. Положим: 6=1 - R. Для каждого достаточно малого е и каждого покрытия C/G Uc(Af) будет построено покрытие U’ 6 G U2 С(М), для которого , I Ы \ Vd(V )<(j j Vd(U)- (8) Из определения меры Хаусдорфа следует, что тогда md(M) = 0; значит, dimHAf Опишем сначала выбор е. Пусть е* Е (0, 1) — произвольное число, для которого (1 +e')d(l -б/< 1 -6J/2. Число е возьмем столь малым, что для любого х Е В и h Е. RN при 118
I h | < e выполняется неравенство (R - то же, что в предложении 2) |g(x + h)~g(x)-g*(x)h | <e'R\ h |. (9) Ниже каждый шар или эллипсоид с центром в точке х RN отождест- вляется с шаром или эллипсоидом пространства Тх К с центром в нуле с помощью отображения: -► Тх Ryv, у = х. Пусть теперь [/6 Ue (М), U- {Bv I v = 1, ..., к} , В(, - шар радиуса rv с центром xv. Для каждого из эллипсоидов Ev -gSxv)Bv (с центром g(xp)) существует такое покрытие Uv шарами радиуса Rrv, что (Ю) Это следует из условий предложения 2 и соображения подобия. Каждый из шаров, составляющих покрытие Uv, заменим концентрическим шаром радиуса (1 + e')Rrv\ полученное покрытие обозначим U,v. В силу нера- венства (9), U'v - покрытие компакта gBv. Совокупность всех шаров, составляющих покрытия U'v, v = 1, ..., к, обозначим U'. Очевидно, U1 - покрытие компакта gM = М\ оно удовлетворяет неравенству (8) в силу неравенств (9) и (10). Предложение 2 доказано. Предложение 3. Пусть Л: R7V->R7V-линейный оператор, и сущест- вуют такие неотрицательное X и натуральное л, что || А II и для каждо- го ^-мерного параллелепипеда П* С R7^ к > л, И(ЛП*)<е',(Х+1)-*И(П*). Тогда для каждого d, удовлетворяющего одному из неравенств d> 16л(Х+ 1) (X + 5), </>4лХ2(1 + ф(Х)), (11) существуют число R < 1 и покрытие U эллипсоида AQ шарами радиуса R , для которого < R. Здесь Q - единичный шар в R7^ Функция ф задана ниже формулой (13). Здесь отметим только, что ф(Х) —► 0 при Х-* °°. Доказательство. Покрытие U строится по следующему плану. Эллипсоид AQ заключается в произведение двух шаров: inapaQi большо- го радиуса и малой размерности и шара Q2 малого радиуса и большой раз- мерности. Сначала найдем экономное покрытие шара Qi, а затем, слегка раздув это покрытие, превратим его в покрытие произведения Qi X Q2. Перейдем к подробному построению. Возьмем произвольное р Е Е (е"1, 1). Пусть Pi - плоскость, натянутая на все полуоси эллипсоида AQ. которые не меньше р; Р2 - ортогональное дополнение к Р\. Пусть Qi CPj - шар с центром О и радиусом e\Q2 СР2 - шар с центром О и радиусом р. Очевидно, AQ CQ^X Q2. Положим m = dim Рг и оценим m через р, X, п. Для каждой из m наиболь- ших полуосей эллипсоида AQ возьмем ее прообраз единичной длины; пусть Пт - натянутый на эти прообразы параллелепипед. Очевидно, И(ПШ )< 1. По условию и по построению рт < К(ЛПт)<ел(Х+1)-"’, 119
отсюда л(Х+1) т <-----------. 1 + 1пр Следующая лемма легко выводится из теорем Роджерса [31 ] и здесь не доказывается. Лемма 3. m-мерный шар радиуса R можно покрыть шарами радиуса г, число которых не превосходит величины (R + 2г)т N(m,R,r)= (0(/и)+1), где 0(1)= 1, 0(т) = m(ln т + In In т + 5) при т> 2. Число г выберем так, что р2 + г2 < 1; пары (р, г ): pG (е"1,1), р2 + + г2 < 1 будем называть допустимыми. Покроем шар Q i шарами радиуса г, центры, которых лежат в плоскости Pi, а число оценивается леммой 3. Каждый из шаров покрытия заменим концентрическим шаром радиуса R = (р2 + /2) ^2.Полученный набор шаров обозначим С/(р,г). По теореме Пифагора С/(р, г) - покрытие компакта Qi X Q2. Имеем Vd(U(p,r))<NRd, N=N(m,e\r). Следовательно, InW Vd(U(p,r))<R при (12) Первая часть последнего неравенства оценивается через л, X, р и г; поэто- му, в силу предложения 2, любой выбор допустимой пары риг дает оценку сверху на dim# М. Мы тем самым уже закончили доказательство теоремы 1 в следующей ослабленной формулировке: В условиях теоремы 1 существует оценка сверху на dim/уЛ/ величиной, зависящей только от Х/а и и. Для доказательства этой ослабленной теоремы не нужно и леммы 3: покрытие С/(р, г) не обязательно брать’’почти оптимальным”. Перейдем к точным оценкам. Имеем I х 1п(0(?Л) + 1) 1 In 7V = m ln(ex + 2r) - In r +--------- . L m I Простое вычисление дает ln(0(m) + 1) <7/2m, m= 1,2,..., ln(ex + 2r)<X+1. X>0, r<l/2. Следовательно, при г < 1/2 In TV m(X + 9/2 - Inr) --------- <—1 <Ф(л, X,p,r), I In Я |-|1пЯ| 2л(Х+ 1)(X + 9/2 - Inr) Ф(л, X, p, r) = ---------------1--- . (1 + Inp) | ln(p2 + r2) | 120
Построим покрытие U, когда d удовлетворяет первому из нера- венств (11). Положим U = U(p, г) при р = г = е~ */2. Очевидно, 1/э 4и(Х+1)(Х + 5) Ф(л, Х,е~‘/2, e"l/2) = —1----------< 16л(Х + 1)(Х + 5) - 1. 1 - In 2 В силу оценки (12) Vd(U) < R. Это доказывает первую часть пред- ложения. Определим функцию ф равенством Ф(л, Х.е-1'2, [е(Х+ 1)]-,/2)+1 = 4лХ2(1 + V'(X)). (13) Очевидно, ф(к) -► 0 при X -* Пусть d удовлетворяет второму из нера- венств (11) с этой функцией ф; положим U= U(p,r) прир = е-1/2, г = = [е(Х+1)]”1/2. Тогда, в силу оценки (12), Vd(U)<R. Предложение 3, а вместе с ним лемма 2 и теорема 1 доказаны. Отметим, что с ростом X становится выгодным покрывать шар Q\ шара- ми малого радиуса г. § 6. Доказательство теоремы 2 Пусть и(х)=/(х)-х Тогда (М*) О s ЛОО М) - (М) < <(£-!)($,£),т.е. Xi(x)<L-l. Далее, пустьКх = КегД(х). При %£КХ ?)=-«, f). Поскольку codim Кх^ и, не более чем п собственных значений формы (и*00М) превосходит-1, т.е. X„ + i(x)<- 1, что и требовалось доказать.
СПИСОК ЛИТЕРАТУРЫ Авербух ДЯ. - Автоматика и телемеханика, 1969, №11. 2 .Арнольд В.И. - Лекции по дополнительным главам классической механики. - М.: Наука, 1974. З .Берл Р. - В кн.: Принципы самоорганизации. М.: Мир, 1966. 4 .Бернштейн С. Н. Теория вероятностей. - М.: Госте хи зд ат, 1946. 5.Васильев Н.Б., Митюшин Л. Г, Пятецкий-Шапиро ИИ., Тоом А.Л. Операторы Ставской. - Препринт ИПМ АН СССР, 1973, № 12. б.Вентцель А.Д., ФрейдлинМ.И. - Успехи матем. наук, 1970, т. 25, № 1. 7. Взаимодействующие марковские процессы в биологии. - Пущино: НИВЦАНСССР, 1970. 8.Винер Н, Розенблют А. - Кибернетич. сб., № 3, М.: ИД 1961. 9.Гельфанд ИМ., ЦетлинМ.Л. - ДАН СССР, 1960, т. 131, №6. XQ.Гельфанд ИМ., ЦетлинМ.Л. - В кн.: Модели структурно-функциональной орга- низации некоторых биологических систем. М.: Наука, 1966. 1 \. Дунин-Барковский В.Л. - XII научн. конференция МФТИ. М.: МФТИ, 1966. 12.Дунин-Барковский В.Л. - Биофизика, 1970, т. 15. № 2. 13. Дунин-Барковский В.Л. - Биофизика, 1971, т. 16, № 3. \4.Дунин-Барковский В.Л. - Биофизика, 1971, т. 16, №5. 15.Дунин-Барковский В.Л. Информационные процессы в нейронных структурах. - М.: Наука, 1978. ХЬ.Дунин-Барковский В.Л., Якобсон В.С. - Биофизика. 1971, т. 16, № 6. \7.Ильяшенко Ю.С., Четаев А.Н. - ПММ, 1982, т. 16, №4. \Ъ. Кедер-Степанова И.А. - В кн.: Модели структурно*функционалыюй организации некоторых биологических систем. М.: Наука. 1966. 19. Кедер-Степанова ИА. - В кн.: Физиология дыхания (в серии ’’Руководство по физиологии”). Л.: Наука, 1973. 2$. Кедер-Степанова И.А., Пономарев В.А. - Биофизика, 1965, т. 10, № 2. 2\. Кедер-Степанова И.А., Четаев А.Н. - В кн.: Вопросы физиологии и патологии дыхания. Куйбышев: КМИ, 1968. 22 .Кедер-Степанова И.А., Четаев А.Н. - Биофизика, 1970, т. 15, № 5. 23 .Кедер-Степанова И.А., Четаев А.Н. - ДАН СССР, 1970, т. 193, №6. 24 .Кедер-Степанова И.А., Четаев А.Н. - Биофизика, 1978, т. 23, № 6. 25 .Кедер-Степанова И.А., Пономарев В.А., Четаев А.Н. - Биофизика, 1966, т. И, № 1. 26 .Кедер-Степанова И.А., Пономарев В.А., Четаев А.Н. -ДАНСССР, 1970. т.193, № 3. 27 .Кронрод А.С. - Успехи матем. наук. 1950, т. 5, № 1. 2%. Лидс кий В.Б. - В кн.: Гантмахер Ф.Р. Теория матриц. М.: Наука, 1967, с. 535. 29.Мак-Коллак У.С., Питтс В. - В кн.: Автоматы. М.: ИД 1956. ЗЪ.Митюшин Л.Г - Проблемы передачи информации, 1970, т. 6, № 6. ЗХ.Позин Н.В. Моделирование!'нейронных структур. - М.: Наука, 1970. 32 .Роджерс К. Укладки и покрытия. - М., 1968. ЗЗ .Розонозр Л.И. - Автоматика и телемеханика, 1969, №№5-7. 34 .Ротенберг А.Р. - Автоматика и телемеханика, 1971, №№9, 10. 35 . РюэльД Статистическая механика. - М.: Мир, 1971. 36 .Сафонов В.А., НекрасоваВ.М., Ефимов В.Н, Чумаченко А.А. - В кн.: Физиоло- • гия человека и животных. Вып. 9. М., 1972. 37 .Симпозиум по нейрональной организации дыхательного центра. - Куйбышев: КМИ, 1973. 38 .Смит Д, Дэвидсон С. - В кн.: Проблемы бионики. М.: Мир, 1965. 122
39 . Ставе кая О.Н. - Матем. сб., 1973,т. 92, № 3. 4Q. Ставская О.Н.. Пятецкий-Шапиро И.И. - В кн.: Проблемы кибернетики, вып. 20. М.: Наука, 1968. 41. ФеллерВ. Введение в теорию вероятностей и ее приложения. Т. 1,2. - М.: Мир, 1967. 42. Ф/шер ИЗ. Статистическая теория жидкости. - М.: Физмгггиз, 1961. 43. Харди Г.Г.. ЛиттлъвудД.Е.. ПолиаГ. Неравенства. - М.: ИД 1948. 44. Хирш М. Дифференциальная топология. - М.: Мир, 1968. 45. Холли Р. - Математика, 1974, т. 18, № 6. 46. Холоденко Б.Н. - Биофизика, 1974, т. 19. №4. 47. Холоденко Б.Н.. Четаев А.Н. - Биофизика, 1973, т. 18, № 2. 48. Честнова А.А.. Четаев А.Н. - Биофизика, 1979, т. 24, №4. 49. Честнова А.А., Четаев А.Н. - Биофизика, 1979, т. 24, №4. 5Q. Четаев А.Н. - Биофизика, 1972, т. 17, № 3. 51. Четаев А.Н. - Биофизика, 1972, т. 17, №5. 52. Четаев А.Н. - Биофизика, 1974, т. 19, № 3. 53. Четаев А.Н. - Биофизика, 1974, т. 19, №4. 54.Четаев А.Н. - В кн.: Моделирование возбудимых структур. Пущино: НИВЦ АН СССР, 1975. 55. Четаев А.Н. - Успехи матем. наук, 1976, т. 25, N* 4. 56. Четаев А.Н. - Биофизика, 1979, т. 24, № 3. 57. Шеннон К Работы по теории информации и кибернетике. - М.: ИД 1963. 5%.Beurle RL - Phil Trans. Roy. Soc., 1956, 240, p. 55. 59 .Feldman J. L. Cowan J.D. - BioL Cybern., 1975, v. 17,N»1. 60 .Fortuin CM.. Kasteleyn P. W.. GinibreJ. - Common. Math. Phys., 1971, v. 22, № 2. 6\.Hardy G.N.. Littlewood J. £, Polya G. Inequalities. - London: J. Wiley, 1934. 62 .KHng V.. Szekely G. - Kybernetik, 1968, v. 5, № 1. 63 . Mallet-Paret J.. Duff J. - Equa., 1976, v. 22,^2. 64 .Palmay F. von. Davidson E'.J.. Duffin J. J. - Bull Mathem. Biol., 1974, v. 36, N*l. 65 .Rubio J. E. - Bull. Mathem. Biophys,, 1967, v. 29, №4. 66 .Rubio J.E - ВиП. Mathem. Biophys,, 1972, v. 34, №2. 61 .Shuji Yoshizaw. - Kybernetik, 1977, v. 16, № 1. 6%.Smith D.R.. Davidson CH. - J ACM, 1962, v. 9, N* 3.
A.N. CHETAEV NEURAL NETS AND MARKOVS CHAINS Summary The book presents an attempt at sketch variant for a general theory of nets of excitable elements. This theory is first of all devoted to problems of neural modelling. The main prob- lem is how to give a formal discription of the activity dynamics in a net, consisting of "neu- ron-like elements” - some variant of the McCulloch-Pitts model neuron. A lot of computer simulations and approximations of varying degry of accuracy have been proposed in this field by now. A number of exact analytical results concerning various aspects of net activity dynamics is elaborated in the book. The theory is based on the axiomatics of the excitable element main properties of which are as follows. The time in models is considered to be dicrete. The notion of excitable element is based on Markov's chain definition. The Mar- kov's chains used in the book are intermediary between finite chains and that general class of Markov's chains, which demands for definition the whole arsenal of the measure theory. The main notations are as follows. For each moment time the probability for an element to be excited depends on its "po- tential" - the sum of all excitations, having arrived to the element from all the other ele- ments of the net. The excitable element is called a "linear excitable element", if the pro- bability of element to be excited is a linear function of a potential (a proper normalising factor is of course included here to guaranty the absence of probabilities, exceeding 1). The notion of linear excitable element permits analitical treatment of a number of prob- lems. The first thoroughly analysed problem is the division of the network properties into local and nonlocal ones. The informal meaning of this classification is to make clear, which parameters of the network activity can be calculated on the base of "local" parameters of single neurones and their connections and which parameters depend on the "global" para- meters of the interconnection matrix. It has been proved for linear excitable element that net mean number of excited elements in a network is a "local" value, i.e. depending only on local parameters, while the dispersion of this value is "non-local" - it depends on the type of interconnection matrix. A number of problems is formulated and some solutions are given concerning the "op- timal" structure of the net (e.g. for the nets with extremal value (in a given "local" class of nets) of the activity dispersion and some related values). For a certain some classes of nets a hypothesis is put forward that the activity level of the net obeys the so-called Smith-Davidson inequality (the hypothesis is proved for two special types of model neurones). In other words a well-known stochastic approximation of activity level is shown to be in certain cases a lower or upper border for activity level in certain neural nets. Problems, arising in definitions and activity estimations of the so-called random nets are extensively worked out. One of the problems, treated in the book is the dependence of activity level on the deg- ree of excitability of single elements (e.g. the elements "threshold", etc.). It is shown in a number of cases that "paradoxial" situations may occure, in which the activity level dec- reases with the decrease of the threshold value or with the strengthening of excitatory con- nections. Some generalizatins of results, originally obtained from neural net simulation are presen- ted in the book. They belong to the area of statistical physics and the theory of dissipa- tive systems. 124
Chapter IX oT the book is devoted to formulation and analysis of the model of the medul- lary respiratory centre. The, fundamental experimental results, which are used here have been obtained by the author himself in cooperation with well-known neurophysiologist Dr. In- nesa A. Kedcr-Stepanova. The consequences of the model, which can be experimentally verified are extensively discussed. THE CONTENTS Preface by professor L.I. Rosonoer .................................................. 5 Introduction......................................................................... 8 Chapter I. Basic definitions....................................................... 12 1. The definition of an excitable element ................................. 12 2. The definition of a net................................................. 14 Chapter II. Locally homogenous nets........................................... 1. The local homogenity.................................................... 15 2. The net of linear excitable elements.................................... 18 3. Values which are equivalent to the dispersion of the activity level .... 22 4. Extremal nets........................................................... 27 Chapter III. Dependence of the activity level on the excitability of a single element............................................................................. 33 1. Formulation of the problem.............................................. 33 2. The net of linear excitable elements.................................... 33 3. Excitable tissues. The theory of O. Stawskaja........................... 34 4. The elements without refractory period. Mitiushin’s theory.............. 35 5. A net of counter-neurons................................................ 36 6. Discussion.............................................................. 39 Chapter IV. Ensembles of nets and the gas4ike net.................................. 41 1. Ensemble of nets and its randomization.................................. 41 2. Nets of linear elements ................................................ 44 3. Nets of elements with exactly one connection............................ 46 4. Discussion.............................................................. 48 5. Proof of the propositions A-D........................................... 49 Chapter V. Stochastic nets........................................................ 54 1. Formulation of the problem.............................................. 54 2. The representability theorepi........................................... 57 3. Proof of the Smith-Davidson inequality.................................. 66 4. The method of markowian operators comparison............................ 68 5. Discussion.............................................................. 69 6. Summary................................................................. 69 Chapter VI. The exiomatics of an excitable element................................. 70 Chapter VII. Random walks on partly ordered set..................................... 73 1. Monotonous functions.................................................... 74 2. The rank order of measures.............................................. 75 125
3. Triangle operators..................................................... 76 4. Monotonous measures.................................................... 77 5. Two lemmas on quotients................................................ 7g 6. Operators.............................................................. 81 7. The family of operators PA............................................. 82 8. The operators which are tangential to the order........................ 83 9. The attractive domains ................................................ 84 10. Concordated pairs...................................................... 85 11. Concordated quaruples.................................................. 87 12. A property of X(4) function............................................ 89 89 Chapter VIII. Long-living states in finite systems................................. 90 1. Metastable states and finite systems................................... 90 2. Phases and phase transitions........................................... 91 3. The maximum Theorem.................................................... 93 4. A swamp structure ..................................................... 95 5. Slow processes......................................................... 96 6. Generalizations........................................................ 98 Chapter IX. Computational model of the medullary respiratory centre.................. 99 1. The determinism of net dynamics....................................... 99 2. Nets at a circle......................................................... 100 3. Dispersion of the oscillation period..................................... 102 4. Hypothesis on properties of neural interconnections in the respiratory centre........................................................................ 102 5. The circle model of the respiratory center............................... 103 6. The activity equations................................................... 104 7. The main properties of activity equations solving........................ 105 8. The propagation of wave mode............................................. 106 9. The circle model of the respiratory center with windows.................. 107 Chapter X. On attractor dimensions for a class of dissipative systems........................ 113 1. Formulation of the problem. Attractors and their dimensions........ 113 2. Review of the results................................................. 114 3. The Hausdorff and enthropy dimensions................................. 116 4. Phase volume distortions in a phase flow of a weakly constraining system.................................................................... 117 5. Evaluation of the Hausdorff dimension of an attractor................. 118 6. Proof of the main theorem............................................. 121 Bibliography........................................................................ 122
АЛЕКСАНДР НИКОЛАЕВИЧ ЧЕТАЕВ НЕЙРОННЫЕ СЕТИ И ЦЕПИ МАРКОВА Редактор В.Л. Дунин-Барковский Технический редактор В.В. Лебедева Корректоры Т.В. Обод, Е.А. Янышева Набор осуществлен в издательстве на наборно-печатаюшмх автоматах ИБ№ 12654 Сдано в набор 27.12.84 Подписано к печати 22.03.85 Т—07429. Формат 60 X 90 1/16 Бумага офсетная № 1 Гарнитура Пресс-Роман Печать офсетная. Усл.печ.л. 8,0 Усл.кр.-отт. 8,13. Уч.-изд.л. 8.06 Тираж 1950 экз. Тип. зак. 359 Цена 1 р. 20 к. Ордена Трудового Красного Знамени издательство "Наука” Главная редакция физико-математической литературы 117071 Москва В-71, Ленинский проспект, 15 4-я типография издательства "Наука” 630077 г. Новосибирск-77, ул. Станиславского, 25
ИЗДАТЕЛЬСТВО ’’НАУКА” ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ ГОТОВЯТСЯ К ВЫПУСКУ В 1986 ГОДУ Автоматное управление асинхронными процессами в ЭВМ и дискретных системах/Под редакцией В.И. Варшавского. Кабалевский А.Н. Малые ЭВМ: функциональное проектиро- вание. Первозванский АА. Курс теории автоматического управ- ления: Учебное пособие. Серия "Теоретические основы технической кибернетики" Волгин Л.Н. Оптимальное дискретное управление динами- ческими системами. Михайлов Ф.А. Теория и методы исследования нестационар- ных линейных систем. Назин АЗ., Позняк А.С. Адаптивный выбор вариантов: ре- куррентные алгоритмы. Серия "Проблемы искусственного интеллекта" Нечеткие множества в моделях управления и искусственного шггеллекта/Под редакцией ДА. Поспелова. Поспелов ДА. Ситуационное управление: теория и практика. Серия "Теория и методы системного анализа" Дубов Ю.А., Травкин СМ., Якимец ВЛ. Многокритериальные модели формирования и выбора вариантов систем. Робертс Ф.С. Дискретные математические модели с прило- жениями к социальным, биологическим и экологическим про- блемам. Перевод с английского. Терехина AJ0. Анализ данных методами многомерного шка- лирования.