Текст
                    ПРИКЛАДНАЯ
КОМБИНАТОРНАЯ
МАТЕМАТИКА
СБОРНИК СТАТЕЙ
Под редакцией
Э. БЕККЕНБАХА
Перевод с английского
Под редакцией М. Е. Деза
ИЗДАТЕЛЬСТВО „МИР" МОСКВА 198$


У.Д.К.519.15 Сборник содержит большой фактический материал, отражающий как со- современные результаты в комбинаторной математике, так и многочисленные ее применения. Рассматриваются задачи систем управления, многие задачи из биологии, физики и техники. Для решения этих проблем применяются но- новые методы комбинаторного анализа. Сборник отличается высоким научным уровнем, о чем свидетельствует состав авторов: в их числе такие известные ученые, как Р. Калаба, М. Холл и др. Книга представляет большой интерес для широкого круга читателей. Она будет полезна как математикам, так и экономистам, биологам, инженерам и т. д. Ее также можно рекомендовать аспирантам и студентам соответ- соответствующих специальностей. Редакция щтературу ио математич&сцим наущщ Инд. 2-2-3
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Этот сборник составлен из статей вышедшего под редакцией Э. Беккенбаха сборника «Прикладная комбинаторная матема- математика» (США, 1964 г.). Комбинаторная математика рассматривает обычно задачи на существование, эффективное построение, перечисление и опти- оптимизацию объектов, зависящих от сравнительно большого числа дискретных переменных. До недавнего времени комбинаторные объекты (конечные геометрии, одномерные комплексы, я-куб< конечные метрические пространства и т. д.) представлялись для многих курьезом, пригодным разве лишь для школьных мате- математических кружков и олимпиад. Этому способствовали сравни- сравнительная изолированность результатов, элементарность доказа- доказательств, впрочем, весьма сложных, и главное отсутствие важных приложений. В связи с развитием вычислительной техники резко расширились возможности перебора и повысился интерес к ди- дискретным моделям, что обусловило новый подъем комбинатор- комбинаторной математики. Комбинаторные методы применяются ныне как в самой математике, так и вне ее — теория кодирования, плани- планирование эксперимента, топология, конечная алгебра, математи- математическая логика, теория игр, кристаллография, биология, статисти- статистическая физика, экономика и т. д. При составлении сборника преследовалась цель по возмож- возможности широко охватить те области применения комбинаторной математики, которые недостаточно полно освещены в отечествен- отечественной и переводной литературе. Поэтому в сборник не включены, например, производящие функции, теория информации, потоки на сетях, логические сети, линейное и динамическое программи- программирование. Каждая статья представляет собой монографию по рассма- рассматриваемому в ней вопросу, написанную известным специали- специалистом, содержащую оригинальные результаты и библиографию. В статье Э. Монтролла вычисляются вероятности некоторых событий на решетках. Рассматриваются случайные блуждания,
Предисловие редактора перевода задача распределения знаков на решетке, вычисление пфаффиа- нов, обсуждаются термодинамические свойства айзинговой мо- модели ферромагнетизма. Статья Н. де Брёйна посвящена строгому изложению и обоб- обобщению наиболее мощного комбинаторного аппарата — теории перечисления Пойа. Ф. Харари в своей статье собрал основные характеристики графов и в связи с этим систематизировал основные результаты, проблематику и приложения теории перечисления графов. В работе Р. Калабы показано, как многие важные задачи теории автоматического управления сводятся к задачам теории графов. Задача о правиле остановки вероятностного устройства при данной структуре платежей и решений и ее приложения иссле- исследуется Л. Брейманом. В статье М. Холла содержится обзор блок-схем, методов их построения, теорем существования и применений. Примером глубокого приложения комбинаторных методов в топологии является статья У. Томикинса, в которой обобщается лемма Шпернера и теорема Брауэра о неподвижной точке. Работа Г. Гамова представляет собой обзор биологических и математических исследований, связанных с гипотезой автора о генетическом коде и развитие этой гипотезы. Особое место занимают «Дополнения» Германа Вейля, яв- являющиеся частью его книги «Философия математики и есте- естественных наук» A949 г.). В этой работе рассматриваются неко- некоторые философские вопросы применения комбинаторики в био- биологии, квантовой механике и структурной химии. Не следует искать в этой статье строгих формулировок; некоторые философ- философские взгляды автора спорны, однако широта взгляда и попытка универсального подхода явились причинами включения этой статьи (как это и было сделано редактором американского сбор- сборника). Большинство статей является записью лекций и написано в соответствующем духе — с множеством примеров, порой юмо- юмористических, с вопросами для самопроверки, с отступлениями. Широта и новизна тематики вызвали большие терминологи- терминологические трудности при переводе и редактировании сборника. Эта книга должна привлечь внимание как читателей — мате- математиков, так и специалистов в других областях, тем более, что статьи можно читать независимо друг от друга. М. Деза
ВВЕДЕНИЕ Джордж Пойа Знаменитый Лейбниц обладал мно- многими действительными знаниями, кото- которыми он обогатил науки, но еще более грандиозны были его замыслы, выпол- выполнение которых мир тщетно от него ждал. ИММАНУИЛ КАНТ Собр. соч., т. 2, стр. 371, М., 1964. Готтфрид Вильгельм Лейбниц был, кажется, первым авто- автором, который использовал термин «комбинаторный» в том смысле, в каком мы употребляем его сегодня, говоря о комби- комбинаторном анализе или о комбинаторной математике. Лейбницу едва исполнилось двадцать лет, когда он написал свою «Dissertatio de Arte Combinatoria», напечатанную в 1666 г. Ее титульный лист обещал приложения во всех сферах науки и «новый подход к логике изобретения». Во вступлении провозгла- провозглашалось приложение теории к замкам, органам и силлогизмам, к смешиванию цветов и к «протейскому» стиху, к логике гео- геометрии, военному искусству, грамматике, юриспруденции, меди- медицине и теологии. На самом деле диссертация содержит, помимо блестя- блестящей демонстрации схоластической эрудиции, некоторые матема- математические результаты. Она объясняет и решает основные комби- комбинаторные задачи, приводящие к биномиальным коэффициентам и к факториалу, но почти ничего больше. Эти задачи в 1666 го- году не были так тривиальны, как в наше время, но многие из результатов Лейбница были известны до него. За математиче- математическими предложениями следуют приложения, большинство кото- которых представляются современному читателю бесплодными или фантастическими, что в некоторых случаях было ясно самому Лейбницу. Эта «Диссертация о комбинаторном искусстве» была, од- однако, только началом большой работы, которая всю жизнь зани- занимала Лейбница. Он часто упоминает об этой работе в своих письмах и в печатных трудах, и к ней относятся многие записи,
Джордж Пойа найденные в его рукописях, оставшихся неопубликованными. Не- Некоторые из этих заметок были посмертно напечатаны. Из них мы видим, что Лейбниц планировал всё новые и новые приме- применения для своего комбинаторного искусства или «комбинато- «комбинаторики»: к кодированию и декодированию, к играм, к статистике смертности, к комбинации наблюдений. Он также все больше и больше расширял сферу применения комбинаторики. Иногда он рассматривал комбинаторику как половину общего Искус- Искусства Изобретения, эта половина относится к синтезу, в то время как другая — к анализу. Комбинаторика должна заниматься, говорит он в другом месте, одинаковым и различным, похожим и непохожим, абсолютным и относительным, в то время как обычная математика занимается большим и малым, единицей и многим, целым и частью. Наконец, он приписывает комбинато- комбинаторике широчайшую сферу применения, рассматривая ее как почти или полностью совпадающей со своей «Characteristica Universa- lis». Он проектировал «универсальную характеристику» как не- нечто вроде обобщенной математики, которая будет рассматри- рассматривать все, что угодно, и которая сведет мышление к чему-то вроде вычисления с помощью соответствующих цифр и симво- символов. Были ли эти проекты Лейбница просто мечтами? В них был некоторый смысл, и, возможно, его мечты были пророческими. Используя свою «Characteristica Universalis», он намеревался свести понятия к символам, символы к числам и, наконец, с помощью цифр и символов подвергнуть понятия механиче- механическому вычислению. Этот проект казался абсурдным и фанта- фантастическим многим, обычно здраво рассуждающим людям, но сегодня вычислительные машины реализуют часть этого фанта- фантастического плана. Лейбниц знал некоторые основы математиче- математической логики, важность которой он признал задолго до кого бы то ни было, а математическая логика лежит где-то на пути к «Characteristica Universalis». Правда, применения его Ars Com- binatoria были фантастическими, тривиальными или бесплод- бесплодными, но он, конечно, предвидел громадное разнообразие при- приложений и расширяющуюся сферу применения комбинаторики, поэтому имя Готтфрида Вильгельма Лейбница, великого мате- математика, философа и прожектора с полным правом заслуживает упоминания во введении в настоящую книгу.
СТАТИСТИКА РЕШЕТОК Эллиот В. Монтролл 1. Введение В этой статье будет идти речь об исчислении вероятностей некоторых событий, которые могут осуществляться на решетках. Будем избегать приближенных методов; нас будут интересовать только точные решения задач, возникающих для больших ре- решеток. В большинстве исследований будут рассматриваться только одномерные и двумерные решетки. Различие между этими задачами и задачами для решеток большего числа изме- измерений оказывается огромным. На протяжении всей статьи будут использоваться производящие функции. Решетка определяется обычным образом. Рассмотрим си- систему трех некомпланарных единичных векторов i, j, k. Концы векторов 1 ('//) для всех /, пробегающих целые значения 0, ±1, ±2, ±3, .... об- образуют некоторую пространственную решетку. Решетка произ- произвольной размерности может быть определена подобным же об- образом. Кристаллическое твердое тело (см. [32]) есть, в сущности, совокупность атомов или молекул, занимающих положения рав- равновесия в узлах некоторой пространственной решетки. Источни- Источником многих проблем статистики решеток является физика твер- твердого тела. Можно отличать проблемы, посвященные физике твердого тела, от проблем, посвященных решающим устрой- устройствам, однако в том и другом случае нужно руководствоваться поиском точных решений. Специалист по физике твердого тела делает всевозможные приближения, даже самые смелые, если необходимо, чтобы получить качественную картину, которая по- помогла бы ему понять некоторые эксперименты. Задачи, связан- связанные с решающими устройствами, предъявляют особые требова- требования к граничным условиям; решение должно быть точным, даже если при этом теряется физический смысл задачи и приходится погружаться в дебри математики. Все имеет свои сильные и сла- слабые стороны.
10 Эллиотт В. Монтролл 2. Случайные блуждания по решеткам и проблема Пойа Рассмотрим задачу случайного блуждания по одномерной решетке. Частица находится в исходный момент времени в на- начале координат (рис. 1) и в следующий момент делает скачок Начало -3-2-10123 Рис. 1. Случайное блуждание. на единицу либо вправо, либо влево с вероятностью 7г- Нас ин- интересует вероятность того, что после t шагов частица окажется в точке / данной решетки. В выражении коэффициент 7г при ei<r есть вероятность шага вправо, т. е. ве- вероятность того, что /=1 после первого шага, а коэффициент 7г при е(Р — вероятность шага влево. Коэффициент 74 при e2i<f в выражении есть вероятность того, что 1 — 2 после двух шагов; коэффи- коэффициент У2 при eOi<f — вероятность возвращения в начало; коэффи- коэффициент 74 при e~2i<? — вероятность того, что /= —2 после двух ша- шагов. Вообще Pi(l)—вероятность того, что за t шагов частица окажет- окажется в точке /, равна коэффициенту при е''ч" в разло-/|\ жении бинома [у(е'ч> ~f е~''фI • Интегральное представление этого коэффициента непосред- непосредственно получается из тождества 1, если /м = 0 ±. -я 0, если пг — целое число, отличное от нуля. Если мы подействуем интегральным оператором
Статистика решеток 11 на выражение у(е'ф + ?~|ф) , то в разложении бинома анну- аннулируются все члены, кроме члена, содержащего е'ч>г, и мы по- получим я Это рассуждение может быть непосредственно применено к исследованию блужданий по двумерной квадратной решетке, когда блуждающая частица может переходить в любую из своих четырех смежных точек с вероятностью 'Д- Тогда вероятность /'((l) попадания из начала координат в точку решетки 1 = (/t, /2) равна я я И вообще для S-мерной простой кубической решетки с 2S воз- возможными равновероятными перемещениями из каждой точки ре- решетки в смежную точку имеем -я -я —я —я где ф ¦ 1 = ... -f и dsq> e= В случае блуждания по 5-мерной простой кубической ре- решетке с последовательными перемещениями в смежные точки производящая функция для всех траекторий частицы, оканчи- оканчивающихся в точке I, есть
12 Эллиотт В. Монтролл Таблицы [17] этих функций существуют для S = 3. В частности, производящая функция для траекторий, начинающихся и окан- оканчивающихся в начале координат,есть d Ф /г>\ Л 1 _-?-(cos «р, + ... +со5ф5) Если мы будем исследовать блуждание более сложное, чем блу- блуждание с перемещением в смежные точки, то мы можем легко запутаться в последовательности производимых перемещений, поэтому следует предпочесть более систематический подход к ис- исследованию. Такой подход будет использован в п. 3, где пока- показано (см. также [19]), что U{Z X) I J Ф ^ J 1- где Цф) = Цф,, ф2, ..., Ф5) = 2рA)^/ф|) а рA) —вероятность шага из точки V в точку \" = \' + \. Для блуждания по трехмерной объемноцентрированной ку- кубической решетке л(ф) имеет вид E) тогда как для гранецентрированной кубической решетки ^¦(ф)= у (^2 + ^3 + ^3) F) (см. п. 3). Интересный вопрос, касающийся случайных блужданий по решеткам, был поставлен Пойа много лет назад [26]. Сам он ча- частично решил этот вопрос. Всегда ли возвращается в начальную точку блуждающая частица, которая последовательно переме- перемещается в смежные точки решетки? Если нет, то какова вероят- вероятность невозвращения для данной решетки? Чтобы ответить на этот вопрос, мы используем некоторые идеи Феллера [5], касающиеся теории рекуррентных событий. Пусть Е — некоторое событие, которое может осуществляться повторно. Пусть /;- — вероятность того, что событие Е осуществилось впервые в /-м испытании, Uj — вероятность того, что событие Е осуществилось в /-м испы- испытании независимо от того, осуществлялось ли оно раньше.
Статистика решеток 13 Положим ио=1 и построим производящие функции последова- последовательностей {Uj} И {fj} ее со U(z)=2i UjZJ и F{z)= 2 f/гЛ G) Далее мы имеем Правая часть последнего равенства представляет собой сумму вероятностей несовместных событий, каждое из которых влечет за собой осуществление события Е в /-м испытании. Так как «0=1, «o/j есть вероятность того, что событие осуществится впер- впервые в /-м испытании, «i/>-i есть вероятность того, что оно осу- осуществится впервые в (/ — 1) испытании и затем снова осуще- осуществится в следующем испытании, и т. д. Теперь умножим обе части на zi и просуммируем эти равенства по / от 1 до оо. По- Получим j j -1 ; или U(z)-l=F{z)U(z), откуда Интерпретация F(l) очевидна, поскольку вероятность того, что Е когда-либо произойдет, равна так как fu f2 и т. д. представляют собой вероятности несовмест- несовместных событий: fi — вероятность того, что Е осуществится впервые в первом испытании, f2 — впервые во втором испытании и т. д. Следовательно, вероятность того, что событие Е когда-либо осу- осуществится, равна 1 Возникают две возможности: 1. Если U(I) = оо, то F(l) = 1, и событие Е достоверное. ¦ 2. Если U(\) < оо, то F(\) < 1, и существует положитель- положительная вероятность неосуществления события Е. В нашей задаче о случайном блуждании частица с вероятно- вероятностью 1 возвращается в начало, причем это происходит беско- бесконечно часто, если интеграл C) [или D)] расходится, так как C)
14 Эллиотт В. Монтролл [или D)] есть просто искомая производящая функция, опреде- определенная в G). С другой стороны, если интеграл C) [или D)] схо- сходится, то существует положительная вероятность невозвращения блуждающей частицы в начало. Перед тем как приступить к точному вычислению вероятно- вероятностей возвращения в начало для различных решеток, исследуем качественное поведение выражения C) при 2=1, а именно по- поведение выражения / A) = Сходимость этого интеграла зависит от знаменателя подиитег- рального выражения, который ведет себя, как поскольку * COS ф;-=1 2"ф2-|- •¦¦ при (фь фг, ..., фя) —+0. Мы определим г как переменный ра- радиус в S-мерных полярных координатах. Интеграл t/sA) может быть представлен в виде суммы двух компонент. Первая ком- компонента — интеграл по S-мерному шару малого радиуса а с цен- центром в начале координат. Вторая компонента — интеграл по S-мерному гиперкубу объема Bп)8 с выброшенным из него ша- шаром радиуса а с центром в начале координат. В области, не включающей начало координат, подинтегральная функция не имеет особенностей, поэтому вторая компонента нашего инте- интеграла заведомо сходится. Мы вычислим вклад в интеграл от ма- малого шарового слоя вокруг начала координат пространства ф, пренебрегая вкладом в интеграл от шара радиуса е, а затем устремим е к нулю. Поскольку внешний радиус слоя достаточ- достаточно мал, можно считать подинтегральное выражение зависящим только от г; следовательно, мы можем использовать полярные координаты при интегрировании и d8(p будет пропорционально rs~ldr. Искомый интеграл, как показано в G), A9), B0), про- пропорционален выражению 11 с , _____ При 5=1, — In— при 5 = 2, ^2"(as-2 — e*-2) при 5>3.
Статистика решеток 15 При е->0 окрестность начала координат включается в интегри- интегрирование, и мы видим, что /(е) —¦ се для S = l или 2, тогда как /(е)<°° для S>3. Следовательно, Us{\) расходится при S = 1,2 и сходится при S !> 3. Это и есть результат Пойа: ча- частица, блуждающая по решетке описанным выше способом, с достоверностью возвращается к началу блуждания, если она блуждает по одномерной или двумерной решетке. Отличная от нуля вероятность невозвращения существует для n-мерной ре- решетки при п ^ 3. Мы продолжим исследования Пойа в направлении точного вычисления Us(\) для трех различных трехмерных кубических решеток: простой кубической, объемноцентрированной кубиче- кубической и гранецентрированной кубической. По счастливой случай- случайности Г. Н. Уотсон [30] проделал для нас всю эту работу. Он вы- вычислил три интеграла: л я л Г Г Г J J J d<f2 d<f3 _J__ BлK J J J . 1 , . . _„ _л -л 1— у (cos ф, + cos ф2 + cos ф3) = З^т [18 + 12 У 2 - 10/3 — 7 УЪ] К2 [B - УЗ)(УЗ~У2)] = =-1,5163860591, (8) л л я ¦COS ф| COS ф2 COS фз —я —л —я 1 \14 BлK J J J 1—< —я —л —я [г(т)Г = JJ±iL = 1,3932039297, (9) Л Л Л , 1 Г Г Г *Pi _Я _я _л 1 5 (Ci 9 fr (t)T L ,v /J = 1,3446610732, A0) где K(k) есть полный эллиптический интеграл второго рода. На первый взгляд кажется странным, что кто-то мог посвятить свой досуг исследованию таких интегралов. В действительности Ван Пейп [25] столкнулся с вышеприведенными интегралами при раз- разработке теории ферромагнитной анизотропии, основанной на спино-волновой теории. Он не смог вычислить эти интегралы в конечном виде и прибег к графическому интегрированию. !'• А. Крамер, изучая работы Ван Пейпа, предложил задачу вы- вычисления трех интегралов (8), (9) и A0) Р. X. Фаулеру, кото- который сообщил ее Г. X. Харди. После этого, как пишет Уотсон [30],
16 Эллиотт В. Монтрплл «проблема приобрела всеобщую известность в Кэмбридже, а впоследствии в Оксфорде, откуда без труда перекочевала в Бир- мингам». Если мы будем исследовать производящую функцию B) при S = 3 и z=l и объединим формулы E) и F) с формулой D) для е=1, мы увидим, что Л, /2 и /3 суть соответственно значения производящих функций ?/зA) для случайных блужданий по про- простой, объемноцентрированной и гранецентрированной кубиче- кубических решетках. Как было показано выше, вероятность возмож- возможного возвращения блуждающей частицы к началу блуждания равна F(\) = 1 — [U(l)]~\ Отсюда для различных кубических решеток получим ([19]): 0,340537330 для простой кубической решетки, вероятность возвращения в начало /•"(!) = 0,282229985 для объемно- центрированной кубической решетки, 0,256318237 для гране- гранецентрированной кубической решетки. Число смежных точек для точки простой кубической решетки равно 6; для объемноцентрированной кубической решетки рав- равно 8; а для гранецентрированной кубической решетки равно 12. Не удивительно, что вероятность возвращения уменьшается с возрастанием числа смежных точек, поскольку увеличивается число путей для ухода. Вероятность невозвращения также воз- возрастает с ростом размерности решетки при фиксированном числе смежных точек для каждой точки решетки. Например, вероят- вероятность возвращения в начало на четырехмерной простой кубиче- кубической решетке, у которой для каждой точки существуют восемь смежных, равна 0,20, тогда как для объемноцеитрированной трехмерной кубической решетки с таким же числом смежных то- точек эта вероятность равна 0,28. Прежние оценки вероятностей возвращения для простой кубической решетки были 0,35 по Мак-Крею и Уипилю [16] и 0,34054 по Домбу [2]. 3. Более общие случаи блуждания по решеткам Рассмотрим простую S-мерную бесконечно протяженную ку- кубическую решетку. Пусть I и V — некоторые векторы, опреде- определяющие точки решетки. Компоненты 1 и V суть целые числа ! = (/!, /2, .... /s), где /у = 0, ±1, ±2
Статистика решеток 17 V выражается аналогично. Пусть р{\— 1') есть вероятность пе- перехода из точки V в точку 1 на некотором этапе блуждания, когда частица находится в точке Г. Кроме того, пусть Pt(\) есть вероят- вероятность того, что частица попадет в точку 1 после / шагов. Тогда 2 р{\ — Г)=1 для всех Г, A1) i где 1 пробегает всю решетку. Аналогично Вероятность того, что блуждающая частица попадет в точ- точку 1 после /+1 шагов, равна Обозначим через ф вектор из 5 компонент - - Ф = (<Pi. Фг. • • •' Фл)> .,.,, где ф,- — действительные числа, /= 1. 2,..., S. Если то из A2) мы получим Если к тому же блуждание начинается в начале координат при / = 0, то П0(ф) = 1 и, следовательно, Это выражение может быть обращено для нахождения Р,(\) при помощи хорошо известной формулы для коэффициентов ряда Фурье. Если on | . =я — ОО ¦ " . ¦ ТО . 2л 2л ... • ч ' О О Поэтому 2я 2л О О 2 Зек. 909
18 Эллиотт В. Монтролл Отсюда производящая функция случайного блуждания есть оо 2я 2л Ц f ... f т , f" *''* г Bji) J J 1—гЯ,(«р„ <р2 cp* Это и есть формула D). Случайное блуждание с перемещением в смежные точки на трехмерной объемноцентрированной кубической решетке экви- эквивалентно блужданию по простой кубической решетке шага 1, при котором частица может делать только шаги, соответствую- соответствующие восьми векторам смещения вида (±1, ±1, ±1). Если каждый шаг может быть осуществлен с вероятностью Ve> то мы имеем ^ (ф) — 2 Р (I) ei<tl — cos ф! cos ф2 cos ф3. Случайное блуждание с перемещением в смежные точки на гранецентрированной кубической решетке эквивалентно блу- блужданию по простой кубической решетке шага 1, в котором ча- частица может делать только шаги, соответствующие двенадцати смещениями вида (±1, ±1,0), (±1,0, ±1), @, ±1, ±1), ка- каждый шаг с вероятностью !/i2- Отсюда имеем ^ (ф) = ^ Р 0) е^Л — у (C0S Ф1 C0S <P2+C0S ф! COS фз + COS ф2 COS фз). 4. Пфаффиан и задача о димерах В конце XIX — начале XX в. изучались различные алгебраи- алгебраические объекты, подобные определителям. Но поскольку эти объекты не нашли себе места в приложениях математики и не имели связи с основаниями математики, они вскоре были за- забыты. Один из этих объектов, пфаффиан, недавно был возро- возрожден Кайанелло [1] благодаря его естественному появлению в квантовой теории поля. Интересное свойство пфаффиана заключается в том, что че- через него выражается число способов покрытия системы точек двумерной решетки изолированными отрезками. Эта связь была установлена независимо Темперли и Фишером [29] и Кастелей- ном [11]. Задача о покрытии системы точек отрезками впервые упоминается Фаулером и Рашбруком [8] в 1937 г. Замечательно, что решение этой задачи было найдено двадцатью пятью годами позднее одновременно и независимо разными авторами, причем одним и тем же методом.
Статистика решеток 19 Задача о димерах возникает при исследовании адсорбции двухатомных молекул на поверхности. Она формулируется сле- следующим образом: требуется найти число способов объединения атомов в двухатомные молекулы (которые мы будем отныне на- называть дилерами), так чтобы при этом покрывалась дважды периодическая решетка с шагом, равным длине димера, причем каждый димер покрывал бы две смежные точки решетки и не оставалось бы ни одной непокрытой точки. Две димерные кон- конфигурации для решетки 4X6 представлены на рис. 2. Поскольку о о о о——о о cv Oq о- ° ° 13 14 15 16 17 18 ? ? 7 8 9 10 И 12 о о о о о о о о о о о б Рис. 2. Димерные покрывающие конфигурации. каждый димер покрывает два узла решетки, димерная конфигу- конфигурация может существовать только для решеток с четным числом узлов. Таким образом, решетка с квадратной элементарной ячейкой должна иметь четное число узлов хотя бы в одном напра- направлении, чтобы быть покрытой димерами. Мы потребуем этого для горизонтального направления. Для решения задачи о димерах нам потребуется ввести по- понятие пфаффиана. Рассмотрим совокупность антисимметричных функций {а(р, р')} от двух переменных р и р', пробегающих це- целые положительные значения 1, 2, 3, ..., 2N. Антисимметрия этих функций означает, что ,. / — а(Р'> />)• если Р^Р'' /1О, а(р, р) = { л , A3) уу у' \ 0, если р = р ¦ Множество {а (р, р')} можно интерпретировать как множество элементов кососимметрической матрицы i=[ a{\, 1) a(\, 2) ... o(l, 27V) -i aBN, 1) aBN, 2) ... aB^V, 2^V) J где a(pt p') удовлетворяют условиям A3). По аналогии с обо- обозначением определителя будем изображать пфаффиан как часть матрицы А выше главной диагонали, заключенную в прямые
20 Эллиотт В. Монтролл черточки: | Р {а (р, р')) = аA, 3) ... аA, а B, 3) ... а B, 2JV) aBN — 1,27V) Он определяется следующим образом: Я {а (р, />')} = 2' М (а, а) а (д,, /»4) ... а (Ayv-i. p2N), A4) р где суммирование производится по всем перестановкам1) P = (Pv Ръ • • •> P2n) Целых чисел A, 2, 3, ..., 2N), таким, что Множитель бр берется равным +1 или —1 в зависимости от того, является ли Р четной или нечетной перестановкой чисел /\ Рис. 3. Шестиугольная решетка. ЧАА ЛЛЛ Рис. 4. Треугольная ре- решетка. A, 2, ..., 2N). Нечетной перестановкой называется последова- последовательность целых чисел, которая может быть получена нечетным числом транспозиций пар чисел в последовательности A, 2,... ..., 2N). Так, последовательность 132 4 является нечетной пе- перестановкой последовательности 12 3 4, поскольку она полу- получается из последней транспозицией чисел 2 и 3. Разложение пфаффиана [1] для N = 2 имеет вид , 4) -а(\, 2)оC, 4)— A7) — а(\, 3)аB, 4) + аA, 4)аB, 3). а B, 3)оB, 4) оC, 4) ') Имеются в виду 2Л^-перестановки из 2N элементов в смысле опреде- определения на стр. 10 книги: Риордан Д ж., Введение в комбинаторный аНй- лиз, ИЛ, М., 1963. — Прим. ред.
Статистика решеток 21 Можно исследовать класс плоских решеток, на которых воз- возможны димерные конфигурации. Простейшей из таких решеток является квадратная решетка. Некоторые другие возможности доставляют гексагональная (шестиугольная) решетка (рис. 3), треугольная решетка (рис. 4) и так называемая «кафельная» решетка (рис. 5). Поставим в соответствие димер- ной конфигурации последователь- последовательность пар точек, в которой каждый элемент пары является концом ди- мера: С—{Р\, Ръ Pi Ps> Pf>> Рис.5. «Кафельная» решетка. где элементы р в каждой паре яв- ляются смежными точками на ре- решетке. Единственность такого представления гарантируется упо- упорядочением элементов р в С так, что A<ft. Д»<А. Ps<Pv ••• О8) Р1<Рз<Р5< •••• (Щ Конфигурации а и б на рис. 2 суть соответственно. 11, 2; 3, 9; 4, 10; 5, 6; 7, 13; 8, 14; 11, 12; 15, 21; 16, 17; 18, 24; 19, 20; 22, 23} {1, 2; 3, 4; 5, 6; 7, 8; 9, 10; 11, 12; 13, 14; 15, 16; 17, 18; 19, 20; 21, 22; 23, 24). Последняя конфигурация является примером «эталонной кон- конфигурации» Со, введенной Кастелейном. Это такая конфигура- конфигурация, в которой все димеры горизонтально расположены на квад- квадратной решетке. Точки на диаграмме слева направо и снизу вверх мы пере- перечисляем, чтобы получить схему, характеризуемую неравенствами A8) и A9). Неравенства A8) и A9) совпадают с A5) и A6). Следова- Следовательно, существует взаимно однозначное соответствие между Димерной конфигурацией и членами разложения пфаффиана. Элементы а(р, р) должны быть равными нулю для тех зна- значений р и р', которые не могут быть соединены димером. Ввиду такого соответствия, мы можем надеяться выразить производя- производящую функцию для числа димерных конфигураций на прямо- прямоугольной решетке Фт,«(*1. г3)= 2 g(Ni,N2)z»*»' . B0)
22 Эллиотт В. Монтролл в виде пфаффиана. Здесь g{Nu N2) есть число димерных кон- конфигураций с Ni горизонтальными и N2 вертикальными димерами на прямоугольной решетке с m точками по горизонтали и п по вертикали. Суммирование производится по всем таким N\ и N2, что ^nm = Nx-\- N2. Существует взаимно однозначное соответствие между членами в выражении B0) и членами разложения пфаффиана поряд- порядка ппг, которые определяются следующим образом: zv если рир', при р < р' горизонтально смежны, I и (р< Р ) I ==¦ / , 1 ^ ^ " z2, если р и р , при р<р вертикально смежны, 0 в любом другом случае. Действительно, можно показать, что Здесь, однако, требуется, чтобы все члены разложения A4) были неотрицательны. Поэтому необходимо установить, можно ли подобрать такой фазовый множитель единичного модуля при а(р, р'), чтобы все члены разложения Р{А) были неотрица- неотрицательны? Кастелейн [12] показал, что знаки могут быть приписаны элементам а(р,р') таким образом, что все члены разложения Р{А} будут неотрицательны при условии, что решетка плоская и не имеет изолированных точек и мостов, т. е. не имеет пересе- пересекающихся связей. Сейчас мы обсудим его идеи, которые он любезно сообщил автору в ходе многочисленных бесед. Начнем с тождественной перестановки Ро и соответствующей ей покрывающей конфигурации (рис. 26). Припишем значение Z\ следующим элементам матрицы: аA, 2) = аC, 4) = аE, 6)= ... =аB3, 24) = zlt т. е. элементам матрицы, соответствующим всем горизонталь- горизонтальным димерам, которые соединяют точку, обозначенную нечет- нечетным числом слева, с точкой, обозначенной четным числом справа. На произвольной квадратной решетке с т точками в го- горизонтальном направлении этот член пфаффиана имеет значе- значение zl тп Т
Статистика решеток 23 Любой член разложения пфаффиана может быть выражен множеством эквивалентных способов. Рассмотрим член, соответ- соответствующий перестановке P:bpa(pv р2)а{р3, р4) ... a(p2N^, p2N), B2) где элементы р расположены в каноническом пфаффовом по- порядке A5) и A6). Этот член останется неизменным при нару- нарушении неравенств A6). Например, предположим, что мы заме- заменили пару (pi, p2) на (р3, р4) и получили новую перестанов- перестановку Р'. Тогда 6р = бр', поскольку Р' преобразуется в Р четным числом транспозиций. Эта перестановка индексов соответствует перемене места двух сомножителей в соответствующем члене разложения пфаффиана, и следовательно, вид нового пред- представления члена B2) останется тем же. К тому же B2) ин- инвариантно по отношению к нарушениям неравенств A5) и A6). Пусть нарушается первое, тогда я(А> Р2)~+а(р2, Pi) = — a{pv р2), так что знак произведения символов а меняется. Однако эта' перестановка, которую мы обозначили через Р", включает одну дополнительную транспозицию индексов р. Следовательно, ЬР = =—6р".Множитель —1 просто компенсирует антисимметрию сим- символов а, и новое представление B1) имеет то же численное зна- значение, что и B2). Все представления члена Р, полученные из A5) и A6), соответствуют той же димерной конфигурации, по- поскольку те же индексы р соединяются в символах а. Удобно различать разные представления одного и того же члена пфаф- пфаффиана на димерном графе (рис. 2) при помощи стрелок на ди- мерах. Так, например, множителю а{р,р') на графе соответ- соответствует димер со стрелкой, направленной от р к р'. Таким образом, мы приписали знаки четверти всех связей, которые соединяют соседние точки решетки. Указание знаков для остальных трех четвертей делается путем сравнения знака члена, соответствующего произвольной перестановке B2), со знаком члена, соответствующего эталонной перестановке Ро или произвольной другой перестановке, принятой за эталон. Заме- Заметим, что если димерная конфигурация, соответствующая пере- перестановке Рь накладывается на димерную конфигурацию, соот- соответствующую перестановке Р2. то результирующий граф состоит из некоторого числа димеров и из замкнутых многоугольников. Рисунок 6 получен наложением рис. 2, б на рис. 2, о, причем ди- меры рис. 2,6 обозначены пунктиром. Те димеры, которые при- присутствуют и в Рь и в Р2, не внесут различия между членами пфаффиана, соответствующими Pi и Р2. Мы видим, что все
24 Эллиотт В. Монтрплл представления членов Р4 и Р2, которые соответствуют различ- различным расположениям направленных связей, производят те же численные значения членов пфаффиана, что Р4 и Р2. Из всего множества различных представлений членов Р\ и Р2 выберем такие два представления Р\ и Яг> чтобы на результирующем графе все замкнутые многоугольники обходились по часовой Рис. 6. Многоугольники, получающиеся наложением конфигураций рис. 2. стрелке, а индексы, соответствующие точкам, лежащим на мно- многоугольнике, были расположены по циклу. Назовем многоуголь- многоугольники, получающиеся при наложении графов, суперпозицион- суперпозиционными многоугольниками. Пусть Р3 есть перестановка, преобра- преобразующая Pi в Рг'), т. е. Р'ч = РзР\- Из теории перестановок хорошо известно, что 6Dr=6 •&„'• И1 Р3 И\ В каждом замкнутом многоугольнике пунктирные димеры могут быть преобразованы в димеры, обозначенные сплошной линией (Pi), циклической перестановкой, соответствующей сдвигу на один шаг по часовой стрелке по многоугольнику. Циклические перестановки, соответствующие разным много- многоугольникам, независимы между собой, поскольку многоуголь- многоугольники не пересекаются. Следовательно, ЬР] есть произведение 6i, 62 •¦• 6и равных +1, если циклическая перестановка четная, и — 1, если она нечетна. Чтобы определить знак данной цикличе- циклической перестановки, рассмотрим Р\ Рг Рз ¦¦¦ Рп-\ Р„ 1 1,[\ . Pi Рз А • • • Рп Р\\' - ¦ - ') Имеется в виду нижняя строка подстановки, которая является произ- произведением подстановок с нижними строками Р1 и Я2 соответственно.—Прим. ред.
Статистика решеток 25 Окончательное расположение (р2, Рз, •¦•, Pi) получается из (рь Рг, •••. Рп) транспозицией р2 и рь затем р3 и р( и т. д., пока pi не появится справа. Поскольку каждой транспозиции соответствует множитель (—1), мы получим б = (—I)™. Ка- Каждый суперпозиционный многоугольник на рис. 6 содержит чет- четное число точек решетки, поскольку в него должно входить столько же димеров из конфигурации, соответствующей Рг' сколько и из конфигурации, соответствующей Ръ Следователь- Следовательно, каждое б, равно —1, и мы имеем где s есть общее число многоугольников, полученных при на- наложении двух графов. Наше требование, чтобы все члены пфаффиана были неотри- неотрицательными, может быть достигнуто, если мы сумеем сделать один член положительным, что уже выполнено для эталонной конфигурации на квадратной решетке, и найдем такое распре- распределение знаков по связям решетки, которое обеспечило бы всем другим членам тот же знак. Знак у Pt будет тем же, что и у Рг, если знак любого сомножителя в Р{ или Р\, соответствующего не- некоторому суперпозиционному многоугольнику, тот же, что и знак сомножителя, соответствующего тому же многоугольнику в Р2 или Pi. Если сомножитель, соответствующий пунктирным ли- линиям (рис. 6) на /-м суперпозиционном многоугольнике, равен 6р|«(Л' Р2)а(Рз> то сомножитель, соответствующий сплошным линиям на том же многоугольнике, равен b(jja(pr p3)a(p4, ps)... a(p2№j, />,), поскольку каждый суперпозиционный многоугольник состоит из последовательно чередующихся пунктирных и сплошных от- отрезков. Условие совпадения знаков этих двух членов записы- записывается в виде равенства - $! sign а (/>,, р2) sign а (р3, р4) ... sign а (/>2я._,, р2п.) = = 6(^ sign a (pr p3) sign а (р4, р5) ... sign а (/>2 , />,). Поскольку все сомножители в этом равенстве суть либо +1, либо —1, и так как
26 Эллиотт В. Монтролл то условие равенства знаков можно переписать в виде 2nj П sign а (рк, рк+1) = —\, B3) учитывая, что р2п +1=/>,. Таким образом, задача распределения знаков будет решена, если произведения знаков на некоторых замкнутых многоугольниках, которые могут быть суперпози- суперпозиционными многоугольниками, равны —1. Это будет выполняться Рис. 7. Распределение знаков для квадратной решетки. Рис. 8. Направленные связи на квадратной решетке в том случае, если —1 будет появляться нечетное число раз в каждом суперпозиционном многоугольнике. Удовлетворяющее этой цели распределение знаков на ква- квадратной решетке дано на рис. 7. В этом случае мы имеем а(р, р') = — а(р', р) = гх для горизонтальных связей при р' > р, (—\)р z2 для вертикальных связей при р' > р, О, если точки р и р' не являются смежными. Произведения знаков на каждом из трех суперпозиционных многоугольников на рис. 6 равны —1, что и требуется. Доказа- Доказательство того, что такое распределение знаков правильно, а также общее доказательство того, что всегда можно найти подходящее распределение знаков на плоской решетке без осо- особых точек и без самопересечений, даны в работе [12].
Статистика решеток 27 Знаки данных элементов матрицы можно изобразить при по- помощи стрелок так, чтобы направление стрелки от р к р' озна- означало, что а(р, р') > 0. Например, стрелочная диаграмма рис. 7 изображена на рис. 8. Заметим, что в дальнейшем изложении мы будем придерживаться именно такого понимания стрелок. То соглашение о стрелках, которое было использовано при вы- выводе B3), уже сыграло свою роль и теперь должно быть за- забыто. Многоугольник с четным числом положительно напра- направленных отрезков1) назовем положительно четным; многоуголь- многоугольник с нечетным числом положительно направленных отрезков — положительно нечетным многоугольником. Аналогично для от- отрицательного направления обхода. Поскольку все суперпозици- суперпозиционные многоугольники содержат четное число отрезков, то если суперпозиционный многоугольник отрицательно нечетный, он и положительно нечетен. Теперь равенство B3) эквивалентно утверждению, что каждый суперпозиционный многоугольник должен быть положительно нечетным, т. е. при полном обходе суперпозиционного цикла нечетное число стрелок должно быть направлено от р, к pj+i. Можно расположить стрелки так, что все многоугольники на решетке, не содержащие внутри себя точек решетки и несамо- пересекающиеся, будут положительно нечетными. Сначала, вы- выбрав такой многоугольник, расположим на нем нечетное число положительно направленных стрелок, оставшиеся будут напра- направлены отрицательно. Смежный с ним многоугольник будет иметь некоторое число общих отрезков со своим соседом и хотя бы один неориентированный отрезок. Таким неориентированным отрезкам придается произвольная ориентация, за исключением одного отрезка. На последнем выберем направление так, чтобы многоугольник был положительно нечетным. Этот процесс мо- может быть продолжен таким образом, что на каждой ступени мы будем иметь простую связную область, пока все многоугольники не будут промаркированы и не останется ни одного неориенти- неориентированного отрезка. Распределения стрелок для квадратной, ше- шестиугольной и треугольной решеток приведены на рис. 8 и 9. Для такого расположения стрелок можно доказать [12], что число положительно направленных стрелок на замкнутом мно- многоугольнике и число заключенных внутри него узлов решетки имеют противоположные четности. Мы только что показали справедливость этого утверждения для случая, когда много- многоугольник не содержит внутри себя точек решетки, поскольку 0 ') Примем за положительное направление обхода какого-либо контура направление обхода по часовой стрелке, а направление против часовой стрелки соответственно за отрицательное направление обхода. — Прим. перев.
28 Эллиотт В. Монтролл есть число четное, а число положительно направленных стрелок нечетно. Рассмотрим теперь многоугольник Г„, который состоит из п многоугольников описанного выше типа, и предположим, что наша теорема верна для этого многоугольника. Мы можем построить новый многоугольник Гп+ь который объединяет мно- многоугольник Гг, и примыкающий к нему элементарный много- многоугольник Гь не содержащий внутри себя точек решетки. Нужно доказать, что из справедливости нашей теоремы для Г„ следует ее справедливость для Гп+i- Пусть Г„ содержит внутри себя -у точек решетки, включает в себя а положительно направленных связей и имеет р связей, общих с Гь который включает в себя Рис. 9. Направленные связи на шестиугольной и треуголь- треугольной решетках. а' (нечетное число, как легко видеть) положительно направлен- направленных связей. Число точек решетки, содержащихся внутри Г„+1, равно Y + P— 1- Число положительно направленных связей в Гп+1 равно числу их в Г„ плюс число их в Гь минус число поло- положительно направленных стрелок в Гь оказавшихся внутри Г„+1 при объединении многоугольннков, минус число их в Г,,, оказав- оказавшихся внутри Гп+1. Поскольку положительно направленные связи многоугольника Г„, общие с Гь являются отрицательно направленными связями многоугольника Гь каждая общая связь является положительно направленной либо в Гь либо в Г„. Отсюда следует, что число положительно направленных связей в многоугольнике Г„+1 равно а + а'—р. Из предположе- предположения, что наша теорема верна для Г„, следует, что а и \ имеют противоположные четности. Поскольку а' нечетно и слагаемое — 1 в y + P—1 также нечетно, то (а + а' —Р) и (y+P—1) имеют противоположные четности, что и требовалось доказать. Задача о распределении знаков на решетке будет оконча- окончательно решена, если показать, что суперпозиционный много- многоугольник необходимо заключает внутри себя четное число точек решетки, потому что из этого будет следовать, что все супер-
Статистика решеток 29 позиционные многоугольники положительно нечетны, и поэтому B3) будет справедливо для всех таких многоугольников. На- Наложение двух произвольных димерных конфигураций порождает только суперпозиционные многоугольники, границы которых со- содержат обязательно четное число точек решетки, а также нало- наложенные друг на друга изолированные димеры, так что не остается ни одной непокрытой точки решетки. Следовательно, суперпозиционный многоугольник может заключить внутри себя только другие суперйозиционные многоугольники и димеры, за- заключая при этом лишь четное число точек решетки. Именно это и нужно было доказать. Ориентированные графы на рис. 8 и 9 дают распределение знаков для квадратной, шестиугольной и треугольной решеток. 5. Циклические матрицы Квадратная матрица А порядка п с элементами которые зависят только от k — j, причем a(k + n) =a(k), назы-4 вается циклической [22]. Например, а@) а(\) аB) аC) аC) а@) аA) а B) а B) аC) а@) аA) _аA) а B) аC) а@)_ Элементы матрицы могут быть числами или матрицами. Пред- Предположим, что они являются матрицами пг-го порядка. Такие циклические матрицы могут быть легко преобразованы в ма- матрицы, в которых диагональные элементы являются матрицами порядка ш, а недиагональные элементы — нулевые. Пусть R — ортогональная матрица, в которой элементами являются ма- матрицы m-го порядка: __1_ 2яШ R(k, /) = я Чте » , где 1т есть единичная матрица порядка т. Элементами ма- матрицы R~l являются Элементами матрицы B'ssR~*AR
30 Эллиотт В. Монтролл ЯВЛЯЮТСЯ , k)= l,s=l (ft-/ «(*-о s~l) k которые являются диагональными матрицами порядка пг, обра- обращающимися в нуль при l=j=k, так что 2я о М^Ч... о 4л Суммирование по s не зависит от / вследствие периодичности а{к)\ в самом деле, мы имеем п Поскольку определитель матрицы Л есть инвариант ортого- ортогонального преобразования, мы получим det A = det В == Д det % (-^-). Устремим п к бесконечности. Обозначим Ф = ~7 Тогда мы получим в пределе — -1 In det A = -L 2] In det A. 2я -^Г J 1п det к (ф) rf(p< Этот результат легко обобщается на случай, когда j и к яв- являются векторами с 5 компонентами, а элементы матрицы удо- удовлетворяют условиям k = (kv
Статистика решеток 31 Тогда А приводится к диагональному виду с помощью ортого- ортогональной матрицы Я (к, 1) = /тП-т так что где Затем В пределе при п4 —> оо, п2 —* оо, ... мы положим ф„=——. так что Тогда мы получим V У ... ... АЛ АЛ indet^ У ...Indetxf. ,.. nin2... п,пг... АЛ АЛ \ и, п2 2л 2я ^ ТГТГ f • • • Г In det Я, (ф„ ф2 ф5) а'ф, ^ф2 ... dys. B5) Bя) 5 J 6. Вычисление димерных пфаффианов Наиболее удобный алгоритм для вычисления пфаффиана Р{А) дает формула det А = [Р {А}]2. B6) Следовательно, задача о димерах будет решена, если мы сумеем вычислить det Л. Решетка с ориентированными ребрами (рис. 8) перестала быть инвариантной относительно горизонтального сдвига на один шаг, поскольку сдвиг на один шаг вправо изме- изменяет направления вертикальных ребер на противоположные. Од- Однако если мы введем новую элементарную ячейку, содержащую пару точек по горизонтали, то решетка станет инвариантной от- относительно горизонтального сдвига на целое число элементар- элементарных ячеек. Для удобства введем новую систему нумерации узлов решетки. Будем представлять узел решетки р тремя
32 Эллиотт В. Монтролл индексами: р\ — абсцисса элементарной ячейки, р2 — ордината элементарной ячейки и параметр Г, принимающий значение L для левого узла элементарной ячейки и R для правого узла. Наконец, мы определим матрицу А(р\ р'), элементы которой связывают узлы элементарной ячейки р с узлами ячейки р' сле- следующими соотношениями: , , _ \a(pv Pv Ц & Р'2' Z) a(pv Pr L> Pv P'r ЩЛ Pv PV Pi)-[a(Pi, Pr R; P'v P'r L) a(Pv p2, R; p[, p'v R)\ Все такие матрицы нулевые, за исключением матриц, соответ- соответствующих парам смежных ячеек. Следовательно, = 0' кР°ме P2 = p'2±h p,=p[, или B7) Заметим, что ^(Pj. P2\ p[> P2) зависит только от ^р\ — p^ и (p2 — p2\ т. е. каждая элементарная ячейка (pi, p2) связана со смежными ячейками таким способом, который зависит только от направления (за исключением концевых эффектов, которые будут обсуждаться позднее) и не зависит явным образом от 1Рь Рг). Рассмотрим A(pi, p2; Р\, рг)- Это соответствует связи между двумя точками в одной элементарной ячейке. Здесь имеются два ненулевых элемента а{ри р2, L; pv р2, /?) = г, = - а(ри р2, R; pv p2, L), поскольку первый из этих элементов соответствует горизонталь- горизонтальной связи, проведенной из левого узла в правый узел ячейки (pi, p-z)- Таким образом, L R A(P), p-y\ Pv A>) = L О г, ==л@, 0), B8) где а(и, v) определяется как Р2, Р[, р?) = а (р[ - р1, р!2 — р2) = а (р1 — р). B9) Далее рассмотрим А(ри рг\ pi+1, p2). Эта матрица связывает данную ячейку со смежной с ней справа. Правый узел левой ячейки может быть связан горизонтальным димером с левым узлом правой ячейки, гак что а(Рь Pz> Я; Л-И. Л- L) = zx.
Статистика решеток 33 Поскольку не может быть других связей между ячейками (рь Рг) и (Pi+1, Рг), мы получим L R L ГО 0] Л(А. Л! А + 1. А) = ? I 0|=аA,0). C0) Аналогично получаем Г 0 — г, 1 = Л(-1, 0). C1) Теперь рассмотрим матрицу а(рь Рг; Рь Рг+1). Она связывает элементарную ячейку со смежной с ней сверху вертикальной связью. В этом случае соответствует направлению вверх вертикальной связи, тогда как a(pi, p2, L; pv /ъ+1, /.) = —г2 соответствует направлению вниз вертикальной связи. Недиаго- нальные элементы обращаются в нуль в этом случае, поскольку не существует димера, связывающего левый узел верхней ячейки с правым узлом нижней ячейки. Следовательно, мы получим х, Ръ Ръ Р2-\-\)=\ п „ |=а@, 1) C2) и аналогично Гг2 О I А(Ри Рь А- А— ')= а =а@, —1). C3) L0 —z2j Соотношения B7) эквивалентны равенству а (и, v) = 0, кроме следующих случаев: A) « = и = 0; B) « = 0, у = ±1 или C) v = 0 и ы= ±1. Пусть решетка имеет m узлов по каждой из горизонталей и п узлов по каждой из вертикалей. Когда размеры решетки очень велики, при т —* оо, п—юо следует ожидать, что точные гра- граничные условия мало влияют на решение задачи о димерах. Мы будем обсуждать это в дальнейшем в п. 8. Здесь, однако, для простоты мы выберем периодические граничные условия, а именно /1 \ - ' /у I h _i_ **) h 1 и ! .- /У I b 1} | 1 1 1 О "*'* *^2 I I —" \ 1' 2/* 3 Зак. 909
34 Эллиотт В. Монтролл m поскольку наша решетка имеет -у ячеек в горизонтальном на- направлении и п в вертикальном. Теперь мы можем непосредственно применить результат B5) к вычислению det Л: 2л 2л ^ J JlndeUfopq^rfq),^, C4) о о где из B4) и B8), C0), C1), C2) и C3) мы получим M<Pi. Фг)= 2 а(их, и2)е1(и^'+иМ = а@, 0)-(-аA, 0)е1^- U,, Uj + а(- 1, 0)e-l<f> + a@, \)el^-\~a@, ~\)~l<t' = z1—z1e-l(f< откуда det К (ф,, ф2) = 4 (z« sin2 -у + z\ sin2 ф2) C6) 2л 2л о о 2л 2л о о Наш пфаффиан B6) имеет вид ( л л | Р{Л)~ехр та| Jln2[B?+e|)-zJcos9,-2^cosв2]?/в^вЛ. loo j C7) Из B1) наш пфаффиан является производящей функцией Для числа димерных конфигураций. Интеграл в C7) вычисляется следующим образом. Пусть л л = -^ j J ln(A", + X3 о о
Статистика решеток 35 Заметим, что я F(XV 0) = — f In 1^,A- о и аналогично F@, X2) = ln~-. Также имеет место равенство я я dF _ 1 Г Г A — cose,) tf9, rf92 дХ, ~ Ц? J J х,+Хг — X, cos 9, — Хг cos 92 о о Интегрирование по 02 приводит к равенству dF _ 1 г A—cos9,)rf9, 0 ,.., , .^(l-cose,)!2-^ ' Положим у— 1 — cos 6ь тогда 2 dF _ I f ~ я J Поскольку 2 ' О ГУ /О и\ /01 2 d ._... Г^1B—«Iг 1 [A-.p-jfX^+X.y)] то из предыдущего следует, что <?/=• 2 _„._/*, \Т 2 После почленного интегрирования и использования граничных условий, наложенных на А, мы получим В частности FB, 2), как это следует из C7), где Zi=z2=l, имеет значение Сумма, обозначенная здесь через G, называется постоянной $ талана. Ее приближенное значение равно 0=1— 3~2 + 5~2 — 7'2+ ... ^0,915965594.
36 Эллиотт В. Монтролл Найдем теперь число димерных конфигураций [6], [11]: л л ФтвA. l)~exPl—T \ Jin 2 B-cose^cos 20 о о где —2~ есть число димеров, покрывающих решетку пХт. Чис- Численное значение коэффициента е л есть с26'"* 1,791623. На этом заканчивается оценка интеграла C7), сделанная Фау- лером и Рашбруком [8]. Эта оценка была получена путем экстраполяции соответствующих результатов для бесконечных цилиндров малого радиуса при т, меняющемся от 2 до 8, и п —* сю. Точные результаты для конечных прямоугольников и торов также были получены Фишером [6] и Кастелейном [11]. Интерес- Интересный численный результат был получен Фишером для числа спо- способов покрытия шахматной доски (8X8 клеток) 32 костяшками домино, причем каждая кость покрывает две клетки; это число равно Ф8,8A, 1)= 12988816 = 24-(901J. Известны также результаты для нескольких других типов реше- решеток. 7. Задача Лизинга Этот раздел посвящен обсуждению [3], [23] термодинами- термодинамических свойств айзинговой модели ферромагнетизма. В этой простейшей модели ферромагнетизма мы ставим в соответствие элементарному магниту (или электронному спину) узел решетки и обозначаем положение /-го спина через переменную а, со сле- следующими свойствами: ( -f-1, если магнитный момент направлен „вверх" \ , 1 \—1, если магнитный момент направлен „вниз" \. Кроме того, для каждого спина постулируется взаимодействие с соседними спинами так, что предпочтительна параллельная взаимная ориентация спинов, т. е. положение минимальной энер- энергии пары спинов о и о' есть положение, в котором они парал-
Статистика решеток 37 лельны. Энергия взаимодействия J вводится следующим обра- образом: Энергия параллельного расположения ff или Ц = —J Энергия антипараллельного расположения fj. или jf = = — Jaa'. Ферромагнитное состояние решетки есть состояние с ненулевым остаточным магнитным моментом, немагнитное состояние есть состояние с хаотическим распределением ориентации спинов, не дающим остаточного магнитного момента. Если взаимодей- взаимодействуют только пары смежных спинов и если энергия взаимодей- взаимодействия аддитивна, тогда энергия спинового состояния решетки {01, 02. • • } есть П. 101. 02» ¦ • • , 0/VI ""^ ^e /ft' с. т. где суммирование производится по всем парам / и k, являю- являющимся смежными точками (с. т.) на решетке. Термодинамиче- Термодинамические свойства решетки выводятся [3] из функции разбиения / n z = 1 1II V"*1 °'т' где [ 1, если j и k смежны, •''* 1 0, если j и k не смежны где k есть постоянная Больцмана, а Т — абсолютная темпера- температура. Если Z рассматривать как функцию температуры, то вну- внутренняя энергия ферромагнетика Лизинга равна U = kTi-fr\nZ, а теплоемкость . • -, С — Ш- ¦ " ¦¦¦¦'."-: Другие термодинамические характеристики "выводятся Из Z стандартными способами. -¦-¦.---. ; - :
38 Эллиотт В. Монтролл Пусть с есть число смежных точек для данной точки ре- петки. Тогда, поскольку 02" = 1, а 02п+1 = 0, мы имеем Nc C8) cN л где -„-есть общее число пар смежных точек, а На квадратной и на простой кубической решетках с = 4 и с = 6 соответственно. Раскроем произведение C8) Nc Z = (chKJ 2 ••• 2 Q(<tp o2, .... одг), C9) а,-±1 одг-±1 где Q (ор а2, ..., Од,) = 1 -f г 2 (<??;) Н- г2 2 (а^,-) 2 (о^г) + с. т. с. т. с. т. Коэффициент при г* является суммой всевозможных произведе- произведений 2s символов о. Различные символы 0 встречаются в Q па- парами, соответствующими парам смежных точек, и ни одна пара не входит в произведение более чем один раз. Можно построить диаграмму, которая представляла бы про- произведение различных о путем введения связей, соединяющих ка- каждую пару точек i и /, соответствующую сомножителю (о*, Oj). Поскольку никакая пара смежных а не повторяется в данном произведении, то никакая связь не встретится в данном графе более одного раза. На рис. 10 построен граф, соответствующий члену который типичен для членов разложения Q (аи ..., ojy). По- Поскольку 2 о = 0 и 2 а2 = 2, о—±1 а-±1 то ненулевыми в разложении Z будут только те члены, в кото- которых каждая из а, встречается четное число раз. Поскольку лю- любая пара может появиться в каждом члене только один раз, то фиксированная а, может встретиться самое большее с раз (на- (например, четыре раза на квадратной решетке). Это значит, что нас интересуют только те графы, в которых каждая точка ре-
Статистика решеток 39 шетки входит в четное число связей @,2 или 4). Тогда все не- ненулевые графы должны получаться наложением простых замк- замкнутых многоугольников (многоугольников без самопересечений), которые не имеют общих сторон, но могут иметь общие вер- вершины. И наоборот, каждой суперпозиции простых замкнутых многоугольников соответствует ненулевой член в Z. Многоуголь- Многоугольники, являющиеся суперпозицией простых многоугольников, 7 8 10 I о о о о 2 3 4 5 Рис. 10. Типич- Типичный граф для чле- члена разложения функции разбиения Лизинга. Рис. 11. Типичный ненулевой (замкну- (замкнутый) граф для члена разложения функции разбиения Лизинга. могут взаимно пересекаться при условии, что не возникнут крат- кратные связи. Для простоты назовем такие графы замкнутыми гра- графами (рис. 11). Каждому замкнутому графу из m ребер соот- соответствует в Z член zm 2N после суммирования по всем 0ь ..., сг;у. Отсюда функция разбиения может быть записана в виде Nc 2 D0) где п(г) есть число замкнутых графов из г ребер, которые мо- могут быть построены на решетке. Очевидно, что п(О)--—1 и на квад- квадратной или простой кубической решетке п(г) = 0, если г нечетно. Можно обобщить формулу D0) так, чтобы она включила константу анизотропного взаимодействия [23]. Если, напри- например, К представляет взаимодействие между точками решетки, лежащими в одном горизонтальном ряду, а К' — парное взаимо- взаимодействие между точками в одном вертикальном ряду, то мы по- получим Z J D1) где n(r, s) есть число замкнутых графов с r+s ребрами г по горизонтали и s по вертикали.
40 Эллиотт В. Монтролл Мы могли бы вначале применить формулу D0) для под- подсчета функции разбиения для кольца из N точек. Ясно, что единственный замкнутый граф, который может быть нарисован на кольце, если не вводить двойных связей, это кольцо с N реб- ребрами, которое полностью очерчивает данное кольцо. Такой граф может быть построен единственным образом. Поскольку с = 2 для кольца, мы получим Z = 2N (ch K)N \n @) + п (N) th" К] = hK)N~BchK)N при 7V->oo. Термодинамика двумерной модели Лизинга была впервые рассмотрена Онзагером [13], [24]. Этот расчет был очень важен, поскольку это был первый пример, ясно показывающий, что ста- статистическая физика способна описать фазовый переход в дан- данном случае от упорядоченного ферромагнитного состояния к не- неупорядоченному немагнитному состоянию. Кац и Уорд выразили функцию разбиения в виде некоторого определителя и получили результаты Онзагера другим путем [10], [23], [27]. Но в их вы- выводе не было строгости, вскоре этот недостаток был устранен Шерманом [28]. Хурст и Грин [9], [4] переформулировали теорию Каца — Уорда в терминах пфаффианов в работе, которая вдох- вдохновила Фишера и Кастелейна на работу о димерах. Наконец, Кастелейн [12] недавно показал зависимость между задачей Ай- зинга и задачей о димерах. Сейчас мы выводим результаты Онзагера, пользуясь этой связью. Рассмотрим димеры на «кафельной» решетке и замкнутые графы, которые нас интересовали в связи с задачей Лизинга для квадратной решетки. Введем еще одну степень свободы в расположении димеров. Позволим димерам быть диагоналями в маленьких квадратах и разрешим диагональным димерам пе- пересекаться между собой, но при этом, как и прежде, ни одна точка решетки не должна быть покрыта двумя димерами. (Мы могли бы рассматривать маленькие квадраты как города, а го- горизонтальные и вертикальные связи как дороги, соединяющие данные города.) Для каждого замкнутого многоугольника в задаче Лизинга можно найти соответствующую ему димерную конфигурацию на кафельной решетке. Сравните, например, рис. 12 и 13. Каждая точка квадратной решетки в графе Лизинга может быть пересечением четного числа ребер @, 2, 4); ни одна точка решетки не может быть местом встречи нечетного числа ребер графа. Существует взаимно однозначное соответствие между горизонтальными и вертикальными димерами, соединяющими маленькие квадраты на кафельной решетке, и горизонтальными
Статистика решеток 41 и вертикальными ребрами, соединяющими соседние точки на квадратной решетке Лизинга. Рис. 12. Граф Лизинга. На кафельной решетке не существует такой димерной кон- конфигурации, в которой сходились бы только два вертикальных и один горизонтальный димер (или наоборот), потому что иначе А\ А\ А\ /N. /у\ /Г\ \ А\ N1/ /К УК XI/ N1/ Рис. 13. Димерная конфигурация иа кафель- кафельной решетке, соответствующая рис. 12. точка 1 (или аналогичная ей) рис. 14,а осталась бы не занятой. Аналогично не может существовать димерной конфигурации, в которой с маленьким квадратом кафельной решетки соединен только один горизонтальный (или вертикальный) димер (см.
42 Эллиотт В. Монтролл рис. 14,6). Следовательно, запрещенные конфигурации на квад- квадратной решетке Лизинга являются запрещенными конфигура- конфигурациями на кафельной решетке. Полное соответствие между димерными и айзинговыми кон- конфигурациями будет установлено, если будет показано взаимно \ />] Рис. 14. Иллюстрация того, что не сущест- существует димерной конфигурации, в которой с ма- маленьким квадратом связано нечетное число внешних связей, так как в противном случае одна точка остается непокрытой. однозначное соответствие между всеми конфигурациями Лизин- Лизинга на квадратной решетке и димерными конфигурациями на ка- кафельной решетке. Каждая точка квадратной решетки Лизинга J Рис. 15. Соответствие между димерными конфигурациями и кон- конфигурациями Лизинга. может находиться в одном из четырех возможных состояний: с четырьмя присоединенными связями, с двумя присоединенны- присоединенными связями в одном направлении, с двумя связями под прямым углом и без связей вообще. Точке на решетке Лизинга, в которой сходятся две горизонтальные связи, взаимно однозначно соот- соответствует димерная конфигурация на рис. 15, а. Точке, в которой сходятся одна горизонтальная и одна вертикальная связи, взаим- взаимно однозначно соответствует димерная конфигурация на рис. 15, б. Точке, в которой сходятся четыре связи, взаимно однозначно со-
Статистика решеток 43 ответствует димерная конфигурация кафельной решетки на рис. 15, в. Только одна ситуация подлежит особому исследованию. Это ситуация, в которой точка решетки Лизинга не связана с дру- 4 а б в Рис. 16. Три димерные конфигурации, в которых малень- маленький квадрат не связан с соседними квадратами. гими точками. Если будет установлено взаимно однозначное со- соответствие и в этом случае, то оно будет установлено полностью между всеми положениями точек решетки Лизинга и димерными конфигурациями кафельной решетки. Однако здесь возникает трудность. Как становится ясным из рис. 16, существуют три димерные конфигурации, в которых малый квад- квадрат не связан с соседни- соседними. Таким образом, в этом случае возникает три-од- нозначное соответствие. К счастью, у нас есть еще надежда. Мы можем при- приписать знаки различным димерным конфигурациям такого типа. Если членам разложения пфаффиана, которым соответствуют описанные выше димер- димерные конфигурации, припи- приписать знаки таким обра- образом, чтобы конфигураци- конфигурациям а и б рис. 16 соответ- соответствовал знак +, а конфи- конфигурации в — знак —, то Рис. 17. Расположение стрелок, удовле- удовлетворяющее описанным требованиям. два члена разложения пфаффиана взаимно уничтожатся и ос- останется один, что и требуется. Итак, требуется найти такое рас- распределение знаков на кафельной решетке, чтобы сделать поло- положительными все члены разложения пфаффиана, за исключением тех членов, которым соответствуют конфигурации со скрещи- скрещивающимися димерами. Эти последние должны быть сделаны отрицательными.
44 Эллиотт В. Монтролл непосредственно убедиться, что расположение стре- стрелок, изображенное на рис. 17, удовлетворяет нашим требова- требованиям. Сначала рассмотрим именно те направленные связи, ко- которые проходят внутри малых квадратов. Каждый малый квад- квадрат, например {1, 2, 3, 4}, и каждый восьмиугольник, например {4, 3, 5, 6, 7, 8, 9, 10}, положительно нечетны, так что все супер- суперпозиционные многоугольники, не имеющие сторон внутри ма- маленьких квадратов, тоже положительно нечетны. Теперь введем направление влево на горизонтальных связях каждого малень- маленького квадрата. Треугольники, на которые горизонтальные связи разбивают квадраты, по-прежнему положительно нечетны, тот же результат справедлив и для направленных вниз вертикаль- вертикальных связей. Следовательно, все суперпозиционные многоуголь- многоугольники, не содержащие пересекающихся связей, положительно не- нечетны, а все димерные конфигурации, находящиеся во взаимно однозначном соответствии с айзинговыми конфигурациями, встречаются со знаком плюс в разложении димерного пфаф- фиана. Теперь рассмотрим подробно каждую из димерных конфи- конфигураций рис. 16. Предположим, что все точки решетки, не вхо- входящие в некоторый малый квадрат, покрыты какой-либо димер- димерной конфигурацией. Такая конфигурация имеет место для трех членов димерной производящей функции. Каждый из этих чле- членов можно разбить на два множителя, один множитель соответ- соответствует данному маленькому квадрату, а другой — димерной кон- конфигурации остальных точек решетки. Ясно, что второй множи- множитель будет общим во всех трех членах и его можно вынести за скобки. Оставшееся в скобках выражение является суммой трех слагаемых. Каждое из этих трех слагаемых разбивается на два множителя, и мы можем считать все выражения в скобках раз- разложением пфаффиана A7), составленного для маленького ква- квадрата. Первый член разложения A7) соответствует рис. 16, а, второй — рис. 16,6, и третий — рис. 16, в. Припишем значение а(М)=1 D2) каждой связи, направленной от i к / на малом квадрате, тогда a(i> 0 ——1 из условия антисимметрии. Для направлений свя- связей, обозначенных на рис. 16, разложение A7) принимает зна- значение Следовательно, при условии D2) данному малому квадрату, как и вообще любому малому квадрату, покрытому двумя ди- мерами, соответствует множитель 1 в члене разложения димер- димерного пфаффиана.
Статистика решеток 45 Если мы припишем следующие значения горизонтальным и вертикальным сторонам больших восьмиугольников на кафель- кафельной решетке: г, для каждой горизонтальной связи, направ- направленной от / к /, D3) г2 для каждой вертикальной связи, направлен- направленной от / к у", то мы можем показать, что функция разбиения Лизинга D1) имеет вид z = BchK-chK')NP(A), D4) где Р(А) есть димерная производящая функция с вышеопреде- вышеопределенными весами. Рассмотрим член разложения пфаффиана. Он соответствует димерной конфигура- конфигурации, в которой некоторое число малых квадратов покрыто внутрен- внутренними димерными конфигурациями без связи с другими малыми квад- квадратами. Таким квадратам соответ- соответствует множитель в первом члене. Другие малые квадраты связаны го- горизонтальными и вертикальными связями с соответствующими весами Zj и z2, как это требуется в задаче Лизинга. Эти димеры создают кон- конфигурации, соответствующие неко- некоторым замкнутым графам в зада- задаче Лизинга. Из предыдущего наше- нашего обсуждения следует, что каждый член разложения D4) соответствует члену разложения D1), и наоборот; знак каждого члена плюс, как это следует из D2), что и требовалось достичь с помощью распределения знаков на ре- решетке. Продолжим теперь вычисление пфаффиана Р{А) путем вы- вычисления соответствующего ему кососимметричного определи- определителя B6), значение которого есть [P(/4)]2. Наша кафельная ре- решетка будет иметь симметрию квадратной решетки, если в ка- качестве элементарной ячейки взять квадрат, содержащий внутри себя малый квадрат, как это изображено на рис. 18. Каждая элементарная ячейка характеризуется парой (рь р2), как это делалось в п. 6. Здесь, однако, индекс Г принимает четыре значения: L, R, U, D вместо двух, поэтому мы имеем теперь че- четыре вместо двух узлов элементарной ячейки. L представляет Рис. 18. Пунктирные квадра- квадраты, соответствующие элемен- элементарным ячейкам на кафельной решетке.
Эллиотт В. Монтролл левую, R— правую, U—верхнюю и D—нижнюю точку на ма- маленьком квадрате. Матрицы второго порядка А(р, р') для про- простой квадратной решетки должны быть заменены матрицами четвертого порядка, имеющими вид Pv P'v R L U R L U D a(pv p2, R; p[, р'ъ R) ... D _a(pv p2, D; p[, p'y R) Как и в п. 6, только ненулевые матрицы A(pi, р2; р[, р2) войдут в B7), и Л(рр р2; р[, р0 зависит только от р[ — рх и р2 — р2, т. е. от вектора р' — р, так что, повторяя B9), мы запишем со- сокращенно A(Pv Pv Pv Р2) = а(Р\ — Pv P'2 — Р?)- Мы также наложим периодические граничные условия. Сначала мы найдем R L U D ъ Pv Pi) = R L U D О 1—1—1 — 1 0 1—1 1—10 1 1 1 —1 о а@, 0). Верхняя строка соответствует связям между правым углом ма- малого квадрата и различными другими углами. Поскольку дан- данная точка не может быть соединена сама с собой, элемент (R, R) равен нулю. Элемент (R, L) соответствует димеру, связываю- связывающему правую точку с левой. Его значение 1, поскольку он на- направлен от R к L на рис. 17. Элементы (R.U) и (R, D) отрица- отрицательны, поскольку связи направлены к R. Вообще элемент в строке Г и столбце Г' положителен, если связь, соединяющая Г и Г', направлена к Г', и отрицателен, если она направлена к Г. Далее рассмотрим А{ри р2; pi+1, Pz). Эта матрица связы- связывает данную ячейку с соседней справа ячейкой. Правый угол левой ячейки может быть соединен с левым углом правой ячейки. Никаких других связей не может быть. Поскольку эта связь горизонтальная, ей дается вес z% [см. D3)], поэтому a {Pv />2> R> Pii- 1. />2. ?) = «!
Статистика решеток 47 ft! А Аналогично получим (а. Л)= R L D R L U D Q г, О О 0 0 0 0 0 0 0 0 0 0 0 0 О 0 0 0 — z, О О О л (а. а; а. а+1)= ¦Л(a. a; a. a — i): О О 0 0 0 0 0 0 О О О о о о 0 0 0 0 0 0 0 0 0 0 0 0 z2 0 _ о о о о = а(— 1, 0), a (I, 0), 0 0 0 0 _0 0 — г2 0_ = а@, —1). Все другие а(и, и) нулевые. На решетке с nXn = N элементар- элементарными ячейками, соответствующей пХп решетке Лизинга, значе- значение [Р(А)]2 = detА дается формулой B5) при П\=-П2 = п: 2я 2я In det Я- (ф15 D5) О О где 4-а @, 0 1 + z A-t-г^-'»-) О 1 —1 1 1 1 1 0 —1 —1 1 + z2e>> о
48 Эллиотт В. Монтролл Отсюда мы получим det Я,(ф1, ф2) = = (l+z?)(H-4)-2z1(l-^cos?I-2z2(l-z?)cos?2. D6) Комбинируя D4), D5), D6) и D1), мы получим знаменитое равенство, впервые найденное Онзагером: 2л 2л w In Z = In 2 + -^p- J J о о где Q = In (ch 2/Ci ch 2K2 — sh 2/Ci cos ф; sh 2/C2 cos cp2). В симметричном случае мы получим К2 = К\ = К = -г~ , и внутренняя энергия точки решетки равна -1 B th2 2/C - ] где ^! = 2sh 2/C • ch~2 2/C, a /Ci (^i) есть полный эллиптический ин- интеграл первого рода, а именно я/2 2 Критическое состояние наступает при 2th2 2/C = 1, когда система изменяет свое состояние; это состояние является упорядоченным (ферромагнитным) при низких температурах и хаотичным при высоких. Здесь отсутствует скрытая теплота. Теплоемкость равна С=-^~г. Поскольку один из членов Е пропорционален \Т — 7'с|1п|7'—Тс\ в окрестности Т-—Тс, то в С есть член, пропорциональный 1п|Г—Тс\, поэтому теплоем- теплоемкость имеет логарифмическую особенность, так называемую Я-точку в Тс. Функция разбиения модели Лизинга в магнитном поле есть производящая функция для некоторой задачи на решетке, у ко- которой в каждой точке определена переменная, принимающая два значения, и существует взаимодействие между соседними точками решетки. 8. Некоторые замечания о периодических граничных условиях Вычисления п. 6 и 7 были сделаны при использовании перио- периодических граничных условий. Представляет интерес обосновать в общих чертах это упрощение. Центральной задачей п. 6 и 7
Статистика решеток 49 было вычисление определителя кососимметрической матрицы, который равен квадрату искомого пфаффиана. Элементы косо- симметрической матрицы Л удовлетворяют, конечно, условию а(р, р') = — а(р', р) = е1яа{р', р). Задача о вычислении собственных значений 2 D7) р' может быть сведена к другой задаче о вычислении собственных значений 2*(/>./О Ф (/>') = W(/>). D8) где Ь(р, р') являются элементами эрмитовой матрицы В. Пусть in b(p, р') = ета(р, р'), где элементы а(р, р') вещественны, как и в п. 6 и 7. Тогда л — I ¦ >', р) = е *а(р', р) = е 2 а(р, р') = Ь'(р, р% где Ь* — комплексно сопряженное к Ь. Если мы положим то из D7) будет следовать D8). Пусть {Xj} и {щ,-} суть множе- множества собственных значений матриц А и В соответственно. Тогда если Л, а значит и В, суть квадратные матрицы порядка N. Легко видеть, что \п\е 2 det А) = In det В = ^ 1п ц, = | где ^(ц) есть функция плотности распределения собственных значений ц, матрицы В, т. е. g(\i)dyL есть число собственных значений матрицы В, заключенных в интервале (ц, |.i + d(j,). По- Поскольку матрица В эрмитова, то все [i действительны. Следующая фундаментальная теорема дает обоснование за- замены матрицы А матрицей А' с периодическими элементами. Теорема Лидермана [14]. Если в эрмитовой матрице элементы, лежащие на пересечении некоторых г строк и соот- соответствующих им столбцов, некоторым образом изменить, причем 4 Зак. 909
50 Эллиотт В. Монтролл так, чтобы матрица осталась эрмитовой, то при этом число собственных значений матрицы, заключенных в некотором за- заданном интервале, не может увеличиться или уменьшиться бо- более чем на 2г. Пусть В' есть матрица с периодическими элементами, кото- которую мы взяли вместо исходной матрицы В. Собственные значе- значения матрицы В' объединим в пары ц±(Ф,, Ф2)= ±2^sin2-^-4-4sm %) ' где ф! = —— и ф2 = • при N — nm [см. C5) и C6)]. При N —*¦ оо распределение собственных значений [i в пределе ста- станет всюду плотным на интервале 1 Следовательно, некоторый маленький подинтервал А\х этого ин- интервала будет содержать N собственных значений. При исполь- использовании периодических граничных условий, однако, элементы матрицы для всех элементарных ячеек, лежащих на границах решетки, терпят некоторые изменения. Поскольку число гра- граничных ячеек есть 2(n + m) = 0{\/~N), то из теоремы Лидер- мана следует, что число собственных значений матрицы на ин- интервале изменяется не более чем на O(\/"N) в результате изме- изменения граничных условий. Следовательно, g(\x), которая есть O(N), изменяется только на O(YN), т. е. на величину, которой можно пренебречь в пределе при N —* оо. Так обосновывается использование периодических граничных условий. 9. Статистика решеток с небольшими дефектами До сих пор мы имели дело только с идеальными периодиче- периодическими решетками. Иногда бывает нужно понять влияние не- небольшого числа «дефектных» точек или связей на решетке. Мно- Многие важные свойства твердых тел являются следствиями не- небольшого числа дефектов типа инородных включений или пустот. Многое в технологии производства полупроводников основано на таких свойствах. Локальные колебания кристаллов часто возникают вблизи дефектов. Было разработано множество математических приемов при исследовании таких задач. Неко- Некоторые из них будут рассмотрены здесь в применении к стати- статистике решеток. Поскольку объем статьи ограничен, мы рассмо- рассмотрим только самые простые примеры.
Статистика решеток 51 Начнем с исследования влияния небольшого числа «дефект- «дефектных» точек на случайные блуждания. В соответствии с п. 2 и 3 вероятность P(+i(l) того, что блуждающая частица окажется в точке I после / шагов, определяется системой уравнений Л+1A) = 2*A. 1')Л(П. D9) где яA, 1') есть вероятность шага из I' в I при условии, что ча- частица находится в точке V. Для идеальной решетки яA, I') счи- считается функцией только от I — I'. Поскольку на неидеальной ре- решетке некоторые точки отличаются от других, то для нее это неверно. Запишем яA, I') следующим образом: яA, 1') = рA_Г) + <7A, Г), E0) где член р(\ — I') тот же, что и для идеальной решетки, а член q(\, V) является возмущением. После нескольких шагов частица будет находиться в какой-нибудь точке решетки, поэтому 2яA, l')=1 для всех Г. Это равенство соответствует сохранению частицы. Для идеаль- идеальной решетки было справедливо выражение A1) . Следовательно, 2 ?A, 1') = 0 для всех 1'. 1 Пусть G(l, г) есть производящая функция для 0A, г)=2*'ЛA)- t-o В предположении, что при ^ = 0 перед первым шагом частица находится в точке 10, мы имеем /Ml) = 6,, и- E1) Умножив D9) на z'+1, просуммировав от t = 0 до t = oo и объеди- объединив E0) и E1), получаем 0A, z) — 61|1о = г|яA, 1')О(|', г) или 0A, г)-г2рA-ГH(Г, *) = в|, i. + *2?(Ь У
52 Эллиотт В. Монтролл Эта система линейных уравнений может быть решена при помощи функции Грина U(\, г), которая является решением уравнения UA, г) — z 2 рA — 1') U (Г, z) = 6,, о. E2) Точная формула для ?/A, г) может быть найдена для блужда- блужданий на различных кубических решетках (п. 2) и для общего случая блуждания по решетке (п. 3). Неоднородное уравнение 0A, г) —гЦ/>A —l')O(l', z)=F{\) E3) г имеет решение О A, г) = 2 ?/ A — 1', г) /41'), E4) что можно проверить, подставив это выражение в левую часть E3) и использовав E2), чтобы получить правую часть E3). Если мы теперь положим /ГA) = 6).10+г2^A, l')O(l'.z) в E3), то E4) примет вид 0A, г) = % U (]-Y, г)[бГ,,0 + г2<7A'. ПО (Г, г)], или GA, г) = УA-10,г) + г|?/A-1',г)?(Г, Г)G(Г, г). E5) Вообще говоря, это уравнение может быть решено методом итераций. Однако при специальном условии, что ^A, 1') обра- обращается в нуль везде, кроме нескольких точек, скажем, l' = li, 1г, .... In- и 1 = 1ь Ь, ..., \п, можно получить решение в конечном виде. Пусть перемен- переменная 1 пробегает все множество возможных значений. Тогда при /=1,2 п' мы получим О A,, z) = U A, -10, z) + z 2 it/ A, - \k, z) q A», lm) 0 (lm, г). ft—1 m—1 Эта система уравнений может быть разрешена относительно не- неизвестных G(lj, z). Подставив это решение в E5), мы получаем 0A, г) = ?/A-1о, гL-г2 2 «/A-1*. г) 9 О*- UOA,-, г). E6) Чтобы проиллюстрировать применение этого результата, вы- выведем формулу влияния дефектов на решение задачи Пойа.
Статистика решеток 53 Пусть частица начинает блуждание из начала координат. При 1о=О вероятность того, что она никогда не вернется в начало, была получена в п. 2 и равна G @, 1) • На идеальной решетке она равна т/ЖТГ • н0 на решетке с де- дефектами производящая функция G(l, z) играет ту же роль, что и ?/A, г) для идеальной решетки. Следовательно, вероятность невозвращения к началу блуждания равна 2 2 U{-\k, ])q(lk, \m)G(lm, 1) ft-l m-\ Теперь используем эту формулу в особом случае. Пусть не- неотрицательное q есть q(\v 10 = е и ^A, 10 = — Ъо~ • если точка 1 является смежной для lt для S-мерной простой кубической решетки, на которой частица по- попадает с каждым шагом в смежные точки с равными вероятно- вероятностями. Если 8=1, то тогда точка 1) является поглощающей «ло- «ловушкой» для блуждающей частицы. Если е<1, то частица, попав в 1Ь остается там с вероятностью е в момент, когда она в нормальных условиях сможет делать следующий шаг. Тогда из формулы E6) при 10 = 0 мы имеем 0A, г) = ?/A, г)+ 260 0!, z)\U(\-lv г)- ±- где {1ft} представляет собой множество точек, смежных с h. Из E2), в применении к данному случаю, мы получим так что 0A, z) = U(h г) + е|(г-1)?7A— Ц, 2) + 6,_i1,o]0(li, г). Может быть найдено выражение для G(li, г) при условии l Тогда мы имеем 0A z)- U{h'z) z) с>~ (\ — еL-еA— г) U®, г)' так что, если l^li, 0A z)~
54 Эллиоту В. Монтролл Основная величина в задаче Пойа определения вероятности не- невозвращения к началу блуждания есть G@, 1), которая имеет вид 0,0, !,_>, Как и следовало ожидать, размерность играет важную роль при исследовании влияния дефекта на невозмущенное решение ?/@,1). Функция |?/A, z) | ограничена для трехмерной решетки и ( U @, 1), если е< 1, O<a"=jt/@.1,-I^fl, если . = 1. Отсюда следует, что если е < 1, возмущение не влияет на ве- вероятность возвращения в начало. С другой стороны, если точ- точка li является ловушкой, из которой частица никогда не вер- вернется (е=1), то имеет место поправка к U@, 1). Пусть |h| есть расстояние от начала блуждания до ловушки. Тогда при )lt j —> оо мы имеем Эта асимтотическая формула, так же как и другие свойства, и таблицы функции 0A, z) приведены в [18]. Из п. 1, однако, мы знаем U@, 1)= 1,51638 ... ==и. При |li|—юо вероятность невозвращения в начало становится равной Таким образом, вероятность невозвращения к началу блужда- блуждания увеличивается на величину, обратно пропорциональную ква- квадрату расстояния поглощающего дефекта от начала блужда- блуждания. Для одномерной решетки мы имеем Отсюда получим cos lx dx
Статистика решеток 55 При z —* 1 мы имеем ПРИ { ( 2/х при е=1. ь-^- Тогда из E7) вероятность невозвращения в начало есть-^- при е=1. Некоторые функции, которые появляются в статистике ре- решеток, могут быть выражены как аддитивные функции соб- собственных значений соответствующих матриц. Пусть {%,} есть множество собственных значений матрицы М. Тогда такая ад- аддитивная функция имеет вид Примером является характеристическая функция распреде- распределения собственных значений матрицы Обратное преобразование Фурье от этой функции (а является параметром преобразования Фурье) есть просто функция плот- плотности распределения собственных значений. Определитель ма- матрицы М есть откуда является также аддитивной функцией собственных значений. Производящая функция димерных конфигураций (см. C4)), а также функция разбиения Лизинга являются аддитивными функциями собственных значений. Подробный расчет влияния дефектов на число димерных кон- конфигураций и на свойства модели Лизинга слишком громоздок, и мы не будем на нем останавливаться. Вместо этого мы лишь в общих чертах наметим аппарат исследования сумм аддитив- аддитивных функций. Этот аппарат может быть использован в теории влияния дефектов на колебания решетки, а также в теории ядерных взаимодействий мезонных пар.
56 Эллиотт В. Монтролл Пусть kj является корнем характеристического уравнения Если то dX ~~~ ИХ — Контур интегрирования С обходится по часовой стрелке и со- содержит внутри себя все точки Xj. При этом функция /(г) не должна иметь полюсов внутри контура С. Пусть detM0(k) =g(k) для идеальной решетки. Предполо- Предположим, что соответствующая матрица для решетки с дефектами есть Тогда мы имеем det М = (det Щ [det (/ + Л^1)]. In detМ = In det М0-\-\пdet(/ + M0"'A). Если Fo есть аддитивная функция для идеальной решетки, а именно - -J- Г с то изменение F, обусловленное существованием дефектов/ есть -F _F L Г Элементы Л/о есть по существу функции Грина, рассмотрен- рассмотренные в начале этого пункта, и мы полагаем, что они известны. Тогда, хотя det Мо есть определитель с большим числом строк и столбцов, det (/+ Mo"' Л) может быть сведен к малому числу
Статистика решеток 57 строк и столбцов при небольшом числе дефектов, т. е. если Д имеет небольшое число ненулевых элементов. Рассмотрим простейший пример = e, а все другие Дг;-= 0. Тогда мы имеем ^Д = -1 0 0 0 1 0 0..." 0... 1...  0 0 — 0 1 0 о.. о.. 1 .. 1 . 0 . 0 _ 1 0 д** Ми Дм М^ Akk 0 . 0 . 0 0 0 0 1 0 д о - 0 1 Значение определителя матрицы (/-f-УИо1 Д) вычисляется пу- путем разложения по столбцам. Получим откуда 1 f dz -dz. Применения этой формулы весьма многочисленны в теории ко- колебаний решеток. Функции Мы для простых кубических ре- решеток недавно были иротабулированы. Вопросы для самопроверки 1. Димер есть: а) метод покрытия двойной периодической решетки; б) двухатомная молекула; в) предмет, стоящий десять центов; г) ни одно из перечисленных неверно.
58 Эллиотт В. Монтролл 2. Пфаффиан есть частный случай: а) матрицы; б) определителя; в) квадратичной формы; г) ни одно из перечисленных неверно. 3. Некоторая эрмитова матрица (а,-,) порядка 5 имеет собственные значения —3, 0, 3, 5, 8. Если значение ац увеличить на 7, то полу- получившаяся матрица необходимо имеет в интервале D.9): а) по меньшей мере одно собственное значение; б) ровно два собственных значения; в) самое большее четыре собственных значения; г) ни одно из перечисленных неверно. 4. Значение пфаффиана |3 4 2 1 5 7 а) 3; б) 4C —X.J —2A — ХJ + 5G-ЯJ; в) равно значению определителя соответствующей кососимметрическ матрицы; г) ни одно из перечисленных неверно. 5. Суперпозиционный многоугольник а) обязательно положительно четный; б) обязательно положительно нечетный; в) может быть как положительно четным, так и положительно нечет- нечетным; г) нельзя приписать никакой положительной четности. ЛИТЕРАТУРА [1] С a i a n i е 11 о Е. R., Theory of Coupled Quantized Fields, Nuovo Ci- mento, A0), 14 A959), Supplement, 177—191. [2] Domb C, On Multiple Returns in the Random-Walk Problem, Proc. Cam- Cambridge Philos. Soc, 50 A954), 586—591. [3] Domb C, On the Theory of Cooperative Phenomena in Crystals, Advan- Advances in Phys., 9 A960), 149—244. [4] Dyhne A. M., Rumer Ju. В., Thermodynamics of a Plane Ising-Onsa- ger Dipole Lattice, Soviet Physics Uspekhi, 4 A962), 698—705. [5] Ф е л л е р В., Введение в теорию вероятностей и ее приложения, т. 1, «Мир». М., 1964. [6] Fisher М. Е., Statistical Mechanics of Dimers on a Plane Lattice, Phys. Rev., 124 A961), 1664—1672. [7] F о s t e r F. G., Good I. J., On a Generalization of Polya's Random- Walk Theorem, Quart. J. Math., B), 4 A953), 120—126. [8] Fowler R. H., Rushbrooke G. S., Statistical Theor> of Perfect Solu- Solutions, Trans. Faraday Soc, 33 A937), 1272—1294.
Вопросы для самопроверки 59 [9] Н u rst С. A., Green H. S., New Solution of the Ising Problem for a Rectangular Lattice, /. Chem. Phys. 33 A960), 1059—1062. [10] К а с M., Ward J. C, A Combinatorial Solution of the Two-dimensional Ising Model, Phys. Rev., 88 A952), 1332—1337. [11] Kasteleyn P. W., The Statistics of Dimers on a Lattice, Physica, 27 A961), 1209—1225. [12] Kasteleyn P. W., Dimer Statistics and Place Transitions, /. Math. Phys. A963), 287—293. [13] Kaufman В., Onsager L., Crystal Statistics, II. Partition Function Evaluated by Spinor Analysis, Phys. Rev., 76 A949), 1232—1252. [14] Ledermann W., Asymptotic Formulae Relating to the Physical Theory of Crystals, Proc. Roy. Soc. London, Series A, 182 A943—1944), 362— 377. [15] Lifshitz I. M., Some Problems of the Dynamic Theory of Non-ideal Crystal Lattices, Naovo Cimento, A0), 3 A956), Supplemento, 716—734. [16] McCrea W. H., Whipple T. F. W., Random Paths in Two and Three Dimensions, Proc. Roy. Soc. Edinburgh, 60 A940), 281—298. [17] M a r a d u d i n А. А, Магиг P., Montroll E. W, Weiss G. H., Remarks on the Vibrations of Diatomic Lattices, Rev. Mod. Phys., 30 A958), 175—196. [18] Mara dud in A. A., Mont roll E. W., Weiss G. H., Herman R., Milnes H. W., Green's Fuctions for Monatomic Simple Cubic Lattices, Acad. Roy. Belg. Cl. Sci. Mem. Coll. in-A° B), 14 A960), No. 7, 1—176. [19] Montroll E. W., Random Walks in Multidimensional Spaces, Especially on Periodic Lattices, /. Soc. Indust. Appl. Math., 4 A956), 241—260. [20] Montroll E. W., Topics on Statistical Mechanics of Interacting Par- Particles, in Cecile de Witt (editor). La theorie des gaz neutres et ionises: Le probleme des n corps a temperature non nulle, John Wiley and Sons, New York, 1960. [21] Montroll E. W., Potts R. В., Effect of Defects on Lattice Vibrations Phys. Rev., 100 A955), 525—543. [22] Montroll E. W., Potts R. В., Effect of Defects on Lattice Vibrations: Interaction of Defects and an Analogy with Meson Pair Theory, Phys. Rev., 102 A956), 72—84. [23] Newell G. F., Montroll E W., On the Theory of the Ising Model of Ferromagnetism, Rev. Mod. Phys., 25 A953), 353—389. [24] Onsager L., Crystal Statistics. I. A Two-Dimensional Model with an Order-Disorder Transition, Phys. Rev., 65 A944), 117—149. [25] Peype W. F. van, Zur Theorie der magnetischen Anistropie kubisher Kristalle beim absoluten Nullpunkt, Physica, 5 A938), 465—483. [26] P б 1 у a G., Uber eine Aufgabe der Wahrscheinlichkeitsrechnung betreffend die Irrfahrt im Strassennetz, Math. Ann., 84 A921), 149—160 [27] Potts R. В., Ward J. C, The Combinatorial Method and the Two-Di- Two-Dimensional Ising Model, Progr. Theoret. Phys., 13 A955), 38—46.
60 Эллиотт В. Монтролл [28] Sherman S., Combinatorial Aspects of the Ising Model for Ferromag- netism 1. A Conjecture of Feynman on Paths and Graphs, /. Math. Phys., 1 A960), 202—217. [29] Те mpe r le у H. N. V., Fisher M. E., Dimer Problem in Statistical Mechanics —An Exact Result, Phil. Mag., 6 A961), 1061 — 1063. [30] Watson G. N.. Three Triple Integrals, Quart. 1. Math. Oxford Ser., 10 A939), 266—276. [31] Wentzel G., Pair Theory of Nuclear Forces, Helvetic Phys. Ada, 15 A942), 111—126. [32] R i о г d a n J., Generating functions, Applied Combinatorial Mathematics Wiley, N-Y, 1964, стр. 67—96.
ТЕОРИЯ ПЕРЕЧИСЛЕНИЯ ПОЙА Н. Дж. Де Брёйн 1. Введение Большая часть комбинаторного анализа связана с перечисле- перечислением: подсчет числа возможностей, числа решений, числа мно- множеств данного типа и т. д. Часто техническая трудность нахождения общих формул для требуемых чисел может быть преодолена методом произво- производящих функций, который является орудием в том смысле, что он «работает» для нас после небольших предварительных уси- усилий с нашей стороны, как показано в статьях Монтролла (стр. 9—60) и [17]. Многие трудности комбинаторного анализа имеют скорее принципиальную, чем техническую природу. Это случается, когда подсчет затрудняется тем, что различные объекты прихо- приходится рассматривать как равные. На современном языке это означает, что мы имеем на множестве объектов некоторое отно- отношение эквивалентности и подсчитываем не число самих объек- объектов, а число классов эквивалентности. Например, говоря, что существует ровно 5 правильных мно- многогранников, мы, очевидно, используем эквивалентность, связан- связанную с геометрическим подобием. Иногда отношение эквивалент- эквивалентности задается группой преобразований конечного множества объектов, и в этом случае имеется простой результат (Лемма 1, стр. 66): Число классов равно среднему арифметическому, взя- взятому по всей группе, от числа элементов, являющихся инвари- инвариантными для элементов группы. Третий тип трудностей в перечислении состоит в том, что перечисляемые объекты не всегда имеют одинаковый вес. На- Например, говоря, что каждое алгебраическое уравнение имеет ровно п корней, мы подразумеваем, что каждый корень берется с весом, равным его кратности. Эти три аспекта перечисления — производящие функции, эквивалентности, индуцированные группами, и веса — встре- встречаются вместе в изящной теореме, принадлежащей Пойа [10]. Поскольку в перечислении она занимает центральное положение, мы называем ее фундаментальной теоремой перечислительного комбинаторного анализа. Этой теореме посвящены п. 2—8,
62 Н. Дж. Де Брёйн а большинство остальных пунктов имеет дело с результатами, полученными в том же самом духе, и приводят к формулам того же типа. В большой и важной части статьи Пойа [10] речь идет о пе- перечислении деревьев. Эти вопросы здесь рассматриваться не будут, так как все понятия эквивалентности деревьев очень сложны. Мы их оставляем для статьи Харари, стр. 107—140 наст. сб. В этой статье мы будем стремиться элементарно изло- изложить и полностью описать комбинаторные понятия, заменяя первоначальные интуитивные представления конкретными поня- понятиями, такими, как множества и отображения. Однако в вопро- вопросах, связанных с классами эквивалентности деревьев, представ- представляется трудным провести эту программу при первом знакомстве, и, что еще хуже, от этого проиграло бы изящество предмета, в котором интуиция занимает такую большую часть. Смотрите статью Харари, стр. 107—140, и некоторые ссылки в п. 14. Мы предполагали, что читатель немного знаком с теорией групп, а в целом мы старались представить теорию как можно более просто, сопровождая изложение большим количеством численных примеров. Для обозначений, связанных с отображениями, мы следуем обычным современным соглашениям. Если / есть отображе- отображение множества S в множество Т, то через f(s) мы обозначаем образ элемента s€ S при этом отображении. Таким образом, f(s) есть элемент множества Т, и символ f(s) никогда не исполь- используется для обозначения самого отображения. Если f есть ото- отображение S в Т, и g есть отображение Г в У, то gf есть слож- сложное отображение, определяемое свойством, что для каждого &6S оно отображает s в g[f(s)]. Если далее h есть отображение множества U в множество V, то мы имеем равенство h(gf) = = (hg)f. В соответствии с этим мы можем при желании вообще опускать скобки и даже можем писать hgfs для обозначения образа элемента s6 5 при отображении hgf. Множество всех отображений множества S в Т обозначается через 74 Если S — конечное множество, то через \S\ обозначается число его элементов. Если G — группа, то \G\ называется по- порядком группы. Если имеется группа подстановок множества S, то \S\ называется степенью этой группы подстановок. 2. Цикловой индекс группы подстановок з". i'. Пусть S — конечное множество. Подстановка множества S — это взаимно однозначное отображение S на себя. Если л яодстановка и s некоторый элемент S, то ns обозначает эле-
Теория перечисления Пойа 63 мент, на который отобразился s подстановкой л. Если л4 и Яг — подстановки, то их произведение Л1Я2 определяется как сложное отображение, полученное применением сначала л2, затем Яь таким образом, для всех s?S имеем Хорошо известно, что если дана подстановка л, то можно разбить множество S единственным образом на циклы, т. е. подмножества S, такие, что их элементы циклически переста- переставляются подстановкой я. Если / — длина такого цикла и если s — некоторый элемент этого цикла, то цикл состоит из следую- следующих элементов: S, ns, Л25, . . ., я'-'S, где Я2 = яя и т. д. Если S разбивается на by циклов длины 1, 6а Циклов длины 2 и т. д., то мы говорим, что такая подстановка л имеет тип {bi, 62> Ь3 ¦ ¦ .}• Очевидно, Ь; = 0 для всех, кроме, быть может, ко- конечного числа индексов i; естественно, 6; = 0 для i > m, где m — число элементов S. Кроме того, ясно, что т. е. сумма длин циклов равна общему числу элементов мно- множества S. Определим теперь цикловой индекс группы подстановок. Если G — группа, элементы которой суть подстановки множе- множества S, причем групповой операцией является умножение, вве- введенное выше, то определим следующий многочлен от m пере- переменных Ху, . . . , хт с неотрицательными коэффициентами. Для каждого g? G образуем произведение х{хх22 . .. х^п, если {/?i, /?2, •¦-, Ьт} — тип g. Взяв сумму таких членов и разделив ее на число элементов в G, получим многочлен pQ(xv х2,..., хт)=| о г12 А1 А* ¦ ¦ ¦ <"'• который и назовем цикловым индексом группы G. Пример 1. Если G состоит лишь из тождественной подста- подстановки, то мы имеем Р0 = х™, так как тождественная подста- подстановка имеет тип {т, 0, 0, . . .}. Поскольку здесь Ра зависит от т, этот простой пример иллюстрирует тот факт, что цикловой ин- индекс группы G зависит не только от структуры самой группы G как абстрактной группы, но также и от интерпретации ее эле- элементов как подстановок множества S.
64 Н. Дж. Де Брёйн Пример 2. Пусть S — множество вершин куба, так что т = 8, и пусть G — множество всех тех подстановок S, которые мо- могут быть получены вращениями куба. Всего 6 X 4 = 24 таких вращений. Их можно разбить на пять категорий. (а) Тождественное. (б) Три поворота на 180° вокруг прямых, соединяющих центры противоположных граней. (в) Шесть поворотов на 90° вокруг прямых, соединяющих центры противоположных граней. (г) Шесть поворотов на 180° вокруг прямых, соединяющих середины противоположных ребер. (д) Восемь поворотов на 120° вокруг прямых, соединяющих противоположные вершины. Поскольку 1+3 + 6 + 6 + 8 = 24, этот список полон. Легко представить себе циклы множества S в каждом слу- случае. В случае (а)—восемь циклов длины 1; подстановки ти- типа (б) дают четыре цикла длины 2; в случае (в) два цикла длины 4; (г) дает четыре цикла длины 2; в случае (д) два цикла длины 1 и два цикла длины 3. Поэтому цикловой индекс таков: Пример 3. Пусть S—множество ребер куба, так что т=12, и пусть G— множество всех 24 подстановок S, которые могут быть получены вращениями куба. Вращения те же, что и в примере 2. Теперь надо посмотреть, что делают вращения с ребрами. Тождественное вращение — подстановка типа {12, 0, 0,...}. Вращения (б)—типа {0, 6, 0, 0,...}, в случае (в) — тип {0, 0, 0, 3, 0, ...}, в случае (г) — тип {2, 5, 0, 0, . . .} и в случае (д) — тип {0, 0, 4, 0 . . .}. Поэтому имеем рМ2 Пример 4. Опять возьмем вращения куба, но теперь пусть S — множество всех его граней. Наши пять категорий враще- вращений дают подстановки типов {6, 0, 0, ...}, {2, 2, 0, 0, ...}, {2, 0, 0, 1,0.. .}, {0, 3, 0, 0, . . .}, {0, 0, 2, 0, . . .} соответственно, и поэтому Пример 5. Пусть S — множество из т элементов и G — груп- группа всех подстановок S; т. е. G—так называемая симметриче-
Теория перечисления Пойа 65 екая группа степени т. Ее цикловой индекс оказывается рав- равным коэффициенту при zm в разложении йу„ ,г | Z Х2 . Z ХЪ . \ ,„. в ряд по степеням г. В примере 17 мы покажем, что это следствие теоремы Пойа. Можно также дать и непосредственное доказательство, кратко состоящее в следующем. Выражение B) может быть записано в виде ^2 АЛ ™ 2&2 *2 . . /. - и Х2 Коэффициент при zm получается суммированием выражений **оф ••• (Ь,! Ь21 2*^з 1 3** ...) C) по всем возможным 6Ь 6а, • • •, удовлетворяющим условию 6i + 262 + 3&3+ • • • —т. Не считая множителя пг\, коэффициент в C) равен числу подстановок типа {Ьи Ь2, ..¦)¦ Это доказывает наше утверждение. Пример 6. Пусть S — некоторая конечная группа, и пусть снова |5|=т. Если а — фиксированный элемент множества S, то отображение s-+as, как легко видеть, есть подстановка на множестве 5. Обозначив ее через ga, мы замечаем, что если а пробегает все множество 5, то такие подстановки ga образуют группу G. Имеем gagb = gab, и поэтому G изоморфно самой группе S, где изоморфизм определяется так: ga-*-+a- Группа О называется представлением Кэли группы S. Мы интересуемся ее цикловым индексом. Если а 6 S, то порядок а — это наименьшее положительное целое k, такое, что ah = e, где е — единичный элемент группы 5. Обозначим этот порядок через k (а). Подстановка ga разбивает 5 на циклы, длины которых все равны k(a): если s — некоторый элемент множества S, то он принадлежит циклу, образованному из следующих элементов: s --> as -->a2s-^- ... -> a" {a)s — s. Отсюда следует, что m делится на k(а) и что подстанов* Ка ga разбивает 5 на m/k(a) циклов длины k(a). Таким образом, мы получаем цикловой индекс: 5 Зап. 909
66 Н. Дж. Де Брёйн Эта сумма может быть записана также так: fld, E) dim где d пробегает все делители пг, a v(d) —это число элементов ad S, порядок которых k(a) — d. Пример 7. В качестве частного случая примера 6 возьмем следующую циклическую группу подстановок. Пусть S — группа всех корней т-й степени из единицы е2пц/т^ где j=\t ..., пг, a i — мнимая единица. Тогда для каждого а? S отображение s -> as является под- подстановкой S, а группа этих подстановок — циклическая. Если a = e2ni'im, то порядок элемента а равен k(a) =т/(т, /), где (пг, /) — наибольший общий делитель пг и /. Поэтому в силу D) цикловой индекс т Р — 1 \(у \<т- Л Второе выражение получается из E): dim где ф — функция Эйлера, т. е. ф(с?) —это число целых п, удо- удовлетворяющих условию 1-^-n^.d, (n, d) — \. Пример 8. Пусть G — группа подстановок множества S, и пусть Н — группа подстановок множества Т. Предположим, что множества S и Т не имеют общих элементов и пусть U — их объединение. Любому выбору g€ G и /г?# соответствует под- подстановка множества U, определенная так: u-*gu, если u?S, u—>hu, если и ? Т. Обозначим такую подстановку множества V через gXh. Легко видеть, что эти подстановки образуют группу, порядок которой равен произведению порядков G и Я. Эта группа назы- называется прямым произведением групп G и Я и обозначается че- через GXH. Если g(z G и /г?Я и если g имеет тип {Ь{Ь2, .. .}, а /г —тип {сь Съ .. .}, то gXh. имеет тип {bi + cu Ь2 + с%, ...}, так как каждый цикл в U лежит либо целиком в S, либо целиком в Т. Отсюда член циклового индекса группы GxH, соответствующий эле- элементу gXh, равен произведению члена в Ро. соответствующего
Теория перечисления Пойа 67 элементу g, и члена в Рн, соответствующего h. Применив это ко всем членам PG и всем членам Рн, получим формулу для произ- произведения Pqxh^Pq • Рн- Замечание. Тип перестановки g позволяет делать некоторые выводы о перестановке и о степенях g2, g3, .... но мы очень мало можем сказать о типе произведения gig2, исходя из типов сомножителей. Соответственно, хотя цикловой индекс может дать информацию о комбинаторных вопросах, касающихся группы подстановок, он мало говорит о мультипликативной структуре группы. Действительно, Пойа [10, стр. 176] дает при- пример двух неизоморфных групп подстановок с одинаковыми цикловыми индексами. Таким образом, цикловой индекс не все- всегда определяет группу однозначно. Пойа берет две неизоморфные группы порядка р3, где р>2 простое, которые обладают тем свойством, что каждый эле- элемент, кроме единичного, имеет порядок р. В результате выражение E) для циклового индекса пред- представления Кэли дает один и тот же результат в обоих случаях, 3. Основная лемма Основную часть теории Пойа составляет простая лемма, по- видимому, впервые опубликованная Бёрнсайдом ([3], разд. 145, теорема VII). Для удобства мы дадим здесь более общую лемму; она тем не менее является тривиальным следствием ори- оригинала. Лемма, которую мы приведем, имеет дело не с группой подстановок, а с группой, элементы которой ведут себя так, как подстановки. Пусть G — конечная группа. Предположим, что элементы G ведут себя, как подстановки множества S; это значит, что существует отображение G в симметрическую группу множе- множества S. Другими словами, каждому g?G мы поставим в соот- соответствие подстановку множества S, которую обозначим через ng. Предположим, что отображение — гомоморфизм, т. е. %«•' = ng • V F) для всех gdG, g'?G. Заметим, что различные элементы G не обязательно соответствуют различным подстановкам. В нашем случае G порождает отношение эквивалентности на элементах множества S. Два элемента su s2 множества S назы- называются эквивалентными, записывается Si~s2, если существует элемент g6 G, такой, что ngsi = sa- Легко доказать такие резуль- результаты: 5»
68 И Дж. Де Брёйн 1. s~s для всех s?S [так как формула F) показывает, что если в — единичный элемент группы G, то яе — тождественная подстановка, т. е. оставляющая на месте все точки 5]. 2. Если Si~s2, то s2~Si [так как формула F) показывает, что если g'^g'1, то jig==(ng)~l]. 3. Если Si~sa и s2~s3, т0 si~s3 [так как если ngSi = s,, n?'S2==S3, то имеем ^g'g)S\ = %¦ (%Si) = %-S2 = S3]- Хорошо известно, что свойства 1, 2 и 3 вместе означают, что ~ есть отношение эквивалентности, при помощи которого множество S может быть разбито на несколько классов экви- эквивалентности. Два элемента эквивалентны тогда и только тогда, когда они принадлежат одному и тому же классу. В нашем случае классы эквивалентности называются тран- транзитивными множествами. Лемма 1. Число транзитивных множеств равно где [ G \ обозначает число элементов в группе G и для каждого g ty(g) обозначает число элементов множества S, остающихся инвариантными при подстановке ng, т. е. число элементов s ? S, для которых ngs = s. Доказательство. Рассмотрим все пары (g, s), для ко- которых g6 G, s?S, ngs = s. Число п таких пар может быть вы- вычислено двумя способами. Во-первых, для каждого фиксирован- фиксированного g можно подсчитать число элементов s, удовлетворяющих условию ngs = s, отсюда число пар С другой стороны, для каждого s?S можно подсчитать число элементов g со свойством ngs = s. Обозначив это число через f](s), получим 22 G) Для фиксированного s элементы группы G, обладающие свой- свойством ngs = s, образуют подгруппу группы G, которую обозна- обозначим через Gs. Порядок подгруппы Gs равен f](s). Если Si эквивалентно s, то число элементов g, таких, что ngs = Si, равно \GS\. Это следует из того, что существует эле- элемент h?G, удовлетворяющий условию ял$1 = 5, а теперь равен-
Теория перечисления Пойа 69 ство 7igS = Si означает то же самое, что и hg(z Gs. Таким обра- образом, если Si и s фиксированы, то число возможностей для g равно как раз числу элементов в Gs. Соответственно G может быть разбита на подмножества, ка- каждое из которых состоит из \GS\ элементов и соответствует ровно одному элементу того класса эквивалентности, в который входит s. Отсюда следует, что этот класс эквивалентности со- содержит \G\/\GS\ элементов. Поэтому имеем v ' число элементов в классе эквивалентности, содержащем s Суммируя по s, получаем, что сумма чисел r\(s) для всех s, принадлежащих одному и тому же классу эквивалентности, равна \G\. Следовательно, сумма всех r\(s) равна взятому \G\ раз числу классов эквивалентности, т. е. формула G) доказы- доказывает лемму. 4. Функции и классы Пусть D и R—конечные множества. Рассмотрим функции, определенные на D, со значениями в R; другими словами, рас- рассмотрим отображения D в R. Множество D называется областью определения, а множество R — областью значений. Множество всех таких функций обозначим через RD. Число элементов в множестве RD равно |^?||DI, поскольку если мы хотим по- построить функцию f, то мы имеем для каждого элемента d 6 D \R\ возможностей выбрать f(d), и эти выборы независимы. Далее предположим, что нам дана группа G подстановок множеств D. Эта группа вводит отношение эквивалентности в RD: две функции fi и f2 (обе из RD) называются эквивалент- эквивалентными (обозначается U~h)> если существует элемент g?G, та- такой, что для всех d?D. (8) Соотношение (8) может быть кратко записано так: Ug=U, ибо fig обозначает сложное отображение «сначала g потом fi». Легко устанавливаются обычные условия эквивалентности: 1) f~f; 2) если fi~f2, то fa~fr, 3) если fi~fa и f2~fs, то fi~f3- Первое условие следует из того, что тождественная подста- подстановка принадлежит G; второе — из того, что если g?G, то об- обратная подстановка g'1 принадлежит G; и третье — из того, что если gi ? G, g26 G, то g^6 G. Таким образом, ~ есть отношение эквивалентности, с по- помощью которого RD разбивается на классы эквивалентности.
70 Н. Дж. Де Брёйн Пример 9. Пусть D — множество, состоящее из всех шести граней куба, и пусть G — группа всех подстановок D, которые могут быть получены вращениями куба (см. пример 4). Пусть R состоит из двух слов: красный и голубой. Элемент f(iRD может быть рассмотрен как способ окрашивания куба (так что каж- каждая грань красная, либо голубая). Это может быть сделано 28 способами. Если два таких куба, расположенных параллельно, окрашены различно, то может случиться, что один из них можно повернуть так, что кубы перестанут казаться различными. В этом случае они принадлежат к одному классу эквивалентности. В нашем примере десять классов эквивалентности, которые могут быть описаны следующим образом (в скобках — число функций в каждом классе эквивалентности): (а) все грани красные A); (б) пять граней красные, одна голубая F); (в) две противоположные грани голубые, остальные четыре ¦— красные C); (г) две смежные грани голубые, остальные четыре красные A2); (д) три грани, имеющие общую вершину, крас- красные, три остальные голубые (8); (е) две противоположные грани и одна из оставшихся красные, три остальные голубые A2); (ж), (з), (и), (к) получаются из (г), (в), (б), (а) заме- заменой слов «красный» и «голубой». В качестве проверки заметим, что 1-J-6 + 3 +12 + 8+12 + 12 + 3 + 6+1=26. Пример 10. Пусть множество D состоит из трех элементов {1, 2, 3}, пусть G — симметрическая группа D (т. е. группа всех шести подстановок D) и пусть R состоит из двух элементов х и у. В этом случае функций восемь, а классов эквивалентности лишь четыре. Классы эквивалентности можно обозначить сим- символами х3, х2у, ху2, у3 соответственно. Например, х2у предста- представляет класс отображений f, таких, что два из значений f(l), fB), fC) равны х и одно у. Класс эквивалентности х3 состоит только из одной функции, которая определена так: Полезно рассмотреть также х и у как независимые перемен- переменные и поставить в соответствие каждой функции f произведение f(\)fB)fC), которое не зависит от порядка сомножителей. Другими словами, так как симметрическая группа дана, то го- говорить, что функции fi и f2 эквивалентны, — это то же, что ска- сказать, что произведения fi(l)M2)M3) и f2(l)f2B)f2C) тожде- тождественны. Поэтому классы эквивалентности характеризуются возможными значениями произведений, а именно одночленами х3, х2у, ху2, у\
Теория перечисления Пойа 71 5. Вес функции; вес класса эквивалентности Опять возьмем конечные множества D и R и группу G под- подстановок множества D. Каждому элементу множества R прида- придадим вес. Этот вес может быть числом, или переменной, или вообще элементом коммутативного кольца, состоящего из ра- рациональных чисел. Таким образом, мы можем образовывать суммы и произведения весов, произведения весов на рациональ- рациональные числа, и эти операции удовлетворяют обычным законам ас- ассоциативности, коммутативности и дистрибутивности. Вес, при- придаваемый элементу r?R, обозначим через w(r). После того как выбраны эти веса, мы можем определить вес W(f) функции /? RD как произведение JJ (9) Если /i и U эквивалентны в смысле п. 4, т. е. если они принад- принадлежат одному и тому же классу эквивалентности, то они имеют, одинаковый вес. Это следует из того факта, что если fig = f>, g?G (см. 8), то д ® и. ш = д ® и 1 ш=д поскольку первое и второе произведения имеют одни и те же сомножители, разве что в другом порядке, и в силу коммутатив- коммутативности произведения весов. Так как все функции, принадлежащие одному и тому же классу эквивалентности, имеют одинаковый вес, мы можем определить в качестве веса класса эквивалентности это общее значение. Таким образом, если F обозначает класс эквивалент- эквивалентности, обозначим вес его через W(F); использование символа W как для веса функции, так и для веса класса вряд ли вызовет путаницу. Пример 11. Рассмотрим случай окрашивания куба из при- примера 9 и образуем кольцо всех многочленов от двух перемен- переменных х и у с рациональными коэффициентами. Множество R состоит из элементов «красный» и «голубой», которым мы при- придадим в качестве весов значения хну соответственно. Десять классов эквивалентности (а), ..., (к) имеют теперь веса х6, х5у, х*у2, х*у2, х3у3, х3у3, х2у*, х2у*, хуь, у6 соответственно. Отсюда можно видеть, что различные классы эквивалентности не обязаны иметь различные веса. :
72 Н. Дж. Де Брёпн Пример 12. В примере 10 множество R имело два элемента х и у. Если считать х и у переменными, то нет причин, запре- запрещающих дать элементу х бес х, а элементу у — вес у. Теперь символы х3, х2у, ху2, у3 действительно стали весами классов. В этом случае вес характеризует класс: различные классы обла- обладают различными весами. Пример 13. Если взять w(r) = l для всех г?/?, то мы будем иметь W(f) = l для всех функций и W(F) = \ для всех классов эквивалентности. 6. Запас и перечень Как и раньше, имеем множества D и R, и каждый элемент r?R обладает весом. Считая R множеством, из которого мы выбираем значения для функций, назовем R запасом (store). Так как веса можно складывать, то существует сумма весов; эта сумма называется производящей функцией (enumerator) запаса, или перечнем (inventory) множества R: Перечень #= 2 w(r)- (Щ r<LR Пример 14. Терминология наводит на мысль, что перечень дает достаточно точное описание элементов R, однако это верно лишь отчасти. Пусть R — множество, содержащее три коробки мыла (назовем их ми м2, м3), два пакета чая (назовем ч(, ч2) и четыре бутылки вина (ви в2, в3, в4). Если мы возьмем девять переменных м[, м'2, м'3, ч[, н'2, в[, в'2, в'3, в'4 и придадим элемен- элементу Mi вес м[ и т. д., то перечень будет иметь вид и значение суммы даст полную информацию о запасе. Лавочник обычно применяет более простую систему, так как он не инте- интересуется мелкими различиями между полностью эквивалент- эквивалентными предметами. Он обозначит символами м, ч, в абстрактные понятия «коробка мыла», «пакет чая», «бутылка вина». Затем он придаст всем элементам щ, м2, м3 один вес м; каждому из Чу и ч2 — один вес ч; et и в2 — вес в, а элементам в3 и в4 — вес 2 в (так как в3 и в4 пол-бутылки, а разница между ними са- самими к делу не относится). Его перечень имеет вид Зл( + 2ч + 3в. Иногда, впрочем, лавочник, или ревизор, интересуется значе- значением запаса в долларах. Если он оценивает коробку мыла в 3, пакет чая в 1, бутылку вина в 2, а пол-бутылку в 1 доллар, то перечень примет вид 9 + 2 + 4 + 2=17. Теперь перечень просто
Теория перечисления Пойа 73 число; он не дает информации о том, из чего состоит запас, кроме того факта, что его общая стоимость равна 17 долларам. В конце концов у лавочника есть еще возможность обучить своего клерка считать: придавая каждому предмету вес 1, можно получить значение перечня, равное общему числу пред- предметов, т. е. 9. 7. Перечень функции Пусть мы имеем конечные множества D и R и хотим рас- рассмотреть множество RD всех отображений D в R. Каждый эле- элемент r?R имеет вес w(г); поэтому каждая функция f?/?D имеет вес Тогда перечень множества RD равен перечню множества R в степени, равной числу элементов множества D: Перечень R° = 2 W(f) = [2 w(r)]1 '. A1) / Ь-ея J Это можно увидеть следующим образом. \D\-n степень мо- может быть записана как произведение \D\ сомножителей. Если в каждом сомножителе мы выделим один член и возьмем произ- произведение таких членов, то получим один член полного выраже- выражения для произведения (которое содержит |/?||Dl членов, т. е. столько, сколько существует способов выбора). Возьмем неко- некоторое взаимно однозначное соответствие между сомножителями в A1) и элементами множества D; благодаря этому соответ- соответствию можно сказать, что выбор членов из каждого сомножи- сомножителя может быть описан отображением f множества D в R. Функции f соответствует член w[f(d)] ' ' из полного разложения для произведения. Так как этот член равен W(f), мы замечаем, что полное произведение равно сумме всех W(f), т. е. равно перечню множества RD. Оценим теперь перечень некоторого подмножества S множет ства RD. Пусть D разбито на несколько непересекающихся комт понент Di, . .., Dh, так что Рассмотрим множество S всех функций f, обладающих тем свой- свойством, что f постоянна на каждой компоненте; функция может быть различной на различных компонентах, но не обязательно.
74 Н Дж. Де Брёйн Такие функции f можно рассматривать как сложные функции / = Ф^, где ф и ф определены следующим образом: ф — функция, отображающая d на индекс той компоненты, которой принадле- принадлежит d, так что мы всегда имеем d?A|)(d), а ф — отображение множества {\,...,k} в R. Заметим, что ф — фиксированная функция, а для ф существует \R\h возможностей. Справедливо следующее соотношение: к Перечень S = П S [w(r)]|D/|. A2) Это опять может быть получено при рассмотрении полного раз- разложения произведения. Член этого разложения получается вы- выбором одного члена в каждом сомножителе A2), а это означает выбор отображения ф множества {1, ... k) в R. Следовательно, такое отображение даст член Если <jK|> = f, то этот член равен в точности W(f), так как, очевидно, П П l\ d? D Таким путем каждая функция /?S получается в точности один раз. Следовательно, сумма весов W(f) для всех f?S рав- равна сумме всех членов в разложении произведения A2), что и доказывает справедливость A2). Пример 15. Три человека: Чи Ч2, Ч3 распределяют между со- собой т фишек так, чтобы 4i получил такое же количество фи- фишек, что и Чг. Сколькими способами это можно сделать? Мы интересуемся не отдельными фишками, а только тем, сколько фишек получает каждый человек. Иначе говоря, мы хотим по- получить функции f, определенные на множестве D = {4U Ч2, Ч3}, с областью значений /? = {0, 1, 2, ...} и с ограничениями fDi)=fD2) и fDi)+fD2)+fD3)=m. Положим {Чи 42) = DU {Ч} О } Возьмем переменную х и придадим элементам 0, 1, 2, ... множества R веса 1, х, х2, х3, .. . соответственно. Таким образом, функции, которыми мы интересуемся, имеют вес хт.
Теория перечисления Пойа 75 Из A2) перечень всех функций, постоянных на каждом Dit равен A2 « )A 2+ ...)• A3) Искомое число есть коэффициент tipn xm в этом разложении. Поскольку то для требуемого числа функций мы получаем т. е. 72^+1, если т четно, и '/гяг + '/г, если m нечетно. Легко получить этот результат непосредственно: заметим, что требуе- требуемое число может быть интерпретировано как число представле- представлений натурального числа т, в виде суммы двух натуральных чисел, одно из которых четно. То, что запас есть бесконечное множество, а перечень — сумма бесконечного ряда, не должно нас особенно волновать. Мы можем обрезать запас, заменив его множеством {0, 1,... ..., т), остальные элементы не будут играть никакой роли в за- задаче, в силу ограничения fDi)+fD2)+fD3)=m. Более того, коэффициент при хт в A3) равен коэффициенту при хт в вы- выражении 8. Перечень классов эквивалентности, теорема Пойа Снова рассмотрим конечные множества D и R и группу под- подстановок G множества D. Элементы К имеют веса w(r), и, согласно (9), функция f?RD и класс F имеют веса W(f) и W(F). Вместо перечня функции 2 W(f)> определенного в A1), f будем теперь искать перечень 2 W (F) множества всех классов F эквивалентности. Этот перечень дается следующей теоремой: Теорема 1. (Основная теорема Пойа). Перечень классов эквивалентности равен w(r), 2 [w (г)]», 2 [а/ИР. ..Л, где Pa — цикловой индекс. В частности, если все веса выбраны равными 1, то получаем число классов эквивалентности = Ра(\Я\, \R\, \R\, ...). A5)
П Н. Дж. Де Брёйн Доказательство. Пусть со — одно из возможных значе- значений, которое может принимать вес функции. Пусть S множество всех функций f, f?RD, удовлетворяющих условию W(f)=a. Если gdG w U — bigy T0 fi и /г имеют одинаковый вес (см. п. 5). Отсюда если fi6S, то fig~'€5. Таким образом, каждому элементу g? G соответствует отображение ng множества S в себя определенное так: ngf = fg'u, здесь ng— подстановка, так как она имеет обратную ng-i. Отображение g-*ng удовлетворяет условию гомоморфиз- гомоморфизма F). Поэтому если g(iG, g'dG, то F) выполняется, по- поскольку для каждой f ? 5 имеем Два элемента ft и f2 из S эквивалентны в смысле п. 3 тогда и только тогда, когда они эквивалентны в смысле п. 4: суще- существование элемента g группы G, такого, что ngf2 = fi, означает то же самое, что и существование элемента g группы G, такого, что f2 = fig- Следовательно, классы эквивалентности, поскольку они существуют в S, суть классы эквивалентности из п. 3. Тогда лемма 1 показывает, что число классов эквивалентности, по- поскольку они содержатся в S, равно где \|)ffl(g) обозначает число функций f, таких, что W(f) =a>, fg'1 = f (или, что то же самое, f=fg). Все классы эквивалентности, принадлежащие S, • имеют вес со; поэтому если мы умножим A6) на со и просуммируем по всем возможным значениям со, то получим перечень классов эквивалентности Очевидно, U)iS(f) . «' f (|> ¦••-¦-• где 2j означает, что суммирование происходит по всем f? RD, для которых f = fg. Отсюда (f) ¦ . \ 2
Теория перечисления Пойа 77 Для того чтобы оценить 2 W(f)> заметим, что g—подстановка множества D, и поэтому D распадается на циклы, элементы которых циклически переставляются подстановкой g Условие f = fg означает, что поэтому функция f постоянна на каждом цикле D. Обратно, каждая функция f, постоянная на каждом цикле, автоматически удовлетворяет условию fg = f, поэтому g(d) всегда принадлежит тому же циклу, что и d. Таким образом, если циклы суть (р) Du D2, ..., Dk, то сумма 2 W(f) есть как раз перечень, полу- f ченный в п. 7, который выражается формулой A2). Пусть {b\, b2, ...}— тип подстановки g. Это означает, что среди чисел |Di| |D/(| число 1 встречается fei раз, чи- число 2 — Ь2 раз и т. д. Следовательно, имеем (Р) ft Л ' 2 ^(Я = |2«(г)Г{2|«(г)]П\... A8) Число сомножителей конечно, но мы не будем стремиться за- записывать последний из них; в конце концов можно считать, что все Ь{, начиная с некоторого i, равны нулю, сомножители с по- показателем степени 0 равны 1 и произведение бесконечного чи- числа единиц равно также единице. Выражение A8) может быть получено подстановкой хх = 2 w (г), х2 = 2 [w (г)]2, х3 = 2 [w И3, ... =« ?« €Я в произведение х^х^х^ ... , которое является членом, соот- соответствующим g в \G\Pa (см. п. 2). Суммируя по g и деля на G\, мы заключаем, что значение A7) получено предыдущей подстановкой из Pg(*i, х2, х3, ...) и это доказывает теорему Пойа. Пример 16. Рассмотрим пример 9. Здесь D — множество гра- граней куба, G — группа вращений, R — множество двух цветов: красного и голубого. Согласно формуле A5), число способов окрашивания равно РсB, 2, 2, ...), а цикловой индекс Рс был дан в примере 4. Мы получаем iB6 + 3 • 24-Ь 6 ¦ 234 6 • 23 + 8 ¦ 22) = 10; то же число, если проверить, было получено и в примере 9,
78 Н. Дж. Де Брёйн Возникает вопрос: сколько классов эквивалентности окраши- окрашиваний дают 4 красные грани и две голубые. Для этого дадим вес х красному цвету и у голубому и най- найдем перечень классов эквивалентности; по формулам A4) и A) он равен Коэффициент при х4у2 равен В самом деле, существуют ровно два класса эквивалент- эквивалентности функций, при которых четыре грани окрашены в красный цвет [(с) и (d) в примере 9]» Для полного перечня классов эк- эквивалентности мы легко получаем х6 4- х5у + 2x4t/2 -|- 2x3t/3 + 2xV -f- xy5 -f У6, что согласуется с примером 11. Пример 17. Пусть множество D состоит из т элементов, и пусть G — симметрическая группа на D. Пусть R— множество из п элементов, R = {\, 2, ..., п), и пусть веса этих элементов равны соответственно ии ..., «„. (Случай т = 3, п = 2 был рас- рассмотрен в примере 10.) Перечень классов эквивалентности функций равен Яо^-Ь «2+...+«„, «?+...-+-«?,..., «Г-Н...+и«). A9) Нашей целью является определить Pg путем сравнения A9) с выражением для перечня классов эквивалентности функций, который может быть найден непосредственно. Две функции fi и f2 из множества RD эквивалентны тогда и только тогда, когда каждый элемент r? R является значением функции fi(d) столько же раз, сколько он является значением функции f2(d). Другими словами, эти функции эквивалентны тогда и только тогда, когда у них одинаковый вес. Поэтому класс F может быть соответствующим образом опи- описан как функция, определенная на R, со значениями в множе- множестве Af={0, 1, 2, ...} при ограничении 2 Ц(г) = т. гея Вес класса F равен W (F) = uyW ... и^п\ и поэтому легко видеть, что перечень классов эквивалентности ~LW{F) равен коэффициенту при zm в разложении произведения
Теория перечисления Пойа 79 Это произведение равно что может быть описано как результат подстановки л л *i=2«<. *2=2и?, ••• B0) i-1 i-1 В ex р (zx, -f 1 г2л:2 +1 г3лг3 +...). Коэффициент при zm в степенном разложении этого выраже- выражения есть многочлен Q(xu x2, ...). Сравнивая наш результат с A9), мы приходим к выводу, что Рс и Q имеют одинаковые значения при подстановке B0). Если взять п = т, то можно по- показать, что Pg и Q, как многочлены от xt,. . ., хт, тождественны; это следует из того, что если хи . ¦ ¦, хт — заданные комплекс- комплексные числа, то мы можем найти ии . .., ит так, чтобы B0) вы- выполнялось при п = т. Таким образом, мы доказали результат, сформулированный в примере 5, т. е. то, что B) есть произво- производящая функция для циклового индекса симметрической группы. Пример 18. Пусть D — конечное множество, и пусть G — группа подстановок множества D. Два подмножества D\ и D2 называются эквивалентными, если для некоторого элемента g? G имеем gDi = D2. Это означает, что D2—множество всех элементов gd, полученных, когда d пробегает все множество Dt. Как обычно, образуем классы эквивалентных подмножеств и найдем число этих классов. Подмножества могут быть поставлены во взаимно однознач- однозначное соответствие функциям. Пусть R состоит из двух элементов «да» и «нет». Припишем вес 1 каждому из них. Если f — ото- отображение D в R, то пусть этой функции соответствует подмно- подмножество всех элементов d? D, для которых/(d) = да. Очевидно, что так мы получим все подмножества и эквивалентность функций соответствует эквивалентности подмножеств. Каждая функция имеет вес 1, так что число классов подмножеств равно перечню классов эквивалентности. В силу теоремы Пойа это равно РсB,2,2, ...)• Если в качестве весов возьмем и>(нет) = \, ау(да)=до, где W переменная, то подмножества из k элементов срртветствуют
80 Н Дж. Re Брёйн функциям f, для которых W(f)=wh. Таким образом, число клас- классов, состоящих из подмножеств, содержащих k элементов ка- каждое, равно коэффициенту при wh в перечне классов эквива- эквивалентности, который в нашем случае равен PG(\+w, \+w2, \+w3, ...). Суммируя по всем k, снова получим PGB, 2, 2,. . .), так как сумма коэффициентов многочлена p(w) равна рA). Подробный пример дает окрашенный куб (см. пример 16). Подмножества соответствуют очевидным образом окрашиваниям куба. При каждом окрашивании красные грани образуют под- подмножество, и из каждого подмножества мы можем получить окрашивания, закрашивая это подмножество граней красным, а остальные грани голубым цветом. 9. Обобщение теоремы Пойа В предыдущих пунктах мы рассматривали отображения множества D в R с эквивалентностью, введенной при помощи группы G подстановок множества D. Изучим теперь более об- общую ситуацию, когда также дана группа Я подстановок мно- множества R и эквивалентность отображений определяется при помощи обеих групп. Два отображения fidRD и f2? RD назовем эквивалентными, fi~f2, если существуют элементы g? G и ft? Я, такие, что f\g = hfz, т. е. fi(gd) = hf2(d) для всех d?D. B1) Покажем, что это отношение эквивалентности. 1. Отношение fi~fi очевидно, если взять в качестве g еди- единичный элемент группы G, а в качестве ft единичный элемент группы Я. 2. Если f\~Ui то Для некоторых g? G и ft ? Я имеем fi[g{g'ld)] = hf2{g~>d) при любом d? D, так как g~ld<iD при лю- любом ddD. Отсюда следует, что f2(g'1d) =h~1fi(d) для всех d?D; поскольку g-'6 G, h~l ? Я, то /2~fi. 3. Если f\~U, h~tb т0 существуют g, g'? G и ft, ft'€ Я, та- такие, что для всех dd D, d'<iD. Беря d'=g'd, получаем для всех rf€ D. Из того, что gg'? G, hh'd H, следует, что /ч~/з. На основании этих свойств соотношение, определенное в B1), является эквивалентностью, и мы можем сказать, что RD разби- разбивается на классы эквивалентности.
Теория перечисления Пойа 81 Теперь предположим, что каждый элемент fdRD имеет опре- определенный вес W(f), причем все эти веса являются элементами одного и того же коммутативного кольца. Здесь мы не предпо- предполагаем, как в предыдущих пунктах, что эти веса W(f) полу- получаются из определенных весов элементов множества R по фор- формуле типа (9); однако мы сделаем совершенно строгое предпо- предположение, что эквивалентные функции имеют одинаковые веса: из f^f2 следует W(fl)=W(f2). B2) Если F обозначает класс эквивалентности, то по определе- определению вес W(F) равен общему значению всех весов W(f), где f€F, как мы делали и в п. 5. Задача снова состоит в вычисле- вычислении перечня классов эквивалентности, т. е. суммы весов всех классов эквивалентности. Аналогично A7) докажем следующий результат. Лемма 2. Перечень классов эквивалентности равен (е. л) G\~l\H\-1 2 2 S ^(f). B3) H где 2 W (f) означает сумму весов W(f), распространенную на все такие f, которые удовлетворяют условию fg = hf. Доказательство. Доказательство является непосред- непосредственным развитием доказательства равенства A7). Пусть со — некоторое из возможных значений W, и пусть S — множество всех f(zRD, для которых №(/)=ю. Далее рассмотрим прямое произведение GXH (см. пример 8), состоящее из всех произве- произведений gXh, где g? G, h^H. Имеем такое правило умножения: Каждому gXh? GxH поставим в соответствие подстановку из S, определенную следующим образом: ngXJi"=f2 означает, что f2 = hflg-1. Если f2 = Mig~i< т0 в силу A5) W(fi) = №(f2); следовательно, nqXh преобразует множество S в себя. Кроме того, элемент ngxh имеет обратный, поскольку Поэтому яйхл является подстановкой множества S. Отображение gXh —>яЙХ л удовлетворяет условию гомомор- гомоморфизма F). Это следует из того, что если gdG,g'dG,h^H, 6 Зак. 909
82 Н. Дж. Де Брёйн h' ? Н, то для каждого f € S имеем (g'Xh')f = ngg'Xhlff = {hh') f (gg')~ и поэтому Кроме того, эквивалентность элементов fi и /2 в смысле B1) означает, что существуют такие g и А, что ngXhh = h- Следова- Следовательно, при применении леммы 1 к группе GXH оказывается, что число классов эквивалентности, принадлежащих множе- множеству 5, равно '2 2 в(*. А), B4) где i|><»(g. /г) —число функций f, для которых W(f)=a, ngXhf = = f. Последнее условие означает hf = fg. Наконец, умножив B4) на со, просуммировав по всем воз- возможным со и воспользовавшись соотношением 0) f мы полностью завершим доказательство леммы. Пример 19. Дадим очень общий пример задания веса W(f) для каждой функции f € RD таким способом, чтобы выполня- выполнялось свойство инвариантности B2). Предположим, что D разбито на непересекающиеся подмно- подмножества ?)), ..., Di, такие, что каждое Dt инвариантно при преоб- преобразованиях группы G, т. е. для всех g 6 G, d € Dit i= 1 /, имеем g(d) 6 Dt. Аналогично предположим, что множество R разбито на части Ru ..., Rh, такие, что каждая из них Rj, /=1, ..., k, инвариантна при преобразованиях из группы Н. Пусть г|)(/; Пи ..., щ)—некоторая функция целочисленных переменных /, щ, ..., щ, где 1 -</-<^, 0 <ni<oo, ..., 0 ¦<«;< <оо. Предполагается, что значения этой функции лежат в не- некотором коммутативном кольце. Если f(LRD, l-<i-</, r 6 R, то tii(f, r) обозначает число элементов d € Д-, удовлетворяющих условию f(d)=r. Теперь определим в качестве веса функции f значение ¦ W(f)= П П Ш «,(/. г),..., /»,(/,¦ r)J. B5)
Теория перечисления Пойа 83 Для того чтобы установить свойство B2), прежде всего заме- заметим, что для всех i, g, h и г, t= 1, ..., /, g € G, h ? H, r ? R, имеем ni{tfg~\ r)=nt{f, h~lr), B6) так как число элементов d € Dit для которых hfg~l(d) =r, равно числу элементов d ?/),-, для которых hf(d)=r (элемент g дает подстановку множества ?>г), и это число равно числу элемен- элементов d (i Dit для которых f(d)=h~lr (элементы d в обоих слу- случаях те же самые). Из соотношения B6) следует, что если в формуле B5) за- заменить f на hfg'\ то сомножители в произведении \>[j\ «i(f. r), ••-. nt(f, г)} только поменяются местами, поскольку если г пробегает мно- множество Rj, то и А г пробегает множество Rj. Таким образом, замена / на hfg~{ не изменит произведения. Это доказывает, что W(hfg-i) = W(f), т. е. W удовлетворяет условию B2). В [2] рассматривается частный случай веса B5); там пред- предполагается, что /=1 и что группа Н есть прямое произведение HiX...XHh групп подстановок множеств Ri,...,Rh соответ- соответственно. При этих предположениях результат B3) может быть опять-таки выражен в терминах циклового индекса рассматри- рассматриваемых групп. Мы не будем здесь на этом останавливаться подробно; заметим только, что в качестве частных случаев мы можем получить основную теорему Пойа и два других резуль- результата, которые будут рассмотрены в п. 10 и 12. Теорема Пойа получается, если считать Ru ..., Rh одноэлементными множе- множествами, так что k=\R\, и если взять в качестве каждого Я,- группу, состоящую только из единичного элемента, причем Здесь n(f, r)—число элементов d?D, для которых f(d)=r; Wj — некоторый вес, приписанный множеству Rjt но так как ка- каждый Rj состоит лишь из одного элемента, то это означает то же самое, что приписать веса элементам множества R. Веса, используемые в п. 10 и 12, можно рассматривать как частные случаи B5). В обоих п. 10 и 12 имеем &=/ = 1, и по- поэтому \|з зависит только от одного переменного п и ^(/)=1ЬИ/. г)]; .;.,;,*¦.< ,, re/? n(f, r) —число элементов d ? D, для которых f(d)=r. Для по- получения случая, рассмотренного в п. 10, надо взять i|>@)=l, 6*
84 Н. Дж. Де Брёйн г|)A) = 1, г|)B)=г|)C)= ••• =0, где W{f) = l, если функция / взаимно однозначна, и W(f)=0 в противном случае. Этот слу- случай из п. 12 можно получить, взяв просто i|)(n) = l для всех п, а поэтому W(f) = 1 для всех /. 10. Классы эквивалентности взаимно однозначных отображений Как и в п. 9, имеем конечные множества D и R, на которых действуют группы подстановок G и Н соответственно. Опреде- Определим теперь вес W(f) для любой функции / ? RD следующим об- образом: f 1, если f— взаимно однозначное отображение, "' \0 — в противном случае. Очевидно, отображение hfg'1 (g € G, h ? Н) взаимно одно- однозначно тогда и только тогда, когда f взаимно однозначна, и поэтому W удовлетворяет условию B2). Перечень HW(F) равен числу классов эквивалентности взаимно однозначных функций (классы эквивалентности определены, как и в п. 9, при помощи эквивалентности, индуцированной группами G и Я). Чтобы определить это число, применим формулу B3), а поэтому пре- («. А) жде всего вычислим 2 W (/). I Пусть в данный момент g и h фиксированы, g ? G, h ? Н. Пусть элемент g имеет тип {Ьи Ь2, ...}, где 6* — число циклов длины i; см. п. 2. Кроме того, пусть элемент h имеет тип [ci, съ с3, ...}. Мы хотим найти число взаимно однозначных ото- отображений / множества R в D, удовлетворяющих условию fg = = hf. Пусть f — такое отображение, и пусть d — некоторый эле- элемент множества D, принадлежащий циклу длины /. Этот цикл состоит из элементов d, gd, g2d, ..., gJ'ld, B7) и gid=d. Заметим, что из соотношения fg = hf получается fg2==fgg = hfg = hhf==hlfi fg3 = h3f „т.д. Поэтому f отображает элементы B7) на элементы kfd, h2fd, ..., fij-lfd, B8) и hifd = fgid—fd. Отсюда следует, что длина цикла в множе- множестве R, содержащего элемент fd, есть делитель числа /. По- Поскольку мы пока не пользовались условием, что / взаимно одно- однозначна, эту первую часть рассуждений также можно применить
Теория перечисления Пойа 85 в п. 12. В настоящем случае, однако, мы предположили, что f взаимно однозначна. Отсюда следует, что в последовательности B8) нет повторений, и поэтому длина цикла, которому принад- принадлежит fd, равна самому числу /. Различные циклы множества D отображаются на различные циклы множества R, так как / взаимно однозначна. Теперь легко описать все взаимно однозначные отображе- отображения f, удовлетворяющие условию fg = hf. Чтобы построить такое отображение /, для каждого цикла из множества D выберем цикл той же длины из множества R, заботясь лишь о том, чтобы каждый цикл из R был выбран самое большее один раз. При каж- каждом выборе соответствующего цикла, если/его длина, существует /' возможностей установить соответствие между / элементами цикла из D и / элементами цикла из R. Это является след- следствием того, что если d — элемент цикла из D, то мы можем отобразить его на любой элемент г цикла из множества R, в том случае, если мы отображаем gd на hr, g2d на h2r и т. д. Число взаимно однозначных отображений множества из bj элементов в множество из с,- элементов равно с, (с,-1) (с,--2)... (с,-*,.+ !), B9) причем это число равно нулю, если C]<bj. Поэтому число взаимно однозначных отображений f множества D в R, удовле- удовлетворяющих условию fg = hf, равно 2 W(f)=='[^/Jcj(cj-\)...{cj-bj-\-\). C0) Произведение берется по всем /¦, для которых bj>0; но если считать, что B9) равно единице при bj = O, то произведение можно брать по всем /==1,2,3.... Мы можем записать выражение jbc(c—1)...(с— Ь + \) как 6-ю производную функции A+/г)с в точке 2 = 0. Соответ- Соответственно C0) можно выразить как результат нескольких част- частных дифференцирований по переменным zit г2,... в точке г4 = До сих пор g и h были фиксированы. Теперь, суммируя по g и/ги деля на порядки групп \G\ и \Н\, получим перечень клас- классов эквивалентности B3), который в нашем случае равен числу классов эквивалентности взаимно однозначных отображений. Дифференциальный оператор в C1) получается из члена
Н. Дж. Де Брёйн циклового индекса Рв(Хь х2, .. ¦) группы G при подстановке Xi = =-fe-' Х2 = ~^~- ¦ • •> а операнд в C1) получается из чле- члена циклового индекса Рн(х\, х2, ...) группы Н при подстановке Xi=\+zu х2 = 1 +2г2,.... Таким образом, после суммирования получим следующий результат. Теорема 2. Число классов эквивалентности взаимно одно- однозначных отображений множества D в R (классы эквивалентно- эквивалентности определяются, согласно B1), в соответствии с эквивалент- эквивалентностью, индуцированной группами G и Н множеств D и R соот- соответственно) равно k )ЯA+г 1+2г ^^ О C2) При Xi=Z2 = Z3= . . . = 0. Выражение, данное в теореме 2, можно немного упростить, если \R\ = \D\. (Если \R\<\D\, то число взаимно однозначных отображений, естественно, равно нулю.) Тогда мы всегда имеем S bj = 2 Cj, j i так что в C1) будет или bi — Ci, Ьг = с2,..., или хотя бы один раз bj>Cj. В последнем случае C1) обратится в нуль. Таким обра- образом, легко видеть, что C1) всегда равно при Zi = z2=z3= ... =0. Следовательно, мы получили следующий результат. Теорема 3. Если выполняются предположения теоремы 2 и если, кроме того, \R\ = \D\, то число классов эквивалентности равно (kkk ) C3) При Zi = Zz = Z3= . . . —0. В этом случае ситуация совершенно симметрична; если |/?| = |D|, то взаимно однозначные отображения множества D в R являются отображениями множества D на R, и их обрат- обратные отображения суть взаимно однозначные отображения мно- множества R на D. В самом деле, можно непосредственно прове- проверить, что в точке Zi = Z2=z3— ... =0 выражение C3) равно
Теория перечисления Пойа 87 Пример 20. Сколькими геометрически различными спосо- способами можно циклически упорядочить грани куба? Это означает, что мы хотим узнать число классов эквивалентности взаимно однозначных отображений в такой ситуации: D — множество граней куба и G — группа подстановок, соответствующих вра- вращениям (пример 4); R — множество корней шестой степени из единицы и Н — группа подстановок, соответствующих враще- вращениям комплексной плоскости (пример 7, где т = 6). Цикловые индексы равны И + 6X + 8х _j_ 3X2X2 и поэтому C3) дает такое число классов эквивалентности .1.. ^_ F! -f- 6 • 23 • 3! -\- 16 • З2 • 2!) = 9. Пример 21. Возьмем конечную группу S и рассмотрим все подстановки группы S. Две подстановки jti и пг назовем экви- эквивалентными, если существуют элементы a, b?S, такие, что ап\Ь = пг. Здесь левая часть апф — подстановка, которая пере- переводит любой элемент sE в ani(bs); заметим, что bs — произ- произведение элементов bus группы S, и ani(bs)—произведение элементов а и Jt4Fs) группы S. Мы ищем число классов эквивалентности. Легко проверить, что это означает то же самое, что число классов эквивалентно- эквивалентности взаимно однозначных отображений в такой ситуации: D — = R = S, G = H=представление Кэли группы S. Из E) имеем P0 = PH = m-i 2 v(k)(xkf/k, к | т где т— \S\ и для каждого делителя k числа т символ v(&) обо- обозначает число элементов s6 S порядка k. Из C3) получаем, что [v(k)fkm/k(- k | т есть число классов эквивалентности. 11. Маркировка и демаркировка При возникновении комбинаторного анализа встречались проблемы того же типа, что и изученные в предыдущих пунктах. Формулировки раннего комбинаторного анализа иногда нечетки, а мы их можем сделать более ясными лишь путем подробных
Н Дж. Де Брёйн разъяснений относительно рассматриваемых групп и эквива- лентностей. Например, во всех случаях, когда используется та- такое выражение, как «порядок элементов не принимается во вни- внимание», имеется в виду, что на некотором множестве объектов мы вводим отношение эквивалентности, определяемое группой подстановок (часто симметрической группой), и что мы пере- переходим от первоначального множества объектов к множеству классов эквивалентности. Аналогично если некоторые объекты отождествляются или считаются равными или если они раз- различны, но незначительно, мы снова сталкиваемся с процессом введения классов эквивалентности. В этом контексте употреб- употребляются слова маркировка и демаркировка (labeling and dela- beling). Нестрого говоря, маркировка дает способ опознавать эле- элементы в множестве, в котором все элементы слишком похожи, а демаркировка — это обратная процедура упрощения путем того, что мы пренебрегаем несущественными различиями. Бо- Более того, существуют еще и промежуточные случаи, когда эле- элементы множества снабжены опознавательными знаками (мет- (метками, ярлыками — labels), но некоторые из этих ярлыков счи- считаются одинаковыми. Пусть D и R — конечные множества. Любое взаимно одно- однозначное отображение f множества D в R называется маркиро- маркированным подмножеством множества R. Если S — подмножество R, на которое f отображает D, то S является подмножеством, на котором произведена маркировка, a D называется при этом множеством меток. Заметим, что маркированное подмножество множества R не является подмножеством R. При желании его можно рассматривать как множество пар [d, f(d)], где d пробе- пробегает все множество D. На самом деле лучше было бы говорить о «подмножестве с маркировкой» вместо «маркированного под- подмножества». Если, в частности, D есть множество {1, 2, ..., т}, то маркированные подмножества часто называют вариациями или гп-перестановками. Если мы возьмем группу Н подстановок множества R, то можно определить классы эквивалентности маркированных под- подмножеств, и эти классы эквивалентности являются как раз теми классами взаимно однозначных отображений, которые были из- изучены в п. 10, с условием, что группа подстановок множества D состоит из одного единичного элемента. Таким образом, имеем Ро = х™, где пг — число элементов множества D, и из теоремы 2 получаем для числа классов
Теория перечисления Пойа 89 Если, кроме того, и Н состоит только из единичного эле- элемента, то, если R содержит п элементов, имеем т. е. хорошо известный результат для числа m-перестановок из множества п элементов. В частном случае, на основании теоремы 3, т = п мы можем заменить C5) выражением и легко видеть, что это равно |Я|-'т!. Можно проверить этот результат непосредственно следующим образом. Для каждой маркировки f мы можем получить класс эквивалентности, ко- которому f принадлежит: это множество всех hf, где h пробе- пробегает Н. Поскольку все эти элементы hf, где f фиксировано, различны, то класс эквивалентности содержит ровно \Н\ элементов. Сле- Следовательно, существует \Н\~ т\ классов эквивалентности. В качестве примера рассмотрим число возможных игральных костей. Здесь R есть множество граней куба, Н — группа под- подстановок, индуцированная вращениями куба, D = {\, 2,. . . , 6}, число классов равно 61/24 = 30. Рассмотрим теперь полную демаркировку; это означает, что мы введем симметрическую группу на множестве меток и обра- образуем классы в соответствии с ней и одновременно в соответствии с группой Н на множестве R. Не имеет значения, какие метки даны элементам множества R, а важно лишь, какие элементы из R получили метки, а какие нет. Таким образом, число клас- классов эквивалентности равно в точности числу классов эквивалент- эквивалентности подмножеств из т элементов. В соответствии с примером 18 это число равно коэффициенту при wm в многочлене Pn(\-\-w, \-\-w2, 1-+ЯУ3, . ..).'. ".>. г Для проверки покажем, что тот же результат получается из теоремы 2. Теперь G — симметрическая группа степени т, та- таким образом, Pg(xi, х2, ...) равен коэффициенту при ш в раз- разложении A 1 \
90 Н. Дж. Де Брёйн см. пример 5. Для того чтобы оценить действие дифференциаль- дифференциального оператора C2), мы заметим после разложения в ряд Тей- Тейлора, что \exp(a-^)f(z)} = / @) + «Г @) +-gj-Г @) + ¦•¦ = f (а), при условии, что f — многочлен, так как в этом случае нет не- необходимости заботиться о сходимости. Таким образом, в нашем случае C2) становится коэффи- коэффициентом при ш™ в выражении PH[\-\-w, а это то же самое, что мы получили выше. В частном случае, когда группа Н состоит только из единич- единичного элемента, мы имеем Я/ V- у* \ . \гШ jj I " ] j о' ' * ' ) 1 * откуда число классов эквивалентности — коэффициент при wm в разложении A + до)п. Это хорошо известный результат, так как здесь классы эквивалентности являются (немаркирован- (немаркированными) подмножествами из т элементов множества R. В ком- комбинаторном анализе некоторые авторы называют эти подмно- подмножества «сочетаниями» — это несколько излишнее выражение в наше время, так как их можно называть просто «подмноже- «подмножествами». Сейчас мы рассмотрим один пример неполной демаркировки. Пример 22. Имеем шесть ярлыков du d2, d3, dk, db, de, кото- которые мы будем навешивать на грани куба, по одному на каждую грань. Ярлыки имеют цвета. Ярлык d{ желтый и d2 черный. Ярлыки d3 и di оба фиолетовые и их нельзя отличить друг от друга. То же самое имеет место для d5 и d6, которые оба пур- пурпурные. Усложним эксперимент, предположив, что лицо, прово- проводящее его, не знает, что является фиолетовым и что — пурпур- пурпурным. Такой человек не дальтоник, но хотя он видит разницу, он не знает названия этих цветов. Более того, ои даже не интере- интересуется, находятся ли люди, обозревающие окраску куба, по ту же сторону куба, что и он сам. Естественно маркировки, кото- которые могут быть получены одна из другой вращениями куба, должны быть отождествлены. Ищем число классов эквивалент- эквивалентности. Пусть D — множество из 6 ярлыков п R — множество из 6 граней куба. Группа G состоит из 8 подстановок и характери- характеризуется тем условием, что d{ и d2 фиксированы, а подмножество
Теория перечисления Пойа 91 {d3, di) отображается или на себя, или на множество {d5, d6). Цикловой индекс этой группы равен а Ря выражается правой частью равенства A). Число классов эквивалентности дается формулой C4). Это легко получить из того соображения, например, что оператор -д—) (-^—) дает ненулевой результат лишь для члена с z*zr Для числа классов эквивалентности получаем 1.^{б!4-3-3-2!22-2! + 6-2-2!4-1!} = 5. Мы можем это проверить, если опишем классы эквивалентности следующим образом. 1) Желтая и черная грани противополож- противоположны, а другие пары противоположных граней имеют одинаковый цвет. 2) Желтая и черная грани противоположны, а из осталь- остальных граней противоположные имеют различные цвета. 3) Жел- Желтая и черная грани смежные, а грань, противоположная желтой, имеет тот же цвет, что и грань, противоположная черной грани. 4) Нижняя грань черная, передняя желтая, а верхняя и левая грани одного цвета. 5) Нижняя грань черная, передняя желтая, а верхняя и правая имеют одинаковый цвет. 12. Общее число классов эквивалентности Снова мы имеем конечные множества D и R и группы под- подстановок G и Н множеств D и R соответственно. При помощи этих групп определяется понятие эквивалентности [см. B1)] в множестве RD всех отображений D в R, и мы будем интересо- интересоваться числом классов эквивалентности. Таким образом, вопрос стоит так же, как в п. 10, с той лишь разницей, что мы не будем больше ограничиваться взаимно однозначными отображениями. Другими словами, мы ищем перечень классов эквивалентности, принимая вес W(f) равным 1 для всех /6 RD- (g.h.) Применим опять формулу B3) и для вычисления 2 W (f) будем пользоваться первой частью п. 10. Эти рассуждения по- показывают следующее: если / удовлетворяет условию fg = hf, то каждый цикл множества D отображается в множестве R на цикл длины, равной делителю длины соответствующего цикла в D. Кроме того, внутри цикла имеется в виду такое соответ- соответствие цикличности. Если d — элемент цикла множества D и
92 Н Дж. Де Брёйн если f(d)=r, то отображение дается соотношениями: f(gd)=hr, /(g2d)=ftVHT. д. Обратно, каждая функция с таким свойством удовлетворяет условию fg = hf. Поэтому мы можем легко подсчитать число воз- возможностей, которые имеем для f. В каждом цикле множества D выделим некоторый элемент и назовем его выбранным элемен- элементом. Число возможностей для элементов из R, на которые мо- может перейти выбранный элемент при отображении /, равно 2 jcj, C6) где i — длина того цикла множества D, который содержит вы- выбранный элемент, с, — компоненты типа {ct, c2,...} элемента h, сумма берется по всем делителям / числа i. Поскольку выборы значений функции для различных выбранных элементов неза- независимы и поскольку эти выборы полностью определяют f, число функций f равно произведению сумм вида C6), взятому по всем выбранным элементам. Так как существует Ь, циклов длины /, мы получаем = (с,) ' (ci -+- 2с2)°- (с, + ЗсзГ {ci 4- 2с2 4- 4с4Г (с, 4- 5с5)" .... C7) Заметим, что в нашем контексте следует степень с показа- показателем 0 принять за 1, даже если основание равно нулю. Тогда не возникает трудностей при толковании бесконечного произ- произведения. Как и в п. 10, мы можем интерпретировать C7) как произ- производную. Степень аъ может быть записана как Ь-я производная от eaz при 2=0; если а = Ь = 0, то мы получим нужное значение 0°=1. Согласно этому, выражение C7) можно записать как произ- производную / д \"' (_д_\"'( д \ \ dzt ) \ дг2 ) \ дг3 I вычисленную при Zi=Z2 = z3= ... =0. Выражение под знаком экспоненты можно записать так: 2 г, 2 jcf = 2 jo, (Zj + z2j 4- z3j 4- ...). Теперь заметим, что дифференциальный оператор полу'чен из х^хрх"» ... заменой ху = -^—, х2 = -г—, ..., а операнд, на ко-
Теория перечисления Пойа 93 торый действует этот оператор, получается из х^'Х^хр за- заменой у „г1+г2+г,+ ... 2(г2+г,+г,+ ...) 3(г3+ге+г, + ...) Таким образом, суммируя по g и ft и применяя B3), получим следующий результат. Теорема 4. Общее число классов1) эквивалентности ото- отображений множества D в R равно выражению д д \у XPH[e'' + w'+-, е2(г2+г,+г6+...)) еЗ(г,+г,+г,+ ...), , . . ]f вычисленному при Zi = z2 = Zs= ... =0. Существует другое выражение для числа классов эквива- эквивалентности, которое иногда оказывается проще для применения. Заметим, что C7) получено подстановкой x^ — Ci, x2 = c1 + 2c2, • • • в выражение х^х^.... Суммируя по g и деля на \G\, полу^ чаем 3, cx-\-2c24-4^4, ...), где i'-й аргумент равен 2 jcj. Следовательно, снова воспользовавшись формулой B3) для числа классов эквивалентности, имеем \Н\'1 2 Pa(cv c, + 2c2, с, + 3с3, сх + 2с2 + 4с4, ...). C8) Здесь надо помнить, что {с4, с2, с3,...} — тип элемента ft. Рассмотрим несколько примеров. Во всех них тип обо- обозначают число элементов в множествах D и R соответственно: m = \D\, n = \R\. Пример 23. Рассмотрим частный случай, когда группа со- состоит только из единичного элемента и PG = xmi. Тогда классы эквивалентности можно назвать классами эквивалентности со- сочетаний с повторениями, так как если мы запишем D в виде по- последовательности {1, ..., т), то для каждой функции f?RD в ') «Классы» определяются в соответствии с эквивалентностью индуциро- индуцированной по формуле B1) группами подстановок G и Н множеств D н R соответственно.
94 Н Дж. Де Брёйн последовательности {f(l), ..., f(m)} могут оказаться повторе- повторения, поскольку f не обязана быть взаимно однозначной. По тео- теореме 4 число классов эквивалентности равно о.' C9) Если ?*ы рассмотрим еще более частный случай, когда груп- группа Я тоже" состоит только из единичного элемента, то классы эквивалентности будут не чем иным, как функциями f(LRD. В самом деле, в этом случае C9) превращается в пт, а Рн{ег, |. !,-••) становится равным епг. Еще один частный случай C9) получается, если, оставив R и Я любыми, потребовать, чтобы множество D состояло из од- одного элемента dt. Теперь две функции ft и f2 эквивалентны тогда и только тогда, когда fi(di) и /г(^0 принадлежат одному и тому же транзитивному множеству из R, т. е. тогда и только тогда, когда fi(di) можно отобразить на /2(di) некоторой пере- перестановкой из группы Я. Следовательно, число классов эквива- эквивалентности равно числу транзитивных множеств. В самом деле, если мы возьмем в C9) т=\, то это приведет к случаю нашей основной леммы, леммы 1, поскольку любой член полученный подстановкой А типа {сь с2, ...}, при подстановке его в C9) дает \Н\~хси a cf — число элементов множества R, инвариантных при подстановке А. Пример 24. Пусть G — симметрическая группа множества D, а группа Я произвольна. Действие симметрической группы со- состоит, грубо говоря, в том, что мы интересуемся только числом элементов множества D, которые функция f отображает на дан- данный элемент из R, а не самими элементами. Таким образом, наши классы эквивалентности могут быть описаны как классы эквивалентности отображений ф множества R в множество N={0, 1, 2, ...} с условием где классы эквивалентности образованы в соответствии с груп- группой Я, действующей на области определения, которой в данном случае является множество R. Таким образом, число классов эквивалентности можно подсчитать, пользуясь теоремой 4 или теоремой 1. Покажем, что в обоих случаях результаты одина- одинаковы. Можно применить теорему 1, если придать элементам
Теория перечисления Пойа 95 множества N веса 1, до1, до2, до3, ... и искать классы эквивалент- эквивалентности с весом wm. Число этих классов равно коэффициенту при дот в разложении ЯяО+да + ^ + да3-!- ..., l-f-w2+w4-f ... .... 1+да3+да6 + ...,)• Если применить теорему 4, то в качестве дифференциального оператора будем иметь коэффициент при дот в разложении ехР(«^г+4«»^г+ •¦¦); см. пример 5. Действие этого оператора на функцию <p(zi, z2,...) при z1 = z2 = ... =0 выражается так: Ф (да,  да2, j да3, ...). Следовательно, легко видеть, что в результате подстановки zl = w, z2 = 2" да2, z3 = -j да3, ... в аргументы Рн в теореме 4 получается д и т. д. Таким образом, мы получили Рн[(\ — w)~\ A — да2), A— да3), ...], т. е. тот же результат, что и выше. Строго говоря, применение здесь ряда Тейлора доставило бы больше забот, чем в п. 11, так как теперь мы имеем дело с сум- суммой показательных функций, а не с многочленом. Пример 25. Рассмотрим частный случай, когда Я — симме- симметрическая группа всех подстановок множества R, а группа G содержит лишь единичный элемент. Теперь классы эквивалент- эквивалентности оказываются разбиениями множества D самое большее на m классов, где разбиение на классы по определению озна- означает множество непересекающихся подмножеств (классов) мно- множества D, причем объединение их равно D. Мы пользуемся здесь термином «разбиение на классы» вместо более простого «разбиение», поскольку в дальнейшем будем употреблять по- последний термин в другом смысле. Вышеупомянутый результат
96 Н Дж. Де Брёйн следует из того факта, что если f(LRD, то f определяет разбие- разбиение на классы, если в один класс помещать все такие d, кото- которые отображаются при помощи f на один и тот же элемент мно- множества R. Согласно выражению C9) и примеру 5, находим, что число классов эквивалентности равно коэффициенту при wn в разло- разложении и легко видеть, что он равен т\, умноженному на коэффициент zmwn в разложении A — w)~l ew^e ~^ ¦ Из этого результата о числе разбиений самое большее на п классов нетрудно вывести, что число разбиений ровно на п классов равно т\, умноженному на коэффициент при zmwn в разложении ew^e ~1\ и что общее число разбиений на классы равно т\, умноженному на коэффициент при гт в разложении e"z~l- Это частный случай результата, принадлежащего Хадви- геру [7], для числа разбиений множества из п элементов на т классов, содержащих не более k элементов каждый. Пример 26. Если мы возьмем в качестве Н симметрическую группу, но теперь не будем делать каких-либо ограничений на группу G, то получим классы эквивалентности разбиений мно- множества D на классы. К сожалению, в этом случае, кажется, не- невозможно упростить результат теоремы 4 [или C8)]. Если мы возьмем в качестве G симметрическую группу мно- множества D, то классы эквивалентности станут разбиениями мно- множества неотождествляемых элементов на классы. То есть един- единственно размеры множеств принимаются во внимание, а не их содержимое. Таким образом, наши классы эквивалентности мо- могут быть приведены во взаимно однозначное соответствие с раз- разбиениями числа m на не более чем п частей. Разбиение числа m является решением {bit b2, ...} уравнения а целых неотрицательных числах Ьи Ь2, Ь3, ... . Мы говорим тогда, что число m разбито на Ь( единиц, Ь> двоек, Ь3 троек, .... и соответственно bi + b2 + b3+ ... называется числом частей раз- разбиения. Число классов эквивалентности можно получить из при- примера 24, взяв в качестве Н симметрическую группу* Мы полу- получим коэффициент при zm в разложении
Теория перечисления Пойа 97 который в нашем случае равен коэффициенту при zmwn в раз- разложении (l z)~' +W2(l z2fl\w^(\ z3)! а это выражение сводится к такому: exp[log(l — w)~4-l-log(l — дагГ' + logO - таг2) 4- •¦•]== со 1 П — wzk Это хорошо известный результат для производящей функции числа разбиений данного числа на данное число слагаемых (см. [13], стр. 112). Пример 27. Рассмотрим снова случай, который был в на- начале примера 26, ограничась теперь условием п = 2. Таким об- образом, мы получаем классы эквивалентности разбиений множе- множества на не более, чем два класса. Из C8) следует, что число таких классов эквивалентности равно ~РаB, 2, 2, ...) + ±Ра@, 2, 0, 2, ...), так как Р L v-2 _|_ JL *¦ гн — 2 1 ' 2 2- Если мы сравним это с числом классов эквивалентности раз- разбиений на два маркированных класса (см. пример 18), т. е. PGB, 2, 2, ...), то мы увидим, что член PG@, 2, 0, 2 ...) пред- представляет собой число симметричных разбиений множества D на два класса Dt и D2. То есть Pg@, 2, 0, 2...) представляет число классов эквивалентности подмножеств Du эквивалентных своим дополнениям, где эквивалентность определяется при помощи подстановок группы G, и классы эквивалентности определяются согласно этому же отношению эквивалентности. Как частный случай, возьмем в качестве D множество кор- корней 10-й степени из единицы и в качестве G группу десяти вра- вращений. Цикловой индекс (см. пример 7) равен и поэтому Ра@, 2, 0, 2 )=-i- 7 Зак. 909
98 Н. йж. йе Брёйн Обозначив через ш первообразный корень 10-й степени из единицы, опишем классы эквивалентности, указав представи- представителя каждого такого класса: {1, (О, (О2, (О3, (О4), }1, (О2, (О4, (О6, О)8}, {1, (О, (О4, (О7, О)8}, {1, (О, (О2, (О4, (О8). 13. Группа Кранца В этом пункте, который не зависит от п. 8, 9, 10, 11, а ме- местами и от п. 2 и 7, мы докажем результат Пойа о цикловом ин- индексе для так называемой группы Кранца. Пусть S и Т — конечные множества, и пусть G и Н — группы подстановок множеств S и Т соответственно. Рассмотрим пря- прямое произведение SxT, т. е. множество пар (s, t), s?S, t?T. Образуем частные подстановки множества SxT следующим образом: выберем элемент g? G и для каждого s(iS выберем элемент hs?H. Эти элементы определяют подстановку множе- множества SxT: (s, t)->(gs, hj), ses,ter. Существует |G|-|#|1SI таких подстановок, и они образуют группу, которую Пойа [10] назвал группой Кранца G[H]. Ее цик- цикловой индекс можно весьма изящно выразить в терминах цик- цикловых индексов групп G и Н, Теор ем а 5 (Пойа [10]). Имеем Ра \н\ {хи х2, ...) = Ра [Рн {х,ъ х2, х3, ...), Рн(х2, хь х6, . ..), ...], D0) где правая часть получена подстановкой Ук = Рн (**> хы *з*> • • •) в Ро (у„ у2, у3, ...). Доказательство. Фиксируем элемент у группы G[H], выбрав элементы g? G, ftt6 H,... ,/im? H. Мы хотим узнать тип у. Пусть si, ..., sh — циклы g длины k. To есть имеем s^S, ..., sk?S, gsl = s2, g% = s3, ..., Отсюда следует, что множество всех пар (s,-, /) для i—\,...,k, tdT, переходит в себя при преобразовании у. Назовем это мно- множество блоком и будем искать, на какие циклы распадается он под воздействием у. Мы утверждаем, что эти циклы зависят только от произведения
Теория перечисления Пойа 99 причем следующим образом: пусть h* имеет тип {си с2, с3, .. .}: тогда блок распадается на cf циклов длины k, с2 циклов дли- длины 2k и т. д. Это видно из того, как преобразование у и его сте- степени действуют на элемент (sit t). Последовательные примене- применения у дают (s,, 0-»-(й, Av t)->(s3, hs2 hst)-> ... ->(Si, h*t). Таким образом, (st, /) встречается впервые снова через kl при- применений преобразования у, где /—первый показатель степени, при котором {h*)lt = t. Отсюда следует, что элемент (st, t) по- порождает цикл длины kl. Заметив, что два элемента (su () и (sb t') порождают один и тот же цикл тогда и только тогда, когда t и У порождают один и тот же цикл при применении преобразования h*, мы делаем вывод, что наш блок содержит ровно С; циклов длины kl, и это справедливо для каждого /. Соответственно с этим каждому из таких блоков припишем произведение \ H\~k хЪ'х^Ъ .... Если просуммировать эти произ- произh h ф р ведения для hs, ¦¦-, hSk, где g, sit...,sh фиксированы, то мы получим Рн(Хк, x2h, x3k, • • •)• Это следует из того факта, что если А*,» ¦ . -, hs все пробегают группу Н, то произведение h* пробе- пробегает IWi^1 раз группу Н. Теперь рассмотрим все элементы -у группы G[H], получаю- получающиеся из единственного элемента g типа {bit b2,...}. Нетрудно показать методом, аналогичным приведенному в п. 7, что вклад этих элементов в цикловой индекс Ра\н\ равен [PH(xv х2, . ..)]*¦ \Р„{х2, *4, • • .)р\Рн{х„ х6, .. .р. . . . Наконец, после суммирования по всем g? G теорема полностью доказана. Оригинальное доказательство теоремы 5 у самого Пойа со- содержит весьма изящное, хотя и не совсем простое, применение его основной теоремы 1. Вот краткий набросок этого доказа- доказательства. Пусть R — некоторое конечное множество, элементы г кото- которого снабдим весами w (r). Рассмотрим отображения множе- множества Т в R и образуем классы эквивалентности X в смысле экви- эквивалентности, индуцированной группой Н. Пусть Л — множество этих классов эквивалентности. Его перечень таков: (r), 2 И (г)]2, ...}. D1) Теперь рассмотрим отображения множества S в Л и образуем классы эквивалентности г|з в смысле эквивалентности, индуциро- индуцированной группой G. Определив очевидным образом веса IF*(ар),
100 Н. Дж. Де Брёйн получим для перечня классов эквивалентности \|з следующее вы- выражение: ЕЛЛЕИЧ*,), 2[^№ SI^WP. •••}¦ D2) Суммы 2[№(А,)]2, 2[№(А,)]3 получаются применением соотноше- соотношения D1) к новым весам w2, w3,.... Следовательно, выражение D2) равно выражению, которое мы получим подстановкой x,= 2w@. ^=2[®№ •¦• D3) в правую часть формулы D0). Следующим шагом установим взаимно однозначное соответ- соответствие между множеством классов эквивалентности \|з и теми классами эквивалентности, которые соответствуют эквивалент- эквивалентности, индуцированной группой G[H] в множестве R(SXT). По- Поскольку это сделано, можно заключить, что перечень для \р также равен левой части D0) после подстановки туда D3). На- Наконец, равенство D0) можно получить из того факта, что R и w произвольны примерно в таком же смысле, что и в при- примере 17. Пример 28. В «-мерном векторном пространстве рассмотрим множество R, состоящее из 2п точек: 1, 0, 0, ..., 0), (—1, 0, ..., 0), @, 1, 0, ..., 0), @, —1, 0, .... 0) @, ..., 0, 1), @, ..., 0, —1). Пусть G — группа линейных однородных преобразований про- пространства, переводящих R на себя. Мы можем рассматривать R как прямое произведение множества {1,.. ., п} из п элементов и множества {—1, 1}, если точке (xi,... ,х„) поставим в соответ- соответствие пару (k, г) (для 1<?<п, е=±1) так: xh = e, *i = 0 при 1Фк. Кроме того, если рассматривать группу G как группу под- подстановок множества R, то легко видеть, что G оказывается группой Sn[S2], где Sn и S2 симметрические группы соответ- соответственно степеней п и 2. Из теоремы 5 и примера 5 мы видим, что цикловой индекс группы G равен коэффициенту при wn в разложении в степен- степенной ряд выражения Пример 29. Имеем п кубов, грани которых мы хотим окра- окрашивать в красный или голубой цвета. Спрашивается, сколько существует способов окраски, если эквивалентность определяется
Теория перечисления Попа 101 подстановками множества кубов и вращениями отдельных кубов. Рассматриваемая группа есть Sn[G], где Sn — симметриче- симметрическая группа степени n, a G — группа граней куба из примера 4. Из A5) следует, что для нахождения искомого числа мы должны подставить Xi = x2= . . . =2 в цикловой индекс. Если произведем эту подстановку в любой из многочленов Ра(хг, х2, х3, ...), Р0(х2, х4, х6, ...), Ра(х3, х6, хд, ...),..., D4) то всякий раз будем получать РсB, 2, 2, .. .), что равно 10 [см. пример 16]. Таким образом, ответом на наш вопрос является 5„ A0, 10, 10, ...). Это число равно коэффициенту при wn в раз- разложении а поэтому sn(\o, ю, ю, ...) = 1» Зададимся еще одним вопросом, связанным с примером 27. Многие ли классы эквивалентности, о которых шла речь выше, обладают тем свойством, что они не меняются, если поменять цвета? Согласно примеру 27, это число находится подстановкой xt = х3 = х5 = ... = и, х2 = X} = х6 = ... =2 в цикловой индекс. При этой подстановке многочлены D4) ста- становятся такими: PG@, 2, 0, 2, .. .), PGB, 2, 2, ...) и т. д., чере- чередуясь. Поскольку Ра@, 2, 0, 2, ...) = 2, мы получаем Psaia\@, 2, 0, 2, ...) = PSaB, 10, 2, 10, ...)¦ Это коэффициент при wn в разложении = ехр log A — w) + 8 log (I — w2)~ 2] = )~ = A — w)~\\ —¦w2y* = Например, при п = Ь искомо^ число классов эквиваденТИОСТИ равно 42.
102 Н. Дж Де Брёйн 14. Заключение Дадим некоторые замечания о материале, рассмотренном в этой статье, и об относящихся сюда вопросах. Как указал Харари [9] дополнение 1; см. также п. 11 статьи Харари (стр. 105—138 наст, сб.), многие важные аспекты теории Пойа были предвосхищены Редфилдом [12], но с применением несколько отличной терминологии. Очевидно, Редфилд был пер- первым, кто ввел цикловой индекс группы, который он назвал «group reduction function». Основная лемма (лемма 1), конечно, доказывалась довольно часто. Она является основной в вопросах о числе классов экви- эквивалентности. Рассмотрение этой леммы с рядом примеров дал Голомб [6]; в большинстве из этих примеров использовался цик- цикловой индекс, хотя и не всегда явно. Основная теорема Пойа была дана Пойа [10], Риорданом [13] (для применений см. также [14], Уленбеком и Фордом [16] и в более усложненной форме Риге [1], приложение V). Для при- применений к деревьям и графам, введенным Пойа [10], мы отсы- отсылаем к обзору Харари [9] и ссылкам, данным там; смотрите также Уленбек и Форд [16] и статью Харари (стр. 105 — 138 наст, сб.) этой книги. Сейчас мы будем рассматривать только применения и обобщения, которые не относятся к перечислению деревьев и графов. Сначала приведем несколько общих положений. Если у нас есть одна или более групп подстановок, действующих на мно- множестве объектов, то мы часто можем рассматривать новые мно- множества объектов, на которых естественным образом действуют подстановки, индуцированные первоначальными подстанов- подстановками. В этой новой ситуации можно попытаться найти число транзитивных множеств и цикловой индекс. Типичный пример — п. 12, где D и R — первоначальные множества, на которых дей- действуют группы G и Я, в то время как новые объекты — отобра- отображения множества D в R, а элементы групп g? G и /г?Я инду- индуцируют подстановку f-*-hfg~{. Эти подстановки образуют группу, а транзитивные множества — то, что мы называем клас- классами эквивалентности. В качестве следующего примера мы можем привести под- подстановки, индуцированные группами G и Я на прямом произве- произведении D и R, где g?G, h€ Я индуцируют отображение (d, г)-+(gd, hr). Эта группа подстановок —то, что Харари [8] называет прямым произведением G и Я (он применяет термин прямая сумма для группы из примера 8). Эта группа индуци- индуцирует группу подстановок на подмножествах произведения.
Теория перечисления Пойа 103 DxR- Если вместо всех подмножеств мы рассмотрим только подмножества, являющиеся графами отображений D в R, то снова вернемся к случаю п. 12. Аналогично группа Кранца G[H] из п. 13 индуцирует группу, которую Харари [8] называет экспоненциацией HG. Любой эле- элемент G[H] образует подстановку прямого произведения SxT, следовательно, он переставляет подмножества множества Sx Т. Подмножество, которое является графом отображения 5 в Т, преобразуется в другое подмножество такого типа. Теперь эти графы образуют новые объекты, а их группой подстановок яв- является Н°. Несмотря на то, что можно воспользоваться спосо- способом, которым элементы G[H] были сгруппированы при первом доказательстве теоремы 5, получить простое выражение для циклового индекса группы HG нелегко. Вот сравнительно простой пример. Пусть G — группа под- подстановок множества R и Ф — множество отображений R в себя. Любое g? G индуцирует подстановку множества Ф : ф-> grpg (см. [4]) и случай взаимно однозначных отображений (см. [2]). Существенным аспектом теории Пойа является использова: ние весов настолько общего характера, что мы можем принять их за переменные. В результате этого мы можем интересоваться вопросами о числе классов эквивалентности, подчиняющихся не- некоторым дополнительным условиям, как, например, условие о четырех красных и двух голубых гранях в примере 16. Таким образом, использование переменных весов дает нам возмож- возможность получить производящие функции. Этого аспекта недоста- недоставало в п. 10 и 12, которые являются частными случаями более общих теорем, представленных в [2], где встречаются произво- производящие функции. Дальнейшее применение теории Пойа было дано Пойа [11] и Слепяном [15]. В их работах рассматриваются симметричные типы булевых функций п булевых переменных. Функция п бу- булевых переменных является функцией, определенной на множе- множестве 2" элементов; на этом множестве мы можем определить группу подстановок порядка п\ 2" и степени 2™, если возьмем все подстановки переменных и все возможные способы замены не- нескольких переменных их отрицаниями. (Используя экспонен- циацию Харари, мы можем обозначить эту группу через S2n , где S2 и 5, — симметрические группы степеней 2 и л соответ- соответственно.) Эти «симметрические типы» и являются как раз клас- классами эквивалентности отображений области определения из 2" элементов в множество значений из 2 элементов, где классы эквивалентности взяты по отношению к эквивалентности, инду- индуцированной группой подстановок S2n области определения. Нет
104 Н. Дж. Де Брёйн необходимости говорить, что мы можем также определить число классов эквивалентности в случае, если эквивалентность расши- расширена путем взятия булевой функции, эквивалентной своему от- отрицанию. Это относится к симметрической группе области значений из 2 элементов; ответ дан в примере 27. Окончательно мы упомянем применение теоремы 4 (см. при- пример 26) к случаю, когда G является циклической или диэдраль- ной группой подстановок, а Н является симметрической груп- группой (Гильберт и Риордан [5]). Эти авторы также дают примене- применение теории к музыкальным аккордам. Замечание, добавленное при корректуре. После того как была написана эта статья, автор опубликовал новое обобщение теории Пойа в статье, которая в это время появилась («Enume- rative Combinatorial Problems concerning Structures, N. Arch. Wisk C) 11, 1963, 142—161). Там дано много применений ме- метода, основанного на рассмотрении многочлена И{у\, г/2,...) для данного класса структур при наличии группы подстановок. (Читатель может сам подумать о классе маркированных гра- графов из п вершин и k ребер, если брать в качестве группы под- подстановок группу всех подстановок ярлыков.) Элемент группы подстановок либо переводит структуру в эквивалентную струк- структуру, либо оставляет структуру инвариантной. В последнем слу- случае подстановка принадлежит группе автоморфизмов струк- структуры. Выделим полное множество неэквивалентных структур из нашего класса, и для каждой из них определим Pz, т. е. цикло- цикловой индекс группы автоморфизмов. Сумма всех таких Pz есть полином U. Этот полином дает решение многих комбинаторных задач, относящихся к структурам, совершенно аналогично тому, как PG дает решение для единственного множества объектов, переставляемых группой подстановок. Например, рассматривая частный случай графов, упомяну- упомянутый ранее, мы можем искать число существенно различных ок- окрашенных графов с п вершинами и k ребрами, где вершины окрашиваются в цвета из набора, содержащего г красок. Ответ прост: U(r, r, ...), что аналогично A5). В этом примере и во многих других случаях полином U может быть определен точно. Вопросы для самопроверки 1. Пусть т — некоторое фиксированное целое число, и пусть п=2т + 1. Рассмотрим 10" чисел из п цифр (число может начинаться оДним или не- несколькими нулями), причем каждое из чисел напечатано на листочке бумаги. Два числа считаются одинаковыми, если одно переходит в другое при пере- переворачивании «вверх ногами» (так, например, 0698161 отождествляется
Теория перечисления Пойа 105 с 1 918 690, так как перевернутые цифры 0, 6, 9, 8, 1 нельзя отличить от 0, 9, 6, 8, 1 соответственно). Число различных чисел на листках равно: а) 10"-1-5" +у-б, б) 5" + 3 ¦ 5т, в) 10»+1EЯ1+1-5в). г) ни одному из предыдущих чисел. 2. Пусть S — конечное множество, и пусть G— группа подстановок множества S. Рассмотрим множество Т упорядоченных пар (а, 6), где a?S, b?S. Пусть любой подстановке g ? С соответствует подстановка h множе- множества Т, определенная так: h(a, b) = (ga, gb). Эти элементы h образуют группу Н подстановок множества Т. Ее цикловой индекс Рд равен: а) в точности Рв, б) полностью определен цикловым индексом Pg, но не структурой са- самой G как абстрактной группы, ' в) неправильно определен предыдущими утверждениями (а и б), так как структура множества Т зависит от структуры множества S, а не только от структуры группы G, г) полностью определен структурой группы G как абстрактной группы. 3. Рассмотрим полый куб с тонкими стенками, который мы хотим окра' шивать как снаружи, так и изнутри. Таким образом, надо окрасить 12 граней. Нашего количества краски до- достаточно, чтобы окрасить 7 граней в красный и 5—в голубой цвет. Если Рв обозначает цикловой индекс, то число классов эквивалентности (относительно ортогональной группы) равно коэффициенту при г7Ьъ в выра- выражении а) \Ра(г + Ь. г»+6*. г* + Ь\ шшш)уг б) Pol(r + b)*. (г*+6*)*, (г»+ 6»)*...]. в) Ро (г2 4- Ьг 4- ь\ г4 4- ьч* 4- ь\ г6 4- SV3 4- *"• • ¦ • )¦ г) Ро С2 4- Ь\ г4 4- *'. '¦' 4- *"• ¦ • • )• 4. Рассмотрим классы эквивалентности отображений множества S в мно- множество классов вычетов по модулю 6 с эквивалентностью, индуцированной группой G множества S. Предположим, что |G|>1. Вес функции равен клас- классу вычетов по модулю б и определяется просто как произведение значений функции jjf(s). Предположим теперь, что сумма весов классов эквивалентно- сти сравнима по модулю 6 с Рв C, 1, 3, 1, ...), так как сумма k-x степеней чисел 1, 2, 3, 4, 5, 6 сравнима по модулю 6 с 3, если k нечетно, и с 1, если k четно. Последнее предположение а) есть следствие основной теоремы Пойа 1, б) верно, но не является следствием теоремы 1 в силу сделанного в тео- теореме ограничения относительно кольца, которому принадлежат зна- значения весов, в) чепуха, так как классы вычетов являются значениями функции, и их нельзя использовать одновременно в качестве весов, г) чепуха, так как мы ие определили деление в кольце классов вычетов по модулю 6. 5. В кольце многочленов от шести переменных Z\, z-i, г3, г4, 2s, гв с це- целыми коэффициентами рассмотрим многочлен ip=Z\ZgZ3 + ZiZ5Z$. Кроме того.
106 Н. Дж. Де Брёйн рассмотрим группу G подстановок шести символов 1, 2, 3, 4, 5, 6, состоящую из всех подстановок я, удовлетворяющих равенству г лB). гя(зг гяD). гпфу гя(б)) = Ф(г1- г2, г3, г4, г5, г6), тождественному относительно гь ,.., г6. Эта группа есть а) прямое произведение S2 X S2 X ^ б) прямое произведение S3 X ^з. в) группа Кранца S3 [S2], г) группа Кранца S2 [S3], ЛИТЕРАТУРА 1. Б е р ж, Теория графов и ее применение, ИЛ, М., 1962. 2. d e Bruijn N. G., Generalization of Polya's Fundamental Theorem in Enumerative Combinatorial Analysis, Nederl. Akad. Wetensch. Proc. Ser. A 62 Indag. Math., 21 A959), 59—69. 3. Burnside W., Theory of Groups of Finite Order, 2nd edition, Cambridge University Press, Cambridge, England, 1911; Dover Publications, New York, 1955. 4. Davis R. L., The Number of Structures of Finite Relations, Proc. Amer. Math. Soc, 4 A953), 486—495. 5. Gilbert E. N., Riord an J., Symmetry Types of Periodic Sequences, Illinois J. Math., 5 A961), 657—665. 6. Golomb S. W., A Mathematical Theory of Discrete Classification, in С Cherry (editor), Information Theory, Fourth London Symposium, Butter- worths, London, 1961. 7. Hadwiger H., Gruppierung mit Nebenbedingungen, Mitt. Verein, Schweiz, Versich-Math., 43 A943), 113—122. 8. H a r a r у F., Exponentiation of Permutation Groups, Amer. Math. Monthly, 66 A959), 572—575. 9. H a r a r у F., Unsolved problems in the enumeration of graphs, Magyar Jud. Akad. Mat. Kutato Int. Kozl. Pubt. Math. Inst. Hungarian Acad. Sci., 5 (I960), 63—95. 10. Pol у a G., Kombinatorische Anzahlbestimmungen fur Gruppen, Graphen und chemische Verbindungen, Ada Math., 68 A937), 145—254. 11. Poly a G., Sur les types des propositions composees, /. Symbolic Logic, 5 A940), 98—103. 12. Redfield J. H., The theory of group-reduced distributions, Amer. J. Math., 49 A927), 433—455. 13. P и op дан Дж , Введение в комбинаторный анализ, ИЛ, М., 1963. 14. R i о г d a n J., The combinatorial significance of a theorem of Polya /. Soc. Indust. Appl. Math, 5 A957), 225—237. 15. Slepian D., On the number of symmetry types of Boolean functions of n variables, Canadian J. Math., 5 A953), 185—193. 16. Uhlenbeck G. E., Ford G W., Theory of linear graphs with applica- application to the theory of the virial development of the properties of Gases, in J. de Boer and G. E. Uhlenbeck (editors), Studies in Statistical Mecha- Mechanics, Vol. 1, 123—211, North Holland Publishing Company, Amsterdam 1962. 17. Riordan J., Generating functions, Applied Combinatorial Mathematics, Wiley, N-Y, 1964, стр. 67—96.
КОМБИНАТОРНЫЕ ЗАДАЧИ ПЕРЕЧИСЛЕНИЯ ГРАФОВ Фрэнк Харари 1. Введение В настоящей статье мы задались целью указать несколько нерешенных задач перечисления графов в надежде возбудить более активный интерес к этой области. Вероятно, не все эти задачи будут решены в ближайшем будущем, так как их реше- решение означало бы, в частности, решение проблемы четырех кра- красок. Покажем сначала, пользуясь графами и направленными гра- графами, что подразумевается под задачей перечисления графов. Затем разовьем эти предварительные понятия, чтобы кратко сформулировать нерешенные задачи. Будут даны (без доказа- доказательств) некоторые методы, которые используются при пере- перечислении графов. Наиболее важным из них является изящный и сильный метод перечисления Пойа. Этот метод или его вариа- вариации применялись при решении большинства задач подобного рода. Мы сопоставим задачи, касающиеся числа деревьев все- всевозможных видов с аналогичными задачами для графов. При- Приводятся также списки 27 решенных и 27 нерешенных задач. Указана важность нерешенных задач и природа их существен- существенных трудностей. Заключает эту статью исчерпывающая библио- библиография. 2. Предварительные сведения о графах Граф G состоит из конечного множества V вершин Vi, и2. • • ¦ . . . , vp и множества X неупорядоченных пар различных вершин множества V. Каждая такая пара вершин и и v есть ребро x = uv графа G. Мы говорим в этом случае, что вершины и и v смежные и ребро X инцидентно каждой из них. Заметим, что по определе- определению граф не содержит различных ребер, соединяющих одну и ту же пару вершин. Если обобщить определение графа, разре- разрешив кратные ребра, т. е. ребра, соединяющие одну и ту же пару различных вершин, то полученный граф называется мультигра- фом. Если, кроме параллельных ребер, мы еще разрешим нали- наличие петель, т. е. ребер, соединяющих вершины сами с собой, то получим граф общего вида (или общий граф).
108 Фрэнк Харари Подграф графа G состоит из подмножества множества V и подмножества множества X, которые сами образуют граф. На- Натянутый подграф графа G содержит то же множество V вершин, что и G. Два графа изоморфны, если существует взаимно однознач- однозначное соответствие между множествами их вершин, сохраняющее отношение смежности. На рис. 1 показаны все графы (с точ- точностью до изоморфизма), состоящие из четырех вершин. Подробное изложение теории графов смотрите у Кёнига [38], Бержа [1] и Оре [45]. Направленный граф (или, короче, диграф) состоит из конеч- конечного множества V вершин и множества упорядоченных пар раз- различных вершин множества V. Каждая такая упорядоченная Рис. 1. Графы с четырьмя вершинами. пара (и, v) называется дугой (или ребром, если смысл ясен из —> контекста) и обозначается uv (или кратко uv, если ясно напра- направление). Определение изоморфизма диграфов аналогично соответ- соответствующему определению для графов. На рис. 2 показаны все диграфы из трех вершин. Более подробное исследование дигра- диграфов per se смотрите у Харари, Нормана и Картраита [31]. Пусть gpq — число графов с р вершинами и q ребрами. Пе- Перечислить графы с р вершинами означает найти выражение для производящей функции, или перечисляющего ряда (много- (многочлена): gp (Х) = gpO +gpiX-\- * где наивысшая степень х равна р(р — 1 )/2. Обозначим через gpq число диграфов с р вершинами и <? реб- ребрами. » • Тогда 1 gp2x2 -}- . ..
Комбинаторные задачи перечисления графов 109 — перечисляющий многочлен для диграфов с р вершинами (здесь наивысшая степень х равна р{р— 1)). Из рис. 1 и 2 видно, что перечисляющие многочлены для гра- графов из четырех вершин и диграфов из трех вершин равны соот- соответственно gA(x)= 1 + х ^з (х) = 1 + х+ 4х2 + 4х3+ 4х4 Путь графа — это последовательность вершин и ребер, начи- начинающаяся и кончающаяся вершинами, причем вершины и ребра О О Q О О О О О О О О г О Л А Л ?. А 0. ?, А Рис. 2. Графы с тремя вершинами. чередуются и каждое ребро инцидентно вершине, непосред- непосредственно предшествующей и непосредственно следующей за ним. Говорят, что путь вида Vo, хи vit х2,. .. ,vn соединяет вершины Vo и vn- Длина пути есть число ребер в нем. Цепь — это путь, в котором все ребра различны; элементар- элементарная цепь — путь, в котором различны все вершины. Открытый путь имеет различные начало и конец; у замкнутого пути они совпадают. Элементарный цикл — замкнутый путь, в котором все вер- вершины различны, кроме начала и конца, которые совпадают1). Полный путь содержит все вершины графа G. Граф называется связным, если каждая пара его вершин соединяется элементар- элементарной цепью. Дерево — это связный граф, не имеющий элемен- элементарных циклов. Расстояние между двумя вершинами — это дли- длина кратчайшей элементарной цепи, соединяющей их2). ') Циклом называется замкнутая цепь. — Прим. ред. 2) Смысл определений связного графа, дерева и расстояния не изме- изменится, если заменить слова «элементарная цепь», «элементарный цикл» и «элементарная цепь» на «путь», «замкнутый путь» и «путь» соответственно.—¦ Прим. ред.
Таблица I Нерешенные задачи перечисления графов Категория Диграф Распределение Топология Связность Группы Электричество Физика Задача Сильные диграфы Односторонние диграфы Диграфы с источником Графы с данным распределением Гомеоморфно несводимые графы Однородные графы Эйлеровы графы ^-окрашенные и ^-хроматические графы Планарные графы Планарные графы с дополнительными свой- свойствами Бипланарные графы Симплициальные комплексы Графы данного диаметра и охвата Графы данного индекса и уровня связ- связности Неразделимые графы Реберные графы Симметричные графы Тождественные графы Графы с заданной группой Латинские квадраты Типы полных циклов на п-кубе Конечные автоматы Неприводимые двухполюсные сети п-мерная задача Лизинга Задача Лизинга с магнитным полем Мозаика Задача о росте клеток Номер 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 В п. 4—10 эти задачи описаны более подробно.
Комбинаторные задачи перечисления графов 111 Степень вершины — число ребер, инцидентных ей; распреде- распределение графа — это последовательность степеней его вершин. Если каждая пара вершин графа соединена ребром, то граф называется полным и обозначается КР- Существуют соответствующие определения для диграфов. Например, направленная элементарная цепь из v{ в vn состоит из последовательности дуг v,v2, v&z, ..., vn^ivn вместе с п раз- различными вердлинами. Если существует направленная элементар- элементарная цепь из и в в, то в называется достижимой из и. Внешняя степень вершины v — это число дуг, выходящих из v; внутренняя степень — число дуг, входящих в v. Распределе- Распределением диграфа называется последовательность упорядоченных пар, составленных из внешней и внутренней степеней каждой вершины. 3. Некоторые нерешенные задачи Решением каждой из задач табл. 1 можно считать произво- производящую функцию в замкнутой форме для числа графов каждого данного вида с данным числом р вершин и данным числом q ребер (или дуг для диграфов). Эти задачи разбиваются на семь категорий, объединяющих связанные между собой задачи, как это показано в табл. 1. 4. Задачи о направленных графах Диграф D называется сильно связным или сильным, если каждая его вершина достижима из любой другой; D называется односторонне связным или односторонним, если для любых двух Ситный Односторонний Слабый Несвязный Р и с 3. Диграфы с различными видами связи. вершин хотя бы одна достижима из другой; D называется слабо связным или слабым, если для любого разбиения множества его вершин на два непустых подмножества существует ребро, иду- идущее из вершины одного подмножества в вершину другого. На- Наконец, диграф D называется несвязным, если он не является слабым (см. рис. 3). Источником диграфа называется вершина, из которой дости- достижимы все остальные вершины,
112 Фрэнк Харари Рассмотрим следующие типы диграфов: Сильные диграфы Односторонние диграфы Диграфы с источником Для каждого из них получим из рис. 2 перечисляющий мно- многочлен в случае диграфа из трех вершин. Для сильного диграфа это так как, например, существует два сильных диграфа из трех вершин и четырех ребер. Для односторонних диграфов этот пе- перечисляющий многочлен таков: х2 + 4л? ¦+ 4х4 4- Xs 4- -к6, а для диграфов с источником — 2х2 4- 4х34- 4 5. Задачи, связанные с распределением Графы с заданным распределением Из рис. 1 видно, что все графы из четырех вершин имеют различные распределения. Например, граф, состоящий из одного элементарного цикла длины 4, имеет распределение B, 2, 2, 2), причем это единственный граф с таким распределением. Однако при числе вершин, большем четырех, существуют различные графы с одинаковым распределением. Рис. 4. Два графа с одинаковым распределением. Например, на рис. 4 показаны два графа, имеющих распре- распределение A, 1,2, 2, 2). Гомеоморфно несводимые графы Граф называется гомеоморфно несводимым, если у него нет вершин степени 2. Из рис. 1 видно, что перечисляющий много- многочлен для гомеоморфно несводимых графов из четырех вершин равен
Комбинаторные задачи перечисления графов 113 Однородные графы Однородный граф — это граф, в котором все вершины имеют одну и ту же степень; однородный граф называется кубичным, если степень каждой вершины равна 3. Однородные графы пред- представляют собой интересный частный случай графов с заданным распределением. Каждый однородный граф степени 1 имеет четное число 2п вершин, соединенных ребрами так, что получаются п связных компонент. Каждый однородный граф степени 2 содержит эле- элементарный цикл в каждой своей компоненте. Более интересный случай однородных графов — это кубич- кубичные графы. Единственный кубичный граф из четырех вершин показан на рис. 1; так что перечисляющий многочлен для кубич- кубичного графа из четырех вершин есть просто л'6. Эйлеровы графы и диграфы Эйлер доказал, что граф содержит цикл, проходящий через все его вершины (т. е. полный цикл), тогда и только тогда, когда он связен и каждая вершина имеет четную степень. Та- Такие графы были названы эйлеровыми. Из результата Эйлера Рис. 5. Эйлеров граф и эйлеров диграф. следует, что эйлеровы графы принадлежат категории графов с заданным распределением. Диграф эйлеров тогда и только тогда, когда он сильный и для каждой вершины ее внешняя степень равна внутренней. На рис. 5 показаны эйлеровы граф и диграф. 6. Топологические задачи Графы ^-окрашенные н ^-хроматические Граф называется k-окрашенным, если каждой его вершине придан один из k цветов так, что вершины одного цвета не со- соединены ребром и в окраске участвуют все k красок. Два &-ок- рашенных графа считаются изоморфными, если существует изо- изоморфизм между ними как графами такой, что две вершины пер- первого графа имеют один и.тот же цвет тогда и только тогда, Ь зэк. ад
114 Фрэнк Харари когда их образы окрашены в один цвет. Граф называется &-хро- матическим, если он может быть ^-окрашен. Например, биокрашенные графы с двумя вершинами каждого цвета даны на рис. 6, на котором две левые вершины каждого графа считаются окрашенными в первый цвет, а две правые вершины — во второй цвет. Найдены числа лишь биокрашенных и бихроматических гра- графов [25], [33]. Очевидно, что существует взаимно однозначное соответствие между связными1) биокрашенными графами и связными бихро- матическими графами, но несвязных биокрашенных графов Рис. 6. Биокрашенные графы с двумя вершинами каждого цвета. больше, чем несвязных бихроматических графов. По теореме Кёнига [38] граф бихроматический тогда и только тогда, когда все его элементарные циклы имеют четную длину. Таким образом, из рис. 1 видно, что число бихроматических графов из четырех вершин дается многочленом Аналогично тому, как КР обозначает полный граф с р вер- вершинами, через Km, n обозначим полный биокрашенный граф с т вершинами одного и п вершинами другого цвета, в котором две вершины соединены тогда и только тогда, когда они окрашены в разные цвета. И вообще через Кп „ „ обозначим полный Г Г "V П2 "ft ^-окрашенный граф с п,- вершинами г-го цвета. Пленарные графы У плоского графа вершины — точки плоскости, ребра — ли- линии плоскости, пересекающиеся разве лишь в вершинах. Граф называется планарным, если он изоморфен плоскому графу. ') Неизоморфнымн. — Прим. ре<).
Комбинаторные задачи перечисления графов 115 Подразбиением ребра uv графа называется замена этого ребра двумя ребрами uw и wv вместе с новой вершиной w. Под- Подразбиение графа — результат последовательных подразбиений его ребер. Два графа называются гомеоморфными, если они обладают изоморфными подразбиениями. Куратовский показал, что граф планарен тогда и только тогда, когда он не содержит подграфов, гомеоморфных графам /Сз.з или Кь, изображенным на рис. 7. Рис. 7. Два непланарных графа. Наиболее четкое доказательство этой теоремы дано у Дирака и Шустера [10]. Другие критерии того, чтобы граф был планарен, рассмотрены Уитни [69]. Поскольку каждый граф из четырех вершин планарен, пере- перечисляющий многочлен для планарных графов из пяти вершин получается из перечисляющего многочлена для всех графов из пяти вершин вычитанием х" ю Планарные графы с дополнительными свойствами Эти задачи включают планарные кубические, планарные эй- эйлеровы и планарные /г-хроматические графы. Они интересны в основном благодаря их связи с проблемой четырех красок. Бипланарные графы Граф называется бипланарным, если он есть объединение двух планарных подграфов. Так, граф /С5, изображенный на рис. 7, бипланарен, поскольку он является объединением двух планарных подграфов, например двух циклов длины 5. Есте- Естественно, каждый планарный граф бипланарен, но не наоборот. Пока не известен комбинаторный критерий того, чтобы граф был бипланарен. Симплициальные комплексы Симплициальный комплекс (абстрактный) состоит из мно- множества Р точек и совокупности S подмножеств множества Р,
116 Фрэнк Харари называемых симплексами и удовлетворяющих следующим двум условиям: 1. Каждая точка — симплекс. 2. Каждое непустое подмножество симплекса — симплекс. Размерность симплекса на единицу меньше числа точек в нем. Задача состоит в нахождении числа неизоморфных симпли- циальных комплексов с заданным числом симплексов каждого измерения. Мы проиллюстрируем это с помощью рис. 1, написав перечисляющий многочлен для симплициальных комплексов с четырьмя точками и с заданным числом 1-симплексов (отрез- (отрезков) и 2-симплексов (треугольников). Если переменные х и у представляют 1-симплексы и 2-симплексы соответственно, то искомый перечисляющий многочлен таков: 1 + х 4- 2х2 + Зх3 4- xhj + 2х4 + х4у + х5 + х5у + 4- xhf 4- х6 4- х*у 4- х у 7. Задачи, касающиеся связности Графы с данными диаметром и охватами Диаметр связного графа — это наибольшее расстояние ме- между любыми двумя его вершинами. Нижним охватом (lower girth) называется длина наименьшего цикла, а верхним охватом (upper girth)—длина наибольшего цикла. Из рис. 1 видно, что перечисляющий многочлен для связного графа из четырех вер- вершин с диаметром 2 равен х3 + 2х* + х5; что ровно три связных графа имеют нижний охват равным 3, и столько же графов с верхним охватом 4. Графы данного индекса и данного уровня связности В результате удаления вершины v и ребер, инцидентных с V, из графа G получается граф G—у, который является макси- максимальным подграфом графа G, не содержащим вершины v. Ана- Аналогично граф G—х, полученный удалением ребра х из графа G, — это максимальный подграф G, не содержащий ребра х. Уровень связности графа G — это наименьшее число вершин, удаление которых приводит к графу, несвязному или состоя- состоящему из одной вершины. Индекс связного графа — это наимень- наименьшее число ребер, удаление которых делает граф деревом. Из рис. 1 получаем, что перечисляющий многочлен для связ- связных графов, состоящих из четырех вершин, с уровнем связности 1 равен 2х3 + хА, Среди связных графов из четырех вершин два графа имеют индекс 1, один — индекс 2 и один — индекс 3,
Комбинаторные задачи перечисления графов 117 Неразделимые графы Рассекающей вершиной связного графа называется вершина, удаление которой приводит к несвязному графу. Блок графа — это максимальный связный подграф, не имеющий рассекающей вершины. Неразделимый граф имеет только один блок. Поскольку связный граф обладает уровнем связности 1 тогда и только тогда, когда в нем есть рассекающая вершина, то отсюда сразу следует, что уровень связности неразделимого графа больше еди- единицы. Из рис. 1 видно, что перечисляющий многочлен для нераз- неразделимого графа из четырех вершин равен х4 + х5 + х6. Реберные графы Два ребра графа G называются смежными, если оба они ин- инцидентны общей вершине графа G. Реберный (line) граф графа G — это граф, вершины которого соответствуют ребрам G, и та- такой, что в нем две вершины являются смежными, если смежны соответствующие ребра в G (см. рис. 8). Граф назы- Р и с. 8. Граф G и его реберный граф Н. вается просто реберным, если он реберный граф некоторого графа. Следует заметить, что здесь различные авторы поль- пользуются различной терминологией, причем иногда эта термино- терминология более наглядна, иногда менее. Так, реберный граф графа G Оре [45] называет замененным (interchange), а Сабидусси [61] — производным (derivative) графом. Идея реберного графа G появилась впервые у Уитни [68], ко- который показал, что реберный граф Н является реберным гра- графом лишь одного графа, если только не имеет место равенство Н = Кз. Крауз [39] получил следующий изящный критерий ребер- ности графа: граф G — реберный тогда и только тогда, когда существует такое разделение множества ребер G в полные под- подграфы, что никакая вершина G не лежит в более чем двух таких подграфах. Задача состоит в отыскании числа реберных графов с задан- заданным числом вершин и ребер.
118 Фрэнк Харари 8. Задачи, связанные с группами Симметричные графы Автоморфизм графа — это изоморфизм его на себя. Две вер- вершины графа называются подобными, если существует изомор- изоморфизм, переводящий одну из них в другую; подобие двух ребер определяется аналогично. Граф называется ввршинно симметричным, если все его вер- вершины подобны, реберно симметричным, если подобны все его Вершинин симметричный Реберно симметричный Симметричный Рис. 9. Симметричные графы. Рис. 10. Тождественные графы. ребра, и просто симметричным, если он и вершинно симметри- симметричен и реберно симметричен. На рис. 9 приведены графы каждо- каждого из этих трех типов. Задача состоит в подсчете числа графов каждого из этих типов с данным числом вершин и ребер. Тождественные графы В тождественном графе единственным автоморфизмом яв- является тождественное преобразование. На рис. 10 показаны наи- наименьшие тождественные графы без циклов и с циклами. Графы с заданной группой Группой графа называется совокупность всех его автомор- автоморфизмов; это группа подстановок, действующая на множестве вершин графа. "Известно [13], что каждая конечная группа изо- изоморфна группе некоторого графа, но не известно, вообще го- говоря, является ли данная группа подстановок группой графа.
Комбинаторные задачи перечисления графов 119 Общая задача, включающая в себя эту, состоит в том, чтобы найти число графов с данной группой подстановок. Реберная группа графа G — это группа подстановок, дей- действующая на множестве ребер G и такая, что ее подстановки индуцированы подстановками группы автоморфизмов. Можно также искать число графов с данной реберной группой. Латинские квадраты Латинским квадратом порядка п называется квадратная ма- матрица порядка п, каждый столбец и каждая строка которой являются перестановками целых чисел 1, 2, ..., п. Пусть Ln — число таких латинских квадратов, у которых числа в первой строке и первом столбце расположены в естественном порядке 1„2, ..., п. Известны лишь семь первых членов перечисляющего ряда латинских квадратов: Каждый латинский квадрат можно рассматривать как би- окрашенный граф Кп, п, в котором ребра тоже окрашены. Точки Ui первого цвета соответствуют рядам латинского квадрата, а точки V{ второго цвета — столбцам. Каждое ребро графа Кп, п окрашено в один из п цветов та- таким образом, что каждая вершина инцидентна ровно одному ребру каждого цвета. В матричной интерпретации таких графов цвету ребра щь^ соответствует член ац матрицы. 9. Задачи из теории электричества Неподобные полные циклы на я-кубе n-Кубом называется граф из 2" точек, каждая из которых есть последовательность из п нулей и единиц, в котором две 010 01 оо ю 2-куЪ 3-куд Рис. 11. Два куба. точки смежные, если они различаются ровно одной цифрой. На рис. 11 изображены 2-куб и 3-куб. Два полных цикла «куба
120 Фрэнк Харари называются подобными, если существует автоморфизм куба, отображающий один цикл в другой. Легко самостоятельно убедиться в том, что на 3-кубе имеется всего один с точностью до подобия тип полных циклов. Гильберт [15] показал, что перечисляющий ряд для этой за- задачи начинается так: х2 + х3 + 9х4 + ..., где коэффициент при хп есть число попарно неподобных полных циклов на «-кубе. Этот коэффициент не известен даже для х5. Общее число полных цик- циклов также неизвестно для п>4. Конечные автоматы Конечный автомат, или последовательная машина, с двумя входами 0, 1 и конечным числом-состояний может быть опре- определен следующим образом. Рас- Рассмотрим общий диграф (т. е. такой, в котором возможны петли и параллельные дуги) и назовем его точки состояния- состояниями, причем одну из них — на- начальным состоянием. Из каждой вершины идут две дуги; одна из них отмече- отмечена знаком 0, другая 1. Началь- Начальное состояние называется ис- Рис. 12. Конечный автомат. точником (см. рис. 12). Два 9 знака @,1) на дугах диграфа называются входами и служат для обозначения следующего со- состояния машины, когда известны данное состояние и вход. Неприводимые двухполюсные сети Двухполюсная сеть — это связный мультиграф, в котором отмечены две вершины и и и; эти точки называются первым полюсом и вторым полюсом. Произведением или последователь- последовательным соединением N = NiN2 двух двухполюсных сетей Ni и N2 на- называется сеть, полученная отождествлением точек и, и ы2. Сумма или параллельное соединение N=Ni + N2 получается отожде- отождествлением «1 с «2 и Vi с v2. Эти две операции на сетях проиллю- проиллюстрированы на рис. 13. Двухполюсная сеть называется последовательно-параллель- последовательно-параллельной, если она может быть составлена из конечного числа после- последовательных и параллельных соединений, начиная с сети, со- состоящей из двух смежных точек и и v. Хорошо известно [57], что двухполюсная сеть последозательно-параллельна тогда и только
Комбинаторные задачи перечисления графов 121 тогда, когда она однонаправлена, т. е. никакие две элементар- элементарные цепи от и к v не содержат никаких двух вершин W\ и w2, в противоположных порядках. Композиция N — Ni(N2), где Ni последовательно-параллельна, получается заменой каждого ребра /Vi (с использованием одно- однонаправленности) сетью N2. На рис. 13 также изображена /V,: , (Ы2): Рис. 13. Произведение, сумма и композиция двухполюсных сетей. композиция сетей, первая из которых последовательно-парал- последовательно-параллельна. Сеть N называется неприводимой, если ее нельзя записать в виде N = Ni(N2). Ветухновский [67] получил верхнюю и нижнюю границы для числа неприводимых двухполюсных последовательно-параллель- последовательно-параллельных сетей с данным числом вершин. Точно число не известно; его определение и составляет настоящую задачу. 10. Физические задачи Задача Лизинга размерности П В маркированном графе каждая вершина окрашена в Цвет, отличный от цветов, в которые окрашены все остальные вер- вершины. В двумерной решетке вершины суть упорядоченные пары (г, /), г'=1, 2, ..., т; /= 1, 2, . . ., п. Две вершины называются смежными, если евклидово расстояние между ними равно 1. Пример см. на рис. 14; заметим, что в физических приложе- приложениях решетка обычно предполагается нарисованной на торе, т. е.
122 Фрэнк Харари отождествляются обе пары противоположных сторон. Аналогич- Аналогично определяется п-мерная решетка. Рассмотрим маркированный граф, являющийся я-мерной ре- решеткой. Подграф этой решетки назовем допустимым, если ка- каждая его вершина имеет четную степень. Пусть Ач — число раз- различных маркированных допустимых подграфов с q ребрами. Рис. 14. Двумерная решетка n-Мерная задача Лизинга состоит в том, чтобы найти произ- производящую функцию для величины Aq. Эта задача была предло- предложена Лизингом [36]. Для п — 2 Онзагер [44] получил решение без использования комбинаторных методов. Его способ не был об- обобщен для большего числа измерений. Недавно Шерман [63] получил чисто комбинаторное решение для п = 2. Что касается я^З, то здесь не было реальных сдвигов. Задача Лизинга с магнитным полем Под площадью допустимого маркированного подграфа дву- двумерной решетки мы понимаем минимальную площадь, заклю- заключенную в непересекающиеся элементарные циклы, образующие Рис. 15. Двумерная решетка с диагоналями. этот подграф. Пусть АЧ:Г— число допустимых маркированных подграфов с q ребрами и площадью г. Задача состоит в нахо- нахождении производящих функций для величин АЧшГ. Как показано
Комбинаторные задачи перечисления графов 123 в физической литературе, это — двумерная задача Лизинга с магнитным полем. Вариантом задачи Лизинга является случай, известный в ли- литературе как взаимодействие между неближайшими соседями. ? СП cm I I I I П JJ. В в Рис. 16. Фигуры от г = 1 до г— 5. На рис. 15 показан граф, полученный из решетки рис. 14 соеди- соединением ближайших несмежных точек. Задача состоит в опреде- определении перечисляющего ряда для допустимых подграфов таких графов. Мозаика Возьмем двумерную решетку с TV квадратиками и рассмо- рассмотрим «1 квадратиков и п2 двойных квадратиков (как домино),
124 Фрэнк Харари так что ni + ti2 = N. Сколькими способами можно покрыть марки- маркированный граф такими фигурами? Задача о росте клеток Рассмотрим одноклеточное «существо» — фигуру, имеющую вид квадрата и растущую в плоскости за счет прибавления ква- квадратных клеток того же размера к какой-нибудь ее стороне. Сколько существует (с точностью до изоморфизма) связных фи- фигур Аг с г клетками? Связность фигур заключается в том, что в них нет дыр. На рис. 16 приведены все такие фигуры для г <15. Недавно Рид [54] расширил известные результаты; теперь они приняли такой вид: Таблица 2 Число Ап простых связных фигур площади п п Ап 1 1 2 1 3 2 4 5 5 12 6 35 7 107 8 363 9 1248 10 4271 11. Методы перечисления графов В предыдущей статье (см. стр. 61 —106 настоящего сборника) де Брёйн [4] обсуждает теорию перечисления Пойа и развивает свое обобщение [3] этой теории. Мы приведем теорему Пойа без доказательства, с тем чтобы наше изложение было независи- независимым, а затем упомянем о частном случае, полученном Дэвисом [8] и Слепяном [64]. Теорема Оттера [46] для деревьев была обобшена Норманом [43] для произвольных графов. Это предложение играет роль по- полезной комбинаторной леммы в решении некоторых задач пере- перечисления графов. Недавно Рид [51] усовершенствовал свою тео- теорему о суперпозициях для перечисления определенного класса графов общего вида. В целях исторической справедливости за- заметим, что перечисляющая теорема Пойа и несколько других относящихся к ней приемов подсчета были предвосхищены Ред- филдом в прекрасной статье [56], которая в основном осталась незамеченной. Сформулируем теорему Пойа в форме, удобной при построе- построении перечисляющих многочленов для всевозможных видов гра- графов. Нам нужна формулировка теоремы Пойа для одного пере- переменного. Однако в ряде задач, связанных с подсчетом, предпо- предпочтительнее формулировка теоремы для двух или более пере-
Комбинаторные задачи перечисления графов 125 менных, т. е. так, как в оригинальной статье Пойа [47]. Пусть D — область определения и R — множество значений совокуп- совокупности функций. Согласно терминологии Пойа, элементы множе- множества значений назовем фигурами, а само множество значений — совокупностью фигур. Элементы области определения назовем местами, где должны быть расположены фигуры. Конфигура- Конфигурация— это одна из функций, отображающих D в R. Пусть У— группа перестановок, действующая на D. Две конфигурации /i и /г называются Y-эквивалентными, ес- если существует перестановка а из У, такая, что для всех ?D Поэтому У называется-также группой конфигураций. Каждой фигуре поставим в соответствие неотрицательное це- целое число, называемое ее объемом. Обозначим через ah число различных фигур объема k. Тогда ряд, перечисляющий фигуры, определяется так: *=о A) Пусть У — группа перестановок степени s и порядка п. При этом конфигурацией будет последовательность из s фигур. Объ- емом конфигурации назовем сумму объемов ее фигур. Пусть Fh обозначает число У-неэквивалентных конфигураций объема k. Ряд, перечисляющий конфигурации, определяется так: /="(•*) = 2/="*•**¦ B) Теорема Пойа выражает F(x) через а(х) и У. Это делается при помощи циклового индекса группы У, который определяется следующим образом. Пусть h(j) — число элементов группы У типа (/) = (/ь /г, • ¦ •, /«), т. е. элементов, имеющих jh циклов длины k, k=l, 2, . . . , s, так что У1 + 2у2+ ...+sjs = s. C) Пусть г/i, (/г, ..., ys — неизвестные. Тогда Z(Y), цикловой индекс группы У, определяется так: где суммирование производится по всем разбиениям (/) числа s, удовлетворяющим C). Для любой функции f(x) пусть Z[Y,f(x)] обозначает функ- функцию, полученную из Z(Y) заменой неизвестного tjh на f(xh).
126 Фрэнк Харари Теорема Пой а. Перечисляющий ряд для конфигураций получается, если в цикловой индекс группы конфигураций под- подставить перечисляющий ряд для фигу р..Символически это запи- запишется так: = Z[V,a(x)}. E) Эта теорема сводит задачу нахождения перечисляющего ряда для конфигураций к задаче определения перечисляющего ряда фигур и циклового индекса группы конфигураций. Следующий частный случай теоремы Пойа был независимо обнаружен Дэвисом и Слепяном. В наиболее простой из своих фэрмулировок этот частный случай получается из теоремы Пойа E) подстановкой х = 1. Формально это дает F(l) =Z[Y, a(\)]. Из B) мы имеем F(\) =2Fk и из A) получаем аA)=2а&; но F(l) —это общее число неэквивалентных конфигураций без учета их объемов, и, аналогично оA) —общее число всех фигур также без учета объема. Следовательно, подстановка х—1 в E) приводит к сле- следующей формуле для полного числа конфигураций в терминах общего числа фигур и группы конфигураций. Используя обозна- обозначения работы [20], положим B = FA) и Ь = а(\), Тогда E) пре- превратится в %jK F) U) Таким образом, В получается сразу из циклового индекса группы конфигураций. Пойа [49] дал изящное и ясное изложение в рисунках, кото- которое помогает интуитивным соображениям при размышлении над задачами перечисления графов. Обобщение теоремы Пойа Де-Брёйном основано на том, что имеется группа подстановок, действующая на множестве R, аналогично тому, как на множестве D действует группа Y. Теорема Оттера о характеристике неподобия, приведенная здесь в виде формулы G), была использована им в качестве леммы для изящных перечислений [46] деревьев в терминах корневых деревьев, т. е. таких, у которых одна вершина отли- отличается от всех других. Обобщение (8) этой теоремы Норманом [43] может служить и более общей задаче нахождения числа гра- графов с данными блоками. Эти теоремы и другие формулы полу- получены в [30]. Под числом неподобных вершин графа мы понимаем число классов эквивалентности подобных вершин. Аналогичные опре- определения можно дать для ребер, блоков и т. д.
Комбинаторные задачи перечисления графов 127 Теорема о характеристике неподобия для деревьев Пусть р' и q'— числа неподобных вершин и ребер дерева, и пусть q"— число ребер, содержащих подобные вершины. То- Тогда имеем t/-(q'-q")=\. G) Теорема о характеристике неподобия для графов Пусть G — связный граф с k неподобными блоками. Пусть р' — полное число неподобных вершин в G и р — число непо- неподобных вершин в г'-м неподобном блоке G. Тогда При применении формул G) и (8) к задачам перечисления графов суммируют каждое из этих соотношений по множеству всех графов, которые следует пересчитать. Член 1, просуммиро- просуммированный по всем графам, очевидно, дает общее число графов, в то время как 2/>' дает число корневых графов. Комбинаторные методы служат для нахождения формул для сумм оставшихся членов в формулах G) и (8). с,. - G: ¦¦ Рис. 17. Три графа и мультиграф G, являющийся их суперпозицией. Рид [51] применял свою теорему о суперпозициях к интерес- интересному классу задач перечисления, которые, вероятно, не решаются предыдущими методами. Суперпозиция совокупности графов, построенных на одном и том же множестве вершин, есть объ- объединение множеств их ребер, включая их кратность. Например, на рис. 17 показан мультиграф G, являющийся суперпозицией графов Gi, Gi и Оз. Вот одна из интерпретаций суперпозиции: ребра графа G,- окрашены в цвет i, отличный от цвета / при 1Ф], причем эти цвета сохраняются в G. Если точки какого-нибудь графа Gt особым образом отмечены, то граф суперпозиции не обязан быть изоморфным данному графу. Таким образом, мо- можно задаться вопросом: даны п графов Gu G2, ... , Gn, сколько неизоморфных графов-суперпозиций можно из них образовать?
128 Фрэнк Харари Это число, как оказалось, зависит только от групп автоморфиз- автоморфизмов Уь У2>.. ., У„ графов, обозначим его через N(YU ..., У„). Пусть hi — порядок группы У*, и пусть Л*(/) —число пере- перестановок типа (/) в группе Yit как было определено в D). Ис- Используя эти определения, можно сформулировать следующую теорему. Теорема о суперпозициях. Число неиэоморфных су- суперпозиций, которые можно получить из графов Gj, Gz, ..., Gn, равно N(YV Y2, ..., Yn)= Q , (9) где Q = 2 Ai (У) h2 (у) ... hB (у)A '^ ... sJ'j\l у2! •.. у,!)"-1 (Я 12. Методы перечисления деревьев Приведем некоторые результаты, которые могут быть полу- получены с помощью перечисляющих рядов для деревьев. Пусть Тр — число корневых деревьев с р вершинами; тогда есть перечисляющий ряд для корневых деревьев. Аналогично определяются tp и t(x) для некорневых деревьев. Хорошо из- известное комбинаторное тождество [47] l^, A0) л-0 г-1 где по определению Z[So, f (x)]=l, полезно при получении неко- некоторых из следующих формул, а также при решении других за- задач перечисления. Пойа показал, что Т(х) удовлетворяет функциональному со- соотношению ^^f>. A1) Это равенство легко получается также из более раннего ре- результата Кэли [6] Т(х) = хй{\-хг)-Гг. A2) г-1
Комбинаторные задачи перечисления графов 129 Кэл» и Пойа получили выражения для tp, однако наиболее простая зависимость t(x) от Т(х) была впервые получена Отте- ром [46]: t{x) = T{x)-\[T*{x)-T{x>)\. A3) В работе [19] показано, что эти соотношения могут быть вы- выведены из формул Пойа непосредственными преобразованиями. Мы нашли в явном виде Т (х) = х + х2 + 2х3 + 4х4 -f 9х5 + 20л;6 + 48л;7 + и t(x) = Методы Пойа и Оттера могут быть распространены и на под- подсчет других видов деревьев. Пусть h{x), H(x) и Н{х)— пере: числяющие ряды для гомеоморфно несводимых деревьев, кор- корневых деревьев и деревьев с висячим корнем соответственно. Здесь дерево с висячим корнем — это корневое дерево, у кото- которого корень имеет степень 1. _ Харари и Принс [32] показали, что Н (х) удовлетворяет функ- функциональному уравнению г-1 Затем они же получили следующие выражения для Н(х) как функции от Н(х): i± Н(х) - -^ [Я2 (х) + Н(х>)]. A5) Н{х) Теорема Оттера G) тогда дает /1(х) = Н(х)-±[НЦх)-Н(х% A6) В явном виде имеем Допуская некоторую вольность обозначений, положим 9 Зак. 909
130 Фрэнк Харари где Ап обозначает знакопеременную группу порядка п. Риор- дан получил следующую формулу, связанную в A0): К v~ ч / ул > . A7) л = 0 т=\ Пусть и(х) и U(х) — перечисляющие ряды для деревьев и корневых деревьев, для которых группа автоморфизмов состоит только из тождественного преобразования. Воспользовавшись формулой A7), Харари и Принс [32] показали, что U(x) удовле- удовлетворяет функциональному уравнению оо U(x) — xexp 2j r——^- A8) и что и(х) может быть выражена через U(х) следующим об- образом: Окончательно имеем Риордан [58, 60] подсчитал некоторые другие виды деревьев, включая различные типы маркированных и окрашенных де- деревьев. Кроме гомеоморфно несводимых и тождественных де- деревьев, Харари и Принс [32] пересчитали следующие деревья: деревья с данным распределением, деревья с данным диаметром, направленные деревья, ориентированные деревья, деревья, снабженные знаками, деревья данной интенсивности, деревья данного типа. Направленное дерево получается, если каждому ребру де- дерева дается одно или более направлений. Ориентированный граф — это граф, каждое ребро которого имеет единственное на- направление. Граф снабжен знаками, если каждое его ребро счи- считается положительным или отрицательным. Граф интенсивности п — это мультиграф, в котором любая пара точек соединяется не более чем п ребрами. Граф типа п получается из графа мощ- мощности п окрашиванием его ребер, причем так, что любые два ребра, соединяющие одну и ту же пару вершин, имеют различ- различные цвета.
Комбинаторные задачи перечисления графов 131 Существует интересное обобщение деревьев — кактусы, кото- которые также пересчитаны. Кактус — это связный граф, в котором ни одно из ребер не принадлежит более чем одному элементар- элементарному циклу. Таким образом, каждый блок кактуса представляет из себя или элементарный цикл, или единственное ребро. Рань- Раньше такие графы называли деревьями Хусими. Кактусы, каждый блок которых является тругольником, были перечислены впер- впервые в работах [19] и [34]; общая задача была решена Норма- Норманом [43], решение ее дали также Форд, Норман и Уленбек [11, ч. II]. 13. Сравнение решенных и нерешенных проблем Мы приводим здесь список решенных проблем о перечисле- перечислении, кроме указанных ранее задач о деревьях (см. табл. 3). В остальной части настоящего пункта указаны методы, которые используются при решении этих проблем и сравниваются решен- решенные проблемы с нерешенными, указанными выше в табл. 1. Для получения числа графов с р вершинами следующим об- образом используется теорема Пойа. Пары различных вершин из р данных рассматриваются как фигуры; объем фигуры равен 1 или 0, в зависимости от того, соединены или нет эти две верши- вершины. Перечисляющий ряд фигуры есть 1+х. Группа конфигу- конфигураций, которая служит для подсчета графов, получается из симметрической группы степени р, для которой перемещаемые объекты — это пары различных вершин. Цикловой индекс этой группы находится, и теорема Пойа дает перечисляющий многочлен для числа графов с р вершинами и данным числом ребер. Подсчет корневых графов является легкой модификацией предыдущего; он получается, если фиксировать один из объек- объектов, перемещаемых симметрической группой, перед тем, как об- образовать группу его пар. Число диграфов также сразу полу- получается из числа графов при помощи построения группы упоря- упорядоченных пар аналогично группе пар. Связные графы могут быть перечислены в терминах полного числа графов комбинаторным методом, который аналогичен пе- перечислению корневых деревьев в терминах этих деревьев, как это сделано у Пойа. При этом используется тождество A0). Этот результат ока- оказывается особенно важным благодаря его широкой применимо- применимости. Он служит вообще для подсчета числа связных графов или других конфигураций, обладающих данным свойством, в случае, когда известно полное число связных и несвязных графов или конфигураций. Если угодно, эта формула может служить также 9*
132 Фрэнк Харари Решенные задачи перечисления Таблица 3 Категория Граф Диграф Распределение Группы Топология Электричество Маркировка Задача Графы Корневые графы Связные графы Графы данной мощности Графы данного типа Графы, снабженные знаками Подграфы данного графа Надграфы данного графа Графы с данными блоками Направленные графы Слабые диграфы Ориентировочные графы Турниры Транзитивные диграфы Функциональные диграфы Графы общего вида с данным рас- распределением Группы деревьев Биокрашенные и бихроматические графы Самодополнительные графы Корневые пленарные триангуляции Двухполюсные смешанные сети Типы булевых функций Натянутые деревья данного графа Маркированные графы Маркированные смешанные сети Маркированные графы с заданным распределением Маркированные несепарабельные графы Литература [18] [18] [18] [18] [18] [17] [21] [22] [43], [11, ч. II] [18] [18] [23] [9] [68] [26, 53] [51] [50] [25], [33] [55] [65], [66] [57], [59] [48], [64] [37] [14], [11-1] [5] [51] [11-111] для получения полного числа графов данного вида в терминах числа связных графов этого вида. Перечисление снабженных знаками графов не представляет трудностей и получается немедленно из формулы для числа гра- графов заменой перечисляющего ряда фигуры на \+х + у, где чле- члены 1, х, у означают соответственно отсутствие ребра, наличие по- положительного ребра и наличие отрицательного ребра между
Комбинаторные задачи перечисления графов 133 двумя вершинами. Используя группу ребер графа как группу конфигураций и 1+х как перечисляющий ряд фигуры, мы полу- получаем сразу же число неподобных подграфов данного графа. В работе [24] даются аналогичные формулы для числа непо- неподобных надграфов данного графа и вообще для числа типов графов в данной паре граф — подграф. Описанными методами подсчитываются также слабые дигра- диграфы, хотя оказалось, что для нерешенных задач 1 и 2 таблицы (о числе сильных и односторонних графов) эти методы непри- непригодны. Задачу 3, в которой требуется найти число диграфов с ис- источником, можно рассматривать как обобщение задачи 1, так как любая вершина сильного диграфа является источником. За- Задача 22 нахождения числа конечных автоматов была недавно A963 г.) решена М. Харрисоном, однако задача перечисления важного класса сильно связных автоматов осталась нерешенной. Определение числа ориентированных графов аналогично оп- определению числа диграфов, но включает модификацию группы конфигураций и перечисляющего ряда для того, чтобы учесть то условие, что каждая дуга ориентированного графа имеет только одно из двух возможных направлений. Снова фигура — это пара различных вершин, которые или не являются смежными, или со- соединены ребром с некоторым направлением. Таким образом, ряд, перечисляющий фигуры, есть \+2х, где объем фигуры — это число ребер, которые она содержит. Подсчитаны и некоторые другие частные случаи диграфов. Турниры — полные ориентированные графы — были подсчитаны Дэвисом [9]. Результат также сразу получается, как частный случай формулы, данной Харари [23] для числа ориентирован- ориентированных графов. Мун [40] заметил, что перечисляющий ряд для силь- сильных турниров может быть выражен через перечисляющий ряд для всех турниров, а Мозер [70] показал, что полное число тран- транзитивных ориентированных графов с р вершинами есть р У Функциональный диграф — это диграф, в котором каждая точка имеет внешнюю степень 1. Число функциональных дигра- диграфов было найдено [26] благодаря следующей характеризации конечного функционального диграфа: каждая слабая компонента его содержит ровно один направленный цикл вместе с корне- корневыми деревьями, находящимися в каждой вершине этого цикла. Отсюда следует, что группа конфигураций в этой задаче цикли- циклическая, а перечисляющий ряд — известная производящая функ- функция для корневых деревьев. Упрощение этой формулы было по- получено Ридом [53]. . .
134 Фрэнк Харари Мы уже отмечали, что число деревьев с заданным распреде- распределением известно. Рид [51] также определил число графов общего вида с заданным распределением, использовав свою теорему о суперпозиции. Но его метод, вероятно, неприменим, если не разрешены петли и параллельные ребра. Таким образом, для задачи 4 (табл. 1), которая сама не решена, имеются решения двух частных случаев. Результаты Рида также используются при перечислении гомеоморфно несводимых, однородных или эйле- эйлеровых графов (соответственно задачи 5, 6 и 7). Задача перечисления биокрашенных и бихроматических гра- графов недавно была сформулирована с помощью построения но- новой бинарной операции на группах подстановок, названной экспоненциацией. Элементарное изложение алгебраических соотношений ме- между этими и другими уже известными операциями на группах подстановок дано в статье [25]. Трудности, возникающие при перечислении пленарных гра- графов, интуитивно объясняются родством этих задач с проблемой четырех красок. Если будут найдены производящие функции для числа пленарных графов и пленарных 4-хроматических графов и будет установлено равенство, то тем самым будет доказано предположение о четырех красках. С другой стороны, если будет показано, что эти числа не совпадают, то предположение о четы- четырех красках будет опровергнуто. Тутт [65, 66] весьма энергично взялся за задачу перечисления пленарных графов. Триангуляция сферы называется простой, если каждый треугольник есть грань. Тутт отделяя внешний тре- треугольник от других граней, подсчитал простые триангуляции сферы, в которые он является корневым. Дополнение G графа C_состоит из множества вершин графа G, причем две вершины в G смежны тогда и только тогда, когда они не смежны в G. Самодополнительный граф изоморфен своему дополнению. Дополнение диграфа определяется аналогично, так же как и са- самодополнительный диграф. Рид [55] недавно подсчитал число самодополнительных графов и диграфов, решив одну из нере- нерешенных задач, поставленных ранее в [28]. Из равенства (9) Норман [43] вывел формулу для числа связных графов с данными блоками. Тем не менее никто еще не получил формулы для числа неразделимых графов с задан- заданным числом вершин и ребер (задача 15 табл. 1). Задача 14 — перечисление графов с заданным индексом и уровнем связности в принципе аналогична. Доказана некоторая совокупность теорем, касающихся ин- индекса графа и его уровня связности, но оказалось, что они
Комбинаторные задачи перечисления графов 135 мало помогают в поисках такой характеризации группы под- подстановок этих графов, которая была бы полезна при перечисле- перечислении этих графов. Принс [50] охарактеризовал группы подстановок деревьев. Кроме того, он нашел число деревьев, соответствующих каждой такой группе. Соответствующий критерий для групп графов не известен. Подобный критерий дал бы частичный ответ на зада- задачу 19, состоящую в отыскании числа графой с заданной группой подстановок. Вообще говоря, проще перечислять маркированные графы всевозможных видов, чем соответствующие немаркированные графы. Конечно, существует очень много трудных задач о мар- маркированных графах, например задача Лизинга. Некоторые за- задачи перечисления маркированных графов, однако, так просты, что могут быть немедленно решены. Например, перечисляющий ряд для маркированных графов с р вершинами равен так как каждое отдельное ребро графа КР или лежит в отдель- отдельном натянутом подграфе, или нет. Перечисление (Гильберт [14]) связных маркированных гра- графов на языке всех маркированных графов основывается, в част- частности, на комбинаторной лемме, которая использовалась в [18] при перечислении связных графов на языке всех графов. Как и в [18], пусть у(х, у)—число всех графов с данным свойством и н(х, у)—число связных графов среди них; тогда B0) Число маркированных деревьев с р вершинами равно рр~2, что было, видимо, впервые установлено Кэли [6], а потом неза- независимо доказывалось много раз. Недавно очень простые дока- доказательства были даны Хусими [35], Кларке [7] и Муном [41]. Хотя маркированные графы с заданным распределением под- подсчитаны Ридом [51], перечисление немаркированных графов с точки зрения этой интересной и важной характеристики оста- осталось незатронутым. Аналогично Рид [52] подсчитал маркирован- маркированные ^-окрашенные графы, но для случая немаркированных гра- графов (задача 8 табл. 1) задача не решена. В задачах перечисления часто представляют интерес асим- асимптотические формулы. Такие формулы для числа деревьев были получены Пойа [47] и Оттером [46], а для графов и маркиро-
136 Фрэнк Харари ватсных графов — Фордом и Уленбеком [11, ч, IV]. Несколько других ученых также получили асимптотические формулы для всевозможных видов графов, главным образом для того, чтобы применить результаты к задачам теоретической физики и химии. 14. Некоторые приложения задач перечисления к другим областям Задачи Лизинга Невелл и Монтролл [42] дали очень ясное изложение задач Лизинга, показав, что их можно рассматривать как задачи пе- перечисления графов, и поэтому мы будем придерживаться их формулировок этих задач — задач, интерес к которым оказался настолько вынужденным для многих физиков-теоретиков, что возникло саркастическое название «болезни Лизинга». Соответ- Соответствующая болезнь математиков, это, вероятно, «болезнь четы- четырех красок». Из'вестны критерии того, чтобы распределение было распре- распределением для графа. Этот вопрос был изучен Сениором [62] при попытке классифицировать химические соединения с точки зре- зрения их конфигураций, т. е. мультиграфов, в которых вершины — это атомы молекулы, а число ребер, соединяющих пары вер- вершин,— число электронов, «обобществленных» соответствующими двумя атомами. В насыщенных углеводородах СпН2„+2 каждая конфигурация есть дерево, в котором вершины имеют степень 1 или 4. Задача отыскания числа таких изомеров, т. е. различных соединений с одинаковыми атомными компонентами, была ре- решена Кэли [6] и более мощным способом — Пойа [47]. Каждый из них начал с обобщения задачи нахождения числа некорневых деревьев. В этом контексте число таких деревьев равно числу однозамещенных насыщенных углеводородов. Задача 27 табл. 1 —задача о росте клеток — была предложе- предложена автору Уленбеком, который хотел определить число различ- различных видов мозаичных блоков для применения к задаче 26, и био- биологом, который интересовался числом различных видов живот- животных с данным числом клеток. Совсем недавно для вычислитель- вычислительной машины была сделана программа перечисления общего чис- числа таких плоских фигур, как многосвязных, так и просто связ- связных. Полученный перечисляющий ряд до того члена, до кото- которого он известен, равен х + х2+2х3 + 5х4+12х5 + 35х6+108х7 + 369х8 + + 1285х9 + 4655х10+ 17073хи + 63600х12. Эту задачу также исследовал Голомб [16], который пользо- пользовался термином полимино, или обобщенное домино, для изло-
Комбинаторные задачи перечисления графов 137 жения того варианта задачи © мозаике, в котором все мозаич- мозаичные плиты имеют одинаковую площадь. Комбинаторные соображения играют важную роль в теории планирования эксперимента. Два латинских квадрата (см. стр. 204) S и S' порядка п называются ортогональными, если в квадрате, полученном наложением S и S', каждая из п2 упорядоченных пар (i, /'), г, /'=1, 2, ..., п, встречается ров- ровно один раз. Раньше один из двух ортогональных латинских квадратов записывали латинскими буквами, а другой — грече- греческими, а их наложение называлось греко-латинским квадратом. Нахождение формулы для числа различных латинских ква- квадратов произвольного порядка п (задача 20 табл. 1) по-види- по-видимому, чрезвычайно трудно. Соответствующие числа для п^С7 были получены трудоемкими методами. Дальнейшие задачи перечисления даются в недавней работе Бозе, Паркера и Шрикханде [2], в которой они опровергли стояв- стоявшую уже давно гипотезу Эйлера о том, что не существует пары ортогональных латинских квадратов порядка 4п + 2 для я>1 '). Авторы привели примеры пары ортогональных латинских квад- квадратов для каждого целого положительного п. Эта работа бу- будет детально рассмотрена в статье Холла, стр. 203—242 настоя- настоящего сборника. Хотя автор настоящей статьи пытался решить каждую из задач табл. 1, правда, пока безрезуль- безрезультатно, он чувствует, что некото- некоторые из этих задач в принципе не слишком трудны. Автор надеется, что хотя бы некоторые из них бу- будут решены в ближайшем буду- будущем. Вопросы для самопроверки 1. Граф G (см. рисунок) а) непланарный, так как он содер- содержит подграф, гомеоморфный Кг„ б) непланарный, так как он содержит подграф, гомеоморфный Кз, з, в) неплаиарнын, так как он содержит слишком много линий для своих пяти точек, г) пленарный. 2. Уровень связности графа G равен а) 1, б) 2, в) 3, г) 4. . 3. Число деревьев с семью точками равно а) 48,6) 12, в) 11, г) 16,807. ') Изменена неверная формулировка гипотезы Эйлера. — Прим. ред,
138 Фрэнк Харари 4. Следующее распределение есть распределение графа: а) A, 2, 3, 3, 4), б) @, 2. 2, 2, 4), в) A, 1, 2, 4, 4), г) B, 2, 3, 3, 4) 5. Цикловой индекс знакопеременной группы порядка 4 равен а) -^ D ]l 4i ) б) -!-( "' 12 l Г>-2Т< ЛИТЕРАТУРА 1. Б е р ж К., Теория графов и ее применения, ИЛ, М.. 1962. 2. В о s e R. С, Parker E. V., Sbrikhande S. S., Further results on the construction of mutually orthogonal latin squares and the falsity of Fu- ler's conjecture, Canadian J. Math., 12 A960), 189—203. 3. de Bruijn N. G., Generalization of Polya's fundamental theorem in enumerative combinatorial analysis, Nederl. Akad. Wetensch, Proc Ser. A62-fndag. Math., 21 A959), 59—69. 4. Д е Б р ё й н Н, Теория перечисления Пойа, настоящий сборник, стр. 59—104. 5. Carlitz L, Riordan J., The number of labeled two-terminal series- parallel networks, Duke Math J., 23 A956), 435—446. 6. Cay ley A., Collected mathematical papers, Cambridge University Press, Cambridge England, 1889—1897, 3, 242—246, 9, 202—204, 427—460; 11, 365—367; 13, 26—28. 7. Clarke L. E., On Cayley's formula for Counting trees, J. London Math. Soc, 33 A958), 471—474. 8. Davis R. L., The number of structures of finite relations, Proc. Amer. Math. Soc, 4 A953), 486—495. 9. D a v i s R L., Structures of dominance relations, Bull. Math. Biophysics, 16 A954), 131—140. 10. D i г а с G. A., Schuster S., A Theorem of Kuratowski, Nederl. Akad. Wetensch, Proc. Ser., hbl-lndag. Math., 16 A954), 343—348. 11. Ford G W., Uhlenbeck G. E., Combinatorial problems in the theory of graphs I, II, III, IV, Proc. Nat. Acad. Sci. U. S. A. (R Z. Norman is the third co-author of Paper II), 42 A956), 122—128, 203—208, 529—535; 43 A957), 163—167. 12. E r d б s P., G a 11 a i T , Grapher. mit Punkten vorgeschriebenen Grades, Mat. Lapok., 11 A960), 264—274. 13. Frucht R., Graphs of degree 3 with a given abstract group, Canadian J. Math., 1 A949), 365—378. 14. Gilbert E. N., Enumeration of labeled Graphs, Canadian J Math. 8 A956), 405—411. 15. Gilbert E. N.. Gray codes and paths on the n-cube, Bell System Tech. J., 37 A956), 815—826. 16. G о 1 о m b S. W., Checker boards and polyominoes, Amer. Math. Monthly, 61 A954), 675—682. 17. Harary F, On the notion of balance of a signed graph, — Michigan Math. J., 2 A953—54), 143—146. . . ¦
Комбинаторные задачи перечисления графов 139 18. На гагу F., The number of linear, directed, rooted, and connected graphs, Trans. Amer. Math. Soc, 78 A955), 445—463. 19. Harary F., Note on the Polya and Otter formulas for Enumerating trees, Michigan Math. J., 3 A955—56), 109—112. 20. Harary F., Note on an enumeration theorem of Davis and Slepian, Michigan Math. J., 3 A955—56), 149—153. 21. Harary F., On the number of dissimilar line-subgraphs of a Given Graph, Pacific J. Math., 6 A956), 57—64. 22. H а г а г у F., The number of dissimilar supergraphs of a linear Graph, Pacific J. Math., 7 A957), 903—911. 23. Harary F., The number of oriented graphs, Michigan Math. J. 4 A957), 221—224. 24. Harary F., On the number of dissimilar graphs between a given graph- subgraph pair, Canadian J. Math., 10 A958), 513—516. 25. H а г а г у F., On the number of bicolored graphs, Pacific J., Math., 8 A958), 743—755. 26. Harary F., The number of functional digraphs, Math. Annalen., 138 A959), 203—210. 27. H a r a r у F., The exponentiation of permutation groups, Amer. Math. Monthly, 66 A959), 572—575- 28. Harary F., Unsolved Problems in the enumeration of graphs, Magyar Tud. Akad. Mat. Kutato Int. Kozl-Publ. Math. Inst. Hangar. Acad. Sci, 5 A960), 63—95. 29. Harary F., Norman R. Z., The dissimilarity characteristic of Husimi trees, Ann. of Math., 58 A953), 134—141. 30. Harary F., Norman R. Z., Dissimilarity characteristic theorems for graphs, Proc. Amer., Math. Soc, 11, A960), 324—332. 31. Harary F., Norman R. Z., Cartwright D., Structural models an introduction to the theory of directed graphs, John Wiley and Sons, New York, 1965. 32. Harary F., Prins G., The number of homeomorphically irreducible trees, and other species, Ada Math., 101 A959), 141—162. 33. Harary F., Prins G., Enumeration of bicolourable graphs, Canadian J. Math., 15 A963), 237—248. 34. H a r a r у F., Uhlenbeck G. E., On the number of Husimi trees I, Proc. Nat. Acad. Sci. U. S. A. 39 A953), 315—322. 35. Husimi K., Note on Mayer's theory of cluster integrals, J. Chem. Phys., 18 A950), 682—684. 36. I s i n g E., Beitrag zur Theorie des Ferromagnetismus, Z. Physik, 31 A925), 253—258. 37. К i г с h h о f f G., IJber die Auflosung der Gleichungen, auf welche man bei der Untersuchung der linearen verteilung galvanischen Strome gefuhrt wird, Ann. Phys. Chem., 72 A847), 497—508. 38. Konig D., Theorie der endlichen und unendlichen Graphen. Kombinato- rische Topologie der Streckenkomplexe. Mathematik in Monographien 16. Akademische Verlagsgesellschaft, Leipzig, 1936, reprinted by Chelsea Pub- Publishing Company, New York, 1950 39. К г a u s z J., Demonstration nouvelle d'une theoreme de Whitney sur les resaux, (Hungarian), Mat. Fiz. Lapok, 50 A943), 75—85. 40. Moon J. W., On some combinatorial and probabilistic aspects of bipar- bipartite graphs. Doctoral Dissertation, University of Alberta, 1962. 41. Moon J. W., Another proof of Cayley's formula for counting frees, Amer. Math. Monthly, 70 A963), 846—847. 42. Newell G. F., Montr oil E. W., On the theory of the Ising model of ferromagnetism, Rev. Modern, Phys., 25 A953), 353—389.
140 Фрэнк Харари 43. Norman R. Z., On the number of linear graphs with given blocks Docto- Doctoral Dissertation, University of Michigan, 1954. 44 Onsager L., Crystal Statistics 1 A two-dimensional Model with an Or- Order—disorder transition, Phys. Rev., 65 A944), 117—149. 45. Ope О., Теория графов, «Мир», М., 1965. 46. Otter R., The number of trees, Ann. of Math., 49 A948), 583—599. 47. Poly a G., Kombinatcrische anzahlbestimmungen fur Gruppen Graphen und chemische verbingungen, Ada Math., 68 A937), 145—254. 48. P 61 у a G., Sur les types des propositions composees, J. Symbolic Logic, 5 A940), 98—103. 49. Pol у a G., On picture-writing, Amer. Math. Monthly, 63 A956), 689—697. 50. P r i n s G., The Automorphism Group of a Tree, Doctoral Dissertation, University of Michigan, 1957. 51. Read R. C, The enumeration of lically Restricted graphs 1, II, J. Lon- London Math. Soc, 34 A959), 417—436; 35 A960), 344—351. 52. Read R. C, The number of й-colored graphs on labeled Nodes, Canadian J. Math., 12 A960), 409—413. 53. R e a d R. C, A note on the number of functional digraphs, Math. Ann., 143 A961), 109—110. 54. Read R. C, Contributions to the cell-growth problem, Canadian J. Math., 14 A962), 1—20. 55. Read R. C, On the number of self-complementary graphs and digraphs, У. London Math. Soc, 38 A963), 99—104. 56. R e d f i e 1 d J. H., The theory of group-reduced distributions, Amer. J. Math., 49 A927), 433—455. 57. R i о r d a n J., Shannon С. Е., The number of two-terminal series-paral- series-parallel networks, J. Math. Phys., 21 A942), 83—93. 58. Riordan J., The numbers of labeled colored and chromatic trees, Ada Math., 97 A957), 211—225. 59. Риордак Дж , Введение в комбинаторный анализ, ИЛ, 1963. 60. Riordan J., The enumeration, of trees by height and diameter, IBM J. Res. Dev., 4 A960), 473—478. 61. Sabidussi G., Graph derivatives, Math. Z., 76 A961), 385—401. 62. Senior J. K-, Partitions and their representative graphs, Amer. J. Math., 73 A951), 663—689. 63. Sherman S., Combinatorial aspects of the Isting model for ferromagne- tism, I, A Conjecture cf Feynman on paths and graphs, J. Math. Phys., 1 A960), 202—217. 64. S 1 e p i a n D., On the number ot symmetry types of Boolean functions of n variables, Canadian J. Math., 5 A953), 185—193. 65. Tut tie W. Т., A census of planar triangulatiorts, Canadian J. Math., 14 A962), 21—38. 66. T u 111 e W. Т., A new branch of enumerative graph theory, Bull. Amer. Math. Soc, 68 A962), 500—504. 67. В е т у x н о в с к и й Ф Ю., О числе неразложимых сетей и о некоторых их свойствах, Докл. Акад. Наук СССР, 123 A958). 391—394 68. Whitney H., Congruent grapjis and the connectivity of graphs, Amer. J. Math., 54 A932), 150—168. 69. Whitney H., Non-separable and planar graphs Trans. Amer. Math. Soc, 34 A932), 339—362. 70. Wine R. L., Freund J. E., On tht enumeration of decision patterns in- involving n means, Ann. Math. Stat., 28 A957), 256—259.
ТЕОРИЯ ГРАФОВ И АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ Роберт Калаба 1. Введение Основная проблема теории автоматического управления со- состоит в преобразовании некоторой системы из начального со- состояния в требуемое конечное наиболее эффективным способом. Например, если порыв ветра поворачивает самолет вокруг про- продольной оси, то автопилот должен послать управляющий сиг- сигнал к плоскостям управления с тем, чтобы самолет возможно быстрее вернулся в исходное горизонтальное положение и при этом скорость вращения его относительно продольной оси рав- равнялась бы нулю. Далее рассмотрим космический корабль перед входом в плотные слои атмосферы. Наша цель состоит в том, чтобы осуществить посадку корабля на землю по такой траек- траектории, на которой максимальная температура соприкасаю- соприкасающихся с воздухом частей поверхности космического корабля была бы минимальной. Однако можно было бы выбирать траекторию посадки, на которой минимизировалось бы макси- максимальное ускорение. С математической точки зрения представляется естествен- естественным рассматривать подобные задачи как относящиеся к вариа- вариационному исчислению. В соответствии с этим введем вектор состояния х(/) с начальным значением х@)=с, вектор управ- управления y(t) и уравнение движения x=f(x, у). A) Мы хотим определить такой вектор управления у(/), чтобы си- система перешла из начального состояния с в некоторое желае- желаемое конечное состояние, например х = 0, максимально быстро. В настоящее время имеется обширный список литературы, от- относящейся к подобным задачам [4, 17] и особенно к тому слу- случаю, когда f есть линейная функция переменных х и у, и на компоненты вектора управления у наложены определенные огра- ограничения. Напротив, наше желание могло бы состоять в отыска- отыскании такого вектора управления y(t), который минимизирует максимальное значение некоторой функции g[x(t), y(t)] в про- процессе перехода системы из начального состояния в конечное.
142 Роберт Калаба Проблемы такого рода также охвачены литературой (правда, менее обширной), см [1, 2]. Вспомним о том, что решение важных задач, относящихся к рассматриваемой области, в конечном итоге предполагает применение электронных цифровых вычислительных машин, в которых все переменные имеют дискретный характер, а также то, что некоторые системы управления работают с дискретными переменными в силу их конструктивных особенностей. Поэтому возникает интерес к формулировке и решению задач автомати- автоматического управления в дискретных переменных в отличие от того случая, когда переменные являются непрерывными. Задача настоящей статьи состоит в том, чтобы осветить современный уровень знаний в этом вопросе 2. Оптимальное по времени управление и природа обратной связи Рассмотрим систему S, которая может находиться в любом из конечного числа N состояний. Поставим в соответствие этим состояниям вершины некоторого графа [9, 15] и перенумеруем их числами натурального ряда от 1 до N. С течением времени система меняет свое состояние; это означает, что система пре- претерпевает последовательность преобразований, которую мы на- назовем процессом. В тех случаях, когда система находится в со- состоянии /, будем предполагать, что может быть выработано управляющее решение, в результате которого система перехо- переходит в некоторое новое состояние. В общем случае, если си- система находится в состоянии i, то в результате выработки управляющего решения и его реализации она может перейти только в некоторое новое состояние (см. [25]). В процессе перехода из состояния i в состояние / должно быть израсходовано определенное количество какого-либо ре- ресурса, например энергии. В соответствии с этим принципом дуге ') графа, идущей из вершины i в вершину /, должно быть поставлено в соответствие число /,-;. Рассмотрим случай, когда мы хотим так управлять системой 5, что если эта система вы- выведена из равновесия (или из наиболее желаемого состояния), например из состояния N, то нам необходимо вернуть систему в состояние равновесия за наименьшее возможное время. На первый взгляд может показаться, что задача состоит в отыскании кратчайшей траектории в фазовом пространстве, ведущей из начального состояния i в конечное состояние N. ') Граф предполагается ориентированным. — Прим. ред.
Теория графов и автоматическое управление 143 В действительности дело обстоит иначе. Довольно часто мы не будем располагать предварительными сведениями о том, каково будет начальное состояние i, причем мы должны будем уметь переводить систему из любого начального состояния в желаемое конечное состояние и осуществлять этот переход за минимальное время. Теперь мы можем продвинуться еще на шаг вперед и отметить, что если система находится в со- состоянии i, то нет необходимости определить всю траекторию от i до N. Действительно, достаточно лишь установить, что если система находится в состоянии i, то следующим состоянием, в которое переходит система, обязано быть состояние /. Это рассмотрение позволит различать управление по ра- разомкнутому циклу и управление с обратной связью. В процес- процессах с разомкнутым циклом вся последовательность преобразо- преобразований задается заранее. Этот тип управления пригоден в тех случаях, когда имеется высокая степень уверенности в том, что система будет функционировать заданным образом и что слу- случайными внешними воздействиями можно пренебречь. В реаль- реальных случаях это означает, что все управляющие воздействия будут осуществляться предписанным образом в зависимости от некоторой заданной функции времени, т. е. в соответствии с показаниями часов, причем не обращается никакого внима- внимания на фактическое состояние системы. Простым примером мо- может служить регулирование комнатной температуры посред- посредством включения и выключения электрического камина в фик- фиксированные моменты времени. Управление по разомкнутому циклу, как правило, экономично, но оно может не обеспечить удовлетворительное качество вследствие того, что в этом слу- случае пренебрегают внешними факторами. Более сложный тип управления достигается введением сле- следующего цикла операций: 1) определить состояние системы, 2) выработать решение об управляющем воздействии (вклю- (включить нагрев или выключить), 3) возвратиться к операции 1. Система управления, работающая по этому принципу, назы- называется системой управления с обратной связью. Существует разработанная теория подобных процессов, восходящая к Макс- Максвеллу [6, 19, 20]. Во всей этой теории (особенно в той части, где изучается поведение системы, управляемой определенным способом) главную роль играет понятие устойчивости [18]. Однако совершенно очевидно, что если мы намерены осу- осуществлять оптимальное управление, то основное внимание сле- следует уделить понятиям оптимальности и устойчивости, хотя, естественно, между этими двумя понятиями имеется тесная связь,
144 Роберт Калаба 3. Формулировка задачи Введем следующие обозначения [3]: ttj— время, необходимое для преобразования системы из со- состояния i в состояние / по соответствующей дуге графа. ut—время преобразования системы из состояния i в состоя- состояние jV (желаемое состояние) оптимальным способом, /=1, 2, ... , N. Для установления соотношений между этими величинами заметим, что если система находится в состоянии / и вырабо- выработано решение о преобразовании этой системы в состояние /('^/Ь то процесс будет протекать оптимально от состояния / до состояния N (в том случае, когда весь процесс оптимален). Кроме того, выбор следующего за состоянием / состояния / производится на основе минимизации суммы ttJ-\-Uj, поскольку ti) представляет собой время перехода из состоя- состояния / непосредственно в состояние /, а щ — минимальное время, необходимое для перехода из состояния / в конечное состоя- состояние N. Проведенное рассмотрение, иллюстрирующее принципы оптимальности Беллмана (см. [25] или [4]), приводит к следую- следующей системе нелинейных уравнений: у , /=1, 2, ..., N— 1, B) uN = 0. 4. Единственность Поскольку систему уравнений B) предполагается решать различными методами последовательных приближений, важно установить единственность решения этой системы [3]. Предположим, что {«,-} и {?/,•} суть два решения системы B) и что k — некоторый индекс, для которого разность достигает максимального значения. Положим лу + и,} = *й|. + и, C) kj + U])=tks+Us. D) Так как по предположению tij > 0,
Теория графов и автоматическое управление 145 то очевидно, что г Ф k; s=f=k- Получаем соотношения и* = '*г + Иг<***+и*. E) F) которые в дальнейшем приводят к установлению единствен- единственности, а именно: Uk-Uk<us-Us. G) Вследствие того, что k — индекс, по которому максимизи- максимизируется разность Uj—Uj, в выражении G) должен иметь место знак равенства: uk — Uk = us-Us, (8) который означает, что в E) также имеет место точное равен- равенство То же самое рассуждение можно теперь повторить для состоя- состояния s и установить, что существует другое состояние пг, для которого um-Um = us-Us = uk~Uk. A0) Кроме того, тфз и тфИ, так как и* = <*, +/,„ + «„. . (И) Продолжая этот процесс, мы должны в итоге достигнуть состояния N, для которого' uN-UN = 0, A2) чем и завершается доказательство. 5. Последовательные приближения Можно применить метод последовательных приближений Пикара и построить эффективную схему вычисления этого ре- решения. В качестве исходного приближения uf> выберем реше- решение, преобразующее систему непосредственно из состояния i в состояние N: uf = tiN, *=1, 2, .... N. A3) 10 Зак. 909
146 Роберт Калаба Естественно, в случае когда подобный прямой переход.из i в Л' не существует, предполагаем, что истекшее время М доста- достаточно велико. Приближения более высокого порядка получа- получаются обычным способом: / = 1, 2, ..., /V — 1, A4) при & = 0, 1, 2, .... Физический смысл этой задачи позволяет обнаружить некоторые свойства каждого из последовательных приближений. Например, так как ( = min t)N), i = 1, 2, ..., TV — 1, u$ = 0, [ ясно, что «0>—минимальное время, необходимое для преобразования системы из состояния / в состояние N не более, чем через одно промежуточное состояние, 1=1, 2,..., N. u(k)—минимальное время, необходимое для преобразования системы из состояния i в состояние jV не более, чем че- через k промежуточных состояний. Отсюда следует, что приближения монотонно убывают: «(*+')<ир>, i=\, 2, ..., N. A5) Этот факт легко установить с помощью индукции. Так как а'** ограничены снизу м(*)>0, /=1, 2, ..., N, A6) то сходимость аппроксимирующей последовательности установ- установлена. Однако на самом деле оптимальная траектория из любого состояния i в состояние N имеет не более jV — 2 промежуточ- промежуточных состояний, так как траектория сама себя не пересекает и не образует контуров. Таким образом, предполагается, что процесс сходится не более чем за N — 2 шага. Очевидно, что предель- предельное значение удовлетворяет уравнению B). 6. Замечания к схеме приближений Вычисление последовательных приближений с помощью уравнений B) требует только две операции: сложение и срав- сравнение чисел, для выполнения которых удобно использовать электронную вычислительную машину. Кроме того, при вычис- вычислении значения м(.*+1> в оперативную память машины требуется
Теория графов и автоматическое управление 147 ввести только i-ю строку матрицы (<?,;) и вектор (uf\ uf\ ¦ ¦¦ #$')¦ Таким способом даже при N порядка нескольких тысяч задача может быть решена на электронной цифровой вычислитель- вычислительной машине ИБМ-7090 за несколько минут. В эффективных программах обычно используются специфические особенности конкретной задачи. Эти особенности имеют место в тех слу- случаях, когда каждое состояние непосредственно связано с не- небольшим числом соседних состояний. В некоторых случаях зна- значения отдельных последовательных приближений более важны, чем решение исходной задачи. Если оптимальная траектория из состояния i в состояние N имеет много промежуточных со- состояний, то может потребоваться сложная вычислительная схема для построения этой траектории, так что как знание по- последовательных приближений решения, так и знание предель- предельного значения могут оказаться важными при синтезе системы управления. Наконец, заметим, что предложенное решение сводится не столько к определению значений щ, и2,..., uN, сколько к полу- получению информации о том, что некоторое значение Uj минимизи- минимизирует выражение (ц + и, при каждом /. Именно это и требуется знать для отыскания оптимального управления с обратной связью. 7. Иные подходы Другие подходы к решению рассматриваемой задачи были развиты рядом авторов, например Данцигом [10] и Фордом и Фалкерсоном [11]; см. также [27]. В частности, оказывается возможным, отправляясь от ис- исходного состояния, определять шаг за шагом первое, второе и т. д. ближайшие состояния вплоть до конечного. Можно также применить и ряд других методов. Некоторые из них описаны в [13]. Там же даны ссылки на обширную лите- литературу. 8. Произвольные конечные состояния Если задача состоит в определении оптимальной траектории из любого начального в любое конечное состояние, то описан- описанную выше процедуру можно применить N раз, полагая каждое из состояний в качестве желаемого конечного состояния. С дру- другой стороны, можно положить. uf)—время преобразования системы из состояния i в со- состояние / вдоль траектории с не более чем k проме- промежуточными состояниями. 10*
148 Роберт Калаба Применяя принцип оптимальности, можно видеть, что 'A7) Так как самое большое значение, которое может принять k, равно N— 1 и вследствие того, что матрицы Г«<0I [«AI 1и<3>1 ГиEI Ги<7>1 ГиA5I га\- rul 1ии\- ги\' iuij\' ги\' •¦• легко определяются, задача легко решается, по крайней мере численно. 9. Предпочтительные субоптимальные траектории Одна из основных трудностей применения изложенных выше идей к конкретным ситуациям лежит в выборе числа и природы физических состояний рассматриваемой системы [16]. В част- частности, если число выбранных состояний слишком мало, а имен- именно если сетка в фазовом пространстве слишком грубая, то время перехода вдоль траектории, ближайшей к оптимальной, может быть существенно больше времени перехода по оптималь- оптимальному пути. С другой стороны, если разность этих времен неве- невелика, то уверенность в приемлемости математической модели физического процесса возрастает. Помимо сказанного, следует отметить, что даже в случае, когда получено точное решение математической задачи, мы на- находим лишь приближенное решение соответствующей физиче- физической задачи вследствие того, что при математической формули- формулировке были опущены многие физические факторы. Если анали- аналитически найденная траектория неприемлема с физической точки зрения, то можно либо для той же задачи вычислить тра- траекторию, близкую к оптимальной, в надежде, что она окажется лучше с физической точки зрения, либо заново сформулировать математическую задачу. Покажем теперь, как определяются вторые наилучшие (наилучшие после оптимальных) траектории при условии, что оптимальные траектории, ведущие в конечное состояние N, определены. Предположим, что существует по меньшей мере одна траек- траектория из состояния i в состояние N, отличная от оптимальной (/= 1, 2,.. ., N— 1), и введем переменные vt (i= I, 2,. .., jV— 1): vt — время, затрачиваемое на преобразование системы из состояния / в состояние N по второй наилучшей траек- траектории, /=1, 2,..., N—1, vN = 0. ;i. Естественно, предполагается, что траектория не.-обладает контурами. Отметим далее, что если мы приняли решение пере-
Теория графов и автоматическое управление 149 вести систему из состояния i непосредственно в состояние /, то продолжение должно проходить по траектории из состояния / в состояние Л/, т. е. оно является либо оптимальным, либо вто- вторым наилучшим. Из этого следует: Vt = min2 (/,;. + Uj, tu + vj), (i = 1, 2, ..., N - 1), A8) vN = 0, где используется обозначение min2(a1, a2, ..., aR)— второе наилучшее из ab a2 ... aR (в предположении, что не все они равны между собой). Обобщения этого случая приведены в [5] и подробно рас- рассмотрены в [22]. Поллак [23] обнаружил, что вторые наилучшие траектории можно вычислить, определив оптимальную траекторию (по предположению единственную) из состояния / в состояние jV, исключив затем из сети первую дугу оптимального пути и найдя оптимальную траекторию из состояния i в состояние N, используя только оставшиеся дуги сети. Подобная операция выполняется с каждой из оставшихся дуг рассматриваемой оп- оптимальной траектории. Так как в оптимальной траектории имеется самое большее N— 1 таких дуг, необходимо решить не более jV— 1 подобных задач. Траектория, которой соответствует наименьшее из чисел, найденных таким способом, и будет второй кратчайшей траек- траекторией. Доказательство получится, если заметить, что вторая кратчайшая траектория должна отличаться от оптимальной хотя бы одной дугой. Этот метод позволит без труда рассмот- рассмотреть случай траектории с контурами. 10. Оптимальные по времени вероятностные процессы управления Предположим, что физическая ситуация такова, что время ttj, необходимое для преобразования системы из состояния / в состояние /, неизвестно точно [13]. Предположим, однако, что это время можно рассматривать как случайную величину с за- заданной плотностью распределения. Это предположение является сильным. Оно может осуществляться, а может и отсутствовать в конкретной ситуации. Кроме того, будем предполагать, что время перехода по какой-либо дуге траектории не зависит от времени перехода по любой другой дуге (этой же траектории), что является вторым очень сильным ограничением.
150 Роберт Калаба В этих предположениях наша цель состоит в отыскании оптимального решения для управления с обратной связью в случае, когда система находится в состоянии /. Поясним де- детально, что мы имеем в виду. Будем предполагать, что наша цель состоит в максимизации вероятности преобразования си- системы в требуемое состояние jV за время, не превосходящее /, где Последовательность операций, которые необходимо при этом выполнить, следующая: во-первых, посредством измеритель- измерительной аппаратуры регистрируется как момент времени, так и со- состояние системы в этот момент; во-вторых, принимается реше- решение о следующем состоянии, в которое должна перейти данная система. Затем проходит некоторое время, величина которого случайна, пока, наконец, система достигает этого нового состоя- состояния. Производится следующее измерение нового значения вре- времени и нового состояния. На основании сведений о новом вре- времени и новом состоянии вырабатывается решение о том, каким должно быть следующее состояние, и т. д. Заметим, в частности, что мы не пытаемся с самого начала упорядочить всю последо- последовательность решений, приводящих от состояния i к состоянию jV (как это имело бы место в случае управления по разомкнутому циклу), скорее мы производим наблюдение, вырабатываем ре- решение и действуем, и так раз за разом. Мы стремимся по- построить оптимальное решение в заданных условиях, т. е. для заданного состояния и заданного времени, оставшегося для процесса. Хотя в случае детерминированных процессов управ- управление по разомкнутому и замкнутому (с обратной связью) цик- циклу приводит к одним и тем же результатам, решения в случае вероятностных процессов существенно отличны как по идее, так и фактически. Определим теперь функции щ(г), i=\, 2,..., N, посредством соотношений и{(() — вероятность преобразования системы из начального состояния i в желаемое конечное состояние N за вре- время, ие превосходящее t, в условиях оптимального управления с обратной связью. Применив еще раз принцип оптимальности, можно получить следующие уравнения: ut(t) = max [ Pu(t-s) и ,(s)ds, i=l, 2, .. ., N—l, A9) uN(t)=\.
Теория графов и автоматическое управление 151 Уравнения A9) довольно сложны для решения как аналити- аналитическим, так и численным методами. Появление в уравнениях интеграла свертки предполагает применение преобразования Лапласа [7]. Преобразование, рассмотренное Беллманом, Кэра- шем [8] и рядом других авторов, также может оказаться по- полезным. Кроме того, тесно связанные с этим вероятностные процессы управления рассмотрены в [13] и [14], а также в [26]. 11. Минимаксные процессы управления При некоторых обстоятельствах, подобных рассмотренным в п. 1, желательно преобразовывать систему из начального со- состояния в конечное так, чтобы минимизировать максимальное напряжение, действующее на систему на протяжении про- процесса. Процессы управления подобного рода мы будем назы- называть минимаксными процессами управления. Мы вновь будем рассматривать систему, которая может находиться в любом из конечного числа jV состояний, которые пронумерованы натураль- натуральными числами от 1 до N. Предполагаем, что состояние jV является желаемым конечным состоянием. Если система пере- переходит из состояния / непосредственно в состояние /', имеет место максимальное напряжение stj. Тем самым напряжению s^ ста- ставится в соответствие дуга (i, /) графа. Наша основная задача состоит в определении такой траектории из состояния i в со- состояние N, что максимум напряжения вдоль этой траектории настолько мал, насколько это возможно. 12. Функциональные уравнения Введем переменные щ, i—\, 2, ..., jV— 1, посредством сле- следующих соотношений: Ui — максимальное напряжение вдоль оптимальной траек- траектории из состояния i в конечное состояние N, 1=1, 2 , N — 1. Применение принципа оптимальности немедленно приводи! к соотношениям и, — min [max (s(;-, Uj)], i=\, 2, ..., N—1, B0) ¦)Ф1 Эти уравнения, естественно, аналогичны уравнениям B). Ре- Результаты следующих пунктов будут получены непосредственно
152 Роберт Калаба из этих уравнений. Тем не менее на первом этапе у нас будут использоваться лишь представления, связанные с понятием сети (а не применение этого метода). 13. Частный случай Чрезвычайно важный и интересный частный случай возни- возникает тогда, когда мы вводим дополнительное условие т. е. дугам (i, j) и (/, i) соответствует одно и то же напряжение. Мы можем довольно детально проанализировать этот случай и установить связь с не имеющей (на первый взгляд) отношение к этому случаю задачей из теории графов. Прежде всего заметим, что максимальное напряжение, кото- которое достигается вдоль любой из траекторий, является числом, принадлежащим множеству {5,j}. Расположим эти положитель- положительные величины {Sij} в порядке возрастания и запишем получен- полученную последовательность как Si, 52, . . ., sR, где R4^.(N/2) (N +1). Обозначим соответствующие дуги через 5Ь 52,. . . , SR. Для удоб- удобства предположим, что все напряжения, соответствующие дугам графа, различны между собой. Это условие можно выполнить, задавая в случае необходимости достаточно малые отклонения данным напряжениям. Отметим далее, что состояния, связан- связанные дугой с напряжением sh не могут быть связаны никакой другой траекторией с меньшим напряжением. Таким образом, дуга 5j образует оптимальную траекторию для этих состояний. Заметим также, что состояния, связываемые дугой с напряже- напряжением s2, также связываются оптимальным образом дугой 52. Положение несколько усложняется в случае, когда рассма- рассматриваются состояния, связываемые дугой 5з. Если дуги Si, 5г и S3 не образуют контура, то состояния, связываемые дугой 53, связываются этой дугой оптимально. Если, однако, дуги Su S2 и S3 образуют контур, то оптимальная связь состояний осуще- осуществляется дугами Si и S2, а не дугой 53. Кроме того, мы видим, что если продолжить процесс выбора дуг из последовательности^!, 5г, ... , SR, проверяя, чтобы ни одна из выбранных дуг не образовывала контура ни с какими из уже выбранных дуг, то в результате мы выберем N— 1 дуг при пол- полном отсутствии контуров. Итак, нами построено некоторое свя- связывающее дерево сети. Единственная траектория в этом дереве, которая связывает любые два состояния, является минимаксной траекторией между этими состояниями,
Теория графов и автоматическое управление 153 14. Минимальные связывающие деревья Построение, проведенное в п. 13, позволяет, как известно, по- получить решение другой задачи, на первый взгляд не связанной с предыдущей — при условиях, сформулированных в п. 13, опре- определить дерево, сумма напряжений в ветвях (дугах) которого ми- минимальна. Это дерево называется минимальным связывающим деревом. В 1956 г. Крускал [16] показал, что приведенное по- построение обеспечивает решение этой задачи. Другие, отличные от сформулированных, алгоритмы имеются в [16] и [13]. Описанный выше алгоритм неудовлетворителен с вычисли- вычислительной точки зрения, так как проверка, образуются ли контуры при последовательном рассмотрении дуг, может потребовать значительного времени. Примом [24] было предложено несколько очень эффектив- эффективных вычислительных процедур. 15. Замечания и связь с другими задачами Результат по минимаксным процессам управления, получен- полученный нами при ограничениях, изложенных в п. 13, можно сфор- сформулировать следующим образом. Оптимальные минимаксные траектории принадлежат минимальному связывающему дереву. Рассмотрим полученный результат с несколько иной точки зрения. Прежде всего приведем другое доказательство. Рассмотрим некоторую оптимальную минимаксную траекторию из состояния I в состояние N. Предположим, что не существует траектории из состояния i в состояние N, которая лежит на минимальном связывающем дереве. В таком случае существует по меньшей мере одна дуга этой траектории, которая не принадлежит мини- минимальному связывающему дереву. Обозначим эту дугу через А. Если включить эту дугу в множество всех дуг, образующих ми- минимальное связывающее дерево, то образуется в точности один контур, например контур, образованный из дуг (A, Ai, . . . , Aj). Заметим, что должно выполняться следующее неравенство: напряжение (Л)>тах [напряжение (Л^, напряжение (Л2), ... ..., напряжение (Лу)]. B1) Если бы неравенство B1) не выполнялось, то оказалось бы воз- возможным уменьшить сумму напряжений в ветвях минимального связывающего дерева, включив дугу А в минимальное связы- связывающее дерево и исключив дугу Ль для которой напряжение (Л) < напряжения (Л;).
154 Роберт Калаба Неравенство B1) свидетельствует о том, что дугу А минимакс- минимаксной (по предположению) траектории можно заменить дугами из минимального связывающего дерева без увеличения имеющего- имеющегося в ней максимального напряжения. Так как в качестве дуги А можно было бы выбрать любую дугу минимаксной траектории, то это завершает доказательство. Прим указал в [24], что минимальное связывающее дерево не только минимизирует сумму напряжений в его ветвях, но также минимизирует для всех деревьев любую монотонно возрастаю- возрастающую симметрическую функцию напряжений ветвей. Заметим, в частности, что минимальное связывающее дерево минимизи- минимизирует функцию >=1. 2, Как легко доказать, limSp= max E,, s2, ..., sN_x). B2) Это означает, что мы рассмотрели задачу об определении траектории из состояния i в состояние /V, на которой достигается минимум суммы р-х степеней напряжений дуг, образующих эту траекторию. Очевидно, что случай р=1 эквивалентен рассмо- рассмотренной ранее задаче построения оптимальной по времени тра- траектории. С другой стороны, при достаточно больших р в силу B2) возникает проблема, эквивалентная задаче определения ми- минимаксной траектории. Если говорить более строго, то можно показать, что при достаточно больших значениях р траектория, на которой достигается минимум суммы р-х степеней напряже- напряжений ее дуг, лежит на минимальном связывающем дереве. Чтобы это показать, рассмотрим дугу S, принадлежащую оптимальной траектории, но не лежащую на минимальном связывающем де- дереве. Пусть напряжение, соответствующее этой дуге, равно s, и пусть напряжение дуг, составляющих минимальное связы- связывающее дерево, с которыми дуга 5 образует контур, равны Si, s2, • • • ,sr. Тогда, как было показано выше, 5> maxE,, s2, ..., 5,) B3) и для достаточно больших р справедливо неравенство : или ¦ . '¦ •• +sp. ¦ С25)
Теория графов и автоматическое управление 155 Из неравенства B5) следует, что дугу 5 можно заменить ду- дугами минимального связывающего дерева, откуда вытекает не- необходимый результат. Поллак в одной из своих работ [21] сформулировал и пред- предложил несколько решений проблемы определения такого пути, соединяющего две станции в железнодорожной сети, который обладает максимальной пропускной способностью. Эта пробле- проблема эквивалентна нашей задаче. Кроме того, Д. Р. Фалкерсон со- сообщил автору данной статьи, что Ху [12] в комментариях к статье Поллака получил наш результат, относящийся к мини- минимальной траектории. 16. Напряжения различной природы Довольно часто при протекании некоторого процесса возни- возникают напряжения, обусловленные различными причинами, на- например механическими или тепловыми. Несмотря на то что в общем случае минимаксная траектория для одного типа напря- напряжений не совпадает с минимаксной траекторией для другого, можно попытаться определить также траектории, которые были бы оптимальными в том смысле, что любое их изменение не уменьшает максимальные значения напряжений обоих типов. Положим, что дуге (i, j) соответствует максимальное тепловое напряжение ttj и максимальное механическое напряжение т,,-. Тогда, если ввести множители Лагранжа гс4 и п2, то с каждой дугой можно связать обобщенное напряжение s,-,: SU Например, полагая пх = 1, п2 = а и определяя минимаксную траекторию между двумя заданными состояниями относительно обобщенного напряжения, у которой достигается максимум механических напряжений, можно гаран- гарантировать, что среди всех траекторий с этим максимальным ме- механическим напряжением (между этими состояниями) всегда найдется траектория с данным максимумом теплового напря- напряжения. Последующее изучение параметров наряду с определением нескольких минимальных связывающих деревьев может дать по- полезную информацию о возможных дальнейших направлениях. 17. Обсуждение результатов Наша первоначальная цель состояла в том, чтобы показать тесную связь между различными классами важных задач авто- автоматического управления и теории графов. Проведенное рассмо- рассмотрение породило много дополнительных вопросов. Закончим дан- данный пункт, сформулировав некоторые из них,
156 Роберт Калаба Формулировка Как определить, сколько состояний системы нужно рассма- рассматривать; какие напряжения или времена подлежат рассмотре- рассмотрению и что является критерием этого? Аналитический и вычислительный подходы Каковы связи между решением дискретных и непрерывных задач? Возникает также множество других проблем, слишком разнообразных, чтобы дать их перечень. Приложение Каким образом можно осуществлять контроль за выполне- выполнением программ в том случае, когда оптимальная замкнутая си- система управления процессом решения имеет место с самого на- начала? Ясно, что ответы на такие вопросы должны обеспечи- обеспечиваться как с чисто математической стороны, так и со стороны обоих видов автоматического управления, не исключая в ряде интересных случаев и другие дополнительные средства. Вопросы для самопроверки I. Рассмотрим прямоугольную взвешенную сеть, приведенную на рисунке. Нам удобно интерпретировать число на каждой из дуг сети как время, 26 U 13 © 1 15 23 12 4 22 5 28 30 24 © 27 9 10 25 3 6 2 © 11 7 18 21 29 31 16 20 8 17 19 ® ® © необходимое для прохождения по этой дуге. Минимальное время прохожде- прохождения из вершины А в вершину В есть: а) 89, б) 84, в) 85, г) 87. 2. Мы также можем интерпретировать числа на дугах сети, изображенной на рисунке, как максимальные напряжения, возникающие при прохождении
Теория графов и автоматическое управление 157 по этим дугам. Наименьшие из возможных максимальных напряжений, кото- которые могут возникать вдоль траектории от вершины А до вершины В, есть а) 22, б) 23, в) 24, г) 25. 3. Суммой напряжений ветвей минимального дерева для сети, изображен- изображенной на нашем рисунке, является а) 212, б) 211, в) 207, г) 208. 4. Если каким-либо образом получилось так, что система оказалась в указанном на рисунке состоянии С и если это случилось в процессе же- желаемого преобразования системы в состояние В, то необходимо как можно быстрее произвести корректировку следующего промежуточного состояния с помощью сдвига. а) вверх, б) вниз, в) вправо, г) влево. 5. В сети, приведенной на рисунке, необходимо найти такие связываю- связывающие деревья, которые в результате перенумерации ветвей становятся мини- минимальными связывающими деревьями. Рассмотрим единственный путь от вер- вершины А до вершины В. Этот путь представляется следующими вариантами: a) ADFC, б) AGFC, в) ADEC, г) AGFDEC. ЛИТЕРАТУРА [1] Ash M., Bellman R., Kalaba R., On Control of Reactor Shutdown Involving Minimal Xenon Poisoning, Nuclear Science and Engineering, 6 A959), 152—156. [2] Беллман Р., Динамическое програмирование, ИЛ, М., 1960. [3] Bellman R., On a Routing Problem, Q. Appl. Math. 16 A958), 87—90. [4] Б е л л м а н Р., Процессы регулирования с адаптацией «Наука», М 1964. [5] В е 11 m a n R., К а 1 a b a R., On й-th Best Policies, /. Soc. Ind. Appl. Math., 8 (I960), 582—588. [6] В e 11 m a n R., Kalaba R. (editors), Mathematical Trends in Control Theory, Dover Publications, New York, 1964. [7] Bellman R., Kalaba R., Lockett J., Numerical Solution of Fun- Functional Equations by Means of Laplace Transforms — VI: Stochastic Time- Optimal Control, RM-4119, the RAND Corporation, Santa Monica, Calif. 1964. [8] Bellman R., К a rush W., On a New Functional Transform in Ana- Analysis: The Maximum Transform, Bull. Amer. Math. Soc. 67 A961) 501—503. [9] Б е р ж К., Теория графов и ее применения, ИЛ, М., 1962. [10] Dantzig G., On the Shortest Route through a Network, P-1345, The RAND Corporation, Santa Monica, Calif, 1959. [11] Форд Л., Фалкерсон Д., Потоки в сетях, «Мир», М., 1966. [12] Н и Т. С, The Maximum Capacity Route Problem, Operations Res. 10 A962), 898—900. [13] Kalaba R., On Some Communication Network Problems, Chapter 21 in R. Bellman and M H a 11, Jr. (editors), Combinatorial Analysis. Proc. Sympos. Appl. Math. 10, American Mathematical Society, Providence, Rhode Island, i960.
158 Роберт Калаба [14] Kalaba R., Dynamic Programming and the Variational Principles of Classical and Statistical Mechanics, Chapter I in J. E. Lay and L. E. Malvern (editors), Developments in Mechanics 1, Proceedings of the Seventh Midwestern Mechanics Conference, Plenum Press, New York, 1962. [15] Konig D., Theorie der endlichen und unendlichen Graphen. Kombinato- rische Topologie der Streckenkomplexe, Mathematik in Monographien 16, Akademische Verlagsgesellschaft, Leipzig, 1936; reprinted by Chelsea Pub- Publishing Co., New York, 1950. [16] Kruskal J., On the Shortest Spanning Subtree of a Graph and the Tra- Traveling Salesman Problem, Proc. Amer. Math. Soc, 7 A956), 48—50. [17] LaSalle J. P., Time Optimal Control Systems, Proc. Nat. Acad. Sci. U.S.A. 45 A959), 573—577. [18] Ла-Салль Ж., Лефшец С, Исследование устойчивости прямым методом Ляпунова, «Мир», М., 1964. [19] Maxwell J. С, On Governors, Proc. Royal Soc. London, 16 A868), 270—283. [20] Newton G. L. Gould, Kaiser J., Analytical Design of Linear Feed- Feedback Controls, John Wiley and Sons, New York, 1957. [21] Pollack M., The Maximum Capacity through a Network, Operations Res., 8 A960), 733—736. [22] Pollack M., Solutions of the ft-th Best Route Through a Network —A. Review, /. Math. Anal. Appi, 3 A961), 547—559. [23] Pollack M., The &-th Best Route through a Network, Operations Res., 9 A961), 578—580. [24] Prim R., Shortest Connection Networks and Some Generalizations, Bell. System Tech. J., 36 A957), 1389—1401. [25] Bellman R., Dynamic programming and Markovian decision processes, with particular application to baseball and chess, Applied Combinatorial Mathematics, 1964, стр. 221—236. [26] Peterson E., Optimum multivariable control, Applied Combinatorial Mathematics, 1964, стр. 253—283. [27] Beckenbach E., Network flow problems, Applied Combinatorial Mathe- Mathematics, 1964, стр. 348—365.
ЗАДАЧИ О ПРАВИЛАХ ОСТАНОВКИ Лео Брейман 1. Как распознать задачу о правилах остановки? Почему нужно изучать задачи о правилах остановки? От- Отчасти уже потому (если не говорить о большом содержательном интересе, который представляют они сами), что задачи о прави- правилах остановки образуют простейший подкласс задач быстро раз* вивающейся в настоящее время области проблем последовательных решений с многозначным выбором, включающий в себя такие интересные аспекты, как ди- динамическое программирование [1] и по- последовательные испытания, состоящие из гипотезы и оценки. Рассмотрим в качестве важного и воинственного примера радарную антен- антенну, периодически просматривающую го- горизонт. При каждом проходе антенны оператор видит какое-то пятно и каждый раз он должен принять одно из двух ре- решений: доложить о наблюдаемом объек- объекте или продолжать наблюдение и собрать больше информации. В качестве примера, носящего более PjIC { Однорукий бан- легкии и развлекательный характер, рас- дит- смотрим устройство, показанное на рис. 1. При всей своей кажущейся простоте оно иллюстрирует все су- существенные черты задачи о правилах остановки. Поскольку дей- действие этого устройства хорошо известно'), опишем его в общих чертах. Мы наблюдаем текущее состояние, т. е. символы, появ- появляющиеся в окошке, и у нас есть самое большее две возмож- возможности: забрать весь выигрыш, накопившийся к настоящему мо- ') Играют с «одноруким бандитом» следующим образом: в верхнее круг- круглое отверстие опускают монету — вступительный взнос — и проворачивают ручку. После этого механизм автомата приводит в движение диски и оста- останавливает каждый диск некоторым случайным образом. Если одинаковые рисунки на всех трех дисках оказались в одном ряду, То в нижнюю щель выдается выигрыш.
160 Лео Брейман менту, и выйти из игры или внести вступительный взнос — моне- монету в 5, 10, 25 центов или больше — и получить право перейти в следующее состояние. Несерьезность этого примера только в том, что, видимо, никто не определял вероятности перехода из одного состояния в другое. Итак, задача правил остановки характеризуется такими чер- чертами, которые можно грубо разделить на две части: 1) вероятностный механизм, т. е. случайное устройство, пе- переходящее из одного состояния в другое по известному, частич- частично известному или неизвестному вероятностному закону; 2) структура платежей и решений такова, что при наблюде- наблюдении текущего состояния у нас имеется самое большое две воз- возможности: а) забрать накопившийся к данному моменту выигрыш и выйти из игры; б) внести вступительный взнос, чтобы иметь право наблю- наблюдать еще одно состояние. 2. Примеры Рассмотрим теперь некоторые примеры, которые серьезг^ чем «однорукие бандиты», — серьезнее в том смысле, что они могут быть сформулированы математически. В литературе было рассмотрено и решено много таких примеров; весьма неполная библиография дается в конце статьи. Пример 1. Задача о бросании монеты при неограниченном капитале [7]. Осуществляются последовательные бросания сим- симметричной монеты; выпадание герба означает выигрыш одного очка, выпадание решетки — проигрыш одного очка. Определив Xh следующим образом: Xh= + l, если в результате &-го броса- бросания выпал герб, и Xh = — 1, если в результате &-го бросания вы- выпала решетка, мы получим, что есть выигрыш, накопившийся за п бросаний. Так описывается вероятностная структура задачи. Чтобы строго определить структуру решений, предположим, что наш партнер бесконечно любезен и согласен продолжать или прекра- прекращать игру по нашему желанию и что вдобавок он бесконечно богат. Усугубляя фантастический характер наших допущений, будем считать, что и мы в начале игры обладаем бесконечно большим капиталом. Смысл этих допущений состоит в том, что после каждого бросания мы можем принять одно из ровно двух решений; пре-
Задачи о правилах остановки 161 кратить игру и собрать накопившийся к данному моменту выиг- выигрыш или продолжить игру и произвести по крайней мере еще одно бросание. (Заметим, что в этом примере нет вступительных взносов; мы не обязаны делать ставки, чтобы иметь право про- произвести следующее бросание.) Для этой игры существует хорошо известная стратегия, ко- которая требует, чтобы мы выходили из игры, как только начинаем выигрывать. Хотя эта стратегия должна представляться иску- искушенному математику тривиальной, все же в дальнейшем она приведет к интересным следствиям. Сохраним здесь упоминание об этой стратегии, чтобы иметь возможность в дальнейшем на нее ссылаться. Заметим, что, характеризуя задачу о правилах остановки, мы до сих пор говорили, что на каждом шагу имеется самое боль- большее две возможности. В примере 1 из-за того, что временные и денежные ресурсы предполагались неисчерпаемыми, каждый раз возникало ровно две возможности. Пример 2. Задача о бросании монеты при ограниченном ка- капитале. Рассматривается та же задача, что и в предыдущем примере, с той разницей, что начальный капитал S предпола- предполагается ограниченным. Тогда если на какой-то стадии игры ока- оказывается, что 5„ = —S, то у нас уже не остается никакого вы- выбора: наши деньги пропали и мы обязаны выйти из игры. В прекрасной, весьма содержательной книге [7] собран боль- большой материал по бросанию монеты. Более серьезное изложение теоретических аспектов задач о правилах остановки можно най- найти в работе [6], в главе, посвященной мартингалам. Пример 3. Задача о выборе дома [2, 13]. В этом примере мы делаем выборку из генеральной совокупности с известным рас- распределением, причем каждый элемент выборки извлекается не- независимо от других. Говоря более формально, при извлечении &-го элемента вы- выборки выпадает целое число / с известной вероятностью pi, так что если Xh — результат &-го извлечения, тс Структура платежей определяется следующим образом: если мы выходим из игры после выбора п элементов, то мы полу- получаем в качестве платежа максимальное из чисел (Xi, ..., Хп), т. е. «лучший номер» из всех, какие нам встретились. Если, од- однако, мы хотим продолжать игру, мы должны заплатить неко- некоторую сумму С за право выбрать еще один элемент. 11 Зак. 909
162 Лео Брейман Юмор того, что рассмотренная задача называется задачей о выборе дома, страдает излишней изысканностью: только житель Лос-Анжелеса мог бы считать, что выборка из беско- бесконечной генеральной совокупности (поскольку извлечение из по- популяции одного элемента не меняет распределения остальных) является реальной моделью выбора дома. Пример 4. Задача Р. В этой задаче, прекращая игру в нужный момент, нужно показать, что у симметричной монеты на самом деле имеется тенденция чаще давать при бросании герб, чем решетку. Так, если Xk= + l в случае, когда при k-м бросании выпа- выпадает герб, и Xk = 0 в противном случае, то Хк независимы: =\) = ± и Если мы положим n 2 k k=l то наш выигрыш, если мы выйдем из игры после п-го бросания, составит S,Jn; вступительных взносов нет. Мыслимо ли правило остановки, которое бы учитывало тенденцию монеты к гербам? Рассмотрим следующее правило: следует прекращать игру, если Xi=l, в противном случае надо прекращать игру ровно через два бросания. Тогда 1 для Л", —1, ] 0 для Х1 = О, Х2 = О, у) Х 0 Х 1 Sn г\ - ч 1 , „ 1 . 1 1 5 Отсюда ожидаемый выигрыш равен 1 у + 0 • -т + т ' т = ~я"- Решение этой задачи, т. е. оптимальное правило остановки и ве- величина максимального ожидаемого выигрыша, по-видимому, не- неизвестны. ' Пример 5. Задача о стоянках. В последовательности незави- независимых случайных величин X_N, X-N+i, . . ., Хо, Xi, ... все слу- случайные величины принимают значение 0 или 1 с одной.и той же вероятностью, т. е. P(Xk = 0) = p, P{Xk=\)=--\~p. Мы можем остановиться на Xk, только в случае, если ^ = 0, но если Xh = 0 и мы действительно останавливаемся, то мы пла- платим штраф \k\. Придадим задаче более живописную форму: представим се- себе, что мы едем куда-то на автомашине и что до места нашего
Задачи о правилах остановки 163 назначения будет еще N стоянок. В поле нашего зрения попа- попадает каждый раз только одна стоянка. Естественно, что если стоянка занята, то мы не можем на ней остановиться; если же стоянка свободна и мы поставим на ней автомашину, то штраф, или убыток — это то расстояние, которое нам придется пройти до места назначения пешком. (Этот пример сообщил автору д-р Стенли Френкел.) 3. Постановка задачи Теперь, когда мы запаслись достаточным количеством при- примеров, поставим своей целью сформулировать в точных, но до- достаточно общих терминах, что имеется в виду под задачей о пра- правиле остановки. Мы уже подчеркивали выше, что должны быть определены две различные структуры: вероятностная схема перехода из состояния в состояние и структура платежей и решений. Вероятностная схема Предположим, что этой схемой будет цепь Маркова со счет- счетным числом состояний и известными стационарными вероят- вероятностями перехода. Теория таких схем широко развита [7]. Здесь мы лишь повторим бегло основные определения. Схема может находиться в состояниях, которые можно про- пронумеровать некоторым подмножеством целых чисел. Марков- Марковское свойство [4, 6, 7, 10] определяется в предположении, что если Sn есть состояние схемы в момент п, то P(Sn+i = J, если известно, что Sn — i, и известна вся преды- предыдущая история вплоть до момента n) = P(i\j), где Р (i\j)—известные вероятности перехода из состояния / в состояние /, удовлетворяющее условию Я(/|/)>0, 2Я(/|у)=1; последнее равенство справедливо в силу того, что сумма ве- вероятностей перехода во все возможные состояния должна рав- равняться единице. Это определение будет основой для дальнейших построений. Содержательно оно означает, что если в настоящий момент мы находимся в состоянии /, то — независимо от того, сколько пе- переходов мы уже сделали, прежде чем попасть в это состояние, независимо от того, каков был наш точный путь и двигались ли мы по кривой или по прямой, — вероятность перейти на следую- следующем шагу в состояние / задается числом P(j\i). Говоря эври- эвристически, данное состояние содержит в себе всю существенную информацию о прошлом. 11*
164 Лео Брейман Может показаться, что марковское свойство очень жестко и что случайная схема, встречающаяся в нашей задаче, не удовлетворяет данному определению. Мы утверждаем, однако, и в дальнейшем покажем это на примерах, что, выбирая надле- надлежащим образом множество состояний, мы можем уложить в схему цепи Маркова — в том виде, в каком она была опреде- определена выше,—любую схему, которая производит выборку из генеральной совокупности со счетным числом элементов. Введем, наконец, начальное состояние /0 и этим завершим описание вероятностной структуры нашей задачи. Структура платежей и решений Эта структура вводится в виде двух функций, определенных на состояниях системы: функция F(i) суммарного платежа на данном шагу и функция вступительного взноса f(i). Если в мо- момент п мы находимся в состоянии i, то мы можем принять одно из самое большее двух решений: 1) выйти из игры и получить сумму F(i); 2) заплатить /(/) и сделать еще по меньшей мере один шаг. Встречаются, однако, состояния, в которых возможно только одно решение. Чтобы формализовать этот факт, введем в рас- рассмотрение множество Ts состояний с вынужденной остановкой, такое, что если i?Ts, то мы должны прекратить игру и забрать F(i). Аналогично можно ввести не пересекающееся с 7"., мно- множество Тс состояний с вынужденным продолжением, таких, что если i?Tc, то мы должны заплатить f(i) и сделать по меньшей мере еще один шаг. Отметим, что на множестве Тя нет необхо- необходимости определять f(i), а на множестве Тс — F(i). Вернемся теперь к нашим примерам и уложим их в полу- полученную схему. В примере 1 выберем в качестве состояния системы общий накопленный к данному моменту выигрыш. Если мы находимся в состоянии i, т. е. если наш выигрыш к данному моменту со- составляет (', то независимо от того, сколько игр нам пришлось сы- сыграть, чтобы накопить эту сумму, т. е. независимо от прежних превратностей судьбы, вероятность перехода в состояние /+1 есть '/г, и в состояние ('— 1 —тоже '/г. Таким образом, наша схема является цепью Маркова, у которой -g- для j = i -f1, \ для / = /-1, C) О для других значений j.
Задачи о правилах остановки 165 Начальное состояние есть г'о=О. Платеж, если мы останавли- останавливаемся в состоянии i, — это просто наш выигрыш к данному мо- моменту; т. е. F(i)=i. Вступительного взноса нет, так что f(i)=0; состояний с вынужденной остановкой или продолжением также нет. В примере 2 то же положение, что и в примере 1, но здесь есть состояния с вынужденной остановкой, а именно Ts вклю- включает в себя все состояния йС—S. Чтобы получить цепь Маркова в примере 3, нужно аккуратно определить состояния системы. Правильный выбор состояния Sn таков: Xu ..., Хп). Непосредственным подсчетом получаем далее (Sa+l = J, если дано, что\ (° для P\Sn = i и известна вся 1=; Я(Агп+,</) для . \предыдущая история / \ , = /) ДЛЯ J>1. Таким образом, мы получили цепь Маркова, где P(i\j) выра- выражаются через Pt следующим образом: О для j < i, " pk для j=-.i, D) для j > i. Легко видеть, что F(i)=i, существует постоянный вступи- вступительный взнос /(/) =С, и множества Ts и Тс пусты. Вдохновленные примером 1, мы могли бы попытаться опре- определить Sn точно так же и в задаче примера 4: Схема, определенная таким образом, безусловно, обладает марковским свойством: /Sn+i = y, если дано, что\ I 2 для J~ '+1' \ S» = l / = ji для /=/, но если мы остановимся в состоянии i после п шагов, платеж составит i/n. Это не то, что нам нужно, так как мы хотим, чтобы платеж зависел только от состояния, в котором мы останавли- останавливаемся, и не зависел бы от того, сколько шагов было до этого сделано.
166 Лео Брейман Чтобы избежать этой трудности, придадим каждому состоя- состоянию счетчик числа шагов, т. е. так расширим наше множество состояний, чтобы, взглянув на каждое из них, мы видели не только величину Sn, но и число переходов. Короче говоря, мы возьмем в качестве состояний все упорядоченные пары целых чисел (i,n), где / = 0, 1, ... и /г = 0, 1, ..., с начальным состоя- состоянием @,0). Первое число i показывает путь Sn, а второе число п ведет счет времени. Правила перехода таковы: из состояния (i,n) система переходит в состояние (/+1, /г+1) с вероятностью '/г и в состояние (/,/г+1) с вероятностью '/г. Платеж F(i,n) есть i/n, вступительный взнос f(i,n)=0; a TS и ТС пусты. Пример 5 снова требует умения правильно выбрать состоя- состояния. Мы возьмем в качестве состояний пары целых чисел (/,&), где / пробегает значения —N, ¦—N+\, ..., 0, 1, ..., a k прини- принимает только значения 0 и 1. Содержательно это означает, что / измеряет расстояние от данной стоянки до пункта назначения, a k отмечает, свободна данная стоянка или нет. Правила пере- перехода таковы: переход из (/, k) в (/+1,0) осуществляется с ве- вероятностью р, а переход в (/+1,1)—с вероятностью 1—р. Этот пример отличается от предыдущих тем, что в нем есть множество состояний с вынужденным продолжением, а именно Тс состоит из всех состояний (/, 1), где / = —N, —N+1, .... Платеж задается формулой F(i, 0) = -|/|, где минус показывает, что платеж — величина, противоположная штрафу. Вступительный взнос снова равен нулю, а в качестве начального состояния берется (—N—1,0). 4. Что такое правило остановки? В отношении любой задачи о правилах остановки мы можем спросить: что значит знать, когда остановиться? Как сформули- сформулировать математически правило остановки? Отметим, прежде всего, что речь идет не о пророчествах: решение о том, нужно ли останавливаться на п-м шагу, должно основываться только на знании истории, предшествующей этому шагу, и на заданных распределениях и платежах. Поскольку мы имеем дело с механизмом, который носит ско- скорее вероятностный, чем детерминированный характер, то за на- начальным состоянием /0 может следовать очень много различных последовательностей состояний. Хорошо введенное правило оста- остановки должно говорить нам, когда нужно остановиться при- применительно к любой возможной последовательности состояний, иначе механизм смог бы выдать такую последовательность со- состояний, на которой наше правило не работало бы.
Задачи о правилах остановки 167 Предположим теперь, что мы получили правило, которое и в самом деле охватывает все возможные последовательности; назовем тогда последовательность г0, i\, ..., /„ останавливаю- останавливающей последовательностью, если, проходя по ней, мы решили остановиться в in, и не раньше. Мы теперь сможем полностью описать наше правило, если зададим список всех останавливаю- останавливающих последовательностей; действительно, на каждой стадии ра- работы механизма оказывается выработана некоторая последова- последовательность состояний и, чтобы решить, останавливаться или нет, мы просто проверяем, есть ли наша последовательность в спи- списке. Существует несколько требований, которым должен удовле- удовлетворять любой такой список. Во-первых, если /0, г'ь ..., /„ — останавливающая последовательность, то в списке не должно содержаться ни одного ее продолжения. Кроме того, ни одно со- состояние, входящее в останавливающую последовательность, за исключением, быть может, /„, не может принадлежать Ts, a in не может принадлежать Тс. Наконец, правилом остановки разумно называть только та- такое правило, которое нас и в самом деле останавливает. Смысл этого последнего требования можно выразить, в частности, сле- следующим образом: вероятность остановки должна равняться еди- единице. Сформулируем это более строго. Вероятность Р (i0, i\, ..., in) последовательности состояний «о, «1, ¦ • •, in выражается через вероятность перехода по следую- следующей формуле: Я(/о, 1г, ..., /„) = />(/, | /0) • P(i21 /,) • .... P(in | /„_,). E) Иными словами, вероятность переходов io->h -> h->•..-> in есть вероятность перехода /о-*¦ h< помноженная на вероятность перехода ix-^i^ и т. д. Мы утверждаем таким образом, что спи- список, претендующий на то, чтобы быть осмысленным правилом остановки, должен обладать следующим свойством: 2/>(/„. iv •¦•- *„)=1, F) где суммирование производится по всем останавливающим по- последовательностям. Итак, о любом списке останавливающих последовательно- последовательностей, удовлетворяющем перечисленным выше условиям, мы бу- будем говорить, что он определяет некоторое правило остановки. 5. Что такое решение? Теперь мы уже знаем, как ставится наша задача и какой вид может иметь правило остановки. Настало время обсудить, что
168 Лео Брейман же именно мы хотим получить в этой задаче, т. е. что именно требует в ней решения и что такое решение. Для любой останавливающей последовательности k, г'ь ... ..., in общий выигрыш, который мы обозначим Z(i0, /j, ..., /„), равен F(in)—f(i0)—... — /(/„_i). Другими словами, получен- полученная прибыль равна суммарному платежу F(in) минус вступи- вступительные взносы, внесенные в состояниях /0, iit. . . , in-i- Грубо говоря, нам нужно правило, которое делало бы об- общую прибыль как можно более высокой. Однако о достоинствах правила нужно судить по его общему действию; в самом деле, правило, которое работает очень хорошо на маловероятных по- последовательностях и плохо —на более вероятных, нельзя счи- считать хорошим. Итак, о достоинствах правила нужно судить по ожидаемому общему выигрышу EZ, который дает это правило; в нашем слу- случае он определяется EZ= 2 Z(/o, iv ..., in)P(i0, h, ..., *„), где суммирование производится по всем останавливающим по- последовательностям из списка, а Е— принятое обозначение мате- математического ожидания. Таким образом, EZ получено усредне- усреднением общего выигрыша всех останавливающих последователь- последовательностей, каждый из которых взвешен своею вероятностью. При оптимальном правиле остановки, а это и есть искомое решение, EZ оказывается максимальным. Теперь задача полностью сформулирована и остается только ее решать. Однако правило остановки в том виде, в каком мы его определили, громоздко и им неудобно оперировать. Состав- Составлять полный список останавливающих последовательностей и затем выбирать лучший из таких списков — работа трудоемкая и непроизводительная. Тут-то и приходят на помощь введенные нами с такой скрупулезностью цепи Маркова, которые в громад-' ной степени сократят эту работу. Мы утверждаем, что оптимальное правило остановки нужно искать среди тех правил, в которых решение принимается толььо на основании того, в каком состоянии мы находимся в данный момент. Для случая, когда оптимальное правило существует, это утверждение можно доказать строго, но доказательство это трудно и содержит много выкладок. Тем не менее главная идея ясна: если после какого-то числа переходов мы оказались в со- состоянии /, то влияние на нас предистории проявляется только в том, что мы к этому моменту уже внесли какую-то сумму всту- вступительных взносов, но ведь эти взносы — как утекшая вода: они
Задачи о правилах остановки 169 уже внесены и никогда к нам не вернутся. Следует ли продол- продолжать игру, находясь в состоянии /, мы узнаем, сравнивая то, что мы получим, если выйдем из игры, с теми перспективами, кото- которые открывает продолжение игры. Однако в силу марковского свойства все будущее вероятностное развитие событий зависит только от данного состояния / и не зависит от предистории. По- Поэтому мы должны изучать перспективы, которые открывает дан- данное состояние, и принимать каждое решение заново, как будто игра только началась и ничего до этого не было. Что значит вывести правило остановки, при котором наше решение зависело бы только от текущего состояния? Это значит, что каждое состояние должно быть отнесено к одной из двух категорий: состояния, в которых мы прекращаем игру, и состоя- состояния, попав в которые мы ее продолжаем. Математически, сле- следовательно, такое правило есть не что иное, как разбиение всех возможных состояний на два множества: множество мест оста- остановки Т и множество мест продолжений Т, которое является до- дополнением Т. Тогда дается такое правило: следует останавли- останавливаться в первом же состоянии из множества Т. Сформулируем снова основные определения. Правило остановки есть любое множество состояний Т, удо- удовлетворяющее следующим условиям: 2) 3) Р (попадания из /о в Т) = \. Решение задачи о правилах остановки есть правило оста- остановки Т*, такое, что если ETZ определяет математическое ожи- ожидание общего выигрыша при применении правила остановки Т, то для любого Т ET*Z^ETZ. G) 6. Прекращай игру, когда выигрываешь; проблема устойчивости Как подчеркивалось в различных местах данной статьи, су- существуют серьезные и глубокие проблемы, касающиеся природы и существования решений, а также эффективности методов ре- решения. Мы их по большей части не будем здесь затрагивать и порекомендуем работу [14] тем читателям, которых интересует более математическое изложение этих вопросов. Сошлемся вме- вместо этого на известное наблюдение, которое знают инженеры и физики и которое состоит в том, что каждая задача, в основе которой лежит явление действительности, если эту задачу пра- правильно поставить, имеет только одно разумное решение. Мы коснемся вкратце только одного аспекта проблемы суще- существования и природы решений; этот аспект интересен и сам по
170 Лео Брейман себе и еще больше как иллюстрация тех трудностей, с которыми можно столкнуться при постановке математической задачи. Это так называемая проблема устойчивости. Пусть Т — правило остановки. Обозначим тогда через 7W такое другое правило остановки, которое получится, если обо- оборвать правило Т на N-м шагу; иными словами, в течение N— 1 шага применяется правило Т, и если оно нас за это время не остановит, то мы автоматически выходим из игры после N-ro шага. Это можно выразить иначе, сказав, что список останавли- останавливающих последовательностей для T('v> включает в себя все те останавливающие последовательности из списка для Т, которые состоят менее чем из N шагов, плюс все остальные последова- последовательности из списка для Т, оборванные на N-м шагу. Будем го- говорить, что правило Т устойчиво, если WmET(N)Z = ETZ. (8) JV->CO Устойчивость правила остановки означает, следовательно, что оно может быть аппроксимировано (во всем, что касается платежа) такими правилами, по которым мы решаем выходить из игры после большого, но фиксированного числа шагов, если мы не вышли из игры до этого. Например, в задаче о выборе дома усечение при jV= 1000 000 означало бы, что, если после 1000 000 попыток мы не поселились ни в одном доме, то мы оставляем дальнейшие попытки и выбираем лучший из тех до- домов, которые мы до этого видели. Будем называть устойчивой также саму задачу правила оста- остановки, если она имеет устойчивое решение. Имея устойчивое решение, мы можем получить почти все, что возможно в данной задаче, даже если заранее решим, что мы можем сделать самое большее N шагов. Из различных задач, которые мы приводили в качестве при- примера в п. 2, есть одна задача, не являющаяся устойчивой; это пример 1 — задача о бросании монеты при неограниченном капи-> тале. Вернемся теперь к замечанию, которое мы тогда сделали по поводу предложенного для этой игры правила: выходить из игры, когда выигрываешь. Это очень хорошая стратегия. Чтобы формализовать ее, вве- введем уровень выхода из игры а>0 и решим прекращать игру в первый же раз, когда наш капитал превысит величину а или сравняется с ней. Таким образом, нашим останавливающим мно- множеством Т будут все /, такие, что С^-а. Возникает вопрос: удовлетворяет ли Т тем условиям, кото- которые мы накладывали на останавливающие множества? Действи- Действительно ли правило Т останавливает нас с вероятностью, равной
Задачи о правилах остановки 171 единице? Уверены ли мы, что наступит такой момент, когда S>? На эти вопросы можно ответить утвердительно (см. доказа- доказательство в [7]). Эвристически можно привести следующий до- довод: если мы изобразим графически изменение нашего капитала как функции от числа шагов (см. рис. 2), то увидим, что график Рис. 2. Капитал Sn как функция от числа шагов п. представляет собой линию, колеблющуюся около оси х; оче- очевидно, что найдется такое колебание, которое превышает а. Итак, Т — действительно правило остановки. Легко видеть, что ?rZ>a, (9) поскольку по сформулированному правилу мы с вероятностью 1 всегда получаем по меньшей мере выигрыш, равный а. Тем не менее для этого примера можно доказать, что для любого правила 7' ET(N)Z — §. A0) Другими словами, каким бы способом мы ни играли в эту игру, но если только мы установили заранее тот срок, дольше кото- которого мы играть не будем — будь это неделя, месяц, год и т. д.,— то игра оказывается симметричной, так как математическое ожидание выигрыша равно 0. Это можно в какой-то степени пояснить с помощью следую- следующего рассуждения: если а разумной величины и N велико, то вероятность того, что мы к моменту N превысим уровень а и выйдем из игры, близка к единице; но все же остается неболь- небольшая вероятность того, что в момент N мы еще продолжаем игру и вынуждены выйти из нее, оставаясь в проигрыше. Можно по- показать, что при этой последней альтернативе речь идет об очень крупном проигрыше и этот маловероятный, но большой убыток сводит на нет наш выигрыш а, имеющий большую вероятность. Так или иначе, пример 1 дал нам образец неустойчивой за- задачи правила остановки. Не вдаваясь в дальнейшие обсужде- обсуждения, мы будем впредь считать, что наши задачи устойчивы и что их решения существуют и единственны.
172 Лео Брейман 7. Функциональное уравнение Можно различными способами пытаться решать задачи правил остановки. Первый метод, который мы здесь исследуем, имеет много общего с методами, примененными Ричардом Белл- маном в динамическом программировании [1]. Этот метод за- заключается в составлении функционального уравнения и исполь- использовании оптимизирующего аргумента. Обозначим через Н(i) выигрыш, который мы получаем, при- применяя оптимальное правило остановки при начальном состоянии io = i. Тогда можно показать, что Н (i) удовлетворяет уравне- уравнениям F (i) для i ? Ts, //(/) = для (И) max [/-(г), 2t fiU)^U i) — ПЩ Для j Мы снова уклонимся от строгого доказательства и дадим только схему, по которой это доказательство может быть по- построено. Пусть мы находимся в состоянии L Если / € Ts, то мы, ко- конечно, должны остановиться; поэтому H(i)=F(i). Подсчитаем, однако, какой ожидается выигрыш, если нам выпадает продол- продолжать игру. Мы платим вступительный взнос и с вероятностью P(j\i) переходим в состояние /. Если мы теперь продолжим игру и применим оптимальную стратегию, то наш выигрыш составит H(j). Итак, если мы выходим из состояния /, делаем еще один шаг и блестяще проводим все дальнейшее, то ожидаемый вы- выигрыш составляет / Для состояний из Тс, находясь в которых мы должны обя- обязательно сделать еще один шаг, Н(i) должно быть в точности равно этому выражению. В состояниях из Ts\jTc, где можно принять одно из двух решений, мы получаем F(i), если мы вы- выходим из игры, и H](i), если мы продолжаем игру. Поскольку И(i) — выигрыш, соответствующий оптимальной стратегии, то М(i)= max \F(i), Я,@1 Для 7^U7V .. A3) Это и является тем самым функциональным уравнением, на которое мы ссылались выше.
Задачи о правилах остановки 173 Зачем все же нужно функциональное уравнение, если наша цель — получить останавливающее множество? Дело в том, что если мы сможем решить это функциональное уравнение, то мы и получим оптимальное останавливающее множество. Действительно, пусть 7"* = {множество всех состояний i(fcTc, таких, что H(i) = F(i)}. Будем тогда утверждать, что если Г* является вообще каким-то останавливающим множеством, т. е. если Я(попадания из /0 в Г*)=1, то Г* есть оптимальное останавливающее множество, потому что если максимальный выигрыш при продолжении игры в со- состоянии i в точности равен тому выигрышу, который мы можем получить, выйдя из игры в этом состоянии, то нам следует выйти из игры. Одним словом, решение функционального уравнения — путь ко всевозможным благам; однако этим путем идти нелегко. Число функциональных уравнений рассматриваемого типа,-ре- типа,-решение которых известно, очень мало по сравнению с числом функциональных уравнений, решение которых неизвестно. Стало почти аксиомой, что для точного решения функционального уравнения нужно либо чтобы само это уравнение было совсем простым, либо чтобы решающий был почти гением. Будем по- поэтому искать для возникающих у нас функциональных уравне- уравнений приближенные решения или вычислительные методы. Легко применим к функциональным уравнениям обычный итерацион- итерационный подход, который мы проиллюстрируем для случая, когда Тс пусто. Пусть Я(°)(i) — F (i); определим тогда последовательные при- приближения следующим образом: ( F(i) для Ts, тах [/=¦(/), 2Hw(j).P(j\i)-f(i)] для 7V Нетрудно доказать, что Я(л+1) (i)> H(n) (i) и что процесс сходится к H(i). Здесь возникает серьезная трудность, а именно нам нужно не H(i), a T*. Можно было бы попытаться аппроксимировать 7"* следующим образом: Гд = (все состояния i, такие, что H{n)(i) = F(i)}.
174 Лео Брейман Это, однако, вообще бесполезно, поскольку если //<">(/)<//(/), то равенства то равенства не могут выполняться одновременно и поэтому i не может вхо- входить и в Т*, и в 7*. Очевидно, самым правильным было бы сказать, что Т*п состоит из всех состояний /, таких, что //<")(/) достаточно близко к F(i), но тогда тотчас же возникнет воп- вопрос: какая близость является достаточной? Не вызывает сомнений, что предложенная процедура, если ее умно дополнить, может дать хорошие приближения; мы, од- однако, не хотим обсуждать это здесь и оставляем эту проблему, чтобы перейти к вопросам более приятным. 8. Устранение вынужденного продолжения Очевидно, что задачи о правилах остановки мы сможем сформулировать в терминах линейного программирования. На первых шагах осуществления этого плана будем приводить за- задачи к стандартной форме. Для начала устраним состояние Тс с вынужденными про- продолжениями. Предполагая, что i0 не принадлежит Тс, заменим исходную задачу такой измененной задачей, в которой множе- множеством состояний является Тс (т. е. состояний с вынужденным продолжением нет), но которая эквивалентна исходной задаче. Заметим, что для любого состояния t € Гс, такого, что Р (попасть когда-либо из i0 в г) > О, должно иметь место равенство Р (когда-либо вернуться из ib Tc)—\. Действительно, в противном случае существовала бы положи- положительная вероятность того, что, выйдя из состояния @, мы на- навсегда останемся в Тс и, следовательно, никогда не кончим игру. На множестве состояний Тс определим новые вероятности перехода Р (/1 i): P(J\i) = P (первым состоянием из Тс, в которое мы попадем из i, будет у) = 1. Эти вероятности можно посчитать на основании равенств л-0
Задачи о правилах остановки 175 где <7(П)(ЛО есть вероятность, выйдя из состояния i, попасть в Гс, оставаться там на протяжении п шагов и затем сделать переход в состояние /. Иными словами, ?<»>(/|0=2ЯA\ iv .•¦. *Я,У). A6) где суммирование производится по всем последовательностям i, 'ь • • • > in, U таким, что i\ ? Tc,..., in ? Тс. Изменив таким образом вероятности перехода, мы внесем теперь некоторые коррективы в структуру платежей. F(i) и Т„ остаются прежними, а функцию вступительных взносов f(i) необходимо преобразовать. Идея этих преобразований заклю- заключается в следующем: мы на самом деле не платим отдельные вступительные взносы за каждый единичный переход, а вносим ожидаемую общую сумму вступительных взносов за такое ко- количество шагов, которое позволило бы нам вернуться в состоя- состояние, в котором возможна остановка. Иначе это можно выразить так: изменив вероятности перехода, мы стали в действитель- действительности рассматривать движение системы только по состояниям, не принадлежащим 7V Итак, если мы находимся в состоянии / (; Тс и хотим про- продолжать игру, то нашим вступительным взносом будет ожи- ожидаемая общая сумма вступительных взносов за то минимальное количество шагов, которое приведет нас в Тг. Следовательно, функцию вступительных взносов f(i) мы заменяем другой функцией, которая выражается следующей формулой: где суммирование производится по всем последовательностям /, ii, ..., in, k, таким, что ix € Тс,... , /„ € Гс и k ? Тс. Интуитивно должно быть ясно, что рассмотренные задачи — исходная и измененная — эквивалентны в том смысле, что одно и то же останавливающее множество Т даст в каждой из них один и тот же ожидаемый платеж. Решение Т* одной из этих задач является также решением другой. В заключение покажем, как могут быть устранены состоя- состояния с вынужденными продолжениями в примере 5. Тс включает в себя в этой задаче состояния (/, 1), а Тс — со- состояния (i, 0), где /= — /V, —/V+1,... . Мы получим преобра- преобразованные вероятности перехода, задавая следующий вопрос: если мы выйдем из состояния / и вернемся впервые в одно из состояний из Тс, то какова вероятность, что этим состоянием окажется (у, 0)? Более конкретно: если г-я стоянка пуста, то
176 Лео Брейман какова вероятность того, что ближайшей следующей пустой стоянкой окажется /-я стоянка? Легко видеть, что О, если у <; i, -p)s~'~\ если ]"> L Что касается изменения вступительного взноса, то нам ни- ничто не грозит: поскольку /(/)=0, то и /(<)=0. Мы опускаем нули во всех (/, 0), и задача в преобразованном виде звучит теперь так: даны состояния —N, —N+l,... с вероятностями перехода 0 при /</, '-- ;>, <17> и с F(i) = \i\, /(/)=0; требуется максимизировать ожидаемый выигрыш. Впредь при обсуждении задач о правилах остановки мы бу- будем считать, что состояния с вынужденными продолжениями устранены и Тс пусто. 9. Задачи о вступительных взносах и сведение к ним Следующим и очень важным шагом будет введение в рас- рассмотрение одного особого класса задач правил остановки. Задача о правилах остановки называется задачей о вступи- вступительных взносах, если суммарный платеж отсутствует: F(i)=0. Следовательно, в задаче вступительных взносов играющий ничего не получает за то, что кончает игру. Сразу же возникает возражение: если играющий ничего не получает за окончание игры и вместе с тем должен платить за право продолжать игру, то зачем вообще ее продолжать? Ответим, что мы ничего не говорили о знаке /(/):/(«) может быть положительным, рав- равным нулю или отрицательным; отрицательное же /(/) означает, что это нам платят за то, что мы продолжаем игру. Будем считать благоприятными те состояния, в которых f{i)<0, и неблагоприятными те, в которых /(/) >-0. Может те- теперь показаться, что лучшая линия поведения, когда мы имеем дело с задачей о вступительных взносах,— это продолжать игру, пока мы находимся в благоприятных состояниях (т. е. пока нам платят за продолжение игры), и выходить из игры, как только мы попадаем в неблагоприятное состояние. Но это не обязательно так. Пусть f(i) имеет такой вид, как это показано на рис. 3, где график изображен непрерывным. Находясь в состоянии /, мы можем, несмотря на то что это состояние неблагоприятно, за-
Задачи о правилах остановки 177 хотеть продолжить игру, заплатив небольшой взнос, потому что есть большая вероятность перейти в состояние / и получить затем за продолжение игры большую сумму денег. Одно ясно, нам, безусловно, следует продолжать игру, пока мы находимся в благоприятных состояниях; в самом деле, глупо бросать игру, если нам платят за то, что мы ее продолжаем, и если, более того, попав после этого в неблагоприятное состояние, мы сможем выйти из игры безнаказанно. Неблагоприятные состояния, Р и с. 3. Задача о вступительных взносах со взносом / (i) для продолжения игры из состояния i. Есть один тривиальный частный случай, когда упомянутое выше правило остановки является оптимальным. Если возвра- возвращение из неблагоприятных состояний в благоприятные невоз- невозможно, то нет причины не выходить из игры, как только мы по- попали в неблагоприятное состояние. Сформулируем это простое замечание более строго. Теорема 1. Пусть в задаче о вступительных взносах Т* — {все неблагоприятные состояния i). Если P(j\i)=O для лю- любых i и /, таких, что i — неблагоприятное, a j— благоприятное, и если Т* удовлетворяет всем требованиям, предъявляемым к правилу остановки, то Т* является решением. Ситуацию, которая удовлетворяет условиям этой теоремы, мы будем называть абсолютно монотонным случаем. Хотя сфор- сформулированная теорема и кажется тривиальной, она предоста- предоставит нам способ решения многих из приведенных выше примеров. Кроме того, что задачи о вступительных взносах важны сами по себе, есть и еще одна существенная причина, по которой по- полезно рассмотреть этот класс задач: каждая задача о правиле остановки может быть сведена к эквивалентной задаче о всту- вступительных взносах. В строгой форме это утверждение таково: пусть дана задача о правилах остановки с P(j\i), Г„ F(i), /(/); построим задачу о вступительных взносах (так называемую 12 Зак. 909
178 Лео Брейман главную задачу) с теми же вероятностями перехода и тем же Tf, но со вступительным взносом /'(/), который задается формулой: и, конечно, F'(i)=0. Тогда две эти задачи эквивалентны в смысле следующей теоремы. Теорема 2. Пусть Т есть правило остановки для некоторой задачи о правиле остановки и для соответствующей задачи о вступительных взносах. Если Т устойчиво для обеих задач, то имеем где ETZ' — платеж, полученный при использовании правила Т в задаче о вступительных взносах. Следовательно, если обе за- задачи устойчивы и Т* — решение для одной из задач, то Т* — также решение для другой. Прежде чем показывать, на чем строится доказательство этой теоремы, продемонстрируем, как она прилагается к неко- некоторым из прежних примеров. Задачи в примерах 1 и 2 эквивалентны задаче о вступитель- вступительных взносах, где Как это ни удивительно, но задачи в обоих этих примерах экви- эквивалентны задаче, в которой F(i)~0 и f(i)=0. Теорема утвер- утверждает, что для любого устойчивого правила Т ETZ = ETZ' + F(io); поскольку ETZ = 0 и F(i0) =0, то в результате для любого устой- устойчивого правила мы получаем, что ETZ = 0. Задача в примере 3 эквивалентна задаче о вступительных взносах, где /(i) = С — [ S/P(у | г) — так как Hpk= 1.
Задачи о правилах остановки 179 Для дальнейших ссылок отметим, кроме того, что + IiU j > i так что /(/ -I-1) >/(*). Задача о стоянках (пример 5) в том варианте, когда со- состояния с вынужденными продолжениями уже устранены и Тс пусто, эквивалентна задаче о вступительных взносах, где / с)=21/1 •/>•(!-/>)'-'-'-т- ; >< При i ^ 0 имеем _d_ ~ P' dp Аналогичный подсчет при i<0 дает/(/)== — [2A—/?)''' — l] Снова мы получили, что f(i+l) ^-f(i). Теперь будет приятной неожиданностью заметить, что в при- примерах 3 и 5 мы имеем дело с абсолютно монотонным случаем, поскольку в обеих задачах Поэтому тот простой принцип, который мы воплотили в тео- теореме 1, позволяет нам написать (см. также [6, 14]) следующие решения для (соответственно) примеров 3 и 5: Т* = {все /, такие, что С > 2 (/—0/>/f ¦ Г* = |все г>0, а также такие i < 0, для которых Мы не будем давать подробного доказательства теоремы 2, а продемонстрируем его механизм на примере. Идея заключается в том, чтобы доказать нашу теорему для усеченных правил 12*
180 Лео Брейман остановки, а затем перейти к пределу; иными словами, мы сна- сначала докажем, что для всех N Er{N)Z =-- ET(N)Z' -\- b (i0), а затем, если задача устойчива, предположим, что /V—>оо. В качестве иллюстрации докажем наш результат для Л'= 2. В этом случае Т№ есть правило, имеющее следующий список останавливающих последовательностей (/„, ij) для ix?T и (i0, /,, /2) для /,6 7\ Ожидаемый суммарный платеж при применении Л2> соста- составляет 2 F(i,) • Я(/о, /,)+ 2 F(i2)P(i0, iv h), A8) где суммирование во второй сумме производится по всем по- последовательностям (г0; /), j2), таким, что i\€.T. Замечая, что Р(/0) /„ i2) = P{.i2\h)-P{.i0, /,), мы можем, следовательно, переписать эту вторую сумму 2/(/2) ./>(/„, /lf /2)= 2 [ 2 /Ч'г) • P(h\ h)\ Я (/о- ',)• L J Пусть G{i)=^F(j)-P(j\i) — F(i). Тогда получаем 2 F(h)P(io> ^ h)= и теперь A8) принимает вид 2 fvjpVo, /0+ 2 2 z7 (*i) ¦ я (г\ | /0) 4- 2 о (/, все i, ,-ifr Ожидаемая общая сумма вступительных взносов Следовательно, получаем
Задачи о правилах остановки 181 Если мы используем задачу о вступительных взносах, где то, как очень легко видеть, предыдущее выражение будет в точ- точности равно Z?rC)Z' -\-F(г0). В доказательстве для произволь- произвольного jV проводится в точности та же самая идея; мы опускаем это доказательство только из-за сложности обозначений. Приведем в этом пункте еще один результат, который при- пригодится для дальнейших ссылок. Эвристически его идея заклю- заключается в том, что если в задаче о вступительных взносах /(/) возрастает с возрастанием / и если имеется общая тенденция в сторону больших I — иными словами, если вероятность пере- перехода к большим значениям i выше, чем вероятность перехода к меньшим значениям (, — то решение Т* должно иметь такой вид: существует г*, такое, что мы останавливаемся как только В строгой форме это утверждение таково: Теорема 3. Если f(i+l) ^ f(i), F(i)==0 и вероятности переходов таковы, что для любой неубывающей функции h(i) функция 2 h (У) Р UI i) также является неубывающей, то суще- существует i*, такое, что решение Т* задается множеством {все i, такие, что i ^> /*}. Один из методов доказательства использует переход к функ- функциональному уравнению. В этом случае мы пишем H(i) = max [О, S Я(/) Р(j | i) И Т*= {все /, такие, что M(i) = 0}. Заметим, что путем изменения знаков в условии теоремы мы получаем, что для невозрастающей функции h(i) функция 2i h(j)P(j\i) является снова невозрастающей. Поскольку Я(/)^-0, то теорема будет доказана, если мы покажем, что H(i) не возрастает-, так как из Я(/*)=0 будет следовать, что H(i)=0 для всех i^-i*. Используя метод последовательных приближений, где //((п(г) = 0, Я(п+1)(/) = max [0, 2 Я(л)(у)P(j |/)-/(/)], я>0, получаем, что если H(n~>(i) не возрастает, то, по условию тео- теоремы, 2 H(n'>(j)P(J\i) также не возрастает. Отсюда если /(/) —¦
182 Лео Брейман неубывающая функция, то 2 //("> (j)P(J\i) — f(i)—также не j убывающая функция; следовательно, #(п+1>(г), как функция, яв- являющаяся максимумом нуля и невозрастающей функции, является невозрастающей; другими словами, Я<п+1'(г+1) ^ Поскольку #<°>(i) =0, то #<n>(i) есть для всех п функция невозрастающая, отсюда и предельная функция H(i) также не возрастает. Будем называть ситуацию, которая удовлетворяет условиям этой теоремы, монотонным случаем. Монотонный случай похож на абсолютно монотонный случай, но отличается от этого по- последнего тем, что не дает решения иногда очень трудной задачи подсчета искомого i*. 10. Решение методами линейного программирования Существует ряд достаточно серьезных причин для того, чтобы стараться представить задачу о правилах остановки в виде задачи линейного программирования. Не последним яв- является и то практическое соображение, что существует много машинных программ и что при решении подобных задач совре- современная машинная техника может оперировать переменными в количествах, которые математику представляются почти не- неправдоподобными. Чтобы отбросить это недоверие, нам придется все же на- наложить на задачи о правилах остановки два ограничения, ко- которые мы сформулируем так: 1. Рассматриваются только такие задачи, которые являются задачами о вступительных взносах с пустым Тс; т. е. из задач уже устранены состояния с вынужденными продолжениями; 2. В множестве Ts имеется лишь конечное число состояний, скажем, состояния 1,... , М. Рассмотрим такую задачу линейного программирования, в' которой каждому состоянию из Ts поставлена в соответствие переменная я,-, так что всего имеем М переменных: хи . . ., хм- Эти переменные подчиняются- следующим неравенствам: л:;>0, /=1, ..., М (неотрицательность), xt > —/(*) + '=1. •••- М. A9) Итак, мы рассматриваем следующую задачу: даны неравен- неравенства A9); требуется минимизировать -*;„, если i0 — начальное состояние.
Задачи о правилах остановки 183 Поскольку xio—безусловно, линейная функция от хх, ... .. ., xM(xio = alx1 + . . . -\-амхм, где at = 0, i ф i0 иа(о = 1), то мы получим стандартную задачу линейного программирова- программирования. Как связана эта задача с исходной задачей правил оста- остановки, видно из следующего утверждения. Теорема 4. Пусть (х*, ..., х*^—решение задачи линей- линейного программирования, и пусть Т = {все i, такие, что х* = 6\- Тогда T* = T\jTs есть решение задачи о вступительных взно- взносах и Чтобы коротко очертить ход доказательства, предположим, что все решения единственные. Пусть G — множество всех век- векторов (х\, ..., хм), удовлетворяющих неравенствам A9), и пусть (х\, . . . , хм) и (г/1, . . . , ум) оба принадлежат G; тогда вектор Bi, ..., zM), определенный следующим образом: г, = min (xt, yt), тоже принадлежит G, поскольку, безусловно, г^О и zt = min (x{, yt) > min Г— f (i) -f- 2 XjP (j \ i), Z] B0) Выражение, стоящее в B0) справа, равно где подразумевается, что суммирование производится по состоя- состояниям 1, . . ., М из Ts. Пусть (х*, . .., х*м) является решением, определим (уи ... .. ., ум) следующим образом: у, = max Тогда (у1,...,Ум) принадлежит G, так как (/,^; отсюда, за- замечая, что yi^x*, получаем
184 Лео Брейман Следовательно, (zi, ..., zM), определяемое равенством zi = min(x*p у;),— также решение. Если решение единственно, то zt = х], откуда следует (так как у{ ^ х*), что yi = x*- По- Поэтому ^удовлетворяет условию х\ = max Го, 2-*;.-я(/|о-/(О1- Определяя L(i) следующим образом: х* для i ? Ts, О для / ? Г,, видим, что L(i) удовлетворяет функциональному уравнению: (О для / ? Ts, v ; jmax 0, 2j^-(/)"(/I0 — /(О ДЛЯ 'с'г Это то уравнение, которому удовлетворяет #(/), так что при единственности решения имеем Г*={все I, такие, что Z,(/) = 0}, Сделаем несколько последних замечаний относительно рас- рассмотренной теоремы и ее доказательства. Внимательно читая до- доказательство, можно обнаружить, что при данных неравенствах мы получили бы то же самое решение, минимизируя любую ли- линейную функцию aiXi-f ... +амхм с неотрицательными коэффи- коэффициентами о,-. Это верно, если решения единственны, а для Т* по существу верно даже в случае, когда решения не единственны! Выбор xia диктовался некоторыми соображениями, которые станут понятны в п. 17. Обсудим теперь, что нужно делать, если Ts, как это бывает в общем случае, включает в себя бесконечное число состояний. Одна из возможностей — сделать грубую первоначальную оцен- оценку задачи и выделить некоторое множество Г°, собрав в нем со- состояния, для которых f(i) настолько велико, что мы, очевидно, будем прекращать игру, попав в одно из этих состояний, если мы только не вышли из игры до этого. Возьмем теперь объеди- объединение Ts = Ts U То', если Ts конечно, то мы приходим к ситуа- ситуации, уже оассмотренной выше.
Задачи о правилах остановки 185 ЗАДАЧИ О ВОССТАНОВЛЕНИИ С ДВУЗНАЧНЫМ ВЫБОРОМ 11. Введение и примеры Мы переходим здесь к классу задач, который представляет- представляется на первый взгляд совершенно новым. Введение этого класса вызвано разными причинами. Отметим, прежде всего, что хотя задачи о правилах остановки часто привлекательны и приятны, они все же редко встречаются в промышленных и технических приложениях в чистом виде. Между тем существует широкий класс тесно связанных с ними прикладных задач, в которых возникают математические ситуации, похожие на ситуации в задачах о правилах остановки. Кроме того, нашей целью будет показать, что задачи этого нового класса имеют не только фа- фамильное сходство с задачами о правилах остановки, но находят- находятся с ними и в более тесном родстве. Тот тип задач, который мы назовем задачами о восстановле- восстановлении с двузначным выбором, встречается в разных формах [11]: это задачи о заменах, задачи о проверке и исправлении, задачи контроля качества и т. п. Приведем сначала несколько извест- известных примеров. Пример 6. Задача о потерях и заменах [5]. Некоторый эле- элемент, например электрическая лампа, может с вероятностью рк выйти из строя между моментами времени k и k+l. Периодиче- Периодически, в моменты 0, 1, 2, . . . , лампу можно заменить, а в момент О лампа считается новой. В любой момент времени п лампа может быть заменена; при- причем если в этот момент лампа еще работала, то цена замены равна Ci; в этом случае лампа, поставленная на место прежней, считается новой в момент п + \; если же заменяется лампа, ко- которая вышла из строя между моментами п и и + 1, то цена за- замен составляет С\ + Сг, и новая лампа начинает работать в мо- момент и+ 2. Таким образом, предполагается, что на замену ухо- уходит одна единица времени. Наша цель — найти такую стратегию замен, при которой затраты на единицу времени были бы мини- минимальны (см. п. 13). Пример 7. Задача о проверке и исправлении [3]. Автомат имеет М внутренних состояний: 1, 2, ..., М. Мы периодически проверяем этот автомат в моменты времени 0, 1, 2, ... и опреде- определяем его текущее состояние. Известны вероятности P(j\i) того, что автомат, находясь в момент п в состоянии i, перейдет к мо- моменту /1 + 1 в состояние /.
186 Лео БрейШн Автомат начинает работу в состоянии 1, которое является полностью исправным состоянием. Если в момент времени п ав- автомат находится в состоянии }ФМ, то его можно исправить по цене Ci; в этом случае автомат переходит в состояние п + к. Если же в момент п автомат находится в состоянии М — со- состоянии поломки, — то он должен быть исправлен обязательно; в этом случае цена исправления Ci-f Сг, и автомат переходит в состояние 1 в момент n + h. В этой задаче время, которое ухо- уходит на исправление, — величина переменная, и снова наша цель — свести к минимуму затраты на единицу времени. Пример 8. Задача о заменах [8]. Если какой-то элемент, — скажем, грузовик — находится в эксплуатации / лет, то затраты на то, чтобы поддерживать его в пригодном для эксплуатации состоянии в течение следующего года, есть случайная величина М{ с известным распределением Если в момент времени п грузовик находится в эксплуата- эксплуатации уже k лет, то мы можем либо заменить его и ввести в экс- эксплуатацию в момент п новый грузовик — за все это платится цена С, — либо в течение еще одного года держать старый гру- грузовик. Задача состоит в том, чтобы найти такую стратегию за- замен, при которой затраты на единицу времени были бы мини- минимальны. 12. Постановка задачи Каковы существенные черты примеров 6—8? Как и в зада- задачах о правилах остановки, здесь имеются две составные части: вероятностная схема, переходящая из состояния в состояние, и структура платежей и решений. Задача о восстановлении с двузначным выбором задана, если заданы следующие объекты: 1. Лежащий в основе случайный процесс, в отношении ко- которого мы будем считать, что он того же типа, что и в задачах о правилах остановки. То есть он представляет собой цепь Мар- Маркова, состояния которой — некоторое подмножество целых чи- чисел, с известными вероятностями перехода P(j\i) и определен- определенным начальным состоянием /0, которое мы будем называть на- началом. 2. Две функции G(i) и g(i), принимающие произвольные значения, и функция /(/), принимающая только значения 0, 1, 2,. .. , такие, что если мы находимся в момент п в состоянии
Задачи о правилах остановки 187 (, то у нас есть возможность принять одно из самое большее двух решений: а) заплатить сумму G(i) и вернуться к моменту n + l(i) в со- состояние io, причем считается, что между моментами п и n + /(i) система находится в бездействии; в этом случае мы будем называть G(i) платой за возвращение к на- началу, а /([) —временем возвращения к началу; б) получить побудительный взнос g(i) и сделать еще один шаг. Точно так же, как и в задачах о правилах остановки, здесь возможны состояния, в которых может быть принято самое большее одно решение. Соответственно мы постулируем, что мо- может существовать множество состояний, с вынужденным восста- восстановлением Uг, такое, что если мы находимся в состоянии /€ Ur, то мы должны заплатить G(i) и через l(i) единиц времени пе- перейти к началу. Аналогично постулируем множество состояний с вынужденным продолжением Uc, в которых мы должны сде- сделать еще один шаг, получив необходимый побудительный взнос,. Преобразуем теперь наши примеры так, чтобы они уклады- укладывались в полученную схему. Снова нашей целью будет правиль- правильный выбор состояний. В примере 6 выберем в качестве состояний пары чисел та- такого вида: первое число представляет собой время, в течение которого данная лампа уже находится в эксплуатации; в каче- качестве второго числа берется +1, если лампа еще горит, и —1, ес- если она погасла. Таким образом, нашими состояниями будут па- пары (Л, 1), (*,—1), где k = 0, 1, ...; to= @, 1). Вероятности перехода задаются следующим образом: , -1)|(ft, 1)] = A, и, естественно, P[(k+L -\)\(k, -1I = 1. Состояний с вынужденным продолжением нет, но все состоя- состояния (k,—1) являются состояниями с вынужденным восстановле- восстановлением. Время возвращения l(i) равно 1. Затраты задаются сле- следующим образом; g~0, a G[(k,l)] = Cu G[(k, —1)]=С1 + С2. Задача в примере 7 уже почти имеет нужный вид. Состояний с вынужденным продолжением нет, Ur включает в себя един- единственное состояние М; для состояний 1, ..., М—1 G(/)=Ci; G{MC C ) Время возвращения задается следующим образом: l(i)=U для [фМ и l(M) =h.
188 Лео Брейман В примере 8 состояния будут характеризоваться временем, в течение которого наш грузовик находится в эксплуатации. От- Отсюда значениями / являются числа 0, 1, 2, . . . ; за /о принимает- принимается 0. Цена возвращения G(k)=C, а время возвращения 0. Если мы решаем продолжать, то k-^-k+l. В этом случае цепь имеет чисто детерминированную природу, т. е. имеем P(ft+l|*)=l, P(j\k) = 0 для всех у^*4-1- Побудительный взнос, который мы получаем за продолжение, есть величина, противоположная ожидаемой цене исправления во время й-го периода, а именно Это последнее замечание не очевидно, и мы его сейчас пояс- поясним. Дело в том, что, хотя цена перехода из i в i + 1 изменяется от грузовика к грузовику, мы можем заменить эту изменяю- изменяющуюся цену ее математическим ожиданием, так как нас интере- интересует средняя цена по большому отрезку времени. 13. Что такое решение? Решением является здесь правило восстановления, т. е. пра- правило, которое говорит нам, когда нужно возвращаться к началу, чтобы затраты на единицу времени были минимальны. Рассу- Рассуждая точно так же, как в случае задач о правилах остановки, можно показать, что хорошей формой задания правила восста- восстановления является множество состояний U, такое, что UrczU, UcczU и Р (попасть из to в U) = 1 (т. е. восстановление действи- действительно происходит). Здесь возникает, однако, существенная трудность, с которой мы не сталкивались в задачах о правилах остановки. Истоки этой трудности — в самой природе того объекта, который мы хо- хотим минимизировать. В задачах о правилах остановки было легко определить, ка- какой общий выигрыш ожидается при данном правиле остановки. В том же классе задач, который мы рассматриваем сейчас, про- процесс возвращается к началу и начинается снова. Выражение, которое мы хотим минимизировать, является средним по боль- большому отрезку времени, и нам предстоит еще некоторая работа, чтобы получить удобный вид для той величины, которую мы на- называем затратами на единицу времени.
Задачи о правилах остановки 189 Для данного правила восстановления U определим C(i) сле- следующим образом: О (t), если i ? U, —g(i), если i?U, и пусть t(i) = \, если /€Г7, но t(i)=l(i), т. е. /(/) равно времени возвращения к началу, если i? ?Л Тогда для последовательности состояний Jo, и, . . ., in общая цена составляет С(/о) +• • . + C(in), а общее время, затраченное на то, чтобы пройти эту последовательность состояний, равно t(io) + ¦ . . +t(in)- Средние издержки на единицу времени по этой последовательности равны С (»„)+ ... + С«„) /(/„)+ ... +*(<„) ' Обратимся теперь к результату, который оказывает во мно- многих областях прямо-таки магическое действие, — к эргодиче- ской теореме. Хотя случайный процесс в сочетании с прави- правилом восстановления способен дать самые различные последо- последовательности состояний, эргодическая теорема утверждает, что с вероятностью, равной единице, мы имеем п^м Hh)+ ...4-t(in) и где Wv — константа, зависящая от правила восстановления U. Иначе говоря, средняя по большому числу членов величина за- затраты на единицу времени действительно существует в самом точном смысле этого слова и с вероятностью 1 принимает зна- значение, одинаковое для всех выдаваемых последовательностей. Тогда решением является правило восстановления U*, такое, что для любого другого правила восстановления U Wu* < Wu. 14. Сведение к задаче о правилах остановки путем разбиения на циклы Вводя читателя в рассматриваемый класс задач, мы уже упоминали о том, что они находятся в более тесном родстве с задачами о правилах остановки, чем это представляется на пер- первый взгляд. Теперь мы выразим это яснее. Связь между двумя этими классами задач устанавливалась и использовалась, на- например, в [12] и [9]. Пусть при некотором правиле восстановления наше устрой- устройство выработало последовательность состояний to, k, 12, ....
190 Лео Брепман С вероятностью 1 <о появится в этой последовательности беско- бесконечное число раз. Будем понимать под первым циклом последо- последовательность состояний, которая начинается с начального состоя- состояния io и кончается тем состоянием из U, после которого Jo появ- появляется в последовательности второй раз. Второй цикл — это та последовательность состояний, которая начинается с /о, следую- следующего за первым циклом, и продолжается вплоть до следующего попадания в U, и т. д. Так, если г=0 и нашей последовательностью является 0, 3, 2, 7, 0, 1, 6, 0, 2, . . . , где 7 и 6 принадлежат U, то первый цикл 0, 3, 2, 7, второй 0, 1, 6, и т. д. Для любой последовательности обозначим через Dk цену ?-го цикла, т. е. если k-й цикл представляет собой последова- последовательность /0, •••, U, то Dh = C(i0)+. . . + C(in). Пусть далее Lh обозначает длительность й-го цикла, т. е. Lh = t(io) + ... +t(in). Тогда для п циклов средняя цена на единицу времени состав- составляет 7-,+ ... +7-я ' Различные циклы, их цены и их длительности являются слу- случайными величинами, но все они имеют одно и то же распреде- распределение. Далее последовательные циклы независимы в вероятност- вероятностном смысле; в самом деле, как только мы возвращаемся в i'o и начинаем новый цикл, его развитие не зависит от истории преж- прежних циклов. Применяя закон больших чисел, делаем вывод, что с вероятностью 1 р+ +р у? ТЛ ¦¦¦+?„ W где Еу обозначает математическое ожидание при действии пра- правила восстановления U. Отсюда получаем равенство W -A^L В полученном выражении участвуют только характеристики первого цикла и это показывает, что задача существенно упро- упростилась. В некотором смысле наша задача теперь сведена к чему-то похожему на задачу о правилах остановки, в которой мы как бы считаем, что первый шаг сделан, когда завершен первый цикл. Если бы выражением, подлежащим минимизации, было не частное, а только ErDu то это была бы в точности задача о правилах остановки, в которой F(i)=—G(i), a f(i) = = —g(i), так что Z = —Di, и требуется максимизировать EVZ Однако Wv — дробь, и это не дает возможности непо-
Задачи о правилах остановки 191 средственно отождествить нашу задачу с задачей о правилах остановки. Сделаем поэтому следующие вычисления: пусть а* = = min(Wu), так что а*< и ' для всех U пи'1 (равенство достигается, когда U=U*). Отсюда имеем, как прежде, EuDl^-a*EuTv или (равенство достигается, когда ?/=?/*). Если цикл представляет собой последовательность со, И, ..., /„, то in € U, и мы получаем D, = О(/„) —s-(/„_,)- ... -ff(i0), )-a*t(in)]-la* + g(in^)}~ ... _ [а* Переписывая дальше, видим, что Ev(—Di + a*Ti)-*CQ и max Еи (— D, + а*Г,) = 0. Рассмотрим теперь задачу о правилах остановки, которая задана следующим образом: Если мы используем в этой задаче U в качестве останавли- останавливающего множества, то мы получим Можно сделать вывод, что для каждого останавливающего множества ETZ*C0; в частности, для T* = U* имеем ET*Z = 0. Отсюда U* — решение этой задачи о правилах остановки. В со- соответствии с этим, имеет место следующий результат. Теорема 5. Для задачи о восстановлении с двузначным выбором с ценой возвращения G(i), побудительным взносом g(i) и временем возвращения к началу l(i) рассмотрим одно- параметрическое семейство задач правил остановки, TS=UT, Tc = Ucu F (i) = а/ (/) - О (/), f (/) = ~g (i) - а.
192 Лео Брейман Полагая р(а) = maxETZ, выберем а*, такое, что р(а*)=О. Тогда для этого значения а решение задачи о правиле оста- остановки является также решением задачи о восстановлении и W* Для примера 6 соответствующее семейство задач о правиле остановки описывается следующим образом: Состояния (k, ±1); Ts — (k, — 1); F(k, +1)= —С,—a; F(k, — 1) = — С, - С2 —а; f(k, +1) = — а. Для примера 7 это семейство характеризуется так: Состояния 1, ..., М; /•"(/) = — С,—и, где / = 1, ..., М—\; F{M) = —C1 — C2-a; l(t) = ~a, где /= 1, 2, . . ., М-\. Аналогично для примера 8 условия таковы: Состояния 0, 1,...; F{i) = — C\ /(/) = Сг — а. При разумных ограничениях, наложенных на ph и Cit задачи в примерах 6 и 8 могут быть решены. Задача в примере 6 сводится к задаче о вступительных взно- взносах. Вступительный взнос задается следующим образом; f'(k, 1) = _а-|(-С1-С2- Если рн возрастают, т. е. ph+i>ph, иными словами, если есте- естественно ожидать, что лампа, пробыв в эксплуатации k+l еди- единиц времени, скорее выйдет из строя, чем пробыв в эксплуа- эксплуатации k единиц времени, то мы имеем абсолютно монотонный случай и решение таково: > Г = |все (k, +1) —такие, что pk>-гА—\ [}TS. Пусть Рп — вероятность того, что лампа все еще работает в мо- момент k\ Pft=(l — Pft-i) ... A— ро). Если через х+ обозначить функцию от х, определенную следующим образом: х+=х для x>0 и х+ = 0 для х<0, — то ожидаемый платеж в задаче о всту- вступительных взносах, использующей 7*, равен
Задачи о правилах остановки 193 Решение этой задачи о восстановлении такое: следует заме- заменять горящую лампу, как только вероятность того, что она погаснет в следующий период, станет больше, чем а*/С2+а*- Задача о вступительных взносах в примере 8 задается сле- следующим образом: f'(i) = Ci-a. Если же C;>C;_i, то справедлива теорема 1 и тогда Т* есть {все i, такие, что Сг>а}. Платеж выражается так: 2(,) ( = 0 Так как F@) =—С, то уравнение для а* таково; с=|(а-с|)+. - ¦'¦-¦¦•••¦:¦-- о Теперь можно сформулировать оптимальное правило замены следующим образом: следует покупать новый грузовик, как только Сг>а*. Задача в примере 7, вообще говоря, не относится к классу абсолютно монотонных случаев. Сводя ее к задаче о вступи- вступительных взносах, получаем = -a-f(C2-fu)P(yVf|/). Если P{j\i) таковы, что неубывающие функции переходят также в неубывающие функции (а значит, выполнено второе условие теоремы 3), то автоматически P(M\i) не убывает при возрастании i и справедливо утверждение теоремы: существует /*, зависящее от а, такое, что наилучшая линия поведения — исправить автомат, как только он попадает в состояние C^-i*. Это предложение принадлежит С. Дерману [3]. 15. Прямой подход Существует еще один подход, который тоже приведет нас к задачам о правилах остановки, и, хотя, возможно, он более труден, но представляет интерес сам по себе. Подход этот основан на известном результате [7], который относится к цепям Маркова. Пусть цепь Маркова имеет ве- вероятности перехода P(j\i) и является такой, что для любых состояний i и / существует цепочка состояний, связывающих i 13 Зак. 909
194 Лео Брейман и у, скажем, (/, iu .... in-u j), Для которой P(i, iu . . ., in_t, /) > >0. Для каждого начального состояния /0 пусть Лг(гс) есть ча- частоты попадания в состояние i за время первых п переходов. Тогда при очень слабых ограничениях, которые всегда будут выполняться в рассматриваемых нами случаях, пределы lim л, (й) = л,- существуют и являются единственными решениями уравнений Возвращаясь к Wu, имеем к=° л-1 Последовательность состояний управляется такими вероят- вероятностями перехода: { P{j\i) для i?U, где б(/, /о) = 1 для / = t0 и 0 в противном случае. То есть, если / ? U, то следующим состоянием будет /0- Мы можем написать п-1 л-1 Таким образом, мы свели нашу задачу к задаче минимиза- минимизации выражения 1т^Г' BS> где Я{ является решением уравнения B3) с P(j\i), заданными формулой B4).
Задачи о правилах остановки 195 Это дает нам прямой, но в смысле вычислений чрезвычайно громоздкий метод решения: для всех возможных U подсчиты- подсчитываем л;, подставляем в B5) и ищем минимизирующее U*,— работа, едва ли выполнимая! Однако еще не все потеряно. Посмотрим, нельзя ли заме- заменить B3) и B4) системой линейных неравенств, чтобы в буду- будущем свести задачу, как обычно, к задаче линейного програм- программирования. Конечно, у нас уже есть один путь, приводящий к задаче линейного программирования: свести нашу задачу к задачам о правилах остановки, а эти последние — к неравен- неравенствам. Трудность в том, что мы получим не одну, а целое се- семейство задач линейного программирования. В действитель- действительности это только на первый взгляд кажется трудностью (см. п. 16), поэтому мы продолжим рассмотрение нашего прямого подхода. Чтобы осуществить этот прямой подход, удобно упростить задачу. Используя в точности тот же способ упрощения, что и прежде, мы можем перейти к такой задаче, в которой Uc пусто. Назовем теперь задачей о побудительных взносах такую задачу о восстановлении с двузначным выбором, в которой G(t) — величина постоянная. Существует результат, который имеет не совсем такую общ- общность, как в случае приведения к задачам о вступительных взносах, но достаточную для наших целей; этот результат фор- формулируется следующим образом. Теорема 6. Дана задача о восстановлении с двузначным выбором, в которой Uc пусто и l(i)—величина постоянная /(/)=/; построим задачу о побудительных взносах с теми же Us и l(i), но с побудительным взносом g(i), который задается формулой е (О = g(t) -[So (У) р U10 - о (/)]> а с G(i), равным G(iu). Тогда обе задачи эквивалентны в том смысле, что любое решение U* одной из них является также решением другой и Доказательство. Первой задаче соответствует семей- семейство задач о правилах остановки, где F(l) = al-Q(t), f(I) = -g(i)-a. Если мы сведем эти задачи к задачам о вступительных взно- взносах, то получим 13*
196 Лео Брейман а платежи задаются следующим образом: Рассматривая семейство задач о правилах остановки, кото- которое соответствует задаче о побудительных взносах, получаем а это сводится к точно тому же семейству задач о вступитель- вступительных взносах с теми же платежами. Для задачи о побудительных взносах, в которой l{i)=l и G(i)=C, B5) принимает следующий вид: и это частное может быть минимизировано обычными мето- методами линейного программирования (см. п. 16). 16. Решение методами линейного программирования Результаты п. 16 применимы только к тем задачам о побу- побудительных взносах, в которых Ur содержит конечное число со- состояний, скажем состояния i, ..., М. Полагая я, = 2*,. переписываем B4) и B5) следующим образом: я, = 6 (у, /0)й.+ 2 при этих ограничениях требуется минимизировать выражение - 2^@ «j if U
Задачи о правилах остановки 197 Чтобы линеаризировать эту задачу, введем новые перемен- переменные /•,- и or, которые связаны с щ и X следующим образом: О при i?U, [—1—(/ —1)<т]я, при i?U, А, Поскольку 0^Х<1 и /X), то а—величина неотрицательная, а поскольку (/— 1)о] и л,>0, то г,- — также величины неотрицательные. Условимся теперь писать 2 вместо 2- Тогда уравнения для г,- и о имеют вид О при j?U, б (у, /„) °+ 1iP(J\l) ri> ПРИ У 6 ?Л Теперь, умножая числитель и знаменатель на [1 — (/—1)<х], получаем следующий вид для выражения, подлежащего мини- минимизации: На этом этапе преобразований мы получили задачу, кото- которую в принципе можно решить следующим образом: для каж- каждого множества восстановления U решаем B7) и результат под- подставляем в B8), чтобы получить цену; проделав это для всех возможных U, находим затем прямым сравнением решение U*. Задача не легкая! Рассмотрим теперь такую задачу линейного программирова- программирования, в которой каждому состоянию /=1, ..., М ставится в со- соответствие переменная из у\, ..., ум и, кроме того, существует дополнительная переменная а. Ограничительные условия та- таковы: а) Уi^-O Для всех /, сг>0; b) sry<ft(y, lo)° + %P(j\l)yt Для всех у; B9) с)
198 Лео Брепман и нужно минимизировать линейную форму Как связана эта задача с B7)? Легко видеть, что эти две задачи связаны, в частности, следующим образом: для любого U соответствующее ему решение (п, а) B7) удовлетворяет огра- ограничениям B9). В самом деле, оно обладает тем свойством, что везде в B9а), исключая U, где /"г = 0 и выражение, стоящее в правой части, неотрицательно, выполняется равенство. Отсюда множество допустимых векторов для B9) включает в себя все векторы, которые удовлетворяют B7) для любого U, так что минимум в задаче B9) меньше или равен минимуму при B7). Менее очевидно, что решение B9) приведет обратно к B7); это мы докажем ниже. Прежде чем идти дальше, следует заметить, что в переходе от B7) к B9) скрыто чрезвычайное упрощение задачи. Если решение B7) сталкивается с огромными трудностями, то B9) — стандартная задача линейного программирования и в наш век полупроводников может считаться почти тривиальной. Итоги отождествления B9) и B7) таковы: мы не можем утверждать, что каждый допустимый вектор из B9) соответ- соответствует какому-то решению B7) с некоторым U, но зато мы знаем, что, решая B9), мы можем рассматривать только гра- границу множества допустимых векторов, удовлетворяющих B9). Отсюда достаточно доказать следующий результат. Теорема 7. Пусть (у°, а0)—граничная точка множества допустимых векторов из B9). Тогда (у^, а0)—решение B7), соответствующее множеству возобновления U, где U задано как состояния i, такие, что у°[ > 0]. Доказательство. Пусть (уи а) — некоторый допусти- допустимый вектор; определим A—{i, такие, что yt = 0\, B — {i, такие, что ^ = 0}. Если все состояния принадлежат либо Л.^либо В, то дока- доказательство закончено, так как, определяя U={i, такие, что
Задачи о правилах остановки 199 г/г>0}, мы получим Уi = 0 для i ? U, {j\i)yi для i?U, так что (уи а) является решением B7). Предположим, следовательно, что существует по меньшей мере одно состояние, не принадлежащее A U В; тогда система уравнений с М переменными vu ..., vM, где vt = 0 для i?A, vj='2iP(j\i)vl для j6В, j?A, имеет решение, отличное от нуля. Возьмем Zj = zVj, где е достаточно мало, чтобы для всех / выполнялось I Так как, по нашему определению, и; = 0, когда */j = 0, a \~Vj = 0 для у,>0 и г, = 0, то это условие выполняется. Если г/3- = 0 и 2j = 0, то так что Р (/|/)=0 для всех /^Л и i?A. Отсюда, если j€A{]B, то автоматически равно 0 и, следовательно, 2 равно нулю, как только Zj = O. Пусть а = \ — S ei> так что п~^~2 и B — о)^" Будем теперь утверждать (см. ниже), что два вектора (ш/г + ег, аа) и [B — a) yt — г{, B — а) а]
200 Лео Брейман допустимы. Из того, что их среднее арифметическое в точности равно (г/,, а), следует, что (yit a)—не граничная точка и по- потому для граничной точки необходимо, чтобы каждое состоя- состояние принадлежало A U В. Чтобы доказать это утверждение, будем оперировать сна- сначала вектором (ау{ + е{, аа). В силу условия B9с) получаем или что выполняется автоматически при надлежащем выборе а. Не- Неотрицательность аг/j + e,- следует из того, что I^K^i/,-. Ограничение B9Ь) принимает вид ayj + ej < aab (у, /0) + a 2 Р (j I *) Hi + S P U10 ?/• или «у — Sj° (j\L) Zi что выполняется в силу неравенства Отсюда следует, что вектор является допустимым. Теми же рассуждениями доказывается допустимость век- вектора [B — а)у{— ег, B — а).а]. Осталось доказать только, что {У%, о)Ф(ауг + ег, аа). Равенство достигается, только если а=\, но в этом случае ег должно быть тождественно равно нулю, что противоречит нашему построению. 17. Отношение двойственности В завершение рассмотрим задачу линейного программиро- программирования, двойственную к B9). Итак, введем М+\ переменную: Х\, ..., хм, —а; тогда двой- двойственная задача такова: а) л:; >0, i = ],..., М; а — без ограничений; м i /- ^ j с) — Xia — /а ^ — С; требуется максимизировать а. Слегка перефразируем задачу: для фиксированного а тре- требуется минимизировать xk при ограничительных условиях C0а) и (ЗОЬ). Пусть этот минимум принимает значение ф(а). Тогда
Задачи о правилах остановки # 201 требуется найти наибольшее а, такое, что С—/а^ф(а), дру- другими словами, если а* — наибольшее решение уравнения Р(а) = = 0, где р(а)=ср(а)+/а—С, то решение двойственной задачи сводится к минимизации -*:,•„ при ограничительных условиях C0а) и (ЗОЬ), и эта задача является в точности той задачей линейного программирования, решение которой дает решение семейства задач о вступительных взносах с f (i) =—g(i)—а; здесь ф(а)+/(а)—С в точности равно Et*Z'-\-Io. — G(i0)—платежу в исходном классе задач правил остановки, которому с по- помощью разложения на циклы мы поставили в соответствие задачу восстановления. Что же дает нам теорема двойственности? Чтобы ответить на этот вопрос, рассмотрим равенство а* = max a = min [— где выражение в правой части есть минимальная цена; срав- сравнивая этот результат с теоремой 5, мы видим, что a*=Wu*. Теперь круг замкнулся. То, что казалось двумя разными методами, привело от задачи восстановления к соответствую- соответствующему ей классу задач о правилах остановки. Это одновремен- одновременно и удивительно, и неудивительно: удивительно потому, что разложение на циклы, с одной стороны, и гораздо более дол- долгий прямой подход плюс линейное программирование плюс двойственность, с другой стороны, — приводят нас к одному и тому же результату; не удивительно поэтому, что в матема- математике, если не сделать где-нибудь ошибку, то обычно все дороги приводят в Рим. Вопросы для самопроверки 1. Задача о правилах остановки лучше всего описывается как много- многошаговая задача на принятие решения, причем: а) после определенного числа п шагов нужно остановиться; б) после каждого шага разрешается выбирать между продолжением и остановкой; в) после некоторых шагов разрешается выбирать между продолжением и остановкой; г) все перечисленное выше неверно. 2. Термин «марковское свойство» обозначает такую вероятную схему: а) принимаемое решение зависит только от данного состояния; б) переходы из состояния в состояния не детерминированы; в) прошлая история не влияет на будущее; г) не имеет места ни одно из перечисленного выше. 3. Задача о правилах остановки может быть решена следующим об- образом: а) мы сводим эту задачу к задаче, включающей в себя функциональное уравнение, и решаем затем полученную задачу методами линейного программирования;
202 Лео Брейман б) мы сводим ее к эквивалентной задаче с F(()=0, а затем представ- представляем полученною задачу в виде задачи линейного программирования; в) отыскивается такая задача, связанная с данной, в которой /(t')=0, и решается методом линейного программирования; г) только по наитию, т. е. ни одним из указанных выше способов. 4. Одно из отличий задачи о восстановлении с двузначным выбором от задачи о правилах остановки состоит в том, что в ней: а) в основе лежит другая вероятностная схема, б) создается впечатление, что, для того чтобы максимизировать ожидае- ожидаемый платеж на единицу времени, нужно выйти из игры; в) используются другие обозначения для той же, в сущности, ситуации; г) процесс не останавливается, а продолжается до бесконечности. 5. Задача о восстановлении с двузначным выбором сходна с задачей о правилах остановки в том, что: а) решением обеих задач является множество состояний; б) в первой задаче минимизируется общая цена, а во второй максими- максимизируется общий платеж; в) в обеих задачах есть возможность выйти из игры или продолжать ее; г) ни в чем из перечисленного выше. ЛИТЕРАТУРА [1] Беллман Р., Динамическое программирование, М., ИЛ, 1960. [2] Chow Y. S., Robbins H. E, A Martingale System Theorem and Appli- Applications, 93—104 in J. Neyman (editor), Proceedings of the Fourth Berke- Berkeley Symposium on Mathematical Statistics and Probability, 1, University of California Press, Berkeley and Los Angeles, Calif., 1961. [3] D e r m a n C, Optimal Replacement Rules when Changes of State are Markovian, Chapter X in R. Bellman (editor), Mathematical Optimization Techniques, University of California Press, Berkeley and Los Angeles, Calif. 1963. [4] D e r m a n C, On Sequential Decisions and Markov Chains, to be pub- published. [5] D e r m a n C, Sacks J., Replacement of Periodically Inspected Equip- Equipment, Naval Research Logist. Quart., 7 A960), 597—608. [6] Дуб Дж. Л., Вероятностные процессы, М., ИЛ, 1960. [7] Ф ел л ер В., Введение в теорию вероятностей и ее приложения, М., ИЛ, 1964. [8] G umbel H., Frisbee R. J., Repair Versus Replacement, Tech. Memo- Memorandum PMR-TM-GIR, Naval Air Missile Test Center, Point Mugu, Calif., 1961. [9] Jorgenson D. W., Radner R., Optimal Replacement and Inspection* of Stochastically Failing Equipment, P-2074, The RAND Corporation, Santa Monica, Calif., 1960. [10] Kemeny J. G., Snell J. L., Semi-Martingales on Markov Chains Amer. Math, Stat., 29 A958), 143—154. [11] Klein M., Inspection Maintenance-Replacement Schedule under Marko- Markovian Deterioration, Tech. Report, 14, Statistical Engineering Group. Colum- Columbia University, New York. [12] MacQueen J. В., Sequences of Independent Time Variable Games, Working Paper, 4, Western Management Science Institute, The University, of California, Los Angeles, 1962. [13] MacQueen J. В., Miller R. G., Optimal Persistence Policies, / Op. Res., 8 A960), 312—380. [14] Snell J. L., Applications of martingale System Theorems, Trans. Amer. Math. Soc, 73 A952), 292—312.
БЛОК-СХЕМЫ Маршалл Холл 1. Введение Блок-схемы — это размещения объектов в множества, на- называемые блоками, при которых удовлетворяются различного рода условия, на число появлений отдельных объектов, пар объектов и некоторые другие условия. Блок-схемы возникли в исследованиях по алгебраической геометрии в связи с про- проблемой Штейнера [27]. Они встречаются также в теории схем планирования эксперимента, и читателю, интересующемуся этим вопросом, мы рекомендуем превосходную книгу Генри Манна [20]. Частным видом блок-схем являются конечные геометрии, как это легко увидеть при ознакомлении с работами Брука и Райзера [8] и Човла и Райзера [9]. Существует связь блок- схем и с теорией чисел, связь несомненно глубокая, но едва ли достаточно ясно выраженная. Это можно увидеть в работах [6, 8, 9, 14, 26]. В последнее время блок-схемы представляют интерес также в связи с кодами, исправляющими ошибки. Пункт 2 посвящен примерам и определениям, п. 3 дает некоторое представление о применении блок-схем к проблемам кодов, исправляющих ошибки, и схем планирования экспери- эксперимента. В п. 4 даются общие теоремы существования и матрич- матричные соотношения для некоторых блок-схем, а также указывается связь блок-схем с квадратичными формами. Следующий пункт содержит краткий обзор наиболее известных видов блок-схем и методы их построения. Мы не всегда имели возможность придерживаться деталь- детального рассмотрения, поэтому за более полными доказательствами рекомендуем обратиться к книге автора [15]. 2. Блок-схемы и латинские квадраты. Примеры и определения Блок-схемой называется размещение элементов') в блоки, подчиненное некоторым правилам относительно числа появле- появлений элементов и их пар. Ниже даны три примера блок-схем. ') Всюду в дальнейшем термин object переведен как элемент. — Прим, перев.
204 Маршалл Холл Пример 1. Семь элементов 1, 2 7 размещены в семи блоках Ви ..., В-,: ?, = {1,2,4}, В3={3, 4, 6}, В5={5, 6, 1}, В2={2, 3, 5}, ?4={4, 5,7}, ?6={6,7, 2), В,= {7, 1, 3}. Пример 2. Девять элементов 1, ..., 9 размещены в двена- двенадцати блоках Ви ..., В12: 5, = {1,2,3}, Д2={4, 5, 6}, Въ=[7, 8, 9}, Я4 ={1,4,7}, В5={2,5, 8}, Я6={3, 6, 9}, В1 ={1,5,9}, Я„ = B, 6, 7), Я9={3, 4, 8}, filo={1.6,8}, ?„ = {2,4,9}, Я12 = {3, 5, 7}. Пример 3. Одиннадцать элементов 1, ..., 11 размещены в одиннадцати блоках В\, ..., В\\\ fi, ={1,3, 4, 5, 9,}, В2 -={2,4, 5, 6, 10}, 53= C, 5, 6, 7, 11}, В4 ={4, 6,7, 8, 1}, fis ={5, 7,8,9, 2}, В6= {6, 8, 9, 10, 3}, fi7 ={7,9, 10, 11,4}, Въ ={%, 10, 11, 1,5}, Д9={9, 11, 1,2, 6}, Вю= {10, 1, 2, 3, 7}, ?„= [11, 2, 3, 4, 8}. В первых двух примерах каждая пара различных элементов i, j появляется точно в одном блоке, а в третьем примере — точно в двух блоках. В каждом из трех примеров блоки оди- одинакового объема; каждый элемент появляется одно и то же число раз, соответственно — три, четыре и пять. Эти блок-схемы являются частным случаем общей системы, называемой инцидентной системой. Определение. Инцидентная система S состоит из бло- блоков В\, В2, ..., Вь, элементов а.\, а2, ..., av и отношения инци-' дентности Oi^Bj для некоторых пар элементов at и блоков Bj. Если Oj^Bj, говорят, что о, принадлежит блоку Bj, или, что то же, блок В^ содержит элемент а,. Из этого весьма общего определения инцидентной системы можно выделить «экстремальные» случаи, когда каждый эле- элемент принадлежит каждому блоку или когда ни один элемент не принадлежит ни одному блоку. Но и в остальных случаях допустимо, чтобы два различных блока, например В{ и fi2, со- содержали в точности одни и те же элементы. Ввиду этого блоки не являются множествами элементов в строгом смысле. Если мы хотим дать определение инцидентной системы в терминах
Блок-схемы 205 теории множеств, то мы скажем, что блок Bj есть функция /(/) своего индекса /, принимающая в качестве значений подмноже- подмножества множества элементов а\, ..., av; но здесь нет необходимо- необходимости в такой терминологии. Из элементов аи а2, ..., а„ можно образовать подмножество, включая или не включая по очереди каждый из них. Таким образом, имея две возможности для каждого at, получим все- всего 2" возможных выборок, или 2" подмножеств, включая пу- пустое множество и множество, состоящее из всех о,-. Так как каждый из блоков Ви В2, ..., Вь может содержать любое из этих подмножеств, то существует Bv)b = 2vb различных инци- инцидентных систем из элементов ait а2, ..., av и блоков Ви В2, ... ..., Вь. Помимо того, что число таких систем весьма велико, по-видимому, нет представляющих интерес особых свойств не- неограниченных инцидентных систем. Блок-схема есть инцидентная система, в которой элементы размещены в блоки с некоторой равномерностью. Определение. У равное ешенной неполной блок-схемой -') называется инцидентная система из v элементов аи ..., а„ и b блоков Bit ..., Вь со следующими условиями: 1)-каждый блок Bj содержит одинаковое число k элементов; 2) каждый элемент а,- принадлежит одному и тому же числу г блоков; 3) для каждой неупорядоченной пары аи а^ различных эле- элементов число блоков, содержащих эту пару, равно К. В примере 1 имеем v = b = 7, & = r = 3, Х=\; в примере 2: и = 9, 6=12, г=4, 6 = 3, Х=1; в примере 3: v = b=l\, k = r = 5, К = 2. Если не оговорено противное, мы всюду в дальнейшем под термином блок-схема будем понимать уравновешенную не- неполную блок-схему. Между пятью параметрами блок-схемы легко установить следующие два соотношения: bk = vr, r(k — \) = l(v — \). A) Первое из них указывает на общее число инциденций at € Bjt подсчитанное двумя способами: имеется b блоков, каждый из которых содержит k элементов, и имеется v элементов, каждый из которых принадлежит г блокам. Для доказательства второго соотношения рассмотрим все пары, содержащие фиксированный элемент о4. Здесь Oi содержится в г блоках, в каждом из ко- которых образует пару с k— 1 другими элементами. Но с другой ') Употребляется также сокращение BIB-схема (от английского balan- balanced incomplete block design). — Прим.. перед.
206 Маршалл Холл стороны, d должен образовывать пары с каждым из остальных v — 1 элементов точно X раз. Из двух способов подсчета имеем Условия A) на параметры b, v, г, k, к необходимы для су- существования блок-схемы с этими параметрами; но, как будет показано позже, они не достаточны. В частности, v = b = 22, r = = k — 7, X = 2 удовлетворяют A), однако никакой схемы с этими параметрами не существует. Вопрос о существовании блок-схем с параметрами, удовлетворяющими A), до сих пор еще не по- получил ответа. Обратимся к латинским квадратам. Квадрат с п строками и п столбцами, в котором элементы а\, о2, ..., ап расположены таким образом, что каждый элемент появляется точно один раз в каждой строке и точно один раз в каждом столбце, назы- называется латинским квадратом1). В следующем примере даны три латинских DX4)-квадрата. Пример 4. Латинские квадраты: 1234 1234 1234 2143 3412 4321 3412 4321 2143 4321 2143 3412 Два латинских квадрата называются ортогональными, если их можно наложить один на другой так, что каждый элемент первого квадрата появится точно один раз с каждым элемен- элементом второго квадрата. Множество из г латинских квадратов называется ортогональным, если каждая пара латинских квад- квадратов ортогональна. Заметим, что квадраты из примера 4 обра- образуют ортогональное множество (говорят также, что эти квад- квадраты взаимно ортогональны). Ортогональность первых двух из них может быть показана наложением 1 2 3 4 1 3 4 2 2 1 4 3 2 4 3 1 3 4 1 2 3 1 2 4 4 3 ' 2 1 4 2 1 3 Ортогональные множества латинских квадратов могут быть рассмотрены как частично уравновешенные блок-схемы. В ча- частично уравновешенной блок-схеме каждый блок содержит одно и то же число элементов, а каждый элемент принадлежит од- 1) Порядка п. — Прим. перев.
Блок-схемы 207 ному и тому же числу блоков; но некоторые пары элементов принадлежат одному числу блоков, в то время как другие пары — другому числу блоков; можно даже задать несколько таких чисел для появления различных пар элементов в блок- схеме. Для множества из трех взаимно ортогональных латинских квадратов порядка п возьмем Ъп элементов: ги ..., гп, которые соответствуют п строкам; с\, ¦¦¦, сп, соответствующие п столб- столбцам, и fi, ..., fn; sb ..., sn; t\, ..., tn, соответствующие элемен- элементам первого, второго и третьего квадратов соответственно. Для каждой из п2 ячеек ') образуем блок из пяти элементов: ru Cj, fu, sv, tu, если число в г-й строке и у-м столбце есть fu из первого квадрата, sv из второго и tw — из третьего квадратов. Получим п2 блоков, каждый из которых содержит пять элемен- элементов, причем каждый элемент принадлежит п блокам. Тот факт, что два элемента одного и того же рода (г, с, f, s или t) не появляются вообще, выразим с помощью записи A.i = 0; а факт, что два элемента различного рода появляются вместе точно один раз, запишем так: ta=l. Легко видеть, что частично урав- уравновешенная блок-схема этого рода с b = n2, v = 5n, k = 5, r=n, Xi = 0, X2— 1 дает в свою очередь множество трех взаимно орто- ортогональных латинских квадратов. Этот метод, разумеется, мо- может быть распространен на любое число взаимно ортогональ- ортогональных латинских квадратов. Частично уравновешенная блок- схема, соответствующая примеру 4, состоит из 16 блоков по 5 элементов каждый. Она дана ниже. Пример 5. Частично уравновешенная блок-схема: B\ в2 Вг В, в5 г с f s t = {1,1,1,1,1}, = {1,2,2,2,2), = {1,3,3,3,3}, = {1,4,4,4,4}, = {2, 1,2,3,4], В1 в* вд В ю Вп г с \ s t = {2,3,4, 1,2], = {2,4,3,2,1), = {3,1,3,4,2), = {3,2,4,3,1}, = {3,3, 1,2,4], г ?12 = {3, 513 ={4, #14= {4, Я15 = {4, 5,6 = D, с f 4,2, 1,4, 2,3, 3,2, 4, 1, s 1, 2, 1, 4, 3, t 3}, 3}, 4], 1). 2]. fi6={2, 2, 1,4,3], В этом представлении латинских квадратов можно заме- заметить, что строки и столбцы играют роль элементов. 3. Применение блок-схем С появлением спутников естественно было ожидать, что в силу огромных расстояний прием сигналов окажется несовер- ') Наложения данных трех латинских квадратов. — Прим. перев.
208 Маршалл Холл шенным. По этой причине для передачи сигнала желательно использовать кодовые слова, настолько отличающиеся друг от друга, что присутствие умеренного числа ошибок все же мож- можно обнаружить и исправить. В примере 6 дается двоичный код1), исправляющий ошибки. Строки кода обладают тем свой- свойством, что никакие две из них не совпадают более чем в поло- половине позиций. Пример 6. Код, исправляющий ошибки (табл. 1). Строки в этой таблице можно использовать в качестве слов кода, исправляющего ошибки. Так как любые два кодовых Таблица 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 - 19 20 21 22 23 ( ( С ( ( С с ( с ( ( с с ) 1 1 1 0 0 1 0 0 0 1 1 1 0 ) 0 ) 0 ) 1 ) 1 ) 0 ) 1 ) 1 ) 1 ) 0 ) 0 0 1 2 ] 0 1 0 0 1 0 0 0 1 1 1 0 1 0 1 1 0 1 1 1 0 0 0 3 1 1 0 1 0 0 ( 1 ( 0 0 ( 0 ( 1 ( 1 0 ( 0 ( 1 ( 0 1 ( 1 0 1 ( 1 1 0 0 ( 1 5 1 1 1 1 1 1 ) 1 1 0 ) 1 ) 0 0 ) 1 ) 0 ) 0 1 0 ) 0 ) 0 ) 0 0 ) 1 0 1 ) 1 0 1 1 ) 1 столбца 6 1 0 ] 1 I 0 1 0 0 1 0 0 0 1 0 0 0 1 0 1 1 0 1 1 7 1 0 0 1 1 1 0 1 0 0 1 0 0 1 1 0 0 0 1 0 1 1 0 1 8 1 0 0 0 1 1 1 0 1 0 0 1 0 1 1 1 0 0 0 1 0 1 1 0 9 1 1 0 0 0 1 1 1 0 1 0 0 0 0 1 1 1 0 0 0 1 0 1 1 10 1 0 1 0 0 0 1 1 1 0 1 0 0 1 0 1 1 1 0 0 0 1 0 1 11 1 0 0 1 0 0 0 1 1 1 0 1 0 1 1 0 1 1 1 0 • 0 0 1 : 0 ') Термином «код» автор обозначает матрицу, строками которой яв- являются кодовые слова. — Прим. ред.
Блок-схемы 209 слова отличаются по меньшей мере в шести позициях, то от- отсюда следует, что, если некоторое слово принято самое боль- большее с двумя ошибками, можно однозначно восстановить истин- истинное кодовое слово. Другими словами, имея кодовое слово с дву- двумя искаженными позициями, мы не можем с помощью любых двух1) искажений получить новое кодовое слово. При наличии трех ошибок, вообще говоря, истинное слово невозможно восстановить однозначно. Например, 00000000101 1 отличается тремя позициями от 000000000000 и тремя позициями от 001000111011. Поэтому, хотя мы и можем обнаружить, что принятый сиг- сигнал ошибочен, мы не можем с уверенностью исправить его. Таким образом, этот код обнаруживает не более пяти ошибок, а исправляет не более двух. Код, приведенный в табл. 1, может быть построен из блок- схемы примера 3. Начальная строка его (нулевая) состоит це- целиком из единиц. Строки 1 —11 построены из блок-схемы при- примера 3 так: помещаем единицу в столбец с номером 0 и в те столбцы, номера которых соответствуют числам, находящимся в блоке с индексом, равным номеру строки. На всех остальных позициях помещены нули. Строки 12—23 являются дополнения- дополнениями первых 12 в том смысле, что в них нули стоят на месте единиц, и наоборот. Пусть дана блок-схема с параметрами v — b = \t—1, k = r = = 2t—1, X = t—1. Тогда любые два различных блока имеют точно K = t—1 общих элементов. (Это свойство доказано в п. 4.) Исходя из такой блок-схемы, можно построить код, исправляющий ошибки, составленный из 8/ слов длины 4/. Если элементы блок-схемы суть числа 1, ..., 4/—1, то пронумеруем столбцы числами 0, 1, ..., 4/—I2). Первая строка состоит це- целиком из единиц. Строки со 2-й по At построены из блоков Ви ..., B4«-i нашей схемы. В /-ю строку мы помещаем единицу в 0-й столбец и в те столбцы, номера которых являются эле- элементами блока В,_ь и нули — на остальные позиции. Проделаем это для / = 2, ..., 4/. Строки 4/+1, ..., 8/ яв- являются дополнением строк 1, ...,4t соответственно; т. е. мы ') В этой фразе всюду имеется в виду «не более двух». — Прим. ред, 2) Строки пронумерованы числами от 1 до 8/. — Прим. ред. 14 Зак. 909
210 Маршалл Холл заменяем элементы этих строк, помещая нуль на место единицы, и наоборот. Заметим, что каждая из строк 2, ..., At содержит единицы в 1+2^— \=2t позициях и нули в 2t позициях, таким образом каждая строка совпадает с первой строкой в 2t пози- позициях и отличается от нее в 2t позициях. Если i и / (]Ф1) принадлежат совокупности 2, ..., At, то соответствующие блоки имеют /—1 общих элементов, и, таким образом, строки W, и Wj обе имеют единицы в столбце с но- номером 0 и дополнительно в t—1 других столбцах. Следова- Следовательно, W{ и Wj обе содержат единицы точно в t позициях, причем Wi имеет / дополнительных единиц в позициях, где W} имеет нули, a Wj имеет t дополнительных единиц, где Wi имеет нули. Это имеет место для 3^ из At столбцов, а в t оставшихся столбцах и Wj и Wj имеют нули. Следовательно, Wt и W, совпа- совпадают в 2t позициях и отличаются также в 2t местах. Так как Wit+i, ..., W8t суть дополнения первых At строк, то любые две из них также совпадают в одной половине позиций и разли- различаются в другой половине позиций. Относительно строки Wi из верхней половины и строки W} из нижней половины кода можно сказать, что если Wj есть до- дополнение для Wi, то они различаются во всех At позициях. Если строка Wj не является дополнением строки Wt, то Wj совпадает с Wi в тех 2t позициях, где соответствующие им дополнения различаются, и различаются в тех 2t позициях, где их допол- дополнения совпадают. Код, построенный таким способом, будет ис- исправлять до t— 1 ошибок. Таким образом, если слово W,- иска- искажено не более чем в t—1 позициях, то, сделав не более t—1 замен, получим истинное кодовое слово, или слова, отличаю- отличающиеся от него не более чем 2t — 2 позициями, и, следова- следовательно, не получим нового кодового слова, так как любые два кодовых слова различаются по меньшей мере в 2t позициях. Важной областью приложения блок-схем являются схемы планирования эксперимента в статистических исследованиях. Наиболее полно можно познакомиться с этим предметом по книге Манна [20]. Применение латинских квадратов и блок- схем исключает нежелательные эффекты в статистическом ис- исследовании и позволяет анализировать те из величин, которые представляют наибольший интерес. Например, если требуется проверить урожай от m сортов пшеницы, то желательно исклю- исключить изменения урожайности в пределах данного участка. Это- Этого можно достигнуть разбиением участка на т2 секций и высеи- высеиванием пшеницы так, чтобы каждый сорт был использован ровно один раз в каждой строке и ровно один раз в каждом столбце соответствующего разбиения участка. Таким образом, основ- основной схемой для этого эксперимента является латинский квад-
Блок-схемы 211 рат порядка т. Можно также попытаться проверить действие т видов удобрений на этих сортах пшеницы. Здесь мы стре- стремимся использовать латинский квадрат для удобрений, пред- предполагая, что каждый вид удобрения применяется ровно один раз к каждому сорту. С пятью сортами пшеницы ut, ..., vb и пятью видами удобрения ft, ..., f5 необходимо два ортогональных ла- латинских квадрата порядка 5. Следующие ортогональные ква- квадраты удовлетворяют этому требованию. Пример 7. Ортогональные латинские квадраты порядка 5: fifi v2f2 v3f3 1L/4 ^sfs ^4/2 ^5/3 ^1/4 ^2/5 ^3/1 Если необходимо проверить относительно большое число сортов, можно вести эксперимент, высеивая на несколько участ- участков и допуская, что урожайность на каждом отдельном участке постоянная. Если предназначить v сортов для Ь участков, то, распределяя сорта по участкам в соответствии с уравновешен- уравновешенной неполной блок-схемой, можно провести статистическое ис- исследование урожая, который не зависит от плодородия различ- различных участков. В качестве иллюстрации здесь может служить любой из примеров 1—5. Иногда блок-схемы с дополнительными ограничениями ис- используются при специальных испытаниях. Предположим, что требуется исследовать различные виды зубной пасты, давая на пробу каждому из нескольких дегустаторов несколько марок пасты. Тюбики, получаемые каждым из дегустаторов, отличаются цветом. Желательно, чтобы: 1) каждый дегустатор получил одно и то же число марок пасты, 2) каждая марка пасты была использована одним и тем же числом дегустаторов, 3) каждые две марки пасты срав- сравнивались дегустатором одно и то же число раз, 4) каждая марка пасты была окрашена каждым цветом одно и то же число раз, чтобы никакой цвет не оказал влияние на принятие решения. Первые три требования могут быть удовлетворены исполь- использованием блок-схемы для определения распределения марок пасты между дегустаторами, четвертое требование представляет собой дополнительное ограничение. Пусть имеется тринадцать марок пасты, обозначенные чис- числами 0, 1, ..., 12 и тринадцать дегустаторов, обозначенных буквами А, В, ..., М. Тогда мы можем дать каждому дегуста- 14*
212 Маршалл Холл тору по четыре марки, следя за тем, чтобы каждая марка ис- использовалась четырьмя дегустаторами, а каждые две марки сравнивались одним дегустатором, используя при этом блок- схему с параметрами v = b=l3, r = k=4, K=\. Кроме того, мы можем условиться, что каждая используе- используемая марка имеется точно в одном тюбике каждого цвета: крас- красного, белого, голубого и зеленого. Номер марки пасты ставится под названием цвета и против буквы, обозначающей дегуста- дегустатора. Пример 8. Распределение различных марок зубной пасты в цветных тюбиках. (Описано на стр. 209—210 и показано на табл. 2.) Таблица 2 Дегустатор А В с D Е F О N I J К L М красный 0 1 2 3 4 5 6 7 8 9 10 11 12 Цвет белый 1 2 3 4 5 6 7 8 9 10 11 12 0 тюбика голубой 3 4 5 6 7 8 9 10 11 12 0 1 2 зеленый 9 10 11 12 0 1 2 3 4 5 6 7 8 Мы видим, что циклическая структура блоков позволяет осу-, ществить раскраску. Схемы примеров 1 и 3 также циклические. 4. Общая теория блок-схем Свойства блок-схем можно описывать в терминах матриц и в терминах квадратичных форм. Это весьма плодотворно для развития теории блок-схем, так как и матрицы, и квадратичные формы достаточно широко изучены. Любую инцидентную систему S (и, в частности, любую блок- схему) можно задать при помощи матрицы инциденций. Определение. Если S — инцидентная система, состоящая из блоков В[, ..., Вь и элементов а.\, .,,, а„, то матрица инци-
Блок-схемы 213 денций M=(mi}), где i= I, ..., v и /=1 fr, системы S опре- определяется соотношением Вспомним, что если блок-схема D имеет параметры v, b, r, k, %, то выполняются два соотношения A): bk = vr, r(ft —l) = A,(z> —1). Может случиться, что Ь = о и, следовательно, r—k. Назовем такую схему симметричной; тогда первое из соотношений A) обращается в тождество, а второе сводится к следующему: k(k — l) = A,(z> — 1). B) Исключим из рассмотрения тривиальный случай, когда k = v, т. е. случай, когда каждый блок содержит все элементы. Пусть A = (a,j), где i=l,... , v и /=1,... , Ь, есть матрица инциденций блок-схемы D. Тогда покажем, что , C) где Ат — транспонированная матрица А, I — единичная () матрица, а /—(иХ^)-матрица, все элементы которой еди- единицы. Для доказательства заметим, что если ААТ = В= (bst), где s, /s=l, ... , v, то bst есть скалярное произведение s-й и /-й строк матрицы А. Так как каждый элемент матрицы А является либо нулем, либо единицей, то скалярное произведение строки на себя равно числу единиц в строке. Следовательно, bss = r для s=l,... ..., v, так как каждый элемент в D появляется ровно в г блоках, а строка матрицы указывает появление элемента в различных блоках. Аналогично если s Ф t, то bst есть скалярное произве- произведение различных строк матрицы А, и bst равно числу столбцов, в которых обе строки имеют единицу. Но это равно числу бло- блоков, в которых появляются оба элемента. По определению это есть параметр К, и, следовательно, bst = X для s=??. Таким образом, в матрице B=(bst) имеем bss = r, bst-='k для s ф t. Соотношение C) доказано. Мы уже использовали тот факт, что каждая строка мат- матрицы А содержит единицы ровно в г столбцах. Верно также и то, что каждый столбец матрицы А содержит единицы ровно в k строках, так как столбец указывает элементы, содержащиеся в отдельном блоке. Все эти факты можно выразить в терминах
214 Маршалл Холл матриц. Пусть 1ьь, Jw и Jvb — матрицы, состоящие целиком из единиц, а их индексы указывают на число строк и столбцов соответственно. Так как А есть {vXb)-матрица, то выполняются соотношения Первое из этих соотношений указывает на то, что 1 появ- появляется ровно г раз в каждой строке матрицы А, а второе — что единица появляется ровно k раз в каждом столбце матрицы А. Матрица инциденций, соответствующая блок-схеме приме- примера 1 из семи элементов 1, ..., 7 и семи блоков Ви ..., б7, имеет вид 1 0 0 0 1 0 1 - 110 0 0 10 0 110 0 0 1 10 110 0 0 0 10 110 0 0 0 10 110 _0 0 0 1 0 1 1. Здесь третья строка показывает, что элемент 3 появляется в блоках В2, В3, Вт, а пятый столбец показывает, что блок б5 содержит элементы 1, 5, 6. Для этой матрицы можем проверить непосредственно, что где во всех равенствах / есть GX7)-матрица. Можно описать блок-схему D и в терминах квадратичных форм. Пусть Х\,.,. , х„ — неизвестные, соответствующие эле- элементам. Тогда, если А=(а.ц) есть матрица инциденций схе- схемы D, можно записать i = 2 ai t-i j—\, 2, ..., b. Здесь Lj соответствует блоку fij и является суммой неизвест- неизвестных, соответствующих элементам, принадлежащим блоку Bj. Тогда имеем .. +*„)'. D) Заметим, что в L\-\- ... +Z.| коэффициент при x2t равен числу появлений х,- в формах L, т. е. г, так как это соответствует
Блок-схемы 215 числу появлений элемента at в блоках. Аналогично смешанное произведение 2x,Xj возникает всякий раз, когда L содержит и хг и Xj с коэффициентом 1, а это случается X раз для каждой пары xit Xj. Следовательно, в L\-{-. . .-\-L\ член х*х,- появ- появляется с коэффициентом 2Х. Таким образом, коэффициенты при всех членах совпадают, и тождество D) доказано. Разумеется, матричное соотношение C) и квадратичное тождество D) рав- равносильны. Обратимся теперь к выводу свойств блок-схем из матрич- матричного соотношения C) и квадратичного тождества D). Вычис- Вычислим определитель матрицы В X ... X' г ... X \К X ... г, получим det? = [r + (ii — \)Ц{г — %?-\ E) В этом легко убедиться, вычитая первый столбец в В из всех остальных столбцов и прибавив затем вторую, третью и все остальные строки к первой строке. В результате матрица принимает треугольный вид, причем в левом верхнем углу стоит число r+(v—\)К, а на всех остальных местах главной диагонали стоят числа, равные г — К. Таким образом, равен- равенство E) доказано. Теорема 1. В любой блок-схеме выполняется неравенство b^-v. Если в симметричной блок-схеме v четно, то к —К есть квадрат. Доказательство. Если г=Х, то каждый раз элемент появляется с каждым из остальных. Это означает, что каждый блок содержит каждый элемент, — случай, исключенный нами. Следовательно, мы имеем г>А, и det В Ф 0. Так как ранг В не может превосходить ранга А, то Ъ > v, что и доказывает пер- первое утверждение теоремы. Это же можно доказать и по-другому. Если b<v, то можно добавить к матрице A (v — b) столбцов, состоящих из нулей, и получить квадратную матрицу А\. Тогда, как легко проверить, А\АТ\=ААТ = В. Но в таком случае det B= (det A\J, а так как Ai имеет столбец, целиком состоящий из нулей, то deMi = 0, что противоречит условию det 5=^0. Следовательно, допущение b<v неверно, и i^o,
216 Маршалл Холл Для второй части теоремы заметим, что А есть квадратная матрица и det В = (det Af = [k-\-(v — 1) X] (Л — Я.)'. Для симметричной схемы основное соотношение k(k—1) = = K(v—1) дает k+ (v — l)X=k2, и мы получаем (det ЛJ = #(? —Я,). Следовательно, (k — K)v~[ есть квадрат, и если v четно, то k—Я должно быть квадратом. Этим доказана вторая часть теоремы. В 1949 г. Брук и Райзер [8] заметили, что если тождество [4] выполняется для линейных форм L с коэффициентами 0 и 1, го оно должно выполняться и для линейных форм L с рацио- рациональными коэффициентами. Для симметричных блок-схем это соответствует рациональ- рациональной эквивалентности двух квадратичных форм, на вопрос о ко- которой может быть дан ответ применением общей теории, при- принадлежащей Хассе и Минковскому. Это — довольно сильная теория, использующая символ норм-вычета Гильберта. Здесь же мы дадим более простой вывод этого результата, как это сделано у Човла и Райзер а [9]. Прежде всего напишем тождество где ух = Ьххх — Ь2х.2 — У2 = Mi -f- brx2 — Ь4хя + b3x4, У4 = Mi — hx2 -f b2x3 -f bxx4. Оно может быть проверено непосредственно. Если b\, b2, b3, bi — рациональные числа, мы можем разрешить равенство G)' относительно xh выразив их через у* ('—1, 2, 3, 4), при этом знаменателем будет число (b\-\- b\-\- йз4 blf- Используя это тождество, Лагранж показал, что всякое по- положительное целое число п может быть представлено в виде n = b\-\-bl + bl + bl (8) где Ь{ — целые числа (i=\, 2, 3, 4). Для доказательства отсы- отсылаем читателя к работе [18]1). ') На русском языке можно рекомендовать книгу: И. В. Арнольд, Теория чисел, Госучпедгиз, 1939. — Прим. перев.
Блок-схемы 217 Для симметричной блок-схемы тождество D) принимает вид = (к-Щх\+ ... + 4L-^(^4- ¦¦¦ +^J- (9) Запишем k — Х = п и рассмотрим случаи, когда v нечетно. Пусть сначала у= 1 (mod4). Используя представление (8), можно применить тождество F) к правой части равенства (9), беря одновременно по четыре члена. Тогда получим Если мы напишем yv = xv и представим L\,... , Lv и х{+ ... +xv = w в виде линейных форм от г/,- (t=l, 2,... , v), то равенство A0) обратится в рациональное тождество отно- относительно у{ (i=l, 2,... , v), Ц+ ... +L% = y\+ ... +y\.l + nyl^rKw\ A1) Теперь мы имеем Ll = Cuyl + Cl2y2 + - ¦ - + Clvyv, где Си (/=1, 2,... , у)—рациональные числа. Если СиФ\, то поло- положим Lx — yXy а если Сц = 1, то положим L{= — г/ь В любом слу- случае мы можем выразить ух рациональным образом через г/2, ¦ • • ...,yv, и получим ?^ = i/J. Тогда равенство A1) принимает вид ц+ ... +/:| = ^+ •¦• +Ci + ^ + ^2> т. е. становится тождеством от независимых переменных г/2, ..., yv- Аналогично мы можем поочередно положить ^2 = = ±уг, ?з= ±г/з, ..., Lv^= ±yv-i и в итоге получим где Lv и w — некоторые рациональные выражения переменного yv. Взяв уь = хФ0 как общее кратное знаменателей в L, и ш, мы получим следующее выражение в целых числах с хФО: z2 = nx2 + ly2. A2) Рассуждая аналогичным образом в случае u=3(mod4), возьмем новое неизвестное хи+1 и, прибавив nx'2v+l к обеим ча- частям равенства (9), получим Используя тождество F), придем к равенству
218 Маршалл Холл и, продолжая описанным выше способом, найдем решение в це- целых числах с хФО уравнения ПХ* = г2+Ку2. A3) Комбинируя A2) и A3) для нечетного v, получаем г* = пх* + {— 1) 2 Ку2. Полученный результат можно теперь сформулировать в од- одной теореме. Теорема 2. Если существует симметричная блок-схема D с параметрами v, k, К, то необходимо, чтобы: а) для v четного k — % было квадратом, б) для v нечетного уравнение р-1 имело решение в целых числах х, у, z с хФО. При помощи теории Хассе — Минковского можно показать, что условия теоремы 2 являются, кроме того, достаточными для существования рациональной матрицы А со свойством C) или для существования линейных форм Ц, . .. , Lv, удовлетворяю- удовлетворяющих равенству (9). Короче говоря, теорема 2 дает по существу полную информацию о блок-схемах, которая может быть полу- получена из рассмотрения только рациональных полей1). Следующая теорема, принадлежащая Райзеру [25], показы- показывает, что некоторые из свойств симметричных блок-схем яв- являются чисто матричными свойствами. Теорема 3. Пусть А — невырожденная вещественная Xv)-матрица, удовлетворяющая либо равенству { ) + , A4) либо равенству ATA (k l)I + U 1 A5) и, кроме того, либо AJ = kJ, A6) либо , JA = kJ. 'A7) ') Напомним, что речь в статье идет только об уравновешенных непол- неполных блок-схемах. — Прим. перев.
Блок-схемы 219 Тогда А удовлетворяет всем четырем соотношениям, a v, k, К удовлетворяют уравнению Доказательство. Так как detB [ ()]( — ЯI', то невырожденность матрицы А означает, что k — км k + K(v— 1) отличны от нуля. Предположим сначала, что выполняются соотношения A4) и A6). Умножив A6) слева на /И, мы получим 1 = кА~Ч, и по- поскольку k Ф О, то A-lJ = k-4. Теперь умножим A4) слева на Л, тогда . A8) Транспонируя матрицы в A6) и замечая, что У = У, имеем JA —kJ. Умножение соотношения A8) слева на / дает так как J2 = vJ. И мы получаем JA =-i—j—j—-J = mJ, A9) где m — постоянная. Таким образом, J = mJA, и, следовательно, vJ = У2 = (mJA) J = mJ (AJ) = mJ (kJ) = mkP = mkvJ. Отсюда заключаем, что mk=l, и потому m = k~x. Теперь подстановка m = k~x в A9) и сравнение постоянных дают k~1(k — l) = k — k~lvX, откуда следует справедливость уравнения теоремы ?2 — k = X(v — 1). Далее из A9) при m = k~l и jA~1 = k-lJ получаем JA = kJ, B0) т. е. соотношение A7). Умножая теперь A8) справа на Л и при- применяя B0), приходим к соотношению т. е. к соотношению A5). Итак, мы показали, что соотношения A4) и A6) влекут остальные соотношения A5), A7) и k2 — k = X(v — 1),
220 Маршалл Холл Пусть теперь выполняются A4) и A7). Тогда имеем' J(AAT) = (k — X)J + XJ2, kJAr = (k — X)J-+-lvJ = mJ, где m = kJ{ATJ) = k2J2 = и, следовательно, № = т — к — X+Xv, откуда вытекает соотноше- соотношение k2 — k = X(v—1). Кроме того, отсюда следует, что kJAT = = k2J. Из A7) мы заключаем, что кФО, так как матрица А не- вырожденна. Таким образом, имеем JAT = kJ и, транспонируя, получаем AJ = kJ, т. е. соотношение A6). Далее = {k — 'k)I + A-xXJA. B1) Так как AJ = kJ = JA, то отсюда следует, что А~ЧА=1, и B1) принимает вид т. е. вид соотношения A5), что и требовалось доказать. Таким образом, A4) и A7) также влекут остальные равен- равенства. Взяв АТ вместо Л, мы тем же способом сможем доказать, что A5) и либо A6), либо A7) также влекут за собой выпол- выполнение остальных соотношений. Теорема доказана. На основании первоначального определения блок-схемы легко заключить, что матрица инциденций симметричной блок-схемы с параметрами и, k, X удовлетворяет соотношениям A4), A6) и A7). Теорема 3 показывает, что соотношение A5) также удо- удовлетворяется. Следовательно, Ат есть снова матрица инциден- инциденций симметричной схемы с параметрами v, k, X, двойственная первоначальной в том смысле, что роли элементов и блоков пе- переменились. Это доказывает утверждение, сделанное в разд. 2, о том, что любые два блока симметричной схемы имеют ровно X общих элементов. Доказанное свойство симметричной схемы позволяет строить две несимметричные схемы из симметричной схемы. Если Si, ..., Bv — блоки симметричной схемы D, то выберем любой блок, например Bv, и вычеркнем из блоков Ви ..., Б„_4 X эле- элементов, общих с блоком Bv. Новые блокиВи ..., Bv-\z остав- оставшимися элементами образуют блок-схему D*, называемую оста-
Блок-схемы 221 точной, параметры которой b\, vi, k\, n и A-i связаны с парамет* рами b = v, r = k и % схемы D соотношениями D": b} = v — \, vl = v — k, rx = k, kx = k — l, Kx = %. B2) Эти соотношения непосредственно следуют из того, что в ка- каждом из блоков fli, . . . , б„_1 вычеркнуто точно по К элементов и что v — k элементов, не содержащихся в Bv, не меняют число своих появлений в блоках В\, .. ., б„_1. Можно образовать так- также производную схему D', взяв блоки В и ..., B'v-\, имеющие каждый К элементов, общих между Bv и fii, ..., 5,,_i соответ- соответственно. Эта блок-схема имеет параметры Ь2. ^2, тч, k2, %%, Пример 9. Построение несимметричных схем из симметрич- симметричных. Проиллюстрируем описанное выше построение на примере, Таблица 3 1 1 1 3 3 3 1 1 1 2 2 2 1 1 1 2 2 2 5 5 5 7 6 6 2 2 2 4 4 4 4 4 4 3 3 3 3 3 3 4 4 4 6 7 8 8 8 7 Остаточная схема 5 9 7 7 11 5 5 9 6 6 10 5 5 9 6 6 10 5 9 9 9 11 10 10 6 10 8 8 12 6 8 12 7 7 11 8 7 11 8 8 12 7 10 11 12 12 12 11 11 15 13 9 13 15 10 14 13 9 13 14 10 14 13 9 13 14 13 13 13 15 14 14 12 16 14 10 14 16 И 15 16 12 16 15 12 16 15 11 15 16 14 15 16 16 16 15 Производная схема 17 17 17 17 17 17 19 19 19 19 19 19 18 18 18 18 18 18 17 20 23 17 20 23 20 21 22 20 21 22 22 20 21 22 21 21 21 22 20 21 22 20 18 21 24 18 21 24 23 25 24 23 25 24 25 24 23 25 24 23 24 23 25 24 23 25 19 22 25 19 22 25
222 Маршалл Холл принадлежащем Бхаттачария [3], для t> = 6 = 25, k = r=9, K = 3. Здесь #25 состоит из элементов 17, .... 25; D* — блок-схема из 24 блоков, в которых элементы суть числа 1, ..., 16, a D' — схема из 24 блоков, в которой элементы суть числа 17, ..., 25. Обе схемы показаны в табл. 3. Блок-схемы D* находятся слева от вертикальной линии, а блок-схемы D' — справа; D* имеет па- параметры 6i = 24, t4=16, n = 9, &i = 6, Xi = 3; D' имеет параметры fo24 9 8 fe 3 Я 2 Пример 10. Блок-схема с параметрами остаточной схемы, но не являющаяся остаточной. Характер производной и остаточной блок-схем, получаемых из схемы D, зависит от того, какой блок взят в качестве Bv, из которого будут вычеркнуты элементы. Различные остаточные и производные схемы, получаемые из D вычеркиванием различных блоков, не обязаны быть изоморф- изоморфными. Бхаттачария [2] нашел пример схемы с параметрами оста- остаточной схемы, которая не является остаточной ни для какой симметричной схемы. Эта блок-схема с параметрами 6=24, v = = 16, г=9, & = 6, Я = 3 показана в табл. 4. Таблица 4 блока 1 2 3 4 5 6 7 8 9 10 11 12 1 3 2 3 1 2 3 3 4 2 3 1 Содержание 2 5 3 5 б 5 4 4 5 4 б 2 7 7 8 8 7 7 7 б 7 9 7 3 8 8 9 9 9 10 10 13 9 10 10 4 блока 14 11 13 12 12 13 12 14 12 11 11 5 15 13 16 14 13 15 16 15 15 13 14 6 блока 13 14 15 16 17 18 19 20 21 22 23 24 1 2 5 1 1 2 1 2 1 4 1 11 Содержг 4 4 6 6 2 6 4 5 3 6 5 12 7 8 8 8 3 7 5 6 9 8 9 13 нне 8 10 10 10 11 9 13 11 10 9 10 14 блока п 12 15 12 12 14 14 12 15 11 11 15 16 14 16 13 15 16 16 16 16 15 14 16 Здесь два блока {1, 6, 7, 9, 12, 13} и {1, 6, 8, 10, 12, 13} имеют четыре общих элемента. Следовательно, для этой схемы не су- существует производной схемы некоторой симметричной блок-схе- блок-схемы с параметрами v — b = 25, r=& = 9, Я = 3, в такой симметрич- симметричной схеме любые два различных блока имеют ровно три общих элемента. Если, однако, К=\ или К = 2, то блок-схема с параметрами, данными в B2), всегда является остаточной схемой единствен-
Блок-схемы 223 ной симметричной схемы. Для К=1 это по существу означает, что аффинная евклидова плоскость может быть расширена до проективной плоскости') добавлением бесконечно удаленной прямой, и доказательство этого достаточно просто. Но для Х = 2 ситуация в значительной степени усложняется. Доказательство в этом случае было дано Коннором и Холлом [11], которые ис- использовали условия, первоначально разработанные Коннором [10], — необходимые' условия на блоки Ви ..., Bt, чтобы они являлись частью схемы с блоками Ви .. ., Вь, Это доказатель- доказательство отчасти опирается на тот факт, что для Я=1 или 2 произ- производная схема тривиальна. 5. Построение блок-схем и ортогональных латинских квадратов Методы, используемые при построении блок-схем, столь раз- разнообразны, что невольно напрашивается мысль объединить их все в одну категорию «смешанных». Тем не менее можно выде- выделить три общие категории, которые будут описаны здесь, как-то: 1) рекурсивные методы, 2) теоретико-числовые методы и 3) тео- теоретико-групповые методы. Рекурсивные методы Существует несколько методов построения блок-схем, кото- которые весьма неточно могут быть названы рекурсивными мето- методами. Во-первых, это — метод композиции, при котором некото- некоторая комбинация двух схем Di и Di дает третью схему Бз. Блок-схема с k = 3, К—1 называется системой троек Штей- нера. Из основных соотношений A) находим и, следовательно, v=2r+\, 3b = rBr+\). Таким образом, в случае системы троек Штейнера v нечетно и либо г, либо 2г+1 кратно 3. Комбинируя эти условия, имеем, что либо v = 6t+l (если r = 3t), либо v = 6t + 3 [если 2г+1 = •=3B*+1)]. Следовательно, для троек Штейнера имеем либо , r = 3t, k = 3, X = \, B3) либо r = 3/-fl, k = 3, Л=1. B4) ') Имеются в виду конечные аффинная и проективная плоскости,— Прим. ред.
224 Маршалл Холл Верно и обратное: для любого числа v вида 6^+1 или 6^ + 3 существует система троек Штейнера с v элементами и парамет- параметрами, данными в B3) или B4). Из системы троек Штейнера S с v элементами можно построить мультипликативную систему М для v элементов системы S, полагая х2 = х для каждого х и ху= = г, если хфу и если х, у, г — единственная тройка из S, содер- содержащая пару х, у. Эта схема М может быть описана следую- следующим образом: 1) х2 — х для каждого х?М; 2) если хфу, то xy = z — единственный элемент в М и гфх, гфу, а также yx = z, xz = zx = y, yz = zy = x. Легко можно проверить, что если дана система М с умноже- умножением, удовлетворяющим A) и B), то тройки х, у, z, определен- определенные соотношением хфу, xy = z, образуют систему троек Штей- Штейнера с числом элементов, равным числу элементов в М. Если Mi — мультипликативная система для системы троек Штейнера Si с vi элементами, а Мг — мультипликативная си- система для S2 с V2 элементами, то можно построить систему М = = MiXM2, в которой элементами являются v\vz упорядоченных пар (xi,xz), xi^Mi, хг^Мг. Если определить операцию умноже- умножения в М по правилу 0*1. x2)(yv y2) = (xlyv х2у2), то отсюда немедленно следует, что умножение в М — М1ХМ2 об- обладает свойствами A) и B), и, следовательно, из М можно об- образовать систему троек Штейнера с v — vivt элементами. Таким образом, если существует система троек Штейнера Si с vi эле- элементами и другая система троек Штейнера 5г с vi элементами, то существует система троек Штейнера 5 = SiX52 с fit>2 элемен- элементами. Читатель может проверить, что тривиальная система троек Штейнера Si с тремя элементами 1, 2, 3 и единственной трой- тройкой 1, 2, 3 такова, что SiXS2 есть система S с 9 элементами, данная в примере 2. Отметим, что в системах B3) и B4) под- подсистемы с фиксированным х\ или хг соответствуют подсистемам системы S, изоморфным S2 и Si соответственно. Более сложное рекурсивное построение для систем троек Штейнера принадлежит Муру [21]. Оно содержится в следую- следующей теореме. Теорема 4. Если Si — система троек Штейнера, построен- построенная для V2 элементов, если S2 содержит подсистему троек Штей- Штейнера S3 с v3 элементами и если S4 — также система троек Штей- Штейнера с числом элементов ui>l, го можно построить систему троек Штейнера S с числом элементов v = vs + vi(v2 — уз), та- такую, что S имеет подсистемы, изоморфные S4, S2 и S3.
Блок-схемы 225 Доказательство. Здесь мы рассматриваем систему S3 с одним элементом х, не имеющую ни одной тройки как систему, удовлетворяющую нашим требованиям. Таким образом, из=1 допустимо для всякой системы S2 с v2>l. Построим таблицу из y = f3+ui(u2 — из) элементов, расположив их в виде vi+\ мно- множеств / q'. <Х\, . . . , Clv3, 1- Ьп, . . ., bls, Т2: Ь21, ..., b2s, B5) TVl: bVlu ..., bVlS, S — V2 — V3. Все vz+v\(vi — и3) элементов в B5) различны. Образуем тройки из этих элементов по следующим трем правилам: 1) элементам множества То поставим во взаимно однознач- однозначное соответствие элементы системы, имеющей v3 элементов, и будем брать в качестве тройки новой системы S тройку (а,, а,, ah), если (/, /, k) есть тройка в S3; 2) элементам множества ToU7\-, где 7\ — любое множество из B5), i=l, . . ., vi, поставим во взаимно однозначное соответ- соответствие элементы системы порядка V2, при этом множество Го со- соответствует подсистеме из v3 элементов. Тройки из ai} i=\, ... .. ., из уже определены правилом 1); другие тройки содержат не более одного a* (i = l, ..., из) '). и мы образуем тройки вида (am, bij, bjh) или (bij, bih, bir), согласно установленному соответ- соответствию с системой S2, имеющей v2 элементов2); 3) если (/, k, r) есть тройка системы, имеющей vi элементов, образуем все возможные тройки вида (bjx, bhy, brz), в которых вторые индексы удовлетворяют соотношению х + У Ч- z -==5 0 (mod s). Все тройки, образованные по этим трем правилам и взятые в совокупности, дают систему троек Штейнера S с v = v3 + + V\(v2 — V3) элементами. Можно доказать существование си- систем S всех порядков v = 6t+\ или v = 6t+3, используя несколько частных случаев этого правила. Заметим, что система S, по- построенная этим путем, имеет подсистемы, изоморфные системам Si, S2, S3. ') Если тройка содержит пару а,-, а,, то она в силу определения системы троек Штейнера неминуемо содержит и третье — а^. — Прим. перев. 2) То есть, если тройки (т, /, k) и (/, k, r) соответственно являются тройками системы S2. — Прим. перев. 15 Зак. 909
226 Маршалл Холл Рассмотрим пять частных случаев общей теоремы: a) vY = t, x>2 = 3, v3=l, v = 2t+l, *> : Ь) ¦у1 = 3, v2 = t, v3=l, v = 3t~2, *> с) 1^ = 3, v2 = t, v3 = 3, v = 3t— 6, t^> e) ^ = 3, z>2 = /, ^3 = 7, v = 3/ — 14, t > 15. В случае е) необходимо, чтобы система порядка vi содер- содержала подсистему порядка 7. Эти правила, если они применимы, позволяют строить другие системы троек Штейнера, указанные в табл. 5. Таблица 5 Вид для v 36*+ 1 Збй + 3 36*+7 36*+ 9 36* -f13 36* +15 Правило (Ь) (а) (а) («0 («> (а) Значение / 12*+ 1 18*+ 1 18* + 3 6*+1 12*+ 9 18*+ 7 ' Вид для v 36*-j~19 36*+ 21 36* -+25 36*+ 27 36*+ 31 36*+ 33 Правило (») (d) (») (а) (а) (с) Значение 1 12*+ 7 6* + 3 12*+ 9 18*+13 18*+15 12*+ 3 Примеры 1 и 2 дают системы SG) и S(9) порядков 7 и 9 со- соответственно. Мы должны, кроме того, построить систему 5A3) (существуют две неизоморфные системы порядка 13). Если мы образуем систему 5B1) как прямое произведение систем 5C) и 5G) и построим системы 5B5), 5C3) и 5C7), содержащие в качестве подсистемы 5G), то данные выше правила оказы- оказываются достаточными для построения систем троек Штейнера S(v) всех порядков v=^6t+l или v = 6t + 3; кроме того, для у^15 система S(v) всегда содержит 5G) —что является необ- необходимым условием всякий раз, когда мы пользуемся прави- правилом е). Можно избежать трудоемкого построения систем 5B5), 5B7), 5C3) и 5C7) с подсистемой 5G), если воспользоваться композицией или правилами теоремы для построения систем 5(и), таких, чтобы всякий раз, когда это возможно, S(v) содер- содержала бы 5G). После небольших подсчетов мы обнаружим, что системы 5 (и) с подсистемой 5G) существуют для всех v, исключая
Блок-схемы 227 о=1, 3, 9, 13, 25, 27, 33, 37, 67, 69, 75, 81, 97, 109, 139, 201, 289, 321, 643. Мы должны применять теорему по-разному всякий раз, когда / находится в этом перечне, a v нет. Например, табл. 5 дает 85 = 3-33.—14 по правилу е), которое мы не можем приме- применить, если система SC3) не имеет подсистемы SG). Так, значе- значения, полученные для ^ = 643 по соответствующим правилам, суть 2/ + 1 =1287 = 3-429, 3/ —14=1915=1+319G—1), 3/ —6 =1923=1+2-961, ; B6) St—2 =1927 = 1 + 321G—1), 6/ + 3 =3861 =3- 1287. Другие выражения для v дают другой путь нахождения си- системы S(v), содержащей SG). Это и доказывает, что сущест- существуют системы троек Штейнера всех порядков v = 6t+\, 6t + 3. Первоначальное доказательство этого факта было дано М. Рис- сом [24]; его доказательство основывалось на рекурсивном ме- методе перехода от системы S(v) к системам SBt> + 1) или SBv — 5) путем точного перечня троек, вычеркивания и добав- добавления троек в S(v), пока не получалась требуемая система. Позднее рекурсивные методы были использованы Ханани [17]. Матрицей Адамара Н порядка п называется матрица, эле- элементы которой суть +1 и —1 и для которой справедливо ра- равенство ННТ = л/. B7) Матричное соотношение B7) эквивалентно утверждению, что любые две строки матрицы Н ортогональны. Очевидно, переста- перестановка строк и столбцов матрицы Н, а также умножение строки или столбца матрицы Н на —1 не нарушают свойства B7), и потому матрицы, полученные после указанных преобразований, считаются эквивалентными матрице Н. Поскольку мы можем заменить матрицу Н на эквивалентную ей матрицу, то можно допустить, что матрица Н нормализована, т. е. ее первая строка и первый столбец целиком состоят из +1. Пусть п^-3 и Я — нормализованная матрица Адамара порядка п. Рассмотрим для первых трех строк столбцы вида  - 1 1 - 1" 1 1 ' 1 ~ 1 1 " 1 ] 1 15*
228 Маршалл Холл и предположим, что существуют х, у, z, w столбцов этих типов соответственно. Тогда имеем x-\-y-\-z-\-w = n, x — y-\-z — w = 0, Первое уравнение указывает, что имеется п столбцов, второе и третье выражают ортогональность первой строки со второй и третьей строкой соответственно, а последнее уравнение выра- выражает ортогональность второй и третьей строк. Из этих уравне- уравнений находим, что л — у — &—ш—¦ ^. ^о^ . Следовательно, если Н есть матрица Адамара порядка п>2, то п кратно 4. Нетрудно написать матрицы Адамара порядков 1 и 2: 1 1 1 1 -lj- B9) Пусть Н — матрица Адамара порядка n = 4t. Предположим, что Н нормализована, и пронумеруем строки и столбцы числами О, 1, .. ., At — 1. Исходя из i-й строки, i— 1, ..., At — 1, построим инцидентную систему блоков Ви где / 6 Bt тогда и только тогда, когда1) />0 и /ijj= + l. Мы получим b = \t—1 блоков Ви и в силу ортогональности i-й строки с 0-й строкой каждый блок содержит k — 2t—1 эле- элементов, так как i-я строка должна иметь +1 в 0-м столбце и 2/— 1 положительных единиц дополнительно. Кроме того, из равенств B8) видим, что любые два различ- различные блока В,- и Bh имеют ровно т— \=t— 1 общих элементов. В терминах матрицы инциденций А этой системы сказанное означает, что удовлетворяются соотношения A5) и A6) с па- параметрами v = \t— 1, k = 2t— I, X = t — 1. В силу теоремы 3 удовлетворяются все четыре равенства A4), A5), A6) и A7), и, следовательно, мы имеем симметрич- симметричную блок-схему с параметрами v = 4t—1, k = 2t—1, X=t—1. Обратно, из такой блок-схемы легко построить нормализован- нормализованную матрицу Адамара Н порядка At, поскольку блок-схема точ- точно определяет позиции для +1 внутри каймы из +1 в 0-й строке и 0-м столбце. Свойства блок-схемы в точности соответствуют ортогональности Н. ') h'i — элементы матрицы Н.—Прим. перев.
Блок-схемы 229 Существует весьма интересная композиция матриц Адамара. Она отражена в следующей теореме. Теорема 5. Кронекерово произведение Н^ХН2 матриц Адамара Hi и Иг порядков п\ и п% соответственно есть матрица Адамара H = HiXH2 порядка Прежде всего, если /4 = (a(j), где i, /=1, ..., п, и B=(brs), где г, s = \, ..., m, суть две матрицы порядка п и m соответ- соответственно, то кронекеровым произведением АхВ называется (mnXmn) -матрица. апВ а12В а21В а22В аХпВ~ а2пВ ап,В а„пВ .. . а„„В _ап1 Нетрудно заметить, что ВхА можно получить из АхВ пере- перестановкой строк и столбцов. Если А и В — матрицы Адамара, то очевидно, что каждый элемент АхВ есть либо + 1, либо —1. Рассмотрим скалярное произведение двух строк в Имеем ^ г, xs), где хг и xs — строки матрицы В. Если хгфх^, то (xr, jcs)=O, так как В — матрица Адамара. Если xr = xs, то (xr, xs)=m и 1фк, и мы имеем п т^аиаъ1 = т- 0 = 0, так как А — матрица Адамара. Теорема доказана. В качестве несложного примера подсчитаем Вспоминая B9), имеем 1 1 1 1 1 —1 1 -1 1 1—1—1 1 — 1 —1 В частности, матрицы Адамара порядка 2т существуют для всех т. Возможно, что матрицы Адамара существуют для всехп = 4/. В настоящее время это известно для п = 4, 8, ..., 112. Первое
230 Маршалл Холл число кратное 4, находящееся под сомнением, — это 116'). Дол- Долгое время было под сомнением число 92, но недавно решение было найдено Бомером, Голомбом и Холлом [1]. Теоретико-числовые методы Методы второй общей категории были названы теоретико- числовыми. В качестве примера методов такого рода рассмо- рассмотрим способ построения некоторых матриц Адамара, данный Пэли [22]. Пусть p=3(mod 4) — простое число. Для х~\, ..., р—1 (mod p) существует точно -^-н— реше- решений сравнения x2~a(mod p), называемых квадратичными вы- вычетами числа р. В таком случае для р = М—1 справедливо утверждение: k = 2t—\ квадратичных вычетов аи ..., ah(mod р) таковы, что множества Bi+i = {ai + i, аг+i, ..., ak + i(mod р)}, где / = 0, ... ..., М — 2 = р—1, образуют блоки симметричной схемы с v — = 4t—1, k = 2t — 1, X = t—\. Доказательство читатель найдет в уже упомянутой книге автора [15, стр. 162]. Например, для р=11 имеем я( = 1, #2 = 3, а3 = 4, й4 = 5, а5 = 9 и ?, = {1,3,4,5,9], Д5={5, 7, 8, 9, 2], В9 = (9, 11, 1, 2, 6), В2={2, 4, 5, 6, 10), Дв={6, 8, 9, 10, 3], В10= A0, 1, 2, 3, 7), Д3={3, 5, 6, 7, 11], Д7={7,9, 10, 11,4], Вп = {11, 2, 3, 4, 8], 54={4, 6, 7, 8, 1), 58={8, 10, 11, 1,5), т. е. блоки из примера 3. Этот метод дает матрицу Адамара по- порядка At всякий раз, когда \t — 1 — простое число. Вообще, если мы используем конечные поля с рг элементами вместо вычетов по модулю р, то мы получим матрицу Адамара порядка М всякий раз, когда \t— 1 является степенью простого числа. Таким обра- образом, поскольку 28—1=33, то существует матрица Адамара по- порядка 28. Теоретико-числовые методы связаны с конечными полями GF(pr) и геометриями над этими полями. Известно, что если п есть степень простого числа, п = рг, то существует конечное поле GF(pr) из п — рг элементов, и притом единственное с точностью до изоморфизма. Отсюда и следует возможность использования теоретико-числовых или геометрических методов построения. Если п = рг, то пусть 0,1, х2, ..., *n-i — элементы поля GF(pr). Тогда (иуо, иуи ..., иут), где и, г/г-€ GF(pr), ифЪ и (у0, ... • • •. Ут) =?@, ..., 0) есть точка конечной проективной геометрии ') В настоящее время таким ближайшим числом является 188. — Прим. перев.
Блок-схемы 231 PG(m,pr)—m-мерной проективной геометрии над полем GF(pr). При этом (т—1)-мерные подпространства т-мерной геометрии PG(m,pr) образуют симметричную блок-схему с па- параметрами _( _j р — 1 „ V = — j = , k = -!—, г- , К = j = , k = -!—, г- , К = — -. = . Например, если рг = 22 = 4, /п = 2, то имеем симметричную блок- схему с v = 2\, & = 5, Я=1. Под общим названием теоретико-чис- теоретико-числовых методов мы будем понимать использование конечных по- полей. Если р — простое число, то вычеты 0, 1, .. . , р — 1 (mod p) образуют конечное поле, в котором сложение, вычитание, умно- умножение и деление, включая деление на нуль, — операции, опреде- определенные единственным образом, если при этом выполняются обычные законы коммутативности и ассоциативности для сло- сложения и умножения, а также дистрибутивный закон (а + Ь)с = — ас + Ьс. Кроме вычетов по модулю р, существуют также поля из.р1" элементов, где р — простое число, a r — любое положительное целое число. Конечное поле GF(pr) существует, и притом един- единственное с точностью до изоморфизма, для каждой степени про- простого числа рг. Это поле может быть представлено следующим образом. Существует по меньшей мере один полином неприводимый по модулю р, где а, — вычеты по модулю р. Это означает, что невозможно представление f (х) ^ g(x)h(x) (mod р), "¦'¦'' где ;._/.•¦/ g(x)=x*+b1x°-i+ ... +*,. ;.¦;¦': ;г;' '. h{x) = xt + clx*-1-\- ... +ct, '.. ¦ '',... полиномы степеней s^>l и С^-\ соответственно. Если через А (х)^В(х) [modup, j(x)] мы обозначим выпол- выполнение следующего равенства: А (х) - В (х) = pR (х) + f{x)S (x), где А(х), В(х), R(x), S(x) — полиномы с целыми коэффициен- коэффициентами, то полиномы co+cix+ ... +cr_ixr[modd p, f(x)] образуют полное множество вычетов по modd p, f(x), где ct—целые чис- числа, взятые по mod р. Если, кроме того, многочлен f(x) неприво- неприводим по mod p, то эти вычеты образуют конечное поле GF(pr). Например, 0,1, х, х+\ (modd 2, х2+х+\) образуют конечное поле GFB2). Элемент у поля GF(pr) называется примитивным
232 Маршалл Холл корнем, если 1, у, у2, . .., урГ~2 — все рг — 1 различные элементы поля GF(pr), исключая нуль. Примитивный корень в поле GF(pr) существует всегда. (В действительности существует ц>(рг—1) примитивных корней1).) Большинство построений основано на первых результатах, полученных для конечных полей. Например, если pr=3(mod4), то существует точно (р' — 1)/2 элементов поля GF(pr), являю- являющихся ненулевыми квадратами, т. е. имеющих вид ii1 = а ф Ofmodd/?, f(x)\. Эти элементы могут быть использованы для построения ма- матрицы Адамара порядка рг + \. Например, х3— х+1 — полином, неприводимый по mod 3, и 27 вычетов , х3 — х-\-\) образуют конечное поле GFC3). В этом поле х — примитивный корень. Ненулевые квадраты суть 1, х2, х2 — х, х2 + ;с+1, — х2— 1, х2 + х, х2—\, Л) X —j— 1, JC ЭС ) 1 f JC —j— Л | 1 * X 1 j -X2—Jt+1. Обозначим 27 элементов поля GFC3), например, так: ио=--О, uv ..., и26 (т. е. ui = xi~\ i=\, ..., 26). Указанные выше квадраты в поле GFC3) мы можем исполь- использовать для построения матрицы Адамара порядка 28. Для это- этого первую строку и первый столбец составим из +1. Нумеруя остальные положения числами 0, . . ., 26 по строке и столбцу, мы положим ац= +1, если м? — и, есть квадрат, и а,-, = — 1 в про- противном случае. Это правило дает матрицу Адамара порядка 28. Мы можем использовать конечные поля и для построения ортогональных латинских квадратов. Пусть р а П = Р,Х ••• Pss — разложение целого числа п на произведение степеней разлив ных простых чисел. Для простоты запишем ') См., например, И. М. В и н о г р а до в, Основы теории чисел, изд-во «Наука», 1965, стр. 28. — Прим. перев.
Блок-схемы 233 Образуем систему М элементов (хи ..., xs), xtd GF(tii) и оп- определим сложение и умножение элементов системы М по пра- правилам (xv х2, ..., (xv x2, ..., xs) ¦ (y,y2, ..., ys) = (Xlyv x2y2, ..., xsys). Здесь Xi + yi и Xiyf суть элементы поля GF(tii). Пусть zt — при- примитивный корень поля GF(tii), i= 1, . . ., s, и пусть z= (zb ..., zs). Если t есть минимальное среди чисел nt — 1, п3 — 1, ..., ns — 1, то элементы z\ j = O,...,t— 1, все различны в каждой компо- компоненте 1,.... s. Следовательно, линейные соотношения у = z'x ~^b, j = 0, 1, ..., t — 1, где х, у, b? M, таковы, что если то z\ zh, bi, b2 определяют единственные х и у, за исключением случая, когда j—k. Это следует из того факта, что C0) дает {z>-zk)xx = b2-bv C1) и если }ФЬ, то разность zi— zft отлична от нуля в каждой ком- компоненте; следовательно, C1) определяет единственное .г, а тогда одно из уравнений C0) определяет единственным образом у. Можно использовать систему М для определения множества из t взаимно ортогональных латинских квадратов порядка п. Обозначим п элементов системы М через flo = O, ai = l, ..., an-i- Ячейки квадратов суть (х, у), где х, у — элементы из М. В /-й квадрат, / = 0, 1,...,/—1, поместим число b во все ячейки (х, у), для которых y = zix + b. Отсюда легко следует, что каждое из чисел 0, \,...,п—1 появляется точно один раз в каждой строке и точно один раз в каждом столбце /-го квадрата, и по- потому мы имеем t латинских квадратов. Единственность х и у а C0), когда j = k, есть как раз условие, необходимое для того, чтобы t квадратов были ортогональными. Мы сформулируем полученный результат в виде теоремы, принадлежащей Макнейшу [19]. Теорема 6. Если п = р[1р22 ¦ ¦ ¦ p[s — разложение числа п на степени простых чисел и если v (п) = miп (//.'— l), то суще- существует v(n) взаимно ортогональных латинских квадратов по- порядка п.
234 Маршалл Холл Проиллюстрируем эту теорему для я=12 = 22-3, взяв в ка- качестве элементов поля GFD) элементы 0, 1, х, х+\ (modd 2, х2 + х+1), поля GFC) —элементы 0, 1, —1 (modd2, x2+x+\) и поля GFC) — элементы 0, 1, —1 (mod 3). Имеем Zi = x, z2= —f — примитивные корни. Элементами си- системы М могут служить следующие: 0), \) 1), 0), 1), 8 = (. 1), 9 = (. 0), 10 = (. 1), 11=(. к, —1) «+1, 0), x, 1), *+*, -1). C2) Мы получаем два ортогональных латинских квадрата поряд- порядка 12, показанные в табл. 6. Таблица 6 к Номео | строки 0 1 2 3 4 5 б 7 8 9 10 11 0 0 5 4 3 2 1 б 11 10 9 8 7 1 1 0 5 4 3 2 7 6 11 10 9 8 2 2 1 0 5 4 3 8 7 б 11 10 9 3 3 2 1 0 5 4 9 8 7 б 11 10 4 4 3 2 1 0 5 10 9 8 7 б 11 5 5 4 3 2 1 0 11 10 9 8 7 б б б 11 10 9 8 7 0 5 4 3 2 1 7 7 б 11 10 9 8 1 0 5 4 3 2 8 8 7 б 11 10 9 2 1 0 5 4 3 Номер столбца 9 9 8 7 б 11 10 3 2 1 0 5 4 10 10 9 8 7 б 12 4 3 2 1 0 5 и 11 10 9 8 7 б 5 4 3 2 1 0 0 0 10 2 б 4 8 9 1 11 3 7 5 1 1 11 3 7 5 9 10 2 б 4 8 0 2 2 б 4 8 0 10 11 3 7 5 9 1 3 3 7 5 9 1 11 б 4 8 0 10 2 4 4 8 0 10 2 б 7 5 9 1 11 3 5 5 9 1 11 3 7 8 0 10 2 б 4 б б 4 8 -0 10 2 3 7 5 9 1 11 7 7 5 9 1 11 3 4 8 0 10 2 6 8 8 0 10 2 б 4 5 9 1 11 3 7 9 9 1 11 3 7 5 0 10 2 б 4 8 10 10 2 б 4 8 0 1 11 3 7 5 9 и 11 3 7 5 9 1 2 6 4 8 0 10 Теоретико-групповые методы Следующий метод дает взаимно ортЬгональных латинских квадратов порядка я, когда
Блок-схемы 235 есть разложение п на степени простых чисел. В течение долгого времени считалось, что это было и максимально возможное число. Здесь для n = 4k + 2 значение v(n) равно 1, что подтвер- подтверждало предположение Эйлера о несуществовании пары ортого- ортогональных латинских квадратов для n = 4k + 2. Недавно посред- посредством конструктивных методов — частично рекурсивных, частич- частично теоретико-групповых — была показана ошибочность обоих предположений. Пара ортогональных квадратов порядка 10 дана в табл. 8 на стр. 236. Под теоретико-групповыми методами мы будем понимать та- такие методы, которые предполагают некоторую группу автомор- автоморфизмов для блок-схемы. Например, чтобы построить систему троек Штейнера порядка и = 6/ + 3 с циклической группой автоморфизмов порядка 2t + \, поступим следующим образом. Параметры схемы суть Все элементы разложим на три множества по 21 + 1 элементов в каждом: •АI -"Р • • •> -™2<> > "р ¦ • •' *> ^0' ^Р • • •» ^V Каждое множество циклически перестановочно образующим ав- автоморфизмом порядка 2/+1. Заметим, что / пар A,2/), B, 2/ — 1),...,(/,/+ 1), рассма- рассматриваемые как вычеты по mod B/ + 1), имеют в качестве разно- разностей ± B/ — 1), ± B/ — 3),. . . , ± 1; разности берутся в обе сто- стороны, так что каждый ненулевой вычет по modB/+l) появ- появляется ровно один раз. Следовательно, 3/+1 троек (Л,, А,,, Во), (Л>, A2t_v Во), ..., (Д, At + V Bo), (Bv B2t, Со), (В2, B2t~\, Со), .... (Bt, Bt + l, Co), (83) (Gp Czt, Aq), (C2, L,2t-\, Aq), . . ., (Ct, Cf + v Aq), (Ad, Bq, Co), таковы, что при применении автоморфизма а, а = (А,. Л Л21)(В0, Вг, ..., B,t)(C0, Ср . . ., C2t), мы имеем b= C/+ 1) Bt+ 1) троек. Проверим, что эти тройки Об- Образуют систему Штейнера, построенную из элементов. Для этого достаточно показать, что каждая пара различных элементов появляется ровно в одной тройке. Пара Ar, As, r^s, .появляется в тройке (Aj+U, A2t+i-j+u, Bu), где r — s=± [j — B/ + 1) + у] (mod 2/ + 1),
236 Маршалл Холл а и выбирается так, чтобы j + u и 2t+l —j + u были равны г и s, либо s и г соответственно. Аналогичным образом появ- появляются пары В,., Bs и Cr, Cs в тройках второй и третьей строк C3). В первой строке C3) элемент Во появляется с каждым Аг, исключая Аа. Следовательно, автоморфизм дает тройку с пред- предписанной парой Вг, Aj, \Ф1. Аналогично вторая строка при этом автоморфизме дает пары С,, Вр \Ф1\ а третья строка дает пары Аи Ch \Фь. Последняя тройка (Ао, Во, Со) при автоморфизме дает все пары Ait Bt\ Ait С, Таблица 7 и ви С,. Поскольку каждая пара из 6/ + 3 элементов по- появляется ровно один раз в B/+1)C* + 1) тройках, то подсчет показывает, что каждая пара различных элементов появляется ровно один раз. Таким образом, тройки из C3) и их образы, полученные при различных степенях автоморфизма а, дают требуемую систему троек Штейнера. Рассмотрение двух орто- ортогональных квадратов поряд- порядка 12 в табл. 6 показывает, что второй квадрат может быть получен из первого простой перестановкой строк. Другими словами, если элементы столбца 0 суть элементы х0, хи...,хп системы М, то элементами столбца biy i—l, ..., 11, являются bit bt+Xi, ... . . . ,Ь{ + Хц. Иными словами, эти квадраты инвариантны относи- относительно аддитивной группы системы М. Это свойство было взято Дюльмашем, Джонсоном и Мендельсоном [12] за основу при ис- исследовании числа ортогональных латинских квадратов на быст- быстродействующих вычислительных машинах, и они нашли семей- семейства из пяти взаимно ортогональных латинских квадратов по- порядка 12. В табл. 7 даны первые столбцы пяти взаимно ортого- ортогональных латинских квадратов порядка 12. Строки нумеруются так же, как в табл. 6, и, таким образом, первый квадрат в табл. 7 тождествен первому квадрату в табл. 6. Полный подсчет на ма- машине показал, что существует некоторое число семейств из пяти взаимно ортогональных квадратов этого типа, но не суще- существует ни одного семейства из шести взаимно ортогональных латинских квадратов порядка 12. Номер строки 0 1 2 3 4 5 6 7 8 9 10 11 1 0 5 4 3 2 1 б 11 10 9 8 7 Номер квадрата 2 0 1 7 2 8 б 9 3 5 10 4 11 3 0 11 9 1 б 3 2 10 7 4 5 8 4 0 9 5 11 1 8 3 4 б 7 2 10 5 0 7 2 10 11 4 8 5 3 1 9 6
Блок-схемы 237 Комбинируя теоретико-числовые и теоретико-групповые ме- методы, Паркер [23] построил семейство пар ортогональных ква- квадратов порядка Cq— 1)/2, где q— любая степень простого числа, такая, что g=3(mod4); в частности, при q = 7 получаем первую известную пару ортогональных квадратов порядка 10. Эта работа и последующая работа Паркера, написанная сов- совместно с Боузом и Шрикханде [5], полностью опровергли пред- предположение Эйлера. Пусть / — примитивный корень поля GF(q), <7=ps=E3(mod4), и пусть х„ /=1, .... ^~, C4) другие ^-g— символов. Построим упорядоченные четверки t, b, t2i + b, t -\-l) + b,xltb], { > (/+1)+ *,*,]. Здесь i=\, ..., —п—' а Ь принимает все значения из поля GF(q). В разд. 2 мы уже устанавливали соответствие между па- парой ортогональных латинских квадратов и множеством упоря- упорядоченных четверок (г,-, Cj, fh, si), предназначая для каждой ячейки из строки гг и столбца Cj элемент fk для первого квадрата и S/ — для второго. Так как (q—1)/2 нечетно, то существует пара ортогональных квадратов этого порядка; такая пара мо- может быть построена, например, методом Макнейша. Пусть даны упорядоченные четверки (xlt xp xk, xt). C6) Паркер показал, что четверки C5) вместе с четверками C6) дают пару ортогональных латинских квадратов порядка п, где п = —g— • Взяв q = l\ / = 3, п= 10 и *i = 7, x2 = 8, х3=9, получим два ортогональных квадрата, показанные в табл. 8. Следующий конструктивный метод основан исключительно на требовании специфической группы автоморфизмов. Мы не можем останавливаться на этом методе столь же подробно, как это сделано в [15], но один, весьма частный, вид автоморфизма мы сейчас рассмотрим. Пусть D — симметричная блок-схема с параметрами v, k, X. Допустим, что для схемы D существует автоморфизм порядка о,
238 Маршалл Холл Таблица 8 Номер строки 0 1 2 3 4 5 6 7 8 9 0 0 8 9 5 7 б 3 1 2 4 1 4 1 8 9 б 7 0 2 3 5 2 1 5 2 8 9 0 7 3 4 6 3 7 2 б 3 8 9 1 4 5 0 4 2 7 3 0 4 8 9 5 б 1 5 9 3 7 4 1 5 8 6 0 2 б 8 9 4 7 5 2 б 0 1 3 7 3 4 5 б 0 1 2 7 8 9 8 6 0 1 2 3 4 5 8 9 7 Номер 9 5 б 0 1 2 3 4 9 7 8 столбца 0 0 б 5 9 3 8 7 4 1 2 1 7 1 0 б 9 4 8 5 2 3 2 8 7 2 1 0 9 5 б 3 4 3 6 8 7 3 2 1 9 0 4 5 4 9 0 8 7 4 3 2 1 5 б 5 3 9 1 8 7 5 4 2 б 0 б 5 4 9 2 8 7 б 3 0 1 7 4 5 б 0 1 2 3 7 9 8 8 1 2 3 4 5 б 0 8 7 9 9 2 3 4 5 б 0 1 9 8 7 циклический относительно элементов и блоков схемы D. В та- таком случае за элементы можно принять вычеты 0, 1,. . . , и— 1 по модулю v, а за блоки — подмножества элементов Во, Вь ... .. ., Bv_i с индексами, взятыми по модулю v, за автомор- автоморфизм а — а: i_> i_|_i (modi)), ?,->?/+1. C7) Назовем D циклической блок-схемой. Блок-схемы в приме- примерах 1 и 3 — обе циклические. Назовем теперь разностным мно- множеством А из k вычетов по модулю и множество аь ... . . ., aft(mod и), такое, что каждый ненулевой вычет d по мо- модулю v может быть выражен сравнением , . flf^a^»— a;(modv), at, а;-^Д, C8) ровно X раз, где k(k — \) =X(v — I). Теория циклических схем и теория разностных множеств являются по существу одним и тем же, как показывает следующая теорема. Теорема 7. Если аь ..., aft — вычеты по модулю v, обра- образующие блок Bj циклической схемы с параметрами v, k, X, то существует разностное множество по модулю v. Обратно, если аи ... ,ah — разностное множество, то блоки V *{! + «. 0.2+iу •••>«*+')¦ *' = 0, вычетов по модулю и суть блоки циклической блок-схемы с аметрами v, k, X и автоморфизмом а : i-> i+1 (mod v), из параметрами B B
Блок-схемы 239 Доказательство. Пусть блок В} циклической схемы D с параметрами v, k, X содержит вычеты аи .. ., ak. Тогда блок Bj+s содержит вычеты af+s, a2+s, .. . , ah + s. Пустьй удовлетво- удовлетворяет условию d^0(modv). Тогда существует ровно X различ- различных блоков, которые содержат и d и 0. Другими словами, суще- существует ровно X выборов для s, au flj, таких, что cii + s=d, Gj + s= ~0(mod у). То есть существует ровно X выборов at и aJt таких, что v), C9) так как, очевидно, aj + s=0(mod и) определяет s=—aj(modv). Но сравнение C9) означает, что аи . ..,ah есть разностное мно- множество Д. Легко обратить все рассуждение и показать, что если ait. .. , ak — разностное множество Д, то в блоках Bi = {a] + i, a2-\-i, . .., ak-\-i], i = 0, .. ., v—l, пара элементов 0 и d#0 (mod v) появляется ровно К раз. Тогда для всякого / значения / и j+d появляются вместе ровно X раз; но это означает, что любая пара различных элементов г и s по- появляется ровно X раз (если возьмем /=л и d=s — г). Отсюда видно, что Вг суть блоки симметричной схемы D, а из их. построения непосредственно следует, что преобразова- преобразование а, указанное в теореме или в C7), есть автоморфизм схемы D. В определении циклической блок-схемы D не утверждается, что D не имеет никаких других автоморфизмов, кроме степеней определяющего автоморфизма а. В самом деле, каждая извест- известная циклическая блок-схема имеет другие автоморфизмы. Назовем множителем циклической блок-схемы D вычет t по модулю v, такой, что преобразование р р: i->ti(modi)), г = 0, 1, ..., v — l, D0) есть автоморфизм схемы D. Так как 1 (mod и) есть элемент схемы D, то D0) автоматически сводится к требованию (/, v) = 1, т. е. чтобы / и v были взаимно простыми. Множители D, если они существуют, образуют подгруппу мультипликативной груп- группы вычетов по модулю v, взаимно простых с и. Каждая из из- известных циклических блок-схем имеет множитель /#l(modu). Основная теорема Холла и Райзера [16] утверждает существо- существование множителя для многих случаев. Теорема 8. Пусть аи ..., ah образуют разностное множе- множество по модулю v. Пусть р — простое число, делящее n=k — X, и такое, что (р, v) = 1 и р>Х. Тогда р есть множитель блок- схемы, определенной данным разностным множеством.
240 Маршалл Холл Отсутствие места не позволяет поместить здесь доказатель- доказательство этой теоремы. Однако если множитель существует, то для небольших параметров обычно легко построить разностное мно- множество, если оно существует, или же доказать, что никакого разностного множества не существует. Всегда существует разностное множество для параметров V k К (т—1)-мерного подпространства геометрии PG(m, рг). Этот результат принадлежит Зингеру [26]. Квадратичные вычеты по модулю р, где р=3(тос1 4), р — простое число, также образуют разностное множество. Этот результат принадлежит Пэли [22], как было замечено раньше. Следующий результат, найденный автором [14], предста- представляется более интересным. Если р — простое число вида 4х2 + 27 и если t — примитивный корень из р, подобранный соответствен- соответственным образом, то k= 2 различных вычетов х6, Зх6, 27л:6 (mod/?), хфО, D1) образуют разностное множество. Здесь х пробегает все значе- значения 1,..., р—l(modp), а х6 принимает-^—различных зна- значений, каждое шесть раз. Первые два случая имеем при р = 31 и р = 43. Соответствующие разностные множества суть г» = 31, k=\5, 1 = 7, п = 8 1, 2, 3, 4, б, 8, 12, 15, 16, 17, 23, 24, 27, 29, 30(mod31) и г» = 43, ? = 21, А, = 10, я=П: 1, 2, 3, 4, 5, 8, И, 12, 16, 19, 20, 21, 22, 27, 32, 33, 35, 37, 39, 41, 42 (mod 43). Следующий результат принадлежит Брауеру [6]. Если р и q = p + 2 — простые числа, то при v = pq и k = pq ^— имеем, что k вычетов по модулю pq = v, а именно такие значения а, что = + 1, и 0, q, 2q, ..., (p—\)q(тойpq), образуют разностное множество по модулю v = pq. Здесь (—\ — -1-1 \РЯ1 "*"
Блок-схемы 241 означает, что либо одно из сравнений л:2 = a (mod p) и у2 = =a(mod<7) имеет решение, либо ни то, ни другое. Проиллюстрируем эту теорему на примере р = Ъ, q = l, v = 35, 6=17, Я, = 8, тогда имеем следующее разностное множество: О, 1, 3, 4, 7, 9, 11, 12, 13, 14, 16, 17, 21, 27, 28, 29, 33 (mod 35). Возможны и другие случаи: например для и = 37, & = 9, А, = 2 имеем п = 7, и теорема 8 утверждает, что 7 есть множитель. Ре- Решением является разностное множество 1, 7, 9, 10, 12, 16, 26, 33, 34(mod37). Несколько удивительно, что, очевидно, сильные условия тео- теоремы 8 часто удовлетворяются. С другой стороны, пример в [41] показывает, что теоретико-числовые и групповые аспекты мето- методов построения разделить нелегко. Разностные множества, со- соответствующие нециклическим группам, были изучены Бруком [7], но, по-видимому, схем, соответствующих циклическим груп- группам, существует значительно больше, чем схем, соответствую- соответствующих другим группам. Вопросы для самопроверки 1. Существует по меньшей мере одна система троек Штейнера с v эле- элементами, где а) и = 95, б) и=100, в) f = 105, г) ни одной из вышеназванных. 2. Число симметричных блок-схем с параметрами ti = 22, k=l, Л=2 равно а) 2, б) 1, в) 0, г) бесконечности. 3. Пять из блоков системы троек Штейнера суть {1,2,3}, {1,4,5}, {1,6,7}, {2, 5, 6}, {2, 4, 7}. Остальные блоки: а) |3, 4, 6}, {3,5,7}; б) {3, 4, 5}, {3,6,7}; в) {4, 5,6), {1, 2, 3}; г) {2,3, 4j, {5,6, 7}. 4. Двоичный код состоит из 144 слов по 72 знака в каждом слове. Лю- Любые два слова отличаются 36 из 72 знаками. Можно исправить вплоть до, но не больше: а) 9 ошибок, б) 17 ошибок, в) 18 ошибок, г) 36 ошибок. 5. Цифры 1 9 разметены в латинском прямоугольнике с 8 стро- строками и 9 столбцами. Можно добавить еще одну строку, чтобы получить ла- латинский квадрат: а) всегда по меньшей мере двумя способами; б) всегда точно одним способом; в) нельзя; г) число способов добавления строки за- зависит от вида данного прямоугольника. ЛИТЕРАТУРА [1] Baumert L., Golomb S. W., Hall M., Jr. Discovery of an Hada- mard Matrix of Order 92, Bull. Amer. Math. Soc, 68 A962), 237—238. [2] В h a 11 а с h a r у a K. N., A New Balanced Incomplete Block Design, Science and Culture, 9 A944), 508. 16 Зэк. 909
242 Маршалл Холл [3] В h a 11 а с h а г у а К. N., On a New Symmetrical Balanced Incomplete Block Design, Bull. Calcutta Math. Soc, 36 A945), 91—96. [4] Bose R. C, On the Construction of Balanced Incomplete Block Designs, Ann. Eugenics, 9 A939), 353—399. [5] Bose R. C, Shrikhande S. S., Parker E. Т., Further Results on the Construction of Mutually Orthogonal Latin Squares and the Falsity of Euler's Conjecture, Canad. J. Math.. 12 A960), 189—203. [6] В r a u e r A., On a New Class of Hadamard Determinants, Math. Z., 58 A953), 219—225. [7] В ruck R. H., Difference Sets in a Finite Group, Trans. Amer. Math. Soc, 78 A955), 464—481. [8] В ruck R. H., Ryser H. J., The Nonexistence of Certain Finite Pro- jective Planes, Canad. J. Math., 1 A949), 88—93. [9] С h о w 1 a S., Ryser H. J., Combinatorial Problems, Canad. J. Math., 2 A950), 93—99. [10] Connor V. S., On the Structure of Balanced Incomplete Block Designs, Ann. Math. Stat., 23 A952), 57—71. [11] Connor W. S., Hall M., Jr., An Embedding Theorem for Balanced Incomplete Block Designs, Canad. J. Math., 6 A953), 35—41. [12] Dulmage A. L, Johnson D. M., Mendelsohn N. S., Orthomor- phisms of Groups and Orthogonal Latin Squares, I, Canad. I. Math., 13 A961), 356—372. [13] Euler L., Commentationes Arithmetical, II, 302—361, Petrograd, 1849. [14] Hall M., Jr., A Survey of Difference Sets, Proc. Amer. Math. Soc, 7 A956), 975—986. [15] H a 11 M. Jr., Combinatorial Theory, Toronto—London, 1967. [16] Hall M. Jr.. Ryser H. J., Cyclic Incidence Matrices, Canad. J. Math., 3 A951), 495—502. [17] Han an i H., On Quadruple Systems, Canad. J. Math. 12 A960), 145—157. [18] Hardy G. H., Wright E. M., An Introduction to the Theorie of Num- Numbers, New York, 1938. [19] MacNeish H. F., Euler Squares, Ann. Math.. B), 23 A922), 221—227. [20] Mann H. В., Analysis and Design of Experiments, New York, 1949. [21]j Moore E. H., Concerning Triple Systems, Math. Ann., 43 A893), 271—285. [22] Pa ley R. E. A. C, On Orthogonal Matrices, /. Math. Phys., 12 A933), 311—320. [23] Parker E. Т., Orthogonal Latin Squares, Proc. Nat. Acad. Sci. 45 A959), 859—862. [24] R с i s z M., Ober eine Steinersche Combinatorische Aufgabe welche in 45 Band dreses Journals, Seite 181, gestellt worden ist, /. Reine Anqeio. Math.. 56 A859), 326—344. [25] Ryser H. J., A Note on a Combinatorial Problem, Proc. Amer. Math. Soc, 1 A950), 422—424. [26] Singer J., A Theorem in Finite Projective Geometry and Some Applica- Applications to Number Theory, Trans. Amer. Math. Soc, 43 A938), 377—385. [27] Steiner J., Combinatorische Aufgabe, /. Reine Angew. Math., 45 A853). 181—182.
ЛЕММА ШПЕРНЕРА И НЕКОТОРЫЕ ЕЕ ОБОБЩЕНИЯ Ч. Томпкинс 1. Введение Эта статья посвящена четкому доказательству некоторых ин- интуитивно очевидных фактов. В качестве иллюстрации рассмо- рассмотрим в евклидовом трехмерном пространстве шар В, т. е. обык- обыкновенную сферу 5 с ее внутренними точками. Теперь предполо- предположим, что этот шар подвергся процессу сжатия, так что, став несколько меньше, он расположился в области/?, целиком лежа- лежащей внутри шара В и не имеющей общих точек с граничной сферой 5. Предполагаем, что процесс деформации проходил без разрывов, т. е. две точки, близкие друг к другу в В, остались близкими друг другу в R, но допускаем стягивания, т. е. две точки, будучи далекими в В, могут оказаться близкими или даже совпадающими в R. Мы будем говорить о точках в В и об их образах после деформации в R. Построим векторное поле на сферической границе 5 шара В, соединив вектором каждую ее точку с образом этой точки в R. Так как R не имеет общих точек с 5, то каждый из этих векторов имеет положительную длину, а так как разрывы не допускаются, то это векторное поле непрерывно. Более того, поскольку R лежит полностью внутри В, то и все векторы полностью расположены внутри В. После этого утверждения становится довольно правдоподобным (а для некоторых читателей и очевидным) то обстоятельство, что направления векторов при пробегании 5 заметают полный телесный угол. Более того, очевидно, что подобные утверждения остаются верными и для сфер, концентрических с S, но немного меньшего радиуса. Если же мы рассмотрим все сферы, концен- концентрические с 5 и лежащие в В, то увидим, что заметание полного телесного угла сохраняется до тех пор, пока какой-либо вектор в некоторой точке не становится одновременно направленным во все стороны, а это возможно для непрерывного векторного поля в пределе только для нулевого вектора, т. е. для вектора с длиной 0. Таким образом, мы вынуждены предположить, что при данных условиях один из векторов, связывающих точку из В с ее образом в R, должен иметь нулевую длину, и, следова- следовательно, после деформации образ этой точки в точности совпа- совпадает с положением самой точки. Такую точку мы будем назы- называть неподвижной тонкой. 16*
244 Ч. Томпкинс Хотя все это интуитивно ясно и было сформулировано еще Гауссом, а возможно, и еще раньше, точные доказательства не столь очевидны. Лемма Шпернера позволяет доказывать приве- приведенные утверждения с помощью некоторых арифметических вы- выкладок. Помимо этого, она представляет собой образец изящ- изящной арифметизации, влияющей на развитие математики и по- позволяющей оценить могучую роль абстракции. Заметим, кстати, что первоначальная форма доказательства леммы Шпернера иллюстрирует следующую важную особенность доказательств по индукции. Иногда необходимо заменять утверждение, требую- требующее доказательства, на более сильное, с тем чтобы доказывать его с помощью математической индукции. Впервые, насколько известно автору, эта мысль была высказана в публичной лекции Германом Вейлем. Так, в лемме Шпернера мы хотим показать, что некая конфигурация встречается по меньшей мере один раз, а в индуктивном доказательстве мы должны показать, что она встречается нечетное число раз. В индуктивных доказа- доказательствах существует следующая деликатная альтернатива. Если предполагаемое утверждение слишком сильно, то доказатель- доказательство справедливости его для значения индекса k+l (при спра- справедливости его для всех значений индекса 1,...,k) становится невозможным; если же предполагаемое утверждение слишком слабо, то справедливость его для всех значений индекса 1, ... ..., k дает недостаточно информации для утверждения его спра- справедливости при значении индекса k+l. Мы будем обобщать лемму и расширять область ее прило- приложений в конце статьи. Соображение о существовании по мень- меньшей мере одной неподвижной точки, используемое в первом аб- абзаце, является чем-то более сильным, чем то, что имеется в виду в самой лемме и ее непосредственных приложениях. Поэтому мы могли бы начать обобщение и опустить целиком лемму, но это повлекло бы за собой несколько потерь. Во-первых, лемма ил- иллюстрирует значение абстракции в исследовании и в изложении. Во-вторых, существуют обобщения леммы в других направле- направлениях, возможно, пригодных для комбинаторных задач, некото- некоторые из которых приведены в [14]. И наконец, извлечение из абстрактного вида леммы геометрического смысла само по себе поучительно. Почему-то многие математики приходят к убежде- убеждению (и это совпадает с точкой зрения автора), что геометрия — мать математического исследования, а анализ и алгебра — обя- обязательные инструменты при проведении доказательств, как бы они ни были сложны, и что геометрия либо при обобщении идей и операций алгебры и анализа, либо при случайном замечании придает возникшим абстрактно и, казалось бы, совсем далеким от нее понятиям вполне определенный и доступный смысл. Ав-
Лемма Шпернера 245 тор надеется, что эта столь прозрачная основа будет служить в течение всего изложения, показывая, как геометрические ут- утверждения, содержащиеся в этой статье, могут быть арифмети- зированы с тем, чтобы им придать вполне определенный смысл. 2. Лемма Шпернера Иллюстрацией леммы Шпернера служит рис. 1, где слева изображен треугольник произвольной формы с вершинами, по- помеченными 0, 1,2. Справа тот же треугольник вместе с его вну- внутренней частью подразделен на некоторое множество меньших треугольников. Вершинам основного треугольника оставлены их старые пометки. Дополнительные вершины получают пометки из того же множества чисел 0, 1, 2 при одном ограничении: лю- любая вершина, лежащая на стороне основного треугольника, дол- должна быть помечена одной из пометок двух концов этой стороны. Вершины, добавленные внутри основного треугольника, могут быть помечены любой из трех пометок. Лемма утверждает, что по меньшей мере один из малых тре- треугольников помечен всеми тремя пометками 0, 1 и 2 на его вер- вершинах, как бы мы их не указывали, выполняя упомянутое пра- правило. На рис. 1 один такой малый треугольник заштрихован, но существует еще два незаштрихованных. Предложим читателю, прежде чем он начнет пытаться искать противоре- противоречащий пример, прочитать столько, сколько необходимо, чтобы уяснить себе процесс подразделения. Если же он захочет продолжить чтение и уяснит себе доказательство, то он не будет терять время на поиск несуществующего противоречащего примера. Лемма Шпернера применима не только к треугольникам, но и к фигурам, являющимся его обобщениями на более высокие
246 Ч. Томпкинс размерности, например к тетраэдрам. Эти фигуры называются п-мерными симплексами; при этом мы обычно пишем п-сим- плекс вместо n-мерного симплекса. 1-симплекс состоит из пары точек и отрезка между ними; предполагаем их лежащими в ев- евклидовой плоскости или в евклидовом пространстве, если чита- читателю претит считать себя живущим на отрезке. 2-сим- плекс состоит из вершин, сторон и внутренней части треуголь- треугольника. 3-симплекс состоит из вершин, ребер, граней и внутренней части тетраэдра; /г-симплекс строится на п+1 точке в /г-мерном пространстве. Он состоит из всех точек наименьшей выпуклой области, содержащей эти вершины, точно так же, как 3-сим- 3-симплекс состоит из всех точек наименьшей выпуклой области, содержащей четыре точки. Добавим, для того чтобы не тра- тратить слов на замечания в будущем, что О-симплекс состоит из единственной точки и что (—1)-симплекс вообще не содержит точек. Элементарные сведения о пространствах размерности более высокой, чем три, см. в статье автора в сборнике [3, стр. 448— 479]. Однако несколько замечаний в конце этой статьи укажут общий метод обращения с симплексами высоких размерностей, что сможет утешить тех, кто не очень привык иметь дело с раз- размерностями, более высокими, чем три. Теперь вернемся к некоторым определениям, которые пона- понадобятся при формулировке и доказательстве леммы. Эти опре- определения приемлемы при интуитивном подходе, но следует отме- отметить, что они вполне корректно излагаются и на более строгом языке. Симплексами, подчиненными n-симплексу S, называются сим- симплексы всех размерностей от —1 до п, имеющие те же вершины, что и вершины S. Таких симплексов 2" + 1, включая (—^-сим- (—^-симплекс, не имеющий точек. Тетраэдру, например, подчинены единственный (—1)-сим- (—1)-симплекс, четыре вершины в качестве О-симплексов, шесть ребер в качестве 1-симплексов, четыре грани в качестве 2-симплексов и сам тетраэдр в качестве 3-симплекса — всего 16 = 24. Пересечение любых двух различных симплексов, каждый из которых подчинен 5, тоже является симплексом, подчиненным 5, а его размерность не превышает размерности любою из этих симплексов. При этом, если ни один из них не содержит другого, то размерность пересечения будет меньше размерности каждого из них, а если один симплекс содержит другой, то размерность содержащего симплекса не меньше, чем содержимого, и если оба они подчинены 5, то либо они совпадают, либо содержащий симплекс имеет большую размерность, чем содержимый. Все эти утверждения очевидны.
Лемма Шпернера 247 Если р— точка /г-симплекса S, то носителем р в S назы- называется симплекс наименьшей размерности, подчиненный S и содержащий р. Носитель произвольной точки р в S вполне оп- определен, так как, если р лежит в двух различных симплексах одной и той же размерности, то он лежит и в их пересечении, являющемся, как это уже было отмечено, подчиненным S сим- симплексом меньшей размерности. Смысл понятия носителя поясняет следующее определение. Множество точек n-симплекса S называется допустимо по- помеченным, если оно содержит все вершины S и все эти вер- вершины помечены от 0 до п в любом порядке, так что каждая пометка присвоена в точности одной вер- вершине, а всякая другая точка этого множества помечена одной из по- пометок вершин ее носителя. Из этого вытекает, что присваи- i вание каждой отличной от вершин S точке пометки из множества по- пометок вершин ее носителя вполне произвольно и не зависит от при- присваивания пометки другой точке, от- отличной от вершин S. Допустимое помечивание — совершенно общее понятие, так что оно включает и двумерный случай со всеми присущими ему ограничениями, изложенными в первом абзаце этого пункта в связи с примером, проиллюстрированным на рис. 1. В частности, в этом примере стороны основного симплекса являются носителями вершин под- подразделения, лежащих на этих сторонах. Подразделением п-симплекса S называется конечное мно- множество {Si} /г-симплексов, содержащихся в S, такое, что 1) ка- каждая точка р симплекса S содержится по крайней мере в одном симплексе S* из множества {?,}, 2) два различных симплекса S-, и Sh из множества {S} не пересекаются по внутренним точкам, 3) если р — вершина произвольного симплекса Sj из {Si}, то она же является вершиной и каждого симплекса Sh из {Si}, с которым она инцидентна. Сначала поясним обозначения, а затем дадим примеры. Под множеством {?;} мы подразумеваем некоторое множество /г-сим- /г-симплексов, помеченных индексами I из конечного индексного мно- множества /; как правило, в качестве / берется несколько первых натуральных чисел. В применении к симплексу S,- этого подраз- подразделения мы подразумеваем, что некоторое частное значение из/ Рис. 2.
248 Ч. Томпкинс присвоено этому симплексу, и мы обозначили это значение че- через у; символ Sk имеет аналогичное значение. Подразделение, указанное на рис. 1, удовлетворяет указан- указанному выше определению. Большой треугольник и его внутрен- внутренняя часть полностью покрыты малыми 2-симплексами, и лишь граничные точки являются общими для них. Условие 3 опреде- определения также выполняется для них. На рис. 2 мы проиллюстри- проиллюстрировали, как условие 3 может не выполняться. Этот рисунок изображает четыре малых 2-симплекса вблизи нижней правой вершины на рис. 1; верхний из них как раз тот, который заштри- заштрихован на рис. 1. Если предпринять дальнейшее подразделение, как показано, по помеченной пунктиром линии из нижней левой вершины на рис. 2 к противоположному ребру малого симплекса, то образованная при этом вершина не будет вершиной верхнего треугольника, с которым она инцидентна. Тогда для того, чтобы выполнялось требование 3, должна быть добавлена верхняя внутренняя линия (или некоторое более сложное по- построение). Ясно, что множество точек, являющихся вершинами сим- симплексов допустимого подразделения, содержится в 5, и это мно- множество вершин содержит вершины S. Теперь мы сформулируем лемму Шпернера. Лемма Шпернера. Для любого допустимого помечива- ния множества вершин любого подразделения п-симплекса S су- существует по крайней мере один симплекс Sj подразделения с вершинами, несущими полное множество пометок. Доказательство индуктивное, и индукция проводится по раз- размерности п. Однако в соответствии с замечаниями во введении удобнее доказать более строгое предложение, заключающееся в том, что число симплексов подразделения с вершинами, несу- несущими полное множество пометок, нечетно. Отсюда будет сле- следовать лемма Шпернера, поскольку 0 четное число. Мы на- назовем это утверждение сильным утверждением. Для одномерного случая предложение относится к линей- линейному отрезку с концами, помеченными нулем и единицей соот- соответственно. Этот отрезок подразделен конечным множеством то- точек. Каждая из этих точек произвольно помечена нулем или единицей независимо от того как помечены другие точки. Вы- Выберем из коротких отрезков (не содержащих внутри вершин подразделения) те, у которых хотя бы один конец имеет по- пометку 0. Выбранные сегменты принадлежат к одному из двух типов: те, у которых оба конца помечены нулем, и те, у которых
Лемма Шпернера 249 один конец помечен нулем, а другой — единицей. Рассматривая каждый такой отрезок отдельно, подсчитаем число концов, имеющих пометку 0. Если имеется а симплексов с двумя ну- нулями, то в них 2а концов имеют пометку 0. Если имеется b сим- симплексов с одним концом, помеченным нулем, и одним — едини- единицей, то в них b концов помечены нулем. Так что общее число помеченных нулем концов отрезков равно 2а + Ь. Теперь рассмотрим отрезок в целом. Одна и только одна вершина с пометкой 0 лежит на конце отрезка. Каждая другая помеченная нулем вершина, если она существует, лежит внутри основного 1-симплекса и, следовательно, инцидентна с двумя симплексами подразделения. Теперь все такие вершины подсчи- подсчитаем в качестве концов отрезков подразделения. Общее число симплексов подразделения с пометкой 0 равно удвоенному числу помеченных нулем вершин внутри основного отрезка плюс еди- единица, соответствующая первоначально помеченной нулем вер- вершине. Таким образом, это число нечетно. Отсюда число, полу- полученное в конце предыдущего абзаца 2а + Ь, нечетно, а сле- следовательно, и b нечетно. Так как b — не что иное, как число симплексов подразделения, несущих полное множество пометок 0 и 1, то этим завершается доказательство сильного утвержде- утверждения для одномерного случая. Та же самая вычислительная процедура будет проведена и для произвольной размерности, но, возможно, совсем небеспо- небесполезно еще раз обратиться к рис. 1, прежде чем продолжить ин- индукцию. Рассмотрим (малые) 2-симплексы подразделения и для каждого из них, независимо от других, подсчитаем число сторон, имеющих пометку 0 на одном конце и пометку 1 на другом. Заштрихованный треугольник подразделения имеет одну такую сторону, как и любой другой треугольник, вершины которого не- несут все три пометки. Левый симплекс подразделения на самой вершине рисунка имеет две вершины, помеченные нулем, и одну--помеченную единицей, т. е. всего две стороны, имеющие пометки 0 и 1 на концах. Продвигаясь вниз слева, мы обнару- обнаруживаем у следующего треугольника две вершины с пометкой i и одну — с пометкой 0, так что имеются также две стороны, концы которых несут пометки 0 и 1. Возможны только такие типы по- помеченных симплексов, содержащих сторону, один конец которой помечен нулем, а другой — единицей. Обозначив через at число симплексов подразделения с двумя вершинами, помеченными нулем, и одной вершиной, помеченной единицей, а через а2 число симплексов, у которых две вершины помечены единицей, а одна помечена нулем, положим a = ai + a2. В таком случае а обозначает число симплексов подразделения, вершины которых несут пометки 0 и 1, но не пометку 2. Пусть b обозначает число
250 Ч. Томпкинс симплексов подразделения, имеющих все три пометки. Тогда об- общее число граничных сторон с пометками 0 и 1 на концах равно 2а + Ь. Некоторые из этих сторон, подобные той, что разделяет два верхних треугольника, инцидентных с левой стороной основного треугольника на рис. 1, лежат между двумя треугольниками подразделения и, конечно, встречаются дважды в предыдущем подсчете. Другие, подобные верхнему отрезку левой стороны большого симплекса, лежат на ребрах основного симплекса и включены в подсчет только один раз. Все стороны подразделе- подразделения, лежащие на ребрах большого симплекса, с пометкой 0 на одном конце и 1 на другом конце, должны лежать на стороне основного симплекса, имеющего вершины с пометками 0 и 1, причем одна из этих двух пометок недопустима на каждой из двух других сторон большого симплекса. Для этой стороны, по- поскольку она является 1-симплексом, уже доказано сильное ут- утверждение. Следовательно, число сторон с пометками 0 и 1, учи- учитываемых один раз в подсчете, нечетно, а общее число рав- равно этому нечетному числу, плюс удвоенное число сторон с по- пометками 0 и 1 (они учитываются дважды в общем подсчете) и, следовательно, является нечетным числом. Таким образом, опять приходим к выводу, что 2а+ Ь нечетно, из чего и сле- следует, что b нечетно. Этим доказано сильное утверждение для случая п = 2. Теперь используем то же самое доказательство, чтобы пока- показать, что если сильное утверждение справедливо для любого подразделения любого симплекса размерности ft, то оно спра- справедливо для любого подразделения любого симплекса размер- размерности ft+1. Рассмотрим подразделение (k+ 1)-симплекса с до- допустимо помеченными вершинами. Пусть а — число симплексов подразделения с вершинами, несущими все пометки от 0 до /?, но не пометку ft + 1. Так как любой (ft + 1)-симплекс имеет ровно k + 2 вершин, то у каждого из этих симплексов одна из пометок встречается на двух вершинах, а все остальные (за исключением, конечно, ft + 1) в точности на одной вершине. Су- Существует, следовательно, ровно две возможности выбора под- подчиненных симплексов, все вершины каждого из которых несут все пометки от 0 до ft. Поэтому число ft-граней, несущих все по- пометки от 0 до ft в этом множестве симплексов подразделения, равно 2а. Аналогично, если существует b симплексов подразде- подразделения с вершинами, несущими все пометки от 0 до ft + 1, то каждый из них содержит единственную ft-грань, несущую все пометки от 0 до ft, и число таких ft-граней в этих симплексах подразделения равно Ь. Тогда общее число ft-граней симплексов подразделения, несущих все пометки от 0 до ft, равно 2а + Ь.
Лемма Шпернера 251 Как и прежде, некоторые из этих граней лежат внутри пер- первоначального симплекса, а некоторые лежат на границе. Те, что лежат внутри, должны быть инцидентны в точности двум сим- симплексам подразделения по одному с каждой стороны грани. Те же, что лежат на границе, инцидентны единственному сим- симплексу подразделения, и все они лежат на ^-симплексе, под- подчиненном первоначальному (k + 1)-симплексу с вершинами, не- несущими пометки от 0 до k [так как каждая другая /г-грань первоначального (k+ 1) -симплекса не несет ни одной из этих по- пометок]. По предположению индукции сильное утверждение спра- справедливо для симплексов размерности k, и, следовательно, число ^-граней подразделения, учитываемых один раз, нечетно. При общем подсчете, как и прежде, это нечетное число склады- складывается с удвоенным числом ^-граней, подсчитываемых дважды, так что снова получается нечетное число. Тогда, как и прежде, 2а + Ь— нечетное число и отсюда вытекает, что b нечетно. Так как b— число симплексов подразделения с вершинами, не- несущими все пометки от 0 до k + 1, то этим доказывается сильное утверждение для каждого допустимого помечивания любого подразделения произвольного (k + 1) -симплекса. Этим и завер- завершается индуктивное доказательство, ибо мы показали, что мно- множество чисел п, для которых справедливо сильное утверждение, а следовательно, и лемма Шпернера, содержит число 1 и что если оно содержит любое число к, то оно содержит и следую- следующее число k+ 1. 3. Теорема Брауэра о неподвижной точке Самое непосредственное применение леммы Шпернера — знаменитая теорема о неподвижной точке, принадлежащая Брауэру. Она проиллюстрирована в п. 1 (непрерывное сжатие шара в подмножество внутренних точек). Ниже эта теорема будет сформулирована для n-симплекса, а не для n-шара. На самом деле теорема Брауэра сильнее, так как она не требует, чтобы образами были только внутренние точки симплекса; гранич- граничные точки также могут быть включены в множество образов. То, что мы использовали /г-симплекс вместо /г-шара, совершенно несущественно, поскольку легко перейти от одного к другому, используя взаимно однозначное отображение, т. е. сопоставляя каждой точке одной фигуры единственную точку другой, так что соседние точки одной переходят в соседние точки другой. Аргументы, изложенные в общих чертах в п. 1, в некоторых отношениях более широко применимы и, следовательно, более убедительны, чем те, которые будут использованы здесь для доказательства теоремы Брауэра о неподвижной точке. Более
252 Ч. Томпкинс убедительные аргументы, относящиеся к лемме Шпернера, бу- будут введены далее, как это и указано в п. 1. Теперь сформули- сформулируем теорему Брауэра о неподвижной точке, но отложим дока- доказательство до тех пор, пока не изложим некоторых предвари- предварительных алгебраических замечаний. Теорема Брауэра о неподвижной точке. Любое непрерывное отображение п-симплекса в себя оставляет по крайней мере одну точку неподвижной. Когда говорят, что отображение оставляет по крайней мере одну точку неподвижной, то под этим подразумевают, что суще- существует по крайней мере одна точка га-симплекса, совпадающая с ее образом. Отображение n-симплекса в себя просто обозна- обозначает правило, сопоставляющее каждой точке га-симплекса ее образ, являющийся точкой того же га-симплекса. Не требуется, чтобы каждая точка га-симплекса была образом некоторой точки при этом отображении; другими словами, не требуется, чтобы каждые две точки имели различные образы. Отобра- Отображение непрерывно в точке р, если для любой данной окрест- окрестности образа q точки р при этом отображении существует окрестность точки р, такая, что образ каждой точки из этой окрестности лежит в выбранной окрестности q. (В этом кон- контексте окрестности точек р и q можно понимать как внутренние точки я-шаров, — но без границы — с центрами р и q соответ- соответственно, но если n-шар содержит точки, не принадлежащие га-симплексу, то окрестность состоит только из тех точек га-шара, которые принадлежат га-симплексу.) Для установления непре- непрерывности рассматриваемые окрестности обычно выбираются достаточно малыми, а определение представляет собой просто формальное выражение того, что деформация, заданная ото- отображением, не позволяет разрывов, но допускает стягивания. Для того чтобы доказать теорему Брауэра о неподвижной точке, используя лемму Шпернера, мы должны указать систе- систематический способ помечивания точек подразделения. Это мо- может быть сделано геометрически, но это же можно сделать более просто и компактно в терминах координат. Обратимся теперь к предварительным алгебраическим замечаниям, о кото- которых упоминалось выше. Один из самых легких способов рассуждений в га-мерной геометрии использует термины координатных осей, подобных обычно используемым в координатной или аналитической гео- геометрии. Эти координаты предполагаются независимыми, т. е. если существует га координат, то каждая из них предполагается находящейся вне пространства, определяемого остальными. Во
Лемма Шпернера 253 многих приложениях удобно считать координатные оси взаимно перпендикулярными, а сами координаты измерять вдоль этих осей в терминах расстояний. Если это так, то выполняется обобщенная теорема Пифагора для расстояния, следующая из обычной теоремы Пифагора для двух и трех измерений. Расстояние между двумя точками с координатами и? и vt соответственно определяется по формуле [2 («I-*,)»]*- Для наших приложений лучше игнорировать эти пифагоровы аспекты геометрии и попытаться описать n-симплекс в терми- терминах симметрических координат. Исключение теоремы Пифагора приводит к отказу от понятия перпендикулярности, но сохра- сохраняет понятие параллельности. Возьмем координатные оси, условившись, что га+1 из них независимы в указанном выше смысле, но не интересуясь ни углами между ними, ни всем тем, что связано с расстояниями. С этой целью возьмем за начало координат некоторую отлич- отличную от вершины точку нашего га-симплекса, требуя только, чтобы лучи, идущие из начала через вершины га-симплекса (су- (существует, конечно, всего га+1 таких лучей), были независимы. Выберем эти лучи в качестве координатных осей. Координаты каждой вершины примут значения 0, за исключением той коор- координаты, ось которой проходит через эту вершину, и этой коор- координате придадим значение 1. Хотя мы не намерены здесь вдаваться в обсуждение аксиом многомерной геометрии, предположим, что вдоль любой коор- координатной оси могут быть сделаны шаги одинаковой длины. Более того, предположим, что шаги одинаковой длины могут быть сделаны вдоль любых двух параллельных направлений. Тогда точка с координатами {и,} получается движением точки по первой координатной оси до координаты и,, затем движением параллельно второй оси на длину и2 и т. д. При этих предпо- ложения-х у «-симплекса, каждая вершина которого имеет все координаты 0, кроме одной, равной 1, координаты каждой точки неотрицательны и в сумме дают единицу. (Пример можно найти в любой комнате. Возьмем вертикальную и две горизонтальные линии в любом из нижних углов комнаты в качестве координат- координатных осей и отмерим на каждой из них точку на расстоянии метра или около этого от угла, затем соединим в треугольник эти три точки. Это 2-симплекс в 3-пространстве. Если мы вместо метра будем пользоваться шагом, то нам трудно будет шагнуть точно на одну и ту же длину во всех направлениях, особенно
254 Ч. Томпкинс вверх. Если же, кроме того, комната старая и имеет осадку, так что угол уже не прямой, то исключается и понятие перпен- перпендикулярности.) Эти п+\ неотрицательных координат, в сумме дающие 1 и представляющие точку га-симплекса, называются барицентрическими координатами. Любая вершина имеет все барицентрические координаты О, за исключением единственной со значением 1. Любое (одномер- (одномерное) ребро состоит из точек, имеющих все барицентрические координаты 0, за исключением двух координат, соответствую- соответствующих вершинам этого ребра и отличных от нуля. Вспоминая определение носителя точки, мы можем утверждать, что только те координаты точки п-симплекса положительны, которые имеют значение 1 в вершинах носителя этой точки. Так как сумма барицентрических координат точки равна 1, то отсюда следует, что как только точка покидает ее носитель, то ее барицентрические координаты, прежде отличные от нуля, должны, вообще говоря, уменьшиться в то время как одна или более ее прежде нулевых координат становятся положитель- положительными. Мы должны отнестись к последнему из этих обстоя- обстоятельств несколько более внимательно. Прежде, однако, изло- изложим правило помечивания, связанное с отображением га-сим- га-симплекса с барицентрическими координатами в себя. Пометки, задаваемые непрерывным отображением га-симп- га-симплекса S в себя, определяются следующим образом: если точка p(S с образом q помечена и если их барицентрические коор- координаты соответственно {рг} и {д,}. то р помечивается /, если /—наименьший индекс, для которого д,<р^=?О. Для «произвольных функций» и «произвольных точек» ча- часто существует только один индекс, для которого барицентри- барицентрические координаты удовлетворяют неравенствам <7; ^С р,=?0, и фраза «наименьшее значение индекса» вставлена только для определенности. В принципе это классическое правило, но его компактная форма взяга у Куна П4]. Прежде всего укажем, что это правило удовлетворяет ранее изложенным условиям для допустимого помечивания множества точек S, если оно конечно и содержит все вершины S. Так как только ненулевые координаты вершин обособлены в соответ- соответствии с обособленностью координатных осей, проходящих через эти вершины, то каждая вершина будет помечена по-своему, ибо должно выполняться неравенство р,=^=0. Это же неравен- неравенство и высказанные выше утверждения о зависимости между положительными координатами точки и вершин ее носителя гарантируют выполнение и других условий допустимого поме- помечивания. Следовательно, справедливо, что если вершины произ- произвольного подразделения п-симплекса помечены по правилу,
Лемма Шпернера 255 связанному с непрерывным отображением S в себя, то это под- подразделение и его помечивание будут удовлетворять условию леммы Шпернера. Нам теперь потребуется еще одно утверждение, достаточно правдоподобное, чтобы можно было отсрочить доказательство его справедливости. Для любого заданного симплекса S суще- существует достаточно мелкое подразделение, т. е. существует такое подразделение, что длина наибольшего одномерного ребра симплекса этого подразделения как угодно мала. Это так, если, что представляется очевидным, процесс подразделения может быть продолжен бесконечно и если подразделение в общем случае заменяет один симплекс на некоторое множество меньших. Сделав это предположение, мы можем теперь закончить доказательство теоремы Брауэра о неподвижной точке. Возь- Возьмем бесконечную последовательность подразделений с мел- мелкостью, т. е. длиной наибольшего одномерного ребра, стремя- стремящейся к 0. Из каждого подразделения выберем один симплекс, несущий все пометки, и в этом симплексе выберем единствен- единственную точку. Тогда мы имеем бесконечную последовательность точек в исходном симплексе S и можем выбрать подпоследова- подпоследовательность, сходящуюся к единственной точке. Эта точка, оче- очевидно, является предельной точкой последовательностей всех вершин всех симплексов, из которых только что выбраны точки сходящейся подпоследовательности. Так как в соответствии с нашим правилом помечивания для одной из этих вершин вы- выполняется <^<1р, для каждого / и так как такие неравенства, очевидно, сохраняются в пределе, то справедливо, что не суще- существует барицентрической координаты образа предельной точки выбранной подпоследовательности, превышающей барицентри- барицентрическую координату самой предельной точки. Следовательно, по- поскольку барицентрические координаты должны быть в сумме равны I, то барицентрические координаты образа предельной точки должны быть в точности такие же, как барицентрические координаты самой предельной точки, и так как координаты в (п+1)-мерном пространстве совпадают, то должны совпадать сами точки. Этим завершается доказательство теоремы Брауэра о непо- неподвижной точке. 4. Подразделения симплекса Здесь мы столкнемся более непосредственно с проблемой, от которой уклонялись в предыдущих пунктах, — существует ли некоторый способ последовательных подразделений п-симплекса,
256 Ч. Томпкинс удовлетворяющий некоторым ограничениям на подразделения, и, в частности, такой способ, при котором мелкость подразде- подразделений стремится к нулю. Будем полагать, что последнее утвер- утверждение достаточно очевидно, в то время как первое будет изу- изучено, и от этой линии изложения мы не будем отклоняться. Легко рассмотреть многие способы последовательных под- подразделений 2-симплекса, однако, последовательное подразделе- подразделение уже 3-симплекса требует некоторого внимания. Вспомним следующие обстоятельства: 1) мы использовали предположение, что внутренние грани подразделения инцидент- инцидентны в точности двум симплексам подразделения, и 2) мы требо- требовали, чтобы каждая вершина любого симплекса подразделения была вершиной каждого инцидентного с ней симплекса подраз- подразделения. Изложим две схемы подразделений, очевидно, на- наследственно обладающих этими свойствами. При этом, однако, будем предполагать, что вершины подразделяемого симплекса заданы в терминах барицентрических координат некоторого со- содержащего симплекса, и будем работать в терминах этих бари- барицентрических координат. Относящееся к вершинам свойство 2 будет гарантировано тем, что все новые вершины зависят только от барицентрических координат вершин носителя. Если два подразделяемых симплек- симплекса имеют общие подчиненные симплексы, то эти подчиненные симплексы обладают одними и теми же вершинами и любые но- новые вершины, добавленные в общие подчиненные симплексы, за- занимают позиции, не зависящие от «родительского» симплекса, и, следовательно, совпадают. Рассмотрим сначала барицентрическое подразделение. Для любого данного /г-симплекса, вершины которого являются точ- точками ^-симплекса с барицентрическими координатами, назовем барицентром точку с барицентрическими координатами, рав- равными арифметическому среднему соответствующих координат всех вершин ^-симплекса. Для построения барицентрического подразделения n-симплекса, являющегося в свою очередь од- одним из симплексов подразделения S, возьмем барицентры всех подчиненных ему симплексов, за исключении (—1)-симплекса. Каждый симплекс барицентрического подразделения имеет в качестве вершин множество из (п+1)-точек — барицентров подчиненных симплексов, причем симплексы берутся всех размерностей от и до 0, и каждая размерность участвует в этом построении только один раз. Более того, если вершина v2 является барицентром симплекса S2 меньшей размерности, чем симплекс S{ с барицентром v\, и если и v\, и v2 — вер- вершины симплекса подразделения, то S2 предполагается подчи- подчиненным Si. Так например, вершины одного из симплексов
Лемма Шпернера 257 барицентрического подразделения 3-симплекса (т. е. тетраэдра с внутренними точками) будут состоять из центра тяжести те- тетраэдра (т. е. барицентра 3-симплекса), центра тяжести одной из его граней, середины одного из ребер выбранной грани и од- одного из концов этого ребра. С помощью несложного чертежа и простых выкладок читатель сможет убедиться в том, что бари- барицентрическое подразделение действительно дает способ после- последовательного подразделения, удовлетворяющего всем указан- указанным выше свойствам. Таким же образом можно прийти к выводу, что симплексы последовательных барицентрических подразделений, хотя их мелкость и стремится к нулю, становятся все более и более вы- вытянутыми по сравнению с их шириной, а это не всегда желатель- желательное свойство. Поэтому, помимо этого основного, изложим дру- другой метод подразделения, принадлежащий X. Уитни [22, стр 489— 491]. Этот метод1) подразделения обладает тем свойством, что симплексы, получаемые при последовательном подразделении, имеют только конечное число видов. В схеме Уитни вершинами подразделения п-симплекса Яв- Являются вершины подразделяемого симплекса и барицентры (се- (середины) одномерных ребер подразделяемого симплекса. Далее середина каждого ребра используется как вершина каждого ин- инцидентного с ней симплекса подразделения, так что вышеизло- вышеизложенное требование 2 к вершинам подразделения наследственно выполняется. Прежде чем мы приступим к самому подразделению га-сим- га-симплекса, обозначим его вершины v{, где / изменяется от 0 до п. Затем определим множество точек vtj для /^С/ с двумя индек- индексами, изменяющимися от 0 до п (или, более точно, i изменяется от 0 до я, а / от i до п). Положим и,-,- = у,- и возьмем в качестве Vij середину ребра с концами и* и Vj. Теперь определим частич- частичное упорядочение точек vtj. Одна такая точка предшествует второй тогда и только тогда, когда первый индекс первой точки не менее чем первый индекс второй точки, а второй индекс пер- первой точки не более чем второй индекс второй точки. Таким об- образом, мы можем переходить от точки к непосредственно сле- следующей за ней или оставляя первый индекс фиксированным и увеличивая второй индекс (если это возможно), или оставляя второй индекс фиксированным, а уменьшая первый индекс (если это возможно); при этом увеличиваем или уменьшаем каждый раз индекс только на 1. Очевидно, не существует точек, предше- предшествующих точке вида Vjj, так как требуется, чтобы второй ин- индекс был не меньше первого; также нет точек, следующих за ') Уитни называет этот метод стандартным. — Прим. перев, 17 Зак. 909
258 Ч. Томпкинс точками вида t>on. Из этих замечаний видно, что максималь- максимальное вполне упорядоченное множество точек будет содержать п+1 точку и таких множеств будет 2". Прежде чем изложить довольно-таки скучное доказательство этого утверждения, ука- укажем все максимальные вполне упорядоченные множества точек для га = 3: ^П> ^12' ^02. ^03 ^22' ^23> ^13' ^03 V22, ^ 12' ^02' ^03 ^33' ^23' ^13' ^ОЗ- Приведенные максимальные вполне упорядоченные множе- множества точек расположены так, что четыре максимальных вполне упорядоченных множества точек для п — 2 могут быть получены из левого столбца последовательностей исключением последних точек каждого множества. Подсчет числа таких множеств оче- очевиден: начиная с t>on, справа существует два способа выбора следующего элемента слева на каждом шагу. Подразделение состоит из симплексов, имеющих в качестве вершин точки этих максимальных вполне упорядоченных мно- множеств точек. Если попробовать осуществить его на примерах, то это почти сразу разъяснит его суть и приведет к индуктивному доказательству того, что подразделение удовлетворяет свой- свойствам 1 и 2. Пример для двумерного случая легко построить с помощью изложенного выше замечания, и ход индукции не- нетрудно понять, если читатель попытается распространить этот пример на случай трех измерений. 5. Обзор изложенного и второе введение • "¦¦ Мы уже доказали лемму Шпернера и вывели теорему Бра- уэра о неподвижной точке. Эта лемма довольно занимательна, а теорема о неподвижной точке хотя и может показаться не- неопытному читателю не имеющей столь уж очевидного значения, но в действительности она является одной из замечательных и волнующих теорем топологии. В этом пункте мы обсудим ситуа- ситуацию в связи с окончанием доказательств этих двух утверждений, отмечая, что не очень-то заметно, насколько мы приблизились к изложенной в первом введении цели, и поэтому наметим пути для ее достижения. Сила теоремы Брауэра о неподвижной точке заключается от- отчасти в справедливости аналогичных утверждений не только по отношению к симплексам (как это отмечалось выше) и отчасти
Лемма Шпернера 259 в ее нескольких известных обобщениях (мы упомянем о ннх в дальнейшем). Сначала займемся расширением теоремы Брауэра о непо- неподвижной точке на области, отличные от симплексов. Для этого проведем очевидное обобщение классического отображения кар- карты. Карта представляет собой непрерывный, хотя, возможно, и ис- искаженный образ отображаемой области; он обладает тем свой- свойством, что каждая точка отображаемой области переходит в единственную точку на карте, а каждая точка на карте является образом единственной точки отображаемой области, и эти ото- отображения области в карту и карты в область оба непрерывны. Слово «карта» может пониматься читателем как лист бумаги, на котором вычерчена часть поверхности Земли. Если кусок бу- бумаги плоский, то без искажений не обойтись, ибо невозможно отобразить любую желаемую часть сферы на плоский лист без искажений. Некоторые карты, например, полученные с помощью гномонической проекции, обладают тем свойством, что образы больших окружностей на сфере являются прямыми на карте. Од- Однако углы в этих проекциях искажены. Некоторые карты, такие, как проекция Меркатора, которая отображает меридианы дол- долгот и параллели широт в прямые, сохраняют углы, но искажают расстояния (гномоническая проекция также искажает расстоя- расстояния). Например, при приближении к полюсам при проекции Меркатора расстояния на карте становятся неестественно боль- большими по сравнению с теми же расстояниями вблизи экватора, так что многие школьники имеют превратное представление о размерах географических объектов на дальнем Севере и дале- далеком Юге. Отображаемые области таковы, что желаемые свойства при- применимы к ним, и поэтому, несмотря на эти искажения, карта по- получается лишь операциями растяжения и сжатия и, что наиболее важно в наших приложениях, непрерывное отображение обла- области в себя индуцирует непрерывное отображение карты в себя. Нетрудно распространить эти идеи, связанные с картами, и на другие размерности. Для этого можно просто воспользовать- воспользоваться обычным глобусом или какой-либо физической моделью в случае трехмерных отображений. Глобус может быть представ- представлен как отображение поверхности Земли вместе с ее недрами на объект той же формы, но много меньших размеров и удобный для изучения. То же самое справедливо и для моделей. Может случиться и так для некоторых моделей, что их размеры боль- больше основного объекта — модели биологических клеток, молекул, кристаллических решеток и т. д. Продолжая далее, мы можем легко сконструировать отображение 3-симплекса в трехмерный шар, т. е. замкнутого тетраэдра с его внутренними точками в 17*
260 Ч. Томпкинс точки сферы и внутренние точки трехмерного пространства, ог- ограниченного этой сферой. Например, если тетраэдр вписан в сферу, то отрезки, соединяющие центр сферы с граничными точ- точками тетраэдра, могут быть отображены на радиусы сферы про- простым растяжением из центра сферы. Растяжение должно быть равномерным вдоль каждого из этих отрезков и таким, чтобы оно растягивало отрезок как раз в радиус. Такое отображение вполне подходит для целей распространения теоремы Брауэра о неподвижной точке на случай шара, а именно, если мы рас- рассмотрим любое непрерывное отображение шара в себя, то есте- естественно индуцируемое отображение симплекса в себя непрерыв- непрерывно и, следовательно, существует неподвижная точка. Точка ша- шара, являющаяся образом неподвижной точки при индуцирован- индуцированном отображении, будет неподвижной точкой для первоначаль- первоначального отображения. Отображение с перечисленными свойствами называется го- гомеоморфизмом, а отображаемая область и ее образ называются гомеоморфными. Существенны следующие свойства: 1) каждая точка отображаемой области имеет единственный образ на кар- карте; 2) каждая точка на карте является образом ровно одной точ- точки отображаемой области; 3) отображение области на карту не- непрерывно и 4) обратное отображение, сопоставляющее каждой точке на карте точку отображаемой области, образом которой она является, непрерывно. Не будем вдаваться здесь в простран- пространное обсуждение, но очевидно, что существуют многочисленные гомеоморфизмы для симплексов всех размерностей и что тео- теорема Брауэра о неподвижной точке должна быть справедлива для любого из этих гомеоморфных образов. Теорема Брауэра о неподвижной точке. Не- Непрерывное отображение любого гомеоморфного образа п-симп- лекса в себя обладает по крайней мере одной неподвижной точ- точкой. В частности, допустимое пространство стратегий в игре с ну- нулевой суммой для двух лиц гомеоморфно симплексу подходя- подходящей размерности. Элементарное изложение теории игр см. в [3, стр. 191—210] или [23]. а для более широкого ознакомления с этими вопросами см. литературу, цитируемую в указанных ис- источниках, и многочисленную более свежую литературу. Знамени- Знаменитая книга Дж. фон Неймана и О. Моргенштерна [18] обычно служит классической ссылкой в теории игр и ее наиболее непо- непосредственных приложениях. Какутани отметил, что хотя теорему Брауэра о неподвиж- неподвижной точке нельзя использовать непосредственно для доказатель-
Лемма Шпернера 261 ства фундаментальной теоремы теории игр, но довольно прямое ее обобщение уже может быть применено. В этом обобщении ис- используется такое отображение симплекса в множество точек сим- симплекса, что образ каждой точки является выпуклым множест- множеством, содержащим по крайней мере одну точку. Так как число то- точек в образах меняется от точки к точке в этом симплексе, то непрерывность определить трудно, однако полунепрерывность сверху имеет смысл. При этом условии ему удалось, используя простое рассужде- рассуждение, связанное с предельным переходом, доказать свою теорему о неподвижной точке, из которой непосредственно вытекает фун- фундаментальная теорема теории игр. Другие весьма элементарные, но интересные приложения результатов этого типа изложены А. Таккером [20] и Ки Фа- Фаном [7]. Иного типа рассуждение, связанное с предельным переходом, было использовано Шаудером в применении к простран- пространствам бесконечных размерностей. В этом случае трудно непо- непосредственно использовать лемму Шпернера, и поэтому Шау- дер распространил теорему Брауэра о неподвижной точке на выпуклые тела в банаховых пространствах [19]. Банаховы про- пространства могут быть бесконечномерными, и в них сохраняются понятия линейного отрезка и вектора, при этом они могут вести себя настолько хорошо, что могут обладать многими свойствами конечномерных евклидовых пространств. Ясное изложение тео- теории Шаудера и некоторых ее непосредственных приложений можно найти в [4, гл. 15] и в других работах по топологии. Тео- Теория Шаудера была применена как для доказательства существо- существования решений уравнений в частных производных эллиптиче- эллиптического типа, так и для доказательства существования решения стандартной задачи для обыкновенного дифференциального уравнения y' = f(jc, у), где х — действительная переменная, у есть га-мерный действи- действительный вектор, а Хо, уо — действительные константы. Многие из задач теории обыкновенных дифференциальных уравнений, включающих такие начальные условия, могут быть представле- представлены в таком виде. Теория Шаудера обеспечивает решения при желательной степени общности для функции f. Мы теперь обсудим те шаги, которые позволят нам прибли- приблизиться к цели, изложенной в первом введении. В этой связи от- отметим, что все рассуждения, используемые в следующих пунк- пунктах, инвариантны относительно гомеоморфизмов и, следователь-
262 Ч. Томпкинс но, область применимости полученных нами результатов гораздо шире, чем та, которая обычно рассматривается. Решающий момент, позволяющий достигнуть нашей первона- первоначальной цели, заключается в том, что помечивание вершин эк- эквивалентно заданию некоторого отображения (функции) ка- каждого симплекса подразделения (область определения) в один и тот же образ — симплекс, который не является частью под- подразделения (область значений). Эту функцию можно считать ли- линейной и построить ее для любого симплекса подразделения (об- (область определения), сопоставляя вершинам этого симплекса, в соответствии с их пометками, вершины симплекса области зна- значений и определяя образы остальных точек линейной интерполя- интерполяцией. Позже мы опишем такое отображение более точно. Нам нужно будет проследить за тем, сколько раз (с учетом знака) симплекс области значений полностью накрывается одним из симплексов подразделения, т. е. мы должны приписать знак каждому помечиванию, в котором встречаются все пометки. И в конце концов мы получим целое число, связанное с сим- симплексом области значений, равное сумме всех этих чисел с уче- учетом знаков. Путь построения достаточно общей теории симплициаль- ных гомологии — основы алгебраической топологии — представ- представляется не более трудным, чем другие. Поэтому в п. 6 рассмо- рассмотрим ориентированные симплексы, их ориентированные границы и ориентированные симплициальные отображения, в п. 7—• &-цепи, циклы и граничные циклы. Вообще говоря, цикл является объектом без границы, таким, как, например, сфера или тор с двумерном случае, окружность в одномерном случае и т. д.; не являются циклами окружность с внутренними точками в дву- двумерном случае, линейный отрезок в одномерном и т. д. Очевид- Очевидно, что все (п— 1)-грани п-симплекса образуют цикл и только этот цикл может быть построен из подчиненных я-симплексу симплексов размерностей, меньших п, и не является граничным среди всех этих симплексов меньшей размерности, т. е. не яв- является границей некоторого другого геометрического объекта, построенного на этих симплексах. Это свойство мы будем ис- использовать и в п. 8 докажем фундаментальную теорему об ин- индексе, позволяющую приблизиться к целям, о которых говори- говорилось в п 1. В п. 9, опуская детали, мы кратко изложим несколько примеров, и в частности, фундаментальную теорему алгебры (о том, что каждый многочлен положительной степени имеет по крайней мере один корень в комплексной плоскости). И наконец, в п. 10 мы покаемся в некоторых из наших грехов и подскажем ссылки, которые могут быть использованы для до- достижения большей строгости в рассуждениях.
Лемма Шпернера 263 6. Ориентированные симплексы, их границы и ориентированные симплициальные отображения Идея ориентации не является необходимой в алгебраической топологии, но мы можем ввести ее для того, чтобы получить ре- результаты, которые каким-либо другим образом получить нелег- нелегко. По существу она заключается в обобщении понятия враще- вращения по часовой и против часовой стрелки. Таким образом, под ориентированным 2-симплексом мы понимаем не только множе- множество точек, т. е. треугольник с внутренними точками, но также и циклическое направление движения вдоль его граничного тре- треугольника. Если два 2-симплекса содержат одни и те же точки, т. е. они построены на одних и тех же вершинах, но предписан- предписанные им движения вдоль граничного треугольника различны, то они рассматриваются как различные ориентированные 2-симп- лексы. Обычно говорят, что один из них противоположно ориен- ориентирован по отношению к другому. В таком случае, если мы имеем один 2-симплекс и хотим обозначить ориентированный 2-симп- лекс с теми же самыми точками, но с противоположной ориен- ориентацией, то просто припишем к символу, обозначающему первый симплекс, коэффициент— 1. Мы распространим эту идею в двух направлениях: 1) обобщим определение ориентации на симп- симплексы любой размерности; 2) расширим область коэффициен- коэффициентов, которые могут быть приписаны к любому символу, обозна- обозначающему симплекс, до кольца всех целых чисел. (Возможны другие области коэффициентов в различных вариантах алге- алгебраической топологии, но обсуждение этого отвлекло бы нас.) Ясное изложение на достаточно элементарном уровне можно найти в [15], а более формальное изложение в [6]. В частности, работу [15] можно рекомендовать как источник дополнительных замечаний по основным излагаемым здесь направлениям. См. также более позднюю работу [17]. Мы по-прежнему предполагаем симплексы, вложенными в ев- евклидово пространство достаточно большой размерности, хотя в [6] это ограничение неким образом ослабляется, о чем будет вскользь упомянуто в п. 10. Точки я-симплекса вполне опреде- определяются заданием его п+\ вершин, не принадлежащих одновре- одновременно пространству размерности п—1. Ориентированный п-сим- плекс (точки и ориентация) определяется заданием п + \ вер- вершин и указанием их линейного порядка. Некоторые различные порядки, однако, могут привести к одному и тому же ориенти- ориентированному симплексу. В случае п = 2 обозначим три вершины через a, b и с. Тогда порядки следования (о, Ь, с) (Ь, с, а) и (с, а, Ь) эквивалентны и
264 Ч. Томпкинс соответствуют движению вокруг граничного треугольника в од- одном и том же направлении. Противоположно ориентированный симплекс может быть задан любым из порядков следования вершин: (Ь, а, с), (о, с, Ь) или (с, Ъ, а). Отметим, что эти шесть порядков составляют в точности шесть различных перестановок трех элементов a, b и с. Для того чтобы компактно описать алгебраическую процедуру опре- определения относительных ориентации симплексов, обсудим поня- понятие четности перестановки. Это широко известное и легко усваи- усваиваемое понятие, но мы приведем точные определения. Вообще, четность перестановки зависит от последовательного располо- расположения элементов, т. е. перестановка является четной, если число транспозиций пар соседних элементов, требуемых для преобра- преобразования перестановки в последовательно возрастающую, четно, и нечетной — в противном случае. Заметим, что рассмотренные выше эквивалентные порядки ориентированных 2-симплексов яв- являются четными перестановками при переходе от одного к дру- другому, а перестановка порядка вершин ориентированного сим- симплекса на порядок противоположно ориентированного дает при- пример нечетной перестановки. Это и будет положено в основу определения относительной ориентации. Теперь возьмем множество п+\ символов вместе с припи- приписанным им упорядочением и заменим его множеством 0, 1, ... ..., п. Рассмотрим любую перестановку Р первоначальных сим- символов. Осуществляя замену символов числами, мы можем за- заменить Р упорядоченным множеством целых чисел р0, р\, ... .. ., рп, лежащих в отрезке [0, п\, причем ни одно из них не ис- используется дважды. Перестановку относительно исходного по- порядка назовем четной, если является четной сумма по i (O^Ci-^ *Сп) остатков от деления на 2 числа всех значений />/, для ко- которых pj<pi, и нечетной — в противном случае. Предлагаем читателю убедиться в справедливости этих опре- определений в случае перестановок трех символов, а также доказать легкую теорему о том, что транспозиция любых двух элементов перестановки меняет ее четность (об этой теореме уже упомина- упоминалось раньше). И наконец, если Pi, Рг и Рз — перестановки я сим- символов, Р2 является четной относительно Pi и Р3 является четной относительно Р2, то и любая из этих перестановок является четной относительно любой другой. Рассмотрим теперь n-симплекс с вершинами а0, аъ ...,ап и зададим на вершинах тот же линейный порядок, в котором они выписаны. Это не что иное, как реализация ориентированного и-симплекса, и все другие реализации этого n-симплекса дол- должны определяться теми же самыми вершинами и линейным по--
Лемма Шпернера 265 рядком, являющимся четной перестановкой по отношению к за- заданной. Ориентированный п-симплекс является /г-симплексом вместе с множеством всех таких линейных упорядочений его вершин, что каждое упорядочение множества вершин является по отно- отношению к другому четной перестановкой. Верно также, что ориентация n-симплекса определяет есте- естественную ориентацию граничных подчиненных симплексов раз- размерности п — 1. Это хорошо видно в уже описанном случае п = 2. Одномерные симплексы на границе направлены в соответ- соответствии с этой ориентацией; из этого следует, что один 0-мерный симплекс каждого ребра является начальной вершиной, а дру- другой — конечной. Ориентацию я-симплекса можно связать с ориентацией (п—1)-симплексов: последняя как бы видна из той вершины n-симплекса, которая не принадлежит этому (п — 1)-симплексу. Прежде чем дать точные определения, следует уточнить опреде- определение противоположно ориентированных симплексов. Два симплекса Si и S2 равны, но противоположно ориенти- ориентированы, если они имеют одно и тоже множество вершин, и по- порядок, присвоенный вершинам Si, является нечетной переста- перестановкой по отношению к тому порядку, который присвоен верши- вершинам 5г. Как было указано в начале этого пункта, тот факт, что Si и S2 равны, но противоположно ориентированы, записывается так: 5i = — S2. Пусть S — ориентированный п-симплекс с вершинами а0, oi, . . . , о„, упорядоченными, например, в соответствии с их за- записью. Тогда граничными ориентированными (п— 1) -симплек- -симплексами п-симплекса 5 являются симплексы (—l)ft5ft, где Sk — ори- ориентированный (п—1)-симплекс со всеми, кроме аи, вершинам» n-симплекса, которые могут быть выписаны в указанном выше порядке (вершина ak в записи опускается). Для доказательства непротиворечивости этого определения нужно только показать, что одни и те же граничные (п— ^-сим- ^-симплексы порождаются любым допустимым упорядочением вер- вершин я-симплекса, но это очевидно и мы не будем на этом останавливаться. В следующем пункте мы введем сложение и сокращение ко- коэффициентов примерно так же, как мы поступили с —1 в выше- вышеизложенном определении. При этом окажется, что каждый под- подчиненный /г-симплексу (п — 2)-симплекс встречается на границе ровно двух подчиненных (п—1)-симплексов, но с противопо ложными ориентациями, так что после сокращений любому (п — 2)-симплексу в качестве коэффициента будет приписан 0.
266 Ч. Томпкинс а, следовательно, любому симплексу меньшей размерности на границе n-симплекса в качестве коэффициента будет приписан О и потому их можно не принимать во внимание. Эти утвер- утверждения легко проверить в случае я = 2, 3, и мы предоставляем проделать это самому читателю. В заключение обратимся к симплициальным отображениям. Симплициальным отображением называется отображение ори- ориентированного симплекса (область определения) Sd в сопостав- сопоставляемый ему симплекс Sr. Для наших целей можно ограничиться предположением, что тело симплекса и сопоставляемый ему симплекс области значений имеют одну и ту же размерность. Симплициальное отображение вполне определяется образа- образами вершин Sd, но при этом требуется, чтобы эти образы были вершинами Sr, хотя и не обязательно различными. Образы 1-симплексов, подчиненных Sd, являются подчиненными Sr сим- симплексами размерности, не большей 1. Отображение, которое мо- может и не быть гомеоморфизмом, определяется линейной интер- интерполяцией образов вершин. Этот процесс линейной интерполяции может быть продолжен индуктивно, но в некоторых отношениях его легче представить в терминах барицентрических координат, введенных в п. 3. Пусть р( — барицентрические координаты точки P?Sd, и пусть <?„—барицентрические координаты ее образа Q в некотором подчиненном Sr симплексе с вершинами, являю- являющимися образами всех вершин Sd. Им может быть и сам Sr, а для ориентированных симплексов необходимо всегда иметь в виду существование равных, но противоположно ориентиро- ориентированных симплексов. Тогда для каждого 0 значение qa равно сумме координат pi по множеству / вершин, отображающихся в эту вершину а. Этим линейная интерполяция вполне опре- определена. Особый интерес для нас представляют симплициальные ото- отображения, при которых каждая вершина Sr является образом только одной вершины Sd- Эти отображения накрывают S,, и ориентации Sr и Sd могут быть согласованы или нет в зависи- зависимости от того, будет или нет для допустимого линейного упоря- упорядочения вершин ориентированного симплекса Sd упорядочение образов согласовано с допустимым последовательным упорядо- упорядочением вершин ориентированного симплекса Sr. Не вдаваясь в детали, отметим, что можно связать разность числа согласованных и не согласованных накрывающих Sr ото- отображений с подобной же разностью для одной из ориентиро- ориентированных граней, где Sr — фиксированный симплекс, a Sd может быть любым из симплексов подразделения. Этим мы заканчи- заканчиваем данный пункт, а в следующем изложим некоторые из эле- элементарных аспектов симплициальной теории гомологии.
Лемма Шпернера 267 7. Гомологии: ft-цепи, циклы, граничные циклы Мы уже отмечали ранее, что будем интересоваться системой коэффициентов (с учетом знаков) накрываемого симплекса при симплициальных отображениях тел симплексов подразделения, а также отмечали, что будем приписывать коэффициент — 1 рав- равному, но противоположно ориентированному я-симплексу. Тогда же мы затрагивали вопрос о том, что допустимо в качестве ко- коэффициента перед символом, обозначающим некоторый симп- симплекс, использовать любое целое число. Это не дает никаких пре- преимуществ при рассмотрении симплексов подразделения, но при- приобретает вполне очевидный смысл в связи с намеченной целью подсчитать алгебраическое число накрытий симплекса области значений. В дальнейшем удобно, однако, допускать коэффи- коэффициент 0 при симплексах подразделения и никаких особых труд- трудностей у нас не возникнет, если мы допустим любые другие по- положительные или отрицательные целые числа (отрицательные числа показывают, что симплекс противоположно ориентирован по отношению к симплексу с противоположным коэффициен- коэффициентом). Более того, допуская такие коэффициенты, мы сможем развить часть классической теории гомологии классической ал- алгебраической топологии. Повторяем, что эта теория четко и в более общей форме изложена в [15] и в других работах по топо- топологии. Нам потребуется определение симплициальной k-цепи. Это абстрактный объект, построенный на конечном числе fe-симп- лексов, каждому из которых приписан целочисленный коэф- коэффициент. В подразделениях симплексов, обсуждавшихся в связи с леммой Шпернера и теоремой Брауэра о неподвижной точке, ориентацию следует указать для основного симплекса, аналогичные ориентации следует указать на каждом из симп- симплексов подразделения и построить цепь на всех этих ориентиро- ориентированных симплексах; каждому из них нужно приписать коэффи- коэффициент 1. Мы обнаружим, что теорию гомологии понадобится приме- применить к каждому из подразделений независимо, так что всегда имеется только конечное число симплексов, подразделения кото- которых рассматриваются и на которых можно построить цепи. Для приложений обычно удобно ориентировать симплексы определенным способом в соответствии с ориентацией, перво- первоначально указанной в задаче, но в нашем исследовании это несущественно. Мы исходим из произвольного конечного множе- множества симплексов, такого, что все подчиненные симплексы мень- меньшей размерности также допускают построение цепей. Симплек- Симплексам этого множества присвоена естественная или произвольная
268 Ч. Томпкинс ориентация и этот геометрический объект называется комплек- комплексом. Комплекс состоит из конечного множества ориентированных симплексов, которое содержит любой симплекс (с некоторой за- заданной ориентацией), подчиненный каждому из симплексов это- этого множества. Следует отметить, что не все симплексы имеют одинаковую размерность и что всем симплексам комплекса присвоена ори- ориентация; при этом ориентация граничного симплекса может как совпадать, так и не совпадать с естественно заданной. В случае, когда S есть n-симплекс комплекса, (п — ^-симплек- ^-симплексы на границе S имеют естественно заданную ориентацию, а для симплексов меньшей размерности она не указана, то ориента- ориентацию тем же самым естественным способом задают и этим симплексам. Поскольку, как в наших приложениях, так и во всех простей- простейших приложениях теории гомологии, симплексы, которые могут быть использованы для построения fe-цепи, выбираются из фик- фиксированного конечного множества, то можно несколько упро- упростить описание, предполагая, что это конечное множество является множеством /г-симплексов некоторого комплекса с за- заданной ориентацией. Если один из этих симплексов в действи- действительности не используется, то мы просто приписываем ему в качестве коэффициента 0. Это можно формализовать в следую- следующем определении, если допускать в качестве коэффициента 0. k-цепь над комплексом К состоит из множества ^-мерных ориентированных симплексов комплекса К вместе с целочислен- целочисленными коэффициентами, приписанными каждому из симплексов. Укажем один простой пример fe-цепи — все согласованно ориентированные симплексы подразделения с коэффициентами 1. Другой простой пример, уже упоминавшийся ранее, — множе- множество граничных ^-симплексов (k+ 1)-симплекса. Более конкрет- конкретно, пусть S—ориентированный (k+ 1)-симплекс. Из него мож- можно построить (&+1)-цепь, если приписать ему коэффициент 1. И хотя это несущественно в данный момент, уместность такого преобразования станет очевидной позже. Симплекс S имеет k + 2 подчиненных ^-симплексов на границе. Эти симплексы, ес- если их каким-нибудь образом ориентировать и приписать им ко- коэффициенты + 1 или —1 по указанным в предыдущем пункте правилам, образуют &-цепь, являющуюся ориентированной гра- границей S. Таким образом, граница каждого ориентированного симп- симплекса является цепью, размерность которой на единицу меньше размерности симплекса. Ясно, что такая цепь может быть по- построена, когда этот симплекс предполагается взятым один раз
Лемма Шпернера 269 (только один симплекс для такой цепи и коэффициент при нем 1) и что следует удвоить коэффициенты граничных симплексов, если рассматриваемый симплекс взят дважды (опять только один симплекс для такой цепи и коэффициент при нем 2). Эта ситуация удвоения может возникать естественно в предельном процессе с двумя симплексами, сближающимися друг с другом вдоль их границ до тех пор, пока они не совпадут в пределе. Так как в приложениях будут встречаться соображения подобного рода, то легко видеть, как определить границу fe-цепи. Формаль- Формально это будет изложено ниже в три этапа. Для &>0 граница ориентированного ^-симплекса S — это (k—1)-цепь, симплексы которой являются граничными (k—1)- симплексами S, каждый из которых ориентирован согласованно с S в смысле предыдущего пункта и каждому из которых при- приписан коэффициент 1. Граница 0 симплекса пуста. На следующем шаге введем понятие суммы двух или более й-цепей. Это понятие требуется в наших приложениях в двух слу- случаях, один из которых был уже упомянут, — алгебраический способ подсчета числа накрытий сопоставленного симплекса- об- области значений. Второе основное приложение заключается в из- излагаемой позже лемме — граница границы является иепью, все коэффициенты которой равны 0. Следует обратить внимание на еще одну формальность, пре- прежде чем мы определим границу цепи. Цепь может быть построе- построена на симплексах, разделяемых гранью, так что один из (k—1)- симплексов в границе &-цепи может участвовать дважды. Раз- Разрешение этой трудности тривиально, и мы вернемся к этому без дальнейших обсуждений, определив сумму fe-цепей. Сумма конечного числа &-цепей комплекса К есть /г-цепь К с коэффициентами, равными суммам соответствующих коэффи- коэффициентов слагаемых fe-цепей. Для определения границы й-цепей теперь все готово. Конеч- Конечно, всегда важно помнить, что грани любого симплекса в ком- комплексе К также являются симплексами комплекса К, хотя воз- возможно с противоположной ориентацией. Граница fe-цепи комплекса К исчезает, если k — О; в против- противном случае она является (k— 1)-цепью, возможно исчезающей. Эта граница является суммой границ ^-симплексов комплекса К, причем число раз, которое берется каждая граница, равно абсолютной величине коэффициента симплекса в цепи; отрица- отрицательные коэффициенты означают противоположные ориентации. Под исчезающей (k—1) -цепью мы понимаем цепь, все ко- коэффициенты которой равны нулю. То, что это возможно, иллю- иллюстрируется простым, но фундаментальным примером, состав- составляющим содержание следующей леммы.
270 Ч. Томпкинс Лемма. Граница границы k-цепи исчезает. Доказательство в основном будет опущено, так как это про- простое алгебраическое упражнение. Правило образования ориен- ориентированной границы ориентированного симплекса сразу же приводит к такому заключению. Мы не будем излагать здесь алгебраического доказательства, но читателю предлагается проверить эту лемму в случаях 2-симплекса и 3-симплекса, использовав сокращение 0-симплексов и 1-симплексов соответ- соответственно. Хотя граница границы исчезает, граница — не единственный тип цепи с исчезающей границей. Например, рассмотрим ком- комплекс, построенный на согласованно ориентированных гранях тетраэдра (без внутренних точек) и, конечно, ребрах и верши- вершинах, небходимо составляющих часть комплекса в силу ранее изложенного в этом пункте определения. 2-цепь, построенная на всех этих гранях, каждая с коэффициентом 1, обладает исче- исчезающей границей, ибо она являлась бы границей 3-симплекса, если бы он присутствовал в комплексе. Но очевидно, что в вы- выбранном комплексе она не может быть границей, ибо в нем во- вообще нет 3-симплексов. Следовательно, существует два рода це- цепей с исчезающими границами — те, которые сами являются границами цепей размерности, большей на единицу, и те, кото- которые таковыми не являются. Соответственно назовем их гранич- граничными и неграничными циклами. Дадим соответствующие фор- формальные определения. Цепь с исчезающей границей назовем циклом. &-цикл комплекса К, являющийся границей некоторого 1)-цикла этого комплекса К, назовем граничным k-циклом комплекса К- &-цикл комплекса К, не являющийся границей никакого (&+1)-цикла комплекса К, назовем неграничным k-циклом ком- комплекса К,- Теория гомологии изучает циклы комплексов; при этом под- подразумевается, что любые два цикла комплекса считаются экви- эквивалентными, если их разность (как разность двух цепей) являет- является граничным циклом. В некоторых работах прилагаются зна- значительные усилия для рассмотрения вырожденных циклов, построенных на симплексах с возможно совпадающими верши- вершинами, но мы, однако, такие циклы можем игнорировать, заметив (как показал это несколько лет тому назад А. Таккер), что все они являются граничными. В современной топологии теория гомотопий позволяет полу- получать более сильные результаты, чем теория гомологии, но это, как правило, более трудно. Более того, ограничение рассматри-
Лемма Шпернера 271 ваемых комплексов симплициальными обычно ослабляется. Дж. Уайтхед ввел общий геометрический объект, удобный для достаточно широкого изложения теории гомотопий, назвав его CW-комплексом. Ясное изложение многих частей топологии, относящихся к гомотопиям, включая и те факты, с помощью которых становит- становится понятной роль CW-комплексов, можно найти в брошюре П. Хилтона [10], где CW-комплексы изучаются в гл. 7, стр. 95— 113. В приведенных нами примерах все комплексы просты и лег- легко описываются, а теория гомологии почти тривиальна. И нам не нужно продолжать изучать дальнейшие детали алгебраичс ской топологии, чтобы завершить наши рассуждения. 8. Основная теорема об индексе Обратимся теперь к фундаментальной теореме об индексе, обобщающей лемму Шпернера в желаемом нами направлении. Она основана, хотя и может показаться, что это излишне, на тео- теории гомологии, кратко изложенной в предыдущем пункте, и при этом использует не весь аппарат этой теории, а только идеи ориентации, границы и приписывание коэффициентов симплек- симплексам. Теорема была известна по существу еще около века назад, но изложение, данное здесь, не совсем классическое. Доказа- Доказательство ее, по-видимому, принадлежит в основном Лефшецу, который первый изложил многие из топологических теорем о не- неподвижных и совпадающих точках. В работах [2] и [5] изложены некоторые более поздние приложения для специальных случаев, выходящих за пределы наших интересов; изложение, близкое к нашему, можно найти в [4, стр. 57]. Изложим сначала некоторые определения и общую теорему и перейдем непосредственно после этого к интересующим нас приложениям (в терминах симплициальных подразделений). Пусть Ch — ориентированная симплициальная fe-цепь, S* — ориентированный ^-симплекс, а / — отображение вершин симп- симплексов цепи Ch в вершины симплекса Sr (очевидно / — симпли- циалыюе отображение каждого симплекса цепи Ch в Sr). Рас- Рассмотрим множество симплексов цепи Ch с вершинами, отобра- отображаемыми / на все множество вершин симплекса Sr. Припи- Припишем некоторым произвольным образом индексы симплексам це- цепи и обозначим через S* /-й симплекс цепи Ch, а через с, ко- коэффициент при 5* в цепи Ск. Условимся также записывать hi—I, если / отображает S* в S* с согласованной ориентацией,
272 Ч. Томпкинс и записывать ht = — 1, если / отображает S* в SkT с противопо- противоположной ориентацией. Тогда индекс f над Ск равен Построим теперь некоторую цепь, зависящую от й-цепи Ch, fe-симплекса S? и отображения fk вершин й-цепи в вершины это- этого симплекса. Цепь и симплекс ориентированы, а отображение имеет индекс в соответствии с предыдущим определением. Будем обозначать границу цепи С* через 6(С*); она является, очевид- очевидно, (k — 1)-цепью. Определим приведенную по fh границу, моди- модифицируя эту цепь, и обозначим через 8~(Ch,fh, а). Приведенная граница — это старая граница, из которой удалены все те (k—1)-симплексы, которые содержат одну или более вершин, отображаемых на одну выделенную вершину а симплекса St- Выбор этой выделенной вершины произволен и наиболее просто в качестве нее взять начальную в некотором согласованном с его ориентацией упорядочении вершин симплекса Sr. (Для удобства обозначений следовало бы взять последнюю вершину, но зато это привело бы к неудобствам, связанным с ориентация- ми для нечетных k.) Определим также приведенное отображе- отображение fh~l (зависящее, по-видимому, от выделенной вершины) как отображение /, но заданное только на вершинах приведенной границы 8'(Ch,fk, а). Наша основная теорема будет заклю- заключаться в том, что индекс К отображения fh~l над 8~(Ck,fh, а) ра- равен индексу }к над Ск. Заметим, что хотя по лемме предыдущего пункта граница 6(СЙ) является циклом, но приведенная гра- граница, вообще говоря, не является циклом. В действительности основную теорему можно значительно расширить на меньшие размерности, применяя ее каждый раз к получаемой приведен- приведенной границе. Это, однако, мало эффективный процесс. Пусть fh — ориентированная симплициальная k-цепъ, S? — ориентированный ^-симплекс, fh — отображение вершин симп- симплексов цепи Cft в вершины Sr и а — вершина Sr. Приведенная граница цепи Ск относительно fh и выделенной вершины а есть (k — 1)-цепь, 6~(Ch, fh, а), на тех же самых симплексах, что и граница 8(С'{), и с теми же самыми коэффициентами, кроме при- приравниваемых нулю коэффициентов тех симплексов 8~(Ch,fh,a), у которых хотя бы одна вершина отображается на а. Пусть fk — отображение вершин симплексов ориентирован- ориентированной симплициальной й-цепи Ск в вершины ориентированного симплекса Si и пусть а — выделенная вершина симплекса 5*- Приведенное отображение fh относительно а является отобра- отображением fh'\ полученным ограничением области определения /ft
Лемма Шпернера 273 только вершинами, не отображающимися на вершину а и, более того, инцидентными с теми (k— 1)-симплексами границы b(Ch), вершины которых не отображаются на а. Основная теорема об индексе. Если Ch — ориенти- ориентированная симплициальная k-цепь, ST — ориентированный симп- симплекс, f — отображение вершин симплексов цепи Ck в вер- вершины симплекса S?, а — выделенная вершина симплекса .S*, б~(С*, /*, а)— приведенная граница Ck относительно fk и а, /й~'— приведенное отображение fh относительно а, то (k-мерный) ин- индекс L отображения }h над Ch равен ((k — 1)-мерному) индексу К отображения fk'] над 6~(С\ f, а), т. е. Прежде чем доказывать эту теорему, наметим ее применение к нашим задачам. Для построения ife-цепи необходимо иметь комплекс с симплексами по крайней мере размерности k. Этот комплекс в наших приложениях всегда будет симплициальным подразделением некоторой ^-мерной области. В приложениях' к теореме Брауэра о неподвижной точке эта область будет тетра- тетраэдром с внутренними точками либо любым гомеоморфным ему объектом, или, более общо, fe-симплексом с внутренними точка- точками. В применении к доказательству основной теоремы алгебры эта область будет кругом большого радиуса в комплексной плоскости с центром в точке, соответствующей числу 0. В при- примере, относящемся к полю касательных векторов на сфере, этой областью будет вся поверхность сферы, за исключением малых окрестностей двух антиподальных точек, например, северного и южного полюсов. В следующем примере, относящемся к некото- некоторому частному методу решения линейных неравенств (и ра- равенств), эта область еще более абстрактна, но и она строится на замкнутом шаре в евклидовом пространстве размерности п. В каждом из этих случаев можно осуществить сколь угодно мелкое подразделение и получить комплекс размерности k, из й-симплексов которого строится цепь и анализируется в свете изложенной выше основной теоремы об индексе. Эти ^-симплек- ^-симплексы имеют естественную ориентацию и цепи каждый раз будут строиться приписыванием к каждому из них коэффициента 1. Граница каждой изучаемой цепи будет каждый раз строиться на симплексах, лежащих на границе исходной исследуемой об- области. Из условий бегло изложенных в первом введении, будет следовать, что число К основной теоремы отлично от 0. Тогда из основной теоремы будет вытекать, что и число L отлично от 0, а из соображений, связанных с предельным переходом (подоб- (подобных тем, что использовались в доказательстве теоремы Брауэра J8 Зак. 909
274 Ч. Томпкинс о неподвижной точке) будет следовать существование неподвиж- неподвижной точки, а из существования такой точки будут, в свою оче- очередь, следовать желаемые результаты. В каждом случае сим- плициальное отображение будет задаваться отображением рас- рассматриваемой ^-мерной области в евклидово ^-пространство, в котором лежит симплекс Sr, являющийся областью значений для /, и снова получим правило помечивания точек отображае- отображаемой области, так что, грубо говоря, приписываемые пометки будут номерами вершин симплекса S,, ближайших к образу точки при отображении /. Это —то же самое помечивание, кото- которое использовалось в связи с доказательством теоремы Брауэра о неподвижной точке. Любую принимаемую за вершину подраз- подразделения точку рассматриваемой области отображение сопостав- сопоставляет той вершине из симплекса области значений, которая имеет ту же самую пометку. В следующем пункте будет более полно изложен ряд относя- относящихся сюда примеров. Обратимся теперь к доказательству основной теоремы. Сле- Следует сначала отметить, хотя это и не так важно и лишь помо- помогает создать у читателя представление об арифметической сути доказательства, что индекс К измеряет число заметаний грани- границы симплекса, являющегося областью значений, так как каждое полное заметание использует каждую ориентированную грань в точности один раз и со знаком, учитывающим ориентацию. Это согласуется с сделанным выше утверждением, что единственным, кроме самого ST, неграничным (k—1)-циклом комплекса, по- построенного на подчиненных Sf симплексах, является цикл, со- состоящий из всех граничных граней, взятых каждая в точности один раз, и с согласованной с S, ориентацией. Теперь, однако, следует слегка изменить это утверждение, ибо мы уже достаточ- достаточно изучали цепи с той поры, как оно было высказано. А именно встречаются и другие неграничные циклы, но все они кратны уже упомянутому граничному циклу. Продолжим теперь доказательство, ставшее совсем простым благодаря изобретательности математиков, постигших сущ- сущность утверждения теоремы. Рассмотрим только те симплексы цепи Ch, вершины которых отображаются на все множество вершин симплекса Sr. По определению эти симплексы и только они дают вклад в индекс L. Каждый из них имеет в точности одну грань, отображаемую на грань симплекса ST, в которой не участвует выбранная вершина. Что касается ориентации, то, ес- если отнестись к этому внимательно, надо проследить, согласована она на этой грани или не согласована в соответствии с согласо-
Лемма Шпернера 275 ванностью или несогласованностью ориентации при отображе- отображении всего симплекса. Тогда вклад симрлексов цепи Ch, верши- вершины которых отображаются на полное множество вершин й-сим- плекса ST, в число К в точности равен числу L этой теоремы. Рассмотрим теперь симплексы цепи Ck с вершинами, отобра- отображаемыми на все, за исключением выделенной вершины а, мно- множество вершин симплекса Sr. Заметим, как уже делалось в до- доказательстве леммы Шпернера, что одна вершина симплекса 5 должна быть образом двух вершин любого такого симплекса. Таким образом, две грани каждого такого симплекса отобра- отображаются на одну грань симплекса Sf, в которую не входит вы- выбранная вершина, и легко убедиться, что эти грани имеют про- противоположные ориентации. Следовательно, каждый такой сим- симплекс ничего не вносит в число К- Наконец, рассмотрим те симплексы цепи Ck, среди образов вершин которых отсутствует по крайней мере одна вершина, отличная от а. Они ничего не вносят в число К. Этим и завер- завершается доказательство основной теоремы об индексе. 9. Некоторые приложения В этом пункте рассмотрим три важнейших приложения полу- полученных нами результатов; остановимся хотя и на не очень су- существенном дальнейшем обобщении (оно изложено в литера- литературе, но требует некоторого дополнительного исследования, однако без привлечения новых методов); затем перейдем к анон- анонсированному Шаудером и Лере [1] обобщению, аналогичному шаудеровскому обобщению [19] теоремы Брауэра о неподвиж- неподвижной точке, и наконец, заключим изложение замечанием относи- относительно еще одного метода, связанного с теми же приложениями и основанного на интегрировании телесных углов. Приложения будут включать новый подход к теореме Брау- Брауэра о неподвижной точке с точки зрения первого введения, на- набросок доказательства основной теоремы алгебры (о том, что каждый многочлен положительной степени имеет но крайней мере один нуль в комплексной плоскости) и набросок доказа- доказательства теоремы о том, что каждое непрерывное поле касатель- касательных векторов на 2-сфере обладает по крайней мере одним нуле- нулевым вектором. Из последней теоремы может быть получен такой результат: каждое непрерывное отображение 2-сферы в себя об- обладает либо неподвижной точкой, либо такой точкой, образ ко- которой является ее антиподом. Доказательство перефразированной теоремы Брауэра о непо- неподвижной точке только слегка будет отличаться от доказательства, 18*
276 Ч. Томпкинс данного в п. 3. Мы сохраним последовательность подразделе- подразделений с мелкостью, стремящейся к нулю, и правило помечива- ния, изложенное в нашем прежнем доказательстве. Возьмем симплекс S? в качестве основного симплекса. Индуктивный шаг, используемый в связи с доказательством леммы Шпернера в п. 2, заменяется шагом, основанным на несколько более сильных предположениях, справедливость которых будет установлена тут же. Мы начнем с непрерывных отображений ^-симплекса в себя. Получим последовательность подразделений симплекса с мел- мелкостью, стремящейся к нулю. Будем считать, что каждое из этих подразделений определяет симплициальный комплекс, и по- построим k-цепъ на этом комплексе. В частности, каждый й-симп- лекс подразделения наделяется ориентацией, согласованной с ориентацией исходного ^-симплекса (ее легко определить, по- поскольку симплексы подразделения лежат в ^-плоскости, содержа- содержащей и исходный ^-симплекс). Цепь Ch такова, что коэффициент, приписанный каждому ориентированному симплексу подразде- подразделения, равен 1. Граница 6(Ch) состоит из (k — 1)-симплексов, составляющих вместе границу исходного й-симплекса, поскольку все внутренние (k— 1)-симплексы имеют коэффициент 0 в силу правила сокращения, введенного в связи с арифметическими операциями, определенными на цепях. Исходный ^-симплекс взят как симплекс области значений Sf для введенных симплициальных отображений. Образ каждой вершины любого подразделения определяется точно так же, как это было сделано в доказательстве теоремы Брауэра о непод- неподвижной точке в п. 2. Это отображение допустимо для фунда- фундаментальной теоремы об индексе, доказанной в п. 8. Выскажем несколько более сильные предположения о четно- четности, чем те, которые были использованы в доказательстве лем- леммы Шпернера в п. 2. Эти предположения заключаются в том, что индекс любого такого отображения вершин на комплексе под- подразделения равен 1, т. е. L = \. Для установления справедливо- справедливости этих предположений по индукции поступим примерно так же, как при доказательстве леммы Шпернера. Прежде всего надо установить справедливость этих предпо- предположений для случая k=\\ это просто и следует из тех же точно рассуждений, которые использовались для одномерного случая при доказательстве леммы Шпернера. Затем мы должны пока- показать, что если это предположение справедливо для отображений (k—1)-мерных симплексов, то оно справедливо и для отобра- отображений ^-мерных симплексов. Чтобы сделать это, заметим снова, что помечивание выделенной грани, не содержащей выделенной
Лемма Шпернера 277 вершины симплекса S1*, подчиняется правилу, установленному в связи с доказательством теоремы Брауэра о неподвижной точ- точке: ни одна вершина выделенной грани симплекса S, не ото- отображается в выделенную вершину. Таким образом помечивание описывает отображение вершин подразделения выделенной гра- грани в вершины этой же выделенной грани. Обозначим эту грань через Sr~X и отображение через fh~]. Отметим, что это отображе- отображение является непрерывным отображением выделенной грани в себя, и если допустить, что наши предположения верны, то от- отсюда будет следовать, что индекс отображения над выделенной гранью равен 1. Этот индекс, однако, равен индексу К отобра- отображения ^-симплекса в себя и по фундаментальной теореме об ин- индексе для любого такого отображения L = K. Таким образом, мы показали, что если это предположение справедливо для размер- размерности k — 1, то оно справедливо для размерности k, и индукция полностью проведена. Тем самым завершается и доказательство теоремы Брауэра о неподвижной точке в той степени общности, как это описано в первом введении. Благодаря тому, что для индекса отображе- отображения дается точное значение 1, эта теорема в некотором смысле сильнее, чем теорема Брауэра о неподвижной точке, точно так же, как и теорема об индексе в некотором смысле сильнее, чем лемма Шпернера. Этот усиленный вариант был хорошо известен сравнительно давно, но, насколько известно автору, впервые явно изложен в [5]. Он также содержится в [2] и более или ме- менее явно формулируется в [4], в той части этой работы, которая относится к лемме Шпернера. В качестве упражнения читатель может показать по индук- индукции, как и в доказательстве леммы Шпернера, что число симп- симплексов подразделения, несущих все пометки в порядке, согласо- согласованном с порядком исходного симплекса, на единицу превы- превышает число симплексов с противоположной ориентацией. Теперь обратимся к доказательству основной теоремы алгеб- алгебры: каждый многочлен не менее, чем первой степени, над полем комплексных чисел имеет нуль в комплексной плоскости. Для этого рассмотрим многочлен Р, отображающий комплексную 2-плоскость в комплексную w плоскость, т. е. w = P(z), где г и w — комплексные числа и Предполагаем, что а, — комплексные (или вещественные) числа и что апф0. Вновь мы должны задать цепь, симплициальное отображе- отображение этой цепи на симплекс области значений, приведенное
278 Ч. Томпкинс отображение приведенной границы и доказать, что индекс ото- отображения отличен от нуля. Цепь строится на комплексе, являю- являющемся подразделением круга большого радиуса в г-плоскости с центром в точке, соответствующей г = 0. Очевидно, что такое подразделение может быть сделано сколь угодно мелким. За- Зафиксируем круг (явно опишем это несколько позже) и выберем последовательность симплициальных подразделений с мел- мелкостью, стремящейся к нулю. Используем связанное с предель- предельным переходом соображение, подобное тому, что и в первом доказательстве теоремы Брауэра о неподвижной точке, и заме- заметим, что оно, конечно, применимо, если мы сможем доказать, что отличен от нуля индекс отображения цени, построенной на подразделении, составляющем несущий эту цепь комплекс. Если это так, то число симплексов с вершинами, отображенными на три различные точки симплекса области значений, очевидно, отлично от нуля, и связанные с предельным переходом сообра- соображения вполне применимы. Возьмем симплекс области значений Sr, лежащий в ау-пло- скости, и, кроме того, зададим его вершины. Возьмем в качестве вершин точки w=l, w = i (где i, конечно, квадратный корень из —''1) и w = — 1 —i, но нам подошел бы и любой другой симплекс, в котором содержится точка w — О. Определим теперь правило для отображения произвольной точки г-плоскости в одну из вершин симплекса Sr. Грубо говоря, это правило заключается в сопоставлении точке z вершины, ближайшей ее образу Р(г). Более конкретно правило выглядит так: если точка z отобра- отображается в вершину симплекса Sc, то она отображается в верши- вершину ш = 1 тогда и только тогда, когда вещественная часть Р(г) неотрицательна и не меньше мнимой (с учетом знаков); она отображается в вершину w = i тогда и только тогда, когда ее мнимая часть неотрицательна и превышает вещественную; во всех остальных случаях она отображается в вершину w = — 1—i. Немедленно проверяется, что точка г, являющаяся предельной для точек, отображаемых во все три вершины, должна отобра- отображаться в точку W — Q и, следовательно, должна быть корнем Р, что и устанавливает теорему. Предполагаем, что читатель без дальнейших пояснений сможет распространить рассуждения п. 3, связанные с предельным переходом, и установить существование этого корня, поскольку мы убеждены в том, что для каждого до- достаточно мелкого подразделения существует симплекс этого под- подразделения с вершинами, отображаемыми на все три вершины 5Г. Обратимся теперь к этой задаче. В дальнейшем будем явно использовать то, что комплекс по- построен на круге. Так как коэффициент а„ многочлена отличен
Лемма Шпернера 279 от нуля, то член anzn доминирует на границе, если круг доста- достаточно велик. То есть, если мы хотим, чтобы на границе круга первый член многочлена был по меньшей мере в миллион раз больше по абсолютной величине суммы всех других членов, то для этого нужно только сделать этот круг достаточно большим, хотя конкретные размеры зависят от частного вида рассматри- рассматриваемого многочлена. Ясно, что образ anzn в ay-плоскости про- пробегает окружность п раз, в то время как г пробегает окруж- окружность один раз, причем обе окружности имеют центр в 0-точках соответствующих им плоскостей. Из этого сразу следует, что если круг взят достаточно большим и подразделение г-окруж- ности и ее внутренних точек с согласованными ориентациями 2-симплексов взято как цепь (каждому из симплексов присвоен коэффициент 1), то индекс К над этой цепью равен п. Остальное доказательство очевидно и предоставляется чи- читателю. Углубление этой теоремы связано с отделением выбран- выбранных корней и последующим применением теоремы; мы найдем, что многочлен степени п имеет п корней, если при этом считать каждый корень с его кратностью. Мы вернемся к вопросу о крат- кратности в связи со следующим примером. Заключительный пример относится к полю касательных век- векторов обычной 2-сферы. Покажем, что такое векторное поле имеет, вообще говоря, две особые точки — точки, в которых ка- касательный вектор имеет нулевую длину. Возможно, что число особых точек значительно больше двух, но это нежелательно и в этом случае теорема становится более сложной, чем фунда- фундаментальная теорема алгебры, так как многочлены степени п ни- никогда не имеют больше чем п корней. С другой стороны, воз- возможна только одна особая точка, но ее нужно считать просто двумя совпадающими особыми точками и здесь имеем полную аналогию с основной теоремой алгебры, так как многочлен сте- степени п может иметь меньше чем п корней, если не учитывать их кратность. Перейдем к обычной процедуре. Сначала предположим, что существует невырожденное поле касательных векторов на сфе- сфере, а это означает, что в каждой точке сферы существует каса- касательный вектор с отличной от нуля длиной и что эти векторы яв- являются непрерывной функцией точки касания. Выберем затем две антиподальные точки, назвав их северным и южным полю- полюсами, и будем проводить все наши рассуждения с этими двумя выбранными точками. Удалим из сферы внутренние точки малых кругов (по широте) вокруг каждого из этих полюсов и построим с помощью подразделения комплекс на оставшейся после выре- вырезания части сферы. Как обычно, нам нужна последовательность подразделений с мелкостью, стремящейся к нулю. Ориентация
280 V. Томпкинс симплексов подразделения должна быть взята согласованно, так что граница цепи, полученной приписыванием коэффициента 1 к каждому из симплексов подразделения, является цепью с сим- симплексами на двух граничных окружностях. Зададим ориентацию на каждой широтной окружности со- согласованно, например, с ориентацией части границы комплекса вокруг северного полюса и зададим два вектора в каждой точке сферы, один из которых касается широтной окружности, прохо- проходящей через эту точку, и направлен согласованно с ориентацией этой окружности, а другой касается меридиана и направлен в сторону северного полюса. Считаем, что каждый из этих век- векторов имеет единичную длину; конечно, они перпендикулярны. Вспомним теперь, что в южном полюсе существует единственный вектор, и мы предполагаем, что его длина отлична от нуля. Век- Векторы, заданные на достаточно малой окружности вокруг этого полюса, по существу имеют все одно и то же направление. Вбли- Вблизи точки пересечения проекции вектора южного полюса с этой окружностью векторы должны достаточно мало отклоняться от северного направления, а в диаметрально противоположной точ- точке (окружности, а не сферы) и вблизи ее достаточно мало от- отклоняться от южного. Следовательно, нетрудно заметить, что вектор, который в силу нашего описания неподвижен, совершает полное вращение относительно наших подвижных координатных осей, когда оси движутся вдоль окружности. Для большей точности отобразим эти две оси в координат- координатные оси плоскости. Построим симплекс в этой плоскости точно так же, как это делалось при доказательстве основной теоремы алгебры, и зададим образ любого вектора сферы, положив в этой плоскости компоненты в координатных осях равными соот- соответствующим компонентам на сфере по отношению к двум уже упоминавшимся координатным векторам с началом в этой точке. Каждой точке поставим в соответствие одну из вершин симп- симплекса согласно тому же правилу, как и при доказательстве ос- основной теоремы алгебры; при этом мы используем образ век- вектора точно так же, как там мы использовали ау-образ. Рассуждения, с помощью которых мы показали, что индекс равен ±1 вокруг границы южного полюса, помогают нам убе- убедиться в том, что индекс вокруг северного полюса такой же. Важно, однако, заметить, что индексы различаются знаками из- за ориентации рассматриваемых симплексов. Следовательно, об- общий индекс К равен ±2; не будем заботиться здесь о точном определении знака, но читатель может попытаться сделать это сам. (Отметим, что оставшуюся для комплекса часть сферы мо- можно подходящим образом отобразить на плоский лист бумаги с помощью упоминавшейся ранее проекции Меркатора, но так,
Лемма Шпернера 281 что векторы, заданные на точках верхней и нижней граничных окружностей, совершают полное вращение при движении с во- востока на запад. Определение значения индекса К зависит от ак- аккуратного задания направлений этих вращений.) Индекс L для каждого подразделения должен тогда принимать значения ±2 (опять-таки знак может быть совершенно точно определен более подробным изучением) и обычные рассуждения, связанные с пре- предельным переходом, показывают, что найдется по крайней мере одна точка, в которой вектор имеет нулевую длину. Доказатель- Доказательство этим завершается, но мы продолжим обсуждение этого утверждения немного дальше. Хотя по основной теореме алгебры для многочлена степени п индекс равен я и не может быть более чем п корней, очевидно, что может быть сколь угодно много точек сферы, в которых дли- длина вектора равна нулю. Действительно, например, каждой точке экватора или некоторого его подмножества можно приписать векторы длины 0, кроме того, векторы длины 0 можно приписать северному и южному полюсам, а всем другим точкам южного полушария приписать векторы положительной длины и направ- направленные к северу; всем другим точкам северного полушария — векторы положительной длины, направленные к югу. В том слу- случае, когда вычисление индекса имеет смысл, он равен 2. Значе- Значение этого утверждения в геометрических терминах важно, но из- излагаться здесь не будет. Читателя же отсылаем к книгам Леф- шеца [15] или Александрова и Хопфа [1]. Отметим также мимоходом, что явление, аналогичное крат- кратности корней многочлена, можно наблюдать и для векторов дли- длины нуль на сфере. Хотя мы ожидаем, вообще говоря, две осо- особые точки в соответствии со значением индекса, но может быть и такой случай, когда они совпадают. Легко построить пример, если рассечь сферу плоскостью, проходящей через меридианы 0° и 180°. Если эту сферу рассматривать из отдаленной точки на луче, выходящем из ее центра и проходящем через точку на эк- экваторе с западной долготой 90°, то сфера будет казаться кругом (по крайней мере для лиц с бедным пространственным вообра- воображением). Как обычно, южный полюс находится внизу. Считаем, что вектор в южном полюсе имеет нулевую длину, и рассмотрим окружности, касающиеся круга в южном полюсе. Векторы на каждой из этих окружностей ориентированы все в одном и том же направлении по отношению к ней, уменьшаясь вблизи юж* ного полюса и увеличиваясь вблизи верхней точки каждой ок-< ружности. См. рис. 3, на котором изображено восточное полу- полушарие. Западное полушарие покрыто векторами, параллельными их зеркальным отражениям в восточном полушарии относительна
282 Ч. Томпкинс рассекающей плоскости через меридианы 0° и 180°. Этот пример, возможно, не столь уж важен, но он может уберечь некоторых читателей от нескольких бессонных ночей, проведенных в по- попытке доказать, что существу- существует по крайней мере две точки с векторами длины нуль. В заключение отметим, что если мы рассмотрим отобра- отображение сферы в себя, то можно сопоставить каждой точке век- вектор с началом в самой точке и концом в точке, являющейся образом этого отображения. Если спроектировать каждый вектор на касательную плос- плоскость, проходящую через его начало, то получим поле каса- касательных векторов на сфере. Единственными векторами дли- длины нуль являются те, которые ранее были такими, и те, на- началом которых является точка, переходящая в антиподальную. Итак, получаем следующее знаменитое следствие. Следствие. Непрерывное отображение 2-сферы в себя либо имеет неподвижную точку, либо отображает по крайней мере одну точку в антиподальную. Обратимся теперь к нашему последнему примеру, который будет изложен без деталей. Он касается метода Качмажа [12] для решения системы линейных уравнений (или неравенств), из- изложенного в [3, стр. 454—455]. Будем рассматривать и описы- описывать случай, в котором не существует решения, и обсудим про- процедуру вычислений в методе Качмажа. Пусть система уравнений имеет вид Южный полюс Рис. 3. и пусть индекс / пробегает большее множество значений, чем / (с неравенствами будем поступать так же, как и с уравнения- уравнениями). Предположим далее, что система не имеет решения. Метод Качмажа является релаксационным методом для приближений любого существующего решения. Для проведения вычислений берется некоторое приближенное решение, а уравнения рассма-
Лемма Шпернера 283 триваются в циклическом порядке относительно индекса /, т. е. t-e уравнение рассматривается после (t—1)-го и т. д. Выбор приближенного решения возможен до рассмотрения любого из уравнений. Оно модифицируется в соответствии с рассматривае- рассматриваемым уравнением посредством изображения на графике гипер- гиперплоскости, соответствующей этому уравнению (в пространстве переменных х, трактуемых как координаты), и последующей за- замены приближенного решения (точки в ^-пространстве) проек- проекцией на эту гиперплоскость. Легко доказать, что этот метод схо- сходится к решению, если оно существует. Быстрая сходимость не гарантируется. Вопрос о том, что произойдет, если решения не существует, не освещен в литературе. Однако можно без труда исследовать это с помощью методов, относящихся к индексу. С этой целью рассмотрим систему однородных уравнений .,,,. ,,, Эта система, очевидно, имеет решением точку с координа- координатами Xj = 0 для каждого /. Применение изложенного метода по- показывает, что индекс отображения Качмажа достаточно боль- большой сферы с центром в начале координат в себя равен 1. При отображении Качмажа образ каждой точки сферы опреде- определяется как точка, получаемая в процессе последовательных проекций на гиперплоскости так, что одна проекция является исходной точкой для следующей проекции. Вернемся теперь к наблюдателю, расположенному на доста- достаточно большом расстоянии. Ему трудно сказать, проходят ли ги- гиперплоскости через начало координат или нет; действительно, передвигая плоскости на расстояние, небольшое по сравнению с расстоянием от наблюдателя до начала, их можно вернуть в первоначальное положение. При этом движении ни один вектор не обращается в 0. Отсюда заключаем, и это можно строго до- доказать, что индекс не изменяется и остается равным 1. Этим еще не доказывается, что система уравнений имеет решение, но по крайней мере доказывается сходимость к инвариантному циклу при проекциях, так что в пределе полное множество про- проекций возвращается в точку, из которой производилось перво- первоначальное проектирование. Это положение (поскольку известно о его существовании) можно описать и численно. Доказатель- Доказательство теоремы в полном виде будет опубликовано Т. С. Моц- кином и автором. Вышеизложенные основные выкладки, относящиеся к мето- методу проекций Качмажа, опираются на другую более важную теорему об инвариантности индекса при гомотопии. Подробное
284 Ч. Томпкинс обсуждение ее можно найти в [10], [15], а также в более поздней работе [11]. Можно также отметить в этом пункте, что все доказатель- доказательства могут быть проведены без ссылок на комбинаторные теоре- теоремы, с помощью интегрирования. В самом деле, доказательства с помощью интегрирования были наиболее ранними. С помощью интегралов определяется сеть телесных углов, заметаемых век- вектором, индекс которого и вычисляется. Общий угол, заметаемый вектором w = P(z), где Р — многочлен степени и, a z пробегает всю окружность достаточно большого радиуса, равен п полным телесным углам, но равен нулю, когда z обегает достаточно ма- малую окружность. Аналогично общий телесный угол, заметаемый вектором от граничной точки симплекса до ее образа при ото- отображении симплекса в себя, равен одному полному телесному углу той же размерности. Векторы, обсуждаемые в связи с век- векторным полем на сфере, заметают два полных телесных угла, когда начало векторов обегает всю границу, при этом, как обыч- обычно, учитывается ориентация. Эти результаты установлены в замечательной работе Ада- мара [8], в более поздней работе Хейнца [9] и во многих других. Обсуждение некоторых из этих работ, в частности ранних, опи- опирающихся на интегралы, можно найти в вводном обзоре кни- книги [15]. В заключение заметим, что теоремы об индексах справедли- справедливы в бесконечномерном банаховом пространстве (аналогично обобщению Шаудером теоремы Брауэра о неподвижной точке). См. Шаудер и Лере [16] или часть работы [4], посвященную теоремам об индексе в банаховом пространстве. Такие теоремы были применены для получения хорошо известных результатов о решении некоторых сложных проблем, связанных с уравне- уравнениями в частных производных. 10. Стремление к большей строгости В этой статье мы часто пользовались геометрическим смыс- смыслом излагаемых предложений. Диспропорция между нагляд- наглядностью и строгостью изложения является (хотя и не всегда) предпочтительной, если делает изложение наиболее ясным. По- Поэтому, стремясь сделать статью наиболее усваиваемой, мы об- обращались к наглядным рассуждениям, отказываясь от более подробного изучения. Особенно это относится к заключительным наброскам этой главы. Более ранние наглядные описания еще подкреплялись кое-какими аргументами, хотя и не совсем по- последовательно.
Лемма Шпернера 285 Заметим вкратце, что для полного доверия к своим рассу- рассуждениям математики должны использовать символику повсюду. Это означает, например, что упомянутое выше без доказатель- доказательства утверждение о том, что два симплекса подразделения, ле- лежащие на различных сторонах разделяющей грани и показы- показывающие, что эта грань не входит в любую граничную цепь ис- использованных нами цепей, должно быть определено и выведено в сжатых и безошибочных обозначениях. Подобного вывода не проводилось. Укажем, что в работе [6] содержится все необходимое для та- таких выкладок. Выпишем из [6, стр. 80] только основное опреде- определение: «Симплексом S размерности п (или просто п-симплек- сом) называется некоторое множество {А}, состоящее из п + \ элементов, рассматриваемое вместе с совокупностью всех дей- действительных функций а, определенных на множестве {А} и удо- удовлетворяющих следующим условиям: ¦-¦¦---¦ 2аИ)=1. а(Л)>0». Любая из этих функций определяет точку s; значения, прини- принимаемые этой функцией на различных вершинах, являются бари- барицентрическими координатами точки. Эти точки должны быть использованы как вершины в под- подразделении, а также должна быть уточнена связь между точка- точками подсимплекса и первоначального симплекса. Тогда опять становится легко оперировать введенными только что в топо- топологию алгебраическими рассуждениями. Весь этот процесс скрывает, однако, чисто геометрические по существу идеи, по крайней мере при первоначальном чтении. Более трудно, конечно, корректно абстрагироваться и фор- формализовать доказательства таким образом, чтобы не только обеспечить вполне недвусмысленное изложение, но и не скрыть его действительного значения. Покончим с извечной дилеммой излагающего. Он должен либо остановиться на таком уровне точности, чтобы не рассчитывать на читателей с исключительным талантом понимания, либо решить, что все вполне понятно. Автору знакомы эти сложности изложения. Он отмечает, что содержание [6] адекватно формализации всей теории, и реко- рекомендует его для претенциозного читателя как полезное матема- математическое упражнение. ,. ., л ... л ,, . ... * ¦ ', « • • т- ¦}:¦!<•''. \r' -i-; ' ' -. . ¦• • ¦ ' .' ;• •'!•;<;'. I-. ¦.' ' ''.I Вопросы для самопроверки ¦ . • > .-."¦ ¦ . ¦ * 1. Если барицентрические координаты вершин Ао, А\, Аг, Л3 3-симплекса A,0,0,0), @,1,0,0,), @,0,1,0) и @,0,0,1) соответственно, то барицентри-
286 Ч. Томпкинс ческие координаты средней точки ребра, связывающего А\ и А2, равны а) @, «/». О, '/»). б) @, —1, 0, 1), в) @, 1, 0, 1), г) (О.'/з.'/з.'/з). 2. Ориентированный 2-симилекс с вершинами Ао, А\, А2 в указанном по- порядке такой же как и симплекс с теми же вершинами, ио в порядке а) Ао, А2, Аи б) Аи А2, Ао, в) А2, Аи Ао, г) Аи Ао, А:. '¦ ¦ * ¦- , 3. При правиле помечивания приписываем пометку / точке Х= (х0, хи х2, х}) при преобразовании с Тх = у, если / такое наименьшее число, чтoУj^Xjф О пометка, приписанная центру грани с вершинами @,1,0,0) @,0,1,0), @,0,0,1) при преобразовании Tx=(l/t, 'Д, 'А, Ч*) ДЛЯ 0 -¦ любого х равна а) 0, б) 1, в) 2, г) 3. 4. Неподвижная точка для отображения в задаче 3 есть а) @, Vs. Vs. 7з), j о 2 б) A, 0, 0, 0), в) ('/». '/2, 0, 0), г) ('А, 'А, 'А, 'А). 5. Для сопровождающего задачу рисунка: а) Пометки приписаны так, что нарушены условия леммы Штернера. б) Подразделение не регулярно. в) Индекс отображения равен нулю. г) Лемма Шпернера утверждает только, что существует сторона с по- пометками 1, 0. ЛИТЕРАТУРА [1] А 1 е х a n d г о f f Р., Н о р f H., Topologie I. J. Springer Verlag, Berlin, 1935 (Grundlehren der mathematischen Wissenschaften, Vol. 45). [2] В a g e m i h 1 F., An Extension of Sperner's Lemma with Applications to Closed Set Coverings and Fixed Points, Fund. Math., 40 A953), 3—12 and an Addendum, 41 A955), 351. [3] В ecke n b а с h E. F., (editor), Modern Mathematics for the Engineer, McGraw-Hill Book Company, New York, 1956. [4] В e r s L., Topology, Lecture notes from New York University, 1956—57. [5] В г о w n А. В., Cairns S. S., Strengthening of Sperner's Lemma Applied to Homology Theory, Proc. Nat. Acad. Sci. USA, 47 A961), 113—114. [6] Эйленберг и Стинрод, Основания алгебраической топологии, Физ- матгиз, 1958. [7] Fan К у, A Generalisation of Tucker's Combinatorial Lemma with Topo- logical Applications, Ann. of Math., B), 56 A952), 431—437. [8] H a d a m a r d J., Note sur applications de l'indice de Kronecker, an ap- appendix to J. Tannery, Introduction a la theorie des fonctions d'une vari- variable, 2nd edition, Vol. 2, pp. 437—477, Paris, 1910. [9] Heinz R., An Elementary Analytic Theory of the Degree of Mapping in «-dimensional Space, /. Math. Mech., 8 A959), 231—247.
Лемна Шпернера 287 [10] Hilton P. J., An Introduction to Homotopy Theory, Cambridge Tracts in Mathematics and Mathematical Physics, No. 43, Cambridge, England, 1961 (revised edition). [11] Hu S. Т., Elements of General Topology, Holden-Day, Inc., San Fran- Francisco, 1964. [12] Kaczmarz S., Angenaherte Auflosungen von Systemen linearer Glei- chungen, Bull. International Acad. Polon. Sci., Cl. Sci. Math. Nat. Series A, 355—357, 1937. [13] Kakutani S., A. Generalization of Brouwer's Fixed Point Theorem Duke Math. J., 8 A941), 457—459. [14] К u h n H. W., Some Combinatirial Lemmas in Topology, IBM J. Res. and Deu., 4 A960), 518—524. [15] Lefschetz S., Introduction to Topology, Princeton University Press, Princeton, New Jersey, 1949. [16] Leray J., Schauder J., Topologie et equations fonctionelles, Ann. Ecole Normale Superieure C), 51 A934), 45—78. [17] Ma к л ей н С, Гомология, «Мир», 1966. [18] Neumann J., Мог gen stern О., Theory of Games and Economic Behavior, 2d edition, Princeton University Press, Princeton, New Jersey, 1947. [19] Schauder J., Dber Linearen Elliptische Differentialgleichungen Zweiter Ordnung, Math. Zeit., 38 A934), 257—282. [20] Tucker A. W., Some Topological Properties of Disk and Sphere Prpc. First Canadian Math. Congress, Montreal, Canada, 1945, p. 285—309. [21] Whitehea d J. H. C, Combinatorial Homotopy I., Bull. Amer. Math. Soc, 55 A949), 213—245. [22] Уитни X., Геометрическая теория интегрирования, ИЛ, 1960. [23] Williams J. D., The Compleat Strategust, McGraw-Hill Book Company, New York, 1954. •IV!' '" . ¦ "'¦¦
КОМБИНАТОРНЫЕ ПРИНЦИПЫ В ГЕНЕТИКЕ Георгий Гамов 1. Вступление Всякая живая клетка состоит из двух основных частей: 1) ядра, содержащего хромосомы — носители наследственной информации, и 2) цитоплазмы, которая составляет основную массу клетки и содержит ферменты, катализирующие различ- различные биохимические реакции, необходимые для развития и вы- выживания организма. Если провести аналогию между живой клеткой и заводом, то ядро можно уподобить дирекции, а хромосомы — помеще- помещениям для хранения чертежей и планов будущей продукции. Фер- Ферменты играют в свою очередь роль рабочих и рабочего инстру- инструмента, выполняющих различные задания согласно распоряже- распоряжениям дирекции. 2. Аминокислотные цепи в белках В химическом отношении ферменты и большинство гормонов являются длинными белковыми молекулами. Изучение белков в настоящее время продвигается успешно, и мы знаем, что они представляют собой линейные цепи, состоящие из сравнительно простых молекул различных аминокислот, соединенных между собой так называемыми пептидными связями. Под действием тепла и слабых кислот белки разлагаются на аминокислоты; при этом можно разделить аминокислоты и измерить их относи- относительные содержания. В органической химии путем простого присоединения к лю- любой молекуле атома водорода, аминогруппы (—NH2) и карбо- карбоксильной группы (—СООН) можно получить тысячи различных аминокислот; тем не менее разложение молекул белка приво- приводит только к двадцати различным аминокислотам. Это ала- нин (Ала), аргинин (Apr), аспарагин (Аспн), аспарагиновая кислота (Асп), цистеин (Цис), глутамин (Глун), глутаминовая кислота (Глу), глицин (Гли),гистидин (Гис), изолейцин (Илей), лейцин (Лей), лизин (Лиз), метионин (Мет), фенилаланин (Фен), пролин (Про), серин (Сер), треонин (Тре), триптофан (Три), тирозин (Тир) и валин (Вал). Структурные формулы этих аминокислот представлены на рис. 1.
н 'IХСООН н глицин сн, I н аланнн снгон I С\ P серин NH2 с=о I сн2 I уСч •спарагин сн2 | N н,с- I н,с -сн2 н I —СН \. сн2 I H2N / | ч СООН н триптофан НзСч /СН» сн I H2NX|XCOOHU н : валии ' ' сн3 снон I 7 |Х СООН н треоиии о c-NH, сн2 . сн2 СООН н глутамин СООН НС н н пролнн С^ ^ CHS сн сн2 I Ny [ ХСООН лейции СООН сн2 л X н COOH аспарагииовая кислота NH -¦•••' С—NH, - NH СН2 СН, СН2 I '9\ | н аргинии СООН -S I сн2 соон h,n/|4cooh к сн3 S сн2 сн2 н метиоиин H,N' сн. | н СООН фенилаланин I сн2 с \ СООН н гистидин сн, I зСч^ ^СН2 сн I 2N7 |Х н изолейции СООН СН2 сн2 I /с | н СООН глутаминовая кислота NH2 сн. сн2 I сн2 I сн2 |ЧСООН он /л H2N I | н ТИРОЗИН Рис. 1. Аминокислоты белков.
290 Георгий Гамов Очевидно, что различия между молекулами белков, выпол- выполняющих разные функции в живом организме, можно связывать только с различием расположения аминокислот в линейных це- цепях, точно так же, как содержание письменного текста пол- полностью определяется порядком следования приблизительно два- двадцати различных букв алфавита. Несколько лет назад Фред Эрик Сенгер [16] в Англии раз- разработал метод, позволяющий «прочитывать» белковые цепи, т. е. определять порядок следования перечисленных выше аминокис- аминокислот. Работы Ф. Э. Сенгера обнаружили тот интересный факт, что даже незначительные изменения в порядке расположения «букв» в белковой цепи могут значительно изменить ее биохи- биохимическую активность. Рассмотрим, например, два простых бел- белка, известных под названиями «окситоцин» и «вазопрессин», ко- которые выделяются в кровь определенной железой. Окситоцин: Цис—Тир—Илей—Глун—Аспн—Цис—Про— Лей—Гли. Вазопрессин: Цис—Тир—Фен—Глун—Аспн—Цис—Про—¦ Лиз—Гли. Эти два белка отличаются только аминокислотами, стоя- стоящими в цепи на третьем и восьмом местах, однако их биологи- биологическое функционирование различно. Окситоцин, выделяясь в кровь женского организма во время родов, вызывает сокраще- сокращение мышц матки, приводя тем самым к выбрасыванию плода. Вазопрессин, выделяемый той же железой, вызывает спазм сте- стенок кровеносных сосудов в мужском организме, что приводит к повышению кровяного давления. Следует заметить, однако, что отмеченные две функции сходны между собой, поскольку в обоих случаях белковый гормон воздействует на гладкие мышцы: стенок матки — в первом случае и кровеносных сосу- сосудов— во втором. Американскому биохимику Вэнсану дю Виньо удалось синтезировать оба этих белка из химических элементов, получить нужный порядок расположения молекул аминокислот и доказать тождество синтетических образований с естествен- естественными. Обзор этой работы, сделанный им и его коллегами, а также хорошую библиографию по теме см. в [20]. Несколько более длинную структуру представляет собой мо- молекула инсулина — первый белок, проанализированный Ф. Э. Сен- гером [16]; эта молекула состоит из двух цепей: в первой — 21 аминокислота, во второй — 30. Цепь А: Гли—Илей—Вал—Глу— Глун—Цис—Цис—Ала— —Сер — Вал — Цис—Сер—Лей—Тир—Глун—Лей—Глу—Аспн— —Тир—Цис—Аспн.
Комбинаторные принципы в генетике 291 Цепь Б: Фен—Вал—Аспн—Глун—Гис—Лей—Цис—Гли— —Сер — Гис — Лей — Вал—Глу—Ала—Лей—Тир—Лей—Вал— —Цис — Гли — Глу—Apr—Гли—Фен—Фен—Тир—Тре—Про— —Лиз—Ала. В молекуле есть цистиновая связь (—S—S—), соединяющая цистеиновую пару (А-6, А-11), а также соединяющая цистеино- вую пару (А-7, Б-7) и цистеиновую пару (А-20, Б-19). Интересно отметить, что хотя присутствие в цепи многих аминокислот существенно для правильного биологического функционирования белка, присутствие других, очевидно, не важно. Так, инсулин, полученный из гормонов крупного рога- рогатого скота, овец и свиней, представляет собой разные цепи, раз- различающиеся тремя средними аминокислотами, но, будучи вве- введены в организм человека, они действуют одинаково. Напротив, малейшее изменение в существенной части цепи может лишить инсулин его эффективности. Изучение белковых цепей продвигается гигантскими шагами. Недавно, например, в Беркли Уэнделл М. Стенли и другие ав- авторы [19] определили цепь из 158 аминокислот для вируса та- табачной мозаики. Результаты и обзор ранних этапов исследований по дешиф- дешифровке белков собраны в [6]; дальнейшее развитие исследований см. в [2]. В двух этих статьях приведена библиография из 65 и 70 названий соответственно; статьи содержат большую часть того фактического материала и ссылок на источники, которые могут понадобиться читателю по этой теме. 3. Двухнитевые цепи в ДНК Как было установлено выше, белковые цепи в различных ферментах и гормонах определяются генетическим материа- материалом, содержащимся в хромосомах. Этот материал известен как нуклеиновая кислота. Молекулы нуклеиновых кислот, отделен- отделенные от ядер клетки, появляются на электромикрограммах в виде длинных нитей; эти нити, однако, значительно толще, чем нити белковых молекул. Химический анализ показывает, что эти длинные молекулы нуклеиновых кислот представляют собой цепи, состоящие из сравнительно простых атомных групп — нуклеотидов. Однако в противоположность белкам нуклеотиды бывают только четырех видов: аденин (А), тимин (Т), гуанин (Г) и цитозин (Ц), — см рис. 2. [Для тимина, как мы увидим ниже, существует заменяющая его слегка модифицированная структура, известная под названием урацил (У).] Каждый нуклеотид состоит из: 1) так называемого основания, которое может выступать в одном из четырех перечисленных 19*
292 Георгий Самое выше видов; 2) молекулы сахара, или дезоксирибозы; 3) фос- фосфатной группы, которая, связываясь с молекулой сахара в со- соседнем нуклеотиде, обеспечивает связь в нуклеотидной цепи. Структурная формула цепи нуклеиновой кислоты показана на рис. 3. NH2 О I ¦ . - » N С % HN С I И СН. I || НС С / ¦ ¦ ¦ С СН !•¦•¦; ? н . ¦ . н Адении j Тинии О NH2 A/nv • А - HN С Ч N СН I II СН | || ее/ с сн t\ - . HjN7 ^N-7 XN/ :•.• ¦:,-.. . ¦-'".'¦¦¦¦ '. H г, .'..•' . Н ,;". ; ¦ Гуанин ¦ Цистеин Рис. 2. Основания четырех нуклеотидов. . » . Дальнейшим важным моментом является то, что в нуклеино- нуклеиновых кислотах, образующих хромосомы, мы в действительности имеем двухнитевое звено, в котором основания одной нити свя- связываются с основаниями другой двойными или тройными водо- водородными связями. Проверяя химическую структуру оснований, можно обнаружить, что соединение с помощью таких двойных водородных связей имеет место только между аденином и ти- мином, а с помощью тройных связей — только между гуанином и цитозином. Поэтому нуклеотидная цепь в одной из двух нитей полностью определяет [22, стр. 174, 175] цепь в другой нити, например (см. рис. 3) д д т и г Гх г\ 1 1-1, 1 ¦ т . , , г in ii ii ii iii iii т ¦..¦¦;¦ .-1' —Г—Т—Т—А—Г—Ц - Тот факт, что хромосомная нуклеиновая кислота (известная так же как ДНК — дезоксирибонуклеиновая кислота) состоит ИЗ двух нитей, важен для процесса репликации. Когда клетка
но о н н .,. X/v >. Н С Н Н С N N ;.:.,.: ANU^A \_/ ¦¦¦'¦¦'•¦¦.,: А ¦ < Vo • О С N к о / |/н н а но о н о н к \ / II I " А/°\ /с—N\ Н С Н НС N |\| I/I \ н с—с н с= н н н-с-н I ( .0 Н I -Щ-ЯЯО \ и н |\| 1/1 \ / ¦ Н С С Н С==С Н i: H IN L.-N С N Н I ! х ¦. \ ~ - и.. но о "' Рис. 3. Структура ДНК. Пунктирные линии обозначают двойные.или тройные водородные связи между основаниями. 29 Зак. 909
294 Георгий Гамов готовится к делению, каждая молекула ДНК в ее ядре, по-види- по-видимому, расщепляется на две одиночные нити и затем каждая из этих нитей воспроизводит около себя новую нить, захватывая те свободные нуклеотиды, которые, по-видимому, имеются в большом количестве в окружающей среде. Таким образом, об- образуются две двухнитевые молекулы ДНК, каждая из которых идентична с исходной. Если, как это иногда случается, в про- процессе репликации возникает ошибка, то одна или, возможно, две из вновь образованных молекул ДНК будут отличаться од- одним или ^олее нуклеотидов цепи, что приведет к изменениям в потомстве, известным под названием мутаций. В нашем примере с заводом рабочие не устремляются все вместе за инструкциями в дирекцию; директор тоже не обхо- обходит завод, чтобы дать распоряжение каждому рабочему. Эта передача информации входит в обязанности специально выде- выделенных людей, которые называются мастерами. Точно так же протеиновые молекулы не синтезируются непосредственно ДНК в ядре клетки. Существует промежуточный агент, известный под названием РНК (рибонуклеиновая кислота), который отличает- отличается от ДНК в трех отношениях: 1) РНК состоит из одной нити; 2) молекулы сахара (рибозы) РНК имеют лишний атом кисло- кислорода и 3) путем небольшого изменения, а именно замены ра- радикала СНз на Н, тимин может быть превращен в урацил. Выработанная дезоксирибонуклеиновой кислотой внутри ядра РНК попадает в цитоплазму клетки и внедряется в частицы, известные под названием рибосом, где в действительности и синтезируются белки. 4. Комбинаторные принципы Точная физико-химическая природа описанных процессов очень сложна, и нет сомнения, что в них играют вспомогатель- вспомогательную роль отдельные ферменты, переносящие свободные нуклео- нуклеотиды к РНК, а также АТФ (аденозинтрифосфат), поставляю- поставляющий необходимую для этого синтеза энергию. Вероятно, потре- потребуется очень большой срок, прежде чем мы получим подробную картину всех явлений, из которых складывается процесс син- синтеза белков. Однако и при современном уровне наших зна- знаний можно поставить вопрос: какие принципы комбинаторной математики полезны для изучения того, как генетическая ин- информация, содержащаяся в цепях нуклеиновых кислот, перено- переносится в цепи белков? Как можно установить взаимно одно- однозначное соответствие между цепями, образованными только из четырех элементов, и цепями, образованными из двадцати эле- элементов?
Комбинаторные принципы в генетике 295- Примерно десять лет назад автор заинтересовался этой про- проблемой и ему пришла в голову мысль [3, 4], что число 20 пред- представляет собой число различных троек, которые могут быть об- образованы без учета порядка, из 4 различных элементов. Не мо- может ли быть так, что 20 разных аминокислот, входящих в струк- структуру белков, — это как раз те 20 из тысяч и миллионов возмож- возможных аминокислот, которые находятся в своего рода родстве с теми 20 различными тройками, которые могут быть образованы из 4 разных нуклеотидов? Физическая картина синтеза белков может быть такова, что различные аминокислоты, находящиеся в свободной форме в среде, окружающей молекулу нуклеиновой кислоты, захваты- захватываются различными тройками нуклеотидов, действующими как своего рода матрица. Размещенные в нужном порядке, эти аминокислоты связываются друг с другом пептидными связями, и вновь образованная белковая молекула отъединяется от ис- исходной матрицы. . , 5. Гипотеза перекрывающегося кода Оказывается, что расстояние между последовательными ну- нуклеотидами в полинуклеотидовой молекуле равно расстоянию. между последовательными аминокислотами в молекуле белка. _ д_ а — Т — Г — Т — Ц — Вал Про (! ' ' ; Р и с. 4. Неперекрывающийся код. Поэтому если нуклеотиды размещены вдоль прямой линии, та захваченные аминокислоты будут отделены друг от друга рас- расстояниями в три раза большими, чем это необходимо для обра- образования пептидных связей, и не будут находиться вплотную друг к другу (см. рис. 4). ......¦;¦ . ,, -, . Асан Про , . . • —А—А—Т—Г—Т—Ц— ¦->••-¦¦ -;:¦¦¦• -•" Вал ' ' Р и с. 5. Перекрывающийся код. .'. Естественно предположить в качестве первой возможности, что здесь мы имеем дело с перекрывающимся кодом, при кото- котором аминокислоты, внедренные в матрицу, расположены так> что два последних нуклеотида одной аминокислоты являются одновременно двумя первыми нуклеотидами другой (см. рис. 5). 20*
¦296 Георгий Гамов Если бы так и было, то можно было бы ожидать, что между соседними аминокислотами проявится некоторая корреляция как результат того, что два нуклеотида у них общие. Так, если одна из аминокислот в цепи определяется тремя аденинами, то каждая из соседних с ней аминокислот должна с необходи- необходимостью определяться двумя аденинами и каким-то третьим нуклеотидом (ААА, ААТ, ААГ или ААЦ). Вопрос о том, суще- существует ли в действительности такая корреляция между сосед- соседними аминокислотами, можно было исследовать детерминист- детерминистским либо стохастическим путем. Число разных способов соотнесения 20 аминокислот с 20 трой- тройками нуклеотидов равно 20! = 3 • 1017, что равняется возрасту нашей Вселенной, выраженному в секундах! Поэтому не может быть и речи о том, чтобы искать это соотношение вслепую, ме- методом проб и ошибок. Однако, как и в любом другом случае декодирования, можно действовать более тонко — путем исклю- исключения различных возможностей в отношении специально вы- выбранных участков протеиновых цепей. Используя этот метод, автор и его коллега Мартинас Ичас [7] смогли обнаружить не- некоторые участки цепи инсулина, которым при любом возможном соотнесении аминокислот с тройками нуклеотидов определенно нельзя было бы дать интерпретацию в терминах системы пере- перекрывающихся кодов. 6. Статистические исследования Другая попытка решения поставленной задачи основана на статистике различных пар соседних аминокислот в белковых цепях. Для этого мы пишем какую-нибудь аминокислотную цепь, например Ала — Вал — Сер — Глу — Про — Ала— ..., и затем выписываем имеющиеся пары, в нашем случае • (Ала — Вал)(Вал — Сер)(Сер — Глу)(Глу — Про)(Про — Ала). . .. Эти пары отмечаются в таблице из 20 строк и 20 столбцов D00 клеток), в которой по осям проставлены названия амино- аминокислот. Затем подсчитывается число клеток, в которых не ока- оказалось отметок, число клеток, в которых оказалось по одной отметке, клеток с двумя отметками и т. д. Если распределение случайно, то результат должен согласо- согласовываться с известной формулой Пуассона:
Комбинаторные принципы в генетике 297 где Р(г) есть ожидаемое число клеток, содержащих г отметок; /V — общее число клеток, п — общее число отметок и n = njN. Применяя этот метод к тем белковым цепям, которые были известны в 1956 г., Александр Рич, Мартинас Ичас и автор [6] получили числа, представленные во втором столбце табл. 1. Таблица 1 Сравнение частоты соседних аминокислотных пар в белковых цепях и пар букв в английском и русском текстах со случайным (пуассоновским) распределением Число отметок в квадрате 0 1 2 3 4 5 6 7 8 Число известных белковых цепей 264 103 27 4 2 0 0 0 0 Пуассоновское распределение 264 116 26 4 0,4 0,04 0,003 0,0002 0,00001 «Потерян- «Потерянный рай» 305 55 23 7 3 3 2 0 2 «Очи черные» 361 32 4 2 1 0 0 0 0 Приведенные результаты чрезвычайно хорошо согласуются с теми, которые ожидались бы при случайном распределении (см. третий столбец). Новейшие работы, основанные на изуче- изучении большого числа известных белковых цепей, еще более под- подтверждают это. Интересно использовать тот же метод для анализа последо- последовательностей букв алфавита в английском тексте. В четвертом столбце табл. 1 показаны результаты (соотнесенные к 400 клет- клеткам), полученные при анализе вступительных строк «Потерян- «Потерянного рая» Мильтона. Здесь наблюдается значительное отклоне- отклонение от формулы Пуассона, что объясняется сильной тенденцией некоторых английских букв встречаться парами, например в случае сочетаний th, ck, ch, sh и т. п. В пятом столбце табл. 1 показаны результаты аналогичного анализа русской песни «Очи черные». Поскольку русская орфо- орфография в большей степени, чем английская, следует фонетиче- фонетическому принципу, то число предпочитаемых пар букв здесь мень- меньше и результаты лучше согласуются с пуассоновским распреде- распределением. 21 Зак. 909
298 Георгий Гамов Как бы ни вели себя буквы в разных человеческих языках, однако «белковый язык» ведет себя в строгом соответствии с формулой Пуассона. Это определенно доказывает, что генетиче- генетический код не принадлежит к перекрывающимся кодам. 7. Геометрические соображения Итак, с геометрической точки зрения необходимо предполо- предположить, что в процессе синтеза белков молекула РНК, вероятно, склеивается в форму соленоида, в котором основания сближены. Рис. 6. Молекула РНК. . , Это позволяет объяснить, почему порядок нуклеотидов в тройке несуществен; действительно, в этом случае основания могут образовывать равносторонний треугольник (рис. 6). Для понимания процесса синтеза белков существенно отве- ответить на вопрос о том, как выбираются тройки из сплошной цепи оснований. Действительно, одна и та же последовательность может быть прочитана тремя разными способами: ААГ, А, АГ АА, Г ЦГУ, Ц, ГУ ЦГ, У АГЦ, ..., А,ГЦ ..., АГ.Ц ....
Комбинаторные принципы в генетике 299 — в зависимости от того, как расставить «запятые», показываю- показывающие, какие из членов цепи образуют тройки матрицы. Очевидно, одно из трех чтений должно быть верно, в то время как два другие неверны. Этой проблеме посвящена недавняя работа Ф. X. С. Крика и др. [1], в которой изучаются мутации в бактериофаге, извест- известном под названием Т4. Мутации могут происходить либо по- потому, что в цепь РНК внедрен один дополнительный нуклео- тид ( + ), либо потому, что один нуклеотид удален (—). Путем сложных опытов с мутантами было обнаружено, что единичная мутация (+ или —) в некотором гене делает его неактивным. Интерпретируя это явление, можно сказать, что в результате внедрения либо удаления одного члена последовательности ее чтение становится «бессмысленным», так как все запятые за местом мутации сдвигаются на один шаг влево либо вправо. То же верно для двух мутаций одного типа (+ + или ), так как они сдвигают запятые на два шага. С другой стороны, пара соседних разнотипных мутаций (н или —Ь) значи- значительно меньше отражается на потомстве, поскольку в этом слу- случае все запятые за местом второй мутации оказываются на прежних местах. Таким образом, приходится предполагать, что в каждом гене (т. е. определенной последовательности нуклеотидов) чтение осуществляется просто начиная с первой тройки с одного из концов цепи. Это означало бы, что в процессе синтеза белков различные аминокислотные молекулы не внедряются в матрицу одновременно либо случайным образом в разные участки; на- напротив, процесс проходит упорядочение и аминокислоты вовле- вовлекаются в него по одной, начиная с одного конца гена. 8. Статистические соответствия Поскольку при синтезе белков мы определенно имеем дело с неперекрывающимся кодом, то соответствие между 20 трой- тройками и 20 аминокислотами не может быть установлено, как это пытались сделать вначале, путем поиска такого единственного соответствия, которое не противоречило бы существующим це- цепям. В самом деле, невозможность нахождения такого един- единственного соответствия показывает, что белковый код не яв- является перекрывающимся. Очевидно, единственный возможный метод нахождения этого соответствия может быть основан на статистических соображениях. Обозначим через а, Ь, с и d относительные количества четы- четырех разных нуклеотидов в клетке некоторой разновидности (a + b + c + d= 1). Тогда, используя выражение (aw + bx + cy + dzK 21*
300 Георгий Гамов как производящую функцию1), можно ожидать, что относитель- относительное содержание различных троек будет пропорционально чис- числам a3, 3a2b, 6abc, 3b2c и т. д. Сравнивая эти относительные содержания с полученным путем прямого измерения процент- процентным содержанием различных аминокислот в белке клетки той же разновидности, мы можем надеяться, что обнаружим, какая аминокислота определена каждой данной тройкой. Изучение относительного содержания оснований в ядре наи- наиболее просто в случае желез, вырабатывающих какой-нибудь простой белок, например в случае желез тутового шелкопряда. Шелк, как и все другие «структурные» белки, имеет очень прос- простую аминокислотную цепь из повторяющихся аланинов и гли- глицинов. Следовательно, можно ожидать, что нуклеотидное строе- строение РНК шелкоотделительной железы включает в себя только те основания, которые определяют эти две аминокислоты, или что это строение по крайней мере обнаружит значительное от- отличие от других клеток организма. Неопубликованный эксперимент Мартинаса Ичаса, объектом которого служила нуклеиновая кислота, извлеченная из желез гусеницы, распространенной в Центральной Африке, дал тем не менее отрицательный результат. Этот отрицательный резуль- результат вызван, вероятно, тем, что в живых клетках содержится большое количество разных нуклеиновых кислот и ферментов, а устройства, вырабатывающие шелк, занимают лишь незначи- незначительную часть одной из нуклеиновых молекул. Поэтому тот факт, что данная клетка вырабатывает шелк, не находит суще- существенного отражения в общем устройстве РНК. Гораздо более многообещающим является применение того же принципа к вирусам — живым существам, значительно бо- более простым по сравнению с клетками. В самом деле, частицы вируса состоят, по современным представлениям, из однотип- однотипных молекул нуклеиновых кислот и однотипных белков. К со- сожалению, число вирусов, для которых известно строение и ну- нуклеиновой кислоты, и белков, очень ограниченно. Мартинас Ичас и автор [7] сделали попытку проанализировать данные, из- известные для четырех вирусов: табачной мозаики, желтой мо- мозаики турнепса, кустистой карликовости томата и гриппа. Хотя и можно высказать некоторые предположения о корреляции между аминокислотами и тройками нуклеотидов, все же суще- существующий материал не является в статистическом отношении достаточно большой выборкой, чтобы прийти к каким-либо определенным выводам. ') См. Риордан Дж, Введение е комбинаторный анализ, ИЛ, М, 1963, — Прим. реф.
Комбинаторные принципы в генетике 301 В последнее время некоторого прогресса в этом направле- направлении добились М. У. Ниренберг и Дж. X. Маттеи [14], заявившие, что путем добавления полиуридиловой кислоты (т. е. РНК, все основания которой урацилы) к бесклеточной системе, способ- способной синтезировать белки, они сумели получить полифенилала- нин (т. е. белок, образованный полностью из молекул фенилала- нина). Из этого открытия следует, что фенилаланинная амино- аминокислота определяется тройкой урациловых нуклеотидов. Можно надеяться, что дальнейшие исследования в этом направлении скоро приведут нас к полному пониманию отношений между тройками нуклеотидов и аминокислотами. 9. Методы Монте Карло Несколько лет назад Мартинас Ичас и автор настоящей статьи предложили еще один метод изучения распределения 28 4 - 20 24 Рис. 7. Кривые относительных содержаний 20 аминокислот. Черные кружки —наблюдается в 22 белках; квадраты — формула Неймана; треугольники —метод Монте Карло; белые кружки —тройки, основанные на 7 РНК. аминокислот в белковых молекулах [7]. Этот метод не тре- требует подробных сведений, о последовательности расположение
302 Георгий Гамов аминокислот (а такие сведения имеются лишь в сравнительно не- немногих случаях) и может быть применен всегда, когда известны доли различных аминокислот в белковых молекулах. Если мы построим аминокислоты каждого белка в порядке убывания их относительных содержаний и возьмем средние ве- величины сначала той аминокислоты, которая преобладает в дан- данном белке, затем второй по относительному содержанию и т. д. (не принимая во внимание, какие это аминокислоты), мы полу- получим кривую, отмеченную на рис. 7 черными кружками. Чтобы увидеть, соответствует ли эта кривая случайному распределе- распределению, сравним ее с математической моделью, которая получена следующим образом. Сегмент единичной длины разделен слу- случайным образом на 20 частей, и отрезки: наибольший, второй по величине и т. д. — усреднены по большому числу таких деле- делений. Каковы будут средние длины наибольшего отрезка, вто- второго по величине отрезка, ..., наименьшего отрезка? Эта задача была решена аналитически специально для дан- данной цели Дж. фон Нейманом1). Его рассуждение таково: рас- рассмотрим единичный отрезок, разделенный случайным образом на п частей, так что величины отдельных отрезков, перечисляя их направо, суть хи х2, х3, .... хп. Величины х* подчиняются условиям Определим теперь п чисел yt следующим образом: ух—наименьшее из xt, у2 — второе по малости из xt, уп — наибольшее из х{. Величины Уг подчинены условиям Рассматривая задачу в /г-мерном пространстве, имеем ста- статистический вес, пропорциональный dn = dyxdy2 ... dyn_2dyn_1 = ... dyn_xdyn. ') Частное сообщение.
Комбинаторные принципы в генетике 303 Задача состоит в том, чтобы найти средние величины Уи Уг, ¦ ¦ ¦. Уп для всех возможных делений единичного отрезка. Пусть zr-=yj — t/j-i, j= 1, 2, .... п, где у0= 0. Тогда очевидно, что У] и ограничения, накладываемые на г,,, принимают вид nzl+ (п— 1)г2 + . . . Статистический вес потерь пропорционален .1 ¦ dl — dzldz2...dzn_2dzn_l= — dzldz2 ... dzn_2dzn = Пусть wk=(n+\ —k)zk, где k=\, 2, ..., п. Тогда ограниче- ограничения принимают вид -' ¦ п и статистический вес пропорционален л! В силу симметричности ограничительных условий в {«-про- {«-пространстве имеем (*/| (*/2 • • • п.л п а поскольку 2^=1, то
304 Георгий Гамов Отсюда мы получаем wk 1 1 * n+l—k п n+\—k' и, следовательно, Г V; V1 1 1/1 , 1 У)=2л k—2л~п ' n-^x — k —" что и является искомым результатом. Результаты, полученные из этой формулы для « = 20, обозна- обозначены квадратиками на рис. 7, и легко видеть) что они значи- значительно отклоняются от эмпирических данных (обозначенных черными кружками). Возможное объяснение этого несовпадения может строиться на том, что неслучайность была внесена самой процедурой пере- перевода из существенно случайного распределения нуклеотидов молекул РНК в аминокислотные цепи белков. Чтобы прове- проверить эту гипотезу, пришлось изучить методом Монте Карло бел- белковые цепи, образованные из случайного распределения нуклео- нуклеотидов с помощью определенного троичного кода. Обозначим относительные содержания четырех нуклеотидов через А, В, С и D с условием нормализации обозначим относительные содержания аминокислот через o&i, o&2, . • • i «го с условием нормализации 20 Введем затем переводную таблицу. Аминокислота а, а2 «20 Тройка нуклеотидов ААА ААВ DDD Теперь возьмем длинную случайную последовательность ну- нуклеотидов, например CD A DC В ВАВ ААВ ....
Комбинаторные принципы в генетике 305 и, применяя переводную таблицу, обратим ее в цепь амино- аминокислот. Применим теперь к этой последовательности описанную выше процедуру определения аминокислоты с наибольшим отно- относительным содержанием, аминокислоты, второй по относитель- относительному содержанию, и т. д. и усредним результаты по большому числу испытаний, чтобы получить кривую, сравнимую с эмпи- эмпирической. Результат 3000 таких испытаний, выполненных Дж. Ферми и Н. Метрополисом [5] на Лос-Аламосской электронной вычис- вычислительной машине, показан также на рис. 7 (кривая из тре- треугольников); этот результат отклоняется от наблюдаемого рас- распределения (кривая из черных кружков) даже больше, чем результаты, полученные по формуле фон Неймана. Как последнее прибежище были взяты действительные про- процентные содержания нуклеотидов в семи известных молекулах РНК и на их основе подсчитаны частоты разных троек. Резуль- Результат (кривая из белых кружков на рис. 7) хорошо согласуется с наблюдаемой кривой, и это показывает, что отклонение от случайности в аминокислотных последовательностях белков яв- является результатом неслучайности, с которой четыре нуклеотида распределяются в молекулах РНК. Степень этой неслучайности и ее отношение к биологической эволюции, вызванной мута- мутациями и выживанием наиболее приспособленных, представляет собой интересный предмет для дальнейших исследований. 10. Экспериментальные результаты Все то время, когда проблема кодирования белков амино- аминокислотами подвергалась смелым атакам теоретиков (а это было нелегко из-за скудности опытных данных), биохимики-экспери- биохимики-экспериментаторы встряхивали пробирки, чтобы получить ответ чисто эмпирическим путем. Автор данной статьи полагает, что — по крайней мере до определенной степени — возросший интерес биохимиков к про- проблеме взаимоотношения между нуклеиновыми кислотами и бел- белковыми цепями был стимулирован его теоретическими рабо- работами. Биохимику, вооруженному всевозможным химическим оборудованием, легче изучать биологические структуры, чем заинтересовавшемуся этой проблемой теоретику, в распоряже- распоряжении которого есть только карандаш, бумага и, возможно, вычис- вычислительная машина. Так, в 1961 г., через восемь лет после появления первой статьи автора, в которой было высказано предположение, ч% аминокислотная цепь в белковых молекулах определяется цепью
306 Георгий Гамов базисных троек в молекулах нуклеиновой кислоты, появилось две статьи — одна Северо Очоа и др. из Школы медицины Нью- йоркского университета [12] и другая Маршалла У. Ниренберга и др. из Национального института метаболических заболева- заболеваний [14], — в которых путем долгой серии опытов (см. библио- библиографию) устанавливалась корреляция между аминокислотами и белковыми цепями. Эти результаты полностью подтвердили первоначальную гипотезу о тройках нуклеотидов. Отношения, полученные экспериментально этими авторами, показаны в табл. 2. Таблица 2 Корреляция Аминокислота Феи Ала Apr Асп Аспн Цис Глу Глун (вероятно) Гли Гис между аминокислотами и базисными тройками Тройка УУУ УЦГ УЦГ УАЦ УАА; УАЦ УУГ УАЦ УЦГ УГГ УАЦ Аминокислота Илей . Лей Лиз Мет Про Сер Тре Три Тир Вал Тройка УУА УУЦ; УУГ; УУА УАА УАГ УЦЦ УУЦ УАЦ; УЦЦ УГГ УУА УУГ Рассматривая эту таблицу, можно заметить, что хотя в об- общем приводимые результаты и согласуются с первоначальной гипотезой, соответствие аминокислот и троек нуклеотидов не выполняется регулярно. Например, аланин и аргинин опреде- определяются одной и той же тройкой. С другой стороны, некоторые аминокислоты (Асп и Тре) могут определяться двумя разными тройками, а лейцин — тремя исходными тройками. Кроме того, тройки ААА, ЦЦЦ и ГГГ не определяют никаких аминокислот. Догадки о возможности этих, как их называют, субститу- субституций высказывались и прежде, при теоретическом подходе к про- проблеме, но установленные теперь случаи нерегулярности так исказили общую картину, что соотношение не могло быть полу- получено чисто теоретически. Природа хитра, но все же число существующих аминокис- аминокислот равно числу троек, которые могут быть составлены из че- четырех разных элементов. Возможно, когда-нибудь в будущем Мы поймем, почему это так.
Комбинаторные принципы в генетике 307 Вопросы для самопроверки 1. Наследственная информация передается и реплицируется через а) РНК; б) ДНК; в) АТФ; г) РДК. 2. Протеиновая молекула состоит из а) нуклеиновых кислот; б) аминокислот; в) бензольных колец; г) анти- антител. 3. Число различных троек, составленных из четырех разных элементов, не учитывая порядка элементов внутри тройки,— а) 12; б) 20; в) 36; г) бесконечно. 4. В задаче 3, если порядок внутри каждой тройки существен, число разных возможностей —• а) 24; б) 55; в) 64; г) 137. 5. Формула Пуассона в том виде, как она использована в данной статье, дает а) вероятность попадания единиц, двоек, троек и т. д. при случайном распределении п элементов в m подмножеств; б) отношение между электрическим зарядом и потенциалом; в) число простых чисел, меньших чем N; г) французский рецепт приготовления рыбы. ЛИТЕРАТУРА ,A] Brenner S., Barnett L., Crick F. H. C, Or gel A., The Theory of Mutagenesis, /. Mol. Biol, 3 A961), 121—124. [2] Crick F. H. C., The Recent Excitement in the Coding Problem, Progress in Nucleic Acid Research, Academic Press, New York, 1963. [3] G a m о w G., Possible Relations between Deoxyribonucleic Acid and Pro- Protein Structures, Nature, 173 A954), 318. [4] G a m о w G., Possible Mathematical Relation between Deoxyribonucleic Acid and Proteins, Kgl. Danske Videnskab. Selskab. Biol. Medd., 22, 3 A954), 1—13. [5] G a m о w G., Metropolis N., Numerology of Polypeptide Chains, Sci- Science, 120 A954), 779—780. [6] G a m о w G., Rich A., Yeas M., The Problem of Information Transfer from the Nucleic Acids to Proteins, Advances in Biological and Medical Physics, 4 A956), Academic Press, 1956. [7] Ganiow G., Y б a s M., Statistical Correlation of Protein and Ribonucleic Acid. Composition, Proc. Nat. Acad. Sci. U. S. A., 41 A955), 1011—1019 [8] Jones O. W., Jr., Nirenberg M. W., Qualitative Survey of RNA Co- Codewords, Proc. Nat. Acad. Sci. U. S. A., 48 A962), 2115—2123. [9] Kaziro Y., Grossman A, Ochoa S., Identification of Peptides Syn- Synthesized by Cell-Free E. Coli System with Polynucleotide Messengers, Proc. Nat. Acad. Sci. USA, 50 A963), 54—61. [10] Krakow J. S., Ochoa S., Ribonucleic Acid Polimerase of Azotobacter Vinelandii, I Priming by Polyribonucleotides, Proc. Nat. Acad. Sci. USA, 49 A963), 88—94. [11] Leder Ph., Clark BF.C, Sly W. S., Pestka S., Niren- Nirenberg M. W., Cell-Free Synthesis Dependent upon Synthetic Oligodeoxy- nucleotides, Proc. Nat. Acad. Sci. USA, 50 A963), 1135—1143.
308 Георгий Гамов [12] Lengyel P., Speyer J. F., Ochoa S., Synthetic Polynucleotides and the Amino Acid Code, I—V, Proc. Nat. Acad. Sci. USA, 47 A961), 1936— 1942; 48 A962), 63—68, 282—284, 441—448, 613—616. [13] Matthaei J. H., Jones O. W., Martin R. G., Nirenberg M. W., Characteristics and Composition of RNA Coding Units, Proc. Nat. Acad. Sci. USA, 48 A962), 666—677. [14] Nirenberg M. W., Matthaei J. H, The Dependence of Cell-free Protein Synthesis in E. Coli upon Naturally Occurring of Synthetic Poly- ribonucleotides, Proc. Nat. Acad. Sci. USA, 47 A961), 1588—1602. [15] Nirenberg M. W., M a t h a e i J. H., Jones O. W., An Intermediate in the Biosynthesis of Polyphenylalanine Directed by Synthetic Template RNA, Proc. Nat. Acad. Sci. USA, 48 A962), 104—109. [16] S anger F., The Arrangement of Amino Acids in Proteins, Advances in Protein Chemistry, 7 A952), 1—67, Academic Press, New York, 1952. [17] Singer M. F, Jones O. W., Nirenberg M. W., The Effect of Se- Secondary Structure on the Template Activity of Polyribonucleotides, Proc. Nat. Acad. Sci. USA, 49 A963), 392—399. [18]Tsugita A., Fraenkel-Conrat H., Nirenberg M. W., Mat- Matthaei J. H., Demonstration of the Messenger Role of Viral RNA, Proc. Nat. Acad. Sci. USA, 48 A962), 846—853. [19]Tsugita A., Gish D. Т., Young J., Fraenkel-Conrat H., Knight C. A., Stanley W. M., The Complete Amino Acid Sequence of the Protein of Tobacco Mosaic Virus, Proc. Nat. Acad. Sci. USA 46 A960), 1463—1469. [20] d u V i g ii e a u d V., Hormones of the Posterior Pituitary Gland: Oxyto- cin and Vasopressin, Harvey Lectures, 50 A954—55), 1—26. [21] Weissmann Ch., Lionel S., Ochoa S., Induction by an RNA Phage of an Enzyme Catalyzing Incorporation of Ribonucleotides into Ribonucleic Acid, Proc. Nat. Acad. Sci. USA, 49 A963), 407—414. [22] White A., Handler Ph., Smith E. L, Principles of Biochemistry 3rd edition, McGraw-Hill Book Company, New York, 1964.
ДОПОЛНЕНИЯ Герман Be иль') 1. Искусство комбинаторики 1. Возможно, наиболее интересной в философском отноше- отношении чертой современной науки является возникновение аб- абстрактных символических структур, выступающих в качестве объективной основы для красочной сказки (по выражению Эд- дингтона), созданной воображением рассказчика. В данной статье речь пойдет о некоторых простейших воз- возможных структурах, о комбинаторике совокупностей и комп- комплексов. К счастью, эта простейшая часть символической мате- математики так тесно переплетается с философски важными пробле- проблемами тождества и вероятности, что она объясняет некоторые наиболее фундаментальные явления живой и неживой при- природы. Такой же «структурной» точкой зрения мы руководствуемся при оценке оснований квантовой механики в п. 2. Если даже обратиться к очень далекой от нас области, например эконо- экономике, то видно, что недавние попытки Дж. фон Неймана и Мор- генштерна построить экономику на базе теории игр являются проявлением той же тенденции. Нервная сеть, соединяющая мозг с органами чувств, является тем объектом, который по самой своей природе требует комби- комбинаторных исследований. Современные вычислительные машины с помощью механических и электронных устройств осуще- осуществляют на практике наш подход к математике как к объекту комбинаторной структуры. Ввиду этой общей ситуации мы собираемся теперь при- привести несколько вспомогательных комбинаторных рассуждений элементарного характера относительно совокупностей и инди- индивидов. Следует предупредить читателя заранее, что в приложениях к генетике все контуры очерчены порой неоправданно четко. С развитием науки часто выясняется, что подобные элементар- ') Эта статья является приложением к книге Вейля «Philosophy of Mathematics and Natural Sciences [PMNS], Princeton University Press, 1949 она включает в себя дополнения В — Е (Appendices В — Е).
310 Герман Вейль ные структуры, которые, грубо говоря, соответствуют очевид- очевидным фактам, основаны на более глубоких структурах; при этом выявляются пределы их годности. Совокупность белых, красных и зеленых шаров может со- содержать несколько белых шаров. Вообще в данной совокуп- совокупности могут встречаться несколько индивидов, или элементов, одного и того же рода (рода белых шаров) или, иначе говоря, элементы с одним и тем же свойством (быть белым шаром) мо- могут встречаться в нескольких экземплярах. Следует различать понятия quale и quid т. е. равный (того же рода) и тождествен- тождественный. На возникающий при этом вопрос об отождествлении Лейбниц дал априорный ответ своим «принципом идентифика- идентификации неразличимости»1): Физики недавно получили точное эмпи- эмпирическое решение этого вопроса для элементарных частиц, осо- особенно фотонов и электронов. С этим вопросом тесно связана проблема тождества во времени; тождественное «Я» моего вну- внутреннего опыта является философски наиболее важным приме- примером. Наше решение относительно того, что следует считать рав- равным или различным, влияет на подсчет «различных» случаев, на котором основано определение вероятности, и, таким обра- образом, проблема тождества затрагивает основания теории вероят- вероятностей. Только благодаря комбинаторной теории совокупностей подобные вещи находят свою точную математическую интерпре- интерпретацию, и едва ли существует иная отрасль знания, где соотно- соотношение идей и математики выступает в более прозрачной форме. Простейший комбинаторный процесс — это разбиение мно- множества S, состоящего из п элементов, на два дополнительных подмножества Si и S2 (обозначим S = Si + S2). В целях отождествления и регистрации мы приписываем элементам произвольно выбранные различные пометки. Только те соотношения и утверждения имеют объективный смысл, ко- которые не подвержены влиянию изменений в выборе пометок; в этом заключается принцип относительности. Эта абстрактная формулировка показывает тривиальность этого принципа. «Индивидуальное» подмножество Si характеризуется тем, что для каждого элемента устанавливается, является ли он элемен- элементом из Si или же элементом его дополнения S2. Поскольку по- построение Si, таким образом, зависит от решения п альтернатив (принадлежность элемента S, или S2) для каждого из п раз- различных по предположению элементов, то имеются всего 2П раз- различных возможных индивидуальных подмножества (включая как пустое множество, так и само множество S). Однако число раз- различных выборов Si равно л + 1, если п элементов рассматривать Piincipium identitatis indiscernibilium (лат.)—Прим. перев.
Дополнения 311 как неразличимые. В этом случае подмножество S, полностью характеризуется числом пх его элементов, принимающим значе- значения 0, 1, ...,«, и разбиение S на Sf и S2 характеризуется раз- разложением n = ni + n2 числа п на сумму двух слагаемых (где Пи Пч — числа элементов в множествах Si и S2 соответственно). Может возникнуть вопрос, сколько различных индивидуаль- индивидуальных разбиений S на Si и S2 приводят к тому же самому «объек- «объективному» разбиению, характеризуемому разложением n = ni + n2. Ответ таков: п\ ¦ л,! л2! ' '•'• : Следовательно, общее число 2" всех индивидуальных раз- разбиений должно равняться сумме : VI л! причем суммирование берется по п+1 различным разложениям n = nl + n2: оя _ п\ п\ п\ . л!_ . 0!л! "f" 1!(л —1)! "i 2!(л—2)! """ " " " "*" л! О! ' у ' Но этот простейший случай не представляет большого инте- интереса. Приближаясь к реальному случаю, предположим, что су- существует отношение, при котором элементы могут быть равны (~) или различны. Шары могут быть белыми, красными или зелеными; электроны могут находиться в том или ином положе- положении; звери в зоопарке могут быть млекопитающими, рыбами, птицами или рептилиями; атомы в молекуле могут быть ато- атомами Н, Не, Li и т. д. Общее выражение для такого «равенства по роду» осуществляется посредством бинарного отношения эквивалентности а~Ь удовлетворяющего аксиомам: а~а; если а~Ь, то Ь~а; если а~Ь, Ь-~с, то а~с. Употребляются раз- различные термины для обозначения эквивалентности а~Ь двух произвольных элементов a, b при данном отношении эквива- эквивалентности: говорят, что а и b того же рода или той же природы, говорят, что они принадлежат одному и тому же классу, или на- находятся в том же состоянии. Совокупность S есть множество элементов, каждый из которых находится в определенном со- состоянии; следовательно, термин «совокупность» употребляется в смысле «множество элементов с отношением эквивалент- эквивалентности». Предположим, что любой элемент может находиться только в некотором из k различных состояний С,,. . . , Ch. Будем говорить, что задано некоторое индивидуальное состояние сово-
312 Герман Вейль купности S, если для каждого из я элементов известно его со- состояние. Таким образом имеются всего kn индивидуальных со- состояний совокупности S. Если, однако, не вводится никаких искусственных различий между элементами и принимается во внимание только внутреннее различие состояния, то совокуп- совокупность полностью характеризуется тем, что каждому состоянию С; (i = l, ..., k) ставится в соответствие число я,- элементов S, принадлежащих Ct. Эти числа, сумма которых равна я, описы- описывают то, что более удобно называть объективным или эффектив- эффективным состоянием системы S. Каждое индивидуальное состояние совокупности связано с некоторым эффективным состоянием, и любые два индивидуальных состояния связаны с одним и тем же эффективным состоянием тогда и только тогда, когда из одного можно перейти в другое подстановкой пометок элементов; здесь принцип относительности находит свое выражение в постулате об инвариантности по отношению к группе всех подстановок. Число различных эффективных состояний равно числу «упоря- «упорядоченных» разложений n = tii + . . . + nk числа я на k слагаемых я,-, и его значение легко находится с помощью выражения —1)! ,9. 9 1 ... (й- 1) n\(k — 1)! ' к > Подобно тому, как равенство A) объясняет различие между ве- величиной B) в левой части и числом я+1 слагаемых в правой, нам не трудно установить, сколько различных индивидуальных состояний связаны с тем же объективным состоянием и, таким образом, объяснить различие между числами kn и B). Было установленно, что число различных индивидуальных раз- разбиений S на два дополнительных подмножества S\ и S2, или же число различных индивидуальных подсовокупностей Su равно 2П; но поскольку элементы теперь различимы по «роду», эффектив- эффективная подсовокупность Si задается приписыванием каждому со- состоянию С,- числа n't элементов, которыми это состояние пред- представлено в S,. Поскольку п\ принимает яг+1 значений 0, 1,... . .. , пи имеем (л,+ 1) ••• (л*+1) ¦ C) различных возможных эффективных разбиений S на Si и S2. Число C) не превосходит 2П {п = п\+ ... +nk). Максимум, т. е. 2П достигается, если все я; имеют значение О или 1, т. е. если в каждом состоянии находится не больше од- одного элемента в 5. Действительно, в этом случае элементы мо- могут быть полностью охарактеризованы состоянием, в котором
Дополнения 313 они находятся (их «природой»), и нет нужды в искусственном различении с помощью пометок. В этом случае мы говорим об одночленной совокупности. Процесс, обратный разбиению некоторой совокупности на две дополнительных подсовокупности S\ и S2, есть объединение двух данных (непересекающихся) совокупностей Si и 5г в S. Комбинаторная теория совокупностей и взаимно обратных опе- операций разбиения и объединения находят особенно важное при- приложение в генетике. Развитие двух организмов может проходить в различных направлениях вследствие «внешних обстоятельств», даже если они имеют одну и ту же генетическую конституцию (зародышевую плазму или, в терминологии Вейсмана и Джоан- нсена, генотип). Эта двойственность конституции и окружающей среды — «природы организма и природы условий» — является основой для нашей интерпретации явлений наследственности. Ее можно считать априорным понятием подобно в какой-то степе- степени аналогичной двойственности инерции и силы в механике. Грубо говоря, факторы окружающей среды характеризуются как внешние по отношению к организму (относительно), изменяю- изменяющиеся и контролируемые, в противоположность внутренней, дан- данной и (относительно) стабильной конституции. То, что принад- принадлежит к социальной среде индивида, может быть конститутив- конститутивной характеристикой общества, в котором он живет. Как и в случае других основных понятий, точный смысл двойственности для каждой области постепенно раскрывается вместе с теорией соответствующего явления: на основе порой туманной, но есте- естественной интерпретации обнаруживаются определенные законы, которые поражают своей точной формой, и, объединяясь вместе, образуют теорию; следуя этим простым законам и интерпрети- интерпретируя все возрастающее множество мельчайших фактов в свете этой теории, удается достигнуть большей точности. В этом смыс- смысле в биологии имеется несметное количество эмпирических дока- доказательств различия природы организма и природы условий, хотя это различие никогда не становится совершенно четким. В экспериментах по скрещиванию удалось выразить генети- генетическую конституцию как совокупность отдельных генов или «то- «точек», подобно тому, как в химии описывают молекулы как сово- совокупность атомов. И так же, как индивидуальный атом (объект со свойством «быть атомом») может находиться в одном из разнообразных состояний, обозначенных химическими символами Не, Li, . . . , генетические точки могут принимать различные дискретные состояния, называемые аллелями. В процессе опло- оплодотворения (сингамия) две совокупности S{, S2 — «гаметы» (спер- (сперматозоид и яйцеклетка) объединяются в «зиготу», или зароды- зародышевую клетку S = Si+S2. Гамета вырабатывается организмом, 22 Зак. 909
314 Герман Вейль Si — организмом Qb S2 — организмом Q2 (^2 не обязательно от- отличен от Qi, они могут быть одним и тем же самооплодотворяю- самооплодотворяющимся растением). Все вегетативные клетки организма Q, ко- которые развиваются из зародышевой клетки S, несмотря на их функциональную дифференциацию, касающуюся их генетиче- генетической структуры, являются копиями его зиготы S. Часть вегета- вегетативных клеток в некоторый период жизненного цикла претерпе- претерпевает обратный процесс разбиения на две дополнительные сово- совокупности (деление созревания, или мейозI); таким образом организм Q способен производить столько конституционно раз- различных гамет, сколько существует эффективно различных под- подсовокупностей S. Это сочетание сингамии и мейоза, объединение и разбиение, объясняет основные черты наследственности: по- постоянство преобладает постольку, поскольку сумма двух сово- совокупностей однозначно определяется обеими частями, изменчи- изменчивость же преобладает постольку, поскольку разбиение совокупно- совокупности на дополнительные части может быть выполнено различными способами. Организм производит гаметы S', содержащиеся в качестве подсовокупности в его зиготе S с определенными относитель- относительными частотами (вероятностями) y = y(S'). На эти вероятности влияют внешние обстоятельства, в частности, температура, и поэтому они в противоположность дискретным совокупностям подвержены непрерывным изменениям. Однако априори оче- очевидно, что дополнительная гамета S" встречается с той же час- частотой, что и S', y(S') =y(S"). (Даже если, как в случае орга- организма 9 2), одна из двух дополнительных частей S', S" исключе- исключена после деления созревания в результате вырождения в поляр- полярные тельца, можно придерживаться предположения y(S') =y(S") для априорных вероятностей.) Правдоподобно, что вероятность сингамии между гаметой S' организма Q и гаметой S, орга- организма Q:: та же, что и для различных родов гамет S' и St. произведенных организмами Q, Q*. Следовательно, вероятность того, что родительские формы Q, Q» порождают дочерний орга- организм с зиготой S' + S[ предполагается равной у (S ) Y* (^0- Возвращаясь к абстрактной теории, перейдем к обсуждению изменения состояния данной совокупности во времени. Пока эле- элементы принимают только дискретные состояния, мы вынуждены представлять время как последовательность дискретных момен- ') Настоящий процесс (двухшаговый процесс сопровождается продоль- продольным расщеплением каждой хромосомы на две хроматиды) немного более сложен, чем его комбинаторный аналог. 2) Женский организм. — Прим. перев.
Дополнения 315 тов t=...,—2, •—1, 0, 1,,.... Тогда переход системы (сово- (совокупности) из состояния в момент t в состояние в момент t+\ будет скачкообразной мутацией. При п элементах, различаемых с помощью пометок р, общая картина будет описываться зада- заданием состояния С(р; t) элемента р в момент t как функции put. Это «индивидуальное» описание посредством функции С(р; t) должно дополняться принципом относительности, согласно кото- которому соответствие между индивидами и их пометками является произвольным; но соответствие, коль скоро оно установлено, не изменяется во времени. Если, с другой стороны, в каждый мо- момент внимание уделяется только объективному состоянию, то числа tii(t),. . . , nh (t), зависящие от t, дают полную картину, хотя эта информация и не полна, вообще говоря. В настоящее время мы говорим только о том, сколько элементов rii(t) нахо- находится в состоянии С{ в любой момент t, поскольку мы не можем проследить тождественность п индивидов во времени. Мы не знаем про элемент, находящийся в данный момент, например, в состоянии С5, был ли он в предыдущий момент в состоянии Сг или С6. Мир как будто создается заново в каждый момент, и между существами, присутствующими в данный момент, и теми, которые будут встречаться в следующий момент, не существует тождественной связи. Таков философский взгляд на изменяю- изменяющийся мир раннего исламского философа Мутакалимуна. Это не индивидуализирующее описание применимо, даже если общее число tii(t) +. . . + nh(t) —n(t) элементов не остается постоянным с течением времени. Где бы в действительности не было выполнено отождествле- отождествление той же самой сущности в различные моменты времени, оно обязательно основывается на наблюдаемом состоянии. Для не- непрерывного течения времени и непрерывного многообразия со- состояний основной принцип, вообще говоря, должен формулиро- формулироваться следующим образом: предположим, что существует в мо- момент t только один индивид в некотором состоянии С, сущест- существенно отличном от состояний всех других индивидов; если через некоторый промежуток времени, особенно если это очень малый промежуток, в момент Р один и только один индивид находится в состоянии С, мало отличающемся от состояния С, или «по- «подобного типа» для состояния С, то это свидетельствует о спра- справедливости предположения о том, что мы имеем дело с тем же самым индивидом и в момент t и в момент Р. Вместо tut' можно рассматривать целую последовательность моментов t, P,t",. . . . Это волна, двигающаяся по поверхности воды! Если отбросить внутреннюю уверенность в тождестве чьего-то «Я» и все связи, основанные на этой уверенности («Я тот же человек, который встречал вас тогда и сейчас»), то нужно воспользовать- 22*
316 Герман Вейль ся теми же средствами (вспомним знаменитые сцены узнавания в мировой литературе, начиная с «Одиссеи» и т. д.). 2. Мы видим, что, говоря о различного рода классах (состоя- (состояниях), мы обращались к лежащему в основе понятию эквива- эквивалентности. Каждый класс С принадлежит определенному роду G = [C], и индивид, будучи членом класса С, также принадлежит роду [С]. Так, звери в зоопарке делятся на млекопитающих, рыб, птиц и т. д., а млекопитающие, в свою очередь — на обезьян, львов, тигров и т. д. Состояния могут совпадать по некоторому признаку, этот признак тогда соответствует роду, а состояние — классу элементов '). Деление на роды и классы основано на са- самом грубом и самом тонком понятии эквивалентности: а~Ь и а~Ь, где из а~Ъ следует а^Ь. В различных отраслях знаний эта различная классификация выступает в различных термино- терминологических формах. Подходящим примером являются совокуп- совокупности в генетике. Гены соответствуют родам, аллели — классам; ген может иметь два или несколько аллелей. Тот факт, что эле- элемент р совокупности принадлежит классу С и, следовательно, роду [С], здесь выражается словами: «точка р занята аллелем С гена [С]». Я упоминаю здесь несколько терминов, используемых в гене- генетике для обозначения основных понятий комбинаторной теории совокупностей, и описываю частные обстоятельства, «нормаль- «нормально» преобладающие в процессе создания потомства. Индиви- Индивидуальная совокупность S известна, если для каждой ее точки (элемента с пометкой) р известно, какому классу Ср она при- принадлежит; тогда р также принадлежит соответствующему роду [Ср]. Две индивидуальных совокупности, S и S*, имеют одну и ту же конституцию S^S*, если пометки р, используемые для точек первой совокупности, могут быть взаимно однозначно ото- отображены на пометки /?*, используемые для точек S*, так что со- соответственные точки р и р* в обеих совокупностях всегда при- принадлежат одному и тому же классу (изоморфизм). Согласно принципу относительности, совокупности одинаковой конститу- конституции должны рассматриваться как неразличимые. При данных внешних обстоятельствах зигота полностью определяет фенотип, видимое развитие организма; зиготы одной и той же конститу- конституции имеют один и тот же фенотип. Некоторая эффективная сово- ') Эта терминология используется в теории чисел; род квадратичной формы шире чем класс. В биологической таксономии с ее иерархией таксонов (тип, класс, порядок, семейство, род, вид, разновидность) дело обстоит наоборот.
Дополнения 317 купность S описывается приписыванием каждому классу С чис- числа пс точек S из класса С; число nG точек из рода G равно тогда сумме 2 "с, взятой по всем тем классам С, для которых [C] = G. Индивидуальные совокупности связаны с одной и той же эффективной совокупностью тогда и только тогда, когда они изоморфны, т. е. имеют одну и ту же конституцию. Говорят, что две индивидуальные совокупности S и S* одного и того же вида а, если между их точками существует такое взаимно одно- однозначное соответствие р+±р*, при котором соответственные точки р и р* в S и S* всегда принадлежат тому же роду1). Совпаде- Совпадение чисел «о и па для всех возможных родов G является необ- необходимым и достаточным условием этого; следовательно, числа «о содержат полное описание вида а некоторой совокупности. Совокупность S называется одночленной, если различные точ- точки никогда не принадлежат к одному классу; она называется гаплоидом, если различные точки S никогда не принадлежат одному и тому же роду, т. е. для каждого рода G число nG рав- равно 0 или 1. Соответствующие виды называются тогда гаплоид- гаплоидными. Если совокупность S содержит две точки различных клас- классов, но одного и того же рода G, то S называется гетерозигогой (гибридом); при этом она является гетерозиготой относитель- относительно G. Объединение двух совокупностей S, и S2 в одно целое S = Si + S2 и обратный процесс разбиения S па S{ и 52 называют- называются уравновешенными, если части имеют один и тот же вид. Именно это обычно наблюдается в случае сингамии и мейоза. При уравновешенных сингамии и мейозе виды остаются посто- постоянными в последовательных поколениях. В самом деле, пусть 5 и S* — две гаметы одного и того же вида а — объединяются и образуют зиготу S + S*; если послед- последняя затем расщепляется в процессе уравновешенного мейоза на Si и S2, то St и S2 обязательно того же вида а, что и S, S*. Это остается верным, даже если допустить возможность мутаций, при которых точка может перейти в другой класс, но не род (точковые мутации). В частности, если процесс «уравновешен- «уравновешенного» воспроизведения начинается с двух гамет одного и того же гаплоидного вида а, то только гаплоидные гаметы этого вида ') Это естественное, но чисто комбинаторное понятие связано, но не пол- полностью совпадает с понятием вида в биологии. Последнее, несомненно, хотя и трудно поддается точному определению, соответствует основному факту. Как пример, указывающий на глубокое различие между двумя понятиями, я привожу «динамическое» определение Добжанского (Philosophy of Science, 2 A935), 344—355); [Вид — это стадия эволюционного процесса, на которой совокупность форм, некогда действительно и потенциально скрещивающихся друг с другом, расщепляется на две отдельные совокупности, которые физио- физиологически неспособны к скрещиванию друг с другом».
318 Герман Вейль (и диплоидные, т. е. состоящие из двух гамет одного вида, зи- зиготы) будут появляться в последующих поколениях; этот наи- наиболее часто встречающийся случай был рассмотрен Грегором Менделем. Если предположить, что зигота самооплодотворяю- самооплодотворяющегося организма Q не является гибридом, то все прямые и косвенные потомки Q будут иметь тот же генотип, что и Q. Причинами различия фенотипа в такой «чистой линии», если они случаются, должны служить внешние обстоятельства, и таким образом, неизменная генетическая конституция наибо- наиболее четко отделена от изменяющихся внешних факторов (опыты Джоаннсена с фасолью, 1903). 3. В физике мы стремимся сделать различия между клас- классами такими тонкими, что дальнейшие усовершенствования ста- становятся невозможными; другими словами, мы стремимся к полному описанию состояния. При этом описании два индивида в одном и том же «полном» состоянии неразличимы никакими внутренними признаками, хотя они могут и не быть одинаковы- одинаковыми объектами. В классической механике принимается, что со- состояние точки данной массы (и заряда) полностью описывается положением и скоростью, потому что подобная точка зрения дает возможность достичь согласования с принципом причин- причинности, в котором утверждается, что («полное») состояние точеч- точечной массы в некоторый момент определяет ее состояние во все другие моменты. Простейшим примером точечной массы яв- является линейный осциллятор. Он колеблется по определенной прямой (таким образом рассматривается пространство одного измерения) и имеет определенную частоту v (равную числу колебаний в 2я секундI). Все состояния осциллятора, точно определяемые положе- положением и скоростью, образуют двумерное непрерывное много- многообразие. Однако, согласно квантовой механике, они принимают значение только из дискретного многообразия п различных со- состояний, 0, 1, 2, .... В состоянии п осциллятор имеет энергию nhv, где п= 1,042X Ю~27 эргХсек — постоянная Планка (число это обычно обозначается перечеркнутой буквой Ь. Излучение в объеме, стенки которого обладают свойством абсолютного от- отражения («черное тело»), эквивалентное суперпозиции гармо- гармонических осцилляторов, каждый из которых обозначен индек- индексом а и имеет определенную частоту va. ') Неудачно, что в английском (как и в русском. — Перев.) языках сло- слово «частота» используется в двух полностью различных смыслах — для обо- обозначения числа событий в статистическом ансамбле (нем. «Haufigkeit») и для числа колебаний.
Дополнения 319 Таким образом, излучение черного тела можно рассматри- рассматривать как совокупность линейных осцилляторов, наделенных не- некоторой собственной частотой va. (Здесь не принимается во вни- внимание статическая часть электромагнитного поля.) Согласно квантовой механике отдельного осциллятора, «полное» со- состояние нашего поля излучения тем не менее придает некоторое целое число па каждому осциллятору ос; в этом состоянии ос- осциллятор а имеет энергию nahva, а сумма 2 tta^va> взятая по a всем осцилляторам, есть полная энергия. В терминах фотонов это можно выразить, сказав, что имеются па фотонов в состоя- состоянии а и с энергией hva. На языке осцилляторов индекс а ука- указывает на отдельный осциллятор, а целое число па — на его состояние, в го время как на языке фотонов а обозначает со- состояние фотона, а па — число фотонов в этом состоянии. После перевода на язык фотонов излучение предстает в виде «газа фотонов». Поскольку в квантовой механике возможные «полные» со- состояния индивида образуют дискретное многообразие, примене- применение статистики здесь состоит в подсчете числа состояний. Как только вопрос о полном описании состояний разрешен, все ве- вероятности подсчитываются простым перечислением и не возни- возникают трудности, которые имеются в случае непрерывного «фа- «фазового пространства». Так как фотоны непрерывно излучаются и поглощаются, то они индивидуально неразличимы. Тем не менее ничего нельзя установить относительно того, что было раньше названо эффективным состоянием совокупности. Сле- Следовательно, состояние фотонного газа известно, когда для ка- каждого возможного состояния фотона а задано число фотонов па, находящихся в этом состоянии. (Статистика излучения Бозе — Эйнштейна.) До тех пор пока у нас не возникает потребность проникнуть глубже в природу света, она не-проявляется сама в таких явле- явлениях, как дифракция, интерференция и т. д., ее дуалистиче- дуалистический характер остается скрытым. С электронами дело обстоит хуже; они, очевидно, являются частицами, в то время как их волновые свойства были обнаружены экспериментаторами только одновременно с развитием квантовой теории. Теперь уже ясно, что явления, подобные излучению, должны быть представлены волновым полем, законы которого хорошо согласуются с урав- уравнениями электромагнитного поля Максвелла и дополняют их (де Бройль, Шредингер, Дирак). Если это выполняется для от- отдельного электрона, то те же самые рассуждения имеют место в применении к излучению черного тела; электронный газ опи- описывается заданием для каждого состояния а числа электронов
320 Герман Вейль па, которые находятся в этом состоянии и обладают соответ- соответствующей энергией hva. Газу, состоящему из бесчисленного чис- числа свободных электронов, мы противопоставляем оболочку из нескольких электронов, связанных с положительно заряженным атомным ядром и образующих вместе с этим ядром атом. Идеи дискретных энергетических уровней и фотона завоевали наи- наибольший успех в применении к последней ситуации, так как они прямо привели к правилу частоты Бора, согласно которому энергия hv, потерянная электроном, перепрыгнувшим с высшего на низший энергетический уровень в атоме, испускается в виде фотона частоты v. Это правило дает ключ к объяснению обшир- обширной области очень тонких наблюдений, накопленных спектро- спектроскопистами, относительно испускания спектральных линий из- излучающими атомами и молекулами. Однако полное согласие было достигнуто только после принятия предположений о том, что никакие два электрона не находятся в одном и том же окончательном состоянии (принцип Паули). Это является ре- решающим фактом для понимания так называемой периодической системы химических элементов. Квантовая теория химических связей основана на том же принципе (ср. п. 3). Выведенный из спектроскопических фактов, этот принцип может применяться к таким свободным электронам, которые встречаются в элек- электрической проводимости в металлах или находятся внутри звезд; и здесь тоже результаты находятся в полном согласии с опытом. Заключением всего этого является тот вывод, что элек- электроны удовлетворяют лейбницевскому принципу идентификации неразличимости, т. е. электронный газ является «одночленной совокупностью» (статистика Ферми — Дирака). В глубоком и точном смысле физика подтверждает Мутака- лимун: ни фотону, ни (положительному и отрицательному) электрону нельзя приписать индивидуальности. Что же касается принципа Лейбница — Паули, то устано- установлено, что он справедлив для электронов, но не для фотонов. 4. Рассмотренные до сих пор совокупности не имели струк- структуры. Но совокупность атомов в молекуле обладает структурой, охарактеризованной схематически с помощью черточек Кекуле. Мы предполагали, что совокупность точек генов, из которых состоит гамета или зигота, точно так же обладает какой-то струк- структурой. Опыт учит нас, что эта структура основана на простом бинарном отношении «соседства» между точками. Будем гово- говорить, что две соседние точки связаны. Совокупность, снабжен- снабженная структурой такого рода, может быть названа комплексом — термином, заимствованным из топологии. Два комплекса К и
Дополнения 321 ,,л Гконституцию) л имеют одни и те же*! >, если между точками р и р*, принадлежащими К а К* соответственно, можно установить взаимно однозначное соответствие, такое, что A) две соответ- (классу) ственные точки всегда принадлежат одному и тому же < >, и B) точки р* и <7* являются соседними в К* тогда и только тогда, когда точки р и q — соседние в К- Назовем соответствие с-изоморфным в первом и g-изоморфным во втором случае. Комплекс К состоит из двух раздельных частей К\ и Кг, если ни одна точка Ki не является соседней для точек из Кг, К на- называется связным, если разложение на две раздельные части невозможно (за исключением тривиального случая, когда одна часть пуста, а другая — сам К). Любой комплекс может быть единственным образом разло- разложен на раздельные связанные компоненты. Согласно совме- совместному опыту генетики и цитологии, эти компоненты должны быть отождествлены с хромосомами в ядре клетки, и мы по- поэтому будем так их именовать в дальнейшем. Связанный ком- комплекс называется деревом, если после удаления одной из его связей он разложим на две раздельные части. При данных внешних обстоятельствах комплекс точек, из которых состоит зигота организма Q, определяет фенотип Q, или, точнее, две с-изоморфных зиготы имеют один фенотип. Из этого следует, что, вообще говоря, фенотип зависит не только от сово- совокупности, но также и от структуры комплекса К\ эффект влия- влияния структуры известен под названием «эффекта положения». При выполнении операции объединения и разбиения ком- комплекса никакие связи не должны обрываться и возникать. Пред- Предположим, что имеется некоторая система хромосом, ведущая себя как одно неделимое целое, и нельзя различать отдельные гены в одной и той же хромосоме. При этих условиях выполняется правило Менделя независимого распределения признаков, в пред- предположении, что вероятности у для конституционно различных гамет, порожденных определенным организмом, одинаковы. Хотя Мендель был прав в том, что две точки двух различных хромосом независимы, было установлено, что точки одной хромосомы не абсолютно, а только более или менее тесно сцеплены друг с другом. Это явление сцепления было изу- изучено с большим успехом Морганом и его школой на примере фруктовой мушки Drosophila melanogaster; результатом этого исследования явились подробные генетические карты, из ко- которых была получена количественная информация относительно вероятностей у. Морган объяснил сцепление с помощью про- процесса кроссинговера. Предположим, что зигота К + К* обра-
322 Герман Вейль зована уравновешенной сингамией из двух гамет К и К* одного и того же вида а, которые связаны друг с другом ^-изомор- ^-изоморфизмом. Пусть а и b — пара соседних точек в К, а а* и Ь*— соответственная пара в К*. Тогда а* и Ь* будут соседними в К*', точки а и Ь будут лежать в одной хромосоме Ко в К, а а* и Ь* — в соответственной хромосоме Ко в К ¦ Кроссинговер состоит в разрыве связей а с b и а* с Ь* и установлении вместо них связей а с Ь* и b с а*. Если /(о — дерево, то этот процесс переводит несвязную пару (/Со, /Со) в пару (/Со. /Со) хромосом, ^-изоморфных Ко- Точки, которые до кроссинговера были в одной и той же хромосоме Ко, могут теперь быть разделены; одна будет принадлежать Ко, другая— Ко- Мы считаем, что пары соответственных хромосом в ядре клетки сами принимают положение для такой операции кроссинговера сразу перед мейозом; они вытягиваются друг около друга, причем каждая точка хромосомы оказывается про- против соответственной точки другой хромосомы (синапсис). Если затем происходит уравновешенный мейоз, то новые гаметы К, К* имеют тот же вид а, что и К, К*. Сцепление между двумя точ- точками a, b хромосомы тем теснее, чем больше существует путей их разделения посредством кроссинговера. Комплексы могут подвергаться двум типам мутаций. По- Помимо точковых мутаций, при которых сцепления не изменяются, когда точки р меняют свой класс Ср (без изменения рода), су- существуют также структурные мутации, при которых состояние точек не нарушается, а изменяются только их сцепления. Описанная выше операция кроссинговера может быть вы- выполнена над любыми четырьмя различными точками a, b, a*, b* (и поэтому может быть названа «переключением»). По-види- По-видимому, простой разрыв и этот процесс переключения играют роль элементарных операций для структурных мутаций. Мута- Мутации являются редкими событиями в отличие от кроссинговера, возможность которого возникает при сииапсисе перед каждым мейозом. Простейшими связными комплексами является «палочка» ai — а2 —. . .—ah (в которой последовательные точки а, соеди- соединены связью —) и «кольцо». За немногими исключениями хро- хромосомы, по-видимому, являются палочкой (закон линейного расположения генов). Однако если переключение происходит в одной палочке (по не между двумя палочками), то могут получиться палочка и кольцо (или снова палочка, но с обрат- обратным порядком компонент). Комплекс, состоящий из раздельных палочек и колец, сохраняет это свойство при разрывах и пере- переключениях.
Дополнения 323 У хромосомы есть особая точка, именуемая центромерой. Если в результате какого-либо структурного изменения возникают хромосомы совсем без центромеры или с двумя центромерами, то такие хромосомы обычно элиминируются при клеточных деле- делениях, так что возникает недостаточность. Существуют также раз- различные пути, при которых весь набор хромосом клеточного ядра, отдельная хромосома или часть хромосомы дуплицируются. Здесь мы попытались развернуть формальную схему гене- генетики в таком общем виде, который включал бы в себя все более или менее нерегулярные возможности. До сих пор в этой схеме не было необходимости упоминать о поле, но, конечно, этот факт не может быть игнорирован, поскольку сингамия между двумя гаметами происходит лишь в том случае, когда одна из них сперматозоид; а другая — яйцеклетка. В этом проявляется по- полярность (иначе говоря, половая принадлежность гамет), кото- которая никак не связана с генами1). С другой стороны, то, является ли отдельный организм сам- самцом, производящим сперматозоиды, или самкой, производящей яйцеклетки (пол зиготы), определяется подобно всем остальным его «явным признакам» генотипом его зиготы в совокупности с факторами внешней среды, влияющими на развитие. Имеющие- Имеющиеся данные показывают, что пол определяется не каким-нибудь одним геном в зиготе, но неким равновесием между многими генами. Половая хромосома (там, где ее можно отличить от аутосом) попросту «склоняет чашу весов» в ту или иную сто- сторону. Это объясняет существование интерсексов, но отличается от обычного представления, согласно которому пол является яр- ярким примером неколичественного признака, т. е. признака «либо то, либо другое». 5. [Наши заметки об энтропии и статистике в п 2, посвящен- посвященные квантовой физике, будут яснее, если мы сейчас в скобках скажем несколько слов об основаниях статистической термоди- термодинамики. Квантовая теория здесь вводится с большими упроще- ') Обозначим через Qap организм, возникающий в результате сингамии сперматозоида генотипа а и яйцеклетки генотипа р. Тот факт, что иногда при одинаковых обстоятельствах реципрокное скрещивание Qpa внешне от- отличается от Qap, является подтверждением того, что интерпретация разви- развития живой природы только в терминах генов не всегда достаточна. Предпо- Предполагается также, что, кроме генов, локализующихся в хромосомах клеточного ядра, на развитие влияют и другие наследственные детерминанты, находя- находящиеся в цитоплазме. Однако эта проблема еще далека от своего сколько- нибудь удовлетворительного разрешения.
324 Герман Вейль ниями. В самом деле, в квантовой физике система 2 принимает значения не больше, чем на дискретном ряде («полных») состоя- состояний с определенными уровнями энергии: Ut(i = 0, 1, 2, ...). В силу закона сохранения энергии, можно распределить боль- большое число N систем 2 случайным образом между возможными состояниями г, так что математическое ожидание полной энергии N систем равно NA (где А — средняя энергия отдельной системы). Можно найти, что в подавляющем большинстве всех распределе- распределений относительные частоты NJN, с помощью которых представ- представлено некоторое состояние i в пределе при N-*-oo, пропорцио- пропорциональны величине е~а '. Здесь а — постоянная, которая должна быть определена с помощью данной средней энергии А. Таким образом, мы определяем каноническое распределение параметра — аи, а, приписывая состоянию i относительную вероятность wl = e '• (Относительные вероятности не обязательно удовлетворяют ус- условию нормировки 2а'г = 1*) Любая величина Z,, зависящая от состояния г, будет тогда иметь среднее значение: и это как раз значение, которое мы приписываем величине Zt в «тепловом равновесии». Параметр а связан с данной средней энергией А уравнением {U)a=A. Встречающиеся в природе си- системы пробегают состояния с произвольно высоким значением энергии, следовательно, а должно быть положительно, и равно- равномерное распределение, которое приписывает каждому состоя- состоянию i одну и ту же вероятность w°i = \, может быть только при- приблизительно получено, в то время как энергия А остается ко- конечной (для больших значений А и соответственно малых зна- значений а). Обратная величина от1 имеет размерность энергии и может в отдельных случаях быть названа статистической тем- температурой. В силу закона сохранения энергии каноническое распределе- распределение стационарно во времени. Возможное состояние системы 2, состоящей из двух частей Б, 2', определяется парами («,&), об- образованными любым состоянием i системы 2 и любым состоя- состоянием k системы 2'. Пусть U\, Uk обозначают энергию 2 в со- состоянии i и энергию Б' в состоянии k соответственно; тогда энергия 2 в состоянии (г, k) равна ?/<¦+?/* при условии, что обе
Дополнения 325 части не взаимодействуют между собой. Мы получаем для ве- вероятности состояния (г, k) в тепловом равновесии -а(и,+ и'Л -aU, -all' . ¦ wik = e к ' *> = е le k = wiiwk. Это означает следующее: A) из теплового равновесия целого вытекает тепловое равновесие частей; B) для комбинации ча- частей выполняется закон статистической независимости, w,-ft = = w. ¦ w'k; C) параметр а имеет в обеих частях то же значение, что и в случае полной системы. Идеальный газ, т. е. совокупность п частиц в состояниях, ко- которые полностью описываются положением и скоростью и взаи- взаимодействием между которыми пренебрегают, занимает объем V под определенным давлением р. Применение классической фи- физики и канонического распределения к такому газу дает вели- величину pV/n для его статистической температуры. Следовательно, если Т обозначает (абсолютную) температуру, показываемую газовым термометром, находящимся в контакте с системой 2 и заполненным идеальным газом, тогда оказывается, что статисти- статистическая температура равна kT, где k — общий коэффициент про- пропорциональности (постоянная Больцмана), которая берется для того, чтобы привести шкалу температур к привычной шкале Цельсия A00°С=разности температур кипения и таяния воды при давлении в 1 атмосферуI). Полная теория теплового равновесия, таким образом, сокра- сокращается до единственного принципа, справедливого как в кван- квантовой, так и в классической физике: каноническое распределение w получается из равномерного распределения w° с помощью уравнения w — w°e~ulkT, где U — энергия (изменяющаяся от состояния к состоянию) и Т—фиксированная температура системы (или же тепловой бани, в которую система погружена).] ЛИТЕРАТУРА Waddington С. Н, An Introduction to Modern Genetics, London, 1939. Шредингер Э., Статистическая термодинамика, ИЛ, М., 1948. Goldschmidt R., Position Effect and the Theory of the Corpuscular Gene, Experientia, 2 A946), 197—203, 250—256. ') Если масса M = n\i газа пропорциональна количеству п частиц и v=V/M означает удельный объем, то закон Гей-Люссака получается в обыч- обычной форме pv = RT, где газовая постоянная R=k/[i. Следовательно, k — ве- величина атомных масштабов и для различных газов произведение R и «моле- «молекулярного веса» сохраняет постоянное значение,
326 Герман В ей ль Woodger J. H., The Axiomatic Method in Biology, Cambridge, 1937.. von Neumann J., Morgenstern O. Theory of Games and Economic Be- Behavior, second ed., Princeton, 1947. (Готовится русский перевод.) 2. Квантовая физика и причинность 1. Современная квантовая теория отошла от строгого детер- детерминистского описания элементарных атомных процессов. Она не отрицает совсем строгих законов, но величины, с которыми она имеет дело, описывают наблюдаемые явления только стати- статистически. Квантовая теория отрицает саму возможность суще- существования любой, даже еще не известной нам строго причинной теории, в рамках которой стало бы возможным точное описание движения каждой отдельной частицы из числа составляющих газ, в целом описываемый статистической термодинамикой. То, что мыслимо для статистического закона, очевидно, невозмож- невозможно для элементарного квантового закона. Погрешность, возни- возникающая в атомных экспериментах, в принципе не может быть сведена к нулю повышением точности наблюдений. Причины перехода от классической к квантовой физике являются не ме- менее вынужденными, чем отказ от абсолютного пространства и времени в пользу теории относительности; польза, какими бы эмпирическими фактами мы ее не оценивали, неизмеримо ве- велика. Разумеется, абсолютная истина еще не достигнута, еще остались непреодоленными многие серьезные трудности. Но что бы будущее ни готовило, мы не вернемся назад к старым клас- классическим представлениям. Одним из наиболее ярких проявлений корпускулярной при- природы света является фотоэффект: облученная ультрафиолето- ультрафиолетовыми или рентгеновскими лучами металлическая пластинка ис- испускает электроны. Эксперименты показывают, что их энергия странным образом определяется цветом, падающего излучения, а именно не превышает его частоты, умноженной на h. Таким об- образом, можно прийти к заключению, что свет частоты v может поглощаться веществом лишь отдельными квантами (фотонами) энергии hv (Эйнштейн, 1905). Эта энергия целиком передается электрону при его эмиссии (его кинетическая энергия может быть близка к hv, учитывая работу, затраченную на освобожде- освобождение электрона). Интенсивность излучения определяет не энер- энергию отдельного электрона, а лишь их число, испускаемое в еди- единицу времени. Процесс начинается немедленно, даже если из- излучение такое слабое, что потребуется много часов до того, как приток накопленной энергии атома достигает величины hv, не- необходимой для испускания электрона.
Дополнения 327 То, что теория непрерывного поля описала бы как присут- присутствие части излучения энергии hv, должно быть в действитель- действительности интерпретировано как малая вероятность присутствия це- целого фотона этой энергии. Процесс, обратный фотоэффекту, есть преобразование первичных электронов во вторичное рентгенов- рентгеновское излучение в трубке, в которой анод тормозит электроны. Поскольку торможение электронов может происходить в не- несколько этапов, мы должны ожидать, что непрерывный спектр для рентгеновских лучей резко обрывается на частоте v = eVh (где е — заряд электрона, а V — напряжение в трубке). Эксперименты подтвердили эти соотношения, впервые предска- предсказанные Эйнштейном, включая и численное значение h, которое совпадает с постоянной Планка, выведенной из термодинамиче- термодинамических законов излучения черного тела. Проблема взаимоотношений двух представлений о свете — волна и фотон, — однако, лучше иллюстрируется явлением поля- поляризации. Пусть плоская монохроматическая световая волна, рас- распространяющаяся в определенном направлении а, линейно поля- поляризована. Направление поляризации, представленное векторомs длины 1, перпендикулярно а. Выберем произвольную точку О за начало и проведем «крест» G, состоящий из двух взаимно перпендикулярных осей 1 и 2, проходящих через О и перпендикулярных а. Как крест, так и вектор s, лежат в плоскости, перпендикулярной а. Пред- Предположим, что световой луч проходит сквозь призму Николя ориентации G; он расщепляется на две части 1 и 2, причем часть I линейно поляризована в направлении 1, а часть 2 — в направлении 2. Относительные интенсивности обоих производных лучей по отношению ко всему лучу даются квадратами компо- компонент Si, s2 вектора s относительно креста G (длин проекции s вдоль осей 1 и 2). Предположив, что световой луч состоит из фотонов, мы вынуждены заключить, что фотоны с двумя различными «свойствами» 1 и 2 (аналогично свойствам «быть белым» и «быть черным» шаром) встречаются с относительными 2 9 2 2 вероятностями S\ и si. (По теореме Пифагора, Si —j- S2 = 1, ве- вероятность для фотона быть «черным или белым» равна единице.) Свойства 1 и 2 соответствуют G. Фотоны обоих видов разделены призмой Николя, устроенной подобно ситу, задерживающему 1 и пропускающему 2. Можно было бы ожидать, что луч, проходя- проходящий сквозь призму Николя и поляризованный в направлении 2, более однороден, чем первичный луч. Однако это не так, поскольку поляризованная плоская монохроматическая световая волна представляет собой самую высокую степень однородности, дости- достижимую для света. Производный луч, поляризованный в направ-
328 Герман Вейль лении 2, посланный сквозь вторую призму Николя с другой ори- ориентацией G', будет снова расщепляться, согласно только что опи- описанному правилу интенсивности. Нечто подобное поляризации происходит, когда на луч атомов серебра действует неоднород- неоднородное магнитное поле. Используя декартовы координаты х, у, г, предположим, что напряженность поля зависит только от х. Атом серебра — это маленький магнитный диполь с векторным магнитным моментом т. Поле расщепляет луч на различные части согласно различным значениям х-компонент тх момен- момента т. Так как наблюдаются только два производных луча (про- (противоположной кривизны), то можно заключить, что эта компо- компонента принимает лишь два значения: + ц.и—ц, (ц — «магнетон»). Это должно выполняться при любом направлении оси х. Од- Однако вектор, имеющий компоненты в любом возможном направ- направлении, равные или + ц., или —ц,, геометрически не имеет смыс- смысла! Невозможность одновременного приписывания фотону или же атому серебра нескольких «свойств», соответствующих раз- различным ориентациям G «сита», кроется, очевидно, в природе ве- вещей, а не является следствием ограниченности человеческой мыс- мысли. Разделение, произведенное ситом ориентации G, нарушается последующим просеиванием в ориентации G'. Однако возникает вопрос, какова вероятность для частиц, проходящих сквозь сито G, пройти и сквозь сито G'; эта вероятность может быть вы- вычислена априори в терминах ориентации G' относительно G. С помощью призмы Ньютона, или дифракционной решетки, свет разлагается на свои монохроматические компоненты. «Сито», позволяющее разделить не только два, но несколько отдельных составляющих, может быть названо, таким образом, решеткой. Фотоэффект сортирует фотоны по их «возможно- «возможностям». Эддингтон в своей прекрасной книге New Pathways in Science (стр. 267) сказал: «В теории относительности Эйнштей- Эйнштейна наблюдателем является человек, который отправляется на поиски истины, вооруженный линейным масштабом. В кванто- квантовой теории он вооружен ситом». С помощью некоторой просеивающей операции М млекопи- млекопитающие в зоологическом саду отсеяны от других зверей. Пусть F — соответствующая операция для рыб. Применение последова- последовательных операций ММ не дает других результатов, чем простая операция М, в то время как результат применения MF, т. е. опе- операции М, а затем F, равен нулю. В силу уравнений М и F называются взаимно ортогональными идемпотентными опе- операторами. Применение решетки в классической физике есть нечто
Дополнения 329 иное, как метод классификации состояний, в которых может нахо- находиться данная физическая система. Здесь состояния рассматри- рассматриваются как элементы некоторой совокупности. Пусть Еи . . ., Е,- обозначают отдельные классы состояний в предположении, что число состояний конечно.. Операция, отсеивающая состояния класса ?; от всех остальных, может быть также обозначена че- через Е{. Решетка G = {?b ..., Ег) может быть измельчена деле- делением каждого класса на подклассы. Мельчайшим подразделением является то, при котором каждый класс содержит только по од- одному члену. Две решетки — деление на классы ?, и на классы Еь— могут быть наложены друг на друга. Операция ЕiE^ отсеи- отсеивает члены, общие для обоих классов Е{ и Ek; при этом выпол- выполняется закон коммутативности, EiEk = ЕъЕь и вся совокупность делится на классы EtEk (некоторые из них могут не содержать членов). Сопоставив отдельным классам Е различные числа at, можно говорить о различающей переменной (или функции со- состояния) А, принимающей значения а,-, когда состояние системы принадлежит классу ?,-. Эта классическая схема должна быть теперь сопоставлена со схемой квантовой физики, описанной в общих чертах с по- помощью типичного примера поляризации. Совокупность п состояний должна быть заменена /г-мерным евклидовым векторным пространством I. Для данного линейного подпространства Е пространства I любой вектор х может быть ортогонально спроектирован на Е. Проекцией является век- вектор Ех, и операция Е проектирования идемпотентна, ЕЕ = Е. Два линейных подпространства Еь Е2 называются ортогональными, если каждый вектор одного ортогонален каждому вектору дру- другого. Тогда мы можем образовать их сумму Е=Е(+Е2, состоящую из всех сумм векторов Х( из Е( и векторов х2 из Е2. Разложение вектора х из Е на две его составляющие Xj и х2 единственно и выполняется ортогональными проекциями ?,. ?2. Таким же путем трехмерное векторное пространство, например, расщепляется на горизонтальную плоскость и вертикальную ли- линию. Едва ли ситуация становится более сложной, когда мы имеем дело с более чем двумя взаимно ортогональными подпро- подпространствами Еь Е2, . . . , Ег. Если их сумма является всем про- пространством, тогда каждый вектор х расщепляется на г компо- компонент, лежащих в подпространствах Е,-, согласно формуле x = Zf,x-f . . . -\-Er\, I и говорят, что все пространство расщепляется на Операторы проектирования ?,- (t=l, ..., г) идемпотентны и
330 Герман Вейль взаимно ортогональны. Будем обозначать через |х| длину век- вектора х. Вводя направление в I, т. е. вектор х, идущий в этом направлении, в квантовой физике представляют волновое со- состояние {волновую функцию) рассматриваемой физической си- системы (будь то простая частица, или совокупность многих, или даже бесчисленного числа частиц). С помощью решетки G = = {Еи ..., Ег} происходит расщепление всего векторного про- пространства на взаимно ортогональные подпространства Ei + ... .. .+ ЕГ. Мы будем говорить о свойстве г, точнее (G; i), соответ- соответствующем некоторому из этих подпространств Е,-, Если система находится в волновом состоянии х, тогда вероятность того, что она имеет свойство i, равна А = |?,х|2/|х|2. - . " . о' -.-. A) С помощью теоремы Пифагора можно установить, что сумма этих вероятностей р1 равна еди- единице. Нет решетки, которая может обеспечить более п различ- различных свойств; таким образом, наша модель подобно классиче- классической модели, с которой она сравнивается, соответствует случаю, когда число свойств ограничено. В природе дело обстоит иначе, однако принятие конечномерной модели не ведет к потере основных характерных черт квантовой механики. Ясно, в чем состоит измельчение решетки G: действительно, любое Е,- может быть в свою очередь расщеплено на взаимно ортогональ- ортогональные подпространства. Мельчайшая решетка представляет собой и взаимно ортогональных осей и таким образом совпадает с «кре- «крестом» ( = декартовой системой координат). Отныне мы будем го- говорить о свойствах (G, 1), ..., (G; г) как об г квантовых состояниях, определенных решеткой G, и назовем их «полными» квантовыми состояниями, если G — мельчайшая решетка. Я не могу удержаться от того, чтобы не заметить, что вир связи с квантовой физикой я использовал ту же самую модель в п. 17 работы [PMNS] для иллюстрации отношений между объ- объектом, наблюдателем и наблюдаемым явлением. Она отличалась от классической модели тем, что применение решетки в вектор- векторном пространстве не поддается суперпозиции. Предположим, что I расщеплено на ортогональные подпро- подпространства двумя способами:
Дополнения 331 Конечно, возможно расщепить любой вектор х из Е,- на его ком- компоненты E'kx(k=\, ..., s), однако они, вообще говоря, больше не будут в Еи если только оператор Е{ не коммутирует с опе- операторами Е\, Е2, . . ., Es- Эта комбинация двух решеток пред- предполагает коммутативность г операторов ?,- с s операторами Ек и, если это условие выполнено, то порядок комбинирования, т. е. G' следует за G, или наоборот, несуществен. Странный факт, относящийся к квантово-физическим ситам, заключается в том, что два таких сита могут, что обычно и бы- бывает на самом деле, быть некоммутативными из-за своей «несо- «несогласующейся ориентации». Свойства i и k, относящиеся к двум некоммутативным решеткам, несовместимы, и в случае когда свойство i определено, свойство k не определено. В этом смысле положение и импульс частицы несовместимы. Если Ах, Арх— не- неопределенности координаты х частицы и компоненты ее им- импульса соответственно, то произведение Ах-Арх обязательно превосходит h. Этот принцип неопределенности Гейзенберга осу- осуществляет идею взаимной зависимости различных свойств.в точной форме. Если цвет и форма тела были бы такими несо- несовместимыми признаками, то имел бы смысл вопрос: является ли тело зеленым, а также такой вопрос: является ли тело круглым; однако вопрос: «является ли оно зеленым и круглым» не имел бы смысла. Здесь, как и в классической модели, различные числа а,- могут быть сопоставлены различным квантовым состояниям (G; г); и тогда различающая переменная А принимает любое из г значений ai, .... ат и совокупность всех ос,, взятых с их ве- вероятностями pi, см. (I;, описывает систему в ее волновом со- состоянии х'). Разложение векторного пространства I с помощью решетки G на подпространства Е, само по себе является чисто идеаль- идеальным процессом. Однако реальное применение решетки к физи- физическим системам переводит систему из волнового состояния х в одно из волновых состояний Etx, . . . , Егх. Однако нельзя пред- предсказать, какое именно состояние будет иметь место, только от- относительные вероятности |?,-х|2 этих г событий могут быть оп- определены заранее. В этом смысле любое измерение или наблю- наблюдение требует вторжения в явление, в результате чего можно только достичь не более чем статистического прогноза. Экспери- Экспериментаторы никогда не закрывали глаза на тот факт, что любое измерение связано с влиянием измерительного инструмента на исследуемый объект. Если мы предположим, что наш прибор может применяться для измерений с бесконечно большой ') Согласно их определениям, такие величины могут быть сложены и умножены, лишь бы они принадлежали коммутативным решеткам,
332 Герман Вейль точностью, то это бы сняло трудности, вносимые принципом не- неопределенности. Но что делать, если объект наблюдения сам чрезвычайно мал и не может быть фиксирован нашим прибо- прибором. Тогда сама идея фактов, существующих вне наблюдения, становится ложной. 2. Вернемся снова к классической модели и используем ее для описания событий во времени. Упрощающее предположение о конечном числе состояний вынуждает нас оперировать с дис- дискретным временем. Динамический закон утверждает, что от момента t до следующего t+l п состояний 1, ..., п претерпе- претерпевают некоторую подстановку s, одну и ту же в любой момент t=...—2, —1, 0, 1, 2, .... Если эта подстановка s имеет «по- «порядок т», т. е. если мы достигаем того же состояния, проведя подстановку т раз, тогда система возвращается к своему на- начальному состоянию после каждого периода длины т (постоян- (постоянная индукция). Квантовая физика не требует от нас дискрет- дискретности времени, если число наблюдаемых квантовых состояний всегда ограничено. В течение бесконечно малого временного интервала dt векторное пространство испытывает некоторый бес- бесконечно малый поворот, придающий приращение dx = Lxdt про- произвольному вектору х. Этот динамический закон dx!dt = Lx ¦. -.' B) - .' s ¦ (в котором операция L не зависит от t и от х) выражается в терминах декартовых координат xt с помощью уравнений dxildt = 2 hjXj @ (*, у = 1 я), с данными постоянными антисимметрическими коэффициентами lij(lji =—lij). Важнейшим моментом является тот факт, что вол- волновая функция х изменяется по строго причинному закону; его математическая простота замечательна. Решетка G = [EU ...,?,} и соответствующие квантовые состояния (G; 1), ..., (G; г) яв- являются стационарными, если подпространство Е; инвариантно по времени, т. е. если его линейный оператор ?,- коммутирует с линейным оператором L. То, что в п. 1 было названо состоянием частицы или сово- совокупности, должно быть теперь более точно интерпретировано как квантовое состояние. Обстоятельство, которое могло там вызвать некоторое недо- недоверие, относительность понятия фотона по отношению к чер- черному телу и своей частоте, теперь представляется как частный
Дополнения 333 случай общего явления: различие квантовых состояний зависит от выбора решетки. Под измерением имеется в виду сито или решетка. Мы не должны думать, что волновая функция есть что-то независимое от такого измерения. На самом деле монохроматический поля- поляризованный световой луч, посланный сквозь призму Николя, сам был отделен с помощью некоторой решетки от естествен- естественного света неизвестного качества. Это согласуется с тем основ- основным фактом, что только относительное положение декартовой координатной системы по отношению к другой может быть опи- описано объективно. Пусть даны решетки G = {EU ..., Ег) и G ={е[, ..., Eg); мы, однако, имеем право задать вопрос: «Если первая решетка показывает, что наша частица находится в квантовом состоянии (G; i), то в каких пределах заключена вероятность того, что наблюдение с помощью второй решетки G' приведет ее в квантовое состояние (С; &)?» На геометрическом языке это равнозначно следующему вопросу: (I) «В каких пре- 1/19/9 делах заключено частное |?ftX | /1 х |", если вектор х свободно изменяется в пространстве Ег?» Если между вторым и первым наблюдением проходит время, то изменение волновой функции системы между этими двумя моментами может быть вычислено как следствие динамического закона B). Система никогда не бывает полностью изолирована от ее окружения и ее волновое состояние, следовательно, подвержено постоянным возмущениям. Это является причиной того, что в термодинамике на первичную статистику должна быть нало- наложена вторичная статистика, учитывающая данную волновую функцию и ее взаимодействие с решеткой. В евклидовом про- пространстве имеется априорная вероятность для случайного рас- распределения векторов длины 1, согласно которой области равной площади на единичной сфере имеют равную вероятность. Это «равномерное распределение» приписывает г квантовым состоя- состояниям 1=1, ..., г, определенным решеткой G = [Elt ..., Ег), ве- вероятности njn, где iii — размерность Е,- и, в частности, равна верятностям п квантовых состояний, определенных мельчайшей решеткой. Истинное вероятностное распределение (ансамбль Гиббса) не обязательно совпадает с этим равномерным распре- распределением. В конце прошлого пункта было описано, как частное каноническое распределение для системы, погруженной в тепло- тепловую баню известной температуры, получается из равномерного распределения. Возникает общий вопрос, несколько отличный от рассмот- рассмотренного выше: 23 Зак. У09
334 Герман fieu.it. (II) «Предположим, что даны решетки G и статистическое распределение волновых состояний; как получить отсюда ве- вероятности для квантовых состояний (G; г)?» Здесь, подобно двум решеткам, сравниваются друг с другом решетка и статистический ансамбль. Чтобы найти ответ на этот вопрос, надо усреднить вероятность ри см. A), которая зависит от х, по данному статистическому распределению векторов х на единичной сфере. Точно так же можно установить среднюю ве- вероятность того, что частица в квантовом состоянии (G; i) ока- окажется в квантовом состоянии (С; k), если применяется другая решетка G'. Если вопрос (I) или (II) поставлен, то интерес будет всегда сосредоточен, особенно если мы имеем дело с системами, со- состоящими из многих частиц, на таких событиях, которые могут быть предсказаны с большой вероятностью. При расщеплении луча света призмой Николя гибель индивидуального фотона не- непредсказуема. Однако относительные интенсивности двух произ- производных лучей предсказуемы с точностью, которая возрастает с числом фотонов. Все изложенное здесь должно быть исправлено в одном отношении: координаты Xj в основном «-мерном векторном про- пространстве являются не вещественными, а произвольными комп- комплексными числами и поэтому имеют абсолютную величину |х| и фазу. Квадрат длины вектора выражается в декартовой си- системе координат суммой квадратов абсолютных величин коор- координат. Простейший из всех динамических законов, закон B), в таком комплексном пространстве имеет вид dx/dt = ivx (i = У11!)- C) Здесь v — вещественная константа. Волновая функция х полу- получается как простое колебание частоты v, х = х0 (cos(v^)-(- i sin(v/)} (xo = const) и, следовательно, энергия имеет определенное постоянное зна- значение hv (закон Планка). Пространство может быть всегда разбито на несколько взаимно ортогональных подпространств Ej (/=1, ¦ . ., г) так, что уравнение C) с определенной частотой v = vj справедливо в Ej. Полученная таким образом решетка G = {EU . . . , Ег) стацио- стационарна и производит просеивание в соответствии с различными частотами Vj и энергетическими уровнями Uj = hv,. На этой ре- решетке G основана термодинамика. Любой вектор х в ?,- удовлетворяет уравнению Lx=/vx (v = Vj), и этот факт на математическом языке можно выразить,
Дополнения 335 сказав, что х является собственным вектором оператора /- с соб- собственным значением iv. Оператор Н — -г L, названный операто- оператором энергии, имеет те же собственные векторы, однако соответ- соответствующими собственными значениями являются энергетические уровни hv. Общее уравнение B) имеет теперь вид ~]~~Ж ^ ^х (уравнение Шрёдингера). Непотревоженный наблюдением «физический процесс» пред- представлен формально математически без интуитивной интерпре- интерпретации; только конкретный эксперимент, наблюдение с помощью решетки может быть описано интуитивно. Это противоречие между физическим процессом и наблю- наблюдением аналогично противоречию между формализмом и созна- сознательным мышлением в гильбертовой системе математики. По- Поскольку возможно формализовать интуитивное математическое рассуждение, постольку верно, что наблюдение с помощью ре- решетки G может быть интерпретировано как физический про- процесс. Желая сделать это, мы должны расширить первоначаль- первоначальную систему 2 до системы 2* включением в нее решетки G. Но как только мы хотим изучить что-то относительно системы 2*, что может быть выражено в конкретных терминах, непотрево- непотревоженный ход событий, описываемых термодинамическим законом B), должен быть снова нарушен подчинением системы 2* на- наблюдению с помощью внешней для нее решетки 3. Пусть даны две системы 2, 2'; их объединение 2 принимает все состояния (i, k), представляющие собой комби- комбинацию произвольного состояния i системы 2 и произвольного состояния k системы 2'. Классическая физика определяет зада- задание таких комбинаций. Это справедливо и для квантовой фи- физики, если только состояние означает квантовое состояние; из (мельчайшей) решетки для 2 и (мельчайшей) решетки для 2' получается (мельчайшая) решетка для 2 Однако предположив, что волновая функция первой системы является вектором x=(xi xm) в m-мерном евклидовом пространстве S, отне- отнесенном к декартовой координатной системе, и что вектор у = = (г/ь ..., уп) п-мерного пространства 5' имеет то же значение для второй системы, мы заключаем, что волновая функция объ- объединенной системы представляется вектором Z = (гп> ¦ • • i zmv zl2' • ¦ • > znfti • • ¦ i zur • • • • zmn) в mrc-мерном «произведении пространств» S = Sx5'. Вектор х в S и вектор у в S' определяют вектор z = xXy с компонентами zik =¦- XMk (' = 1» • • •. т\ k = 1, .... п) D) 23*
336 Герман Вейль в S. Это устанавливает, какое вращение в S индуцируется двумя произвольными вращениями координатных систем в S и S'. Поскольку из D) следует |z,a|2= \xt \2\уи\2, то можно найти, что вероятности квантовых состояний двух частей 2 и 2' не за- зависят друг от друга в волновой функции системы 2 частного вида z = xXy- Но многообразие возможных волновых функций объединенной системы 2 много шире, чем то, которое может быть представлено произведениями хХу произвольных волно- волновых функций х и у его двух частей. На самом деле каждый вектор z в произведении пространств описывает некоторую воз- возможную волновую функцию. В этом смысле квантовая физика подтверждает положение о том, что целое больше, чем комбинация его частей. Вообще говоря, вероятности квантовых состояний целой системы не мо- могут быть определены, исходя из вероятностей квантовых состоя- состояний частей с помощью правила умножения вероятностей в тео- теории статистической независимости. И это верно даже в том случае, когда обе части не находятся в динамическом взаимо- взаимодействии. Это соображение особенно важно в случае двух равных си- систем 2, 2', например пары электронов. Тогда волновые функции обоих частей являются векторами в одном и том же евкли- евклидовом пространстве 5, и среди векторов z=(z^) произ- произведения пространств SXS' («тензоров») можно различить анти- антисимметрические, удовлетворяющие условию zfti = —zih, и симме- симметрические, удовлетворяющие условию zhi = zih. Если пара имеет антисимметрическую волновую функцию, то она и будет оста- оставаться антисимметрической; никакие внешние влияния не могут это изменить, поскольку в закон взаимодействия характеристики одинаковых частиц входят симметричным образом. Поэтому сле- следует ожидать, что волновая функция пары электронов имеет определенный характер симметрии, т. е. она либо симметрична либо антисимметрична. Эксперименты подтверждают справедливость второй альтер- альтернативы. Для некоторого антиснмметрического вектора zik имеет место равенство |zi;1|2 = 0, т. е. вероятность того, что оба элек- электрона находятся в одном и том же полном квантовом состоя- состоянии i, равна нулю; сохранение свойства антисимметрии волновой функции эквивалентно принципу Паули. Едва ли можно более радикальным образом отрицать статистическую независимость квантовых состояний двух электронов, чем с помощью этого принципа! Молекулу водорода можно рассматривать, по край- крайней мере в первом приближении, как систему двух электронов, вращающихся вокруг двух неподвижных ядер, и очевидно, что
Дополнения 337 ограничение, вызванное антисимметрией волновой функции пары электронов, должно оказать существенное влияние на резуль- результаты вычислений их движения. Действительно, это приводит, как показали Лондон и Гейтлер, к полному объяснению хими- химических связей нейтральных атомов в молекуле. В рамках клас- классической физики это осталось непостижимой загадкой. Антисимметрия сохраняется и в случае большего числа элек- электронов. Поскольку статистическая независимость нескольких ча- частиц находится в противоречии с этим законом, мы получаем различные результаты, посылая сквозь решетку отдельный элек- электрон или же одновременный пучок многих электронов. Анало- Аналогичное замечание относится и к пучку фотонов. Его волновая функция подчиняется условиям симметрии, а не антисимметрии. (В самом деле, мы знаем, что принцип Паули не справедлив для фотонов!) В своей окончательной форме теория не требует, чтобы число частиц было постоянным. Фотоны не только могут появляться и исчезать, но, благодаря смелому толкованию Ди- Дирака, это утверждение относят также и к процессам взаимной аннигиляции положительных и отрицательных электронов, со- сопровождаемым излучением фотона соответствующей энергии («Zerstrahlung»); может иметь место и обратный процесс. 4. Я перечислю те черты квантовой физики, которые пред- представляются мне философски наиболее значительными. A) Наблюдение невозможно без «вторжения», эффект кото- которого может быть предсказан лишь статистически. Таким обра- образом, заново освещен такой вопрос, как соотношение между субъектом и объектом: они связаны более тесно, чем это можно было понять с позиций классической физики. В п. 20 работы [PMNS] было отмечено, что количественные результаты, полу- полученные из наблюдений за действием некоторого тела на другие, могут быть описаны, если известны свойства данных тел, вне зависимости от того, происходят ли эти взаимодействия на са- самом деле. Мы теперь видим, что этот «принцип Эйлера» накла- накладывает весьма важные ограничения. Указанная ситуация имеет очевидные аналогии в области психологии. B) Свойства, относящиеся к двум различным решеткам, не могут быть скомбинированы с помощью союзов «и» или «или». Классическая логика не приспособлена к понятиям квантовой физики и должна быть заменена чем-то вроде «квантовой логики». C) Принцип причинности справедлив для изменений волно- волнового состояния во времени, однако он должен быть отброшен, как только речь идёт о соотношениях между волновым и кван- квантовым состояниями.
338 Герман Вейль D) Целое всегда больше, имеет значительно большее число волновых состояний, чем комбинация его частей. Различные ча- части в изолированной системе с фиксированным волновым со- состоянием, вообще говоря, не являются статистически независи- независимыми, даже если они не взаимодействуют между собой. E) Принцип Лейбница — Паули, согласно которому ника- никакие два электрона не могут находиться в одном и том же кван- квантовом состоянии, становится понятным в квантовой физике как следствие закона антисимметрии. F) Существует объективная вероятность, являющаяся основ- основной чертой самой природы, которая не имеет никакого отноше- отношения к знаниям или невежеству наблюдателя. Вероятности \xt\2 индивидуального полного набора квантовых состояний i полу- получаются из компоненты л:,- вектора х= (лгь ..., хп) волновой функ- функции. Мне кажется, что это подтверждает мнение, выраженное в [PMNS] относительно того, что вероятность связана с некото- некоторыми основными физическими величинами и может быть, во- вообще говоря, определена только на основе эмпирического закона, описывающего эти величины. Следует принять, что смысл квантовой физики, вопреки всем ее достижениям, до сих пор еще не столь ясен, как, например, идеи, лежащие в основе теории относительности. Соотношение действительности и наблюдения является центральной пробле- проблемой. По-видимому, мы нуждаемся в более глубоком эпистемо- эпистемологическом анализе того, что составляет эксперимент, измере- измерение, и того, на каком языке сообщаются его результаты. Тот ли это язык, который используется в классической физике, как, по-видимому, думал Нильс Бор, или это «естественный язык», на котором каждый в повседневной жизни общается с миром, с себе подобными и с самим собой? Аналогия с гильберто- гильбертовой математикой, где существенным внелогическим основа- основанием служат практические манипуляции с конкретными симво- символами, а не задание какого-то «чистого сознания», может, по- видимому, подсказать ответ на последний вопрос. Означает ли это, что развитие современной математики и физики происхо- происходит в том же направлении, что и развитие современной фило- философии, прочь от идеалистической точки зрения к «экзистенци- «экзистенциальной»? Помимо загадки эпистемологической интерпретации, кванто- квантовая физика также имеет серьезные внутренние трудности; у нас нет еще действительно непротиворечивой и полной квантовой теории взаимодействия между электромагнитным излучением и (отрицательными и положительными) электронами, если оста- оставить в стороне другие элементарные частицы.
Дополнения 339 Возвращаясь на надежную почву, добавим к сказанному не- несколько слов по поводу позиции квантовой физики по отноше- отношению к проблеме прошлого и будущего, обсужденной в [PMNS]. Нам желательно понять, почему свет испускается только по на- направлению «к будущему». Мы знаем, что физики объясняют это различие между будущей и прошедшей половинами светового конуса простым сохранением запаздывающей части потенциала в формуле Ленарда — Вейхерта. Квантовая теория описывает взаимодействие между электронами атома и полем излучения черного тела как последовательность индивидуальных взаимо- взаимодействий, в которых световой квант испускается или погло- поглощается при соответствующем энергетическом переходе в атоме. Можно считать, что формула для частот этих событий показы- показывает, что индивидуальное событие либо самопроизвольно, либо вынуждено. Частота вынужденных процессов пропорциональна плотности излучения, в то время как самопроизвольные процессы не зависят от него. Вынужденная часть симметрична относи- относительно прошлого и будущего. Для самопроизвольной части это не так: существует лишь самопроизвольное излучение, но не са- самопроизвольное поглощение. Эта асимметрия объясняется такими же вероятностными рассуждениями, как и те, которые приводят ко второму началу термодинамики. Итак, корни отличия будущего от прошлого кроются скорее в статистических принципах термодинамики, чем в любом элементарном законе. ЛИТЕРАТУРА Дирак П., Основные принципы квантовой механики, ИЛ, М., 1909. Нейман Дж.. Математические основы квантовой механики, Наука, М., 1964. Weyl H., Gruppentheorie und Quantenmechanik, second ed., Leipzig, 1931. Wentzel G.. Einfiihrung in die Quantentheorie der Wellenfelder, Vienna, 1943. Bohr N., Atomic Theory and the Description of Nature, Cambridge, 1934. Bohr N.. Kausalitat und Komplementaritat, Erkenntnis, 14 A937), 293. Born M., Atomic Physics, transl by J. Dougall second ed., London & Glas- Glasgow, 1937. Born M., Experiment and Theory in Physics, Cambridge Univ. Press, 1943. Reichenbach H., Philosophic Foundations of Quantum Mechanics, Uiiiv. of Calif. Press, 1944. Rosenfeld L., L'evolution de l'idee de causalite Mem. Soc. Roy. Sci. Lie- Lieges, 4' sen, VI A942). Schilpp P. A. (ed.), Albert Einstein: Philisopher — Scientist of Living Philosophers VII, Evanston, 1949, articles by Niels Bohr, M. Born, W. Heitler, H. Margenau and W. Pauli. 3. Химическая валентность и иерархия структур Описанная ранее символическая структура, используемая для объяснения атомных явлений в квантовой теории, может иметь первичный и неразложимый характер. В противоположность
340 Герман Вейль этому совокупность атомных точек, соединенных черточками валентностей, с помощью которых Кекуле описывает хими- химическую молекулу, имеет только промежуточный характер. В са- самом деле, валентные связи являются сокращенными симво- символами фактических квантовых физических сил, действующих между атомами, которые сами представляют собой сложные динамические системы. Таким образом, мы видим, что диа- диаграмма Кекуле основана на простой первичной структуре, струк- структуре квантовой механики. Это один из примеров того, что Гиль- Гильберт в общем виде описывает как «Tieterlegung der Funda- mente». Теория химических связей предоставляет возможность дать такую хорошую иллюстрацию иерархии структур, что я не могу удержаться от более детального ее рассмотрения. Представле- Представление о спине электрона и принцип Паули позволяют объяснить с точки зрения квантовой механики химическую валентность. Каждый электрон характеризуется определенным положением. Если разделение по положению задавалось мельчайшей решет- решеткой, то волновая функция электрона должна быть (комп- лекснозначной) функцией ty(P) аргумента Р, пробегающего все точки пространства (причем квадрат длины этого вектора яв- является интегралом от |г|)(Р)|2); волновая функция совокупно- совокупности / элементов 1, 2,...,/ должна быть антисимметри- антисимметрической функцией ty(Pi, . . . , Pf) от их положений Ри Ръ . . . , Pf. Принцип Паули является следствием антисимметрии. В силу подобия всех электронов нельзя представить себе такого дина- динамического действия, которое бы переводило антисимметрическую функцию г|) в функцию, которая таковой не является. Функция многих аргументов i, \|)(ii, ..., if), симметрична, если она остается неизменной при всех f\ подстановках f ее аргументов; она антисимметрична, если все четные подстановки оставляют ее без изменения, а нечетные переводят в —г|). Природа аргумен- аргумента i не имеет никакого значения. Он может пробегать конечное число значений i=\, 2, ..., п, как мы предполагали для про- простоты в нашем изложении квантовой механики, или же он мо- может пробегать целый континуум, что и предполагается относи- относительно Р. Мы видели ранее, что различие между четными и нечетными подстановками является комбинаторной основой противоположности левого и правого; мы убедимся сейчас, что оно лежит в основе периодической системы химических эле- элементов и большого числа важных черт «физического мира», ко- которые не поддаются объяснению с помощью понятий классиче- классической физики. Спектроскопические исследования показали, что, кроме раз- разделения электронов по положению, имеет место одновременно
Дополнения 341 и расщепление на два пучка, например под влиянием магнит- магнитного поля. Из этого следует заключить, что волновая функция от- отдельного электрона ty(P, p) зависит от двух переменных: непре- непрерывно изменяющейся пространственной координаты Р и второй переменной р, названной спином, принимающей лишь два зна- значения + 1 и —1. Две компоненты ty{P, +\) = i|)+(P) и ty(P, —1) = = i|)_(P) отнесены к декартовой системе и, как впервые обна- обнаружил Паули, пребразуются согласно спинорному представ- представлению, когда мы переходим посредством вращения к другой та- такой системе. Волновая функция совокупности f электронов есть антисимметрическая функция ty(P\, pi, Р%, Р2, •••> Pf, P/) от / пар (Р, Р). Помимо спина и антисимметрии имеется третье обстоятель- обстоятельство, которое также очень важно: в значительной мере можно пренебречь динамическим влиянием спина. Предположим, что оно строго равно нулю, т. е. динамический оператор энер- энергии Н действует только на пространственные координаты Р, а не на спиновые переменные. На первый взгляд может пока- показаться, что мы можем совершенно пренебречь спином. Однако из условий антисимметрии по отношению к парам (Р, р) следует, что этого делать нельзя. Пусть ц(Ри ..., Pf)—собственная функция оператора Н с собственными значениями hv, Hr\ = hvr\; таким образом, ц представляет собой стационарную волновую функцию с энергией hv. Предположим, что ц антисимметрична относительно своих f переменных Р. Принимая во внимание су- существование спина, мы получим линейное многообразие вол- волновых функций i|) энергии hv, Здесь второй множитель cp(pi, ..., р/) мог бы быть любой функ- функцией / спиновых переменных р; но в силу антисимметрии г|) функ- функция ф должна быть симметрической. Симметрическая функция гр переменных рь ..., р/ принимает определенное значение (pg, если данное число g аргументов р равно +1 и f — g аргументов рав- равны — 1. Функция ср полностью характеризуется своими /+1 зна- значениями ф/, ф/-ь . . . , ф0. Поскольку линейное многообразие сим- симметрических функций ф (f-|-1)-мерно, следствием существования спина является то, что энергетический уровень hv, или «член» v, достигает кратности /+1. Только в том случае, когда учиты- учитывается действительно существующее слабое взаимодействие спи- спинов, этот член кратности f+\ расщепляется на набор из f+\ различных членов. Представим на минуту, что произошла бы, если бы ц была симметрической. Тогда ф была бы анти- антисимметрической. Но антисимметрическая функция обращается
342 Герман Вейль в нуль всякий раз, когда два из ее переменных имеют равные значения. Следовательно, поскольку отдельный аргумент pi функ- функции ф принимает лишь два значения, постольку функция будет тождественно равна нулю, как только />2 и член v, соответ- соответствующий симметрической функции ц, уничтожается, так как его кратность становится равной 0. Благодаря тому что спиновое пространство имеет размерность 2, возможные перестановочные симметрические свойства функций ф(рь ..., р/) могут быть опи- описаны одним числом, валентностью v, которое может принимать все значения O^-v^f, отличающиеся от / на четное число. Со- Состояния, в которых ц антисимметрична (и, следовательно, ф сим- симметрична), имеют валентность /. Член v валентности и только за счет перестановочности электронов имеет кратность v+l. Рассмотрим нейтральный атом как совокупность / электро- электронов заряда —е, которые движутся в поле ядра заряда fe, распо- расположенного в центре О. Нерелятивистская механика применима к этой модели, если принять во внимание только электростати- электростатические силы между этими зарядами и кинетическую энергию электронов. Пусть т\(Р\, ¦¦-, Pf)—антисимметрическая соб- собственная функция оператора энергии Н, соответствующего чле- члену v. Атом в этом состоянии т) имеет энергию hv и наивысшую возможную валентность /. (Любая перестановка / точек Ри ... . . . , Pf заменила бы г\ на собственную функцию для того же члена v; однако в силу антисимметрии это не является причи- причиной перестановочной кратности.) Верно также, что эффектом любого общего вращения вокруг О точек Рь . . ., Pf является преобразование r\(Pt, ..., Pf) в собственное значение для того же члена v. Следовательно, если мы хотим избежать «враща- «вращательной» кратности члена v, мы должны предположить, что функция ц(Р],.. ¦ Pi) координат Р],..., Pf элементов инвариантна относительно всех вращений (центральная симметрия). Такое стационарное волновое состояние называется в спектроскопии S-состоянием. Таким образом, мы предполагаем, что атом имеет свою наивысшую валентность / и находится в S-состоянни. Вероят- Вероятность^ (г) того, что один из электронов будет находиться па расстоянии, большем г от центра О, определяется с помощью т), причем оказывается, что SP (г) экспоненциально убывает с воз- возрастанием г. После того как мы введем два «неизвестных» х+ и х-, соот- соответствующих двум значениям р= + 1 и —1 спина, симметриче- симметрическую функцию ф(р1 . . . р/) удобно представить алгебраической формой от х+, Х- степени f
Дополнения 343 с коэффициентами ф. Сумма в левой части состоит из 2' членов, поскольку р принимает два значения +, и —, a g в правой час- части принимает значения f, f — 1, . .. , 0. Рассмотрим неизвестные х+, л:_ как компоненты вектора х в плоскости и подвергнем их произвольному линейному пре- преобразованию / , „ / / , * / /14 1 х+ = ах'+ -+- $х'_, х_ = ух'+ + Ьх'_ A) с определителем аб — Py=1- Форма F(x, у, .. .,) многих неиз- неизвестных векторов х, у, . . . , степени /„ по х, /ь по у, .. ., назы- называется инвариантной, если F(x, у, ...,)=F(x', у', . . .,) как только х и х', у и у', .. ., связаны одним и тем же преобразова- преобразованием A) с определителем, равным 1. Рассмотрим теперь несколько нейтральных атомов а, Ь, ..., состоящих из fa, fb, ... электронов с ядрами, расположенными в определенных точках Оа, Оь,. . . пространства, и предположим, что каждый из них находится в стационарном S-состоянии наи- наивысшей валентности, причем их уровни энергии соответственно равны hva, hvb Отсюда следует, что объединенная система этих атомов имеет энергию hv0, vo = va + Vb + . . ., и что ее состоя- состояние принадлежит к линейному многообразию П размерности (fa+ I) (fb+ I) ¦ • ¦ • Рассуждая таким образом, мы пренебрегли взаимодействием атомов между собой и таким 'образом нару- нарушили основное сходство всех f = fa + fb + --- электронов, припи- приписывая fa из них окрестности точки О„ и заставляя эти /„ элек- электронов взаимодействовать только между собой и с ядром Оп. Мы предполагаем, что взаимные расстояния г ядер в О„, Оь, .. . велики по сравнению с радиусом Бора h2/me2. Считая теперь взаимодействие между многими атомами малыми возмущения- возмущениями, найдем, что член vo разбивается «перестановочным резонан- резонансом» на некоторое число систем членов молекулы согласно раз- различным возможным валентностям v = f, f — 2, ... . Состояния валентности v образуют линейное подмногообразие П„ размер- размерности пс, которое с точностью до теории возмущений, как и все многообразие П, инвариантно относительно оператора энер- энергии Н и, следовательно, стационарно. Соответствующие nv чле- членов v = vo + Av и индивидуальные стационарные состояния моле- молекулы должны быть определены как собственные значения и собственные функции оператора Н, действующего в ПР. По- Поскольку каждый из пг членов v молекулы в состоянии валент- валентности v имеет кратность v+l, сравнение размерностей приво- приводит к уравнению Мы получаем, что сдвиги Av=V(On, Оь,. . .) являются функция- функциями координат Оа, Оь, . . . ядер того же типа, что и упомянутые
344 Герман Вейль выше вероятности if (r), а именно функциями, экспоненциаль- экспоненциально убывающими с возрастанием расстояния г. Это объясняет тот факт, что гомополярная связь между нейтральными атома- атомами является силой с коротким радиусом действия. (Притяже- (Притяжение двух ионов с зарядами противоположного знака, располо- расположенных на расстоянии г, т. е. гетерополярная связь, в конеч- конечном счете не представляет собой ничего таинственного. Их энергия изменяется по закону Кулона пропорционально 1/г и таким образом является силой с большим радиусом действия.) Пусть каждому атому а, Ь, ... поставлен в соответствие некоторый неизвестный двумерный вектор х=(х+, xJ), у, ... и добавим еще один более «свободный» вектор /. Тогда Пи лучше всего описывается как линейное многообразие всех инвариан- инвариантов J(x, у, ...,/), зависящих от неизвестных векторов х, у, ..., I с заданными степенями fa, \ь, ¦ ¦ ¦, v. В подробности здесь не стоит вдаваться. Во всяком случае должно быть ясно, что двумерные векторы и инвариантность относительно линейных преобразований имеют большое значение, потому что благодаря спину состояние (ф+, ф__) электрона является двумерным век- вектором. Размерность nv многообразия П„ есть число линейно не- независимых инвариантов (степеней /„, /&,.. ., относительно век- векторов х, у,...) и степени v относительно свободного вектора /. Простейший инвариант, линейно зависящий от двух неиз- неизвестных векторов х, у, является «скобочным произведением» [ху] = х+у- — Х-у+. Любое такое произведение называется одно- одночленным инвариантом. Одночленный инвариант полностью опи- описывается диаграммой, на которой каждый из векторных аргу- аргументов х, у, . . ., I представлен точкой, а каждый скобочный оператор, подобный [ху] — линией, соединяющей точки х и у. (Скобочный оператор [xl], включающий свободный вектор /, мо- может быть представлен линией, выходящей из х, а другой конец которой остается свободным.) Степенями fa, /ь, • • • . I одночлен- одночленного инварианта относительно векторов х, у, ..., / являются числа линий, оканчивающихся в точках х, у, . . . , I соответствен- соответственно. Следовательно, одночленные инварианты полностью соот- соответствуют диаграммам валентности Кекуле. Мы будем поэтому называть состояние, описываемое таким инвариантом, состоя- состоянием чистой валентности. Первая основная теорема теории ин- инвариантов устанавливает, что каждый инвариант данных сте- степеней является линейной комбинацией одночленных инвариан- инвариантов этих же степеней. Для молекулы, состоящей из двух атомов х, у валентностей а и Ь, а^-b, мы найдем только один инвариант \xy\d[xird[yl\b-d
Дополнения 345 для каждой из возможных молекулярных валентностей v = =a + b — 2d, d = 0, 1, ..., b. Это в точности соответствует тому, что мы ожидали, исходя из схем валентностей; d — число ва- валентных линий, соединяющих два атома, а а — d, b — d — числа свободных линий валентности, выходящих из х и у соответ- соответственно. Для соответствующего члена vo + Av молекулы найдем Av = A,V(r), где V(г) — функция расстояния г между двумя ато- атомами, не зависящая от d, в то время как формпараметр Я, = {а - d) (b — d) — d зависит от d, но не от г. Функцию V(r) трудно вычислить, но в простейшем случае оказывается, что она положительна при больших г. Предполагая, что это верно, вооб- вообще можно получить силу притяжения или отталкивания согласно тому, является ли формпараметр к отрицательным или положи- положительным, к отрицателен при d = b\ но посколь- поскольку к изменяется от —b до ab, в то время как d принимает значения b, b—1, ... ... , 0, то формпараметр будет отрицательным только для сильной связи d = b или, возмож- возможно, для нескольких сильных связей d = b, Ь-1,... . Картина несколько меняется, когда во взаимодействие вхо- входят более чем два атома. Тогда число nv линейно независимых инвариантов меньше, чем число возможных схем с v свобод- свободными валентными линиями, благодаря существованию линейных соотношений между одночленными инвариантами. Кроме того, индивидуальные стационарные состояния с определенными энер- энергетическими уровнями vo + Av больше не будут совпадать с лю- любым из чистых валентных состояний. В химии на это имеются ясные указания. Например, известная формула Кекуле для бен- бензольного кольца с правильным расположением шести групп СН предполагает две возможности, в то время как изучение орто- ироизводных убедительно доказывает, что в природе имеется лишь одна возможность. Скелет, изображенный на валентной схеме (S) (рис. 1), имеет полную гексагональную симметрию, наличие которой мы ожидаем в бензольном кольце; однако в ней остается при ка- каждом атоме углерода один несвязанный валентный электрон. Это понятие фиксированной конфигурации, на .которую нала- налагается переменное состояние связи между остаточными валент- валентными электронами, может быть, является чрезмерным упроще- упрощением, но оно полезно в качестве первого приближения и сводит нашу задачу (в которую на самом деле входят сорок два элек-
346 Герман Вейль трона) к задаче с шестью равными одноэлектронными атомами, расположенными в вершинах правильного шестиугольника со стороной г. Здесь состояния валентности 0 образуют линейное многообразие всех инвариантов, зависящих линейно от чисто векторных аргументов 1, 2, 3, 4, 5, 6. Пять одночленных инва- инвариантов Л, Л'; Bi, B2, В3, указанных на рис. 2, представляют .3 A2Ц34Ц561 А 123Ц45Ц6Ц А |61||52||43| В. 6 |21Ц36||45| В2 Рис. 2. |23||14Ц65| В3 базис этого многообразия. (Их диаграмму следует перенести в скелет S; соответствующие пять состояний чистой валентности будут в «резонансе».) Приращение члена k\ = XV(r) различных стационарных состояний ц отличается формпараметром X; по- потенциал V(r), или г, однако, является общим множителем экс- экспоненциального типа. Вот список стационарных состояний с их формпараметрами X: (Р, + Р2 + Рз = 0), Я. = 2, 6 (А — А') — A4 /13) (fij 4 Я2 4- Я3). А, = 1 4- /ТЗ, Л = 6(Л — А') — A —/Тз)(в14-^а4-^з). я=1 -/13<0. Как известно, отрицательное значение Я. свидетельствует о существовании стабильной молекулы, находящейся в соответ- соответствующем квантовом состоянии ц Только т} из нижнего равен- равенства удовлетворяет этому условию, и, таким образом, это ц
Дополнения 347 указывает направление, в котором следует внести квантовоме- ханическую поправку в формулу Кекуле: к разности одночлен- одночленных инвариантов А, А', изображенных на двух диаграммах Ке- Кекуле, прибавить кратное суммы трех членов, представленных диаграммами Девара Ви В2, В3. (И А —А', и Bi + B2+B3 ме- меняют знак под действием поворота шестиугольника на 60° и остаются неизменными при отражении от одной из трех диаго- диагоналей.I) Понятие квантовомеханического резонанса между состояния- состояниями одинаковых (почти) энергетических уровней играет важную роль в современной структурной химии. В то же время ста- стараются придерживаться формул с хорошо проверенной и прием- приемлемой валентностью, сводя число модификаций, требуемых теорией резонанса, к минимуму; и во многих случаях мы опре- определяем энергетические возмущения эмпирическим путем, а не путем расчета. Этот консервативный метод, проиллюстрирован- проиллюстрированный здесь на классическом примере бензольного кольца, стал пользоваться поразительным успехом, — поразительным для людей, занимающихся точной математикой, которые считали, что некоторые «приемлемые» допущения приблизительного ха- характера, на которых он основан, весьма трудно доказуемы. (Скоро станет возможным более точное исследование с помощью быстродействующих вычислительных машин, создаваемых в настоящее время.J) Наконец, я перейду к вопросу, который хотел рассмотреть перед этим экскурсом в квантовомеханическую химию. Он ка- касается иерархии структур. На самом глубоком уровне а мы имеем структуру самой квантовой механики, в терминах кото- которой, по-видимому, мы способны интерпретировать все спектро- спектроскопические и химические факты, т. е. все физические факты, для которых внутреннее строение атомного ядра несущественно. На втором уровне р структура, представляющая молекулу в ее различных возможных состояниях, является линейным многооб- многообразием двоичных инвариантов. Но эта картина имеет только ограниченное применение. Прежде всего она относится не к самой молекуле, а к совокупности ее атомов и ядер, располо- расположенных на расстояниях, больших по сравнению с размерами молекулы. Более того, что касается отдельных атомов, пред- предполагаются возможно более простые условия относительно ') Если рассматривать бензольную молекулу как кольцо из шести групп СН валентности 3, то число независимых возможных колебаний' будет возрастать от 5 до 34, поскольку линейное многообразие двоичных инвариан- инвариантов от шести векторных аргументов, имеющих третью степень по каждому из них, имеет размерность 34. 2) Напоминаем, что дополнения были написаны в 1949 г. — Прим. перед.
348 Герман Вейль перестановок их электронов и вращения их конфигурации, в пространстве. Структуры, используемые на третьем уровне у для интерпре- интерпретации химических явлений, являются валентными схемами. В свете уровня р картина уровня у верна в одном основном от- отношении: все возможные состояния молекулы (все инварианты) действительно являются линейными комбинациями состояний чистой валентности (одночленные инварианты). Но она неверна в трех других отношениях: 1) имеются не только несколько дискретных состояний, таких, как состояние чистой валентности, но скорее целое линейное многообразие волновых состояний; в этом, конечно, заключается определяющее различие между клас- классической и квантовой механикой; 2) мы пренебрегаем линей- линейными соотношениями между одночленными инвариантами и, таким образом, получаем очень высокое значение для чис- числа nv независимых возможностей; 3) вообще пс стационарных квантовых состояний не совпадают ни с одним из состояний чистой валентности, а являТотся их некоторыми линейными комбина- комбинациями. В противоположность нашему изложению, исторический по- порядок — это спуск от более поверхностного к более глубокому уровню, y ~* Р ~* &. Кекуле разработал свое графическое пред- представление химической структуры в 1859 году. Промежуточный уровень р был впервые найден Сильвестером в 1878 году (за ним следовали немецкий специалист по теории инвариантов Гор- дан и русский химик Алексеев). Однако из-за отсутствия физи- физической интерпретации для сложения инвариантов и динамиче- динамических законов, определяющих связывающие силы и действитель- действительные стационарные состояния, химики упорствуют в своей при- привязанности к знакомым им схемам валентности. Мы можем теперь видеть, что только такие перемены взглядов, примером которых является введение квантовой механики, могут обнару- обнаружить значение картины, на которую Сильвестер натолкнулся в качестве чисто формальной, хотя и очень впечатляющей ма- математической аналогии. Извлекаемый из этого урок ясен: не принимать буквально такие предварительные схемы, как валентные, полезные в каче- качестве первого руководства в несовместимой на первый взгляд массе фактов. Не следует ожидать, что картина действитель- действительности, набросанная несколькими четкими штрихами, будет от- отражать все разнообразие ее оттенков. Даже если это так, чер- чертежник должен иметь смелость проводить линии твердо. Нет сомнений, что совокупности генов с их сцеплениями, рассматри- рассматриваемые в генетике, являются структурами не менее предвари- предварительного характера, чем валентные схемы в химии. Цитологи-
Дополнения 349 ческое изучение клеток обнаруживает сложные движения хро- хромосом, и многообразные физические процессы, детали которых подвергаются непрерывным вариациям, результаты которых — дискретные генетические диаграммы, есть не более чем сокра- сокращенные резюме ограниченной значимости. Поэтому я не слиш- слишком ручаюсь за точность примитивной комбинаторой схемы, на- набросанной в п. 1, но тем не менее, по-видимому, лучше сделать саму картину, хотя и имеющую ограниченное значение, настоль- настолько определенной, насколько это возможно. (Это является тем принципом, который Николай Кузанский подчеркнул в «De docta ignorantia»: если трансцендентное доступно нам только посредством образов и символов, пусть символы по крайней мере будут настолько отчетливыми и недвусмысленными, на- насколько позволяет математика.) Факты, о которых говорится в следующем пункте, оставляют мало сомнений по поводу того, что законы наследственности основаны в конечном итоге на той же структуре, что и законы химии — на структуре квантовой механики. Структура, которая должна служить посредником между генетическими диаграм- диаграммами и квантовой физикой, должна быть такой структурой, ко- которая принимает во внимание химическую сложность носителей жизни. Может быть, простейшей единицей в комбинаторике является группа п\ подстановок п предметов. Эта группа имеет различное строение для каждого числа п. Вопрос заключается в том, имеется ли, однако, некоторое асимптотическое единообра- единообразие, преобладающее для больших п или для некоторого опреде- определенного класса больших п. Математика все еще не дает ответа на такие вопросы. Удивительно, что квантовая теория органи- органических процессов связана с их решением. В то время как квантовая структура, описанная в п. 2, в на- настоящее время принята физиками в качестве последнего слоя, философ-скептик может задать вопрос, является ли это сведе- сведение более чем промежуточным шагом в regressus ad infini- tum. Но, как предупреждает ученый, ничто не является более дешевым и бесплодным, чем игра с такими мысленными воз- возможностями, прежде чем новые открытия не поставят нас перед такой конкретной ситуацией, при которой мы будем вынуждены подвести новый фундамент под наши знания. Физические явления развертываются в непрерывно протя- протяженной среде пространства и времени; именно этот взгляд, ко- который преобладает в значительной мере над эпистемологиче- эпистемологической мыслью о естественных науках, является основной частью книги [PMNS], которую пытались составить в 1926 г. Это было исторически оправдано, и достижения общей теории относитель- относительности, в то время еще очень свежие, придали дополнительный 24 Зак. 909
350 Герман Вейль вес этой точке зрения. В последние два десятилетия, однако, дискретные и комбинаторные структуры, лежащие в основе явлений природы, приобретают все возрастающее значение. Здесь, по-видимому, на свет выходит более глубокий слой, для описания которого наш обычный язык совсем не приспособлен. Предыдущие дополнения свидетельствуют об этом изменив- изменившемся взгляде. Однако в нашу задачу не входит более чем собирание относящегося сюда материала; философское про- проникновение остается в основном задачей будущего. ЛИТЕРАТУРА Born M., Chemische Bindung und Quantenmechanik, Ergcbnisse der exakten Naturwissenschaften, vol. 10, Berlin, 1931. Паул инг Л., Природа химической связи, Госхимиздат, М., 1947. Р а 1 m е г W. G., Valency, Classical and Modern, Cambridge, 1944. 4. Физика и биология 1. Одной из глубочайших загадок природы является разница между живой и неживой материей. Однако можно охарактери- охарактеризовать жизнь феноменологически: живая материя, очевидно, от- отделена от неживой глубокой пропастью. Жизнь происходит только в материальных системах, которые с физико-химической точки зрения следует рассматривать как системы высокой слож- сложности. Описательно и без претензий на полноту мы перечислим некоторые из типичных черт живого организма: его клеточное строение (клетки — это единицы живого, имеющие самые общие главные свойства); его цельность как формы (morphe, Gestalt) и как функционального комплекса со взаимной корректировкой всех клеточных изменений по отношению друг к другу («Тот нежный пункт, откуда жизнь вся шла»1)); обеспеченность мета- метаболизмом с его способностью использовать чуждую материю, как пищу, и включать ее в свой собственный организм; развитие с помощью усвоения пищи, рост и дифференциация от сравни- сравнительно простых до более сложных состояний; несмотря на вну- внутреннюю неустойчивость, далеко идущая, хотя и ограниченная, способность сохранять себя, как это дифференцированное целое, под воздействием внешних изменяющихся влияний, в особенно- особенности в хаосе молекулярного теплового движения, и восстанавли- восстанавливать себя после повреждающих вторжений; ограничение во вре- времени индивидуального существования (рождение и смерть); способность к распространению и к передаче специфических осо- ') Гёте, Фауст, II часть, пер. Холодковского. ¦—Прим. перге.
Дополнения 351 бенностей своей конституции своему потомству. В то время как неживая материя инертна, организм является источником актив- активности, которая несет на себе отпечаток самопроизвольности тем больше (с осознанным действием, как высшей точкой), чем выше мы поднимаемся в мире организмов. В то же время организм подвержен воздействиям (на высшем уровне—чувства) и ода- одарен способностью накапливать опыт ощущений (память). Жизнь развернулась в громадное разнообразие видов с типично раз- различными конституциями, и все организмы тесно переплетены в сети адаптации и отношений между собой и с окружающей средой. Научный анализ живой материи привел нас, кажется, к ее низшему звену — гену и к его основному свойству — самовос- самовоспроизведению. При этом процессе в живой клетке из доступных материалов синтезируется копия гена. Между прочим, разрыв между живой и неживой природой был несколько сокращен благодаря открытию вирусов. Вирусы являются субмикро- субмикроскопическими объектами, которые ведут себя как мертвая инертная материя, до тех пор, пока не попадут в какую-то жи- живую клетку. Будучи паразитами в таких клетках, они проявляют, однако, основные свойства жизни — самовоспроизведение и му- мутацию. С другой стороны, многие вирусы имеют структуру, ти- типичную для неорганических веществ; они -— кристаллы. В раз- размерах они колеблются от сложных белковых молекул до мель- мельчайших бактерий. Химически они состоят из нуклеопротеинов, так же как и гены. Вирус, очевидно, является чем-то похожим на обнаженный ген. Наиболее изученный вирус — вирус табач- табачной мозаики — является нуклеопротеином с высоким молекуляр- молекулярным весом, состоящим из 95% белка и 5% нуклеиновой кислоты; он кристаллизуется в виде длинных тонких иголок. Основные за- законы, открытые физикой и управляющие химией, касаются, несомненно, также и живой материи. Поэтому такое глубокое изменение в физике, какое было произведено квантовой тео- теорией, должно было иметь отзвук в биологии. Постольку, по- поскольку движение от простых к более сложным конфигурациям является методологически обоснованным в науке, биология бу- будет основываться на физике, а не наоборот. Специфические свойства живой материи должны будут изучаться в рамках ос- основных законов, действительных для всей материи; мы отрицаем точку зрения холизма, по которой сначала вводится теория жизни, а из нее с помощью исключения спускаются к неоргани- неорганической материи. Важно поэтому, что квантовая механика при- приписывает элементарным составляющим материи некоторые про- простые и определенные черты целостности, организации и неопре- неопределенности. В этом отношении между физикой и биологией, не- 24*
352 Герман Вейль сомненно, произошло восстановление дипломатических отноше- отношений. Структура и организация встречаются не только у живых существ; физика хорошо знакома с этим вопросом, предста- представленным в символическом аппарате ее теории, которая предвос- предвосхищает все динамические законы. Квантовая физика атомных процессов становится уместной в биологии в тех случаях, когда в жизненном цикле организма умеренное число атомов произ- производит управляющее воздействие на события больших масшта- масштабов. (Наши радиолампы являются наиболее знакомым неоргани- неорганическим примером такого управляющего механизма.) На широкой эмпирической базе генетика дает наиболее убе- убедительное доказательство того, что организмы управляются по- посредством процессов атомных масштабов, где может проявиться квантовомеханическая неопределенность. На исходе прошлого века, когда Планк ввел в физику поня- понятие кванта взаимодействия, де Вриес открыл скачкообразные мутации генетической конституции эпотеры (наибольшая часть которых в настоящее время признается скорее структурными, чем точковыми мутациями). Для физического понимания мута- мутаций имеет важное значение их искусственное образование при действии рентгеновских лучей на хромосомы. Тот факт, что та- такое облучение вызывает мутации, доказывает, что гены имеют физическую структуру. Когда рентгеновские лучи падают на вещество, тот или иной фотон передает всю или большую часть своей энергии быстрому вторичному электрону, а последний в свою очередь теряет свою энергию за несколько шагов посред- посредством ионизации (или возбуждения) атомов. Средняя энергия ионизации достигает 30 электронвольт. С помощью остро- остроумного метода Мюллеру, Тимофееву-Рессовскому и другим удалось установить простой количественный закон, относящийся к скорости вызванных этим процессом мутаций. Эти результаты показывают, что мутация вызывается единственным ударом, а не совместным действием нескольких ударов и что этот удар состоит из ионизации, а не из процесса, непосредственно осуще- осуществляемого рентгеновским фотоном или при поглощении всей энергии вторичного электрона, как можно было бы думать. Эти факты наводят на мысль, что гены являются (нуклео- протеиновой) молекулой очень сложной структуры и что мута- мутация состоит в химическом изменении этой молекулы, вызванном действием ионизации электронов связи, и таким образом,аллели генов в основном являются изометрическими молекулами. Наи- Наиболее элементарные химические обмены, которые в квантовой физике можно придумать, — это локализованные двухступенча- двухступенчатые квантовые скачки: во-первых, молекула поднимается G энергетического уровня 1 на более высокий уровень 2, а оттуда
Дополнения 353 попадает в новое устойчивое состояние энергетического уровня 3. Разность энергий уровней 2 и 1 соответственно есть необходимая энергия возбуждения U. Скорость, с которой спецефический квантовый скачок, требующий энергии возбуждения U, происхо- происходит спонтанно при данной температуре, зависит в основном от одной U, но изменяется очень сильно вместе с V (по экспонен- экспоненциальному закону). При температуре, преобладающей в настоя- настоящее время на земной поверхности, такой квантовый скачок, ко- который соответствует значению U между, например, 1,4 и 1,7, мо- может иногда происходить, хотя и довольно редко. (Для меньших значений U соответствующие квантовые скачки так часты, что начинает действовать статистический закон больших чисел; они дают толчок таким обычным химическим реакциям, которые имеют место при развитии организма. Таким образом, соблазни- соблазнительно закончить картину, рассматривая мутацию, как редкий квантовый скачок с энергией возбуждения лежащей в вышеупо- вышеупомянутом интервале (модель ДельбрукаI).) Можно было бы объ- объяснить наблюдаемую абсолютную скорость мутации, считая, что для определенной мутации требуется соударение в некотором «критическом» объеме («мишени») гена, с величиной порядка 5—10 кубический ангстрем. В физике считается, если неправдо- неправдоподобным, то по крайней мере приемлемым то, что квантовый скачок в определенной точке, требующий энергию возбуждения порядка 1,5, происходит при соударении с энергией 30 электрон- вольт в чувствительном объеме около 5—10 кубических ангстрем. Наблюдаемая тепловая зависимость частоты спонтанных мута- мутаций (фактор Хоффа) находится в хорошем количественном со- согласии с этой картиной. Есть несколько методов оценки размеров и молекулярного веса генов. Большая часть опытов с облучением связана с му- мутациями, которые называются рецессивными деталями. Опреде- Определенный большой процент их получается, когда ионизация ли- лишает ген его возможности воспроизведения (тогда как другие происходят при больших структурных мутациях). Вероятно, воз- возможно сопоставить первый тип леталей инактивации ферментов и вирусов. Для последних процессов, которые также вызываются одиночными ионизациями, можно определить размер мишени, или с помощью абсолютной дозы рентгеновского излучения, или по относительной эффективности разных видов излучения. При этом радиус мишени получается в один-пять раз меньше, чем ') Ср. Timofeeff-Ressowsky N. W., Zimmer К. G., Del- Delhi г 0 с к М., Ober die Natur der Genmutation und der Genstruktur (Nachr. Gott. Ges. Wissensch., Math.-physik. КЦ Fachg., VI, 1), 1935, 189—245.
354 Герман Вейль радиус молекулы фермента или вируса. Отсюда размер мишени гена для всех рецессивных летальных мутаций «первого типа» не должен быть много меньше размеров гена. Существует сле- следующий другой метод для определения размера гена, или по крайней мере его верхней границы. При сильном увеличении хромосом слюнных желез дрозо- дрозофилы видна поперечная исчерченность, в результате которой создаются полосы различной ширины; параллелизм генетиче- генетических и цитологических данных позволяет выдвинуть гипотезу о том, что эти полосы соответствуют генам или небольшим груп- группам генов. Многие методы сходятся в том, что можно считать правдоподобным, что молекулярный вес генов имеет порядок одного миллиона (в единицах атомного веса водорода). Это как раз то, что можно было бы ожидать, считая, что веса нитевидных молекул нуклеиновых кислот изменяются от пяти- пятидесяти тысяч до нескольких сотен тысяч, в то время как нес отдельной молекулы вируса табачной мозаики достигает сорока миллионов. Исследования последнего десятилетия оказались неблаго- неблагоприятными для гипотезы о том, что мутация является результа- результатом квантового скачка, локализованного и ограниченного не- несколькими атомами. Выяснилось, что в этом отношении имеются некоторые сложности. Ярким примером этого является обнару- обнаруженный Стэнли факт, что некоторая спонтанная мутация вируса табачной мозаики изменяет его химический состав добавлением около одной тысячи молекул гистидина. Таким образом, можно подумать о некотором механизме, посредством которого от- отдельная ионизация освобождает цепь (ферментативных?) реакций со сложной мутацией в конечном результате. Как бы то ни было направление, в котором работает наша модель, едва ли может ввести нас в заблуждение; ген следует рассма- рассматривать как сложную молекулу, а мутации тесно связаны с квантовыми скачками. Последние могут быть вызваны одними ионизациями, и, таким образом, вместе с Йорданом, мы можем заключить, что «управляющие центры жизни не подвержены макрофизической причинности, но лежат в области микрофизи- микрофизической свободы». Между прочим, вирусы, которые могут быть изолированы и наблюдены посредством электронного микро- микроскопа, являются во многих отношениях лучшими объектами для изучения физических основ процесса мутации, чем невидимые гены в хромосомах клетки. Предполагается, что ядро оплодотворенной яйцеклетки полу- получает в силу своей генетической конструкции полный набор определяющих факторов для развития организма. Раньше часто было трудно согласовать эту точку зрения — так тесно была она
Дополнения 355 связана с исходом дискуссии «преформизм» против «эпиге- «эпигенеза»— с широким многообразием животного и растительного мира, со всеми их различными путями развития и их малей- малейшими дифференциациями. Однако фантастически большое число возможных комбинаций атомов в молекуле гена намного пре- превосходят все то, что требуется для этой цели. Таким образом, не является непостижимым, что миниатюрный код, содержа- содержащийся в молекулах гена клеточного ядра, точно совпадают с очень сложным и точным планом развития и содержит сред- средства, необходимые для его осуществления. С помощью известного эксперимента Дриш заметил, что если у Clavellina отрезать верхнюю треть, то она превратится в аморфное скопление клеток, из которого затем вновь разовьется целая Clavellina меньшего размера. Он увидел в этом экспери- эксперименте доказательство существования некой энтелехии, которую нельзя описать в терминах физической структуры. В настоящее время мы представляем себе довольно определенно ту физиче- физическую структуру, которая могла бы соответствовать такой энте- энтелехии. Вопрос выбора между комбинаторными возможностями" заключается в чем-то другом; он касается (i) физико-химиче- физико-химической проблемы стабильности сложных молекулярных соедине- соединений, (и) механизма, посредством которого «код» преобразуется в развитие организма, и (iii) процесса эволюции. Стабильность молекулы зависит от химических связей ее атомов. Как упоминалось раньше, именно квантовая физика пролила свет на первоначально весьма туманную природу хи- химических связей. Кристалл (подобный алмазу) является регу- регулярным расположением атомов (атомов углерода в случае алмаза), периодическим в трех независимых пространствен- пространственных направлениях. Здесь связи распространяются между всеми атомами, и таким образом кристалл является единственной мо- молекулой. Стабильность твердых тел является стабильностью кристаллов, и если модель Дельбрука в основном верна, то ста- стабильность генов основывается на тех же квантовомеханических основах. Однако, в то время как в кристалле те же самые «строительные кирпичи» повторяются периодически, каждый атом в гене имеет свои специфические неизменяемые место и роль. Однако Шрёдингер говорит о гене как об апериодическом кристалле и приписывает ему высшую степень порядка и органи- организации, чем у периодического кристалла. Поскольку макроскопический порядок и регулярность при- природы основаны посредством статистической термодинамики на микроскопическом беспорядке, мы встречаем неожиданно в кри- кристаллах и хромосомах клеточных ядер порядок, который не на- нарушается температурным беспорядком. В противоположность
356 Герман Вейль обычным химическим реакциям, законы которых получены усреднением по огромному числу молекулярных процессов, му- мутации затрагивают одиночные гены. Ввиду того что (а) поря- порядок зиготы передается с помощью самоудвоения и митоза всем соматическим клеткам и (Ь) относительно малая часть хо- хорошо упорядоченных атомов в хромосомах клеток контролирует развитие живого существа, расположение нескольких атомов в мутантном гене вызывает вполне определенные изменения в макроскопических наследственных признаках организма. Пре- Прежде чем мы поймем механизм, лежащий в основе процессов (а) и (Ь), мы не можем утверждать, что нам понятно онтогене- онтогенетическое развитие. Хотя формальная генетика продвигалась вперед скачками в течение последних 40—50 лет, наши знания в этой области до сих пор все еще весьма поверхностны. Что касается централь- центральной проблемы самоудвоения, то Дельбруку (в 1941 г.) удалось дать подробную, но гипотетическую картину того, как амино- аминокислоты могут нанизываться и образовывать конфигурацию, превосходящую ранее существующую модель гена квантово- механическим резонансом на участке пептидных связей. Связь между геном и видимым признаком, например между формой крыла дрозофилы, называемой jaunty, и контролирующим его геном, является, конечно, цепью промежуточных взаимодействий. Тем не менее важным шагом вперед являлось то, что недавно внимание было сконцентрировано на генетическом контроле ферментативных взаимодействий; большой опыт указывает на тесную связь между генами и отдельными ферментами (см. не- недавнюю работу Бидла и др. о Neurospora). Когда небольшой кусочек твердого кристаллического тела заставляет насыщен- насыщенный раствор того же вещества кристаллизоваться, мы стано- становимся свидетелями того, как зародыш порядка способен распро- распространить порядок. Хотя мы еще неспособны проследить за физическим процессом подробно, несомненно, что он лежит в радиусе действия известных физических законов. Наука спешит изучать многообразные процессы, от которых зависит порядок в живых организмах, в основном теми же методами, т. е. на основе квантовой физики и ее первичной статистики. Но здесь может произойти раздвоение в следующем смысле: поскольку порядок происходит из беспорядка посредством вторичной ста- статистики термодинамики, то может встретиться параллельный, но отличный тип законов макромира, описывающих возникновение макроупорядоченности из микроупорядоченности в организме (Шрёдингер). 2. С мутациями в поведение организма входит легко узна- узнаваемый элемент неопределенности. В то время как мои ощуще-
Дополнения 357 ния и действия являются вообще результатами бесчисленного числа индивидуальных атомных процессов, и, таким образом, попадают под действие статистических законов, небезынтересно отметить, что при благоприятных обстоятельствах нескольких фотонов (не более 5—8) достаточно для зрительного ощущения света. Отсюда, от квантовых мутаций в молекуле гена и пере- перехода возбуждения, вызванного несколькими фотонами, в зри- зрительное ощущение, еще очень и очень далеко до полной психо- психофизической реальности, с которой сталкивается человек, и до полной теоретической картины ее, которая объяснила бы факты свободы познания и свободы воли. «Хотя дверь человеческой свободы и открыта, — говорит Эддингтон в «Новых путях в науке» (стр. 87), — она не распахнута: виден только луч света. Но она уже больше не запретна и попытки дальше приотворить ее только поощряются». Мы можем спросить, насколько показа- показателен пример мутаций, в какой степени жизненные процессы могут быть приписаны триггерному действию небольших групп атомов с непредсказуемым поведением. Физик Йордан утвер- утверждал, что в значительной мере это действительно так, но встре- встретил большое сопротивление со стороны биологов. Также и Шрё- дингер предупреждает, что без почти полной точности и надеж- надежности законов макроскопической термодинамики, управляющих нервными и мозговыми процессами человеческого тела и его взаимодействием с окружающим миром, чувства и мысль были бы невозможны. Нильс Бор, однако, склонен расширить область Неопределенности, прибавляя специфический биологический принцип неопределенности (точное содержание которого еще неизвестно) к хорошо установленному квантовомехаиическому принципу неопределенности Гейзенберга. В этой связи он ука- указал, что наблюдение за состоянием клеток мозга, достаточно точное для довольно определенного предсказания поведения жертвы, в следующие несколько секунд может означать втор- вторжение в него, имеющее с необходимостью летальный исход, и поэтому невозможно сделать организм действительно предска- предсказуемым. Бор утверждает, что таким образом анализ жизненных явлений с помощью физических представлений имеет естествен- естественные границы применения; так же как надо учитывать принцип неопределенности Гейзенберга для объяснения устойчивости ато- атомов, для объяснения самостабилизации живых организмов тре- требуются дальнейшие ограничения. Такие теоретические действия, как рассуждение, что 2 + 2 дает 4, служили в [PMNS] для того, чтобы отчетливо вы- выделить проблему свободы. Мысль как таковая была бы аннули- аннулирована, если бы отрицалось, что в этом моем рассуждении (суще- (существующий в уме факт, что 2 + 2 действительно составляет 4)
358 Герман Вейль приобретает власть над индивидуальным психическим действием, и не только над психическим действием, но и над движением моих губ, которые образуют соответствующие слова, насыщен- насыщенные значением, или над движением руки, которая, возможно, в ходе математического доказательства пишет значки «2 + 2 = 4» на бумаге. Поэтому недостаточно просто пробить брешь в стро- строгой причинности природы; внутри теории должно быть найдено представление для витальных, психических и духовных факто- факторов, которые некоторым образом направляют и контролируют атомные процессы. Конечно, для того охвата целостности природы, который предшествует всякой теории, важно не поте- потерять из вида эти черты. Подводя итог работе всей своей жизни, Шпеман пришел к выводу, что «процессы развития ни с чем не могут быть сравнимы в большей степени с точки зрения их свя- связей, чем с теми жизненными процессами, с которыми мы наибо- наиболее интимно знакомы, т. е. психическими процессами». К таким голосам, как этот — а он неодинок, — надо прислушаться. И все- таки я считаю, что в теории действительности идеальные фак- факторы, рассматриваемые здесь, в основном должны быть пред- представлены таким же образом, как элементарные частицы физики и силы между ними; а именно как структуры, выраженные в символах. Я не слишком рассчитываю на предположение, вы- высказанное в [PMNS], что для этой цели могут служить корреля- корреляции между такими атомными явлениями, которые в термо- термодинамике рассматриваются как статистически независимые. Действительно, пример квантовой механики еще раз показал, насколько далеко возможности, с которыми играет наше вооб- воображение до того, как проблема созрела для решения, бывают превзойдены действительностью. Даже при этом объяснение химической связи с помощью принципа запрета Паули наме- намекает, возможно, на то, что при коренном разрыве с классиче- классической схемой статистической независимости открываются воз- возможности настолько же важные, как квантовомеханический принцип дополнительности. Ученые были бы неправы, игнорируя тот факт, что теорети- теоретические построения не являются единственным подходом к рас- рассмотрению жизни; нам открыт и другой путь — понимание изну- изнутри (интерпретации). Вольтерек в своей многосторонней «Фило- «Философии живого» попытался недавно более детально описать орга- органическую жизнь «изнутри». Я сам из моих ощущений, мысли, воли, чувств и поступков обладаю непосредственным знанием, совершенно отличным от теоретического знания, которое пред- представляется «параллельными» мозговыми процессами, осуще- осуществляемыми в символах. Это внутреннее осознание самого себя является основой моего понимания окружающих меня людей,
Дополнения 359 которых я принимаю за существа моего вида и с которыми я со- сообщаюсь, иногда настолько интимно, что могу делить с ними радость и горе. Если даже я не настолько проникаю в их со- сознание, чтобы ощущать его, как свое собственное, тем не менее мое «интерпретационное» понимание его обладает неоспоримой адекватностью. Его яркий свет направлен не только на людей, окружающих меня; он проникает, хотя все более тускло и не- неразличимо, глубоко ив мир животных. Когда Альберт Швейцер высмеивал ограниченный взгляд Канта, утверждавшего, что человек способен к состраданию, но не может делить радость с живыми существами, и задавал вопрос: «Разве он никогда не видел, как бык возвращается домой с поля пьяным?», он был прав. Бесплодно отмахиваться от этого подхода к природе «из- «изнутри» как от антропоморфического и превозносить объектив- объективность теоретических построений. Оба пути ведут, как это бывает, в противоположные стороны: то, что является наиболее темным для теории — человек, — для понимания изнутри является наибо- наиболее ясным, а к простым неорганическим процессам, которые наибо- наиболее просты для теории, интерпретация не находит никакого под-' хода. Для объективной теории понимание изнутри может слу- служить проводником к важным проблемам, хотя оно не может дать их объективного решения. Пример этого был дан недавно исследованиями о направлении инстинктивного поведения жи- животных, рассматривающими их «влечения». Было бы соблазнительно распространить принцип дополни- дополнительности Бора на отношения между двумя противоположными подходами, которые мы здесь обсуждаем. Но сколько бы ни сравнивать их между собой, нельзя уйти от следующего важного и неоспоримого факта: метод конструктивной теории за послед- последние три века показал себя методом, способным к прогрессивному развитию и обладающим, видимо, неограниченной широтой и глубиной; каждая решенная проблема в нем ставит новые, для которых при совместных усилиях мысли и эксперимента можно найти точные и всесторонние убедительные решения. В отличие от этого понимание изнутри, кажется, практически ограничено раз и навсегда человеческой природой, и в лучшем случае, может быть немного расширено уточнением языка, в особенности языка поэтоп. Пониманию по той самой причине, что оно кон- конкретно и полно, недостает свободы «пусто'о символа». Я опа- опасаюсь, что биология изнутри в том виде, в каком она пропаган- пропагандируется Вольтереком, окажется лишенной той постоянной дви- движущей силы проблем, которая ведет конструктивную биологию вперед и вперед.
360 Герман Вейль ЛИТЕРАТУРА Stanley W. M., Chemical properties of viruses, in The Study of Man, Bicen- Bicentennial Conference, Univ. of Pennsylvania Press, 1941. Beadle G. W., The Gene, Proc. Am. Phil. Soc, 90 A946), pp. 422—431. Muller H. J., The Gene, Proc. Poy. Soc, BI31 A947), pp. 1—37. S p e m a n n H., Embryonic Development and Induction, Yale Univ. Press, 1938 (особенно р. 372). Schrodinger E., What is Life? Cambridge and New York, 1945. L e a D. E., Actions of Radiations on Living Cells, Cambridge and New York, 1946. Goldschmidt R., Physiological Genetics, New York, 1938. Del b ruck M., Cold Spring Harb. Symp. on Quant. Biology, 9 A941), pp. 122—126. Bohr N., Light and Life, Nature, 131 A933), pp. 421, 457. Bohr N., Biology and Atomic Physics, Rend, gener. celebr Galvani Bologna, 1938. Jordan P., Naturwissenschaften, 20 A932), p. 815; 22 A934), p. 485- 26 A938), p. 537. Jordan P., Erkenntnis, 4 A934), p. 215. Jordan P., Zur Quanten-Biologie, Biol. Zbl., 59 A939), pp. 1—39. Jordan P., Die Physik and das Geheinnis des organischen Lebens, Braun- Braunschweig, 1941. W о 11 e г е с к R., Philosophie der lebendigen Wirklichkeit, Bd. I: Grundziige einer allgemeinen Biologie, Stuttgart, 1931; Bd. 2: Ontologie des Leben- Lebendigen, Stuttgart, 1940.
Ответы иа вопросы для самопроверки Страница 57-58 104—106 137—138 156-157 201—202 241 285—286 307 Номер вопроса 1 б а б б в в а б 2 Г б В в в в б б 3 в б в в б а б б 4 а г г в г б г в 5 а ' г в а а б а а
СОДЕРЖАН ИЕ Предисловие редактора перевода 5 Джордж Пой а, Введение, перевод О. А. Глебова 7 Эллиотт В. Монтролл, Статистика решеток, перевод Б. А. Дом- нина .... .... 9 Н. Д ж. Д е Б р ё й н, Теория перечисления Пойа, перевод А. Н. Ко- пыловой ....... 61 Фрэик Харари, Комбинаторные задачи перечисления графов, пе- перевод А. Н. Копыловой ..... ... 107 Роберт Калаба, Теория графов и автоматическое управление, пе- перевод В. Г. Тупицына . . .141 Лео Брейман, Задачи о правилах остановки, перевод А. Н. Ж//- ринского . . .... . ... 159 Маршалл Холл, Блок-схемы, перевод С. А. Широковой 203 Чарльз Т о м п к и н с. Лемма Шпернера и некоторые ее обобщения, перевод В. К. Белова ... ... '243 Георгий Га мо в, Комбинаторные принципы в генетике, перевод А. Н. Журинского . . . . 288 Герман В е й л ь, Дополнения, перевод О. А. Глебова 309
'" ПРИКЛАДНАЯ КОМБИНАТОРНАЯ МАТЕМАТИКА Редактор А. А. Бряндинсная Художник А. В. Шипов Художественный редактор В. И. Шаповалов Технический редактор М. П. Грибова Сдано в производство 9/Х 1967 г. Подписано к печати 18/III 1968 г. Бумага № 1 69х90'/1в=11,38 бум. л. 22,75 печ. л. Уч.-нзд. л. 21,63. Изд. № 1/4406 Цена 1 р. 74 к. Зак. 909 Темплан за 1967 г изд-ва «МИР», пор. № 19 ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Ленинградская типография № 2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР Измайловский проспект. 29