Текст
                    ВЕРОЯТНОСТЬ
И СМЕЖНЫЕ ВОПРОСЫ
В ФИЗИКЕ

ИЗДАТЕЛЬСТВО «МИР»
LECTURES TN APPLIED MATHEMATICS PROCEEDINGS OF THE SUMMER SEMINAR, BOULDER, COLORADO, 1957 Volume I PROBABILITY AND RELATED TOPICS IN PHYSICAL SCIENCES by MARK KAC Department ol Mathematics, Cornell University With Special Lectures by О. E. UHLENBECK Depsrtment of Physics, University ol Mlchlgsn A. R. HIBBS Jet Propulsion Lsborstory, Csllfornls Institute of Technology Interscience Publishers, Ltd., London Interscience Publishers, inc. New York
М. Кац ВЕРОЯТНОСТЬ И СМЕЖНЫЕ ВОПРОСЫ В ФИЗИКЕ ПЕРЕВОД С АНГЛИЙСКОГО Р. А. МИНЛОСА ИЗДАТЕЛЬСТВО <МИР» Москва 1965
УДК 519.2:53116 Автор знаком советскому читателю по переводу его ра- боты «Статистическая независимость в теории вероятностей, анализе и теории чисел> (ИЛ, 1963). Его новая книга в основ- ном посвящена одной из интереснейших задач физики: опи- сать, как система из очень большого числа частиц (газ в сосуде) приходит в состояние равновесия, и объяснить, как необратимость этого процесса во времени согласуется с обра- тимостью во времени исходных уравнений. Наибольшее внима- ние уделяется вероятностному аспекту проблемы; рассматри- ваются статистические модели, имитирующие основные черты задачи. Две первые главы имеют и самостоятельный интерес — на удачно подобранных примерах автор показывает, каким образом понятие вероятности возникает в математических и физических задачах и какой аналитический аппарат исполь- зует теория вероятностей. В данное издание включены статьи Каца и других авто- ров, касающиеся затронутых в книге вопросов. Редакция литературы по математическим наукам
ПРЕДИСЛОВИЕ ПЕРЕВОДЧИКА В своем предисловии автор ясно очертил как стиль книги, так и те педагогические и литературные принци- пы, которыми он руководствовался. По своей форме и манере изложения эта книга принадлежит к новому жанру в математической литературе, изобретенному, по- видимому, недавно. Эту форму можно наполнить любым содержанием, и с ее помощью читателя можно вести почти от «нуля» в самую гущу нерешенных проблем, не отнимая- у него возможности в любом месте с достоин- ством выйти из игры. Одно замечание относительно содержания книги. Не- смотря на то что она очень фрагментарна и состоит из большого числа искусно расположенных этюдов, в ней все-таки центральное место занимает третья глава. Здесь сделана далеко идущая попытка ввести читателя в круг вопросов, связанных с кинетическими уравне- ниями. Автор следует в этой главе своей основной тен- денции (впрочем, вполне совпадающей с общим замыс- лом книги) —дать статистическое истолкование кине- тическим уравнениям и тем необратимым процессам, которые ими описываются. В связи с этим здесь почти отсутствует упоминание о других аспектах и подходах к этой проблеме. Этот пробел, правда частично, воспол- няется лекцией Г. Е. Уленбека, помещенной в приложе- ниях к книге. Но следует иметь в виду, что книга на- писана около пяти лет назад, а за последнее время
6 Предисловие переводчика в этой области появилось много интересных работ. В конце книги добавлено приложение, которого не было в оригинальном издании. Это цикл недавних ста- тей М. Каца, Г. Уленбека и П. Хеммера, где подробно разбирается одна модель фазового перехода. В третьей главе, а также в лекции Уленбека трак- туются вопросы неравновесной статистической механи- ки — каким образом большая система, исходя из произ- вольного состояния, приходит к равновесию. Однако уже в равновесной статистической механике существует очень важная нерешенная задача — задача о фазовом пере- ходе. В настоящее время в классической статистической механике имеется лишь одна модель (двумерная и трех- мерная решетки Изинга), в которой строго установлено существование фазового перехода. Непрерывной же мо- дели (модели газа) фазового перехода еще нет, не гово- ря уже о том, что отсутствует какое-либо описание тех систем, где такой переход возможен. В помещенном нами цикле статей строится модель одномерного газа с очень малым и очень дальнодей- ствующим притяжением, в которой обнаруживается фа- зовый переход. Хотя этот случай и не улавливает всех трудностей истинной трехмерной задачи, эти работы очень интересны. К этим статьям мною написано не- большое добавление, где кратко изложены необходимые сведения о проблеме конденсации. Читателю, мало зна- комому с вопросом, лучше начать с этого добавления. Р. А. Минлос
ОТ АМЕРИКАНСКОГО РЕДАКЦИОННОГО КОМИТЕТА Эта книга представляет собой первый том трудов летнего семинара по прикладной математике, организо- ванного Американским математическим обществом и проходившего в Колорадском университете в течение четырех недель с 23 июня 1957 г. Цель этого семинара состояла в том, чтобы ознако- мить квалифицированных математиков с современным состоянием нескольких областей прикладной математики и поставить перед ними ряд важных и интересных задач, которые до сих пор не решены. Такой семинар можно рассматривать как попытку содействовать раз- витию сотрудничества между математиками и физиками. Труды семинара публикуются для того, чтобы информа- ция, приобретенная участниками семинара, стала до- ступной значительно более широкому научному кругу. В то же время эти книги могут служить справочником для тех, кто слушал лекции. Программа семинара была разработана организа- ционным комитетом Американского математического общества в составе П. Гарабедяна, А. Хаусхолдера, М. Каца, Р. Ленгера, Линь Цзя-цзяо, В. Прагера, Дж. Стокера и М. Мартина (председатель). Подготовка семинара (составление программ заседа- ний, организация отдыха участников) была осуществле- на комитетом Отделения прикладной математики
8 От американского редакционного комитета Колорадского университета в составе Бриттона, Бен Крига, Рутланда, Снивли, Шталя, Хатчинсона (пред- седатель). Неисчерпаемая энергия и энтузиазм председателя и других сотрудников университета внесли неизмеримый вклад в успешное осуществление планов семинара. Семинар открылся 23 июня вступительным докладом Р. Фейнмана (Калифорнийский технологический инсти- тут) на тему «Связь математики и физики». Заседания, предусмотренные программой, проводились по утрам, с тем чтобы сохранить свободным послеполуденное время и предоставить участникам возможность проводить не- официальные дискуссии по отдельным вопросам. А. Хаусхолдер 13 октября 1958 г.
Памяти моих родителей и моего брата — невинных жертв войны ПРЕДИСЛОВИЕ Эта книга — расширенное изложение двенадцати лекций, прочитанных на семинаре по прикладной мате- матике в Колорадском университете летом 1957 года. Как и лекции, книга представляет собой введе- ние в теорию вероятностей и предназначена для квали- фицированного читателя, не имеющего почти никаких предварительных сведений о предмете. Это не означает, что она может служить учебником; для этого она слишком фрагментарна и, возможно, слишком сильно отражает вкусы, наклонности и пред- убеждения автора. По сути дела, это скорее обзор неко- торых собственных его исследований и точек зрения. В теории вероятностей автора больше всего привле- кает необычайное разнообразие ее применений. Немно- гие математические дисциплины имеют такой широкий диапазон приложений — от теории чисел до физики; еще меньше среди них тех, которые столь решительно про- никают во все наше научное мышление. Отразить эту многогранность теории вероятностей и показать широту ее применений — в этом и заключается цель книги. Чтобы добиться этого, мы сосредоточили основное внимание в нашем изложении на ряде отдель- ных примеров и задач, не делая при этом никаких серьез- ных попыток вложить их в общие схемы или теории. Помимо того, что такой стиль изложения весьма свойствен автору, он кажется нам наиболее ярким, во всяком случае в педагогическом отношении. Стремление к общности и абстрактности в курсе лек- ций, призванных служить введением в новую область, выглядело бы, мягко говоря, глупо. Это могло бы привести к искаженной картине, где все побудительные
10 Предисловие мотивы были бы скрыты; да и, кроме того, чтобы спа- сти изложение от смертельной скуки, от автора потре- бовался бы литературный талант, далекий от его воз- можностей. Книга делится на четыре главы. В первой (теорети- ко-вероятностный способ рассуждений) показывается, каким образом вероятностные понятия возникают при исследовании различных задач и насколько они бывают плодотворны. Во второй главе (аналитические средства и приемы теории вероятностей) мы прежде всего хотели показать, как подступаются к этим задачам и как их решают. При этом мы получили возможность обсудить на ряде при- меров вопрос о роли переформулировок одного и того же утверждения и выявить столь свойственную теории вероятностей связь между комбинаторным и аналитиче- ским аспектами. Третья глава (самая длинная) называется «Вероят- ность в некоторых задачах классической статистической механики». Эта глава дополнена двумя лекциями Г. Е. Уленбека об уравнении Больцмана (приложение I). Очень удачно, что мы смогли поместить в нашей книге столь прозрачный обзор физических идей, господствую- щих в этой трудной и важной области, и заручиться сотрудничеством столь выдающегося авторитета в этих вопросах. Наша третья глава в значительной степени является последовательным комментарием к некоторым вопросам, затронутым в первой лекции Уленбека, и хотя содержание этой главы независимо, мы очень советуем читать ее вместе с этой лекцией. Вторая лекция Уленбека подводит читателя к гра- нице наших сегодняшних знаний и ставит его перед обширной областью, где возможности дальнейших от- крытий почти неограниченны. Однако я обязан Уленбеку значительно большим. Почти вся третья глава написана под прямым или кос- венным влиянием наших с ним бесед и переписки, длив- шихся в течение почти пятилетней дружбы и научного сотрудничества. И удовольствие, с которым я приношу ему благодарность, заставляет меня полностью забыть те муки, с которыми я писал и переписывал эту главу.
Предисловие 11 В четвертой главе (интегрирование в функциональ- ных пространствах) излагается действительно новый способ исследования задач классического анализа и фи- зики. Эти фундаментальные идеи были выдвинуты в на- чале двадцатых годов Н. Винером и с несколько другой точки зрения Р. Фейнманом в 1942 г. Наши собствен- ные исследования возникли под сильным влиянием ра- бот Фейнмана, хотя в чисто математическом плане мы опирались на строго установленные свойства меры Винера в пространстве непрерывных функций. Подход Фейнмана к нерелятивистской квантовой ме- ханике настолько изящен и нагляден, что мы просили доктора А. Р. Гиббса прочитать специальную лекцию (приложение II), чтобы ознакомить семинар с этим ме- тодом. Мы крайне признательны А. Р. Гиббсу за по- мощь. Читатель может подождать появления книги Фейнмана и Гиббса, целиком посвященной этому важ- ному и захватывающему предмету. Со своей стороны мы в четвертой главе сосредото- чили внимание на выявлении возможностей интегрирова- ния в функциональных пространствах как метода ре- шения задач, не имеющих на первый взгляд ничего общего с вероятностями или мерой в функциональном пространстве. Когда в 1948 г. впервые было строго установлено соответствие между уравнением Шредингера и средним от некоторого функционала по пространству непрерыв- ных функций (идея, навеянная работой Фейнмана), нами была задумана определенная программа. Эта про- грамма состояла в том, чтобы изучить аналитические свойства некоторого класса дифференциальных и инте- гральных операторов, связав их со средними значениями от определенных функционалов по подходящему про- странству функций. Краткое ее изложение дано в на- шей статье <Оп some connections between probability theory and differential and integral equations» (Proc. Sec. Berkely Symp. in Math. Stat, and Prob., 1951). Важ- ная часть программы (касающаяся асимптотики собст- венных значений уравнения Шредингера) была выпол- нена Д. Рэем в 1953 г. Мы указываем здесь также на
12 Предисловие возможности применения метода функционального инте- грирования в классической теории потенциала. За последние годы появилось много статей различ- ных авторов, касающихся некоторых вероятностных ас- пектов теории потенциала и смежных задач. Эти статьи следуют другому пути: авторы стремятся главным обра- зом к окончательной общности вероятностного истолко- вания, а не к использованию вероятностных методов как руководства к открытию, пониманию и доказательству определенных фактов из анализа и физики. Хотя в узком техническом смысле наши результаты являются, может быть, частными случаями некоторых более поздних и общих теорий, мы предпочитаем вычис- ления и формулы словесным доводам, основанным на тонком (но утомительном) использовании теории меры; потеря же общности с избытком вознаграждается яс- ностью и конкретностью. Эта книга возникла из записи лекций и сохранила их свободный стиль. То, что научная книга столь ради- кально отступает от пресловутого «Введения в теорию слонов» («Einfiihrung in die Elephantenlehre»), произо- шло в значительной степени из-за отвращения автора к увесистым заумным трактатам. Если я слишком пере- гнул в другую сторону, то надеюсь, что читателю по крайней мере будет все понятно. Многие друзья и коллеги всячески помогали мне в работе над книгой. А. Иоффе помогал в составлении пер- воначальных мимеографических записей; Дж. Риордан значительно помог мне советами и с выдержкой и тактом исправлял мои погрешности в английском языке. Наи- большую благодарность я приношу Г. Кестену, который критически просмотрел большую часть рукописи и ис- правил там потрясающее количество ошибок. Я особенно благодарен участникам встречи в Боул- дере, чье неизменное внимание и неиссякаемый интерес к предмету служили для меня постоянно ободряющим источником, и, наконец — но не в последнюю очередь,— я благодарю сотрудников издательства Interscience Pub Ushers за их замечательное содействие. Марк Кац Итака, Нью-Йорк
ГЛАВА I ТЕОРЕТИКО-ВЕРОЯТНОСТНЫЙ СПОСОБ РАССУЖДЕНИЯ 1. Что превратило теорию вероятностей в особую науку? Она, несомненно, является ветвью анализа и в уз- ком смысле ветвью теории меры. В своей наиболее руди- ментарной (и часто наиболее трудной!) части она свя- зана с комбинаторикой. Однако все это далеко не исчерпывает содержания теории вероятностей, и вряд ли возможно определить ее точное место и границы. Поэтому мы не будем даже пытаться установить, что такое теория вероятностей. Вместо этого мы покажем, что можно из нее извлечь. Чтобы облегчить изложение, мы предлагаем очень общую (и, следовательно, почти тривиальную!) схему, которая встречается во всех теоретико-вероятностных рассуждениях. Эта схема предполагает, что задано некоторое мно- жество S (называемое «выборочным пространством») и выделено семейство F его подмножеств (называемых «элементарными событиями» или «элементарными мно- жествами»), которым заранее приписаны их меры. Кро- ме того, постулируется ряд правил, с помощью которых меры (или, что то же самое, «вероятности») могут быть вычислены для других подмножеств из S. В классической теории вероятностей приняты сле- дующие правила: 1. Если обозначить через ц меру, то P(S)=1, р(0) = О (0 — пустое множество). 2. Если множества Вп попарно не пересекаются (т. е. BtftBj = 0, i&j) и измеримы(т. е. р(Вп)определены),
14 Г лава I ТО и (У2 * * 5-)=21* (Я-)- Обычно допускаются счетные суммы множеств (впол- не аддитивная мера), но в некоторых интересных слу- чаях (замечательный пример дает теория чисел) допу- стимы только конечные суммы множеств. 3. Если некоторое множество В измеримо, тр и его дополнение S\B измеримо. 4. Если р.(С) =0 и ВсС, то р(В) =0. Последний постулат не является общепринятым, но мы не станем здесь это обсуждать. Само собой разумеется, что первоначальное задание меры (вероятности) на элементарных множествах (со- бытиях) должно быть согласовано с перечисленными правилами. Может показаться удивительным, что столь «тощая» схема служит основанием богатой и плодовитой теории, однако на деле это богатство и плодовитость возникают в значительной мере за счет выбора специальных мно- жеств и специальных мер. Выбор множества S, так же как и выбор в нем се- мейства элементарных событий и задание меры, зави- сит каждый раз от условий рассматриваемой задачи. Теперь мы хотим на ряде примеров проиллюстриро- вать способ рассуждений, принятый в теории вероятно- стей. 2. Пример 1. Рассмотрим одноатомный идеальный газ, состоящий из N молекул с массой т и находящийся в тепловом равновесии. Пусть Vi, v2...Vjv — векторы скоростей молекул в некоторый момент времени. Мы хо- тим найти вероятность того, что значение абсциссы vix вектора v< заключено между числами а и 0; обозначим эту вероятность, как принято, (1-2.1) Р (®< vlx < ₽). Сейчас мы переведем эту задачу на точный матема- тический язык. Под идеальным газом понимают газ, в котором можно пренебречь силами взаимодействия ме«
Теоретико-вероятностный способ рассуждений 15 жду молекулами. Отсюда, если обозначить полную энер- гию такого газа через Е, мы получим соотношение ОС (1.2.2) v’+v’+...+v^=f (v5 = vrv,). Естественно допустить, что энергия Е пропорцио- нальна N, т. е. (1.2.3) E = xN, где х не зависит от N. Состояние газа определяется набором векторов v„ v2, .... vN и может быть изображено точкой (»ix, vlv, Vu, ..., vfx, v(v, vit.vNx, vNy, vNt) на по- верхности ЗЛ-мерной сферы S3n(R) радиуса Интересующее нас событие а<счя<0 определяет очень простое множество на поверхности сферы S3N [(•^-)А] (такое множество называется сферической зоной). Таким образом, выборочным пространством S в на- шем случае служит поверхность сферы S3N I -^-1 , и мы должны теперь задать в этом пространстве меру. Выбор этой меры продиктован нашим предположением о тепловом равновесии в газе. Мы просто примем (это эквивалентно определению теплового равновесия), что мера ц(В) элементарного множества В равна отношению п zo\ Площадь множества В (1.2.0) |*(Я)— г/2«У\%1 ‘ Площадь поверхности S3N 11 I В качестве элементарных множеств мы можем взять, например, фигуры, ограниченные дугами больших кру- гов (сферические многоугольники). Семейство элементарных множеств должно быть все- гда достаточно богатым, чтобы мы имели возможность, пользуясь постулатами теории меры, распространить
16 Г лава / меру (вероятность) на широкий класс «интересных множеств (событий). В рассматриваемом случае интересным для нас мне жеством является сферическая зона а<о1Х<0. Итак, задача нахождения вероятности Р {а < vix < 0 сводится к простому геометрическому вычислению плс щади сферической зоны. Ответ хорошо известен и выра жается формулой (I. 2.6) Р{«< «/,<₽) = mx2^(3TV-3) кт I х|(ЗЛГ-3) 2*н) dx В пределе при Л/->оо получаем (I. 2.7) lim Р (а < vix < р) = N->jo exp 3 mx1 2 2x Это приводит нас к известной формуле Максвелла, если положить (I. 2.8) ЗАТ х— 2 • где k — универсальная постоянная и Т — абсолютная температура. С чисто математической точки зрения этот пример слишком примитивен, поскольку интересующее нас мно- жество случайно оказалось очень простым. Следующая задача более тонкая. Рассмотрим долю, которую составляют молекулы с абсциссой скорости, заключенной между аир. Какова вероятность того, что эта доля отличается от вычислен- ной нами вероятности Р {а < vlx < 0} более чем на е>0? Если обозначить через (х) функцию, принимаю- щую значение 1 на интервале а<х<0 и 0 вне этого интервала, то интересующее нас множество onреде-
Теоретико-вероятностный способ рассуждений 17 ляется неравенством Это уже достаточно сложное множество, и вычислить его меру намного труднее. Не вдаваясь в подробности, заметим только, что, даже не вычисляя точного значения вероятности собы- тия (1.2.9), легко доказать, что для любого е>0 она стремится к нулю при N->oo (это пример «слабого за- кона больших чисел»). Необходимо иметь в виду, что этот вывод следует пока только из основного предположения (1.2.5). Тем не менее то обстоятельство, что вероятность события (1.2.9) мала, нас радует, поскольку мы придерживаемся интуитивного истолкования вероятности как частоты, а сформулированная выше теорема, по-видимому, служит опорой нашей интуиции. В сущности, как это ни обидно, в этой теореме не так уж много содержания. В ней говорится фактически сле- дующее: если вероятность Р некоторого события вычис- лена в соответствии с определенными допущениями и правилами, то мала вероятность (снова вычисленная с помощью тех же допущений и правил) того, что частота, с которой это событие встречается в большом числе испытаний, будет значительно отличаться от Р. Как ни скромно такое утверждение, но в основном это все, что можно ожидать от чисто математической теории. Применима ли такая теория в естественных науках, в конечном счете решается опытом. Но это в равной мере относится ко всяким применениям математической теории за пределами самой математики, и смутное ощу- щение неудобства, которое многие (большей частью фи- лософы) испытывают, впервые сталкиваясь со статисти- ческими рассуждениями, следует приписать сравнитель- ной новизне идей. Для меня не существует методологического различия между возможностью применять дифференциальные 2 М. Кац
18 Г лава / уравнения в астрономии и теорию вероятностей в термо- динамике или квантовой механике. Она работает! И хотя в такой точке зрения много грубого прагматизма, лучшая еще не найдена. 3. Пример 2. Сколько в среднем вещественных кор- ней имеет полином (1.3.1) ... 4-a„_xtn с вещественными коэффициентами? Как и раньше, чтобы придать этому вопросу точный смысл, мы должны установить, как понимать выраже- ние «в среднем». Среди необозримого количества воз- можных толкований мы выбираем следующее, аналити- чески самое простое. Каждому полиному вида (1.3.1) мы сопоставим точку (или вектор) л-мерного пространства (а0, Я|,..., ап_|) =а и рассмотрим только те полиномы, для которых эта точка лежит на единичной сфере Sn(l): (1.3.2) 1^112=24=1. о Число вещественных корней полинома (1.3.1) обозна- чим через Л/(a) =N(a0, ait ... ,an-i). Условимся теперь для полиномов со свойством (1.3.2) средним числом корней считать ('3-3> таит s„m где (1.3.4) |5я(1)|=(2к)я/2/г(|) — площадь поверхности единичной сферы, a da — эле- мент этой поверхности. Таким образом, выборочным пространством в нашем случае является сфера Sn(l), а мерой — обычная мера Лебега (нормированная) на ее поверхности (т. е. та пло- щадь, которую можно чисто геометрически определить на поверхности n-мерной сферы). Мы можем сформулировать задачу несколько более удобным способом.
Теоретико вероятностный способ рассуждений 19 Рассмотрим интеграл (1.3.5) М„ = = (2«)"я* f ... J N(a)exp(-|||a||J)da0 ••• ^„-1 и заметим, что для каждого вещественного числа а =£0 мы имеем Л/(аа) = JV (а). Перепишем (1.3.5) в виде Л1я = (2к)-Я/2Jexp(-1r2)[ f N(a)da,\dr о ' I Sn(n J и заметим, что N (a)dor=rn~l J N(a)do. snw snw Отсюда получим (1.3.6) Af/, = TS_^yr J N^}do, snw поскольку |S,(1)1 (2к)-я/2 f r«-*exp(-4)^=l. 0 Формула (1.3.5) показывает, что мы могли бы в ка- честве выборочного пространства S взять n-мерное ев- клидово пространство, а меру произвольного множе- ства В определить так: (I. 3.7) |*(В)=(2к)-я/2/ ... f ехр(-1||а|^ао---^я-1. в Такая формулировка в терминах, более привычных для теории вероятностей, означает, что коэффициенты полиномов независимы и каждый из них распределен нормально с нулевым средним и единичной дисперсией. Обозначим через ЛЙ* и Л^2' соответственно средние значения числа вещественных корней, заключенных в интервале (—1, 1) и лежащих вне этого интервала. 2*
20 Г лава I Сначала мы покажем, что (1.3.8) = и, следовательно, (1.3.9) М, = 2ЛС Для доказательства равенства (1.3.8) заметим, что по- П —1 лином 2а»? имеет в интервале (—1,1) столько же и л-1 вещественных корней, сколько полином 2ая-1-л** вне о л-1 л-1 этого интервала, так как ал-1-а (т) *)• о о Обозначая через N'(a0, alf ..., an-i), соответственно №(а®, а», ...,an-i), число вещественных корней поли- л—1 нома внутри, соответственно вне, интервала (—1,1), получаем отсюда равенство ^’(Оо, alt ...» а„_1) = ^2>(ая_1, а„_2.....ай). Следовательно, +оо +QO М(я1’ = (2к)-Л/2 J ... j ^»(ао, а,...ая_,)Х —СО —со Xexpj—yllaIPpao ... +оо +со = (2к)-я/г f ... f N«>(ao, а„ .... ая_,)Х —СО —со Xехр(—y||a||2)dao... dae-i=M^. ) Здесь, конечно, предполагается, что свободный член полнно- Л-1 ма Е а*/* отличен от нуля, т. е. среди его корней нет нуля. Полн- о номы, у которых Оо=0, образуют множество меры нуль, — Прим, перев.
Теоретико-вероятностный способ рассуждений 21 Теперь мы вычислим Л!(я1). Для этого нам понадобится следующая лемма. Пусть функция f(t) непрерывна на отрезке а непрерывно дифференцируема на интервале a<t<b и имеет конечное число стационарных точек (т. е. таких точек на (а, Ь), где производная /'(/) обращается в нуль). Тогда число нулей функции /(/) на интервале (а, &), которое мы обозначим через п(а, b\ f), опреде- ляется формулой оо b (I. 3.10) п(а, Ь\ /) = (2к)-1 f ft f cosh/(O]IZZ(/)|dt. -оо а При подсчете п(а, b\ f) кратный нуль считается один раз, а нуль, совпадающий с а или Ь, считается за «пол- нуля» [т. е. дает вклад в л (а, Ь; /), равный */2]. Докажем лемму. Обозначим стационарные точки функции f(t) через си, а2, .... аА; а=а0 ^а|<а2< ... ... <ak^.ak+i = b. Имеем * * 7+1 J COS h/(/)| I/' (/)I dt = 2 J cos [V (01 \f (01 dt = a /=0 «. k 7+i = 2 ± f coslkf (t)]f'(t)dt I = JaO в. /-о Знак «+» выбирается для участков, где функция /(/) возрастает, знак «—»— для участков убывания функции /(/). Таким образом, получаем оо b (2k)"1 fdlf со8[</(01|/'(0|Л = —оо a k 00 «=£• ± (2k)"1 J|[sin$/(ay+1)-sine/(ay)]^ = 7=0 — oo A = 2 7 IsiSn f (“/♦ i) — sign/(«/)l } = «(«. b\ f). j-o
22 Глава I Пусть теперь а = — 1, b = 1 и п—1 /(0 = 2«Z- Имеем со со со М^ = ^)-п,г f ... f ехр(—-^-Hall2) (2ir)-1 f diX —00 —co —co 1 X J COS [!•/ (011/' (t)I dt da. ... da„_v -i Нетрудно показать, что порядок интегрирования можно изменить ’); это дает: (1. 3.11) М” = (2k)"1 f dt Jd\Ra (?, t), —1 —co где co co (1.3.12) /?„G. 0 = (2к)-яЯ f...f exp(-|||a||2)x X COS I ;/(01 |/z (01 da0 ... da„_j. Чтобы завершить вычисления, мы воспользуемся фор- мулой со |у | =it-1 J* (1 — cos 7]у) ->]~2d->] —СО и получим (1.3.13) /?„(?, о= со ______ со со = «-* J Jj-2 di) V(2ic)~" J... Jexp(—yllall2) х X {cos [5/ (0] — cos |?/ (Ol cos Inf' (Oil dao... da„_t. ') Доказательство хотя н простое, но не вполне тривиальное. Мы его опускаем, поскольку для наших целей оно имеет лишь вто- ростепенное значение.
Теоретико-вероятностный способ рассуждений 23 Заметим теперь, что cos{;/(/){ cos [V' (/)! = 7 Re {exp i {'/(/) + V' (*)] + + exp/{;/(/)— Vz(01} и, следовательно, CO co (2л)""2 f ... f exp(—yi|a|p)cos^/(n|cos[n/z(^)lrfao--- — QO —oo X> 00 ...da,,_1 = lRe(2n)-''/2/... Jexp(-|||a||2)x —CO — 00 + da0 da„-i = + exp Полагая т) = 0, получаем 00 u- (2л)-я/г f ... f expf-lllalpjcos^/WIrfao ... dan_^ —oo Возвращаясь к формуле (1.3.13), после нескольких про- стых преобразований находим со | л—1 (1.3.14) /?„(£, 0=л"1 Jr2 exp - —со IL о — exp где интеграл понимается в смысле главного значения.
24 Г лава I Введем обозначения А„ U)= 't'^, О п-1 с,(/)=2й“-2, 1 п-1 вп (/)=2^2ft-1; 1 подставляя выражение (1.3.14) в (1.3.11), мы придем после элементарных интегрирований к формуле -1 = 2я- rKCOCOT-tf.cf J лп (О о или окончательно (1.3.15) м. = 2М<»=4п-|!1-,“(,>С-<У-,<)1\(. J V/ О Из этого выражения нетрудно вывести асимптотиче- скую формулу (1.3.16) Л1„ ~2л-1 log л, л->эо. Читателю может быть интересно, насколько резуль- тат (1.3.16) зависит от выбранного нами определения среднего (1.3.5) или (1.3.3). Если Мп определяется формулой Ma = 2~n f... f N^)da0...dan_y (в обычной для теории вероятностей терминологии это соответствует предположению, что коэффициенты много- члена независимы и распределены равномерно на от-
Теоретико-вероятностный способ рассуждений 25 резке [—1, 1]), то снова выполняется асимптотика (1.3.16), однако ее доказательство значительно услож- няется. Как недавно показали Эрдёш и Оффорд, асимпто- тика (1.3.16) остается в силе, даже если положить Я = 2-"2^(±1, ±1..........±1), т. е. считать, что коэффициенты принимают лишь два значения +1 и —1 и что всем последовательностям ±1, ±1, ..., ±1 приписаны равные веса (2-п). Нас радует, что асимптотика (1.3.16) так нечувстви- тельна к изменениям исходных предпосылок; в этом в известной мере выражается тенденция вещественных полиномов к относительному уменьшению числа веще- ственных корней с возрастанием степени. Предыдущий пример очень поучителен: он показы- вает, какие замечательные возможности таятся в стати- стическом подходе к задачам, которые при индивидуаль- ном подходе неразрешимы. Определить число вещест- венных корней отдельно взятого вещественного много- члена степени 10е — почти безнадежная задача. Тем не менее можно высказать содержательные утверждения относительно совокупности всех вещественных полино- мов степени 10е. Мы видим здесь в миниатюре одну из наиболее пло- дотворных научных идей — идею, которая пронизывает всю современную науку и которая привела к наиболее поразительным достижениям в статистической механике. Вернемся снова к нашей первоначальной формули- ровке [вектор а=(а0, а», ..., an-i) равномерно распре- делен на поверхности единичной сферы Sn(l)]; тем же способом, что и выше, можно показать, что среднее чис- ло вещественных корней, лежащих в промежутке (а, 0), которое мы обозначим </Vn(a, 0)), равно ₽ (Na (a, р)> = л-i f [1 - Л2Я (Л]'А (1 - Z2)"1 dt, а где ha(t) = nt'"'(\ — /2)(1 -/2я)-1.
26 Г лава I Отсюда видно, что функцию Ря(/) = л-1 [1 — Лл(/)1'А(1 — Z2)"* можно считать «средней плотностью» вещественных кор ней. График Рп(0 (рис. I) наглядно показывает, что ве- щественные корни с ростом степени резко сгущаются вблизи +1 и —1. Можно хорошо ощутить, насколько сильно такое сгущение, если заметить, что Рп (+ 1) = Рп (- 1) = К*2 - 1 )/12]у* ~ п/2к /3, в то время как общая площадь, ограниченная кривой Pn(t), асимптотически равна 2n-1logn. Рис. 1. Это наблюдение полностью согласуется с нашей ин- туицией, поскольку в исходных наших определениях подразумевается, что в среднем все коэффициенты Ok — это величины, грубо говоря, одного и того же по- рядка и, следовательно, корни многочлена ••• +ал-1^я должны быть близки к +1 или —1; в противном случае было бы трудно добиться уничтожения всех членов. Мы видим здесь убедительное подтверждение давних слов Лапласа: «Вероятность — это здравый смысл плюс точность». 4. Пример 3. Пусть и (л) означает число простых делителей натурального п с учетом их кратностей [т. е. и(20) =и(22-5)=2+1=3] и v(n) — число простых дели- телей без учета кратностей [т. е. v(20) =v(22-5) =2]. Ка- кова «вероятность» рд того, что <о(л) — v(«) =k?
Теоретико-вероятностный способ рассуждений •п Выборочным пространством S здесь служит множе- ство натуральных чисел 1, 2, 3, ..., а мерой (или вероят- ностью) множества В — его обычная плотность. Плот- ность определяется следующим образом: обозначим через Dn(B) число элементов множества В среди пер- вых W целых чисел; плотность D(B) ( = р(В)) задается тогда формулой И (В) == D (В) = lim Dn (B)/N, N -> OQ разумеется, в предположении, что этот предел суще- ствует. Плотность не является вполне аддитивной мерой; это означает, что если В представляется в виде суммы счетного числа попарно непересекающихся множеств: B=£jB/ (В{ПВ,= 0, i*j), то плотность множества В может оказаться и не равной сумме плотностей множеств В,-. [Например, все про- странство S, имеющее плотность 1, является счетным объединением множеств В<, каждое из которых состоит из одного целого числа j(Bj={«}); ясно, что плотность любого В{ равна нулю] Это обстоятельство усложняет некоторые рассмотрения и требует известной осторожно- сти при применении теоретико-вероятностных методов к задачам теории чисел. Пусть plt р2,... — простые числа (pi=2, р2=3 и т.д.). Напишем разложение Л=ра.(я)рО»(«) ; оно определяет функции он (п), аг (л), ... . Рассмотрим теперь множество целых чисел, для ко- торых одновременно ai(n)=kt, од(л)=А2, ar(n)=kr. Все такие числа представимы в виде (1.4.1) п =p*i... p*rm, где m не делится ни на одно из простых чисел Рь Рг, ...» Рг.
28 Г лава / Для того чтобы узнать, сколько целых чисел, мень- ших N, представимо в виде (1.4.1), достаточно найти, сколько целых чисел, меньших чем не делится ни на одно из pi, .... рг. Но число целых чи- сел, меньших М и не делящихся ни на одно из простых plt рг, .... рг, асимптотически (при М-*«>) равно «П(' - 7-) /=1 \ (это просто доказывается с помощью классического ре- шета Эратосфена) '). Отсюда вытекает, что (1.4.2) Р{а1(л) = А1.«,(*) = *,} = П4;(1—г)- /=1 Р/ ' Формулу (1.4.2), чтобы лучше раскрыть ее смысл, мы перепишем в виде двух формул: (1.4.3) Р{ау(л) = Ау}= 1 Р/ v ' (I. 4.4) D {а, (л) = а,(л) = kr} = Д D {«, (л) = kt}. Представление (1.4.4) плотности в виде произведе- ния особенно примечательно: оно выражает то обстоя- тельство, что функции at (л), аг(п), .... аг(п) статиста- ') Для читателя, не знакомого с теорией чисел, мы приводим набросок доказательства. Пусть для простоты у нас три простых г *, ГМ1 ГМ1 числа pi, р», рз- Среди первых М чисел найдется — I. — I, — I Р\ .1 I Рг । I Рз J чисел, делящихся соответственно на р(, pt и рз ([а] — наибольшее \ z— Г м 1 г м 1 целое, не превосходящее а). Существует также ---------1,1------1, L PiPa J L PiPa J Г м 1 ------ чисел, делящихся соответственно на pipa, pips, papa. и, L РаРз J Г М 1 _ наконец, ------- чисел, делящихся на PiPaPs- Таким образом, чис- L PiPtPa J
Теоретико-вероятностный способ рассуждений 29 чески независимы-, именно в этом заключена возмож- ность применения обычных методов теории вероятно- стей к задачам теории чисел, которые на первый взгляд никак не связаны со случаем, независимостью и другими вероятностными понятиями. Чтобы перейти к нашей задаче, мы введем функции рА(л) при помощи формулы д/ч —h если аА(л)>1, Рл(Л) I О, если и заметим, что (1.4.5) = k Читатель может легко проверить, пользуясь форму- лой (1.4.4), что функции рА(л) также независимы, т. е. (1. 4.6) D {₽, (л) = kx.(л) = kr\ = Д D (₽,(п) = kt\. Заметим еще, что 2* (2ic)-1 J exp (— ZU) exp [ZB (<*> (л) — v (л))] ft = о {1, если ш (л) — v (л) = k, О, если ш (л) — » (л) k. ло тех чисел, которые ие делятся ни на одно нз pi (i=!, 2, 3), рав- но, как нетрудно сообразить, Г Af 1 _ Г Af 1. + L PtPs J L PiPtPz J ’ Г Af 1 Al . , при M ->оо имеем -j- -д- (л фиксироваио), и, следовательно, указанное число равно А1Г1—L__L_±+_l_+_2_+_!___________________—1 = L Pi Pi Pi PiPi PlPi PiPi PiPiPi J 3 -*п(*-Я >1 i' — Поим, nepee.
30 Г лава I Обозначая через Rk(N) число целых чисел, не превос- ходящих N, для которых и(л) —v(n)—k, мы видим, что 2я ^(^7V-I = (2«)-1 f exp(-M)W-1X о х 2 ехР — v («) И Л«1 Если мы сможем доказать, что N (1.4.7) lira N~' S exp (ш(п) - -»(л))] N jo л=1 существует для каждого вещественного £, то, обозначив этот предел через Г(£), мы получим (используя теорему Лебега о сходимости ограниченной последовательности функций) 2ж (1.4.8) Pft= lim /?Jk^)№I = (2ic)-' f exp(—ZU)F(t)dB. лг-*“ о Независимость функций рА(л) [выражаемая форму- лой (1.4.6)] позволяет ожидать, что 11m АГ* 2 ехр [Z? (ш (л) — v (л))] = JV->co л-1 N = lim N-1 2 ехр Г« 2 ₽*(«)]- д«1 L * J оо /V = п Нт АГ* 2 ехр («₽*(«)], Ав! N+х л-1 и поскольку, как легко проверить, lim Af1 V ехр [Д0А (л)] = ^Г1
Теоретико-вероятностный способ рассуждений 31 мы могли бы также ожидать, что (1.4.9) ™ = Ц(1-^)[1+7-^]. Будь плотность вполне аддитивной, равенство N (1.4.10) lim N~' 2 exp |Д 2 ₽»(«)! = /V->00 л«1 h 00 /V = П Нт АГ* s ехр [Др» (»)] jV->oo л«1 тривиально следовало бы из независимости функций рА(л) [формула (1.4.6)]. Но это не так — плотность не обладает полной аддитивностью, поэтому равенство (1.4.10) следует проверить. К счастью, оно проверяется совсем легко. Положим Lr(n)= S р»(л) k> г и заметим, что 2 (л) = 2 2 Р» (fi). л=1 Л > г л = 1 Вспоминая, что рй(л) = /-1 (/>2) для тех п, которые делятся на р* и не делятся на р*+1, мы видим, что /V оо s р. w=,§</-1) (m -1 п/я 11 ([х] означает, как обычно, наибольшее целое число, не превосходящее х), следовательно, N ос- 2 Р* (Л) < 2N 2 (Z - 1)/Pi = 2N/(pa - iy. rt=l /=2 Отсюда AT* %Lr(n)< S(P»-1)-2 = 8, «=1 k>r и о, —>0 при г->эо.
32 Глава I Теперь мы можем написать (1.4.11) N N | ЛГ1 2 ехр (ft 2?» (я)') — N~' S ехр (ft S ?*(»)] < /1=1 \ Л / л= I \ Кг /I N 2 |exp(ft£,(n))-l| < ^ЛГ1 2 £,(л)<Л|;|. л=1 н=1 и из независимости 0* [см. (1.4.6)] вытекает, что для каждого фиксированного г lim N"’У exp/ft У0Л(л)\ = \ * / г N = ТТ lim №* У ехр (/•;?*(«)) = * = 1 /1 = 1 = П (1 — к) (1 + Р* —ехр ft) • *=1 Из оценки (1.4.11) и из того, что б,.-►О при г->оо, сле- дует, в силу сходимости бесконечного произведения Й(1 ~ Рл)(1 Р*--expft ) * Л=1 равенство (1.4.10). Таким образом, мы обосновали (1.4.10), а также формулу [см. (1.4.8)] (1. 4.12) 2х Рл = (2к)"’ f ехр(-/Г;) JT(1 -у-] [1 + 0 v=l Можно переписать (1.4.12) в эквивалентной форме ОО ^JO (1.4.13) 2^=H(l-s)[1+»^]- *=0 Л=1
Теоретико-вероятностный способ рассуждений 33 Полагая z=0, получаем — тт/i А Ро-Щ1 р2)-я2- Последнее равенство хорошо известно и в нашем случае означает, что плотность чисел, «свободных от квадра- тов» (не делящихся ни на какой квадрат), равна 6/л2. Полагая z= 1, получаем 00 2 р* = 1» Л=0 что просто означает полную аддитивность плотности для множеств Вй = {ш(л) — v(/i) = A}. Соображения, основанные на теории вероятностей, следует применять в подобных задачах с крайней осто- рожностью. Следующий пример (воспроизводимый здесь в назидание физикам, которые известны своим оптимиз- мом при использовании эвристических соображений) ил- люстрирует возможную опасность. Вероятность того, что некоторое целое число не де- лится ни на одно из простых чисел pi, .... рА, равна, как легко показать, /=1 Другими словами, число целых чисел, не превосходя- щих W и не делящихся ни на одно из простых чисел Pi....pk, равно приблизительно (I.4.U) A'n('-i)- /=1 Рассмотрим теперь число целых чисел, не превосхо- дящих W и не делящихся ни на одно из простых чисел, меньших VN. Такими числами могут быть только про- стые числа, лежащие между V~N и У, и их число равно Ж(ЛО—it [мы пользуемся стандартным обозначе- 3 М. Кац
34 Г лава I нием я(х) для числа простых чисел, не превосходя- щих х]. Из (1.4.14) мы немедленно заключаем, что 0.4.15) «(Л0-«(УЭД~Л Pj<VN Но известно (теорема о числе простых чисел), что K(N)~2V/log2V и И 0 ~ 7/) ~ ехр Т)/5 * * * * 10^ = 2 exp (— 7)/log 2V Pj<VN (у — константа Эйлера). Следовательно, из (1.4.15) можно было бы заключить, что 2ехр(—т)=1, а это заведомо неверно. Чтобы читатель не чувствовал себя оскорбленным тем, что его хотят так грубо провести, мы отсылаем его к ряду писем, появившихся в журнале Nature, 148 (1941), 436, 694—695, где несколько авторов были за- няты бурным, но бесплодным обсуждением именно этой проблемы. 5. Пример 4. В нашем последнем примере мы хотим кратко обсудить теорию игры «герб или решетка». Выборочное пространство S в этом случае состоит из всех бесконечных последовательностей вида (1.5.1) Л1, Ajt Л3, где каждое Aj может быть одним из двух символов: Г (герб) или Р (решетка). Элементарными множествами служат множества по- следовательностей, в которых k элементов фиксированы (Л«1, 2, 3, ...). Например, элементарное множество со- ставляют последовательности, в которых первые три эле- мента— это Г, Р, Г (А=3), а также последовательности, в которых 25-м, 27-м и 35-м элементами являются соот- ветственно Р, Р, Г (снова k*=3).
Теоретика-вероятностный способ рассуждений 35 В классической теории орлянки («правильная» мо- нета и бросания независимы) мера, приписываемая эле- ментарному множеству, равна 1/2*, где k — число фиксированных элементов. Рассмотрим все (2П) последовательности длины л: Д], А2, • •., А„. Пусть Nn(a) —число тех из них, в которых количе- ство гербов (Г) отличается от j п по абсолютной вели- чине менее чем на а.у п. Мера множества таких после- довательностей равна 2-%(а). Если обозначить через Нп число гербов (символов Г) в последовательности At, Аг, ... , Ап, то можно написать (I. 5.2) Р {| Нп -1 П | < а УН } = 2-Х (а). Замечая теперь, что Л/П(а) легко выражается через би- номиальные коэффициенты, мы приходим к формуле р{|яя-|/1|<аУ^} = 2-я J] С£. I *_4я I * * В качестве упражнения (впрочем, не такого уж лег- кого) предлагается доказать, используя формулу Стир- линга, что (I. 5.3) lim 2“л п-ьсо Чл С5 = (2к)-'А J ехр(—-g-x2)rfx. |*~1Я|<Л^ -2Я Сравнивая (1.5.2) и (1.5.3), мы получаем (1. 5.4) 2а Jim Р {|ЯЛ—<<х Ул| = (2к)_,/* J ехр(—ух2) dx.
36 Г лава I Обе формулы (1.5.3) и (1.5.4) полностью эквивалент- ны, но формула (1.5.4) подсказывает возможность эмпи- рической проверки. Предположим, что мы подбрасываем нашу монету тп. раз и располагаем результаты наблюдений в т групп по п наблюдений в каждой. Затем мы подсчитываем в каждой группе количество гербов Н„ \ Н„ \ ..., Н{™\ определяем число 1л(т) тех групп, для которых | — у п | < а Уп, и сравниваем полученную частоту (от) от с интегралом 2а (2л)-,/’ J ехр у х2] dx. -1я Если наша теория применима к описанному опыту, мы должны ожидать хорошего совпадения двух этих чи- сел. Случайно, конечно, расхождение между ними мо- жет оказаться и большим, но это можно приписать «злой судьбе». Если же большие расхождения возни- кают чаще, чем предсказывает теория, то это все еще может быть и от «злой судьбы», однако при этом воз- никают вполне оправданные подозрения, заставляющие нас пересмотреть исходные предпосылки. Мы можем обнаружить, что наша монета неправильная или что спо- соб ее бросаний вызывает сомнения в их независимости. Читатель, несомненно, заметил, что в формулировке теоремы (1.5.4) мы не использовали нашего выбороч- ного пространства S всех бесконечных последовательно- стей 41, Аг, Аз, ... . На самом деле нам нужно было только пространство всех конечных последовательностей At, .... Ап- Переход к пределу при п->оо здесь срав- нительно безобиден: он требует рассмотрения не «бес- конечномерного» пространства S всех последовательно- стей, а лишь последовательности «конечномерных» про- странств, в каждом из которых теория меры совершенно тривиальна.
Теоретико-вероятностный способ рассуждений 37 Зачем в таком случае вообще говорить об S? Для этого имеются вполне убедительные доводы. Мы мо- жем, например, поставить вопрос, какова вероятность р||1т~=₽| или, другими словами, какова мера множества тех бес- конечных последовательностей, для которых предел Нп/п существует и равен ₽. Чтобы ответить на этот вопрос, мы должны по- строить меру на множестве S, согласованную с мерами, заданными на элементарных множествах. Это можно сделать следующим образом. Если вме- сто Г всюду писать 1, а вместо Р ставить 0, то каждая бесконечная последовательность At, А2, ... запишется в виде последовательности ei, ег, ... из нулей и единиц. Сопоставим теперь каждой такой последовательности ве- щественное число t — 2 1е1 -|- 2 2е2 -|- 2 Зе3 + .... Тем самым выборочное пространство отобразится на интервал 1. Это отображение не является взаимно однозначным; так, например, последовательности 1, 0, 0, ... и 0, 1, 1, ... перейдут в одно и то же число, а именно ‘А- Тем не ме- нее множество всех таких чисел (соответствующих двум разным последовательностям) счетно (оно состоит из двоичного-рациональных чисел, т. е. чисел вида г/24, где г и s — целые положительные), и мы можем вообще не принимать его во внимание. Элементарные множества отображаются при этом в объединения конечного числа попарно непересекающихся интервалов с двоично-рацио- нальными концами, и, кроме того, мера каждого эле- ментарного множества совпадает с суммой длин интер- валов, в которые оно отобразилось. Таким образом, чтобы построить нужную нам меру в S, достаточно построить меру на интервале (0,1), со- гласованную с определенной выше мерой элементарных множеств. Ясно, что такой мерой является обычная мера
38 Г лава I Лебега на этом интервале. Теперь мы в состоянии пере- вести поставленный вопрос на более привычный язык. Напишем t = + ... и рассмотрим множество тех t [в интервале (0,1)], для которых цт ••• ~Ь»л(О о п-»оо л Теперь наша задача — найти меру Лебега этого мно- жества. Для этого заметим, что функции еД/), ег(/), ... не- зависимы, т. е. Н {е*. (/) =’ll. £*,(/) = Ъ.е*г (/) = ’1Г} = 2",= =ДН,*/(/) = 1И < А2 < ••• <U где р — обычная мера Лебега и каждое T]j принимаеп значение либо нуль, либо единица. Введем вспомогательные функции r{(t) г,(/)=1-2в,(/) и заметим, что они также независимы; следовательно, 1 г 1 J г (/)... г (<) Л = П f г>, ">л “ °- О ) = \ о ' Теперь легко видеть, что поэтому л=1 о dt < со. 1
Теоретико-вероятностный способ рассуждений 39 В силу известной теоремы') из теории меры Лебега ряд со Гл *14 Sow Л=1 I 1 I сходится почти всюду, т. е. всюду, кроме множества меры нуль. Отсюда a fortiori SM0 lim-*—— = 0 и. всюду, кроме множества меры нуль, или, другими сло- вами, и Мы встретились здесь с простейшим случаем «уси- ленного закона больших чисел». Выражаясь несколько вольно, мы можем сказать, что «усиленные законы» относятся к мерам в «бесконечно- мерных» пространствах, в то время как «слабые за- коны» [например, (1.5.4)] формулируются в терминах «конечномерных» пространств возрастающей размерно- сти. По моему мнению, большинство «усиленных зако- нов» имеют лишь математический интерес. Как только мы переходим к применениям теории вероятностей (осо- бенно в физике), наиболее интересными и важными оказываются «слабые законы». В связи с этим в даль- нейшем мы не будем заниматься «усиленными зако- нами». ') Здесь имеется в виду следующая теорема: если /п(0>0 и ОО 1 ряд 2 J*сходится, то функциональный ряд S/«(0 п«1 О Я=1 сходится почти всюду, т. е. за исключением множества меры нуль.
40 Г лава I Читателю должно уже стать ясно, в чем состоит тео- ретико-вероятностный способ рассуждений: частные яв- ления включаются в совокупность подобных им явле- ний, и утверждения об этих индивидуальных явлениях заменяются утверждениями о всей совокупности. Я не могу не привести еще один пример, простой и поучительный. Это задача, восходящая, я полагаю, к Фреше, о нахождении максимума определителя АЯ=1Ы. Л/=1, 2...........п, где все ец равны ± 1. Обычная оценка Адамара дает max | Ад К п1,я. и задача (до сих пор не решенная!) состоит в том, что- бы определить, когда в действительности достигается эта верхняя граница. Статистический метод немедленно приводит к неко- торому результату. Определим е(х), 1, так: е(х) = Имеем [полагая еи=е(Х{,)] тах|Ая|> f ••• /А» Hdjc‘j 0 0 l,J = l и простое вычисление дает Отсюда 2 УШ < max |АЯ |< п2 ". 1 1 я f ••• J 0 0
Теоретико-вероятностный способ рассуждений 41 На самом деле можно продвинуться дальше, используя неравенство тах|Д„|> f • • • f Л» П dx4 .0 о I, ] = 1 1 1 л и получить более точную оценку снизу. Если перейти от 4 к 6, 8 и т. д., то, возможно, в прин- ципе и удастся найти тах|Дп| точно, однако вычисления становятся (безнадежно?) трудными. Тем не менее пре- имущества, возникающие от рассмотрения всей сово- купности определителей, очевидны.
ГЛАВ* II НЕКОТОРЫЕ АНАЛИТИЧЕСКИЕ СРЕДСТВА И ПРИЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ 1. В этой главе мы подробно разберем несколько за- дач, с тем чтобы проиллюстрировать ряд аналитических приемов, используемых в теории вероятностей. Мы нач- нем с задачи о случайном блуждании, представляющей самостоятельный интерес. Точка, выходя из начала координат, движется по плоскости шагами длины единица. Направление А-го шага выбирается случайно, причем так, что угол, кото- рый оно образует с направлением предыдущего шага, распределен с плотностью вероятности р(а) (—л < а< <л). В качестве нулевого направления выбирается по- ложительная полуось х, а последовательные углы ai, аг, ... предполагаются выбранными независимо друг от друга. Мы хотим найти распределение вероятностей для по- ложения точки через п шагов и в особенности его асимп- тотическое поведение при п -► оо. Сначала переведем эту задачу на обычный язык ана- лиза. Рассмотрим фиксированный набор углов ai, аг, ..., ап. С помощью этих углов координаты (хп, уп) блуждаю- щей точки после п шагов выразятся, очевидно, так: хп = cos a, + cos (a, -+- <х2) + ... ... -+-cos(ai-|- ... H-a„), (II. 1Л) y-e8inaj+ sinfo + a^H- ... ... H-sin(ai+ ... -|-a„). Мы хотим найти совместную вероятность Р К < а, уя< *).
Аналитические средства теории вероятностей 43 Фактически мы определим предел при п-*оо вероят- ности P{x„<aVn, уя <bVn}. Выборочным пространством S здесь служит л-мер- ный куб —n<:aj<n, /«=1, 2, ... , л. Наше предположе- ние, что все углы а> независимы и каждый из них рас- пределен с плотностью р(а), означает, что мера, припи- сываемая каждому элементарному множеству В, равна (II. 1.2) J •• • Jp(«i) ••• р(ая)^«1 ••• da„. в (В качестве элементарных множеств могут быть вы- браны, например, кубы с ребрами, параллельными коор- динатным осям.) При этом, очевидно, должны выполняться соотно- шения р(а)>.0 и Jp(a)da=l. —Ж Искомая вероятность, таким образом, равна /••• J P(«i) ••• p(a„)rfoti ••• dan- ха< а¥п,уя < bVn Чтобы несколько упростить задачу, отбросим усло- вие уя < Ъ У п (это означает, что мы полагаем Ь = оо) и рассмотрим распределение (II. 1.3) оя(о) = f ... Jp(aj) ... p(a„)daj ... da„. *п<аУ* Заметим, что an(a), как функция от а, обладает сле- дующими свойствами: 1) оп (а)—неубывающая функция; 2) оп(—оо)=0; оп(4-оо) = 1; 3) сп(а) непрерывна слева (в нашем случае просто непрерывна) *)• *) Если бы углы ах были распределены не непрерывно с неко- торой плотностью, как мы это предполагаем, а принимали бы, на- пример, лишь два значения +0 и —0 с вероятностью */а. то оЛ(а)
44 Глава /7 Функция <т(а), удовлетворяющая условиям 1, 2, 3, называется функцией распределения. Вопросам сходимости функций распределения в ма- тематической литературе уделено большое внимание (мотивированное главным образом нуждами теории ве- роятностей). Следующий результат, принадлежащий Полю Леви, считается ныне классическим. Пусть 00 Л(0= J ехр(Дв)лл(о) (5 — вещественное число); —СО предположим, что Нт/я(С) = /(5), Я^ОО причем сходимость равномерна в каждом конечном ин- тервале значений ё- Тогда существует единственная функция распределения а (а), такая, что оо /(?)= J exp(/£e)do(o) -со И «Л (°)-* О (а) в каждой точке а, где а (а) непрерывна. В этой теореме требование равномерной сходимости fn (5) на каждом конечном интервале значений £ может быть заменено более простым (но эквивалентным) тре- бованием непрерывности f(g) при £=0. Успехи, достигнутые с помощью этой теоремы в тео- рии вероятностей (особенно в теории сумм независимых случайных величин), затмили более раннюю теорему, которая тем не менее очень полезна и которую часто* определялась бы как сумма и была бы разрывной функцией. Тем не менее непрерывность слева сохранялась бы, так как она непо- средственно следует из полной аддитивности меры. Дискретные и непрерывные распределения (а также смешанные случаи) можно нзуоть одновременно, если пользоваться интегра- лом Стильтьеса, но это унылое занятие, которое мы предпочитаем обойти, отсылая интересующихся читателей к любому стандартному изложению.
Аналитические средства теории вероятностей 45 можно применять в тех случаях, когда предыдущая тео- рема ничего не дает. Мы говорим о следующей теореме. Если (II. 1.4) lim f a*da„(a) = f a*da(a) (* = 0, 1, 2, ...) Л-»иО —CO —co и, кроме того, co co (II. 1.5) = где !**= f lfll*da(fl)« ft = l —co то снова (II. 1.6) «,(«)-> «(a) в каждой точке непрерывности функции a(a). Условие (II. 1.5) введено по той причине, что если оно не выполняется, то может существовать функция распределения т(а), отличная от a(a) и такая, что f a*dt(a) = f a* da (а). Отсюда, полагая оп(а)=т(а) для л = 1, 2, ... , мы ви- дим, что утверждение (II.1.6) становится неверным. Условие (II.1.5) просто гарантирует единственность функции распределения о (а) с заданными моментами СО J" a* da (а). — СО Наконец, имеется значительно более слабая теорема такого же рода, которая тоже часто бывает полезна (мы применим ее при решении нашей задачи о случайном блуждании). Если для всех вещественных х СО со (II. 1.7) lim f exp(xa)da„(a) = g(x) = f exp (ха) da (а) л-ьоо J J
46 Глава II и если g(x)—целая функция [т. е. существует целая функция g(z), совпадающая с g(x) на вещественной оси], то (П. 1.8) ая(о)—>а(а) в каждой точке непрерывности функции а(а). Поскольку в такой форме эту теорему трудно найти в литературе, мы дадим набросок ее доказательства. Положим СО gn (*) = fexp (ха) dan (a) (z = х + /у) —СО и заметим, что со со |£Я(*)К J|exp(za)|da„(o)= J exp (ха) da„ (а). —СО —со Далее легко видеть, что для каждого Я>0 функции gn(z) аналитичны в круге |z|</?, если п достаточно велико. Поскольку lim gn (х) существует для каждого веще- Я->со ственного х, мы видим, что в круге |z| функции gn(z) равномерно ограничены и поэтому можно выбрать под* последовательность равномерно сходящуюся внутри круга |z|<J? к аналити- ческой функции. Эта аналитическая функция совпадает с g(z) для —R<x<R и, следовательно, во всем круге |z]<& Отсюда вытекает, что интеграл СО J exp (ita) da„t (а) (5—вещественное число) —СО равномерно сходится в каждом конечном интервале из- менения £ к g(it) и, значит, оЯд(а)-> а(а).
Аналитические средства теории вероятностей 47 Те же рассуждения показывают, что любая беско- нечная подпоследовательность {/п*} содержит подпосле- довательность такую, что Оя,*/ (а)-►<’(«). а это и означает, что оя (а) ->а(а). 2. Вернемся теперь к нашей исходной задаче о слу- чайном блуждании и рассмотрим интеграл СО f exp(xa)do„(a), *00 гдеоп(а) определяется формулой (II.1.3). Заметим, что СО (II. 2.1) gn(x) = f exp(xa)da„(a) = *00 к я = f ••• f exp(jfjf „»-'/«) p(aj) ... p(a„)d<Xi ... da.„. -ж -ж гдехп определяется формулой (II.l.l). Рассмотрим теперь вместо gn(x) несколько более об- щее выражение (П. 2.2) gm(x, у) = Я X = f ... f ехр |(xxm 4- yym) р (а,) ... р (am) da, ... dam -ж -я и заметим, что из определения itm и ут следует (если положить x=r cos 0, у—г sin 0) соотношение хх„ + уу„ = г 2 COS (а, 4- ... 4-а*—в). *«i Полагая (11.2.3) g„(x, у)=М
48 Глава It (мы считаем здесь г фиксированным и обращаем вни- мание лишь на зависимость от 0), мы сразу получаем (II. 2.4) Ли(0) = = J Р («0 ехр [rn-'l* cos (0 — at)] Ля|_1 (0 — a,) da,, — к где A0(e)=i. Рассматривая р(а) как периодическую функцию с пе- риодом 2л, мы с помощью простой замены переменных приходим к формуле (II. 2.5) hm (0) = J р (0 — a) exp (rn~'l» cos a) hm_x (a) da. — * Умножая обе части на ехр (у rn~*h cos 0j и пола- гая (II. 2.6) ехр (у т~'/‘ cos о) hm (0) =р„ (0), мы получаем (II. 2.7) рт(в) = = J ехр гл-'/«cos ojp(0—a)exp (у r/i_cos а)Да) da —Ж (ро (0) = ехР (4 ГП~Ч‘ COS 0) j. Если теперь предположить, что Р(«) = Р(— а) и J" р2 (a) da < 00, — X то можно решать нашу задачу с помощью теории воз- мущений. (Теперь становится ясно, почему мы решили
Аналитические средства теории вероятностей 49 работать с интегралом СО f exp(xa)do„(a) -со для вещественных х. Таким путем мы приходим к инте- гральному уравнению с вещественным симметрическим ядром.) Пусть A.i(n), Хг(п), ... — собственные значения и Ф(">(а), ч4л)(а)< • • •— соответствующие им нормиро- ванные собственные функции интегрального уравнения (II. 2.8) J ехр (угл-'7’ cos о) р (0 — а) X — К X ехр (у гп~'A cos а) <р (а) da — Х<р (0). Мы получаем (П.2.9) ртф) = = J ехр cos ajqy>(а) da ф<">(0) ;=i и, следовательно, (II. 2.10) А„ (0) = ехр угл-'7* cos oj X X 2<л) / ех₽ (т rn~'h cos а) W da^Jn} Теперь уже совершенно ясно, что произойдет дальше. Напишем (II. 2.11) р (а) ~ (2л)-1 +21 aj cos Ja- Отсюда (II. 2.12) р (0 — а) ~ (2л)-,/’ • (2л)-,/‘ 4- +у£ (л-1/» cos jtoi-'l* cos /а 4-л_,/1 sin у0л-‘/‘ sin ya), 4 M. Кац
50 Глава II и, следовательно, собственные значения невозмущенного ядра р(0 —а) равны 1, ла1( naj, .... Каждое собственное значение ла* — двукратное, и соответствующие нормированные собственные функции равны n-’*cosA0, n-'/«sinA0. Кроме того, 1*а*1 <1- Собственные значения возмущенного ядра ехр (угл-'/» cosojp (0 — а) ехр (у гп~Ч* cos а) близки к соответствующим собственным значениям не- возмущенного ядра, и, так как в формуле (П.2.10) все они возводятся в n-ую степень, мы видим, что суще- ственно лишь собственное значение, близкое к 1. Таким образом, при п -> оо (И. 2.13) Л„ (0) — ехр (— у гп -'/«cos о) 1? (л) X X J ехр (у- гп-Ч» cos a) (а) daqX») (0). — X Теперь с помощью обычных приемов теории возмуще- ний вычислим ХДп) и ф]П>(а). Напишем m 9 141 Мл)= 1+л"’|*2+ •••» ( ‘ ’ <)(o) = (2*)",/’ + «",41(a)4-«"42(a)+••• и подставим эти ряды в интегральное уравнение (11.2.8). Сравнивая коэффициенты при n~v< и п~1 в обеих ча- стях уравнения, мы приходим к равенствам (II. 2.15) Jр(0—а)^ф!(а)-|--2-г(2я)_'л(со804-со8а)^а =
Аналитические средства теории вероятностей 51 И (II. 2.16) f р (0 — a) [ф2 (а) 4- у гФ1 (а) (cos 0 + cos а) 4- —Ж 4- у (2л)~,л (у г)2 (cos 0 4- cos а)2] da = = Ф2(0)+М1(0) + (2л)’,/’ц2- Поскольку функция <р^я) (а) нормирована, для ф1(а) имеем также соотношение (II. 2.17) f^(a)da = Q. —Ж Интегрируя обе части равенства (II.2.15) по 0, мы получаем (II. 2.18) ^ = 0. Отсюда следует также, что (II. 2.19) ф, (а) = у г (2n)~'h (1 4- JWi) (1 — JWi)”1 cos а. Интегрируя (П.2.16) по 0 и принимая во внимание (П.2.18) и (II.2.19), мы получаем Ж ж ц2 = |г2(2л)-1 f /р(0_а)[(14-ла1)(1-ла1)-,х —Ж —ж X cos a (cos а 4- cos 0) 4- у (cos а 4- cos 0)2] da d9. В силу ограничений, наложенных на р(а), все пре- дыдущие вычисления, использующие теорию возмуще- ний, могут быть строго обоснованы. Итак, мы имеем наконец lim Л„ (0) = ехр (уо2г2). Л->со X* / 4*
52 Глава II где <т2 = (4л)-1 J Jp(0 —cOfu+naOn—ла^Х -« — * X cos a (cos а 4- cos 0) + у (cos а -|- cos 0)^ da dQ. Полагая у=0, получаем (II. 2.20) 11 m f ехр (ха) da„ (а) = ехр (4-а2х2} = П^ОО J \* J — □О со =а-1(2л)_,/’ f ехр (ха) ехр (—^) da. —СО Таким образом, (II. 2.21) а„ (а) = Р {х„ < а /л) -► ->о-‘ (2я)"'л J ехр (— dx. Теорему [см. (II.1.7) ц (II.1.8)], на основании кото- рой сделан вывод (П.2.21), можно легко обобщить на случай нескольких переменных и получить таким обра- зом более содержательный результат: оя(а, b) = Р (х„ < а /л, у„ < b ]/п] -> a b ->o-2(2n)_1 f /ехр[ — СО —со ^£-\dxdy. 3. Предыдущий пример является упрощенным ва- риантом задачи, привлекшей к себе значительное вни- мание в связи с молекулярными цепями. Задача состоит в следующем. В пространстве задана цепь из л звеньев; каждое звено имеет длину 1 и обра- зует фиксированный угол (называемый «валентным уг- лом>) с предыдущим звеном; в остальном цепь распо- лагается произвольно. Требуется найти распределение вероятностей для «размераэ цепи («размеромэ назы- вается расстояние между концами цепи).
Аналитические средства теории вероятностей 53 Обозначим через г* вектор (длины 1), представляю- щий k-e звено, и через ift, jft — пару взаимно перпенди- кулярных единичных векторов, перпендикулярных к rft. Мы можем написать г*+1 = i* sin a cos 0* 4- jA sin а sin 0* 4- r* cos a, где угол 0A выбран подходящим образом из интервала (О, 2л). Мы можем теперь определить и j*+i при помощи формул i»+i = 0*1* — cos 0*j*, jft+i = cos 0* cos a iA 4- sin 0A cos a jA — sin a r*. Заметим, что l*+i ‘ j*+i= i*+i ’ r»+i = j»+i • r*+i = 0. Таким образом, цепь определяется углами 01.02.............0я-1 (О<0»<2Я), и тем самым мы можем считать (л— 1)-мерный куб О<0*<2л, k = \, 2, ..., п — 1, выборочным пространством S. В качестве меры в S мы можем выбрать обычную меру Лебега, нормированную таким образом, что мера всего куба равна 1. [Пользуясь теоретико-вероятностной терминологией, мы можем сказать, что все 0* независимы и распреде- лены равномерно на интервале (0, 2л).] Выбирая произвольно г1( мы получаем, что «размер» цепи равен длине вектора Кя = г1 + г2+ ••• +ГЛ- Легко вычислить среднее значение величины ||Rn||2, г. е. 2* 2« Е {||R„||2] = <||R„||2> = Г2к)-(л-’> / ... f llRjdO, ...rfO^p о о
54 Глава П Действительно, пусть Ah=A (0ft) — матрица Л» = Л(0») = sin 0, COS a COS 0ft sin а cos 0ft — cos 0* 0 COS a sin О* —sin а sin a sin Oft cos а Заметим, что элементы третьей строки матрицы Вя = / + Л, + Л2Л, 4- ... 4- ЛЯ_1Л„_2 ... Л! равны соответственно R« ii. R« Ji и Яд-Гр Отсюда (П.3.1) HRJ2 = *33. где Ьзз — элемент матрицы ВЛВ'Л (В' — транспонирован- ная матрица В). Далее Вя = / 4- {/ + Л2 4- • • • 4“ Ля_!... Л2} Л] = / 4- ВЯ-1Л1]), и, следовательно, ВПВЯ = 14-Вя_1Л1 4-Л1Вя-14- Bn-\Bn-i (поскольку 41 — ортогональная матрица, AiAt = f). Итак, f IMb. »)-!+£ ((В.-И 0а „)+£|(А’в-0а „) + 4-£ {(В._1Вя_0а3)|, Из нашего предположения о том, что углы 01, ... , 0n-i независимы и равномерно распределены, следует, что Е {B„_iA} =Е (Вя_4 Е {Л,} = = £{Л,}4-£ (A)£(A)+ ... ... 4-£{Л,} Д{Л2)...£{Л„_,| = М + М>+ ... +МП~\ где Л4 = £{Л*}= О О О О О О О — sin а COS а ') Следует, конечно, иметь в виду, что SB-i является функци- ей от Ог, ..., 0n-i, в то время как Вя зависит от всех углов Оь 0а,..., 0я_|.
Аналитические средства теории вероятностей 55 Аналогичный результат получается, конечно, и для Е (Л15д_ i). Окончательно мы приходим, используя (П.3.1), к рекуррентной формуле Е {||R„ II2} = 1 4- 2 cos a 171°^s~*a 4- Е {J|> ||»}, откуда fllIRJI’l = !+(«-1)4±^7- Эта формула была впервые получена Айрингом. Можно экспериментально (измеряя рассеяние света) опреде- лить размер молекулярной цепи и убедиться в том, что он пропорционален (f {||R||2})'A. При этом оказывается, что размер цепи пропорционален Yn или корню квад- ратному из молекулярного веса. Этот простой закон действительно выполняется при определенных условиях. Предыдущее рассмотрение неудовлетворительно, по- скольку мы полностью пренебрегли весьма существен- ным эффектом «исключенного объемах Чтобы учесть этот эффект, необходимо подчинить цепь дополнитель- ному ограничению (II. 3.2) £г.|>». выражающему то обстоятельство, что атомы, «сидящие» на концах звеньев, не могут перекрываться. Пытаясь вычислить £{||Re||2), мы должны были бы интегрировать теперь только по той части куба 0 < 0ь< <2л, в которой выполняется неравенство (П.3.2). Это крайне сложная и еще не решенная задача. 4. Возвратимся теперь к нашей упрощенной задаче (в которой мы пренебрегаем эффектом «исключенного объема»). Мы хотим найти распределение вероятностей (в пределе при п-*<») для какой-нибудь компоненты вектора Rnn_'". В действительности лучше попытаться сразу оты- скать совместное распределение вероятностей для трех взаимно ортогональных компонент вектора Rn«_l/’.
56 Глава П С этой целью мы рассмотрим Е {ехр (jc/i-'/’R,, • a-j-y/i-'/’R,, • b+z/i-'AR,, • с)), где а, Ь, с — три взаимно ортогональных единичных век- тора, или в более общем виде gm(xn~'i>, yn~\ zn-'i>) = = Е {exp(jc/i-'/«Rm. a4-y/i-'/»Rm . b + z/i-'/»Rm • с)). Если принять для простоты a = ilt b = jp с=Г1, то можно заметить, что xn-*/»Rm • а + y/i-‘/‘Rm • b + z/i-'/iRm • с является третьей компонентой вектора уп~ч* гп~'1г J Обозначив через | вектор с компонентами (хп-,/г, уп~Ч*, гп~,/г), мы можем написать *) 2» 2к xj - J ехр[(/+Л1+...+Лт_1...Л1)|(3)]А-^т-1= о о 2к = ехр (z/i-‘A) (2k)"1 f g^ (А (0) g) de = о 2к = ехр (гп~’/г) (2к)-1 J g„_x (хп~ч> sin 0 — уп~ч» cos 0, о хп~'/г cos a cos 0 + yn~'i* cos а sin 0 — zn~'i* sin а, xn~'h sin a cos 0 4 yn~'l» sin a sin0 -f- zn~'l» cos a) dO. *) Индекс (3) означает здесь, что мы берем третью компоненту вектора.
Аналитические средства теории вероятностей 57 Для упрощения вычислений рассмотрим частный слу- чай а = у л. Предыдущая рекуррентная формула запи- шется теперь так: gm(xn~4‘, уп-К гп-'!*) = = ехр (zn-'A) (2я)-1 J gm_, sin 0 — уп~',г cos 0, о —2П~',г, ХП~'!» cos 0 4- уп~ч> sin 0) d0. Положим х = (1 — z2)7* cos р, у = (1 — z2)7’ sin р; без ограничения общности мы можем также считать, что x2+y2+z2 = l. Отсюда получаем gm ((1 — cos р, (1 — z2)7’ «-'/• sin p, zn_,/«) = 2* = exp (z/i-‘/«) (2л)-1 J gm_x ((1—z2)7’»-'/«sin (0—p), —zn~\ о (1 — z2)7’ n-‘A cos (0 - p)) dG = 2* = exp (z«~'A) (2л)-1 J g^ ((1 — z2)7* п~'!* sin 0, — z/i-'A, о (1 — z2)7’ n ~ '!• cos 0) d0. Из этой формулы видно, что gm не зависит от р, и мы можем, следовательно, положить р=0. Это дает gm((l-22)7‘/1-7‘, о, zn-*) = ехр (гп-ч>) (2л)-1 X 2« X Jgm-i((l— Z2)7‘/l-'/‘Sin0, — zn~\ (1—Z2)IZ,/l-'/«COS0)d0. о Но gm-l(0 — z2)7*/l"'/»sin0, — zn~'!*, (1 — Z2)7’ «-'A COS0) = = gm-i(n-7’[l-(l-z2)sin20]7*, 0, (l-z^’/i-v.cosO);
58 Глава II полагая получаем 2* frn (г) = exp (z/i-'A) (2л)-1 J /m_i ((1 — z2)'7’ cos 0) d0 0 или, с помощью простых преобразований, (II. 4.1) /m(z) = a-*)'7* = exp(z/i-,/«)n-1 J /m-i(w)[l — (z2+<d2)]“'/,dco. Пусть ядро К(ш, z) определено на квадрате — 1 < ш, z 1 следующей формулой: Z) = [n-111 — (^+если & 4" & < 1 • | 0 в противном случае. Тогда (П.4.1) можно переписать в виде (II. 4.2) fm (z) = ехр (z/i-'A) J К(®, z) /m_i (ш) d®. -1 К сожалению, ядро Х(®, z) сингулярно, и непосред- ственное применение теории возмущений может вызвать сомнения. Чтобы обойти эту трудность, заметим, что итерированное ядро tf(2)(z, ©)= f K(z, ц)К(р, <o)dp -1 ведет себя уже достаточно хорошо. Действительно, 1 (П. 4.3) J J К(Ъ (z, со) dz dw < 00.
Аналитические средства теории вероятностей 59 Для того чтобы в этом убедиться, будем исходить из легко проверяемого равенства *) 1 / К<2> (А ®) Ря (®) rf®=i^uPt («)• -i где Pt (z) — полиномы Лежандра и 2* Xt = (2n)-1 J sin* 0 dO. о Отсюда немедленно вытекает соотношение 00 К2(2. ®)~2K*|(2A+1)P*^P>^’ *-0 а следовательно, и неравенство (П.4.3). Переписав теперь рекуррентную формулу (П.4.2) в виде /-(*) = 1 1 = exp(z»-'A) J f((z, |*)ехр(цл-'Л) J K(p,<o)/W_2(<o)d<odp, -I -I мы сможем легко симметризовать наш оператор и снова применить теорию возмущений (в точности так же, как в двумерном случае). При этом мы должны будем раз- личать случаи четного и нечетного л, но это уже совсем незначительная трудность. Как и раньше, мы получим /„(z)-*exp(—yo’z2), ) Это равенство легче всего проверить, если переписать его в эквивалентной форме 2* (2«)“* [ Рц ((I — л»)'* sin в) 49 - /*Х*Р* (л).
60 Глава П где о=1 для а=л/2. При а ¥= п/2 вычисления стано- вятся более сложными, хотя метод по существу не ме- няется. 5. В качестве другой иллюстрации технических прие- мов, часто используемых в теории вероятностей, рас- смотрим следующую задачу. Точка, выходя из начала координат, двигается по прямой таким образом, что за каждую единицу времени она смещается на +1 или —1. Предполагая, что оба смещения равновероятны и что смещения в разные мо- менты времени независимы, определим асимптотические свойства распределения вероятностей числа Nn возвра- щений точки в начало координат за первые п шагов. Выборочное пространство S состоит из 2П сточек»: каждая «точка» — это последовательность (Xi, ... , Хп) из +1 и —1. Мера любой такой «точки» равна 2-п; это просто перефразировка нашего предположения не- зависимости шагов и равновероятности смещений ( + 1 и —1). Пусть теперь (1, т = 0, V(/n) = l0, тфО. Заметим, что ^=V(X1)+V(X1 + X2)+ ... ... +У(Х, + Х+ ... +*„) = = V ($1) 4- У (52> ~1" • • • + ($»)» где st = A'1 + A'2+ ... H-X*. Вычислим теперь моменты E{N*„], Л=1, 2, .... При этом надо иметь в виду, что Е pvj) — просто сумма 2 " 2 (V(/,)+ ... +У(/, + /2+ ...+/„))*. Zy=±i
Аналитические средства теории вероятностей 61 Покажем, как проводятся эти вычисления, взяв k=2. Имеем V(s»)J}=£{2V(st)} + +24<£<я™*'>}= =£РМ+2 2 W/WI- 1</</<л Далее, E{V(s/)V(sy)} = P{s/ = 0, sy = 0} = = Р (sz = 0, Sj_t = 0} = Р {Si = 0} Р (sy_t = 0}. Положим A = P{S/ = 0}, i = l, 2, .... и рассмотрим л J-1 Qn= 2 PiPj—i = Zj \<i<j<n j=\ / = 1 Заметим теперь, что co / co \ 2 S Q»z"=(i— г)'1 (Sa*'J Л=1 \ 1 / и, следовательно, 2 E (№я) zn = (1 - zYx 2 А-г* + 2 (1 - г)-’ (1 А-г'У • Л-1 1 \ 1 / Здесь мы воспользовались очевидным тождеством 2£{^я)гя = (1-г)-,2Аг/-1 Л=1 1 J В нашем случае „, Л1 г 0, если I нечетно, А = Р{^=0}= 2т I Ь2т * 2 , если I = 2m,
62 Г лава И или 2> pt =(2л)-1 J* cos'OdO. Отсюда Sa? = (1-z’)-,a-1 1 и, следовательно, при z-1. Простое обобщение предыдущих вычислений дает S Е (Nj) z" ~ Л! (1 - г)"1 (1 — z2) "*2 ~ ~ k I2"*'2 (1 — z)-1 (1 — г)-*'2 или 2 [Е {№} -Е {№_.}] Za ~ k 1 • 2-t/2 (1 - z)-^, Л-1 где мы положили No — O. Поскольку Wn>Nn-i, мы имеем f pV*} >Е pvj-i}« и отсюда с помощью тауберовой теоремы Карамата по- лучаем E{№}~AI2-‘V/2/r(l-1-l). или f {(^-%)*}->*l2"w/r(4+ 1), Л = 0, 1, 2, при Л —ОО. Теперь легко проверить, что 2 (2n)"v* f и" ехр (-4 и2) du = k\ г^^/Г (у + 1). и, следовательно, полагая оя(«) = Р{Л/ял_,/‘<п).
Аналитические средства теории вероятностей 63 получаем СО lim f а*«/оя(а) = lim Е {(Л^я/1-'А)*| = л->оо ~ Л-»оо 00 = 2 (2л)-,/’ J «* ехр (— у и2] du. о Применяя теорему о моментах, упомянутую в п. 1 этой главы, мы находим lim оя (а) = lim Р {n~4»N„ < а} = Л->ОО Д-»00 « = 2 (2л)_,/* J ехр у я2) du. О Читатель может заметить, что предыдущий вывод легко непосредственно обобщить на случай, когда шаги Xit Хг,... по-прежнему независимы, но могут принимать любые целые значения. Действительно, пусть Р{Ху = А}=с*. оо где и Zjc*=1; допустим еще ради простоты, —ОО что Выборочное пространство состоит теперь из множе- ства последовательностей (Xi.....Хя), где каждое Xj может принимать любое целое значе- ние k. Мера «точки» (Хь .... Хп) равна р {(А\, ..Хд)} =cxtcxt • • • схя (стоящее справа произведение напоминает нам, что шаги предполагаются независимыми!). Отличие от предыдущего случая состоит только в том, что pt задается формулой 2» Pi = Р {з, = 0J = (2л)"1 J /' (0) </0, о
64 Глава II где /(0)=1Ь*ехр (ikQ). — оо Отсюда мы можем получить (2ж ' * (2л)-1/[1-г/(0)Г’</0 ; о / при /(0) = cos0 = y ехр (Z0) + yexp(—<0) это приво- дит к предыдущему случаю. Если o2 = E{A,J} = 2A2c*<oo, — СО то /"(0) существует (/"(0) = —о2) и легко видеть, что 2« « (2n)~'f [1-2/(0)|-,</0 = л'1 f [l-z/(0)]"1d0~ о о ~л-' Д1— z(l -4о202)]-1</0~ О ~о_,2_,/’(1— z)~\ z->l, конечно, в предположении, что f(0) не обращается в 1 в полуинтервале О<0 < л. Отсюда, как и выше, мы по- лучаем (11.5.1) lim Р {N№n,-4t < ас-1} = 2 (2л)_,/’ J* ехр (— у я2) du. о Ясно, что в нашем первом примере о=1. Если f(0) обращается в 1 где-нибудь в полуинтервале О<0 л, то те k, для которых ck 4= 0, имеют общий делитель. Если обозначить их наибольший общий делитель через h, то видно, что о следует заменить на о/й.
Аналитические средства теории вероятностей 65 6. Читатель, несомненно, уже заметил, что вероят- ностный язык — это всего лишь удобный способ выра- жения некоторых математических фактов, касающихся довольно сложных сумм и интегралов. Если не пользоваться теоретико-вероятностной тер- минологией, то результат (II. 5.1) звучит так: предел суммы ^сх1сх2 • • • сха = взятой по тем наборам из п целых чисел (Xi, .... Хп), для которых число нулей в последовательности (Xi, Х1+Х2, .... Xi+X2+ ... +ХП) не превосходит ахг'п'11, равен 2 (2л)_,/’ J* ехр (— и2^ du. о Это тяжеловесное утверждение, по-видимому, само по себе лишено всякого интереса. Становится ли оно более интересным, будучи запи* сано в виде (П.5.1)? Или оно становится только менее громоздким? Здесь мы касаемся спорных вопросов, затрагиваю- щих отношение математики к нематематическим дисцип- линам. Позвольте мне привести пример из области, связан- ной с математикой, но отличной от нее. Я имею в виду следующее утверждение: при подходящих ограничениях (гарантирующих существование всех нужных интегра- лов) для четной функции f(х) и для ее преобразова- ния Фурье СО Ф(/>) = (2л)-1 J exp(ipx)f(x)dx —ОО имеет место неравенство оо со fp2l<p(p)l2dp> —СО —оо ОО СО >4 f l/(x)№ f 1ч>(Р)124>- —Л -ОО 5 М. Кац
66 Глава II Это довольно забавное неравенство выводится крайне просто при помощи равенства Парсеваля и удачного применения неравенства Шварца. Тем не менее оно служит математическим выраже- нием принципа неопределенности в квантовой механике, принципа, который, безусловно, лежит в самой основе наших представлений о физических явлениях. Нельзя отрицать, что наше восприятие научных вы- водов зависит во многом от контекста, в котором мы их встречаем. Один и тот же факт в одном контексте выглядит только как некое верное утверждение, и его присутствие там лишь в слабой степени оправдывается его истинностью; в другом контексте этот факт, выра- женный подходящим языком, может быть весьма поучи- тельным и заманчивым. Поскольку теория вероятностей обязана своим воз- никновением и развитием прежде всего нематематиче- ским вопросам (например, играм, кинетической теории вещества и др.), то и на природу ее задач оказали не- преодолимое влияние нематематические рассмотрения. Мы возвратимся к этому вопросу в следующей главе, где мы проследим роль теории вероятностей в класси- ческой статистической механике. В заключение этой главы мы обсудим две совер- шенно не связанные друг с другом задачи: обе они ил- люстрируют преимущества теоретико-вероятностного языка. 7. Первая задача связана со случайным блужда- нием, рассмотренным в конце п. 5. Шаги АГ|, Х2,... ,Х* считаются независимыми, и, как и прежде, Р{^=Л) = Р(Х/ = -А)=с*. Мы предположим еще, что с0 О и 2 kck < оо. 1
Аналитические средства теории вероятностей 67 Условие со ¥= 0 несущественно, но оно избавит нас впо- следствии от лишних оговорок. Рассмотрим теперь не все выборочное пространство S (т. е. множество всех наборов из п целых чисел (Хь Х2, .... Хп)), а подпространство S*, определенное условием 5я = Л'14-А'2+ ... -{-Хя = 0. Введем меру в S* следующим образом: мера точки (Л, .... 1п) из S* равна') (П.7.1) „// м_ ₽{*!-/..............x„ = ia, Х.+ ... +хя = 0}_ •••»*«/ — Р {Л-,4- ... +Х„ = 0) ” С/>С*2 • • • - +1„-1 _ С/1^2 •••«/„ - Р ($л = 0} — Р {$я = 0} • P(sn=0) есть мера (см. начало п. 5) множества, опре- деленного условием sn=0. Вспомнив, что /(0)= ехр(/Л0), — JO мы можем написать 2> Р {*л = 0) = (2л)-1 f Г (0) </0 > с0" ¥= 0. о Эта новая мера в S* известна под названием «услов- ная вероятность». Рассмотрим теперь максимум тах(0, s„_lt 5Я), взятый по элементам множества S* [т. е. равный max(0, si, ... , Sn-i)]. и среднее значение этого макси- мума на S* [разумеется, по мере (П.7.1)]. Это среднее («условное математическое ожидание») мы обозначим *) Очевидно, что In----(/>+/»+ ... +/»-!)• 5*
68 Глава II через E{max(O, sp s„)|s„ = O); оно равно сумме 2 max(0, 4, ••• H-Л,) И (A..ln>- V ...+/я-о Очень существенно, что ц — симметрическая функция от 4, 12...In- Пусть / 1 2 ... п \ о = ( I \°1 °2 • • • ап / — некоторая перестановка. Заметим, что 2 max (О, Zj......../,+ ... -|-/л)|л (/„ /2, ...» /„) — +'я=° = 2 max(0, Z-, Z, 4-Zv ...,Z, 4-Z, 4-... 4-Z. )Х / + ..+/ -о 11 2 1 2 я 9я Хр(4,. ••••/«„)= 2 тах(0, 4 1 я/ +<„-0 \ 1 I 2 • ••. /.,+ ••• 4-Z.Jp(4, •••, Z„), и, следовательно, 2 тах(0, 4..........4+ ... 4-Z„)g(4, ...» 1„) = /,+... +z„-o ~И S f2max(0..................../,1 + ...+;.Лх /,+ ... +/„=о\ . / Хр(4.......z„), где внутренняя сумма берется по всем перестановкам о. Мы докажем теперь следующую лемму, впервые сформулированную и доказанную Хантом. Пусть at, ..., ап — вещественные числа и а— некото- рая перестановка /1 2 ... п \ о= I. \°1 °2 • • • °л/
Аналитические средства теории вероятностей 69 Пусть далее N(c) — число положительных членов в по- следовательности л.(. •••• + ••• Тогда 2 max (0, а3), + а,*....а,( + • • • +«>„) = S a,N (о). Мы приведем крайне простое доказательство, при- надлежащее Дайсону. Пусть (1, х>0, (О, х<_0; заметим, что (II.7.2) max(0, а,е а^+а,*................ Н-а>А) — — max(0, a3i, ав1 + а,г, ..., а3|+ ... -+а,Л |) = = 6 (в», + • • • + [а», + ~bmax(0, а,2, ..., ... — — max(0, a,', a,t + а,2, ... , а,{ + ... +а,А_,)|. Обозначим через G(®i..........................®*) множество тех перестановок, у которых первые k индек- сов (взятые в некотором порядке) равны см, ... , со*. Таким образом, множество всех перестановок п элемен- тов разбивается на С* попарно непересекающихся мно- жеств G(coi, ... , со*). Суммируя обе части равенства (II. 7.2) сначала по всем перестановкам множества 6(ь)|, .... со*), а затем по всем множествам G, мы по- лучим (И. 7.3) 2[max(0, ....а3|+ ... Ч-а^) — — max(0, a3j, .... ... _,)] =
70 Глава II Суммируя равенство (II. 7.3) по А от 1 до и, мы прихо- дим, очевидно, к утверждению леммы. Используя эту лемму и равенство (П.7.1), мы полу- чаем У тах(0, /1, Ч-/в)|А(/„ .... /„) = ».+ ••• +/я-о = 7! 2 .....и. /1+...-ия=°\ о / где N(o) обозначает теперь число положительных чле- нов последовательности /вр + • • • + 4>я- Но .............................'’= ..... и ясно, что ........................'•)= =, S, /,(sey1++/,)’)|*(/..................1.)= 1{+ ... +1„ = 0 \* = 1 / = 2 2 ... -+-/*)!*(/»..U= ... +/я=о
Аналитические средства теории вероятностей 71 Далее, =*“’ 2 (А4--. •+/»)!*(/!.../,.) = Z1+ ... +zA>0. Z,+ ... +z„-o = Л-’2/Р{$Л = /, s„ = O}/P ($я = 0) *). Z-l Воспользовавшись легко проверяемым равенством Р{$* = /, s„ = 0} = P{$* = /, sn-sA=-/) = = (2л)-1 j ехр(— Z/0)/*(0)</0 • (2л)-’ X о X f ехр(//0)/"_*(0)</0, о мы наконец получаем Р {$„ = ())£ {max (О, Si.s/I_1)|sn = O) = = 2 max(0, /,.........Zi+ +ln)ciicit ... ctfi = = JexpHZ/O)/*^©^)-1 X A = 1 Z«1 О X f ехр(П0)У"_* (0)d0. о *) Следует заметить, что У IP {s* - /, s„ « 0) < 2 IP {s* = /} < <£{ |x1-j- ... 4-х*|)<Л£{.|Х11} =k 2 I г I cr <oo.
72 Глава II Так как справедливо тождество "2 ["А + (л —Л)]= Тп ~Л>1 и функция f(0) четна [так что при замене I на — I в ехр («70) интеграл не изменится], мы приходим к сле- дующему любопытному тождеству: (II. 7.4) У max (О, А........./1+ ... +/n-i)Q,-.-Cin = Zl+ +'л=° ОО л-1 /=i *=i X (2л)-‘J/»(0)exp(//0)dO X о X (2л)"1 J7n-*(0)exp(«70)d0 , О где по-прежнему m /(0)=2с*ехр(«Л0). —со Читатель здесь вправе недоумевать, к чему на него был обрушен весь этот каскад комбинаторных трюков. Но мы просим еще немного терпения, и ход нашей мысли станет ясным. Займемся теперь другой задачей. Рассмотрим ((m+1) X (т+1))-матрицу Теплица для функции f(0), т. е. матрицу <^=11^/11 = 11^-/11, 0<i, j<m. Обозначим через М(т), ... , Xm+i(m) ее собственные значения. Справедлива следующая теорема: (11.7.5) (т+1 2х | Ух; («)-(т+ 1)(2л)-’ |7Я(0)<*0[ = 1/^ о J
Аналитические средства теории вероятностей 73 ----2 У max(0, /р /1 + 4» •••• 4+• • •+4-i) X '>+ ... + („=<> X сц • • • С1„- Прежде чем мы перейдем к доказательству (очень простому) этого утверждения, заметим, что в соедине- нии с тождеством (П.7.4) оно приводит к следующему замечательному результату Сегё1). Для достаточно малых действительных £ (/ — еди- ничная матрица) имеем (II. 7.6) нт ------------------------------- °° ехр ^-(т+ l)J log (1-5/(0)) йО о J (СО \ 4- S л1Ля12) • 1 / где сг 2ж У kjf = (2л) -1 Г log 11 — и (0)1 [1 + z ехр (- /0)1 х л=0 О X [1 — z ехр (— /0)1"1 </0. Этот чисто аналитический результат (доказанный впер- вые Сегё виртуозным использованием ортогональных полиномов) эквивалентен, таким образом, следующему факту из теории вероятностей: (11.7.7) P{s„ = 0}£{max(0, ...» sn_l|s/I = 0)) = л-1 со = 2>-12р{5* = /» *л = 0}, Л = 1 1*1 вытекающему в свою очередь из доказанной выше чи- сто комбинаторной леммы2). ) В действительности результат Сегё формулируется в несколь- ко иной, но эквивалентной форме. ’) Чтобы соблюсти историческую достоверность н избавить чи- тателя от подозрений, что в этой области математики прибегают
74 Глава JI Здесь мы встречаемся с замечательным примером того, как из теоретико-вероятностного результата сле- дует весьма нетривиальный аналитический факт. В главе IV мы приведем несколько других примеров совершенно иного происхождения, где из результатов, мотивированных теорией вероятностей и доказанных ее методами, следуют факты классического анализа. Нам осталось доказать теорему (II. 7.5). Мы прове- дем доказательство для случая п=3, тем более что оно содержит все существенные моменты общего доказа- тельства. Мы имеем 2x}(m) = Tr (Cm) = 2 J = 1 lit Полагая ф(1) = 1 для и ф(0=0 для осталь- ных I, мы можем написать 2 А,} (т) = 2ф 01) Ф 02) Ф Оз) где сумма берется теперь по всем значениям А, 12, 1з- Вводя новые переменные /1 = Л» /г = ,2 7з = 4—*2» мы получаем 2 х? (от)=2 ф (/,)ф (/,+;2) ф (/; -+- j2 + /3) chcj,c],+il. к «черной магии», мы можем правдиво изложить ход событий. Исходя из результата Сегё. я смог доказать, что он эквивалентен тожде- ству (II. 7.7). Уже после того, как эта редукция была выполнена и истинность формулы (II. 7.7) была тем самым твердо установлена, Хант нашел чисто комбинаторное ее доказательство. Здесь же я перестроил доказательство с заранее задуманным намерением достичь определенного «драматического» эффекта. Заметим, однако, что совершенно независимо и лишь немногим позже Спитцер (частично в сотрудничестве с Боненблюстом) пришел с помощью теоретико-вероятностных рассмотрений к существенному обобщению комбинаторной леммы Ханта; свой результат он затем применил к решению многих задач. Работа Спитцера, по моему мне- нию, является одним из наиболее значительных вкладов в теорию вероятностей за последние годы.
Аналитические средства теории вероятностей 75 Заметим, что Ф (/1) Ф (/1 + /г) Ф (71 + J-2+/з) = = И +1) — (max (0, /2, /2+/3) — min (0, /2, /2+/3)Ь если стоящее справа выражение неотрицательно; в про- тивном случае эта сумма равна нулю. Мы придем к требуемому ответу, если заметим, что S J У3 W "в. о и воспользуемся условием симметрии с_^ = с2. Небольшое видоизменение предыдущего рассужде- ния дает также оценку т + 1 2л 2 Х5 (да) - (да -J-1) (2«)-‘ f Г (0) </0 у-i о <2 2 с1. • • • С1 тах (°- lV Z1 +z2- — /1 + ...+/я=о Эта оценка нужна для обоснования некоторых формаль- ных шагов, ведущих от формулы (П.7.5) к результату Сегё. 8. Результаты предыдущего пункта немедленно на- водят на мысль об их непрерывном аналоге. Не вдаваясь в подробности, мы просто сформули- руем соответствующие факты, предоставив их проверку читателю. Пусть функция р(х) такова, что: 1) р(х)>0, 2) р(х) = р(— х), СО 3) f?(x)dx=\, —СО 00 4) J* хр (х) dx < оо. о
76 Глава II Положим F (ч) = J ехр (/т)х) р (х) dx. Предположим, кроме того, что /|^(ч)1^<°о- Рассмотрим интегральное уравнение а (II. 8.1) J р(х —у)<р(у)«/у = Хф(х) -а и обозначим его собственные значения через А.2(а), .... Наконец, напишем ОО р"” (х) = (2л)"1 J Fa (т|) ехр (Zrpc) — ОО это означает, что р<п)(х) является n-кратной сверткой функции р(х) с самой собой. Тогда lim Vx*"1 (а) —2ал-1 f Fn (л) dx\ = СО со = —2 J ... Jmax(0, хь х1Н-х2,..., х14-...-|-хл_1)Х Хр(*1) • • • РС^л-ОРС*!-!- • • • • • • &Хп_х [аналог равенства (11.7.5)] и J max (0, х„ х, + х2, ..., Xi+ ... +x„_i) X X Р(-*1)Р(-*я) • • • Р(*в-1)Р(*|+- • • +Хл-1)^Х1 • • • ^Хл-1 = = 1« / х £ [Л (л - Л)]"1 р**»(х)р(я-*> (х) dx 0 Л=1 [аналог тождества (II. 7.4)].
Аналитические средства теории вероятностей 77 Наконец, для достаточно малых £ имеем Нт Og<S) ехр 2ап~‘J о log(l— IF CO xjQ 2 = exp J x (2л)"1 J log (1 — ^(n)) ехр(/г]-*)^П dx Lu [аналог формулы (П.7.6); Da(g) — определитель Фред- гольма интегрального оператора (II. 8.1)]. Здесь на совсем частном примере мы ясно видим, как важно уметь по-разному формулировать один и тот же факт. Если бы мы не сформулировали результат Сегё на языке теории вероятностей, было бы очень трудно, а может быть, и невозможно обобщить его на случай интегральных уравнений. 9. Другой пример, где сказываются преимущества различных формулировок, мы возьмем из теории чисел. Рассмотрим функцию v(n) (уже определенную в третьем примере из гл. I), задающую число простых делителей числа п (без учета кратности). Пусть р — простое и | 1, если л делится на р, Рр(п) [о в Противном случае. Тогда у(л) = 2рр(«)- р Функции Рр(л) (р пробегает все простые числа) не- зависимы, т. е. я D {рР, (л) = еь ..., pPjk (л) = е*} = Д D {рРу (л) =?еу), где каждое еь равно 0 либо 1 и D{ } обозначает (как и в примере 3 из гл. I) плотность множества целых чисел, написанного в фигурных скобках.
78 Глава II Положим теперь **(«) = 2 ₽/,(«)• РО’Л и обозначим через ол(а) плотность тех целых чисел п, для которых (v*(«) —Л*)Л*'А<а, т. е. о* (а) = D {(v* (л) — A*) At ',г < а). Напишем J ехр 01а) dak (а)=(exp hl (v* (л) — А*) Л* ’А]) = —СО N = Нт ’У ехр hl (v* (л) — А*) АГ7’]• n*°N£ Воспользовавшись независимостью, мы получим (как и в примере 3 гл. I) {ехр hl (v* (л) — A*) Ai} = = exp(ilAj(*) До< {ехр [/$А*’%(«)]) = = ехр(— <1А*’) Д [1 —№+№ expfaA* %)J. Теперь легко проверить, что Hm {ехр hl (v* (л)—А*) А*,д]} = ехр у . Отсюда вытекает, что lim о* (а) = (2л)-,/1 f ехр (— 4 «21 du. Л->со J \ * / —со Читатель, хорошо знакомый с теорией вероятностей, несомненно, заметил, что мы здесь доказали очень част* ный случай центральной предельной теоремы.
Аналитические средства теории вероятностей 79 Если обозначить теперь через In, к (а) число целых чисел п, 1 п < N, для которых (v* (л) — А*) А*1/1 < а, то доказанный нами результат можно представить в виде а (II. 9.1) lim lim N~'lN, * (а) = (2л)_,/’ f ехр (— ±u2]du. Это наводит на мысль, что, может быть, справедливо также и равенство а lim №1/ЛГ>ЛГ (а) = (2л)-,/* f ехр(-|«2')</« N-*co J \ i 1 или (поскольку <4n = log log N + O(\)) если через <АГ обозначить число целых чисел, не превосходящих N и имеющих простых делителей не более чем log log W+a(log logAZ)'/», то df/N -> (2л)_,/* J exp a2) du. В действительности это так, хотя доказательство сложно и требует сравнительно тонких теоретико-числовых (не теоретико-вероятностных!) рассуждений.
ГЛАВА П! ВЕРОЯТНОСТЬ В НЕКОТОРЫХ ЗАДАЧАХ КЛАССИЧЕСКОЙ СТАТИСТИЧЕСКОЙ МЕХАНИКИ I. Хотя в кинетической теории газов с самого начала пользовались (особенно Клаузиус) аргументами, заим- ствованными из теории вероятностей, только после за- мечательных работ Максвелла и Больцмана (прибли- зительно с 1870 г.) был отчетливо поставлен вопрос о существе и роли теоретико-вероятностных рассужде- ний в физике. Чтобы понять и оценить некоторые трудности и за- дачи, связанные с подходом Максвелла — Больцмана, мы кратко изложим классический вывод уравнения Больцмана. Больцман рассматривает систему из W частиц (кото- рые он считал твердыми шариками диаметра б), заклю- ченных в объеме V. В предположении пространственной однородности он выделяет частицы «А» (скорости кото- рых равны v с точностью до бесконечно малого эле- мента dv) и частицы «В» (скорости которых равны w с точностью до dw). Затем он переходит к нахождению числа столкновений между частицами «А» и «В» в тече- ние времени dt, при которых линия центров направлена вдоль единичного вектора I с точностью до бесконечно малого элемента dl (на поверхности единичной сфе- ры) 1). Этот подсчет (который можно найти в любом учебнике по кинетической теории газов) проводится так. Для того чтобы частица «А» столкнулась указанным образом с частицей «В», должно выполняться неравен- ство (111.1.1) (w-v)l<0 1) Можно назвать их (v, w, I) столкновениями.
Вероятность в задачах классической механики 81 и центр частицы «В» должен лежать внутри косого ци- линдра («цилиндра столкновений»), опирающегося на площадку д2</1 на поверхности сферы радиуса 6, с осью, направленной вдоль w —v и имеющей длину |w — v\dt. Объем этого цилиндра, если принять во внимание (III. 1.1), можно записать в виде (Ill. 1.2) 62 у (|(w — v) • 1| — (w — v) • \)dldt. Обозначая через Пд и пв соответственно число ча- стиц класса «Л» и «В», мы получаем (предполагая про- странственную однородность), что число столкновений указанного типа равно (III. 1.3) «д«в(Л2/Ю— v) • 1| — (w — v) - 1)лГ/Л. Кроме того, предполагается, что (111. 1.4) nA = Nf(v, t)dv, nB = Nf(w, t)dw. После того как указанное столкновение произойдет, ско- рости частиц v и w изменятся и перейдут соответствен- но в (111.1.5) v + ((w — v)-l)l и w — ((w — v)-l)l (подсчет основан на законах сохранения энергии и ко- личества движения при упругом столкновении). Теперь без труда выводится уравнение (III. 1.6) = dw f di{771-//1}|(w-v) l|, S(l) где c = N/V, f = /i=/(w;/), 7=/(v+((w —v)-I)I; /), 7i=/(w —((w-v)-I)l; /), S(l) — поверхность единичной сферы. 2. Приведенный вывод на первый взгляд кажется непогрешимым, а окончательное уравнение (111.1.6) (уравнение сохранения, выражающее то обстоятельство, 6 м. Кац
82 Глава HI что число пА может уменьшиться за счет (v, w, 1)- столкновений и увеличиться за счет (v+((w — v) *1)1, w—((w— v) •!)!, 1)-столкновений ')) выглядит очень естественным. Поэтому кажется удивительным, что урав- нение (III. 1.6) допускает крайне парадоксальное след- ствие. А именно из него непосредственно следует зна- менитая Я-теорема Больцмана, утверждающая, что (111. 2.1) 4- f dvf(v; /)log/(v; t) <0, причем равенство достигается только для / = const • ехр (— av • v). Эта теорема замечательна тем, что она перебрасы- вает мост между механикой и термодинамикой. Дейст- вительно, Больцман видел в ней механическое обосно- вание второго закона термодинамики, где величина Н= J dv/(v; /) log/(v; t) принята за энтропию с обратным знаком. 3. Однако утверждение Я-теоремы нельзя понимать буквально, поскольку в таком наивном толковании она противоречит механике. В самом деле, все уравнения механики обратимы во времени (инвариантны относительно преобразования t-i—t), в то время как Я-теорема выделяет некоторое направление времени. Это было самым ранним возра- жением против подхода Больцмана; его выдвинул впер- вые Лошмидт в 1876 г. (оно называется обычно «пара- доксом обратимости»). Лошмидт просто заметил, что если газ, находясь в некотором состоянии So, перейдет по прошествии времени t в состояние St, то по предпо- ложению должно быть Ht < Яо. Обратим теперь напра- вления всех скоростей. Тогда, с одной стороны, за вре- *) Внимательный читатель заметит, что здесь использован сле- дующий факт: преобразование .4(1) : (v. w) -> (v + ((w—v) • I)I, w—((w—v) •!)!) совпадает с преобразованием Л(—- 1).
Вероятность в задачах классической механики 83 мя t состояние St должно снова вернуться в So, а, с дру- гой стороны, больцмановская Я-теорема снова утвер- ждает, что Таким образом, величина Н не могла бы измениться. (На это возражение Больцман, говорят, ответил: «Ступайте, поверните их!») Более существенное возражение исходило от Цер- мело и состояло в том, что, согласно теореме Пуанкаре о возвращаемое™ (Wiederkehrsatz), замкнутая механи- ческая система должна (если только она не находилась в некотором исключительном начальном состоянии) вер- нуться в конце концов как угодно близко к своему ис- ходному состоянию. Таким образом, если бы Н была чисто динамической величиной, она не могла бы всегда убывать. Стараясь отвергнуть это возражение, Больцман ука- зал на то, что промежутки времени между возвраще- ниями (так называемые циклы Пуанкаре) чудовищно велики (он, как говорят, ответил: «Долго же вам при- дется ждать!»). Теорема Пуанкаре настолько проста и настолько фундаментальна, что мы прервем наше изложение, что- бы доказать и обобщить ее. 4. Состояние физической системы с п степенями сво- боды можно изобразить точкой в 2п-мерном простран- стве (так называемом фазовом пространстве, или Г-про- странстве). Координатами точки в Г-пространстве слу- жат ^1> • • •• Р\' •••> Рп> т. е. обобщенные координаты и канонически сопряжен- ные им импульсы. Поведение системы определяется функцией Гамиль- тона .....Ри •••. Рп) (предполагается, что Н не зависит явно от /), а урав- нения движения имеют вид dq( дН dp, дН dt dpt ’ dt dq{ ' 6*
84 Глава III Из этих уравнений вытекает, что Н (так мы обозначаем теперь гамильтониан, и его не следует путать с И из п. 2) является постоянной движения (закон сохранения энергии); мы предположим, что поверхность постоянной энергии Н(Чх.....qn, Pi, .... Р„) = Е является ограниченным множеством. Допустим, что в начальный момент наша система находится в точке Рп = (Чг •••• # Р°......43- Ее положение в момент времени t задается решением уравнений движения -Рг •••• Р^ О’ Pi(i) = giW......О- Эти формулы определяют однопараметрическое семей- ство Tt преобразований Г-пространства в себя Pt = TtPa. Преобразование Tlt как это утверждается в извест- ной теореме Лиувилля, сохраняет обычную меру Лебега в Г-пространстве: мера Лебега множества Tt(Л) равна мере Лебега множества А. Если рассматривать нашу систему только на поверх- ности постоянной энергии H(qit ..., qn, pi, • •, Рп) = Е, то из теоремы Лиувилля вытекает следующее. Опреде- лим меру ц(Л) множества А на поверхности постоян- ной энергии формулой ц(Л)= J ||grad//||-1 do А (мы предполагаем, что llgrad Я||>с>0 на этой поверх- ности, так что мера всей поверхности конечна; собствен- но, достаточно ввести только это предположение, не ого- варивая отдельно, что вся поверхность ограничена), где
Вероятность в задачах классической механики 85 da — элемент поверхности и ’ л I L/=i Тогда |1(Л(Л)) = и(Л). После такого введения мы можем описать ситуацию чисто математически. На множестве й (поверхность постоянной энергии) задана вполне аддитивная мера р, такая, что ц(й) = 1 (последнее принимается для удобства; важно только, что ц(й)<оо). Далее, существует однопараметрическое семейство взаимно однозначных преобразований Tt, со- храняющих меру. (То обстоятельство, что в механике преобразования Tt взаимно однозначны, тривиально вы- текает из уравнений движения.) Теорему Пуанкаре о возвращаемости можно теперь сформулировать так. Пусть А — такое подмножество в й, что р(4)>0. Тогда для почти всех <о £ А (т. е. за исключением мно- жества точек <о ц-меры нуль) найдется сколь угодно большое /, такое, что Гро £ А. Существует много доказательств этой теоремы, и все они почти тривиальны *)• Мы выбираем одно из них (совсем не самое простое), удобное для наших целей. Прежде всего, вместо того чтобы рассматривать не- прерывное время, будем считать его дискретным и рас- смотрим лишь последовательность Гро, Г2<о, .... Ясно, что Т2=Тъ Т3=Т1.......... Пусть теперь At — множество таких точек <о, что ю£Л, Гро^Л. ') Это еще один пример важного и глубокого факта, чисто ма- тематическое содержание которого лежит почти на поверхности.
86 Глава III Обозначим через Ап множество тех <о, для которых <о£Л, 7><Л, .... Тяа£А. Иначе говоря, имеем Л^ЛПТТ’Л. Д2=ЛПС(7Т'Л)П7Т2Л Л^ЛПССЛЛ^ПССТТ^П ••• ПС(ГГ("-пЛ)п7ТлЛ, где через С (В) обозначено дополнение к В (в мно- жестве $2). Пусть /(со)—характеристическая функция множе- ства А, т. е. | 1, ®£Л, /(w) J Q( ы(£А. Тогда характеристическая функция множества Ап рав- на, очевидно, /М(1 —/(Л®)) • • • (1 - ZCrr1®))/(Г М и, следовательно, и(Л.)=f /И(1 -/(Л®)) ...(i-Xrr’oJMrMrfp. & Положим = / (1 - / (®)) (1 - /(7>)) - • • (1 - / (П<о)) dg 2 и заметим, что |1(Л„) = «»л_1 — 2w„ + w„+I (w0=l). При выводе этой простой формулы мы существенно пользуемся тем, что преобразование 7\ сохраняет меру. Действительно, если взять, например, ц(Л3), то можно
Вероятность в задачах классической механики 87 написать: Ц (Д31 = f f (®) (1 - /(7») (1 - f (7'i®)) / (?М du = & = f (1 - f (Л®)) (1 - f - & - f (I - f (T,®))(1 - f - f + s + f (1 - f (®)) (1 - f (Л®)) (1 - f (T?®) ) (1 - f s Поскольку Л сохраняет меру, два средних интеграла равны друг другу. Отсюда р (Л3) = w2 — 2w3 + w4. Заметим теперь, что НЛ0+ ••• + и(Л„) = 1 — w, —(w„ — w„+i), и так как последовательность {wn} не возрастает и огра- ничена снизу (нулем), то lim wn существует и, следо- вательно, lim (w„ — wn+1) = 0. Таким образом, Sh(A>) = i—= 1 Итак, почти каждая точка © множества А такова, что по крайней мере одна из ее итераций Ti®, Г?©, ... должна попасть в А. Отсюда немедленно вытекает, что для почти каждой точки w из А бесконечно много ее итераций попадает в А. В самом деле, пусть D,— множество тех © из Л, для которых Тп© не принадлежит А при п > /. Приме- няя только что доказанную теорему к преобразованию Т{ (вместо Л), мы получаем p(Dz)=0 и, следовательно,
88 Глава III также h(Ud»)=°- \/=i / Таким образом, почти каждая точка из А бесконечно много раз возвращается в А. Теорема Пуанкаре дока- зана. 5. Теперь у нас имеется способ вычислить и среднее время возвращения (или, как его часто называют, цикл Пуанкаре). Для дискретных наблюдений (дискретное время с промежутком единица) среднее время возвра- щения определяется формулой в’ = 77лг2^<л*)- «>1 Выбирая промежуток времени между наблюдениями, равный т секунд, и заменяя, следовательно, Л на Т мы получаем СО *-i Далее, л л Д Л|1 (Л*) = k (w*_! — 2w* + w*+1) = = 1 — wn — n — w„+1), n и поскольку последовательность S Ац (АЛ) не убывает, последовательность wn+n(wn — a>n+i) не возрастает. Так как очевидно, что wn+^(^n — wn+1) >0, то предел lim [wn + n(w„ — w„+1)] л->оо существует, и поскольку lim wn также существует, мы заключаем, что существует и предел lim n(w„ — ®л+1). Л->ОО Кроме того, ряд (Wj — — w3)-f- ...
Вероятность в задачах классической механики 89 сходится (это равносильно существованию предела lim wn) и, следовательно, lim n(wn — wn+1) = 0. Л->ОО Окончательно, 2 Лц(Л*)= 1 — lim w„. 1 Л-» JJ Наиболее интересен случай, когда lim w„ = 0. Л->ОО Это условие, разумеется, не всегда выполняется, но оно заведомо имеет место, если предположить, что Тх «мет- рически транзитивно»1)» т- е- всякое множество, инва- риантное при преобразовании 7\, имеет ц-меру либо О, либо 1. Чтобы убедиться в том, что метрическая тран- зитивность влечет за собой условие limwn=0, заме- тим, что lim wn равен мере множества тех точек <*>, для которых <о (£ А, Т,(д А, А, .... Обозначим это множество через В. Рассмотрим множество 7\В. Если ©ел#, то №©6 я. т. е. ТГ’и^А, ©£а, Т-и^А, ..., и, следовательно, w £ В, т. е. Т. В с В. Аналогично Т^ВсТ-В и т. д. Положим С = lim Т" В и заметим, что ТХС=С. В силу метрической транзитив- ности мера ц(С) равна либо 0, либо 1. Поскольку *) В нашей литературе чаше употребляется термин оргодич- но». — Прим, переа.
90 Глава III ц (Т"в) = |л (В) и Т"+1Вс:Л'В, отсюда следует, что н(С) = р(В), т. е. мера ц(В) равна либо 0, либо 1; ц(В) не может равняться 1: это означало бы, что р(Л)=0 вопреки нашему предположению. Таким образом, н(В)=0, т. е. lim w„ = 0, и, следовательно, для мет- рически транзитивного преобразования (111.5.1) 0’ = т/и(Д). Как хорошо известно, метрическая транзитивность играет важную роль в эргодической теории. Однако узнать, какие гамильтонианы приводят к метрически транзитивным преобразованиям, — почти неразрешимая задача. Таким образом, с точки зрения механики формула (III.5.1) сравнительно бесполезна. Она имеет также тот недостаток, что при стремле- нии т к нулю (т. е. при переходе к непрерывным на- блюдениям) мы всегда получаем тривиальный предел 0. Это легко исправить, если заметить, что такое выро- ждение происходит за счет рассмотрения события {© £ А, 7\ю£Л}как возвращения через время т. Для непрерыв- ного движения «вероятность» этого события, т. е. Л®£Л)/и(Л), должна быть очень близка к единице, и, следовательно, на долю этого «ложного» возвращения (через время т) приходится почти весь вес. Следуя Смолуховскому, определим среднее время возвращения формулой 0т = т2Лц(Л*+1)/ 5и(Л*.н). 1 I i Мы имеем (предполагая, что Тх метрически транзи- тивно) 2 нМ*+1) = нМ) — И (А). 1 <30 <30 ОО 2 (л*+1) = 2 (k +1) и (л*+о - S и (А+1) = 1 1 1 = 1 —и(А)-(МА -и(А)) = 1 — МА.
Вероятность в задачах классической механики 91 и окончательно 0t = т [1 - и (АЯ/[И (Л) -11 (® € А Л® € А)|. Этой формулой можно уже пользоваться для пре- дельного перехода при т-»-0; все зависит теперь лишь от существования предела lim т-1 [р (Л) — ц(со£Л, 7\ю£Л)]. т->0 Хотя понятие среднего времени возвращения и играет важную роль при изучении основ статистической механики, ясно, что это весьма грубое понятие. Явление выхода и возвращения точек множества А, вообще говоря, слишком нерегулярно, чтобы его можно было адекватно описать с помощью одного только сред- него цикла. К несчастью, средний цикл является един- ственной количественной характеристикой, применимой к общей механической системе, но даже и в этом случае мы должны опираться на почти непроверяемое допуще- ние о метрической транзитивности. 6. Результатам пп. 4 и 5 можно придать другую форму, которая на вид отличается от предыдущей, хотя формально ей эквивалентна. Допустим, что на множестве S2, на котором опреде- лена вполне аддитивная мера ц, задано однопарамет- рическое семейство X(t\ ©) (© £ £2, —оо</<оо) веще- ственных ц-измеримых функций (т. е. для каждого t множество тех точек <о, для которых X(t; со)<а, ц-из- меримо при каждом вещественном а). Такое семейство называется случайным процессом. Процесс называется стационарным в узком смысле (или строго стационарным), если |i {X (/х; со) < а„ .... X (tn-, со) < <х„) = =нИ(Л+т; ю)<«1..........*(Л.+т; ®)<ал} для всех наборов tt, t2, ..., tn, х, at, а2, ..., an- Поскольку все это может показаться чересчур аб- страктным и ничем не оправданным, мы попытаемся вкратце объяснить сущность того, что мы стремимся формализовать.
92 Глава III Когда физик говорит о «смещении Х(1) броуновской частицы за время /», для него это, разумеется, не озна- чает, что X (/) есть точно определенная функция t; он имеет в виду, что X(t) зависит не только от I, но и от чего-то еще, что неопределенно (и вводя до некоторой степени в заблуждение) называют «случаем». Опознав «случай», физик обращается к статистиче- ской теории, задача которой — предсказывать вероят- ности осуществления нли неосуществления некоторых событий. Чтобы построить такую теорию, он должен (что мы неоднократно подчеркивали в гл. I) приписать вероятности некоторым «элементарным» событиям, с по- мощью которых, по-видимому, могут быть вычислены остальные нужные вероятности. Эту ситуацию можно формализовать, определяя слу- чайный процесс, как это было сделано выше. Выбор множества $2 не имеет существенного значе- ния; оно играет чисто вспомогательную роль. Мы могли бы на самом деле выбрать в качестве й множество всех допустимых функций Х(1) и рассматривать © как обо- значение соответствующей функции. В связи с этим возникла довольно важная матема- тическая задача, о которой здесь стоит хотя бы упомя- нуть. Физическая теория доставляет нам множество функций o(alt а2, /2; a„, t„), которые, как мы надеемся, будут служить вероятно- стями Р {*(/>)< а,....*(Q<aJ, если вообще такие вероятности могут быть подходящим образом определены. Вопрос, таким образом, состоит в следующем: су- ществуют ли множество Й с вполне аддитивной мерой ц (вероятностью) и семейство измеримых функций X(t\ ©) (© £ й), такие, что ₽{-¥(/,)< а,....*(/„)< а„} = =И ©) < а,.........X(tK-, ©) < ая)=о(а„ ...; а,„ t„).
Вероятность в задачах классической механики 93 Подразумевается, конечно, что функции о удовлетво- ряют очевидным условиям согласованности, например lim <х„, /я) = о(а1,/1; а„_1, /„_))• в ->оо п Положительный ответ на этот вопрос был дан Колмо- горовым и в более общем виде Дубом. Окончательная теорема, несмотря на свою несомненную важность — в ней устанавливается существование тех объектов, о ко- торых пойдет речь, — обычно мало касается более анали- тических аспектов теории вероятностей. Однако имеются исключения, и в гл. IV мы вернемся к этому вопросу. Теперь же мы просто перефразируем результаты пп. 4 и 5 в терминах стационарных случайных про- цессов. Предположим, что X(Z; со)—строго стационарный случайный процесс и А — такое множество веществен- ных чисел, что множество тех со, для которых X(t; со) £ £ А, измеримо и имеет положительную меру [из стацио- нарности следует, что вероятность Р {Х(/; со)£ Л) =И {Х(Г, со)£Л) одна и та же для всех /]. Определим теперь следующие величины: W,(A) = W (А) = Р {X (t\ со)€Л}, ГС\(Л, Л, ..., Л, Л) = Р{Х(0; ю)€ Л, Х(т; <о)£л, ... .... Х((п — 1)т; со)(£л, Х(пт; со)ел), Р(Л| Л, .... Л, Л) = 1ГТ(Л, А, ..., А, Л)/ГТ(Л)‘). л-1 ' (Напомним, что IF, (Л) = IF (Л) > 0.) Тогда 2Р(Л| Л, ..., Л, Л) = 1 и = 1 ----------- ') Это по определению так называемая условная вероятность того, что, выходя из множества А в момент времени t=0 и двигаясь шагами продолжительностью т, мы вернемся первый раз в А через п шагов.
94 Глава III И (III. 6.1) 3 лтР (АIА....А, А) = x/Wx (А) = xJW (Л), И=1 если предположить, что (III. 6.2) lim НМЛ Л...........А) = 0. л->со ' п (Определения Wx (А, ..., А) и аналогичных величин очевидны.) Аналогом среднего времени возвращения по Смолу- ховскому является, очевидно, величина (III. 6.3) ex = x[l-W(A)]/[W(A)-Wx(A, А)]. Эти формулы выводятся при помощи прямого повто- рения простых шагов, намеченных в пп. 4 и 5. Если при этом следить за выкладками, то можно ясно увидеть, где используется условие строгой стационарности. Можно было бы также получить эти формулы из анало- гичных формул в пп. 4 и 5, если ввести некоторое искус- ственное преобразование Tt, сохраняющее меру (так называемое «преобразование сдвига»). Обратно, читатель может заметить, что функция f(7\<o) в п. 4 задает, в соответствии с нашим определе- нием, стационарный случайный процесс. Таким образом, «динамические теоремы,» в пп. 4 и 5 и «статистические теоремы» (III.6.1) и (III.6.2) этого пункта с чисто математической точки зрения эквива- лентны. Сделаем еще одно замечание относительно (III. 6.2). Пусть Хд(х)—характеристическая функция множества А (т. е. %а(х) = 1 для х £ А и %А(х) =0 в противном слу- чае); рассмотрим Ит / <0))+ • • • + Хд a>))]-lF(A))2d|i.
Вероятность в задачах классической механики 95 Мы имеем /(1[хд(А’(т; (о))+ ... + Хд (А’(пт; «))] - W (Л))2 dg > & >+Хд(А’(«т; <о))]-1Г(Л)рИ1 Чп где Q„ — множество, на котором X (т; ю) (£ А, .. .... Х(пх\ <а)(£А, и, следовательно, f (^1ХдИ(т; ®))+ ... +Хд(*(«*; а)))]-Г(Л)рЦ> s >r2(A)U7T(A......А). л-1 Теперь легко проверить, что если (III. 6.4) lim Р {X (0; со) £ А; X (пт; со) £ А) = Г2 (А) (асимптотическая независимость!), то lim f NrlXA^fr <о))+...+Хд(А’(пт; ю))]-Г (A)f dM=0 «->00 * ' " и, следовательно, (III. 6.5) lim №\(А...........А)=0. Л^ОО 4 1 1 1 ' Свойство (III.6.4) (называемое «сильным перемеши- ванием») влечет за собой метрическую транзитивность, и, следовательно, его проверка для динамических си- стем почти безнадежна. Для многих же «статистиче- ских» систем (III. 6.4) легко проверяется. 7. Возражения Лошмидта и Цермело обнаруживают несостоятельность наивной формулировки Я-теоремы. Формулу для числа соударений («Stosszahlansatz») (III. 1.3), на которой основан вывод уравнения Больц- мана, нельзя рассматривать как простое следствие урав- нений механики, поэтому необходимо некоторое допол-
95 Глава HI нительное истолкование. Сам Больцман предложил ин- терпретировать Я-теорему статистическим образом. Несмотря на блестящее исследование П. и Т. Эрен- фестов, осветившее местами неясные идеи Больцмана и значительно подкрепившее их правдоподобность, этот вопрос даже теперь (через 45 лет после появления ра- боты Эрепфестов!) решен далеко не полностью. Обсуждаются, говоря в общих чертах (и несколько расплывчато), две проблемы: I. Можно ли примирить обратимость во времени и теорему о возвращаемости с «наблюдаемой» необрати- мостью? П. Возможно ли такое примирение в рамках клас- сической механики? Первая проблема, по существу, логического харак- тера. Утвердительный ответ может быть получен, если будет указана модель, обладающая всеми требуемыми свойствами. Такая модель была предложена П. и Т. Эренфестами в 1907 г. Это, вероятно, одна из наиболее поучительных моделей во всей физике, и хотя это только пример ко- нечной марковской цепи, она представляет большой са- мостоятельный интерес. Модель в первоначальном ее виде можно описать так1): 2R шаров, занумерованных от 1 до 2R, раскла- дывают по двум ящикам А и В. Затем «случайно» выби- рается целое число между 1 и 2R, и шар с этим номе- ром перекладывают из коробки, где он лежит, в другую. Эта процедура затем повторяется много раз. Интуитивно совершенно ясно, чего можно ожидать. Предположим для простоты, что сначала все 2R ша- ров находятся в ящике А. Тогда на первом шаге мы обязательно перенесем шар из А в В. На втором шаге мы можем вернуться к начальному состоянию, но ве- роятность этого равна (2J?)*1. Если 2R очень велико (скажем, порядка 1023, что сравнимо с числом Авогад- ро), то с подавляющей вероятностью, а именно 1 — — (2/?)-1, в коробку В попадет и следующий шар. В действительности до тех пор, пока пА (число шаров ) Ее часто называют «.моделью пса и блохи».
Вероятность в задачах классической механики 97 в А) будет намного больше пв (числа шаров в В), мы будем наблюдать «перетекание» шаров из А в В. Если наше математическое понятие вероятности от- ражает какую-либо «реальность», то мы должны ожи- дать «почти необратимого» течения в предпочтительном направлении. •••••••••в «•••••(«••«•••••а •• •••••ввааввававаааавава в! а •оааавваэаааааеаававаааеааааааававаааааа aeaeeaaaaaeeeaeiaeaaaaaeaeeBaaaeaaaeeaaewaaeaB аяв»евааааааааа1аэваааеаааааааааааааавваавааав авве!ваааааеваааав!аааааааааааеаааааавааяв»ааа ••аа*******аа"!"аааеаааа!ваавв!!в""вваа эвав1ввэва»ввеваа8аавваваяававаааввавеваааваав aaaaati laaaiaiaaiaaiaaaaaaaaiaiaaiailaaaiaaai •еа««э<аав8вааваэааевваавваааеаввавввввввввяав яавэ|1ввав<1*1аааввов1е«вва*|аав!а*аеввва«ааав ввав>аавев>а*|аавваве|ааввв(а(ав»>«ав8вваааеов । laiBBK <Bat< i <•••<> I >ai 1 I аваа»аввааавава>1<вввввваааааааааавав>1*ааа>а* 0 tt 80 30 40 50 60 70 80 90 Рис. 2. Ордината на этом графике соответствует значению величины |лА(«)~лв(«)|-2|ял («)-*|. Мы не можем сказать с определенностью, что nA(s) (число шаров в А после s шагов) всегда убывает, но мы можем с уверенностью ожидать, что в некотором смысле nA(s) убывает «почти всегда»’)• Этот эксперимент был действительно осуществлен с сорока шарами; получившаяся кривая воспроизведе- на на рис. 2. Как с помощью этой модели опровергнуть возраже- ния Лошмидта и Цермело? *) Здесь невозможно не привести эпиграф к главе об энтропии из известной книги М а у е г М. G., Mayer J., Statistical Mechanics: «What never? No never! What never? Well, hardly ever». [Это пере- водится приблизительно так: «Этого никогда не бывает? — Никогда! Совсем никогда? —Ну, вряд ли когда-нибудь». — Прим, ред.] Эта самая образная и лаконичная формулировка, в которую Гильберт и Сулливаи облекли второй закон термодинамики в его статистиче- ском варианте, поистине великолепна! 7 м. Кац
98 Глава III Чтобы посмотреть, что происходит при обращении времени, вычислим вероятности (Ш. 7.1) P{«A(s + l) = /i|/ix(s) = m} [т. е. условную вероятность того, что пА($+1)=я, если nA(s)=m] и Р|Лд(« — 1) = л1 «л («) = ») (т. е. условную вероятность того, что nA(s—1)=я, если nA(s)=m). С помощью довольно простых рассу- ждений мы получаем Р{ла(« + 0 = л1 ла («) = «) = = (2/?)-1 тб(п — т4-1)4-(2/?)’1 (2R - т)Ь(п— т — 1) [6(1) — символ Кронекера]. Несколько труднее вычис- лить Р{«а(« — Ь = л1 «а («) = «)• Чтобы сделать это и отчетливее понять смысл условных вероятностей, сформулируем нашу задачу более точно. Если положить Яд(О)=По. то выборочным простран- ством S будет служить множество бесконечных после- довательностей «о. я(, «2, ... неотрицательных целых чи- сел, заключенных между 0 и 2R, причем "‘“{я^-1. Элементарными событиями служат множества последо- вательностей, первые / (/=1, 2, ...) элементов которых фиксированы. Например, множество всех последователь- ностей, начинающихся с чисел л0> 4“ 1. ®0» представляет собой элементарное событие. Мера на элементарных множествах задается, как это следует из описания самой модели, следующим образом: (III. 7.2) Р (»ol л1) P (я, | /Ч) ... P fa-d я,).
Вероятность в задачах классической механики 99 где Р(«л-11пл) — вероятность перехода от n*-i к пк, определяемая формулой Р(л*-11 Л*) = (2Я) *л*-16(л* — л*-1+ D4- + (2/?)-*(2/?- л*_1)д(лд — л*_1 — 1). Рассмотрим теперь вероятность Р(лл(5-1) = л; nA(s) = m). Эта вероятность по определению равна 2 Р («о I «О Р (л> | Яг) • • • Р (л4-11лЛ |жл» причем суммирование распространяется на все nj, я2, • •л«-2 [из формулы для Р (n*_J л*) уже вытекает, что пк равно либо Ял-1+1, либо n*-i — 1]. Искомая условная вероятность определяется отношением Р-!) ..,|„м=„, = , причем условная вероятность (III.7.1) равна (по опре- делению) , . . , . Р1пл(5 + 1) = л; лл(5) = т) Р [пА (s +1) = п I пА (s) = m) = 2_-А---------1. Снова используя определение условной вероятности, мы можем написать Р{лл(«—1) = л, nA(s) = m} = = Р[лл(«—1) = л} • Р{лА($) = т| nA(s — 1) = л) = = P{«A(s-l) = n)X X {(2/?)’1 nb (m — n 4-1) + (2/?)’’ (2R — n) 6 (m — n — 1)}. Наконец, (III. 7.3) P (.л(,-1)=.| пм = п,} x X l(2/?)_1 nb(m -n 4-1)4-(2R)~1 (2Я - n)6(m - n -1)}. 7*
100 Глава III Напомним, что мы положили пА(О)=по. Таким обра- зом, вероятности P{nA(s — 1) = н) и P(nA(s) = m} (и, следовательно, их отношение) могут зависеть (и в дей- ствительности зависят) от По1). Можно надеяться, что при s —> оо существует предел lim Р {nA(s) = m| =W(m) (W(m) не зависит от п01). Физически мы именно этого и ожидали; такое положе- ние вещей соответствует нашему ощущению (а может быть, только сильному желанию!), что с течением вре- мени вероятность обнаружить систему в состоянии т полностью определена и не зависит от начального со- стояния. К сожалению, для модели Эренфестов это не так! Истоки этой трудности неглубоки, но мы несколько отложим ее обсуждение. А пока мы попробуем выйти из затруднения с помощью одного простого приема. Вместо того чтобы фиксировать число н0, мы будем считать его распределенным с вероятностями / » \ W(n0) (W(nJ>0. 2 IF (/io) =1 . Иными словами, в качестве выборочного пространства S мы возьмем теперь множество всех последовательностей Но, «1, Hj, ... (но может принимать любое целое значение между 0 и 2R), а меру элементарного множества будем считать равней не (Ш.7.2), а величине (111. 7.4) IF (Ио) Р (Иц | nJ ... Р (н,_ х | н;). Мы получим Р («Л(*)=«) = 2 ЮГ(Я0)Р(Я0|Я1)...Р(Л,_1|т). Л0’ Л1.Л1-1 Постараемся выяснить, можно ли распределение W'(Ho) выбрать так, чтобы для всех $ выполнялось равенство Р [пЛ (s) = т} = IF (hi). ') Правильнее было бы записать эти вероятности так: •Р {лд(э —1) = л|лд(О) = ло} и Р р1д(э) = т|лд(О) = ло].
Вероятность в задачах классической механики 101 Ясно, что этого можно добиться, если система урав- нений 2/? (Ill. 7.5) W(m) = 2 Р(«olm) (m = 0, 1, 2, ..., 27?) nt=U имеет решение в неотрицательных числах. Легко видеть, что единственное ее решение [нормиро- ванное так, что 2 V7(m) — 1] равно W(m) = C&- 2'зд. Выбрав это решение и соответственно определив вероят- ности [см. (III.7.4)], мы найдем Р[лд($ —1) = л|лд($) = /п| = = ^№)''nb(n-m-V) + + (2Я)_,(2/?-л)й(л-/п+1)}. Теперь без труда проверяется, что Р {пА (s — \) = n \пА(s)=m} = Р [пА ($+1 )=и | пА (s)=m}. Таким образом, оказывается, что наша модель (при подходящем выборе начальных вероятностей) обратима во времени! В этом месте мы воспроизведем весьма поучительные выкладки, принадлежащие Эренфестам. Рассмотрим условную вероятность Р [лд(5—l) = /n —1, Лд(5-(-1) = /П — 1 |лд(х)=/п}, которая, очевидно, равна Р{лд(д—l) = m —1, лд($) = т, лд($+1) = т —1} р{»д («) = »») — Р (дд (s — 1) = m — 1} Р (т — 11 т) Р (т | т — 1) ~ р[«д («) = я|| = (27?)"* (27? — л» +1) (27?)“1 т = (27?)“2/п2. С2Я С другой стороны, аналогичные выкладки дают Рlnx(s — l)==/n-j- 1,ЛД(S 4- 1) = /П — 1 |лд(5) = /п) = = (27?)"2/п(27?-/п)
102 Глава Ш и, наконец, Р (лл($ — 1) = /п + 1, лл($+1) = /п+1 |/1л($) = /п} = = (2ЯЛ 2(2Я - и)2. Отсюда следует, что если т близко к 2/? (т. е. мы да- леки от равновесия), то чередование от т —1о от —I значительно более вероятно, чем остальные располо- жения: m-l-lo om + 1 т+1о от + 1 то от от * т — 1о от —1 Это просто означает, что если из множества всех «кри- вых» п0, nt, п2, .... пробегаемых последовательными значениями пл, мы вы- бираем подмножество, определенное условием лл($) = /п, то в подавляющем большинстве «кривых» этого под- множества осуществляется именно первое чередование. Этот несложный анализ подводит нас к истолкова- нию, казалось бы, бессмысленного и парадоксального утверждения Больцмана, что каждая точка Я-кривой является максимумом. Статистическая интерпретация (подобная только что изложенной) придает смысл этому утверждению и со- гласуется как с обратимостью во времени, так и с тен- денцией к убыванию. Чтобы лучше оценить роль распределения W(m) = CfR2-2R, мы обратимся сейчас к возражению Цермело.
Вероятность в задачах классической механики 103 Снова рассмотрим выборочное пространство S всех последовательностей п0, Л„ п.2, ... (каждое п, — целое число, заключенное между 0 и 2R), определяя меру элементарных множеств формулой (111.7.4). Полагая © {л0, л,, л2, ...} и -¥($; ®) = л1 (s = 0, 1, 2, ...)’), мы можем легко убедиться в том, что X(s; со) —строго стационарный процесс (время теперь считается дискрет- ным). Таким образом, применяя «статистический ва- риант» теоремы Пуанкаре, мы получаем (111.7.6) S Р(л0|п0...........«о. «о) = 1. *=1 ’ ГП где Р(Л0| Лр, ...» Др, Лр) Гч обозначает вероятность того, что если вначале в ко- робке А находилось л0 шаров, то первый раз там снова окажется лр шаров через k шагов (йр — любое целое число, отличное от п$). Другими словами, каждое начальное состояние и0 снова достигается с вероятностью 1. Можно доказать формулу* 2), аналогичную (III.5.1), и найти тем самым, что среднее время возвращения 0* равно (111. 7.7) 0* = 1лР(Лр|ло.......Лр, Лр) = 1/1Г(Лр) = 22/г/^. * ----------------- *) Нетрудно распространить это определение на отрицатель- ные а. 2) Мы не делаем здесь этого, потому что ниже мы приведем другой вывод этой формулы для среднего времени возвращения.
104 Глава 111 Как мы увидим ниже, формулу (III.7.7) можно по- лучить непосредственным вычислением, не обращаясь к понятию строго стационарного процесса. Однако введение меры с помощью формулы (III.7.4) — не просто математическое ухищрение. Распределение W(m) = C?R- 2-2* играет ту же роль, что и инвариантная мера (см. п. 4) в исходной механической задаче, и формула (III.7.5) 2Л W(m)= 2 IF (/io) Р («о |/п) л,«0 служит аналогом теоремы Лиувилля. Как бы много нам ни говорили эти аналогии и как бы сильно мы ни ощущали, что модель Эренфестов ула- вливает самую суть спора между Больцманом и его оп- понентами, мы не должны упускать из виду, что фунда- ментальная проблема II (см. стр. 96) остается еще не выясненной. Обсуждаемая модель является чисто статистической, и вероятностный механизм (т. е. случайный выбор числа) заранее в ней постулируется. Этот вероятностный механизм, должным образом истолкованный, служит для того, чтобы примирить необратимое поведение с обра- тимостью во времени и возвращаемостью. 8. Возможно, стоит вкратце ознакомиться с точкой зрения самого Больцмана на то, как примирить наблю- даемое необратимое поведение с обратимостью во вре- мени и возвращаемостью. Мы следуем изложению этого вопроса в статьеЭренфестовв*Епс. Math. Wiss.-» (1911). Вместе с фазовым пространством всей системы (Г-пространством) рассмотрим также фазовое простран- ство одной частицы (ц-пространство). Для одноатомного газа это ц-пространство шестимерно (три координаты и три составляющих импульса). Разобьем ц-пространство на ячейки Clt С2, ... оди- накового (шестнмерного) объема |С|.
Вероятность в задачах классической механики 105 Для каждой точки Г-пространства (т. е. для любого заданного состояния всей системы) мы получим после- довательность целых чисел («чисел заполнения») «1, п2. ••• (П1+П2+ ••• =N — общее число частиц), ука- зывающих, сколько частиц находится в соответствующей ячейке €•>, ... . Обратно, всякий набор чисел щ, «2....удовлетворяющий условию определяет множество Z (называемое «Z-звездой») то- чек в Г-пространстве, для которых эти числа служат числами заполнения. Объем (6/У-мерный) Z-звезды ра- вен, очевидно, Предположим теперь, что ячейки С4 достаточно малы. Обозначим через е, энергию частицы, попавшей в некоторую точку ячейки С,- (важно подчеркнуть, что мы пренебрегаем энергией взаимодействия между частица- ми!). Тогда с большой точностью можно написать ^п^ = Е, где Е — полная энергия системы. С другой стороны, ячейки должны быть все-таки та- кими, чтобы числа п,- были достаточно велики. Больцман находит те значения л4, для которых вы- ражение достигает максимума, при дополнительных условиях (111. 8.1) (III. 8.2) 2л, = М 2л,е,=£. Это делается при помощи сомнительного (с матема- тической точки зрения!) метода замены п,! по формуле Стирлинга (именно поэтому нужно, чтобы числа п, были большими), после чего рассматриваются как непре- рывно меняющиеся переменные.
106 Глава И! Задача, таким образом, сводится к нахождению ми- нимума выражения S log nt при дополнительных условиях (III.8.1) и (III.8.2). От- вет дается формулой (111. 8.3) nt = а ехр (— ₽е,), где аир определяются подстановкой решения (III. 8.3) в формулы (III.8.1) и (III.8.2). Эренфесты дают следующее пояснение к рассужде- ниям Больцмана. (а) При числах заполнения (III. 8.4) л, = а ехр(—ре,) объем Z-звезды не только достигает максимального зна- чения, но и становится «подавляюще» большим. Это оз- начает, что «небольшие» отклонения от (III.8.3) ведут к «чудовищному» уменьшению объема Z-звезды. (б) Z-звезда, соответствующая числам заполнения (III.8.4), высекает «подавляющую» часть поверхности постоянной энергии ff(Pi....Рп> <h.....= (в) Как следует из эргодической теоремы, почти все траектории, описывающие движение системы, проводят «подавляющую» часть времени в той части поверхности постоянной энергии, которая высекается максимальной Z-звездой. Таким образом, если система не находится в состоя- нии, соответствующем числам заполнения (III.8.4), то она почти наверняка попадет в это состояние; если же система уже находится в этом состоянии, то она почти никогда не выйдет из него. Хотя это утверждение почти полностью лишено ма- тематической строгости, оно представляется чрезвычайно правдоподобным. С физической точки зрения затруднения, связанные с этим методом, заключаются в том, что в нем совер- шенно умалчивается о процессе «приближения к равнове- сию» [т. е. то, каким образом, исходя из произвольных
Вероятность в задачах классической механики 107 чисел заполнения, система приходит к «равновесным» числам заполнения (III. 8.4)]; неясна также его связь с кинетическим методом (т. е. с уравнением Больцмана). В частности, неизвестно, монотонно ли приближается си- стема к равновесию. 9. Какой аналог только что обсуждавшемуся подходу Больцмана можно найти в модели Эренфестов? Предположим, что вначале в ящике А находится п0 шаров. В этом случае можно показать, что почти во всех ) последовательностях Hq, Пу п%, • • • частота появления фиксированного целого числа m равна W(m) = C?R • 2’2/?. Это и есть эргодическая теорема для нашей системы (известная также как «усиленный закон больших чи- сел») * 2). Ясно, что наибольшее значение W(m) принимает при m = R, хотя это значение и не будет «подавляюще» боль- шим. Однако, если мы рассмотрим узкий промежуток со- стояний R - а (2Я),,г < m < R + а (2/?/А, «вероятность» которого приближенно равна 2а (2л)_,/‘ J ехр (—у а2) da, -2а то для а=5 эта вероятность уже «подавляюще» больше вероятности дополнительных промежутков. ') Здесь «почти во всех» означает «за исключением множества последовательностей меры нуль». Мера строится на основании фор- мулы (111.7.4). 2) Это следует из общей эргодической теоремы, но для модели Эренфестов легко может быть доказано и непосредственно. Можно также использовать так называемую «эргодическую теорему в сред- нем», доказываемую еще проще.
108 Глава III Таким образом, если n0>R+5(2R)'lt или n0<R— — 5(2R)'li, то система очень охотно переходит в окрест- ность равновесия и, попав туда однажды, покидает эту окрестность лишь «ненадолго» ’). Этот вывод хорошо подтверждается эксперименталь- ной кривой на стр. 97. Здесь вполне уместно привести краткий обзор неко- торых идей Гиббса. Гиббс с самого начала отказывается от мысли рас- сматривать индивидуальную систему и предлагает рас- сматривать распределение систем во всем Г-прострап- стве (или еще лучше в области между двумя поверхно- стями постоянной энергии Е и Е+&Е). Если вначале системы распределены с плотностью D(px.....рп, Чх.....qa\ 0), то уравнения движения позволяют определить плотность Ог = О(/>„ ....qn‘, t) в произвольный момент времени /. Уравнение, управляю- щее изменением D во времени, — это известное уравне- ние Лиувилля л _ |4У П1 __ V pH <ЭР дН дР\ dt । ' * \ dqi dpi dpi dqt / ’ 1 где H — гамильтониан системы. Далее Гиббс пытается доказать, что Dt стремится в некотором смысле к равномерному распределению в об- ласти между поверхностями постоянной энергии Е и Е+ДЕ (микроканоническое распределение). Впервые Эренфест разъяснил, в каком смысле можно надеяться доказать это утверждение. Он предложил вве- сти понятие «крупнозернистой» плотности («Grobe Dichte»). Разобьем область между поверхностями Е и Е+ДЕ на конечное число фиксированных кусков Дь Д2,..., Дте и определим «крупнозернистую» плотность Pt таким об- *) В то время как вероятность покинуть эту окрестность равна II
Вероятность в задачах классической механики 109 разом: если £ принадлежит Д<, то = = /Di(P> 4)dP\ ••• dPnd4\ А/ (|Д,|—-объем Д,). Предположим теперь, что при /=0 плотность Do по- стоянна в каждом куске (т. е. Do=Po при / = 0). Тогда «теорема» Гиббса утверждает, что Р,(£)-> const независимо от куска, где выбрана точка £. Пытаться доказать это утверждение почти безнадеж- но; оно является более сильным, чем эргодическая тео- рема. Известные доводы самого Гиббса (основанные на аналогиях с перемешиванием жидкостей), даже если от- бросить содержащиеся в них существенные ошибки, слу- жат в лучшем случае указанием на правдоподобность этой «теоремы». Тем не менее верна следующая забавная теорема, до- казанная Эренфестом (он устранил ошибку Гиббса). Определим тр (гиббсовская «энтропия») формулой (111. 9.0) nr = 2>dP(/)iogP7)= i = f P^ogPtdpx ...dpndq, ... dqn. Тогда П/ < По- Крайне простое доказательство основано на неравен- стве (111.9.1) xlogx — xlogy — *+ у >0. Напишем П, — По = J Pt\ogPtdx — J D0\ogD0dx = = У Dt\ogPtdx — у D0logD0^T== = у (D, log Pt - Do log Do) dx, dx = dpi ... dpadqv ... dqn.
по Глава III Из теоремы Лиувилля следует, что f Do log Do dx = f D, log Dt dx, и поскольку J Dtdx = f P,dx = \, мы получаем — По = f (Dt l°g pt — Dt logDt + Dt — pt)dx. Отсюда в силу неравенства (П 1.9.1) следует, что П, < По- Эта теорема показывает, что гиббсовская энтропия (в действительности отрицательная энтропия) является наибольшей при кусочно равномерном ') распределении, но ничего не говорит нам о ее поведении во времени. Идея Гиббса о том, что вероятность следует вводить в механику только посредством плотности D(0), ка- жется, конечно, очень привлекательной. Но, вообще го- воря, эта точка зрения, по-видимому, несостоятельна, и вероятность в механике должна появляться и разными другими путями. Мы еще обсудим это в пп. 14 и 15. Подход Гиббса можно применить к вероятностным моделям, подобным модели Эренфестов. Тогда это просто означает, что мы задаемся каким- либо начальным распределением D(n; 0) 2) и п-ытаемся определить D(/n; s), т. е. вероятность найти систему в состоянии m после s шагов. «Теорема» Гиббса в этом случае означала бы, что lim D (m; s) = W(m) = С2тл • 2~зд. 1->оо ’) То есть при распределении, плотность которого постоянна на каждом куске Д«. — Прим, перев. 2/? *) То есть таким набором чисел D(n; 0) >0, что (л; 0)=1. л«0
Вероятность в задачах классической механики 111 Как было замечено на стр. 100, это не так, если D(/i;0) = l, л = л0, D (п; 0) = 0, п ф п0. Причина состоит в том, что такое распределение недо- статочно «крупнозернисто». Мы еще вернемся к этому вопросу после более детального обсуждения эренфестов- ской модели, которому посвящены два следующих пункта. 10. Мы покажем теперь, как вычислить вероятность (III. 10.1) Р{лд($)=/п|лд(0) = л} для эренфестовской модели. Введем сокращенные обозначения (III. 10.2) Р [пА (s)=m | пА (0) = п) = Р (л | /п; s), (III. 10.3) P(n|m; l) = P(n|/n) = Q(n|m)1) и напомним,что (III. 10.4) Р(л|/п;х) = 2 Q(л|л,)Q(nJДа) ... Q(»,_,!«). ni..B*-i Это следует, конечно, из конструкции самой модели, а так называемое свойство марковости, т. е. то, что ве- роятность конечной цепочки п, пх, .... tn равна QMn^Qfnilna) ... Q(n,_i|/n), вытекает здесь из независимости последовательных перекладываний шаров. Вероятности перехода Q(n|m) задаются формулой (III. 10.5) (?(л|/л) = = (2/?)-1 nb (tn — л +1) + (2/?)"1 (2R — л) б (т — л — 1). Если обозначить через Q матрицу вероятностей пере- хода, т. е. матрицу, в которой элемент с индексом (л, т) ) Эти обозначения вводятся в соответствии с обозначениями Уленбека в первой части приложения I.
112 Глава HI равен Q(n\m), то, как мы видим из (III. 10.4), элемент с индексом (п, т) матрицы Q8 равен (III. 10.6) P(n|m; з). Это простое замечание является решающим в теории марковских процессов и сводит ее к изучению степеней матриц (или в более общем виде—некоторых линей- ных операторов). Для того чтобы получить явное решение, постараемся диагонализировать матрицу Q, т. е. найти такую невы- рожденную матрицу Т, что (111. 10.7) После того как нам удастся это сделать, мы получим (III. 10.8) и делу конец! Хорошо известно, что несимметрические матрицы, вообще говоря, не всегда приводятся к диагональному виду. Однако в нашем специальном случае такое приве- дение можно выполнить в явном виде. Сначала заметим, что матрица Q выглядит так: 0 1 0 0 . . 0 (2Я)"1 0 1— (2/?)"1 0 .. 0 0 2 (2RT1 0 1-2(2/?Г1 . . . 0 • • • • • • . . о • • * • . 1 0
Вероятность в задачах классической механики 113 Ее левые собственные векторы определяются системой линейных уравнений: (2/?)"1 х1 = ;.х0, x0-f-2(2/?)-1 х2 = Ххи (1 -(2/?Г1)х1 + 3(2^)-’х3 = Хх2, Рассмотрим теперь бесконечную систему (111. 10.9) [1 - (k -1) (2₽)" 1 хк_х + (k 4-1) (2/?)‘1 xk+1 = >.xk, k = 0, 1, 2.................. где x-i=0, и заметим, что всякое решение бесконечной системы, удовлетворяющее условию (III. 10.10) *2/?+i = 0. автоматически является решением конечной системы и определяет, следовательно, левый собственный вектор. Введем производящую функцию /(z) = Sx*z* о и получим с помощью (III. 10.9) уравнение f(2)=!W(l-2)(l-^’7(4 или (III. 10.11) /(z) = x0(l— z)*l,_X)(l+z)/?,,+M. Поскольку f(z) аналитична вблизи нуля, наши формаль- ные действия законны. Заметим теперь, что если (III. 10.12) Л =//?-’,/ = -/?, -Я+1....0, 1....R, то f — полином степени 2R, и, следовательно, условие (111.10.10) выполняется. Числа K=jR~l служат, таким образом, собственными значениями матрицы Q, и поскольку их ровно 2/?+1, они исчерпывают все ее собственные значения. 3 М. Кац
114 Глава Ш Компоненты левых собственных векторов СУ> = 1, С(Д С(2Л....С$ определяются, как легко видеть, с помощью тождества 2/? (III. 10.13) (1 - z)R~} (1 + z)R+1 st 2 Ctf’z*. о Левые собственные векторы образуют строки матрицы Т, и нам осталось найти только обратную матрицу Т~1. Для этого нужно решить уравнение я 2 cW = 6(i, г); Л, r = 0, 1, ...» 2R >)• /=-я Мы имеем 2/j R zr = 2 6 (Л, Г) Z* = 2 (1 - z)R-} (1 4- г)Л+у а<Г» = *=о ;=-/? = (l-*)2/? 2 (l+z)*+41-*)'(*+'4'’ = J=-R 2/? = (I - z)2R 2 4'2Л (1 + z)1 (I - z)~l, 1=0 или 2Л zT (1 - zy2R = 2 <4% (1 + *)' (1 - г)"'. Полагая ^(l+zMl-z)-1. мы получаем г = -(1-&)(1+У"1. l-z=2(l+y-1 и 2R (_1)Г2-2Л (J _£)' (1 +£)2/?-Г= 2 1=0 Сравнивая это выражение с ф>рмулой (III. 10.13), мы находим ’) Таким способом мы найдем в действительности матрицу, об- ратную к транспонированной матрице Т, но это не меняет дела.
Вероятность в задачах классической механики 115 <4И = (— 1/2_2/?СЙ7г). Теперь легко вычислить Р(л|/п; s) [см. (III. 10.6) и (III. 10.8)]; мы получаем окончательно я (111.10.14) Р(л|/п; $) = (—1)л 2"2* 2 /=-/? 11. Решение, изложенное в предыдущем пункте, яв- ляется исторически первым (1947 г.). Оно проводится обычным способом теории марковских цепей, хотя и тре- бует, как читатель мог заметить, некоторого искусства. Вскоре после его опубликования было предложено не- сколько других решений. Среди них представляет зна- чительный интерес решение, найденное независимо Зи- гертом и Гессом. Мы здесь следуем изложению Гесса. В рассмотрениях предыдущего пункта состояние си- стемы определялось числом шаров в ящике А. При та- ком определении состояния наша вероятностная модель становится марковской цепью; ее вероятности перехода задаются матрицей Q. Гесс и Зигерт предложили более сложное определе- ние состояния системы. При этом весь процесс по-преж- нему образует марковскую цепь, однако матрица ве- роятностей перехода выглядит крайне просто и может быть почти сразу приведена к диагональному виду. По Гессу и Зигерту, состояние системы определяется указанием точного положения каждого шара1). Если ввести векторы /1\ /о\ “ = (oj " то каждое состояние системы можно представить тен- зорным произведением т] = е1Хе2Х ••• X ') Читатель, знакомый с терминологией статистической механи- ки, поймет, что здесь мы имеем дело с микросостояниями, в то вре- мя как в предыдущем решении использовались макросостояния. 8»
ив Глава HI где каждое e.j принимает значение либо а, либо 0; а со- ответствует ящику А, 0 — ящику В. Так, например, произведение аХРХаХ • •• Ха представляет состояние, при котором все шары, за исключением второго, находятся в ящике А. Введем теперь матрицу -I? ;i- обладающую тем свойством, что Sa = ₽, S₽ = a, и рассмотрим тензорное произведение S^/X/X-.XSX.X/ (/ — единичная матрица второго порядка). По определению Sfi) = X X • • • X X • • • X и, таким образом, действие «S* на т) эквивалентно пере- кладыванию i-ro шара из одного ящика в другой. Теперь ясно, что (а? \* (27?)-1 2SJ т] <=i / является линейной комбинацией 2ая векторов1), отве- чающих всевозможным состояниям нашей системы (по- нимаемым в новом смысле). Коэффициент при ip в этой линейной комбинации равен, очевидно, вероятности POlhz! 5) того, что, выходя из состояния т), система через s шагов попадает в состояние тр. Если, как обычно, определить скалярное произведе- ние векторов П ““ ® j X • • • X И X ®2 ' * X ®2J? ) Точнее тензорных произведений, но мы можем их считать и просто векторами, не опасаясь недоразумений.
Вероятность в задачах классической механики 117 формулой 2Л Ч-6 = Д(е<-е<'). то можно написать Р (П|Пр 5) = ^ 2/? \» -I 1 / J Теперь легко убедиться в том, что Р(л|/п; $) = —r-2PtolTV; где сумма берется по всем Сгя состояниям т], при кото- рых в ящике А лежит п шаров, и по всем С5г состоя- ниям тр, при которых в ящике А лежит m шаров. Теперь ясно, что нужно лишь диагонализировать опе- ратор 2/? (2/?)-' £St. Матрица S имеет нормированные собственные векторы ,,/1\ 1\ Н = 2"/‘(1) и v = 2 Л( ) (они отвечают собственным значениям соответственно 1 и— 1). Очевидно также, что а = 2-,/’(ц 4-v), ₽ = 2_,/‘(ц—v). Далее ясно, что выражение ((2₽)-' g Sj 6, X 62 X • • • X 62/?, где каждое 6( есть либо ц, либо v, равно (2/?)-* • 276,x6гX..-X62R, где 2/ равно числу векторов ц минус число векторов v в произведении SiXdzX ... Хбгя- Таким образом, числа J/R, — RCJ<R,
118 Глава HI являются собственными значениями нашего оператора (кратности CzrJ), соответствующими собственным век- торам X X 63 X • • • X ft?/?. содержащим среди множителей ровно R+j векторов ц. Теперь уже обычным путем снова приходим к фор- муле (III. 10.14). Это решение, помимо своего изящества, замечательно еще и тем, что оно содержит одну идею, которая может оказаться весьма важной и общей. Обычно сложность проблемы возрастает по мере того, как учитывается все большее и большее число де- талей. Более того, слишком детальное описание может, вообще говоря, оказаться совершенно неприемлемым ’)• Метод Гесса — Зигерта показывает, что это не всегда так. Здесь сокращение в описании (или отбрасывание части информации) усложняет задачу! Соотношение между подробным и сокращенным опи- санием касается самого существа статистической фи- зики, но в настоящее время мы все еще далеки от его правильного понимания. Последнее замечание. Вообще говоря, если мы объ- единим состояния в группы и затем будем рассматри- вать эти группы в качестве новых состояний, то марков- ский характер процесса может нарушиться* 2). В действи- тельности мы часто должны производить «разукрупне- ние», чтобы вернуться к исходному марковскому процессу. 12. Вооруженные формулой (III. 10.14), которая дает полное решение задачи Эренфестов, мы можем вернуть- ся к вопросу, обсуждавшемуся в конце п. 9. Заметим сначала, что при оо все члены, кроме двух, в формуле (III. 10.14) стремятся к нулю. Не исче- зают лишь члены, соответствующие /=/? и /= — R. Они *) В связи с этим см. специальные лекции Уленбека в приложе- нии I к этой книге. 2) Если упустить это из виду, то могут возникнуть ошибки. Так, например, в прекрасной обзорной статье Чандрасекара в Rev. Mod. Phys. (1943) есть несколько таких ошибочных «укрупнений» во мно- гих местах гл. III.
Вероятность в задачах классической механики 119 равны: для /=/? (_ if 2-2/?СТСл"л) = Сзд • 2_зд= W(m) и для j — — R (-1)* (- 1)л 2-2ffC(m/?>Сог-л) = (— 1),+л+т W(m). Таким образом, 2J? D (m; s)=2iD (л; 0) Р (л | т; s) ~ л=0 2R ~W(m)+ (— l)w+* W(m) %(—VfD (п\ 0). /1=0 Очевидно, что если Д(л; 0) меняется медленно, то вто- рой член мал, особенно при больших R. Строго говоря, даже крупнозернистое распределение D(m\ s) не стремится к W'(ffi), но отклонения имеют приблизительно порядок R~x, и ими можно спокойно пре- небречь. С помощью формулы (III. 10.14) можно вычислить различные средние значения, хотя это можно сделать также и непосредственно, не используя этой формулы. Мы получаем <Лд(5)-/?> = (Л0-/?)(1-/?-1)’. <(«x(s)-^)2> = («o-^2(l -2/?-'),+4 Отсюда <(Лд(5)-/?)2-«Лд(5)-/?»’> = =(«о-/?)2ю -2/?-*у-(1 -я_,л -ь 4 и -a и, наконец, _ <(»дО)-/?-<Яд(5)-/?>)2> _ <ЯД («>-*>’ “ _ /?(1—(i-2/r*)*) Г. (1—г/?-1)*' 2(Яо —z?)*(i — L (1-/?-1)2,_ ’ Мы вычислили квадрат так называемой «относительной флуктуации»; эта величина измеряет устойчивость сред- него значения.
120 Глава HI В самом деле, с помощью классического неравенства Чебышева получаем I <%«>-*> и, следовательно, Р <пл(5)-Л> Если По=2/? и s имеет порядок xR, мы получаем <р? ~ (ехр (2х) - 1) (2/?)"* - xR-\ и, таким образом, отношение Ф?/е2 мало, если е2/?^>1. Если по=2/? и $ имеет порядок /?2, то <ь становится огромным [приблизительно порядка (2R)-1 ехр 2/?] и пре- дыдущее неравенство уже бесполезно. В действительно- сти можно показать, что в этом случае большие откло- нения от среднего весьма вероятны и «усредненная» кривая Я (1-/Г*)' теряет смысл. С другой стороны, как уже упоминалось в п. 7, среднее время возвращения в состояние п0=2/? равно 22я и R2 значительно меньше, чем 22я. Таким об- разом, вообще говоря, неверно, что в течение всякого промежутка времени, малого по сравнению с циклом Пуанкаре, система ведет себя необратимым образом. Крайне невероятно, что система вернется в состояние п0=2/? за промежуток времени порядка R2, но ожидать, что в течение всего этого времени поведение системы бу- дет в каком-то смысле монотонным, было бы верхом оп- тимизма! 13. Марковский характер эренфестовской модели [вы- ражаемый формулой (III. 10.4)] позволяет существенно подробнее обсудить задачу о времени возвращения. Пусть Р' (л|лг, s)
Вероятность в задачах классической механики 121 обозначает вероятность того, что после s перекладыва- ний в ящике А впервые окажется m шаров, если вна- чале их там было п. Справедливо следующее соотношение: (111.13.1) P(/i|/n; s) = P'(/i|/n; s)+S Р' (л |/п; s — k). Чтобы убедиться в этом, достаточно заметить, что если вначале в ящике А было п шаров, то прийти к m шарам за $ шагов можно следующими взаимно исключающими друг друга s способами: (a) m достигается впервые после s шагов; (б) m достигается впервые на первом шаге, и затем через (s— 1) шагов мы (начиная уже с m шаров) снова возвращаемся к m шарам; (в) m достигается впервые за два шага, и затем че- рез (s — 2) шагов мы снова приходим к т, и т. д. Каждый из этих способов дает соответствующий вклад в сумму (III. 13.1). При этом марковский характер процесса сказывается здесь в том, что вероятность ка- ждой такой возможности — начиная с п шаров впервые получить т шаров после k шагов и затем через s — k шагов снова прийти к т шарам — равна произведению Р'(п |/п; k) P(/n|т\ s— k). Если ввести производящие функции h (п | т; z) = У Р' (п | т; s) z*, 5=1 g (п | /п; z) = 2 Р (л | т\ s) г*, 5=1 то видно, что соотношение (III.13.1) эквивалентно равен- ствам (111.13.2) g(/i|/n; z) — h(n\m’, z)-\-h(n\m-, z)g(m\m-, z) или h(n\m; z) = g(n\m‘, z)/(l+g(/n|/n; z)).
122 Глава HI Поскольку вероятность P(n|m;s) известна [см. (III. 10.14)], мы тем самым знаем g(n\m\z) и, следова- тельно, знаем, по крайней мере в принципе, h(n\m\z) и P'(n|m; s). В действительности найти явные формулы для P'(n|m; s) очень трудно. Однако следующие результаты получаются почти не- медленно: А (п |л; 1)=£ Р' (л |л; s)=?=l, 5=1 lim = V sp' (Л | Л; S) = = 22R/C'iR = 0* • Эти результаты нам уже известны с более общей точки зрения. Тем не менее теперь можно пойти дальше и вы- числить, например, дисперсию времени возвращения 1 (s - 0’)’ Р' (п | /г; $) = Л2. j=i Не вдаваясь в подробности, мы упомянем лишь, что для п = 2/? получается Л22/?~(227 = О- Это показывает, что возвращение в состояния, далекие от равновесия, происходит с такими огромными флук- туациями, что теряет всякий смысл говорить о среднем времени возвращения. Это другое выражение того явления, которое мы об- суждали в конце предыдущего пункта. Рассмотрение эренфестовской модели мы закончим кратким обсуждением понятия энтропии в применении к этой модели. Мы следуем изложению М. Дж. Клейна. Существуют два определения энтропии, принадлежа- щие одно Больцману, другое — Гиббсу. Больцман определял энтропию как логарифм числа микросостояний, реализующих данное макросостояние системы (точнее этот логарифм, умноженный на А, где А — постоянная Больцмана, но это несущественно для нашей искусственной модели), т. е. $б = log Сзд.
Вероятность в задачах классической механики 123 Гиббс определял энтропию через величины P(m; s) (т. е. вероятности найти систему в состоянии m в мо- мент времени s). Его определение таково: (III. 13.3) Sr = — 2 Р (л»; s) log [Р (л»; s) 2'2/?/lF(/n)], m где W(m) задается формулой (111.13.4) lF(/n) = CS?.2-2/?. Заметим, что выражение (III. 13.3) совершенно ана- логично формуле (III.9.0). Что означают оба эти определения для равновесного состояния? Следует заметить, что равновесие имеет совершенно разный смысл у Больцмана и у Гиббса. По Больцману, равновесием называется состояние с наибольшей энтро- пией, т. е. m — R. Таким образом, Sb; равн. = logC&~2/?log2 (если пренебречь членами порядка log# и выше). По Гиббсу, равновесным называется не состояние, й распределение в пространстве состояний. Другими сло- вами, различные величины, описывающие систему, нахо- дящуюся в физическом равновесии, Гиббс получает ус- реднением по всем состояниям, но при этом усреднение происходит относительно распределения вероятностей с наибольшей гиббсовской энтропией. Итак, Sr; равн.= max Sr, и можно показать (повторяя рассуждения, проведенные в конце п. 9), что максимум достигается для P(m; и, следовательно, Sr; равн. = 2# log 2.
124 Глава III Таким образом, в случае равновесия эти два опреде- ления энтропии совпадают; они различаются только по- ведением энтропии во времени. Гиббсовская энтропия возрастает с ростом времени $. Это простое следствие выпуклости функции х log х н того обстоятельства, что Р(т; s+1) • 2~2R/W(m) яв- ляется линейной комбинацией где с„>0 и 2ся = 1. Больцмановская энтропия изменяется гораздо более беспорядочным образом (как это демонстрирует график на стр. 97), и только среднее ее значение ведет себя монотонно. Заметим кстати, что, как мы видели, монотонное из- менение 5г не означает, что P(m; s) [или лучше P(n|m; s)] стремится к W(m). В самом деле, мы знаем, что P(m; s) в строгом смысле не приближается к U7(m)l Эти два определения приводят к двум различным формулировкам второго закона термодинамики. В одной формулировке (Больцман) понятия состоя- ния и энтропии вполне наглядны, но при этом нельзя прямо утверждать, что энтропия монотонно возрастает. Во второй формулировке (Гиббс) возрастание энтро- пии строго доказывается, но само понятие энтропии, а также способ приближения к равновесию очень сложны и не очевидны. 14. Мы столь подробно обсуждали эренфестовскую модель, потому что ее рассмотрение является превосход- ным введением в статистическую механику необратимых процессов. Тем не менее эта модель не может помочь нам понять более существенную проблему, каким обра- зом вероятность появляется в классической механике. Чтобы разобраться в этом вопросе, мы обсудим дру- гую искусственную модель, которая по своему харак- теру значительно ближе к «реальности». Рассмотрим п равноотстоящих друг от друга точек на некоторой окружности; отметим т из них и обозна-
Вероятность в задачах классической механики 125 чим это множество через S; остальные п — m точек со- ставят множество S. В каждую из точек мы положим белый (б) или черный (ч) шар. Пусть за единицу вре- мени каждый шар перемещается против часовой стрелки в ближайшую точку, причем выполняется следующее правило: если шар находился в точке из S, то при пере- мещении его цвет меняется; шары, находящиеся в точ- ках из S, сохраняют свой цвет. Предположим, что сначала все шары были белыми; спрашивается, что произойдет после многих перемеще- ний. 14а. Аналог классического решения Больцмана. Пусть W6(0 (Л^ч(О) —общее число белых (черных) ша- ров в момент времени t (т. е. после t перемещений, t принимает целые значения) и Л^б(5; /) (W4($; /)) — число белых (черных) шаров, находящихся в момент времени t в точках множества S. Мы сразу можем на- писать следующие соотношения (законы сохранения): ЛАб(/ + 1) = ЛАб(О-Л/б(5;/)+Л/,(5; 0. (Ш. 14.1) дач(/+1) = ^(/)-^(5; O + Afe(5; t). Теперь, следуя Больцману, мы введем предположение («Stosszahlansatz»), что JVe(S; /) =/n/г-We (/), (1П. 14.2) ' .... ' ' ' N4(S; t) = mn lN4(t), и получим (t + 1) - W, (t + 1) = (1 - 2m/z-*) (N6 (t) - N4 (/)). Отсюда (Hl. 14.3) Л-ЧЛМ0-*,(/)] = = (1 — 2тп~')‘ n~1 pV6 (0) - N4 (0)1 = (1 - и, следовательно, если (Hl. 14.4) 2m <n (что мы в дальнейшем и будем предполагать), то число черных шаров монотонно приближается к числу белых.
126 Глава III Этот вывод очевидным образом непригоден, посколь- ку наша модель полностью «обратима». Действительно, начиная с одних бепых шаров (W4(0)=0), будем дви- гать их некоторое время, а затем изменим направление движения (по часовой стрелке), предварительно повер- нув множество S на один шаг против часовой стрелки. Мы вернемся тогда к начальному состоянию вопреки формуле (III. 14.3), которая для «обращенной» модели должна выполняться так же хорошо, как и для исход- ной. Кроме того, эта модель строго периодична с перио- дом 2п (цикл Пуанкаре), что опять-таки несовместимо с (III. 14.3). 146. Теоретико-вероятностное рассмотрение. Совер- шенно ясно, что источником этой трудности являются формулы (III. 14.2). Они должны быть заново истолко- ваны, и их смысл следует выяснить более тщательно. Пусть -4-1, если в момент t шар в точке (111.14.5) Т1ДО = р(\ < р С п) белый —1, если в момент I этот шар черный. Пусть, кроме того, (III. 14.6) Тогда (III. 14.7) E=f+1. P^S, р 1-1. Pts. Пр(0 = Пр-1(*~ l)ep-i и, следовательно, (III. 14.8) т]р (0 = Пр-< (0)ep_iep_2 ... ep_t. (Ясно, что р — k следует брать по модулю п.) Отсюда N6(0- М. (0 = 2пр (0 = S Пр-/(0)ep_tep_2 ... ep_(, p p и в простейшем случае /Vq(0) = 0 [т. е. Пр(0) = 11 имеем (Ill. 14.9) л->pV6(/)-#,(/)] = Л'1
Вероятность в задачах классической механики 127 Если вся информация относительно множества S ис- черпывается тем, что оно содержит m точек (т. е. 2ер = р =п— 2m), то представляется естественным рассматри- вать величину (111.14.10) Л"12^,-2 ... tp_t р статистически. Если мы предположим, что все возможные располо- жения множества S равновероятны, то мы сможем легко вычислить среднее значение величины (III. 14.10) с по- мощью очевидной формулы (Ill. 14.11) //1->2ср-1ср-2 ••• tp-i)= р = ... ez) = —— ... e/t w n где штрих означает, что суммирование происходит при дополнительном условии 2 = п — 2m. р Замечая, что (2л/)-’/ с dz 1, если 0, если 2 гр = п — 2/п, р 2 ¥= л — 2m р (С — простой замкнутый контур, охватывающий начало координат), мы получаем С1 ...С/ = (2л0 ’ / /2/*ж+1) 2 г(.1+ч+‘’ где суммирование под знаком интеграла происходит уже по всем возможным наборам е. Итак, 2 = (г +- г-1)""' (г"1 - *)'.
128 Глава III и, используя формулы (111.14.9) и (111.14.11), мы по- лучаем (111.14.12) <1(Мв(П-^(0)) = (2л/)"1 f — г2)1 (l+z2)-‘(z2+l)4z-2mdz ________с_________________________________ (2л/)-1 J (г2+ 1)" z~(2m + ,>dz с Если фиксировать / и устремить п и т к бесконеч- ности так, чтобы (111.14.13) lim/n/i-1 = ц < у, то, применяя метод перевала (который в этом простом случае легко обосновать), можно получить (III. 14.14) lim (л-1(Л/б(/) — N4 (/))> = (1 -2ц)', Л-> JO что устанавливает справедливость формулы (III. 14.3) «в среднем». Чуть более сложное вычисление показывает, что при указанном предельном переходе дисперсия величины n~l(N9(t) — ЛМО) стремится к нулю (как п_|). Наконец, можно показать, что (Ill. 14.15) lim </i"We(S, /)> = |41im(«-W,(0>. Л->ОО Это оправдывает «в среднем» предположение (III. 14.2). Немного поразмыслим теперь, что это все означает. Допустим, что мы построили для каждого множе- ства S график величины n~l(N4(t) —W6(/)) (как функ- ции /). Мы получим СИ «кривых», начинающихся в еди- нице при 1=0 и имеющих период 2п. Допустим также, что мы смогли бы взглянуть на все эти кривые в фикси- рованный момент времени п. Можно считать п по- рядка 1023, а / — порядка 10®. При таком t ординаты всех кривых сосредоточены в очень узкой окрестности около (1 — 2ц)‘ и большие отклонения от (1 — 2р,)‘ можно воспринимать как чрезвычайное невезение. Как ни убедительны эти аргументы, мы должны по- мнить, что в предположении о равновероятности всех
Вероятность в задачах классической механики 129 расположений множества S содержится элемент про- извола. Хотя это предположение, несомненно, можно ослабить, какое-то допущение подобного рода неиз- бежно. В терминологии Эренфеста кривая (1—2р.) * является кривой Н-теоремы [в то время как каждая индивидуаль- ная кривая n~'{N4{t) является Я-кривой], или «Verdichtungskurve». 15. «Круговую модель» из п. 14 можно рассматри- вать дальше, с тем чтобы лучше понять схему, опи- санную в конце первой части приложения 1, принадле- жащего Уленбеку. Прежде чем перейти к этому, мы несколько изменим нашу модель, чтобы облегчить вычисления. В предыдущей формулировке число m элементов мно- жества S считалось строго фиксированным. Ослабим те- перь это условие, применив следующий прием. Для ка- ждой из п точек мы произведем испытание (бросание монеты), имеющее вероятность успеха ц<у. В соответ- ствии с исходом этого испытания мы включим или не включим эту точку в множество S. Другими словами, переменные е принимают уже не фиксированные, а случайные значения с вероятностями (III. 15.1) Р{еу = —1}=ц; Р{еу=1} = 1— ц. Мы предположим далее, что испытания (бросания) про- исходят независимо друг от друга, так что ei, 82,..., еп— независимые случайные величины. Число элементов множества S равно, таким образом, (Л \ fl— 2 8/1 1 / и также является случайной величиной. Среднее значе' ние числа элементов равно Л </п> = у (п — У] е7)=рл, 1 9 М. Кац
130 Глава 111 дисперсия же этого числа равна {(т — </п»2> = <(/п — р/г)2) = \ 1 / Таким образом, можно считать, что отклонение /п_от цп в подавляющем числе случаев имеет порядок Vп, и мы с уверенностью можем ожидать, что результаты не изменятся оттого, что мы прибегнем к этому обходному маневру. Для такой измененной модели мы получаем р = <6,62 ... е,> = (е,) (е2) ... (ег> = (1 — 2ц)‘ в полном согласии с прежним результатом. Вычисления теперь стали значительно проще, и мы обошли сложный вывод асимптотической формулы (III.14.19). Эта уловка хорошо известна в статистической меха- нике. Читатель, знакомый с обычной терминологией, за- метит, что «микроканонический ансамбль» (определен- ный тем жестким ограничением, что число элементов множества 5 равняется т) мы заменили «каноническим» (или точнее «большим каноническим») ансамблем, в ко- тором это ограничение существенно ослаблено. Что служит Г-пространством для нашей модели? Ясно, что это множество всех векторов 1 = 01i. th. • ••. ПЛ Пу=±1. Оно содержит 2П точек. Если Р(Ч; О) = р(тц, . .. т|я; 0) — начальное распределение (р(Ч;0)>0, 2р(ч;0)=П
Вероятность в задачах классической механики 131 и если мы знаем положение множества S, то мы можем написать уравнение, аналогичное уравнению Лиувилля: (III. 15.2) р(т]1, Т12, ..., т|„; /+ 1) = р(е1т|2, е^,.... е^; /). Мы можем переписать его в виде р(/+1) = £р(/), где L — «оператор Лиувилля» — является унитарным оператором. Мы можем теперь формально написать p(/) = Z'p(O) и, усредняя по всем положениям множества S, получить (III. 15.3) <pW> = <Z/)p(0). Вообще говоря, это очень трудно сделать, поэтому фи- зики заменяют уравнение (III. 15.3) уравнением (р (/)> = <£>* р (0). Этот другой подход приводит к тому, что мы назы- ваем в настоящее время «основным уравнением». Про- анализируем, что при этом получается. Мы перейдем от описания в терминах оператора L к чисто вероятностному описанию. Если в момент времени t модель находилась в со- стоянии б, то может произойти переход в состояние ч (за единицу времени), где 61 = e1t)2, 62 = е2тЬ, .... бя = елтц. Вероятность перехода б->т) равна вероятности того, что Ci = &1П2. 62 = б2ть............. е„ = б„т]1. Поскольку ci, 82,... ,8П независимы и удовлетворяют условию (III. 15.1), мы получаем (III. 15.4) Р(В|Ч) = Р (е1=б,ть....ел = б„тц) = = Д { 4 "I — Заменим теперь уравнение Лиувилля (III.15.2) «ос- новным уравнением» (III. 15.5) <р (Ч; /+1) = <р (в; t) р (81 ч) в*
132 Глава fff с начальным условием (III. 15.6) <р (8; 0) = р (8; 0) = р (8). Мы обозначаем теперь распределение символом <р вме- сто р, потому что ф(т); I), вообще говоря, не совпадает с р(т)> 0- «Основное уравнение» можно легко решить, если заметить, что <р(т); 0) sp(i]) можно единственным образом представить в виде (III. 15.6) ?(Ч; 0) = р(Ч) = = 2 " + 2 W) + 2 с1, iWi + • • • 1 !<»</<л ' ’ ' • "I" Cl, 2, .... Далее, ?(Ч; 1) = 2-я-Н1-2И)фМл+1 + + (1— 2р)2 S -Ь • • 1 1 + 1 и вообще (III. 15.7) <р (Ч; /) = 2"я + (1 - 2р)' 2 +/ + + (1-2р)2' 2 ^Я»+А+/+ .... Следует заметить, что «основное уравнение» является полным аналогом уравнения (III. 15.8) Р(л|/п; $4-1) = = Р(л\т— 1; s)Q(m— 1|/п) 4-Р (/г |/п 4-1; s)Q(m+1 |/п), которое управляет изменением распределения во вре- мени для эренфестовской модели. Основное различие состоит в том, что в эренфестов- ской модели уравнение (III. 15.8)—строгое следствие исходных вероятностных предположений, в то время как в нашей модели «основное уравнение» является лишь специальным допущением, подсказанным уравнением Лиувилля и интуицией.
Вероятность в задачах классической механики 133 Основная проблема состоит, таким образом, в том, чтобы обосновать эту вероятностную трактовку, опи- раясь на уравнение Лиувилля (III.15.2). К счастью, мы можем выписать решение уравнения (III. 15.2) в явном виде, а именно (III. 15.9) р(т?!, • •Нп, t) = = ?(•••» ер+1» • ••• вр+j-i» Hp + t' •••• 0) = = 2 4- • • • ep+/-i 4" р 4" Ср, д^р+Мд+^р ••• ep+/-lej ••• ej+/-14“ •••• Р <4 Таким образом, (III. 15.10) ф(Ч; 0=<р(ч; /)> = £{р(ч; /)) = = 2-я + (1-2р)'2м₽+/+ р 4* 2 ср>дПр+^д+t(ер ••• ep+/-je? ••• ев+/-Л4~ .... Р<9 Это не совпадает в точности с тем, что дает решение ос- новного уравнения. Действительно, (III. 15.11) (е, ... ... е,+/_1> = (1 -2р)4(л’:/). где (III. 15.12) А(/>,?;/) = 1 2Л v Ч~P>t' I 4(q-p}, q—p<t, откуда видно различие в некоторых членах. Чтобы выяснить ситуацию, мы ограничимся лишь симметрическим начальным распределением, т. е. та- ким, что c* = q, Ck, 1 = СХ,2 и т. д. Формула (III. 15.10) запишется теперь в виде (III. 15.13) ф(Ч; /) = (р(Ч: 0) = 2-я + (1-2И)Ч2Ч4- 4-^2 2 (I-2ц)4(л?:/)т1А+ ... ... 4-(“1)4,2 л ... V
134 Глава HI Мы видим отсюда, что не только возникает различие в некоторых членах, но даже разрушается исходная сим- метричность. Симметризуем теперь ф (4; t). Получим (11.15.14) 5{ф(Ч, /И = 2-л + (1-2|*)Ч2’Ы- + -^1.2 2 (1 —2|*/<Л<;0 2 Vk+--. п \<p<.q<n \<p<q<n ••• +(-04,2.....Л ••• П„. Для фиксированного t и больших п имеем ± J О - 2И)4<л?:/,~(1 -2И)“ я1<Р<0<Л и т. д., что уже явно согласуется с решением основного уравнения. Остаются еще члены вида (-0+1.2....Л’Ь ••• Ч,. которые не исчезают даже после симметризации, однако это несущественно: если начальное распределение до- статочно гладко, то в разложении (III. 15.6) отсутствуют (или почти отсутствуют) «высокие гармоники». Иными словами, следует рассматривать лишь достаточно «круп- нозернистые» начальные распределения. Наше рассмо- трение выявило еще одну трудность, связанную с «ос- новным уравнением». Очевидно, что при замене -1- (1-2р)4(А’:/) Я 1</><0<Л величиной (1-2ц)* возникает ошибка порядка VCn-
Вероятность в задачах классической механики 135 Аналогично ошибка, возникающая при замене третьего члена, имеет порядок С’/С3, и т. д. Каждая из этих ошибок стремится к нулю при п->-оо, но это может быть не так для суммарной ошибки, если только коэффициенты с не убывают достаточно быстро. Таким образом, мы снова приходим к необходимости считать начальное распределение достаточно «крупно- зернистым». Следует добавить еще несколько слов, чтобы объяс- нить значение симметризации. Рассмотрим частичное распределение (Ш.15.15) /(Пр, V 0 = 2Ч(ч; /), где два штриха у знака суммы означают, что суммиро- вание происходит по всем т|*, кроме т]р и Из (111.15.13) легко получается равенство (111.15.16) /(v VO = = |+(1 ~ 2ц)Ч (Ti, + n,) + c12 (1 - 2ц)4(р’ Чп, или в другом виде Р Ч (/) = ©и т|,(/) = ©г) = +О ~ 2и)' (®i + ®2) + — 2р)4(Л^©^ (©j, ©2 равны либо 4-1, либо —1). Таким образом, совместное распределение вероятно' стей для значений в двух фиксированных точках при /-►оо не стремится к равновесному распределению. Од- нако совместное распределение вероятностей для значе- ний в двух (или более) фиксированных точках нам и не нужно. На самом деле нас интересует совместное рас- пределение для значений в двух случайно выбранных точках. Такое совместное распределение дает именно симметризация f(©i, <о2; /) [здесь мы, разумеется, пред- полагаем, что все пары (р, q), p<q, равновероятны]. Мы
136 Глава III приходим, таким образом, к формуле •$(/(©1» ©г! ^)) =у + (1—2ц)г<?](«>] +©2)+ 4- ^12 —2ц)А(А?' ’©jCOj* " 1 < р < q < п В пределе при n->oo (t фиксировано) получаем 4'4_0 —2р.)* С] (©14-©2) 4-<q,2 0 —2р.) ©i©2> что согласуется с решением основного уравнения. Если здесь допустимы аналогии (возможно, очень натянутые) с кинетической теорией, то мы можем ска- зать, что в больцмановской теории функцию f(»i, о2; О следует понимать не как совместную вероятность для значений скоростей двух фиксированных молекул, а как совместную вероятность для значений скоростей двух случайно выбранных молекул. 16. Больцмановская теория разреженного одноатом- ного покоящегося газа (случай пространственной одно- родности) также может быть построена с помощью ос- новного уравнения. Обозначим через vt, v2, ... , vn скорости п молекул и составим из них (Зп-мерный) «основной вектор» R (111.16.1) R = (v„ v2, v„). Рассмотрим теперь процесс, при котором за промежуток времени dt может произойти «столкновение» «-й и /-й частиц (Kj), причем направление их линии центров (т. е. линии, соединяющей центры i-ro и /-го шариков в направлении от i к /) задается вектором 1 с точностью до элемента dl. Мы предполагаем, что вероятность та кого столкновения представима в виде (111.16.2) %dldi = y((Vj- V/)-l, I v7 - vz |)dldt. Для случая твердых шариков j (111. 16.3) = У J ( I (V; — V,) • 11 — (V; — V,) • I), что соответствует больцмановскому предположению («Stosszahlansatz»).
Вероятность в задачах классической механики 137 Если (i, /, I)-столкновение произошло, то R перехо- дит в Au(l)R, где (111.16.4) 4Z/(1)R = (V1, ..., ¥, + ((*/-Vz) • 1)1. ••• •••. V, —((vy —vf)• 1)1...v„), а остальные компоненты R не меняются. Таким образом, мы можем сказать, что R->4zy(l)R с вероятностью tylfdldt, R->R с вероятностью 1 — dt 2 !</</<» Поскольку при каждом столкновении сохраняются импульс и энергия, мы имеем (III. 16.5) У V; = const *)» (111. 16.6) 2 V/ - v,= const = no2. He ограничивая общности, мы можем считать, что по- стоянная в формуле (III.16.5) равна нулю. Таким образом, конец вектора R всегда лежит на (Зл — 3)-мерной сфере Sn(o) радиуса а]/п. Пусть в момент времени t=0 начальное распределение для то- чек R задается плотностью <p(R; 0). Легко видеть, что изменение этого распределения во времени происходит в соответствии со следующим уравнением: (111.16.7) ° = ' 'or = 2 pl {<P (Аи (I) RU) - ф (R; /)} Ф//. !</</<» ') Это несовместимо с тем, что газ находится в сосуде, так как при столкновении молекул со стенками импульс не сохраняется. Однако это досадное обстоятельство можно обойти, если предполо- жить. что при каждом столкновении со стенкой молекула вновь по- падает куда-нибудь внутрь V с тем же импульсом. Это небольшое затруднение возникает и при выводе исходного уравнения Больцма- на; вывод этот не строго обоснован, так как в сосуде действуют внешние силы.
138 Глава III Это и есть основное уравнение, аналогичное уравне- нию (III. 15.5) для круговой модели, а также уравне- нию (III. 15.8) для эренфестовской модели. Поскольку при выводе «основного уравнения:» (III. 16.7) предполагалось, что все фо задаются форму- лой (III. 16.3), в нем уже содержится главное допуще- ние Больцмана («Stosszahlansatz>). Однако уравнение (111.16.7) в отличие от больцмайовского уравнения (III. 1.6) линейно. Ясно, что переход от уравнения (III. 16.7) к уравнению (III. 1.6) требует дополнитель- ных предположений. Чтобы обсудить эти предположения, а также более отчетливо выявить ряд других обстоятельств, мы по- строим упрощенную математическую модель, обладаю- щую многими (если не всеми) существенными чертами нашей задачи. Пусть (III. 16.8) R = (*i......хп) удовлетворяет условию (111.16.9) ||R|!2 = x? + x|+ ... +х2 = л, и пусть (111.16.10) 4v(0)R = (Xj, ..., х{ cos 0-4- Xj sin 0, ... .... — Х( sin 0 -|- Xj cos 0, .... x„). Пусть далее1) (111.16.11) ф„= 2^-= const. ') Чуть большая общность достигается, если положить tyij — Xf (е)/я, W /(—®) = /(е) («микроскопическая обратимость») Я и J*/(0) dl) = 1,/(в)>0. Вся теория тогда сохраняется без су- —« шественных изменений. Эта более общая теория аналогична теории максвелловского газа.
Вероятность в задачах классической механики 139 «Основное уравнение» теперь принимает вид (III. 16.12) ° = 2* =7 2 i f to (A‘J (0) R; о - я» (R; 0} db аналогом же уравнения (III.1.6) служит уравнение (III. 16.13) д/(£ ° = = v fdy^f {/(*cose+ysin0, OX -oo 0 X/(— x sin 0+у cos 6, t)— f(x, O)d0. Наши упрощения состоят в следующем: (а) мы отбросили закон сохранения импульса (III.16.5); (б) упростили вид фо-; (в) заменили более сложное шестимерное вращение 4о(1) двумерным вращением До(6). Предположим теперь, что <p(R; 0)—симметрическая функция переменных .... хп. Отсюда следует, что <p(R, 0 также симметрична. Введем следующие частичные распределения: (111.16.14) Дя)(х-, t)= f <p(R; t)dOl, х|+ ... +х^«л-х2 (111.16.15) /2Я)(х, у;0= f <p(R; t)dcs2 ... +л^=л-х2-у2 и т. д. Интегрирование ведется по сферам, уравнения которых написаны под знаком интеграла, а свободные переменные заменяются на х, у и т. д. *)• Функции плот- ности /У", /У), ... естественно называть сужениями <р; /»я) образует k-мерное сужение. Легко подсчитать ') Разумеется, при этом dai, dot, ... определены соответствую- щим образом.
140 Глава ИI С ПОМОЩЬЮ (III. 16.12), что (х, t) (iii.i6.i6) = 2в = -JL=r-v J dy ~ f {ff (x cos 0 + у sin 0, -(n-jcrfll 0 — xsin 0 + ycos 0, y, /)}d0. Это уравнение очень напоминает уравнение (III. 16.13). Чтобы получить (III. 16.13), достаточно лишь предполо- жить, что (111.16.17) Л”(х, у, t)~/"4x, /)/1п’(у, t) для всех х, у в допустимой области. Здесь мы немед- ленно сталкиваемся со следующей трудностью: функ- ция <p(R; i) однозначно определяется распределением <p(R; 0), и, следовательно, всякие дополнительные пред- положения о <p(R); t) должны быть выведены из неко- торых заранее постулированных свойств распределения <P(R; 0). Размышляя над этим обстоятельством, мы убедимся в том, что для вывода уравнения (III. 16.13) нужно сна- чала доказать следующую теорему. Основная теорема. Пусть <pn(R; 0)—последователь- ность плотностей вероятности, определенных на сферах ||Я11’=х? + ... + *?, = «. обладающая «больцмановским свойством» а (111. 16.18) lim //’(х,...xft; 0)= Ц Ит /Г’(х,, 0). П ->ОО У «1 Л-> ОО Тогда <pn(R, /) [т. е. решение уравнения (III.16.12)] так- же обладает «больцмановским свойством» Ит //’(х,......х»; /)= П Ит //’(х ; t). П*ОО fisln-^OO ' ' '
Вероятность в задачах классической механики 141 Другими словами, больцмановское свойство сохраняется во времени! Таким образом, оказывается, что нелинейность урав- нения Больцмана (III. 16.13) возникает только благо- даря крайне специальному предположению относитель- но начального распределения. Основная теорема прояс- няет, что прежде скрывалось за предположением о мо- лекулярном хаосе. Возникает вопрос, существуют ли плотности вероят- ности, обладающие больцмановским свойством. Не вда- ваясь в подробности, укажем, что если с(х) >• 0 и для некоторого положительного z функция с (х) ехр (— zx2) интегрируема и если с(х) удовлетворяет некоторым сла- бым условиям регулярности, то можно показать, что последовательность п П <мю=—А1-------------- /П с(х>)da S„ обладает больцмановским свойством. 17. Мы приведем теперь доказательство основной теоремы в предположении, что функция <pn(R; 0) инте- грируема с квадратом по Sn. Это условие гарантирует, что распределение <pn(R; 0) достаточно «крупнозерни- сто». Рассмотрим гильбертово пространство интегрируе- мых с квадратом вещественных функций фп (R), опреде- ленных на сфере Sn, IIR|l2=/i, и линейный оператор Q: (111.17.1) 2фя = = v 2 i f I*. (Л/ (0) R) ~ (R)) M- 0 Легко проверить, что (111.17.2) (2Ф„. ХЯ) = (Ф„, ИХЯ)
142 Глава III и (III. 17.3) (2фя, Фя) = = ~i 2 if f{♦.(A/(e)R)-t,(R)}M«d0. \<K}<n 0 s„ Оператор Q является, таким образом, самосопряженным и, очевидно, ограниченным (хотя его норма может зави- сеть и в действительности зависит от п). Итак, можно написать (III. 17.4) <p„(R; /)= gft^(R;.O) (v<)». »»o Пусть g(R)=g(xi)—ограниченная функция только од- ного переменного. Из формул (III. 17.2) и (III. 17.4) мы имеем (III. 17.5) (<p„(R; t), g(R)) = Vn = f <P« (R; t) g (x>) da = f /1n) (x, t) g (x) dx = sn -Vn = 5-^(2*^ <MR; 0)). »=o Теперь (III. 17.6) Qg= = i Si f cos 0 + X; sin 0) — g(Xj))d0. ;=2 о Полагая (111.17.7) g2(x, y) = cos 0 + у Sin 0) — g(x)| de,
Вероятность в задачах классической механики 143 мы получаем п (III. 17.8) 2g=4 £*(*„ х,). J=2 Далее, п (111.17.9) = 7-2 И 2* (III. 17.10) Qg2 (хр х2)= -J- f {g2(X! cos 0 +x2 sin 0, о —X! sin 0 4-x2 cos 0) — g2 (x„ x2)J da 4- л 2* 4- 4 2 i f {ft cos 0+xisin e’ x2> ~ gi (Xu x2)) </0 4- J=3 0 n 2» 4- 7 2 i f {ft (*«• x2 c )s 0 4- Xj sin 0) - g2 (x„ x2)} dQ. J=3 0 Поскольку <pn(R; 0) >0 и (111.17.11) J <ря (R; 0) do = 1 s, и так как |g(R)|<Af, мы имеем |gzl<2M и, следова- тельно, (III. 17.12) | (2g, <p„(R; 0))|<2M Кроме того, (III. 17.13) |2g2| < 4М//14-4Л! • 2(/i -2)//i < 2! • 4M и, следовательно, (111.17.14) |22g|<2l-22M. Вообще (III. 17.15) |2*g, <ря(R; 0)| <k\ • 2kM. Предыдущее доказательство применимо только для k < п. Однако эта формула остается справедливой и для
144 Глава III k>n, поскольку |Q"g | = 12*-"Qng| < nk~nn\2nM < k! • 2*M. Далее CO (III. 17.16) lim (2g,<p„(R:O))= f [/2(x, y)g2(x,y)dxdy -oo где (III. 17.17) /2(x, y)= lim /V’(x, у, 0). п •> оо И вообще (III. 17.18) lim (2*g, <p„(R; 0)) = n •> ио 00 =J ••• J7*+i(*i..........*»+i)x —oo Xg^Jx,.........x^dXy ... dxft+1, где gh+t определяются по индукции следующим образом: (III. 17.19) gx(x) = g(x), Sk+i(xi> •••» •*»+:)= к 2* = 2 2^f te»(•*!. •... X/cose + xt+i sin 0, ..., xj — 0 — g*(*i. •••. *k)}dQ. Так как мы предположили, что последовательность <pn(R; 0) обладает больцмановским свойством, мы имеем (111.17.20) lim (2*g, <ря(R; 0)) = ОО со ~ f ' ‘' f f f (x»+i) х —оо X g»+i (хх, ..., xk+^dxx ... dxk+li где (III. 17.21) /(х) = Л(х; 0)= lim /"’(х; 0). Л -> jo
Вероятность в задачах классической механики 145 Из (III. 17.5), (III. 17.15) и (III. 17.20) следует, что для 0 < t < l/2v имеем (111.17.22) ff(x, t)g(x)dx = -ОО = S-тг/ • • • f Xg*+i(*i. •••• xM)dxx ... dxk+x, где*) /(x; Z)=/,(x; /)= lim Д’>(х; t). n+> co Начиная теперь с функции ^(х,, хг) =g(xi)h(x2) и опре- деляя yft(xi, .... хА) по индукции с помощью формулы (III. 17.19), мы снова получим для 0<f<l/2v соотно- шение (III. 17.23) f f Л (хi, х2; t) g(Xi)h (х2) dx, dx2 = — CO “ЕД/ ••• J7Ui)---/(**+2)X XYA+2(x,......xA+2)dx, ... dxA+2. Легко проверить, что (111.17.24) у3(х„ х2, х3) = = Л, (х2) g2 (х„ х3) 4- g, (х,) Л2 (х2, х3), (111.17.25) у4(х„ х2, х3, х4) = Л2(х2, x4)g2(x„ х3) + + A,(x2)g3(x1, х3, x4)4-g2(x„ х4)й2(х2, х3) + + gi С*1) Л3 (х2, х3, х4) и т. д. ') Ясно, что здесь имеется в виду слабый предел в пространстве 1(—оо, ОО). 10 м. Кац
146 Глава III Таким образом, мы имеем, например, (Ш. 17.26) f f f f f(Xl) ... f(x4)y4(xu x2, x3, x4)X X dXi dx2 dx3 dx4 f (*1) / (X2) / (-*3) g3 (XP X2< JC3) dxl dX2 dX3 + x3) dxx dx2 dx3 и так как справедливы другие подобные формулы, то для 0 < t< l/2v получаем (III. 17.27) J J /2 to, Jc2; t) g (л,) Л (x2) dxt dx2 = —00 co co = f f(xv t)g<xddxx f f(x2; t)h(x2)dx2. ->CO —CO Так как g иЛ произвольны, мы получаем для 0</<l/2v (III. 17.28) /2(xlt х2, t)=f(x< t)f(x2, t). Аналогичные, но более утомительные рассуждения при- водят к формуле (III. 17.29) Л(х,.хк-, /)=/(Хр /) ... f(xk, t).
Вероятность в задачах классической механики 147 Ограничение, наложенное на промежуток времени t (0 < t< l/2v), можно устранить, если заметить, что оно не зависит от начального распределения. Действительно, выбирая некоторый момент времени /о. O<7o<(2v)~*, за начальный, мы можем, повторяя все предыдущие рассу- ждения, доказать, что больцмановское свойство сохра- няется на интервале 4-С/</о+(2v)"’. Продолжая та- ким способом, мы, очевидно, исчерпаем все значения /, 0</<оо. Предыдущее доказательство теряет силу, если огра- ничение на промежуток времени зависит от начального распределения. Оно неприменимо в важном для физи- ков случае твердых шариков. Пока не удается получить общее доказательство того, что больцмановское свойство сохраняется по времени. 18. Мы изучим теперь Я-теорему и вопрос о прибли- жении к равновесию. Исходя из основного уравнения (III. 16.12) (III. 18.1) •£ = = - S i f {<Р И// (0) R: 0 - Ф (R: /)) М, мы получим [см. (III.17.3)] (III. 18.2) -^Jv2(R;/)rfa = = “7 S rfeJ{<p(H/y(0)R; /) —<p(R; t)}* da 0 и, следовательно, <111.18.3) /q>2(R; t)da ^0. Далее, если а>1, мы получаем с помощью неравенства Гёльдера (Ш. 18.4) f <р-’ (R) <р (Аи (0) R) da < < (J Ф* (R) da^‘ 1Va Ц <р’ (Ау (0) R) dajx'a = J* q>* (R) da 10*
148 Глава III и, следовательно, (111.18.5) Jq>’(R, t)d<s^O. Поскольку (111.18.6) log<p = lim^^-, <>0 Е мы получаем как следствие из (III. 18.5), что (Ш. 18.7) 4 f <p(R; *) log <p(R; t)da <0. Равенство в (III.18.3), (III.18.5) и (III.18.7) возможно только при условии (111.18.8) <р (R, t) = const = 1/S„ (j/TF), где S„(j/TT) — поверхность сферы ||R||2=n. Одномерное сужение распределения (III.18.8). как легко видеть, равно 4 (»-3) (Ill. 18.9) - 0-«-'•**)-----------. V п 1 (1—л-'л2)2 dx -V~ В пределе при п->оо получается плотность Максвел- ла — Больцмана (III. 18.10) (2л)-'Лехр(—|х2). (См. в связи с этим первый пример из гл. I.) Мы дол- жны теперь доказать, что') (III.18.il) <p(R;/)->!/$„(/ЙЭ при t-+co, по крайней мере в слабом смысле; это озна- чает, что для каждой функции x(R) 6 Ь2($п) (III. 18.12) lim f?(R;/)x(R)da = —1 fx(R)d0. t *> 00 J W n) J ') Это просто эргодическое свойство рассматриваемого здесь марковского процесса. Однако вместо того, чтобы обращаться к об- щей теореме, мы предпочитаем придерживаться независимого изло- жения и приводим доказательство, в этом случае совсем простое.
Вероятность в задачах классической механики 149 Поскольку основное уравнение может быть записано в виде (III. 18.13) 1Г = 2Ф’ где Q —ограниченный самосопряженный отрицательный оператор, мы имеем (111-18.14) (<р, х) = J <р (R;/) х (R) do = = J exp(X/)dx(E(X)<p(R; 0), х (R)), — ОО где Е(Х)—проекционные операторы, задающие разло- жение единицы для оператора Q. Функция (III. 18.15) r(X) = (E(X)q>(R, 0), x(R)> имеет ограниченную вариацию, и, поскольку оператор Q ограничен, г(X) постоянна для достаточно больших от- рицательных X. Таким образом, (III. 18.16) <P(R; Ox(R)do= f X exp (X/) dr (X> — QO и, следовательно, (HI. 18.17) lim f)x(R)da = 0. Из (III. 18.3) следует, что существует такая последова- тельность /,->оо, что <p(R; t,) слабо сходятся к функции To(R), т. е. (III. 18.18) Дт f <р (R, ts) х (R) da = f Фо (R) х (R) da и (III. 18.19) lim f <p(R; /,)x(Ay(e)R)de = = f %(R)x(A/(fl)R)d<T.
150 Глава III Поскольку (III. 18.20) <p(R; <)X(R)rf<» = 2* = i nix(Ay(0)R)-x(R)b !</</<» 0 из (III.18.17) следует (если считать, что /->оо, пробе- гая последовательность /,), что (III. 18.21) 2х °= 2 iP0P°?o(R){x(Ay(0)R)-x(R)} = !<<</<« 0 2* = f dot (R) 2 J {<ро (Ац (0) R) - Фо (R)l dQ. l<l<J<n о и поскольку x(R)—произвольная функция, мы полу- чаем (III. 18.22) 2 i / (Фо И// (0) R>~ Фо (R)) de = 0. О Умножая обе части формулы (III.18.22) на q>o(R) и инте- грируя по Sn, мы получаем 2* (III. 18.23) 2 {<й)(А/(0Ж)-Фо(Ю)2^0=О !<«</<» о и, следовательно, (III. 18.24) %(A/(0)R) = 4>b(R) для почти всех 0 и почти всех R. Чтобы из формулы (III. 18.24) вывести, что функция q>o(R) постоянна почти всюду, нам нужно убедиться в том, что Ао(0) по- рождает транзитивную подгруппу в группе всех «-мер- ных вращений. Это почти тривиально. Действительно, если взять вектор (’.11.18.25) Г = U€$я,
Вероятность в задачах классической механики 151 то при помощи подходящего выбора А12(0) можно пере- вести его в вектор (111.18.26) (/Ц+Д, 0, 13, ...,Ц- Выбрав затем подходящим образом А13, мы переведем вектор (III. 18.26) в вектор (III. 18.27) (/ЬЖЖГ 0, 0..............L) и, продолжая таким образом дальше, мы получим, что подобранное соответствующим образом произведение (111.18.28) АД0.-,)... Айе.) переводит вектор (111.18.25) в вектор 0, ..., 0)= = Rq. Предполагая, что значение фо (Ro) определено, мы видим, что (111.18.29) Фо (Т) = Фо (Ro) при условии, конечно, что выбран вектор Т, для кото- рого значение фо(Т) определено и углы 01, ..., 0n-i (ко- торые, очевидно, зависят от Т) не принадлежат исклю- чительному множеству меры нуль. Ясно, что для почти каждого Т углы 01, .... 0П не входят в это исключитель- ное множество и, следовательно, (III. 18.30) фо (R) = const = 1/S„ (/л) почти всюду. Поскольку для любой последовательности th .... t, получается один и тот же предел q>o(R), мы имеем (III. 18.31) lim ф(Ъ /) = ф0ДО, /->00 где предел понимается в слабом смысле. Все предыдущие рассуждения проходят без каких- либо изменений для общего основного уравнения (III.16.7), только доказательство того, что А,Д1) по- рождает транзитивную подгруппу (Зп — 3)-мерной орто- гональной группы, требует некоторых ухищрений. Итак, мы показали, что «основная» плотность <p(R; I) приближается при /-»-оо к равновесной плотно- сти (Ш. 18.32) %(R)=VS.(V^)
152 Глава III и что такое приближение происходит «необратимо», как это следует из (III.18.3), (III.18.5) или (III.18.7). Из того, что «основная» плотность стремится к (III.18.32) и одномерное сужение плотности (III. 18.32) равно (III. 18.9), следует (снова в слабом смысле), что (III. 18.33) lim /1Я|(х, /) = /«>00 /л 1 . , /, . ¥<п~3> (1— л-'х’)2 dx -VT ~(2л)_,/*ехр у х2У Мы обсудим теперь Я-теорему Больцмана в свете наших рассмотрений. Эта теорема утверждает, что (III. 18.34) ©О J f(x' z)l°g/(x> —co и легко выводится, как это сделал сам Больцман, из уравнения (III.16.13). Однако в отличие от утвержде- ний (III. 18.3), (III.18.5) и (III.18.7) [которые можно обобщить дальше, заменив <ра или <р log <р любой вогну- той сверху функцией М(<р)] функционал (III. 18.35) H(f) = f f log fdx является единственным известным до сих пор функцио- налом от f, меняющимся монотонно. Чтобы прояснить ситуацию, мы должны вспомнить, что уравнение (III.16.13) применимо только в том слу- чае, когда распределение обладает больцмановским свойством. Если бы можно было сказать, что в некото- ром смысле п о (III. 18.36) <p„ (R; t)----J----------, f П/(Л;: t)da 1
Вероятность в задачах классической механики 153 то отсюда мы получили бы (111.18.37) фд log <ря da ~ п / » X ~ С7 f Ц/(*/5 о - log c„ do = 1 \ 1 / п = — log С„ + f da log f (x,; t) JJ / (x,; /), i где n (111.18.38) С,= /Д/(х^Л 1 и f (x; /) служит предельным одномерным сужением для Фп(R; /). Асимптотически при больших п мы получили бы (III. 18.39) J* ф„ log <p„da — ----logC„ + /i ff(x, /)log/(x; t)dx, — OO и ИЗ ТОГО, ЧТО (111.18.40) J<P„logT„da убывает со временем, следовало бы, что (III. 18.41) H(f)= f /log/dx — ОО также убывает. Если все предыдущие шаги сделать строгими, мы по- лучим вполне удовлетворительный вывод Я-теоремы Больцмана. 19. Как мы уже видели в пп. 16, 17, 18, действи- тельно возможен теоретико-вероятностный подход к на- шим задачам; он основан на представлениях о случайном
154 Глава III блуждании, которые излагаются в первой части прило- жения I, принадлежащего Уленбеку. Этот подход при- водит к результатам, находящимся в полном согласии как с прежними нашими знаниями, так и с интуицией. Остается, однако, существенная задача — обосновать основное уравнение, исходя из уравнения Лиувилля. Дру- гими словами, необходимо исследование, подобное тому, которое было проведено для круговой модели в послед- ней части п. 15. Такое исследование было предпринято Р. Броутом, о чем также упоминается в первой части приложения 1. Поскольку я считаю попытку Броута чрезвычайно важ- ной (хотя мне хорошо известно, что многие места там требуют дальнейшего прояснения), я постараюсь поды- тожить все, что касается главных, по моему мнению, пунктов предложенного Броутом подхода. Предупреждаю читателя с самого начала, что мы на время покидаем надежную почву математики и отпра- вляемся на экскурсию в другую область. Не противьтесь мне! Сами идеи, несомненно, верны, хотя вполне строгое их обоснование может оказаться очень трудным. Начнем с нескольких замечаний. Если мы обозначим через О (Ух....v„, г,.....г„; 0) начальное распределение в Г-пространстве (мы теперь используем обозначение rj для положения частицы и Vj для ее скорости), то О(У}.....vN, гР ..., r„U) = = D(vr', .... v^, гГ'.....г^;0), где vr'....ГГ'.......... — скорости и положения наших молекул (одноатом- ных!) в момент времени —t, если в нулевой момент они равны Vi.....yN, h......rN. Предположим, что вместо нашей системы мы рас- сматриваем систему, в которой межмолекулярные силы
Вероятность в задачах классической механики 155 Fij = F(\ri — rjl) действуют только внутри некоторой вы- деленной группы молекул (в которую входят, скажем, первая, третья и пятая молекулы), в то время как остальные молекулы не взаимодействуют ни друг с дру- гом, ни с этой выделенной группой. Иными словами, потенциальная энергия равна не N 2 Ф (гу) + 2 0 (г;)« а N 2*4(ru)+£U(rj), где «звездочка» над знаком суммы означает, что сумми- рование происходит только по тем i и /, которые при- надлежат к выделенной группе. Обозначим через 0(1................. i'a.....N) плотность в момент времени t, в которую переходит на- чальная плотность 0(V1, ...» Vjv, Г1..rN\ 0), если межмолекулярные силы «включены» только между частицами Л, ..., in- В частности, D(l', 2'....M) = £>(vy', .... v^', ry'...v-N‘\ 0) и 0(1. 2 Л0 = Д(М [vy/], [ry'] [tf]; 0). Квадратные скобки, окружающие vy* и гу', означают, что /-я частица движется только под действием внеш- ней силы — grad t7(rj). Если же внешние силы отсутствуют, мы получаем Конечно, стенки, ограничивающие наш сосуд, со- здают (сингулярные!) внешние силы, но мы будем обра-
156 Глава И1 щаться с ними бесцеремонно, забывая о них при исполь- зовании формул (Ш.19.1), но помня о них при интегри- ровании по переменным г,. Чтобы быть уверенными, что обозначения понятны, заметим, что 0(1.....Г......N) = D(\, N), и, например, 0(1', 2', 3', 4, .... N) получается, когда vp', vp', vp', гр', гр', гр' находятся из точного решения задачи трех тел, в то время как yj' и гр' (/>3) берутся в квадратных скобках. Дру- гими словами, 0(1', 2', 3', 4.М) = = D(v1-', vp', vp'» v4, .... yN, гр', rp', rp', ...............................rN — vNt-. 0). Положим теперь C° =D(1, 2....N), C} =D(1, 2............ TV) — 0(1, 2, .... M)=0, C?y =0(1, 2....Г.......jr...N)- — 0(1, 2....i'......N)- — 0(1, 2....i......./....M) + D(l, 2....N), С?л = О(1, 2....f.......f.....k'....N)~ — D(l, 2, ..., i'...7......k....N) — — D(l, 2....i......./....k'.....N) — — D(l, 2....C.......j....k’.....N} +- -+ D(l, 2, .... /'.j....k......JV)4- + D(1, 2....i......./....k......N}-\- 4-0(1, 2....i.......j....k'.....N) — — 0(1, 2....N)
Вероятность в задачах классической механики 157 и т. д. Теперь при помощи сравнительно простых выкла- док можно убедиться в том, что (Ш. 19.2) D(vr'.....v^, гГ'.....0) = = D(1/, 2'.....N') = N = ch2cJ+ S c?>+ S с?д+.... i=l Это почти тривиальное равенство, но оно содержит раз- ложение, в котором каждый член допускает непосред- ственное и очень естественное истолкование. Рассмотрим, например, С?23- Допустим, что п, г2, г3, vI( v2, v3 таковы, что в тече- ние промежутка (—I, 0) частицы 1, 2, 3 не взаимодей- ствуют. Напомним, что межмолекулярные силы пред- полагались близкодействующими, и, таким образом, до- пустимо, чтобы в течение промежутка (—t, 0) каждая из этих частиц оставалась вне сферы действия других частиц. Или предположим, что только первая и вторая частицы «ощущают» друг друга. Ясно, что для таких начальных расположений частиц С12з = 0. Действительно, легко показать, что С?23 = о во всех случаях, когда не все три частицы «ощущают» друг друга. Мы ограничимся теперь рассмотрением газа из твер- дых шариков и сделаем следующие основные предпо- ложения: (a) D(vlt .... Уд,, гР .... Гдг; 0) = = <P(Vi....VjvMr,......rN); (б) ЯП....Гд,) = ,Ц р—»(!«/—«>1)} _ _______________________________________ V V !<!</<# {1, 0 < х < б (б — диаметр молекулы), 0 вне этого промежутка.
158 Глава III Допущение (б) означает, что вначале у нас было равномерное распределение в пространстве. Оба допу- щения (а) и (б) сделаны только для / = 0. Мы хотим теперь вычислить <p(vlt ...» v„, t) = = J ••• f D(vt, .... vN, rlt .... rN-, /)dr, ... drN. V V Для этой цели мы используем «комбинаторное» разло- жение (III.19.2). Заметим, что f f С° drx... drN = <p(v,, .... уЛГ) = ф(у1.v„;0). V V Поскольку С*=0, мы начнем с рассмотрения f • • • f Cij • • • drN. V V Чтобы упростить запись, мы положим »=1, / = 2 и заме- тим, что f ’ • • f С?2</Г1 .. • dtN — V V = f ... J* {D(lz, 2', 3, 4, .... JV)~ V V — D(l, 2, .... /V)]^ ... drN = = f... f v2-', [v3-q..........M)x V v Xt(rr'.r2-', [r3-'J.[r-]) - <p([vrq, [V2-'J.[V^])X X4(M. •••. 1^])}^...^= = j*... f (ф(уг', V2-', v3, ..., VW)X Xt(rr', r2-', r3, .... rN)- — <p(Vp v2.....V/vMn......Гдг)) dft ... drN. Здесь на последнем шаге мы воспользовались форму- лами (III.19.1). Напоминаю, что как я уже предупреж-
Вероятность в задачах классической механики 159 дал, мы бесцеремонно обращаемся со стенками всякий раз, когда нам это удобно! Теперь рассмотрим интеграл Р(1р r2)= f • • • f *(Г1» ..., rN)dr3 ... drN. V V Это хорошо известное двучастичное распределение для газа из твердых шариков в равновесии. Его точное вы- числение представляет пока еще не решенную проблему, и в отчаянии физики обращаются к разложению (так называемому вириальному разложению) по степеням плотности C = N/V=\/v (v — объем на одну частицу). В нулевом приближении (идеальный газ) мы имеем P(r„ r2)~ 1/V’ и, следовательно, f • • • f Си = V V = -рз- f (<P(vr'. v2-', v3, .... v„)- £ (vp Vj) — <P(Vp v2....¥„)}*, dr2, где B(vi, v2)—область в шестимерном пространстве, в которой С12 =# 0. Ясно, что г( (или г2) можно выбирать произвольно внутри V (здесь мы снова пренебрегаем стенками), и условие Си ¥= 0 означает просто, что г2 должно быть та- ким, чтобы в промежутке времени (—t, 0) между части- цами (г1( Vi) и (г2, v2) (значения относятся к моменту 1=0) произошло ровно одно столкновение. Для модели твердых шариков, которую мы все время рассматриваем, получается выражение f f • • • drN= V V (фИпО)R; 0 -<p(R; 0)*»=*eMv(R; o); здесь мы пользуемся обозначениями из п. 16.
160 Глава III Мы видим теперь, что <P(R; *)=/••• f D<Vi.......vN, q, ...» rN; i)X V V Xdr, ... dr„ = <p(R; 0)-H S 2zy<p(R; 0)+ .• и если ввести оператор 2 = то мы видим, что он совпадает с основным оператором (III. 16.7). Становится совсем весело, когда мы переходим к рассмотрению • • • J С?/* dr 1 dr2 ... drN. v v Здесь для данных vz, Vj, vfc мы должны исследовать те расположения (rit rj, гЛ1), для которых все три части- цы «ощущают» друг друга в течение промежутка (-/, 0). Сначала следует классифицировать различные типы «расположений столкновения». Броут заимствовал эту классификацию у Грина, который провел ее во всех под- робностях. Различают (а) точные тройные столкновения (i, j, А); (б) последовательность парных столкновений, напри- мер (i, /), (i, А); это означает, что сначала i-я частица сталкивается с /-й, а затем i-я — с А-й [эту последова- тельность следует отличать от (i, k), (i, /), где i-я части- ца сначала сталкивается с k-Vi, а затем с /-й]; (в) «вир- туальные» столкновения, например (i, /)', (i, k)'\ это оз- начает, что i-я частица столкнулась бы с k-ti, если бы этому не помешало предшествующее столкновение ее с /-й частицей; (д) «циклы столкновений», например (i, /), (i, k), (j, k). Столкновениями типа (а) пренебрегают из-за боль- шой разреженности газа; пренебрегают также столкно- вениями типа (д), считая, что их число сравнительно не- велико при больших N.
Вероятность в задачах классической механики 161 Вклады от (б) и (в) вычисляются тогда и дают 27 (^ij^ik + &Jk®lj Н” ^ik^Jk + ®Jk®ik)- В добавление к этим членам мы получим вклад от чле- нов С4 ^<[<N №у®к1 + ®lk®Jl + ®ifijk) • Если объединить все члены второго порядка по t, то они дадут -£-22<p(R; 0), причем мы пренебрегаем величиной и-2еЬф(К; о). Это аргументируют тем, что 2?/ соответствует повтор- ным столкновениям (i, /), (i, /), которые могут происхо- дить только после промежуточного столкновения со стенкой. Снова считается, что в пределе (W -► оо; V-> оо) такое пренебрежение законно. (Это место встре- чается также в доказательстве распространения хаоса во времени, приведенном в п. 17.) Если это все еще недостаточно скверно, то подумаем о членах высшего порядка С’/н и т. д.! Помимо чисто комбинаторных трудностей (при клас- сификации различных конфигураций столкновений), с которыми можно справиться с помощью диаграмм, по- добных введенным Фейнманом в квантовой электроди- намике, мы сталкиваемся с различными предельными переходами (Af->oo, V->oo, NIV=c, с->0, /->оо; ct остается фиксированным), разобраться в которых по- истине немыслимо! Вы можете понять, почему Уленбек в первой части приложения I называет попытку Броута отважной. Од- нако картина все же начинает проясняться и, может быть, скоро станет полностью понятной. 20. Главный недостаток метода, использующего ос- новное уравнение, по крайней мере для кинетической теории газов, состоит в том, что его трудно (если не 11 м. Кац
162 Глава HI невозможно) обобщить на случай пространственно не- однородного газа. Поэтому неясно, в каком же смысле полное уравне- ние Больцмана (т. е. вместе с членами, описывающими течение газа) является вероятностным уравнением. Можно сказать, что раз мы принимаем во внимание зависимость от расположения в пространстве, то ситуа- ция становится переопределенной и не остается возмож- ности для усреднения. Здесь уже нет аналога нашему множеству S в кру- говой модели, и могут быть только «удачные свойства> начального распределения D. Неясно, достаточно ли этого для удовлетворитель- ного вывода полного уравнения Больцмана. Я лично сомневаюсь. Подход Боголюбова, подробно изложенный во вто- рой части приложения I, выглядит (по крайней мере в настоящее время) чересчур формальным. Он оставляет без ответа слишком много вопросов, чтобы его можно было признать окончательным. Чувствуется (по крайней мере, я так думаю), что не- которое усреднение должно каким-то образом происхо- дить в течение короткого времени т (времени столкнове- ния), после которого многочастичное распределение уже функционально зависит от одночастичного распределе- ния. Эта основная проблема требует выяснения, хотя для формального применения метода Боголюбова это несу- щественно. 21. Оставшиеся пункты этой главы будут посвя- щены обзору теории Смолуховского флуктуаций плот- ности. Эта теория служит прекрасным примером статисти- ческой теории в физике; она поможет нам лучше понять многое из того, что уже обсуждалось в других пунктах этой главы. Смолуховский развил свою теорию, чтобы объяснить результаты опытов Сведберга и других с коллоидными растворами. Позднее эту теорию и экспериментальные данные, на которые она опиралась, он положил в основу
Вероятность в задачах классической механики 163 блестящего и глубокого анализа пределов применимости второго закона термодинамики. Сведберг наблюдал через определенные промежутки времени (39 наблюдений в минуту), сколько коллоид- ных частиц находится в фиксированной области А внут- ри большого сосуда. В результате наблюдений он полу- чил последовательность из 517 чисел; мы приводим на- чало этой последовательности: 1,2,0,0,0,2,0,0,3,2,4,1,2,3,1,0,2,1,1,1,1,3,1,1,2,5,1,1,1,0,2,3,3,1. Как следует анализировать эти числа и что поучи- тельного мы можем извлечь из такого анализа? Это ти- пичная задача, которая должна часто вставать перед естествоиспытателем, и мы постараемся сейчас показать, как он к ней подходит. Предположим, что объем сосуда равен V и что в нем содержится /V коллоидных частиц. Сделаем теперь два допущения: (1) каждая частица совершает броунов- ское движение; (2) частицы не зависят друг от друга. Первое допущение для математической теории несу- щественно: все, что нам требуется, — это достаточно полное статистическое описание движения одной части- цы. Под этим понимается, что положение г(т) любой выбранной частицы является реализацией какого-то случайного процесса (принимающего векторные значе- ния) , который нам полностью задан. Чтобы читатель не перескакивал к уже забытому п. 6 этой главы, напомним, что все это означает следующее: г(т) является однопараметрическим семейством измери- мых функций г(т; со), заданных на некотором множе-' стве Q, снабженном вполне аддитивной. мерой ц (p(Q) = 1); при этом мера ц вводится так, что для лю- бых трехмерных борелевских множеств А, А2, ..., Дп мы имеем *) (III. 21.1) Р{г(Л)СД, г&КА. ...» г(/яКА) = =ц{г(Л; “КА. r(/2; ©KA............г(*я; ®КА1- ) Физик, редко ощущающий потребность в формализации <оче- видного», полагает, что случайный процесс полностью определен, коль скоро он знает, как вычислить вероятности в левой части 11*
164 Глава III Очень существенно допущение (2), чрезвычайно упрощающее задачу. Оно позволяет игнорировать та- кое важное явление как коагуляция; однако это может быть обосновано лишь для очень слабых коллоидных растворов. Формальный смысл допущения (2) следующий: пусть гДт; ©j), ©j £ Q,, — случайный процесс, описывающий движение /-й частицы. В предположении, что частицы неразличимы, мы можем считать, что все Qh Q2,..., fi.v тождественны (Qj = Q). При статистическом описании совместного движения всех частиц мы неизбежно дол- жны иметь дело с произведением множеств: 2X2 Х2Х ••• X 2- Предположить независимость — это значит задать меру в ОХ ... Хй как произведение мер. Некоторые другие допущения более специального характера будут сделаны дальше по мере надобности. 22. Пусть ф(г)—характеристическая функция обла- сти А, т. е. ( 1, гбА *<Г) = ( 0, г£А. Тогда N ап. 22.2) «4(0=^ ♦ (Г/W) есть просто число частиц, попавших в А в момент вре- мени /. Очевидно, что nA(t)—случайный процесс и более последовательно было бы его записать так: N ЦП. 22.3) пА (t)=пА (/; «) = 2 ф (г, (/; ©,)), (III21.1). Математик же большую часть времени проводит в обду- мывании того, могут ли эти и более сложные вероятности быть кор- ректно определены. Существуют ситуации (см., например, пп. 1—3, гл. IV), когда такие предосторожности оправданы, но в этом и сле- дующих пунктах они имеют второстепенное значение.
Вероятность в задачах классической механики 165 где ш— сокращенное обозначение набора (ом, .... con) и (Oj£Q (иными словами, ... XQ). Остается теперь вычислить вероятности (Ш. 22.4) Р [пА (/,) = лр лд (t2) = п2, ...» пА (tk) = л*}. Мы подробно покажем, как вычисляется вероятность (III. 22.5) Р {лд (/,) = m, пА (t2) = л}, после чего станет ясно, как производить вычисления в общем случае (II 1.22.4). Мы исходим из очевидной фор- мулы 2* 2х (III. 22.6) (2л)"2 / f ехрЩ^ + т]/))^П = 6*.(Д,о. о о где k и I — целые числа и б — обычный символ Кроне- кера. Отсюда немедленно следует, что Р {л (ZJ = т, п (t2) = л) = 2к 2х = £^(2л)"2 j f ехр[—Z(fcm4-T]«)]X о о X ехр [z ЦпА (/,) 4- Т]ЛД (t2))] d£ dr) Здесь символ Е означает интегрирование по произве- дению пространств ОХ ... XQ. Меняя порядок инте- грирования (Фубини!), мы получаем (III. 22.7) Р {л (Z,) = т, п (t2) = л} = 2» 2х = (2л)"2]’ J expl—1(ИН~т)л)]Х о о X Е {ехр [Z (£лд (/,) + Т]ЛД (f2) Я) d£ di\. Остается вычислить Е {ехр [z &пА (/,) + т]лд (Z2)){}, т. е. просто интеграл по произведению мер в простран- стве ОХ ... XQ от функции ехр [/(6лд (/j; «)+тлд(^2; ю)){.
166 Глава Hl Используя выражение (III.22.2) и предположение о независимости частиц (т. е. то, что мера в ОХ ... ХЯ является произведением мер), мы получаем (III. 22.8) Е (ехр [/ &пА (tx) + п«л (Л))]) = N = £|ехр Z 2(£Ф(г/01))4-ПФ(г>02))) ) = П Е (ехр [< (W (г, (Л))4-пФ 0; (t2)))[} = = [£ (ехр [/ (£ф (г (Л)) + пФ (г 02)))[| [*. Второе равенство непосредственно следует из независи- мости, в то время как третье равенство есть следствие того, что частицы неразличимы (и поэтому статистиче- ски одинаковы). Теперь, поскольку ф принимает только значения 0 и 1, имеем ехр [/ (£Ф (г (tx))+пФ (г (Л)))] = = 1 + [ехр (%) — 1J Ф (г (/,)) + [ехр (in) — 1J Ф (г 02)) + 4- [ехр («1) — 1 ] [ехр On) — 11Ф (г (/,)) Ф (г 02)) и, следовательно, (III. 22.9) Е (ехр[/ft* (г(/,)) + пФ(г))]} = = 14-[ехр (ft)— 1[Р [г (ЛИ Л) + 4-[ехр(/п)-11Р{г(/2)еЛ1 + 4- [ехр -1 [ [ехр On) - 1J Р (г (Л) 6 А, г (Л) £ Л). Комбинируя (III. 22.7), (III. 22.8) и (III. 22.9), мы по- лучаем (III. 22.10) Р {пА (tx) = т, пА (Л) = л) = = (2л)"2 f f ехр [— i (И+пл)1 X X (1 + [ехр(^)- 1]Р (г(лИЛ} + + [ехр(й1)-1[Р{г(ЛИЛ}4- 4- [ехр (/1) -11 [ехр On) — 1 ] Р {г О,) 6 А, г 02) 6 Л))*dl drj.
Вероятность в задачах классической механики 167 Эта формула слишком сложна, чтобы с ее помощью можно было многого добиться, и мы должны теперь обратиться к некоторым дополнительным соображениям, позволяющим упростить ответ. Первая возможность такого упрощения усматривает- ся в том, что оба числа N н V велики. В самом деле, формула (III. 22.10) нас интересует только в пределе (III. 22.11) N-^oo, (смысл v очевиден: среднее число частиц в единице объема). Дальнейшее упрощение возникает из предположения о «статистическом равновесии;». Это предположение в действительности состоит из двух частей: (а) вероятность Р {г (/,) С Л1.г (/„) £ Ля} зависит только от разности моментов времени (/* — /Д (стационарность); (б) Р (г(/)£ Л) = |Л|/У, где |Л| — объем области Л. И вот, наконец, третье необходимое нам допущение, которое на первый взгляд кажется более странным, чем оно есть на самом деле. Это предположение состоит в следующем: (в) P{r(/,)€A......г(/„)6Ля) = = J ••• J Wy(rP 6; г2, /2; ...; гя, tn)dvx ... tfr„, Ап где Л; •••» Гл« ^»)=У ^(Гр Л1Г2’ ^2* •••’ Гл> ^л) и предел lim Pv(Гр tx |г2, /2;...; гя, /я) = Р(г1, |г2, /2;..г„, /я) V-bx существует в слабом смысле. Здесь подразумевается, что при У-»-оо не только объем сосуда, но и все его размеры стремятся к беско- нечности.
168 Глава III Смысл предположения (в) становится более понят- ным, если обратиться к броуновскому движению. Если броуновская частица движется в сосуде с отра- жающими стенками, то можно показать, что ^у(гр /р •••! гя, /„) = = V- Ру(Гр /1|г2, /2) Ру (Г2, /2|г3, /3) ... • • PV (**Л-1’ ^.1-1 I Г/|» ^д). где ^(г. Л If. <2) — фундаментальное решение уравнения диффузии (III. 22.12) 4г=4ДР’ удовлетворяющее граничному условию на стенках сосуда и начальному условию lim(г |р; /) = б(р —г) /->о (единица измерения выбрана так, чтобы коэффициент диффузии равнялся 1/2). Для конечного сосуда Ру(г|р; /) зависит как от его размеров, так и от его формы, но можно опять пока- зать, что lim Pv (г, |р, /2) = У->оо = 12л (/2 - /,)]-’'* ехр [|||р - г|Р (t2 - Л)"‘] = = Р(г, 0|р, t2 —12). Написанная функция служит фундаментальным реше- нием уравнения (III. 22.12) во всем пространстве. Любопытно отметить, что хотя нам с большим тру- дом удается избавиться от V (устремляя V к оо), мы не могли бы никаким естественным образом (во всяком случае, я не знаю как) действовать сразу во всем про- странстве и избежать обременительного предельного пе- рехода.
Вероятность в задачах классической механики 169 Теперь уже все просто! Переходя к пределу (III.22.il) и используя все наши предположения, мы получим (III. 22.13) W(m, п; /2- /,)= 1F(m, п, t2) = = lim Р {лд (Л) = т, пА 02) = л) = = (2л)-2 J J ехр [— i (1т + пл)] F(£, п) dx\, о о где (III. 22.14) F(l, п) = ехр[р{[ехр01)-1[+[exp(in)-l]-f- 4~ g (t2 - А) [exp (/£) — 1] [exp On) — 1 J}]» (III. 22.15) l» = v|X|, (III. 22.16) gO) = TjT f f P(r> 0|p, f)dtd9. A A Смысл ц и g(t) очевиден: p — среднее число частиц в области А и g(t)—условная вероятность [после пре- дельного перехода (III.22.il)] того, что частица, нахо- дящаяся в момент /=0 в А, вернется в А к моменту /. Смолуховский использовал величину (III. 22.17) Р0) = 1-g0). которую он назвал «вероятностью последействия> («Wahrschein-lichkeitsnachwirkung>). Он получил формулы W(т, 0; т + k, t) = ехр (-ц) А^Е/+* k > 0, 1=0 W(m, 0;m — k, /) = ехр(— ц)-^ J} A^Ei-*, 0^.k^m, i=k где Xm)=CmP'(l —P)m"'. ^ = ехр(-ИР)^.
170 Глава /// Вывести эти формулы из (III.22.13)—уже простое упражнение (немного утомительное). Вывод самого Смо- луховского (чисто комбинаторный) намного проще на- шего. Однако наш вывод может быть немедленно рас- пространен и на вычисление вероятности (III.22.4) в общем случае, в то время как способ Смолуховского приводит здесь к сложной комбинаторике. Несмотря на то что нам потребовалось очень много разговоров, чтобы получить формулу (111.22.13), и не- смотря на ее довольно сложный вид, чисто математиче- ское содержание последних двух пунктов сравнительно бедно. «Знаток» теории вероятностей может с легкостью опустить все это, полагая, что здесь просто «много шума из ничего», или, еще хуже, перечеркнуть их непререкае- мым и, по-видимому, самым уничтожающим словом «тривиально». Но попробуем теперь взглянуть на окончательные формулы с точки зрения физика. Он мог бы при помощи данных Сведберга вычислить, скажем, частоту f(0, 0; /), с которой нули последова- тельно появляются друг за другом через t секунд (/ сле- довало бы брать кратным 1/39, поскольку Сведберг де- лал 39 измерений в минуту). Затем он мог бы прирав- нять наблюденную частоту и теоретически вычисленную вероятность Я7(0, 0; /) и получить численное значение для g(t). Поскольку в экспериментах Сведберга ча- стицы были по существу свободными броуновскими ча- стицами, он мог бы положить £(*)=РГГ f JexP(~тЧг — P\\2/Dt)^nDi)~!ll^dp А А (мы вернулись теперь к истинному коэффициенту диф- фузии D1) и вычислить D. Для сферических частиц D задается формулой D = ^7'/(блат|) = /?Г/(6Л/лат]), где R — универсальная газовая постоянная, N — число Авогадро, а — радиус коллоидной частицы, т) — коэффи- циент вязкости той жидкости, в которой взвешены кол- лоидные частицы.
Вероятность в задачах классической механики 171 Отсюда он нашел бы, что число Авогадро приблизи- тельно равно 6,09 • 1023. Поистине невероятно, что можно получить число по- рядка 1028 из чисел Сведберга, каждое из которых не превосходит 6I Здесь мы снова видим результат, ценность которого не может быть определена одними только математиче- скими его достоинствами. 23. Из выражения (III.22.13) для W(m, tx; п, t?) мы немедленно получаем формулу для W(m, tj)= lim Р{лд(Л) = /п}. V->oo Действительно, (III. 23.1) lF(m, Л) = 2 W(m, t2; п, t2) = /1=0 2х = (2л)"1 J ехр (— фл) F (£, 0) dl = ехр (— ц) цт//л1 о Эту формулу, разумеется, можно получить также и не- посредственно. Более интересны формулы для W(nlt tii п2, t2; ...; л*, /*) = = lim Pv{nA(Л) = Л1, лд(/2) = л2, ...» лд (/*)== л*). Непосредственным обобщением метода из п. 22 мы по- лучаем следующий ответ: (III. 23.2) W(nu /р л2, t2, ...; л*. /*) = 2« 2» / * ч = (2л)"*ехр(— ц) J ... f ехр( — 0 0 \ /-1 / где (III. 23.3) F&, XF(^.....••• = ехр ц Д’ [14- gj (ехр (fy) — 1)]].
172 Глава 1И «Звездочка» над знаком произведения означает, что его нужно понимать в следующем смысле: перемножим все , gh так, как если бы они были числами, а за- тем заменим произведение gitSit • • • gij выражением (III. 23.4) g(/t||/,,.tls) = =pt f fp ^1Г2' r- ^)dr> •••dT^ A A (если s=l, g/t просто заменяется единицей). Напри- мер, ]J‘n+g/(exp(i^) —1)] = = 1 + (ехр ОЮ —1)4- (ехр (*12) -1)4- (ехр (<13) -1)4- +g(*i ka)(ехр(а>) — 1)(ехр01а) —1)4- + gOi Из) (ехрО^) — 1) (ехр (Дз)-1)4- + g (*2 1*з) (ехр (*12) -1) (ехр 01з) -1) + +g (Л 1*2, *з) (ехр (110 — 1) (ехр (/Е,2) — 1) (ехр (£3) — 1). Предположим теперь, что существует процесс г(1)* 2) с вероятностями перехода Р(гь /1|г2, 4, .... rn, tn). Иными словами, существует такой процесс, что (III. 23.5) Р |г(/,) = г, |г(/2)6Л2.г(/л)6Ля} = = / '1 ‘ fp(ri’ 1Г2’ ** • •г»’ ’ dr«- Л2 ЛП (Например, трехмерное свободное броуновское движе- ние является именно таким процессом; подробности см. в гл. IV.) ) Само собой разумеется, что моменты времени /, ..., так же как и tit, .... tis, упорядочены. 2) Мы пользуемся тем же обозначением для другого процесса. Для согласованности обозначений мы должны были в преды- дущем пункте использовать обозначение Гу(/).
Вероятность в задачах классической механики 173 С этим процессом мы можем связать процесс nA(t) ’), принимающий лишь неотрицательные целые значения и определяемый следующим набором вероятностей: (III. 23.6) Р (Лд (Л) = Я1..пА (/*) = л*) = = U7(/Zj, /р п^, t2', •••; nk, tk) [здесь все V задаются формулами (III. 23.2) и (III. 23.3)]. Определен ли на самом деле формулой (III.23.6) слу- чайный процесс пА(0? Почти непосредственно можно показать, что nA(t) удовлетворяет требованиям согла- сованности и непрерывности. Все это следует из соотно- шения (III. 23.7) lim g (0 = 1. t-ьо Но будут ли вероятности W неотрицательными? Если вероятности Р могут быть получены как предельные значения вероятностей Pv [см. условие (в) из п. 22 этой главы], то неотрицательность всех W очевидна, так как они являются пределами неотрицательных величин. Но можем ли мы быть в этом уверены, если Р — просто вероятности перехода для процесса г(/)? Прямое доказательство неотрицательности W должно получаться из формул (III.23.2), (III.23.3), но такое занятие выглядит непривлекательным и скучным. Верно ли, что вероятности Р могут всегда быть получены как пределы вероятностей Pv для подходящим образом определенного процесса rv(f)? Почти наверняка это так, но я не знаю доказатель- ства. Что же нам теперь делать? Чтобы сэкономить время, мы просто ограничимся процессами r(t), подобными свободному броуновскому движению, для которых можно определить процесс Гу(/). Добившись согласованности и неотрицательности, мы обратимся к теореме Колмогорова (п. 6 этой главы) и приведем наконец все в полный порядок. *) Мы снова употребляем одинаковые обозначения для разных вещей. Формально мы должны были бы писать nAiV (/).
174 Глава HI Определенные так процессы nA(t) мы назовем в честь их истинного изобретателя процессами Смолуховского. 24. Процесс Смолуховского, полученный с помощью броуновского движения свободных частиц, служит про- стейшей статистической моделью, имеющей непосред- ственное отношение к действительности, для которой можно обсудить некоторые детали, касающиеся обрати- мости и возвращаемости. Конечно, эренфестовская мо- дель «пса и блохи», подробно рассмотренная в этой главе, во многом проще. Но сколь она ни остроумна и полезна, она все же слишком искусственна. Модель Смолуховского прочно укоренилась в физике, и выте- кающие из нее выводы о реально существующих телах могут быть сопоставлены с экспериментальными дан- ными. Мы обсудим вопросы о возвращаемости в сле- дующих пунктах. Здесь же мы сделаем несколько замечаний, чтобы закончить физические рассмотрения. Сначала определим условные вероятности Р(«1, 6|/i2, t2; nk, tk) по обычной формуле (Ш. 24.1) Р(л„ Л|л2, /2; ...; л*, /*) = = lF(nl( f|) ^2’ ^2’ = = IF (П|) ^2> ^2’ •••» th) и заметим, что (Ш. 24.2) Р (лр IЛа, /2; ...; л*. /*) = = Р(Лр 0|л2, t2 — /р nk, tb — tj. Вычислим теперь (Ш. 24.3) Е {лд (0) = ш |лд (/)} = 2 «Р И. 01л, /), т. е. среднее число частиц в области А при условии, что в момент времени 1=0 там было т частиц.
Вероятность в задачах классической механики 175 Имеем £ЛР(Л1, 0|я, /) = -^у 0; п, /) = Л=0 Л=0 = ’гЬг2л(2я^"2/ jexp[— л=0 0 О =тгЬо 2 п (2я)'1 J ехР f 00 d^' ’ л=о о где /(П) = (2л)"1 J ехр (—фп) F(£, т|)с£. о Поскольку /01) = 2 (2л)"1 / ехр (— ЙП)/(О ехр (йух), л»О О мы имеем Г (П) = i 2 п С2")'1 f ехР (— dZ ехр (/тух) л-0 О и, следовательно, (III. 24.4) £|лл(0) = т|Лл(/)}=-^|/'(0) = 2« ~ lW(m) f еХр(’dn\.o^ = = 1г7^2я)~1 / ехр(—/^и)ехр(у|ехр(^) —1|)Х X {1 — g(/) + £(/) ехр (/у) dl = = wg 0) + Н (1 - g 0)) = И + (« ~ И) g 0)-
176 Глава III Эта формула находится в полном согласии с макро- скопической теорией диффузии, если вспомнить, что А А В самом деле, у. есть просто нормальное [и предель- ное, поскольку g(t) -* О при /-*оо] количество «веще- ства» в Л, в то время как (т — n)g(t) — это то, что останется в Л к моменту времени t от дополнительной части вещества (т — ц) в начальный момент / = 0 (она может быть и отрицательной!), если диффузия происхо- дит по классическим законам. Подобным же образом мы найдем, что (III. 24.5) Е {лд (0) = т |(лд (/) - р - (/л - ц) g (/))’} = = mg(/)(l-g(/)) + p(l-g(/)). Итак, относительная флуктуация равна \mg (t) (1 - g (/)) + Ц (1 - g (/) )Г‘ k+ (/п - ц) g ЮГ1. и при больших цит^ц имеет порядок ц_'А; поэтому ею можно пренебречь. Таким образом, можно обойтись без вероятностей и пользоваться феноменологической тео- рией диффузии. Для малых значений ц (в упомянутом опыте Сведберга 1,54) флуктуации перекрывают сред- нее, и статистическое рассмотрение становится неизбеж- ным. 25. Для эренфестовской модели «пса и блохи» мы имели (III. 25.1) Р(Яо|Я1, л2, ...» л*) = = Р (По IЛ1) Р (п} |л2) ... Р (л*_1 |л*). Это есть свойство «марковости», благодаря которому модель легко поддается математическому исследованию. Выполняется ли марковость для модели Смолухов- ского? Иными словами, верно ли, что (III. 25.2) Р(лр /1|л2, t2; ...; л*, /*) = = Р(лр /^Лг, /2) ••• Р(лд_р ^-1^, /4)?
Вероятность в задачах классической механики 177 Вообще говоря, следует ответить «нет>, и мы должны будем обратиться к некоторому искусственному при- меру, прежде чем получим марковскую модель. Чтобы разобраться в этом, заметим, что из (III. 25.2) получается выражение Р(лг, 0|л, /)=2 Р(/п, 0|£, т; п, t) = *=о = 2’Р(лг, 0|Л, т)Р(£, 0|л, t — т); h-0 другими словами, это означает, что матрица П(/)=||Р(т, 0| л, 0|| удовлетворяет уравнению (III. 25.3) П(0 = П(т)П(/ —т)1). Посмотрим, выполняется ли для нашего процесса хотя бы условие (III. 25.3). Напишем ехр ((ехр (ф — 1) + (ехр (гл) — 1)+g (0 (ехр — 1) X X (ехр (й)- 1)) ]=ехр [ц (ехр (£)-1)] ехр [н (ехр (Ztj)—1 )l X X 2 <ехР № —<ехР </г1) — О*- *=о Мы видим, что (III. 25.4) Р(/л, 0|л, 0 = -^>^- = 2^(0Ья. *=0 где (III. 25.5) хт» = ехр (ц)ml p~m (2л)-1 ]' ехр (— &п) X X ехр [и (ехр (ф — 1)] (ехр (ф — 1)М *) Это уравнение (так называемое уравнение Чепмена—Кол- могорова— Смолуховского) часто ошибочно принимают за опреде- ление марковского процесса. Существует пример, принадлежащий П. Леви, в котором выполняется условие (111.25.3), а условие (III. 25.2) не выполняется. 12 М. Кац
178 Глава III и 2« (Ш. 25.6) уЛя = ^.(2лГ} f exp(-/t]/z)X о X ехр [ц (ехр (z‘n) — 1)1 (ехр (й]) — 1)* dr\. Поскольку Р(/п, О|л, 0) = 6т,я [это следует из того, что £(0) = 1], мы получаем (III. 25.7) 1хяЛу*т = бга>я, и, следовательно, (III. 25.4) можно рассматривать как приведение матрицы П(/) к диагональному виду1). В частности, числа 1. m ••• служат собственными значениями матрицы П((). Теперь ясно, что для справедливости равенства (III. 25.3) необходимо, чтобы (III. 25.8) = и поскольку функция g(t) измерима, она должна иметь вид (III. 25.9) g (t) = ехр (— at), а > 0. Так как в опытах с коллоидными частицами g(t) ни- когда не получалась в виде экспоненты, то этот процесс не может быть марковским. *) В действительность соотношений (III. 25.7) недостаточно, чтобы утверждать, что (III. 25.4) приводит матрицу П (/) к диаго- нальному виду. Необходимо еще условие (III. 25.7а) = m«0 которое для бесконечных матриц не вытекает нз (III. 25.7) и на самом деле может оказаться даже неверным. К счастью, в нашем случае (III. 25.7а) можно получить отдельным вычислением, хотя и не очень простым. Может быть, читатель ради развлечения сам най- дет доказательство.
Вероятность в задачах классической механики 179 Возникает вопрос, будет ли процесс, для которого g(t) представляется в виде экспоненты (III. 25.9), мар- ковским. Легко доказать (хотя необходимые для этого вычис- ления слишком утомительны, чтобы их здесь воспроизво- дить), что если в дополнение к условию (III. 25.9) мы имеем также (при /1<^< ...</*) (III. 25.10) £(/,|/2, tz.tk)=g(tx\tk) = g(tk-tx), то условие (III. 25.2) будет выполнено и процесс дей- ствительно марковский. Несколько раздражает оставшаяся нерешенной сле- дующая задача: следует ли (III. 25.10) из (III. 25.9)? Ответ представляется почти наверняка отрицательным, ибо почему вид g(/il6) должен определять последей- ствие высших порядков? Пока вопрос остается открытым. Если бы удалось найти процесс, для которого g(0 = exp(— at) и в то же время не выполняется условие (III.25.10), то мы получили бы другой пример немарковского процесса (менее искусственный, чем упомянутый выше пример П. Леви), для которого выполняется (III. 25.3). 26. Существует ли процесс, удовлетворяющий усло- вию (III.25.10)? Ясно, что это условие может выполняться только в том случае, когда каждая отдельная частица движется так, что, находясь в Л в моменты времени ti и tk, она непременно должна находиться там и во все промежу- точные моменты времени. Процессы, удовлетворяющие условию (III. 25.10), мы будем называть устойчивыми. Простейший устойчивый процесс был впервые изу- чен Фюртом. Он рассматривал число nA(t) пешеходов, проходящих по тротуару в некотором фиксированном отрезке А. Предполагается, что пешеходы двигаются с постоянной скоростью |о| в любом из двух противопо- ложных направлений, нигде не меняя направления сво- его движения, за исключением двух искусственных 12*
180 Глава Ш отражающих барьеров, расположенных в — L и +L (мы устремим затем L к оо). Интервал А может быть вы- бран равным (—-у/, у/)- Пусть фг(х) определяется следующим образом: Ф£(х)=х — 2pL, |х — 2pL| < L, р — четное, фд(х) =—x-\-2pL, \x — 2pL\<L, р — нечетное. Мы можем положить (III. 26.1) rz, д (/) = фд (х{ + е( | v| /), где Хь ..., xN, «|, аг, .... eN все независимы, каждое х равномерно распределено на интервале (—L, L), а каж- дое е принимает значения +1 или —1 с равными ве- роятностями (1/2). В чисто математических терминах это означает, что наше множество Q является произведением множеств (III. 26.2) (-£, £)Х{-1. 1) и на (—£, £) выбирается обычная (нормированная) ме- ра Лебега, а мера на {—1, 1} задается приписыванием равных весов 1/2 для +1 и —1. Мера же множества (III. 26.2) является произведением мер (это математиче- ское выражение нашего соглашения о том, что началь- ные точки и направления движения независимы). Почти очевидно, что при £->оо мы получаем (III. 26.3) g(t) = о, Ясно, что этот процесс устойчив. Если обобщить его, положив где Ui распределены с одной и той же четной плотностью распределения f(v) ’), мы снова получим устойчивый ) Множеством й является теперь (—L, £) X (— оо, оо), где мера на (—оо, оо) определяется так: Н(£) = f f(v)dv. Е Все предположения о независимости, разумеется, сохраняются.
Вероятность в задачах классической механики 181 процесс, для которого g(t) (опять в пределе при L-»oo) задается формулой (III. 26.4) g(i) = 2 f max (1 — r'vi, 0)/ (и) dv = о u~l = 2J (1 — l~'vt)f(v)dv. о Отсюда видно, что не всякая функция g(t) может служить для определения устойчивого процесса описан- ного выше типа. Ясно, что g(t) должна быть такой, чтобы найденная с ее помощью функция f(v) была неотрицательной. Предполагая, что g дважды дифференцируема при />0, мы получим дифференцированием формулы (III. 26.4) и~1 2/"’J vf(v)dv = — g'(t). о Дифференцируя еще раз, получаем Отсюда, если g"(f)^ 0, мы приходим к решению (III. 26.5) /(г>) = у/2|г>Г3^/(/|г’Г1)- Для того чтобы было оо J/(«)Л>=|, о мы должны еще ввести предположение lim tg'(t) = O. /-►оо, t->0 Очевидно, что g(/) = exp(— at) удовлетворяет этим условиям, и, следовательно, с по- мощью этой функции можно получить устойчивый про- цесс. Итак, марковский процесс nA(t) может быть
182 Глава III построен, но его распределение скоростей /Си)=у /2“21v Г3 ехР (— 1а 110 г1) крайне искусственно. Читатель должен был заметить, что устойчивость процессов, рассматриваемых в этом пункте, объясняется тем, что область А (в нашем случае интервал) связна. Будь А объединением двух или большего числа ин- тервалов, нельзя было бы утверждать, что (Ш.26.6) g(M/2./3) = £(Л1*з). Поскольку из опытных данных, подобных данным Сведберга, можно решить, выполняется ли (III.26.6),то тем самым (забавно!) мы имеем возможность опреде- лить связность (одномерного) множества с помощью статистического анализа. Последнее замечание в заключение этого пункта. С процессом лл(0 мы можем связать процесс e(t) следующим образом: , ~ — .v ( 1» если лл(/) = 0, (III. 26.7) e(t) = I (О, если лл(/)=#0. Ясно, что процесс (III. 26.7) стационарный и (III. 26.8) Е [е (/)} = Р {пА (t) = 0) = ехр (- ц). Далее, (III. 26.9) £{е(Л)е(/2)) = = Р [пА (6) = 0, пА (/2) = 0| = W(0, 0, /2) = = (2n)~2f f expfoi {(ехр(/^) —l)4-(exp(/n)—1)4- 4- g (*2 — 6) (exp (it.) — 1) (exp (йО — 1)}] <%> dr\ = = exp (— ц) exp l— и (1 — g(/2 — /,))]. P = log2 Пусть теперь и e(t) = 2e (0 — 1.
Вероятность в задачах классической механики 183 Мы имеем £{?(/)}= О и Отсюда следует, что любая функция вида 2^(0 _i может служить корреляционной функцией стационарно- го процесса, который принимает два значения +1 и —1 в предположении, что существует процесс Смолуховско- го с функцией g(t). В частности, если g(O) = l, g"(t)>0, t>0 и lim tg' (t) = 0, <->oo, Z->0 TO 2*(fl — 1 может быть корреляционной функцией стационарного процесса со значениями +1 и —1. 27. Формулы (III.23.2) и (III. 23.3), хотя и имеют совершенно явный вид, настолько сложны, что их почти невозможно использовать при обсуждении вопроса о времени жизни и времени возвращения для различных состояний. Однако состояние 0 (в области А нет частиц) может быть изучено во всех деталях, и это уже достаточно интересно. Сначала рассмотрим задачу о времени жизни (на- зываемом также временем устойчивости) состояния 0. Задача состоит в том, чтобы вычислить (III. 27.1) Р(0, 0|0, А/; 0, 2 А/; ...; 0, пЫ), особенно в пределе (III. 27.2) Д/->0, nM = i.
184 Глава III Этот предел можно принять за определение вероят- ности того, что время жизни нулевого состояния превос- ходит t. Как следует из нашей основной формулы (III.23.2), Р(0, 0|0, Л/; О, 2Д/; О, пМ)~ 2* 2» = (2л)-(я+,)/ ... J-FOo.... о о Теперь нужно заметить, что л л Д* П + gj (ехр (ft/) - 1И = Д* [(1 — gj)+gj ехр ед= =(1 — gn) П‘ io — gj) -+gj^p ед+ /=о + ехр (ft„) gn Д [(1 — gj)+gje*p ед. где оба произведения л-1 л-1 О-гЛД' и е.Д следует понимать символически. Отсюда вытекает, что 2it W'/Ffa.........1„)<Ц„ = о л—1 = ехр [р (1 — g„)] JJ* [(1 — gj)+gj ехр ед, /-о и, повторяя эту процедуру, мы получим (III. 27.3) Р(0, 0|0, Л/; ...; О, л Л/) = ехр [р Д’(1-«/)]• Символическое произведение л Д‘(1-£/) можно теперь вычислить по нашим правилам, после чего получается (если использовать элементарный принцип
Вероятность в задачах классической механики 185 «включения и исключения» комбинаторного анализа) л (111.27.4) II*(l-gy) = л-1 = — 20Р{г(*Л/)бЛ|г((Л-|-1)Д/)£Л; ...; г(лА/)£Д}. Эта формула становится особенно простой для устой- чивых процессов, поскольку в этом случае слагаемые равны 1 ~ g(M)- Таким образом, для устойчивых процессов (III. 27.5) Р(0, 0|0, А*...; О, лД/) = ехр(-Л|х(1-£(Д/))|, и видно, что ответ получается в точности таким же, как если бы процесс был марковским. Это, конечно, особен- ность нулевого состояния. В пределе при Д/->-0, nkt=t мы получаем ехр [^(0)/], в предположении, что g'(O) существует. 28. Намного интереснее результат, относящийся ко времени возвращения. Время возвращения в нулевое со- стояние является временем жизни (временем устойчи- вости) укрупненного состояния «не нуль» (0), и в этом заключается основная трудность задачи. Мы должны теперь вычислить (III. 28.1) Р (0, 010, А/; 0, 2А/; ...; 0, п М) = = 2 Р(0, 0|Л1, А/; Л2, 2А/; ...; Ля, л А/)1). *1Эьо,..., *я^о >) В пределе при Д/->0, n&t~t эта вероятность стремится к нулю. Это та же самая трудность, с которой мы уже сталкивались в п. 6 этой главы. Чтобы получить разумный предел, мы должны разделить _ _ _ Р(0, 010, Л/; 0, 2ДЛ ...; 0, лД/) на Р(0,0|0, Д/) и тогда уже перейти к пределу. Это совпадает с определением среднего времени возвращения, принадлежащим Смо- луховскому.
186 Глава III Сумма в (1П. 28.1) равна 2к 2» 2 (2л)-,я+17 ... /ехр|—/(*,$, +... +ЛД,)|v *^0, ..., *я^0 о о XF&, £1......IJdb и мы замечаем, что 2 (2я)-’ /ехр|-/Щ^(^о. Si..... *л*° F (&0* £1» • • •» &л—1 о ’ л-1 = ехр g/)+g/ехр (/$,)) — — ехр Продолжая таким образом, мы получим (2л)~2f f exp[-Z(ViUi + W]X *л-.^°-*л*° 0 0 XF&,.....U^„-A = = ехр -ехр р(1 — g„-i)jjr] — .. _ л-2 " — ехр ц(1— g„)IT +ехр Р(1—g„_i)(l — g„)Il* о л-2 л-2 О и, наконец, заметив, что интегрирование по go несколько отличается от интегрирования по другим переменным, (III. 28.2) Р (0, 010, А/; ...; 0, п М) = = ехр [ц (1 — go)] - 2 ехр [|i (1 — g0) (1 — g>)] 4- ‘*"1<<?/<лехР^(1 -g0)(l -g<)(l — g/)]~ — 3 exp(|4(l-go)(l-g<)(l-gy)(l-g*)] + ....
Вероятность в задачах классической механики 187 Здесь, разумеется, все экспоненты следует понимать сим- волически. Используя формулу, аналогичную формуле (III. 27.4), мы получаем Р(0, 0|0, Д/; О, лД/) = = 1- 2ехр[-иР {г(0)€Л|г(/Д/)£Л}] + + 2 <дехр[—и(Р {г(0)6Л|г(М/)£Аг(/Д/)£Л} + + Р{г(М/)6Д|г(/Д/)£Л))]- .... Для устойчивых процессов опять можно достичь су- щественного упрощения. Полагая (III. 28.3) Л(/) = 1—g(/)«). мы получаем (только для устойчивых процессов) (III. 28.4) Р„ = Р (0, 010, Д/; ...; 0, п М) = = 1 - S ехр цЛ (Z ДО] + + S ехр [— цЛ (Z Д01 ехр ]— ц (Л (/ — Z) Д/)] — .. • 1</</<Л Рассмотрим теперь производящую функцию (III. 28.5) tf(z) = S ехр [- рЛ (/ Д/)] г* / = 1 и заметим, что S ехр]—рЛ(/ДО] служит коэффициентом при zn в разложении функции (1—z)"’tf(z), *) h(t) есть в точности Р(/) Смолуховского [см. (III.22.17)]. Мы изменили обозначение, полагая, что буква Р, должно быть, устала от столь частого употребления.
188 Глава III а сумма 2 ехр [— М (Z А/)] ехр [— ц (Л (/ — I) А/)] 1<< <j<n есть коэффициент при zn в разложении функции (1-*)-*№(*) и т. д. Отсюда следует, что jg P„z" = (1 -z)-* z-(l -г)"1 H(z)+(1 -z)-’ № (z)—..., или (III. 28.6) (1 -z) 2 P„z" = - (1 -z)+-1+^ л=1 Переписывая (III. 28.6) в эквивалентном виде (Ш.28.7) V’—М + ^)> Ла 1 и полагая z = exp(— $Д/), мы видим, что 2 lp*_rZ*t.il г*+1 = еХр (— s Ai) J ехр (— st) dau (/)» *=1 о где *д<</ Предполагая, что g'(0) существует, мы имеем р1 = Р(0, 0|0, Д/) = 1—Р(0, 0|0, А0 = == 1 — ехр [— ц (1 — g (А/))] = 1 - ехр [—цЛ (Д<)] ~ ц/t' (0) Af=а Д£ (а = рЛ' (0))
Вероятность в задачах классической механики 189 и, следовательно, из (III. 28.7) СО 1 + sa-1 — lim f ехр (— st) dou (t) = bt-bOJ CO "1 — 1 a J exp (—st) exp (— цЛ (t)) dt 0 Отсюда вытекает, что предел lim Obt(t)=a(t) A/-»0 существует и что (III. 28.8) J exp (— st) do (t) = о = l+sa-1 — CO J exp(— s/)exp(— uh (t))dt о Функция o(/) может теперь быть истолкована просто как распределение интервала времени между «послед- ним> мгновением, когда еще наблюдается состояние нуль, и «первымэ мгновением, когда оио наблюдается вновь. Хотя невозможно, по-видимому, обратить преобразо- вание (III. 28.8) с тем, чтобы найти a(t) в явном виде, некоторые интересные выводы можно получить прямо отсюда. Во-первых, устремляя s к нулю и замечая, что J ехр (— цЛ (/)) dt = О, о мы получаем ill. 28.9) СО /л(/) = 1. о Это есть просто теорема Пуанкаре о возвращаемости.
190 Глава 1П Затем, допуская, что g(/)->0 при t -> оо [откуда Л (/)-*•! при /~>оо], и используя разложение (III. 28.10) Jехр (- st) ехр (— рЛ (t)) dt = о со =s-’ ехр (—р)+J ехр (— st) [ехр (— рЛ (t)) — о — ехр (— р)| dt = s~’ ехр (— р) +1 (s), мы получаем, дифференцируя формулу (III. 28.8) по s и устремляя s к нулю, (111.28.11) pda(0 = a-l(expp — 1). о Это формула Смолуховского для среднего времени воз- вращения в случае непрерывных наблюдений. Следующие моменты также могут быть вычислены, но вычисления становятся все более и более утомитель- ными. Интересный предельный случай может быть получен из (III. 28.8). Обозначая время возвращения через Т, мы имеем (III. 28.12) lim Р {Г > aa-1 (ехр р — 1)} = ехр (— и). |1->ОО Для доказательства этого равенства достаточно за- метить, что Р {Т > иа-> (ехрр — 1)} = 1 — а(иа~1 (ехрр — 1)), и показать, что ОО lira f ехр(— su)do(ua-' (ехрр — !)) = (! +s)-1 = ^“о 00 = J ехр(— su)exp(— a) du, О откуда уже следует (III. 28.12).
Вероятность в задачах классической механики 191 Интуитивный смысл выражения (111.28.12) совер- шенно очевиден. Чувствуется, что вероятность Р [Т > иа-1 (ехрр. — 1)} равна приблизительно (111. 28.13) Р (0,0|б, Диа-1 — 1);б, 2 Дид-1 (в11 — 1);.. .;б, и Дид-1 (ец— 1)) Р (0. 0|б, Дид-1 (^ — 1)) где лДи=и. Далее, для больших ц снова чувствуется, что наблюдения в моменты времени Л Диа-’ (ехрр — 1) почти независимы, так что предел (III. 28.12) должен приблизительно равняться [Р (0, 0|0, Диа-’(ехр И — 1))]я-1. что в пределе при Ди->-0, лДи = и обращается в ехр (—и). Хотя эти рассуждения с математической точки зре- ния кажутся грубыми, они удобны и наводят на мысль о весьма общей теореме: время возвращения, отнесенное к среднему времени возвращения, распределено экспо- ненциально в пределе, когда среднее время возвращения становится бесконечно большим. Это справедливо для эренфестовской модели. При этом экспоненциальный характер предельного распреде- ления объясняет уже замеченное нами явление, что для большого времени возвращения его относительная флуктуация равна приблизительно 1 (100%). Последнее замечание. Если рассматривать газ, на- столько разреженный, что столкновениями между моле- кулами можно пренебречь (газ Кнудсена), и если А — выпуклое множество, то мы приходим к реальному устой- чивому процессу Пл(0- Так как скорости в газе подчиняются максвеллов- скому распределению (111. 28.14) /п,,>(2лЛ7’)_‘'2ехр [- ту • v (2ЛГ)"1] = /(v),
192 Глава Hl то легко показать, что g (0 = | А Г1 J dr J dvi|>(r + vt)f (v), л где ф(г) — характеристическая функция множества А [см. (III. 22.1)]. Формула (III.28.8) в этом случае применима, и, та- ким образом, возможно в принципе найти распределение последовательных интервалов времени, в течение кото- рых в множестве А нет частиц газа!
г л * в * IV ИНТЕГРИРОВАНИЕ В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ И НЕКОТОРЫЕ ПРИЛОЖЕНИЯ 1. До сих пор в тех задачах, которыми мы занима- лись, ссылки на теорию меры были сравнительно три- виальны. Теперь мы переходим к рассмотрениям, опи- рающимся на значительно более сложные факты из тео- рии меры. Исходной точкой служит для нас результат, впервые полученный Эйнштейном и Смолуховским, о том, что ве- роятность попадания свободной броуновской частицы, находящейся в начальный момент в точке х=0, в проме- жуток между си и 01 в момент tt, в промежуток между а2 и р2 в момент /2, и т. д., между ап и 0П в момент /д. задается формулой ₽1 ₽л (IV. 1.1) /... /Р(0|Хр Л)Р(*11*2: *2-А) — “1 “л • • • Р (Хя-11 Хя! ^л <л-1) • • dxn, где (IV. 1.2) 0<Л</2< ... <tu и (IV. 1.3) Р (х| у; /) = (2л/)-1/1ехр [— у (у -х)2Г1]. На самом деле Р (хI у; t) = | (nDt)-'hехр [-1 (у - х)2D-’r1], где коэффициент диффузии D очень просто связан с вяз- костью и температурой среды, в которой происходит броуновское движение, и с радиусом частицы (частицы 13 м. кт
194 Глава IV считаются шариками). Формула для D содержит также число Авогадро, входящее в выражение для константы Больцмана k. Тем самым число Авогадро может быть определено из опытов с броуновскими частицами. Дей- ствительно, именно из-за этой возможности теория Эйн- штейна— Смолуховского и стала столь привлекательной для физиков. Однако с чисто математической точки зре- ния физический смысл D несуществен, и мы можем вы- брать такие единицы измерения, что 0 = 1. Теперь попытаемся вложить теорию броуновского движения в общую схему, описанную в п. 1 гл. I. В качестве выборочного пространства S мы возьмем сначала все вещественные функции х(/) (0</<оо), удовлетворяющие условию х(0) =0. Элементарными множествами мы объявим множества функций, определяемые условиями вида (IV. 1.4) {а, < х(/,) < ........ая < x(t„) < ₽я), 0</,</2< ••• <t„ (Винер называл такие множества «квазиинтерваламиэ). Мера, приписываемая таким множествам (мера Ви- нера) задается формулой Эйнштейна — Смолуховского (IV. 1.1). Легко теперь проверить, что заданная так мера эле- ментарных множеств удовлетворяет условию согласован- ности. Действительно, нетрудно видеть, что условие согла- сованности вытекает из соотношения (IV. 1.5) Р(х|у; /) = JР(х|г; t)P(z|y; t — x)dz, Q<x<t. -*00 Как только установлена согласованность, с помощью общей теоремы Колмогорова (упомянутой в п. 6 гл. III) можно построить вполне аддитивную меру в простран» стве всех вещественных функций *(/), (х|0)=0.
Интегрирование в функциональных пространствах 195 Построенная таким образом, эта мера почти беспо- лезна, поскольку многие интересные и нужные нам мно- жества оказываются неизмеримыми. Например, неизме- римым будет множество С всех непрерывных функций. В самом деле, можно показать, что (IV. 1.6) Ц*(С) = 1. ц.(С)=0, где ц* и ц* — соответственно внешняя и внутренняя меры. Дубом было показано, что если в определении эле- ментарных множеств (IV. 1.4) ограничиться непрерыв- ными функциями (т. е. считать, что квазиинтервалы со- стоят только из непрерывных функций), а их меру по- прежнему задавать с помощью формулы (IV. 1.1), то можно получить вполне аддитивную меру, причем (IV. 1.7) И(С) = 1. 2. Не вдаваясь в доказательство предыдущих утвер- ждений, постараемся объяснить, что из них следует. Исходя из элементарных множеств, которым заранее приписаны меры, мы построим новые множества при помощи объединений (конечных или счетных) элемен- тарных множеств и дополнений к уже построенным та- ким образом множествам. Этим способом получается запас множеств, который называется борелевским полем, порожденным заданны- ми элементарными множествами. Теперь по очевидным правилам (см. п. 1 гл. I) мы можем приписать меру всем множествам борелевского поля (эту операцию называют продолжением меры). Трудное место в теории Колмогорова — показать, что при таком продолжении сохраняется согласованность. Иными словами, надо показать, что два разных разло- жения любого множества В из борелевского поля иа элементарные множества приводит к одному и тому же значению меры В (в разложении может быть использо- вано счетное число операций суммирования и перехода к дополнению). Упомянутый выше результат Дуба можно сформули- ровать так: добавим к элементарным множествам 13*
196 Глава IV множество С непрерывных функций и припишем ему меру, равную 1. Снова построим борелевское поле мно- жеств и, как прежде, продолжим на него меру. Мы по- лучим таким образом новую меру на множестве всех вещественных функций x(t) (х(0) =0), полностью сосре- доточенную на пространстве С. Здесь трудно показать (причем эта трудность мень- шая, чем в доказательстве Колмогорова), что условие ц(С) = 1 согласовано с заданием меры на «квазиинтер- валах» (IV. 1.4). Мы можем теперь забыть о пространстве всех веще- ственных функций и рассматривать нашу меру, опреде- ленную только на пространстве непрерывных функций. Это мера Винера в пространстве непрерывных функций x(t), нормированных условием х(0)=0. Винер, который первым ввел эту меру в начале 20-х годов, сделал это гораздо менее абстрактным образом. Он построил явное отображение пространства С в ин- тервал (0,1) [точнее, в интервал (0,1) минус множество меры нуль], при котором квазиинтервалы (IV. 1.4) пере- шли в множества, обычная мера Лебега которых совпа- дала с мерой квазиинтервалов (IV. 1.1). Метод Винера, несмотря на большую привлекатель- ность (особенно для аналитика), обладает рядом недо- статков (которые мы укажем в дальнейшем) и в на- стоящее время вышел из моды. Тем не менее не следует забывать, что именно Вине- ру первому принадлежит эта идея, и поэтому его вклад в эти вопросы все еще непревзойден. 3. Поскольку согласованность мер, приписанных ква- зиинтервалам (IV. 1.4), следует из соотношения (IV. 1.6) (уравнения Чепмена — Колмогорова — для математиков, уравнения Смолуховского—для физиков, причем по- следнее исторически более справедливо), мы можем исследовать другие решения этого уравнения, с помощью которых можно построить меру в подходящем простран- стве функций. Не вникая в детали классификации решений этого уравнения, что само по себе составляет обширную тему, кратко упомянем лишь один интересный класс таких
Интегрирование в функциональных пространствах 197 решений, а именно (IV. 3.1) Р(х|у;/) = ОО = (2л)-1 f ехр [Гъ (у - х)] ехр [-1Ц |*1 0 < а < 2. — ОО Это так называемые «устойчивые плотности с показате- лем а». Случай а=2 соответствует броуновскому движению и кратко обсуждался в предыдущих пунктах. Случай а<2 интересен тем, что вместо (IV. 1.7) здесь оказывается, что (IV. 3.2) р*(С)=0, и, следовательно, невозможно построить меру в про- странстве С с помощью функции (IV. 3.1). Однако, как показал П. Леви (а позднее Дуб), мож- но с помощью (IV. 3.1) ввести меру в пространстве 35 функций, непрерывных слева (или справа) и имеющих разрывы лишь первого рода. Нам кажется, что в этом случае уже нелегко приме- нить метод Винера (т. е. построить явное отображение в множество, где мера вводится просто); в этом и за- ключается основной изъян метода Винера. 4. Как только построена вполне аддитивная мера в пространстве С, обычным образом определяется инте- грал (интеграл Винера), обладающий всеми основными свойствами интеграла Лебега ’). Мы будем пользоваться символом математического ожидания Е для интегралов и Р — для меры. Пусть V(x)—непрерывная функция, определенная иа интервале (—оо, оо), и, кроме того, V(x)>-0. *) Имеется группа математиков, считающих преступлением сна- чала вводить меру, а затем уже интеграл. Хотя эта точка зрения разделяется немногими и вряд ли заслуживает полемики, можно отметить, что в теории вероятностей, которая является одной из основных «потребительниц» теории меры и интегрирования, «старо- модный» порядок (сначала мера, затем интеграл) совершенно есте- ствен.
198 Гмва IV Рассмотрим теперь интеграл Винера (IV. 4.1) t ехр — J V(x(x))dx о Существует ли он? Поскольку подинтегральный функционал ограничен, достаточно показать, что он измерим. Так как t п (IV. 4.2) f V(х (т)) dx = lim М"1 У V(х (Л/zi"1)) о '"‘’°0 *=1 [напомним, что x(t)GC и что мы предположили непре- рывность У(х)!] и функционал tn~x 5 V(x(ktn~x)) к=1 очевидным образом измерим, то тем самым установлен t на измеримость функционала J V(х (г)) dx, а следова- о тельио, и измеримость ехр —J V(x(x))dx . о Из равенства (IV. 4.2) и теоремы о сходимости огра- ниченной последовательности функций следует, что. (IV. 4.3) Е ехр — J V (х (т)) dx о а = lim Е ехр —in~x V V(x(ktn~x)) , *=i причем здесь заодно утверждается и существование пре- дела в правой части.
Интегрирование в функциональных пространствах 199 С другой стороны, из (IV. 1.1) ясно видно, что (IV. 4.4) Е ехр *=1 ОО 00 = /... /ехр — 00 -со л -/r'^V(xt) х *=i х р(0|Хр /«-»)Р(х, |х2; tn-1)... Р (Хя-Их,; tn-^dxi... dxn. Отсюда мы получаем следующий вывод: предел Л -tn-1 £V(x*) х *=i (IV. 4.5) lim ( ... f ехр Л->00 —со —оо X р (0|Хр tn-1) Р (х( |х2; tn-1)... Р (х„-1|хя; tn~x)dXi... dxn существует и равен Е {ехр (IV. 4.6) t -f V{x{x))dx о Существование предела (IV. 4.5) следует здесь про- сто из измеримости некоторого функционала. Это про- стой, но важный пример тех аналитических возможно- стей, которые таятся в теории меры *). Можно попытаться определить интеграл (IV. 4.6) как предел интегралов (IV. 4.5); эту процедуру в действи- тельности применил Фейнман. Недостатки такого подхода с математической точки зрения очевидны, хотя он и имеет формальные основа- ния. ) Эти рассуждения напоминают знакомый прием из классиче- ского анализа, с помощью которого существование предела (Л \ 2 л-1—iogn) *=i / 1 выводится из существования интеграла / (< 1 — [< *1) dt (в смы- о еле Римана).
200 Глава IV Фейнман записал интеграл (IV. 4.5) в виде (хо=О) j ОО оо (2лМ-1)-^" J ... /ехр — ОО — оо я Л=1 я \* \ in'1 ) dxx... dxn, откуда очевидно, что в экспоненте стоит интегральная сумма для интеграла о Вместо (IV. 4.6) Фейнман пишет (IV. 4.7) /ехр о d (траектория). Это символическое обозначение физически более нагляд- но, поскольку есть функция Гамильтона частицы с массой 1, движу- щейся в потенциальном поле V(x). В действительности Фейнман в своем новом подходе к нерелятивистской квантовой механике пришел к инте- гралу (IV. 4.8) /ехр ИГ* /{4(£)’-У(л(т))рт d (траектория), где и (IV. 4.9) b = 2^- (А — постоянная Планка) о
Интегрирование в функциональных пространствах 201 является классическим действием вдоль траектории х(т). Из-за стоящего в экспоненте i(=V—1) фейнмановскую теорию нелегко сделать строгой. С другой стороны, с ин- тегралами Фейнмана вида (IV.4.7) удобнее обращаться, если переписать их в форме (IV. 4.6). 5. Мы покажем теперь, что вычисление интеграла Ви- нера (IV. 5.1) Е {ехр t — f V(x(x))dx о можно свести к решению дифференциального уравнения, тесно связанного с уравнением Шредингера. Ныне такое сведение можно произвести многими спо- собами, но мы выбираем далеко не самый изящный. Его основное достоинство в том, что он требует очень немно- го предварительных сведений. Мы наложим сначала дополнительное ограничение на У(х), а именно будем считать, что функция У(х) огра- ничена также и сверху: 0< V(x)<M. Теперь ехр t -J У(л(т))Л о _ V (-D* — k\ »=0 Г ' 1* J У(х(т))Л о и так как (IV. 5.2) 0 < J У(х (т)) dx < Mt, о мы получаем (IV. 5.3) Е ехр -f V(x(x))dx о
202 Глава IV Рассмотрим теперь моменты (IV. 5.4) У(х(т))«/т 1* и вычислим их для Л=1 и k=2, с тем чтобы увидеть, как они себя ведут. Для k=l мы имеем ’) Е f У(х(т))Л о t = р{1/(х(т)))Л= о =J f v® (2лт)-'Л ехр (-1 V/т) dx. О —оо Для k=2 вычисления несколько усложняются: Г 1 I2 Е J V(x(t)) dx о = 21Е t •«» f f V(x(t,)) V(x(xJ)dxxdx2 о 0 t *1 = 2! f f E{V(x(T1))V(x(T8)))dTldTJ= о 0 t t, oo oo = 21J J f f 0 0 —00 —GO x [2л (Tj — T1)]",/* exp [— у ft2—£i)2/(t2—Tj)] d^ d^ dxx dxa. *) Здесь мы обращаемся к теореме фубини.
Интегрирование в функциональных пространствах 203 Теперь совершенно ясно, как перейти к случаю общего k. Определим функции Qn(x,t) следующим образом: (IV. 5.5) Qo (л, t) = (Ы)-1'* ехр (-1 л2//), (IV.5.6) (?я+1(л. /) = / J°[W-t)-*X Хехр[—1(л-У2/(/-т)] V(l)Q„(l. TWsrfx. Заметим, что ОО (IV.5.7) Р*(/) = Л1 fQt(x, t)dx. —ОО Далее, так как мы предположили, что 0<V(x)<M, то по индукции можно показать, что 0<Q„(x, t). (IV. 5.8) Положим (IV. 5.9) <?(л, <)=S(-l)‘Q*(x, Q; >=0 в силу (IV. 5.8) этот ряд сходится для всех х и / ¥= 0. Ясно, что IQ (л, I) | < ехр (Mt) Qo (л, t), и в силу (IV. 5.5) и (IV. 5.6) Q удовлетворяет интеграль- ному уравнению t оо (IV. 5.10) Q (х, /) + (2л)-,а/ J(/-t)-,aX 0 —оо х ехр [-1 (л-у2/(/-т)] V ft) Q а, т) Л = Qo (л, t). Комбинируя формулы (IV.5.9), (IV.5.7) и (IV.5.3), получим (IV. 5.11) Е {ехр —fV(x(x))dr о = J Q (х, t) dx.
204 Глава IV Под математическим ожиданием Е ехр — J V(x (т)) dx ° J мы понимаем интеграл по всему пространству С. Если бы мы интегрировали по части пространства С, определенной условием мы пользовались бы очевидным обозначением Г t л Е ехр — J V (л (т)) di ; а•. [о С помощью небольших изменений в наших рассу- ждениях мы получим (IV. 5.12) ь Е ехр — J V (х (т)) di ; а < х (t) < b = J Q (х, t) dx, а t о откуда, в частности, следует, что (IV. 5.13) Q(x, /)>0. Мы можем теперь освободиться от условия V(x) < М. Действительно, положим „ . . /И*), если м I М, если и обозначим соответствующую Q<M>(x, /). В силу полной аддитивности меры Винера мы имеем t л — f ^Л(л(т))«/т ;a<x(i)<b = о J функцию Q через lim Е ехр = Е ехр — fV(x(i))di ; а о
Интегрирование в функциональных пространствах 205 и, как следует из (IV.5.12), при М->-оо функции Q(M>(x, <) образуют убывающую последовательность. Отсюда далее вытекает, что предел lira Qw(x, t) = Q(x, t) М-Ьео существует и что Q удовлетворяет основному интеграль- ному уравнению (IV. 5.10). Из интегрального уравнения (IV. 5.10) следует, что Q удовлетворяет дифференциальному уравнению (IV.5.14) KL=±*«_VWQ. а из (IV. 5.12) немедленно получаются начальные усло- вия для Q: (IV.5.15) Q(x, 0-*6(х), /->0, т. е. lim f Q(x, t) dx = 1. t+o J В действительности проще применить преобразова- ние Лапласа к уравнению (IV. 5.10) и получить (IV. 5.16) ф (л)+(2$)-'л f ехр (- (2s)4t | л - £ |) X X W ♦ ft) dl = (2s)-'1’ ехр (- (2s)'h | л |). где (IV. 5.17) ф (л) = J Q (л, t) ехр (— st) dt, s > 0. Теперь просто убедиться в том, что (IV. 5.18) уФ"-(*+У(х))Ф = 0
206 Глава IV и что 'ф(х) удовлетворяет следующим условиям: (а) ф->0, ±оо; (б) ф7 непрерывна всюду, кроме л = 0; (в) Ф'(-0)-Ф'(+0) = 2. В случае, когда функция V(x) имеет конечное число разрывов, во все лредыдущие рассуждения надо внести небольшие и очевидные изменения. 6. Поскольку Q(x,t) непрерывна по х [это вытекает из (IV. 5.10)], мы получаем из формулы (IV. 5.12) (IV. 6.1) г * Нт 4-Е ехр —[ V (х (т)) tfx; а<л(/)<а-]-е =Q(a, t). •-*0 е 0J Определим условное математическое ожидание Г t 1 Е ехр —J]/(x(r))dT x(t) — a о J как предел Е ехр lim------ -fv(x(r))dr ; О Поскольку мы получаем из (IV. 6.1) (IV. 6.2) (2л/)-‘Л ехр (- -J- а2//) X (Г ехр — J V(x(x))dx x(t) = a = Q(a, i). о J Допустим теперь, что (IV. 6.3) V (х) оо; х -> ± оо.
Интегрирование в функциональных пространствах 207 Хорошо известно, что при этом предположении соб- ственные значения задачи (IV. 6.4) y ф" — V (л) ф = — А.ф, ф £ L? (— оо, оо), образуют дискретный спектр им соответствуют нормированные собственные функции Ф1(*), Ф2(*). ••• • Известно также, что Q можно записать в следующем виде: (IV.6.5) Q(a, /)=Z ехр(— Х/)ф7 (а)ф7(0). / = 1 Комбинируя формулы (IV. 6.5) и (IV. 6.2), мы полу- чаем (IV. 6.6) (Ы)'* ехр [-1а2//] X Х£ ехр — f V(x(i))dr о л(/) = а = = 2 ехР М*/ ♦/ (°)’ и с помощью небольшого обобщения приходим к выра- жению (IV. 6.7) (2л/)-,Лехр [-|(а-у2//]х Xf ехр — f Vft-b л(т))Л x(t) = a — l = о = У ехр (- Kjt) фу (а) Ф7 (у. Итак, мы смогли выразить чисто классическую вели- чину □а ^ехр(— Х/)фу(а)фу(У
208 Г лава IV в терминах интеграла по пространству функций. Заме- чательно, что ряд важных свойств этой величины можно немедленно вывести из вероятностного представления (IV. 6.7.) В самом деле, полагая а=£, мы получаем (IV. 6.8) (2Ж)-% Е ехр - f + х (т)) dt о x(t)=0 = = 2 ехр (— Ijt) ф/ (0, и почти очевидно (доказать это очень легко), что (IV.6.9) limЕ ехр — [ У(£+х(т))Л х(/) = 0 I о J = 1. Таким образом, при /-*-0 2 ехр (-М М'*- и из классической тауберовой теоремы вытекает, что (IV. 6.10) 5 Ф/ (0 ~ 2‘Ал" V’, X -> оо. Этот в высшей степени нетривиальный аналитиче- ский результат получается здесь как следствие почти очевидного соотношения (IV. 6.9). Интегрируя равенство (IV. 6.8) по 5 и используя то обстоятельство, что все ф нормированы, мы получаем (IV. 6.11) £ ехр (-*/) = 1 = (2л/)_,/* f Е ехр -f У(£ + л(т))Л x(t) = 0 d£. •оо 0 Теперь Е ехр - J У(£Н-л(т))Л л(/) = 0 1.0 J
Интегрирование в функциональных пространствах 209 можно рассматривать как интеграл по пространству не прерывных траекторий, удовлетворяющих условиям л(0) = 0 и л(/) = 0. Для малых t естественно считать, что x(t) в проме- жутке приблизительно равно 0. Таким обра- зом, можно ожидать, что Е ехр -JV(Hx(T))dT x(t) = о J ~ Е {ехр [-1 | х (/) = 0} = ехр (-1 Vft)) и, точнее, что ехр У(1+х(т))Л х(/) = 0 ОО ~ /ехр[- —00 в предположении, конечно, что V(x) растет достаточно быстро, чтобы гарантировать существование интеграла в правой части для всех />0. Строгое обоснование асимптотики (IV. 6.12) было дано Реем; оно состоит в основном в доказательстве того, что функции х(т) в интервале (0, /) лишь с смалой» вероятностью принимают <болыпие» значения. Таким образом, при /->0 ОО (IV. 6.13) £exp(-ty)~(2*)‘v’ f exp(-iva)m = —СО =(2л)-* f Jexp[—1 —со -со н М. Кац
210 Глава IV Пусть N(X)= У 1 Ху <х m3 и В (Л) — площадь области -у- + V (£) < X. Тогда формула (IV.6.13) может быть переписана в виде f ехр (— It) dN (X) ~ (2л)"1 f ехр (— М) dB (X), t -> 0, о о и можно ожидать, что при подходящих тауберовых усло- виях мы получим (IV. 6.14) W (X) — (2л)"1 В (X), X -> оо. Это результат фундаментальной важности для кванто- вой механики; он привлекал к себе заметное внимание и в чисто математической литературе. Мы с предельной ясностью изложили интуитивное обоснование формулы (IV.6.14), и строгое рассмотрение (данное Реем) следует пути, подсказанному предыдущи- ми эвристическими рассуждениями. 7. В качестве непосредственного применения форму- лы (IV. 6.11) рассмотрим вычисление статистической (квантово-механической) суммы (IV.7.1) 2=2 ехр (-₽£„), где ₽ = (№ (Л — константа Больцмана, Т — абсолютная температу- ра) и Еп — энергетические уровни квантово-механиче- ской системы.
Интегрирование в функциональных пространствах 211 В простейшем (одномерном) случае частицы в потен- циальном поле V(x) энергетические уровни являются собственными значениями уравнения Шредингера (IV. 7.2) — у А2т-1 -gj-+ У(х)Ф= Полагая х = ф (л) = <р (л'), мы получаем -4-££+ИЛ/п-1/»л')ф = £ф. Это совпадает с формулой (IV.6.4), если в ней заменить У(х) на V(hm~'i*x). Таким образом, с помощью (IV. 6.11) получаем Z= У ехр (- ₽£я) = (2л₽)-,л X V (hm-'h (£+л (т))) dx х(₽) = 0 или после простой замены переменных (IV. 7.3) Z=mhh-1 (2л₽)-,/* X X JЕ ехр — J У’(£ + Л/п-'/*л(т))Л л(р) = 0 d£. —оо О Можно теперь разложить Z в ряд по степеням h, а именно Z Zq -|- Z\h —|- Z?№ . и т. д. Напишем 0 0 f VG + Am-MT))dT = ₽VG)+Am-V» И(У f х (т) dr+ о о 1 г -ЬуИ'(уЛ2/п-> /л2(т)^+... о 14*
212 Глава IV и, следовательно, Г р ехр — J V(t + /im~'hx(x))dx = о = ехр(— pV£)) l-A/n-W'G)Jx(T)dT+ о / г ₽ -12 +H |/n-4V"G)]2 fx(x)dx - \ [о ₽ \ —^m-JV"(^)fx^x)dx - .. о / Мы можем теперь вычислить Р | Е /х(т)Л|х(Р)=0}, о J Г / ₽ \2 Е11 J х (т) dx j | х (р) = О , I \о / ₽ Е J" х2 (т) dx\ х (р) = О . о Мы вычислим только второе среднее • ? ,2 Jх(т)Л| |х(р) = о , о / предоставив читателю вычислить два остальных Мы имеем [ / ₽ х 2 1 £< I Jx(x)dx I |х(р) = 0| = I \0 / J Е = 2£ X (ь) х (т2) dTj dx21 х(р) = 0 = = 2 f f Е[х (Ti) х (т2) | х ф) = OJ dxx dxit о о
Интегрирование в функциональных пространствах 213 и, таким образом, нам осталось вычислить только х(р) = 0}, 0<т1<т2<р. Согласно определению условного математического ожидания, Е РФ.)х(т2) | х(₽)=0) = lim £{х(У/(ТЛ~;а^а<,1 = .2 X (2л (т2 - т,)Г* ехр [-1 X х [2л (₽ — т2)]_,/’ ехр [— у dxi dx2 dx3: : (глр)"7* f ехр (—у у-) dx3 = Г /1 х? 1 (ж,-*,)* x^exp [ ^у Tj + 2 (tj — tl) ) (2л)-*/’[т1(т2 — т,)(₽— т2)] '/1tZx1tZx2 = = т,— Tj^-1 1 4 2 (3-t,) Е и, следовательно, • ₽ \2 Jх(т)Л1 |х(₽) = 0 о / = 2 f fъ(1—с2₽-,)Л1Л2 = ₽з/12. о о Подобным же образом мы найдем, что Е J"х(т)Л|х(р) = 0 =0, о Е /х2(т)Л|х(₽) = о| = ₽2/6. <* J
214 Глава IV Окончательно oo Z = A~,/n/,(2nfi)~v‘ f exp[-₽Va)]^ + + Л2/П-* -g- pVWexp[-₽VG)]^- —& f v*a)expi-₽wi4 - •• = A’W’ (2л₽)_,/‘ f exp [- ₽V^] ft - A^1 J [И(У]’ехр[-₽У(у]^-... . — OO J Это разложение впервые было получено Вигнером и Кирквудом. 8. В качестве последней иллюстрации применения ин- тегрирования в функциональных пространствах мы кратко рассмотрим некоторые вопросы классической тео- рии потенциала. До сих пор мы имели дело лишь с мерой в про- странстве С непрерывных функций x(t) (х(0) =0). Теперь нам понадобится мера в пространстве всех непрерывных трехмерных кривых г(т) (г(0)=0). Поскольку г(т) задается просто тройкой непрерыв- ных функций (х(т), у(т), z(t)), естественно в качестве меры выбрать произведение мер в СхСхС. Этот способ задания меры зависит от выбора системы декартовых координат в трехмерном пространстве, но в силу свойств нормального распределения наши выводы от этого выбора не зависят. Мера строится так, что для любого набора моментов времени 0<t\<h<.. .<tn и борелевских множеств fli, Qs. • • ., йп в трехмерном евклидовом пространстве
Интегрирование в функциональных пространствах 215 R3 имеем (IV. 8.1) Р{г(Л)621, г(/2)€22. .... г(/я)£2я} = = J J... JP(O|ri; Л)Х е1 “» °я ••• Р(?п-1 |гл; ••• ^я» где (IV. 8.2) Р(г|р; О = (2л/Г’'’ехр(-1г1||р-г|р). Здесь ||р — г|| обозначает евклидово расстояние ме- жду г и р, dr — элемент объема. Должно быть ясно, что мы имеем здесь дело просто с теорией броуновского движения (теорией Эйнштейна — Смолуховского) в трехмерном евклидовом пространстве. Пусть Q — ограниченная замкнутая область в R3 и У(г) — ее характеристическая функция, т. е. 1, г£2, (IV. 8.3) V(r)-|0 г(а Рассмотрим функционал СО (IV. 8.4) г2 (у) « f У(у + г (Т)) Л; о он представляет полное время, которое броуновская траектория у+г(т), начинающаяся в у, проводит внутри области й. Мы имеем Е (Гв(у))=£ f У(у+г(т))Л О оо со = p{V(y + r(T)))dT = Jp{(y + r(T))G2)4fr = О о со = f f (2зп)-"гехр (—у т"11|г — у||2) drdt = О 8 = (2л)”1 /||Г — yir’dr < оо, 8
216 Глава IV и, следовательно, значение Та (у) конечно для почти всех траекторий г(т). Легко вычислить все высшие моменты для Та (у). По- лучим (IV. 8.5) £{Т$(у)} = = Л!(2л)"*/ ... Jki— уГка-ПГ1... а о • ••к*—... ж*. Формула (IV. 8.5) наводит на мысль рассмотреть ин- тегральное уравнение (IV. 8.6) (2л)-1/ <р (р)||р - г|| dp = ф (г), г е Q Его ядро (2я)~’||р —г|Г’ вполне непрерывно и положительно определено. Если обозначить через К1, Х>2> • • • его собственные значения и через <h(p). <Ра(₽)» ••• — соответствующие нормированные собственные функ- ции, мы получим =2л‘"7<₽/(₽)</₽(2я)'7 »р-yr1 <₽/(₽)<*₽. *>i. /«1 о a Рассмотрим выражение (и > 0) (IV. 8.7) Л(у; «)=£|ехр|-«Та(у)]).
Интегрирование в функциональных пространствах 217 Легко подсчитать, что (IV. 8.8) Л (у; и) = у=1 а X / Ир —УГ’<₽/(₽)</₽. Q Если у£й, то формула (IV. 8.8) может быть перепи- сана в более простом виде (IV. 8.9) Л(у; «) = = 1 - £ («-1 + Ъ)"1 / Фу (?) </рфу (у), у е Q- /-1 Q Если у находится внутри области й, то Та (у) >0 для любой траектории г(т) и, следовательно, lim Л (у; «) = lim Е [ехр(— «Га(у))} =0. а^оо афсо Таким образом, СО (IV. 8.10) lim 2 (6 + X,)-1 f фу (р) dp ф (у) = 1 для каждого у из области й. Этот аналитический резуль- тат, выражающий то обстоятельство, что разложение единицы в ряд Фурье по собственным функциям ф^ сум- мируется к 1 некоторым методом суммирования, выте- кает здесь из того тривиального замечания, что Та (у) >0. Более тонкое рассуждение показывает, что если об- ласть й удовлетворяет некоторым условиям регулярно- сти (например, если она является локально звездной), то для у (£ й lim (1—Л(у; «)) = lim (1 — £{ехр[— «Га (у)]) ) = и Ф со и 4 со = Р{7'(у)>О) = £/(у),
218 Глава IV где U(у) —объемный потенциал области й, т. е. гармо- ническая функция, обращающаяся в нуль на бесконеч- ности и стремящаяся к 1 при приближении у к регуляр- ным (в смысле теории потенциала) точкам границы. Кроме того, формула (IV. 8.10) остается верной для каждой регулярной точки границы, в то время как для нерегулярных точек этот предел, если он существует, меньше 1. Мы приходим, таким образом, к явной формуле (IV. 8.11) Щу) = ОО J Ф/ (р) J IIf—уН-1 <₽/(p)<*p для объемного потенциала области, удовлетворяющей некоторым слабым условиям регулярности. Хотя формула (IV. 8.11) чисто «классическая», впер- вые она была установлена и доказана вероятностными методами; тем самым еще раз подтвердились их сила и полезность.
ПРИМЕЧАНИЯ И БИБЛИОГРАФИЯ Глава / 1. Идея о том, что теория вероятностей может быть формали- зована на основе теории меры, появилась впервые в классической статье Э. Бореля [Borel Е., Sur les probabilites dinombrables et leurs applications aritmitiques. Rend. Circ. Mat. Palermo, 47 (1909), 247—271]. Борелем же был открыт сусиленный закон» больших чи- сел (см. п. 5). Впервые значительная часть аксиоматики теории ве- роятностей была дана Г. Штейнгаузом в его статье: Stein- h a u s Н., Les probability denombrables et leur rapport й la thtorie de la mesure, Fund. Math., 4 (1922), 286—310. Наиболее полная аксиоматика принадлежит А. Н. Колмогорову, и ее можно найти в его книге <Основные понятия теории вероятностей» (М. — Л., 1936). Мало кому известно, что аксиоматика теории вероятностей входила в знаменитый список проблем Гильберта. 2. Вывод, приведенный в этом пункте, принадлежит Максвеллу, но часто приписывается Борелю. Доказательство <слабого закона» больших чисел получится, если показать, что 1 Г АГ -1» f 4-У (»;*)—р {«<»/,<?} S3NW de стремится к нулю при JV-юо (напомним, что R зависит от М). 3. Изложение этого пункта следует моим статьям <On the ave- rage number of real roots of a random algebraic equation», которые появились в журналах Bull. Amer. Math. Soc., 49 (1943), 314—320 (и 938) и Proc. London Math. Soc., 50 (1948), 390—408. Статья Эр- дёша и Оффорда появилась в журнале Proc. London Math. Soc., 6 (1956), 139—160. Вопрос о нулях случайных функций предста- вляет значительный интерес и особенно важен в теории случайных шумов н связанных с ними явлений. Наиболее важный вклад здесь
220 Примечания и библиография принадлежит Райсу [Rice S. О., Mathematical theory of random noise, Bell System Tech. J., 2B (1944). 282—332; 25 (1945), 46—156]. 4. Изящная формула (1.4.13) была открыта Реньн [R ё п у i А., On the density of certain sequences of integers. Acad. Serbe. Bull. Acad. Set. Mat. Nat., 8 (1955), 157—162]. Приведенное здесь дока- зательство близко следует моей заметке «А remark on the preceding paper by A. Rdnyi» (ibid., 163—165). Если мы обозначим через Af(f(n)} предел (в предположении, что он существует) 2 7 (л) я = 1 то наиболее трудное место в нашем доказательстве — это уравнение М | ехр ₽* («)] } = м { Д ех₽ <«))} = = п м {ехр («мь Оно получается с помощью элементарных вычислений из формулы (1.4.6) и является простым повторением обычных рассуждений, ис- пользуемых при доказательстве того, что математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий. в. Смотри Szekers G., Turan Р., Ober ein Extremalproblem in der Determinantentheorie (венгерск., резюме нем.). Mat. termeszett Ertes., 56 (1937), 796—804. Глава 11 1. Задаче о случайном блуждании из этого пункта для частного случая р(а) — (2л)'* (0<а<2л) уделено значительное внимание в математической литературе. Это особенно простой случай, по- скольку здесь последовательные смещения незавненмы. Рассмотре- ние этого случая можно найтн в работах: Чандрасекар С., Стохастические процессы в физике и астрономии, ИЛ, М., 1947; Rice S. О., Distribution of a sum of п sine waves. Bell Tel. System Tech. Publ., Monograph 2365. Теорему Поля Леви (называемую тео-
Примечания и библиография 221 ремой о непрерывности преобразования Фурье — Стнльтьеса) можно найти в любом стандартном учебнике; см., например, Л о э в М., Теория вероятностей, ИЛ., М., 1962. Теорема о моментах была впервые доказана Чебышевым. Она была существенно обобщена Марковым (см., например, его книгу «Исчисление вероятностей», С.-Пб., 1908), которая, по моему мнению, до сих пор является одной нз лучших н наиболее ярких книг по теории вероятностей). Условие (II. 1.5) было найдено Карлеманом. 2. Насколько мне известно, в доказательстве предельных теорем теория возмущений используется впервые. Вычисления, использую- щие теорию возмущений, не всегда легко строго обосновать, но для наших целей вполне достаточно сослаться на работу: R е 11 i с h, St6rungstheorie der Spektralzerlegung, I, II, Math. Ann., 113 (1937), 600—619; 677—685 (то же самое относится к п. 3). 3. Хотя модель полимерной цепи, которая рассматривается в этом пункте, принадлежит Айрннгу, соответствующая задача о слу- чайном блуждании была исследована Смолуховским в одной из его ранних статей по броуновскому движению. Вычисления в этом пункте в основном принадлежат Смолуховскому. 4. Первое доказательство основного результата этого пункта было дано Мораном [М о г а п, The statistical distribution of the length of a rubber molecule, Proc. Cambridge Phil. Soc., 44 (1948), 342—344], который воспользовался одной общей теоремой С. Н. Бернштейна. Наше доказательство (опирающееся на теорию возмущений) намного более аналитическое, но зато н более прямое. 5. Теоремы этого пункта принадлежат В. Феллеру [Feller W., Fluctuation theory of recurrent events, Trans. Amer. Math. Soc., 87 (1949), 98—119], но мы следуем изложению Дарлинга и Каца [Darling D. А., К а с М., On occupation times for Markov proces- ses, Trans. Amer. Math. Soc., 84 (1957), 444—458]. 8. Математическая формулировка принципа неопределенности принадлежит Г. Вейлю. 7, 8. Изложение в этих пунктах следует моей статье «Toeplitz matrices, translation kernels and a related theorem in probability theory» [Duke Math. J., 21 (1954), 501-509].
222 Примечания и библиография Результат Сегё был опубликован в работе1) «On certain hermi- tian forms associated with the Fourier series of a positive function (Festskrift Marcel Riesz, Lund, 1952, 228— 238). Задача нахождения предела (II. 7.6) возникла у Онзагера в связи с его работой по двумерной модели Изинга. Работа Спитцера содержится в основном в его статье: Spitzer, A combinatorial lemma and its application to probability theory, Trans. Amer. Math. Soc., 82 (1956), 323—339. Идея использовать чисто комбинаторные методы при исследовании некоторых вероятностных задач появилась впервые у Андерсена, чья работа (цитируемая в упомянутой выше статье Спитцера) ока- зала сильное влияние на Спитцера. 9. Теорема этого пункта была впервые доказана Эрдёшем и Кацем. Обзор недавних работ по применению вероятностных мето- дов в теории чисел можно найти в статье: Кубилюс И. П., Ве- роятностные методы в теории чисел, УМН, 11; 2 (68) (1956), 31—66. Глава III 1, 2. Больцман изложил бблыпую часть (но не все) своих ра- бот в двухтомном трактате «Vorlesungen fiber Gastheorie». Это одна нз величайших книг в истории точных наук, и мы очень советуем читателю ознакомиться с ней. Полученное удовлетворение оправ- дывает затраченные усилия. 3. Полемика между Больцманом и Цермело изложена в клас- сической статье П. и Т. Эренфестов (Епс. Math. Wiss., 1911). Этот знаменитый обзор содержит наиболее глубокий анализ идей, лежа- щих в основании статистической механики; всякий, кто намерен серьезно изучить предмет, должен прочитать эту статью. 4, 5. Доказательство теоремы Пуанкаре, а также вычисление среднего времени возвращения следует моей заметке <Оп the notion of recurrence in discrete stochastic processes» (Bull. Amer. Math. Soc., 53 (1947), 1002—1010). Впервые доказательство формулы *) Результат Сегё содержится в книге: Гренадер У. и Сегё Г., Тёплицевы формы и их приложения, ИЛ, М., 1961.— Прим, перев.
Примечания и библиография 223 (11.5.1) было дано Бнркгофом [Birkhoff G. D., Proof of a recur- rence theorem for strongly transitive systems, Proc. Nat. Acad. Set. USA. 17 (1931), 650—655]. Но последовавшее за этим доказатель- ство эргодической теоремы, данное Бнркгофом, настолько затмило эту заметку, что ее потеряли из виду. Работа Смолуховского о сред- нем времени возвращения кратко изложена в его прекрасных лек- циях «Drei Vortrage uber Diffusion, Brownsche Molekularbewegung und Koagulation von Kolloidteilchen» (Phys. Z„ 17 (1916), 557—571, 587-599). 6. Теорема Колмогорова доказана в его книге, упомянутой выше. 7. Первоначальное описание этой модели см. в работе: Е h г е п- fest Р., Ehrenfest Т., Ober zwei bekannte Einwande gegen das Boltzmannsche Я-Theorem, Phys. Z., 8 (1907), 311—314. График взят из второго тома учебника К- Шефера «Теоретиче- ская физика». 8. Изложение в этом пункте следует мимеографическнм записям Хнггннсовских лекций, прочитанных Г. Е. Уленбеком в Принстон- ском университете осенью 1954 г. 9. Читатель, возможно, заметил, что мы не рассматривали подробно эргодическую теорему. Роль этой теоремы в статистиче- ской механике была чрезвычайно преувеличена, н мы старались как-нибудь это уменьшить. Блестящее изложение эргодической теории см. в книге: Хал- мош П. Р-, Лекции по эргодической теории, ИЛ, М., 1959. Крат- кое изложение идей Гиббса следует Хнггиисовским лекциям Улен- бека, упомянутым выше. 10. Вывод этого пункта следует моей статье «Random walk and the theory of Brownian motion» (Amer. Math. Monthly, 54 (1947), 369-391). Любопытно отметить, что если бы мы попытались, используя тот же самый метод, искать сначала правый собственный вектор, то мы натолкнулись бы на трудности.
224 Примечания и библиография II. Siegert A. J. F., On the approach to statistical equilibrium, Phys. Rev. 76 (1949), 1708—1714. Hess F. G., Alternative solution to the Ehrenfest problem,Amer. Math. Monthly, 61 (1954), 323—327. 12. Формулы для (nA ($)) н (n^(s)) можно найти, например, в статье: Wang М. С., Uhlenbeck G. Е., On the theory of Brownian motion, If, Rev. Modern Phys., 17 (1945), 323—342. 13. См. цитировавшуюся выше статью «Random walk and the theory of Brownian motion» н обсуждение энтропии в работе: Klein М. J., Entropy and the Ehrenfest urn model, Physica, 22 (1956), 569-575. 14. В этом пункте почти дословно воспроизводится моя за- метка «Some remarks on the use of probability in classical statistical mechanics» (Acad. Roy. Belgique. Bull. Cl. Sci., 42 (1956), 356—361). 16. 17, 18. Эти пункты почти дословно повторяют часть моей статьи «Foundations of kinetic theory» (Proc. Third Berkeley Symp. on Math. Stat and Prob., v. 3, 171—197). 19. Cm. Brout R., Statistical mechanics of irreversible proces- ses, Part VII: Boltzmann equation, Physica. 22 (1956), 509—524. В обзорной статье, написанной для нового справочника «Hand- buch der Physik», Г. Град дает подробную критику работ Броута и М. С. Грина. 21. Краткое изложение работы Смолуховского можно найти в его работе «Drei VortrSge...», цитированной выше (п. 5 этой главы). Обзор более поздних работ см. в статье Чандрасекара, цитиро- ванной в п. 1 гл. II. 22, 23. Содержание этих, а также части последующих пунктов относится к лету 1946 г., когда автор работал в Мичиганском уни- верситете. Эти результаты были получены в сотрудничестве с Улеибеком, который впервые привлек внимание автора к этому комплексу за-
Примечания и библиография 225 дач. Хотя эти результаты не были ранее опубликованы, онн соста- вили основную часть доклада, сделанного автором в Орегонском университете в нюне 1952 г. В недавней статье Линдлея [Lindley D. V., The estimation of velocity destributions from counts. Proc. Int. Congress, Amsterdam, 1954, 427—444] содержится вывод формулы (III. 23.2), использую- щий другой метод, и приводится интересное обсуждение работы Ротшильда по определению средней скорости сперматозоида. Из-за недостатка времени материал, изложенный в п. 21—28, не был представлен на семинаре в Боулдере. 24. Формулы (III. 24.4) н (III. 24.5) были первоначально вы- ведены Смолуховским сложным путем. Простой и изящный вывод был дан Чандрасекаром в его обзорной статье, цитированной выше. 26. Ссылка на работу Р. Фюрта содержится в обзорной статье Чандрасекара. 27. Формулировка н применение принципа «включения н исклю- чения» имеется, например, в превосходном учебнике: Феллер В., Введение в теорию вероятностей н ее приложения, М., 1964. Глава IV 1, 2. Подход Вннера можно найтн в главе о случайных функ- циях из книги: П э л н Р., Винер Н., Преобразования Фурье в комплексной области, М., 1964. Метод Дуба можно найти в его книге «Вероятностные процессы» (ИЛ, М., 1956). Стоит ли столько «возиться» с теорией меры в применении к теории вероятностей — вопрос вкуса. Я лично предпочитаю огра- ничить «волнения» по этому поводу до минимума, потому что я твердо уверен, что теория вероятностей теснее связана с анализом, физикой и статистикой, чем с теорией меры как таковой. 3. См. L6vy Р., Sur les integrates dont les elements sont des variables aleatoires independantes, Ann. Pisa, 3 (1934), 337—366. 4, 5, в. Этн пункты следуют моей статье «On some connections between probability theory and differential and integral eouations» (Proceedings of the Second Berkeley Symposium on Mathematical Statistics and Probability, pp. 189—215). См. также: Ray D., On 15 M. Кац
226 Примечания и библиография spectra of second order differential operators, Trans. Amer. Math. Soc., TT (1954), 299-321. 7. Это применение было впервые указано Зигертом в его об- зоре «Brownian motion theory as a tool in statistical mechanics» (Phys. Rev., 86 (1952), 621). Мы приводим последующий (независи- мый) вывод А. М. Яглома, содержащийся в прекрасной обзорной статье: Гельфанд И. М. и Я г л о м А М., Интегрирование в функциональных пространствах н его применение в квантовой фи* знке, У МН, 11; 1 (67) (1956), 77-114.
ПРИЛОЖЕНИЕ| УРАВНЕНИЕ БОЛЬЦМАНА Г. Е. У Л ЕН БЕК Часть I 1. Введение. Общая тема двух этих лекций — мате- матическая структура теорий, описывающих так назы- ваемые необратимые процессы типа теплопроводности (выравнивание разностей температур), вязкости (вы- равнивание разности скоростей) и т. п. Мы знаем, что практически все процессы в природе имеют опреде- ленную тенденцию приближаться к состоянию равнове- сия (или состоянию с максимальной энтропией); таким образом, возникает задача описать это приближение с молекулярной точки зрения; при этом предполагается, что структура молекул и законы их взаимодействия нам известны. Поскольку все эти вопросы со времени основопола- гающих работ Больцмана, Максвелла, Чепмена, Энскога и других только недавно стали вновь активно разраба- тываться, можно различить пока только общие очерта- ния математической картины; конкретных же резуль- татов получено очень мало. По этой причине, а также из-за недостатка времени я постараюсь изложить лишь общие идеи и поставить математические задачи. Я ду- маю, что они представляют математический интерес, так как они являются своего рода обобщением эргоди- ческой теории и, несомненно, очень быстро приводят к настоящей terra incognita. 2. Общая задача. Мы будем рассматривать только молекулярную систему простейшего типа: N точечных молекул в сосуде (объема V), между которыми действу- ют парные силы отталкивания, задаваемые для каждой пары (i, /) центрально-симметричным монотонным по- тенциалом <р(го), имеющим конечный радиус действия г0 и таким, что <р(0) -* + оо, <р(го)=О. Мы будем пользо- 15*
228 Приложение I ваться классической механикой. В квантовой механике появляются некоторые дополнительные особенности и, возможно, даже упрощения, но основные задачи, как мне кажется, по существу те же самые. Движение всей системы молекул можно представить движением одной точки, Г-точки, в GV-мерном фазовом пространстве (Г-пространстве) по поверхности постоян- ной энергии E(Xi, ..., xN) = const [обозначения: х^= = (ЧьР<) —координата и импульс i-й частицы]. Известно благодаря Пуанкаре, что это движение квазипериодич- но: точка, начав двигаться из любой конечной области на поверхности постоянной энергии, возвращается в эту область по истечении цикла Пуанкаре. Эта возвращае- мость во времени является по существу следствием об- ратимости во времени механических уравнений движе- ния. Исторически она привела к известному спору между Больцманом и Цермело1), а также к ошибочному вы- воду, что тем самым невозможно объяснить необрати- мые процессы с помощью обратимых механических мо- делей. Причина, по которой теорема Пуанкаре не имеет отношения к теории необратимых процессов, двоякого рода: (а) Поскольку N очень велико, время возвращения для некоторой фиксированной «малой» начальной обла- сти становится огромным, гораздо больше, чем наблю- даемое время выравнивания или релаксации. Тот факт, что для конечной механической модели существует вре- мя возвращения То, лишен, таким образом, интереса, так как мы хотим следить за системой только в продолже- ние времени t<g.T0. (б) Начальное состояние никогда не бывает полно- стью определено, так как любое макроскопическое изме- рение дает информацию лишь о средних величинах по большой совокупности молекул. Поэтому мы должны рассматривать не одну механическую систему, а, по тер- минологии Гиббса, ансамбль идентичных систем, отли- чающихся только начальной фазой, и следить за тече- *) См. Ehrenfest Р., Ehrenfest Т., Grundlagen der Stati- stischen Mechanik, Enz. der Math. V'iss., IV, 32. Это обсуждается также в книге: Haar D. ter, Introduction to Statistical Mechanics.
Уравнение Больцмана 229 нием всего этого ансамбля во времени. Иными словами, следует ввести в Г-пространстве распределение вероят- ностей Dn(хь .... xN, t) и следить за его изменением во времени. Известно, что изменение Djv(xb ..., xN) во времени определяется теоремой Лиувилля ^=(М D„|, (1) где Н—функция Гамильтона, равная в нашем случае п / 2 \ 2<р(г") <2> 1=1 к/ —потенциал внешних сил, включающий «потен- циал стенок», т. е. потенциал, создаваемый стенками со- суда; ги = 1ч< — qj — расстояние между i-й и j-й молеку- лами]; фигурные скобки означают скобки Пуассона < lj г)1 (дН дВ дН дВ \ /о\ I//. гй"ЭчГЬ (3) 1 = 1 Теорема Лиувилля является непосредственным след- ствием уравнений движения и позволяет в принципе найти DN(t), если задано начальное распределение Dn(Xi, ... , xN, 0). Все наблюдаемые макроскопические величины системы могут быть выражены как соответ- ствующие средние значения по распределению DN. Мож- но ожидать в соответствии с эргодической теорией, что любое начальное распределение будет с течением вре- мени приближаться к равновесному распределению, ко- торое в нашем случае является равномерным распреде- лением между соседними поверхностями постоянной энергии Е и Е+&Е1) (так называемое микроканониче- ское распределение). Именно это приближение интерес- но для теории необратимых процессов; оно не противо- речит (но и имеет мало общего) квазипериодичности движения каждой точки ансамбля. *) Это приближение здесь понимается в смысле крупнозерни- стой плотности; см. Ehrenfest Р., Ehrenfest Т., цит. раб. Только в этом смысле можно придать точное значение рассуждениям из гл. 12 книги Гнббса. См. также Tolman, Statistical Mechanics, где проводятся аналогичные рассмотрения в квантовой механике.
230 Приложение I Общая задача — найти подходящие -законы прибли- жения к равновесию. Я говорю «подходящие», потому что не следует стремиться проследить изменение DN во всех деталях. Это потребовало бы нахождения точного решения уравнений движения, что, очевидно, является непосильной и неинтересной задачей, поскольку необхо- димо проследить за изменением во времени лишь неко- торых средних (или макроскопических величин). Спрашивается, как нужно выбрать начальное распре- деление Dn(0), чтобы оно было согласовано с нашими первоначальными макроскопическими сведениями о си- стеме. Рассматриваемая теория не дает общего рецепта для такого выбора, и я долгое время думал, что это яв- ляется существенным пробелом данной теории. Теперь уже я больше так не думаю по причинам, к которым я вернусь во второй части. 3. Сравнение с теорией случайных процессов. Сочета- ние квазипериодического движения индивидуальных то- чек ансамбля с монотонным приближением начального распределения вероятностей к равновесному распределе- нию является характерной чертой теории стационарных марковских процессов ')• Допустим сначала, что все переменные принимают дискретные значения; пусть X — случайная величина (или совокупность случайных величин), которая может принимать дискретное множество значений пусть на- блюдения делаются в дискретные моменты времени /S=sx. Обозначим через P(Xj|Xf,$) условную вероят- ность того, что Х=Х{ в момент времени st, при условии, что в нулевой момент времени л=Х,; для марковского процесса эти вероятности удовлетворяют так называе- мому уравнению Смолуховского Р(^, s) = 2P(Xt, s-1)P(X*|Xz, 1). (4) Л в которое, однако, не входит начальное распределение значений 'Х}. Назовем P(Xft|Xi, l)=Q(Xft, Xf) вероятно- ) См. Феллер В., Введение в теорию вероятностей и ее при- ложения, М., 1964; Wang М. С., Uhlenbeck G. Е., The theory of Brownian motion II. Rev. Mod. Phys., 17 (1945), 323; Kac M., Amer. Math. Monthly. 54 (1947), 369.
Уравнение Больцмана 231 стями перехода; тогда, поскольку £<?(**. Х/) = 1. i мы можем переписать уравнение (4) в виде Р(Х„ s)-P(Xo S-1)=2T|P№. s- *<)- k -P(X,, s-nQ(Xo JQ], (5) где штрих означает, что при суммировании надо опустить член k=i. Уравнение (5) имеет простую интерпретацию: приращение Р равно «прибыли» (за счет переходов минус «потери» (за счет переходов ->%*). Если все переменные непрерывны, то уравнение (5) превращается в уравнение </У[Р(Г, t)Q(Yt X) -Р(Х t)Q(X, У)]. (6) Известно, что при довольно общих предположениях относительно Q из уравнений (4) или (5) следует, что Р (%,-,$) монотонно приближается при s—>-оо к «равно- весному» распределению W(Xi), хотя каждая серия на- блюдений Xi, Хг,... обнаруживает квазипериодическое поведение и не выделяет поэтому «направления вре- мени». По-видимому, то же самое верно и для непрерыв- ного случая, описываемого уравнением (6). Аналогия между движением газа и некоторым слу- чайным процессом становится правдоподобной, если по- пытаться проследить за движением Г-точки по поверх- ности постоянной энергии в Г-пространстве. Очевидно, что эта поверхность имеет форму некоторого гиперци- линдра; если пренебречь на время межмолекулярными силами, то поверхность Е=const будет сферической в на- правлениях импульсов и цилиндрической в координатных направлениях при условии, что все координаты меняются в объеме V. Если газ разрежен (го С V), то межмолеку- лярные силы образуют в этом цилиндре редко располо- женные узкие и глубокие расселины. Движение Г-точки до столкновения происходит по прямой; после столкнове- ния она очень быстро перескакивает в другое место, дви- жется по прямой, снова перескакивает и т. д. Движение,
232 Приложение I таким образом, напоминает случайное блуждание по ги- перцилиндру; поэтому можно ожидать, что распределе- ние Dn(X, t), где X = (Х|, хг, .... x.v), изменяется подоб- но тому, как это происходит в марковских процессах, поскольку случайное блуждание является, так сказать, классическим примером марковского процесса. Исходя из представления о случайном блуждании, М. Кац ') вместо уравнения Лиувилля предложил другое уравнение, описывающее изменение DN(X, t) во времени и похожее на уравнение (6). Кац сделал два упрощаю- щих предположения: (1) Dn зависит только от импульсов частиц, так что X=(ph P2, .... P.v); это предположение делает движе- ние Г-точки очень похожим на случайное блуждание по гиперсфере. (2) Газ очень разрежен, так что нужно рассматри- вать только парные столкновения. Вероятности перехода для случайных шагов могут быть определены, если мы умеем решать динамическую задачу о столкновении двух частиц. Я не сомневаюсь, что при этих предположениях урав- нение Каца (называемое в настоящее время основным уравнением) удовлетворительным образом описывает приближение к микроканоническому распределению. Точное рассмотрение приводит к ряду интересных ма- тематических задач, особенно когда хотят узнать поведе- ние системы при очень больших N. С физической же точ- ки зрения эти упрощающие предположения являются, к сожалению, довольно ограничительными, и неясно, как можно было бы от них освободиться. Остается нерешенной главная проблема — в каком смысле основное уравнение служит приближением к уравнению Лиувилля. Броут* 2) сделал отважную попыт- ку выяснить это, но удовлетворительного ответа, я ду- маю, пока еще нет. 4. Уравнения Б-Б-Г-К-И и общие законы сохранения. Другая линия развития исходит из представления, что в *) К а с М., Proceedings of the Third Berkeley Conference on Mathematical Statistics and Probability, v. Ill, 1966, 171 — 197. 2) В rout R., Physica, 22 (1956), 509.
Уравнение Больцмана 233 большинстве случаев интересующие нас макроскопиче- ские величины зависят не от всей функции распределения DN(xit ... , xN, t) в Г-пространстве, а от вероятности того, что в некотором элементе rfpdq фазового простран- ства находится одна частица, независимо от положения других частиц. Я называю это распределение распреде- лением в ц-пространстве. Ясно, что оно получается ин- тегрированием DN по всем переменным х,-, кроме одной. Заметим, что, поскольку все частицы одинаковы, плот- ность Dn должна быть симметрической функцией от Xi, .... xN\ таким образом, не имеет значения, какую из пе- ременных х« считать фиксированной. Требование симме- тричности Dn не противоречит уравнению Лиувилля, поскольку гамильтониан Н также симметричен. Интегрируя уравнение Лиувилля, мы получаем це- почку уравнений, которые независимо и почти одновре- менно были выведены Боголюбовым, Борном, Грином, Кирквудом и Ивоном *) и которые я поэтому буду назы- вать уравнениями Б-Б-Г-К-И. Введем частичные функции распределения V Fs (Хр .... xs, t) = J* • • • J* Dn dxs+l ... dxN. (7) Интегрируя уравнение Лиувилля дим, что при фиксированном $ V->oo(V/V=t> фиксировано) по xs+i, ..., xN, нахо- в пределе при АЛ->оо, (8) где Н, — функция Гамильтона для группы из s частиц: 5 / 2 \ 2 w <9> !</<;<! U(Qi) — потенциал внешних сил без потенциала стенок и <Р// = <Р(|Ч/ — Ч;|)- *) Боголюбов Н. Н., Проблемы динамической теории в статистической физике, Л., 1946. Статьи М. Борна н Грина собраны в книге Kinetic theory of Bluids; Kirkwood J., J. Chem. Phys., 14 (1946), 180; 15 (1947), 72.
234 Приложение I Уравнение (8) является уравнением Б-Б-Г-К-И. Оно получается непосредственно, и его вывод поэтому можно опустить. Особенно интересен случай s=l, который за- дает изменение распределения в р-пространстве. Напи- шем это уравнение более подробно: = - JL . V,F, - К + (10> К=— Vq(/ — внешняя сила. Первые два члена в правой части описывают изменение Л, возникающее из-за дви- жения в (шестимерном) р-пространстве. Если перенести эти члены в левую часть, то в комбинации с dFJdt мы получим полную (или субстанциональную) производную по времени DF\/Dt, которая показывает, как изменяется Fi, если вместе с частицей движется элемент dp dq р-пространства; последний член уравнения (10) описы- вает изменение Flt возникающее из-за взаимодействия с другими молекулами; в него входит парная функция распределения F2. Обычное макроскопическое описание состояния газа получается из Ft (и F2) с помощью дальнейшего усред- нения по импульсам1). Например, плотность р полу- чается так: p(q. *)=п£г-/ Л(Ч» Р. О^р; средняя скорость равна u(q. 0=7-7/ p/7irfP- Интегрируя уравнение (10), мы получаем уравнение не- прерывности (закон сохранения массы) -^- + div(pu) = 0. (П) Если уравнение (10) сначала умножить на р и затем проинтегрировать по р, мы получим после ряда манипу- ’) Лучше всего эта часть теории изложена в работе: Kirk- wood J., J. Chem. Phys., 14 (1946), 180.
Уравнение Больцмана 235 ляцпй уравнения движения (закон сохранения импуль- са) в виде Du, I ди, _ \ дР,„ (12) Тензор напряжений состоит из двух частей; первая часть зависит только от Ft и определяется равенством UfJ^dv, где Ui = -^(Pi — mut)— тепловая скорость; вторая часть зависит от межмолекулярного потенциала и парной функции распределения Г2; она задается формулой = f f / *Р<*РЛ(Я» г- Р’ Ри 0. где r=qt — q. Полный тензор напряжений, очевидно, симметричен. Наконец, из (10) можно вывести уравнение, выра- жающее закон сохранения энергии; оно имеет обычную форму P^(v) + <Hv4 = -*W>a₽- (13) Правая часть — это работа, производимая тензором на- пряжений; она содержит также тензор деформаций _1/ди/ > диД Ч 2 \ dqj ' dq{}’ Левая часть дает приращение внутренней энергии, со- держащее величину Q=vJflfp4m£/2/7i(4’ р> *)+ + •5!^ f^pff rfPA<P(lq —Я11И2(Я. Я1. р. Р1. *). и ее уменьшение, возникающее из-за теплового потока плотности q; последний, так же как Р1; и Q, состоит из двух частей: одна чисто кинетического происхождения
236 Приложение / (выражается через Л), другая возникает из-за межмо- лекулярных сил и выражается через F2. Я опускаю под- робную формулу. Следует подчеркнуть, что все это чисто формальные выводы, строго следующие из уравнения Лиувилля в пределе при jV-*-oo, V->oo, отношение N/V конечно; они получаются при помощи только интегрирования и подобающего истолкования средних значений. Никаких предположений не делается. В результате возникает общая, но малосодержательная схема. Эта схема мало- содержательна потому, что система уравнений не зам- кнута. Уравнение (10) не является уравнением только относительно Л, оно включает также и F2. Уравнения (11), (12) и (13) не образуют систему уравнений дви- жения относительно макроскопических величин р, и и Q, поскольку они содержат величины Pi} и q, зависимость которых от макроскопических переменных неизвестна. Ясно, что нельзя поумнеть только от вычисления ин- тегралов. Нужны дальнейшие предположения. Они дол- жны как-то отражать тот факт, что наблюдаемые в действительности макроскопические изменения состоя- ния системы одни и те же для подавляющего большин- ства элементов ансамбля, так что среднее значение не- которой величины по ансамблю будет в любой момент времени представлять значение той же величины для отдельной системы. 5. Уравнение Больцмана и уравнения гидродина- мики. Замкнутая система уравнений, описывающих из- менение распределения в р-пространстве и изменение макроскопических переменных, конечно, известна, но она была выведена из интуитивных или феноменологических предпосылок. Уравнение, задающее изменение Fit — это известное уравнение Больцмана, на котором основана кинетическая теория разреженных газов. Чтобы напи- сать его в обычном виде1), мы будем использовать ско- рости вместо импульсов и положим /(/. х, g)=4^. ч. р)- ') Boltzmann, Vorlesungen fiber Gastheorie, В. !; см. также. Chapman, Cowling, Mathematical Theory ol Non-uniform Gases.
Уравнение Больцмана 237 [Ясно, что f(t, х, 5)—число частиц в элементе dxd% ^-пространства.] Тогда уравнение Больцмана примет вид Y df - Dt ~ dt '6o дха Л“ — = dQg/(g, е)(/'/;-//.)• (U) Левая часть здесь такая же, как и в уравнении (10) (за- метим, что теперь — ускорение Kt/m)-, отличие этого уравнения от уравнения (10) связано с членами, описы- вающими столкновение. Здесь штрих и индекс 1 у f от- носятся только к переменной скорости, так что, напри- мер, х, gi) и т. д. Буквы 6, обозначают скорости при парном столкновении (§» Ej) ** (5'» §i'): S = | § — | = | Г — | — относительная скорость; направление относительной скорости после столкнове- ния изменяется на угол G (см. рис. 1). Два члена в пра- вой части представляют соответственно вклад от обрат- ных столкновений и потери от прямых столкновений (§, Чтобы подсчитать число прямых столкновений, рассмотрим относительное дви- жение. Все молекулы со скоростями, лежащими внутри элемента dfa, сталкивающиеся так, что их «параметр
238 Приложение I соударения» заключен между b и b+db, и находящиеся в небольшом цилиндре gbdbdedt вне сферы действия (е — полярный угол), в следующий промежуток времени dt столкнутся так, что относительная скорость g откло- нится на угол 0. Зависимость между Ь, 0 и g опреде- ляется динамикой столкновения или, что то же самое, законом взаимодействия. Больцман далее предполагает, что число прямых столкновений в единице объема за единицу времени равно gbdbdzff^d^ (15) т. е. он предполагает, что это число пропорционально произведению числа сталкивающихся частиц. Это пред- положение (Stosszahlansatz *)), конечно, правдоподоб- но, но, разумеется, не может быть выведено из исходных предпосылок нашей механической модели. Аналогично подсчитывается число обратных столкновений. Подстав- ляя эти числа в формулу (14), окончательно можем на- писать: Ь dbde=7(g,6)dQ — дифференциальное сечение расстоя- ния для столкновений внутри телес- ного угла dQ = sin0ded0. Уравнение Больцмана часто подвергалось критике. Особенно сомнительным кажется то обстоятельство, что в допущении (15), несмотря на существование силы взаимодействия между молекулами, не принимается в расчет корреляция между направлениями скоростей двух сталкивающихся частиц, так что вместо F2 появляется произведение двух Л. Очевидно, что Больцман имел в виду некоторую схему последовательных приближений. В нулевом приближении, когда пренебрегают межмоле- кулярными силами, состояние газа в точности описы- вается функцией f(t, х, v); в следующем приближении при учете только парных столкновений можно еще обхо- диться с помощью f. Только тогда, когда плотность газа настолько велика, что тройные и более высокого поряд- ка столкновения начинают происходить с заметной ча- ') €м. Ehrenfest Р., Ehrenfest Т., цит. раб.
Уравнение Больцмана 239 стотой, следует уже принимать в расчет корреляцию ме- жду скоростями. Таким образом, больцмановское уравнение законно только в том случае, когда плотность газа не слишком велика. Кроме того, сомнительно, чтобы явления, связан- ные с быстрым изменением в пространстве или во времени, могли бы описываться этим уравнением. Я на- деюсь вернуться к этому вопросу во второй лекции. Замкнутой системой уравнений, описывающей измене- ние макроскопических переменных, является хорошо из- вестная гидродинамическая система уравнений Навье— Стокса. Она состоит из уравнений, имеющих тот же вид, что и общие уравнения переноса (11), (12) и (13), и, кроме того, содержит дополнительные уравнения, выра- жающие тензор напряжений и плотность теплового потока q через макроскопические величины. Вот эти уравнения: Рц =Р&1} — 2р. [di} —j- Dacfiij'j , q = — A, grad Г. (16) Они содержат два коэффициента вязкости ц и v и коэф- фициент теплопроводности X; эти параметры характери- зуются уже самим газом и могут зависеть от р и Г, при- чем зависимость определяется экспериментально. Вместе с уравнением состояния р(р, Т) и тепловым уравнением состояния Q(p, Т) мы получаем пять уравнений для пяти макроскопических величин р, и и Т. 6. Выводы. Связь между различными описаниями состояния газа может быть изображена схемой, приве- денной на стр. 240. В левом столбце стрелки вниз соот- ветствуют строгому выводу; пунктирные стрелки озна- чают, что переход связан с некоторой аппроксимацией и требует дополнительных предположений. Каждая пунктирная стрелка в действительности представляет целую теорию, которой должна быть посвящена по крайней мере одна лекция, тем более что пока боль- шинство этих связей еще далеко не ясны. Однако су- ществует, как мне думается, одна общая точка зрения, принадлежащая Боголюбову, которую я и постараюсь кратко изложить в следующей части.
240 Приложение I Механические процессы Необратимые процессы Описание в Г-простран- стве Описание в ц-простраи- стве Макроскопиче- ское описание Часть 2 7. Идеи Боголюбова. Наша основная проблема — вы- яснить соотношение между левым и правым столбцами в указанной общей схеме. Поскольку нас главным об- разом интересует развитие системы во времени, важно сначала обсудить, какие масштабы времени содержатся в нашей задаче. Ясно из самой модели, что появляются следующие характерные промежутки времени, располо- женные в порядке возрастания: (а) время молекулярного взаимодействия, или время столкновения: Т = Го/'»ср.» (1) где о ср- — средняя скорость;
Уравнение Больцмана 241 (б) среднее время свободного пробега, или время между столкновениями: to= ^’ср.» (2) где X — средняя длина свободного пробега. Для газа средней плотности /о^>т (скажем, в 102 или 103 раз боль- ше), для жидкости 6>и т—величины одинакового порядка; (в) время макроскопической релаксации: % = ^/^ср.» (3) здесь L—макроскопический размер, например расстоя- ние между параллельными стенками, между которыми течет газ или проходит тепло, или длина звуковой волны, распространяющейся в газе, и т. д. Вообще L — это рас- стояние, на протяжении которого заметно изменяется какая-нибудь из макроскопических величин р, и или Т. Для обычных медленно протекающих явлений 0о^>^о; в исключительных случаях (высокочастотный звук, удар- ные волны) 0о может стать одного порядка с t0. Рассмотрим случай газа средней плотности с мед- ленно меняющимися макроскопическими величинами, так что 0о>>/о^>т- Из физических соображений можно ожидать, что развитие распределения DN во времени проходит различные стадии. а. Начальная стадия. Для произвольного начального распределения DN(xi, х2, ..., xN-, 0) можно ожидать, что все частичные функции распределения F,(x1, ..., xt, t) при s > 2 меняются очень быстро в течение промежутка времени порядка т. Способ их изменения зависит от ис- ходной ситуации, поэтому его нельзя описать в общем виде. Только первая функция распределения Ft(x, t) не связана непосредственно с отталкивающим межмолеку- лярным взаимодействием и поэтому изменяется мед- ленно. б. Кинетическая стадия. Можно ожидать, что по про- шествии промежутка времени порядка т развитие си- стемы будет управляться изменением во времени функ- ции Л. Поскольку в положении равновесия высшие функции распределения F«(s>2) зависят от Ft [так как в этом случае Ft=Fl(xl) ... Ft(xf) • екр(—р£ф(г^)), ijq 16 м. Как
242 Приложение I крайней мере в первом приближении], то можно думать, что Ft примет вид Л (*> ......= Fs (*i. • • •. Л), (4) где зависимость от времени полностью заключена в Flt каково бы ни было начальное распределение. [Уравне- ние (4) не является, следовательно, тривиальным утвер- ждением, что всегда можно использовать Ft вместо t, поскольку тогда F, зависело бы также от начального распределения для Л.] Уравнение для Л имеет, как можно ожидать, следующий вид: (5) (кинетическое уравнение, или общее уравнение Больц- мана). Это уравнение полностью описывает изменение состояния газа во времени. Через промежуток времени т в описании состояния газа происходит своего рода сужение, или сокращение, после чего развитие во времени определяется уже го- раздо меньшим числом переменных (а именно Ft вместо всех функций Ft). Мы можем также сказать, что в течение времени т происходит первое сглаживание или хаотизация, когда теряются подробности начальной информации. в. Гидродинамическая стадия. Через промежуток времени порядка t0 происходит следующее сглаживание или хаотизация. Очень быстро (всего через несколько столкновений, следовательно, в течение времени по- рядка to) в скоростях почти устанавливается равновесие, и дальнейшее развитие во времени управляется измене- нием макроскопических переменных р, и и Т' (или вну- тренней энергии Q). Функция распределения Ft примет теперь вид (поскольку она имеет такой вид в равновес- ном состоянии): Л(ч> р. <)=Л(ч. р; Р. Л» (6) где зависимость от времени полностью заключена в р, u, Т, каково бы ни было начальное распределение для Ft. По аналогии с формулой (5) можно ожидать, что
Уравнение Больцмана 243 уравнения для р, u, Т запишутся в виде -£ = Я(ч; р, и. Г), Щфр. и, Г). (?) £_е(ч;р,11. ту. Это общие гидродинамические уравнения; они описы- вают теперь дальнейшее изменение состояния газа во времени. Это есть следующее сужение, или сокращение, описания; р, u, Т являются лишь первыми пятью момен- тами распределения Л относительно р, и поэтому раз- витие во времени определяется теперь еще меньшим числом переменных. Возможно, существует следующая стадия развития по пути к равновесию, а именно стадия турбулент- ности. Исследования Тэйлора, Кармана — Ховарда и др. по изотропной турбулентности с помощью усреднения уравнений Навье — Стокса напоминают вывод уравне- ний Б-Б-Г-К-И из уравнения Лиувилля. Снова полу- чается цепочка уравнений, включающая последователь- но парные, тройные и т. д. корреляционные функции скоростей. Снова, очевидно, должны быть сделаны даль- нейшие предположения. Следуя точке зрения Боголю- бова, сначала надо найти различные масштабы времени или длины, содержащиеся в самой задаче. Если удастся расщепить 0О (или L) на два или больше промежутков времени (или отрезков), то можно ожидать дальней- шего сужения описания. Возможно, для изотропной турбулентности L расщепляется на длину вихрей, обра- зующих турбулентность, и корреляционную длину, ко- торая приблизительно раз в десять меньше. Возможно, в этом случае единственной функцией, которая описы- вает развитие во времени, служит парная функция рас- пределения, и все высшие распределения функциональ- но зависят от нее. Возможно, появившуюся недавно теорию Чандрасекара *) можно рассматривать как *) Chandrasekhar S., Proc. Roy. Soc. (London), A229 (1955), 1. 16*
244 Приложение I первый шаг в этом общем направлении. Заметьте, что почти каждое предложение я начинаю словом «возможно»! Все это только предположения, и я ничего не знаю сверх сказанного. Следует упомянуть о недавних работах Ван-Хова *) и Кона и Латтинджера * 2) по квантовой статистической механике. Эти авторы впервые удовлетворительным об- разом вывели так называемое уравнение переноса (ко- торое в нашей терминологии является квантовомехани- ческим аналогом основного уравнения) из квантового уравнения Лиувилля. Существенным моментом их вы- вода является то обстоятельство, что внедиагональные элементы матрицы плотности (которые очень быстро ме- няются во времени) выражены через медленно меняю- щиеся диагональные члены. Уравнение переноса (или основное уравнение) содержит только эти диагональные члены, так что снова получается сокращение в описа- нии состояния системы. Представляется вероятным, что такие последователь- ные сокращения описания являются существенной чер- той теории необратимых процессов. Конечно, возмож- ность таких сокращений должна быть заложена в свой- ствах исходных уравнений системы. Кроме существова- ния ряда времен релаксации (таких, как т, /0 и 60) или длин релаксации, из свойств исходного уравнения должно также вытекать, что его решения для практи- чески всех начальных условий обнаруживают своего рода кусочно-эргодическое поведение во времени. Ре- шения с любыми начальными условиями должны скап- ливаться все вместе к кривой (образовывать «Verdich- tungskurve»), которая описывается уже меньшим чис- лом переменных и подчиняется следующей системе уравнений и т. д. Ясно, что при этом возникают две основные задачи: 1. Показать, что решения исходных уравнений (урав- нения Лиувилля или уравнений Б-Б-Г-К-И в кинетиче- ской стадии, уравнения Больцмана в гидродинамиче- ') Van Hove L„ Physlca, 21 (1955), 517; 23 (1957), 441. 2) Kohn W„ Luttinger J. M., Phys. Rev., 108 (1957); 590; 109 (1958), 1892,
Уравнение Больцмана 245 ской стадии) обладают таким кусочно-эргодическим по- ведением во времени. Обычно физик это допускает, и его больше интересует вторая задача. 2. Найти переменные и уравнения, которые описы- вают указанную кривую («Verdichtungskurve>), или асимптотическое поведение решений исходных уравне- ний. Я постараюсь кратко изложить, как предлагает ре- шать эту задачу Боголюбов. 8. Кинетическая стадия. Существенная черта метода Боголюбова состоит в том, что сокращение уравнений сочетается с процедурой последовательных приближе- ний или разложения в степенной ряд. В кинетической стадии это есть хорошо известное вириальное разложе- ние в ряд по степеням плотности 1/у. Напишем уравне- ния (5) и (6) в виде ^ = А0(х-, /=-1) + 'п-’Д1(х; (8) F,(x„ = ....x,;F,)+ + .... x; /=•,)+ ... (s>2). (9) В действительности следует разлагать в ряд по степе- ням т//0, однако проще использовать l/о. Сравним те- перь (8) и (9) с уравнениями Б-Б-Г-К-И: Fs} + v-'fdxs+l 2 г+1 Z-1 Положим сначала s=l. Используя разложение (9) для Рг, получаем СО Q т, л,)+2»-*f dX, (ф,,, *=1 Сравнивая это уравнение с уравнением (8) и приравни- вая члены с одинаковыми степенями 1/v, находим А(х,; Л) = |И„ А(х,; f dx,\^. F?>(x„ x,: Л)|. <10» ACV F,) = jdx,\4K. R>>(xv xa; F,)j
246 Приложение I и т. д. Следовательно, До описывает течение газа, в то время как высшие члены А содержат парные функции распределения, взятые в приближении, на один шаг бо- лее низком. Далее, рассмотрим уравнения Б-Б-Г-К-И d F для $>-2. Производную по времени-^-следует теперь заменить произведением dF^_bP^ dt ~ 6Ft dt где 6F,/6Ft — вариационная производная по Ft. Заме- няя dFJdt выражением (8), a F,— разложением (9) и приравнивая одинаковые степени l/о, получаем {Hs, Fl0)}-Dort0) = O, {/4, F<;,}-DoF<,, = D1F<O)+ f dxi+1 2ф^+1Л011 (П) и т. д., где оператор Dr, действующий на любой функ- ционал ф(*1, Fi), определяется так: Ог^$;Аг(Х-, FJ. Теперь ясно, как вычислять последовательные прибли- жения. Первое уравнение (11), куда входят только содержит До, которое уже известно. Решая это уравне- ние относительно А0>. мы найдем из второго уравнения (10) Д1(*;Г1). Это полностью определяет правую часть второго уравнения (11), откуда затем можно найти F™. Это в свою очередь дает А2(х; Fi) и т. д. Все это, по крайней мере формально, можно проде- лать. Чтобы дать представление о характере результа- тов, позвольте мне только упомянуть, что в первом при- ближении ^’(х,....X,-. = Др,(<«•>, Pf>. <) (12) Здесь —начальный импульс j-й частицы, при кото- ром после s-кратного столкновения (описываемого га- мильтонианом Hs) через время t достигается конфигу- рация ..., х»; Q\s) — положение t-й частицы, которое
Уравнение Больцмана 247 она должна была бы занимать через время t, если бы она двигалась без столкновений с постоянным импуль- сом Р^\ Как Р(/>, так и Q'/1 являются, следовательно, функциями от Л|, ..., х», которые можно было бы найти, если бы мы могли проинтегрировать уравнения движе- ния для s частиц. Поскольку Р® является произведе- нием s функций Л, мы можем сказать, что в этом при- ближении s точек х, не коррелируют друг с дру- гом [в смысле (12)]. Следует подчеркнуть, что это верно только для первого приближения; F,*’ уже не предста- вляется более в виде произведения Ft. Подставляя вы- ражение (12) для s=2 в уравнение (10) для A i (xj; Ft), можно доказать, что Ai превращается в член уравне- ния Больцмана, задающий число соударений, по край- ней мере в том случае, когда в этом члене можно пре- небречь различием положения двух сталкивающихся ча- стиц. Как я уже сказал, все это можно действительно про- делать. В следующем приближении в кинетическом уравнении Л2(*1; Fi) зависит от тройных столкновений и т. д. Тем самым вириальное разложение кинетических уравнений напоминает обычное вириальное разложение для величин равновесного газа в том смысле, что ка- ждый следующий член учитывает взаимодействие все большего и большего числа молекул. 9. Гидродинамическая стадия. Предварительные ре- зультаты. В гидродинамической стадии основным яв- ляется кинетическое уравнение (8). Сокращение в опи- сании по-прежнему сочетается с разложением в ряд по степеням некоторого параметра. Таким параметром слу- жит теперь 4/0о или Х/L; он измеряет, следовательно, относительное изменение макроскопических величин на расстоянии длины свободного пробега, поэтому мы бу- дем его называть параметром однородности р. Анало- гично уравнению (8) гидродинамические уравнения (7) могут быть разложены следующим образом: -^- = ^(4; р, u, T)4-p%(q; р, и, Т)+ ...» (13) р, и, Г)+ц’и2(Ч; р, и, 7)+ ...
248 Приложение I и подобное же уравнение для дТjdt. Разложение начи- нается с первой степени ц, поскольку р=0 соответствует равновесному распределению, при котором все макро- скопические переменные не меняются во времени. По аналогии с разложением (9) можно написать разложе- ние для функции (6): Fi(q, р, о=/о(ч> р; р. «. 7>Wi(q. р; р, и, Г)+.... (14) Используя кинетическое уравнение, мы можем тогда последовательно определить функционалы U,-, 6,- и последовательные приближения для функции распреде- ления Ft. Если в кинетическом уравнении (8) остановиться на члене, пропорциональном 1/v, так что уравнение (8) станет по существу уравнением Больцмана (прини- маются в расчет лишь члены, описывающие течение газа и парные столкновения молекул), то сокращение в опи- сании, а именно введение параметра ц, полностью экви- валентно выводу гидродинамических уравнений методом Энскога. В этом случае мы знаем, что: I. В первом порядке по ц получается уравнение Эй- лера для идеальной жидкости и, кроме того, уравнение состояния для идеального газа. 2. Во втором порядке по ц мы приходим к уравне- ниям Навье — Стокса, причем для вязкости и коэффи- циента теплопроводности получается явное выражение через межмолекулярный потенциал. Эти коэффициенты не зависят от плотности — классический результат ки- нетической теории газов, — и их значения и темпера- турная зависимость хорошо согласуются с эксперимен- тальными данными. Для нашей модели (одноатомный газ) существует лишь один коэффициент вязкости; коэффициент v равен нулю. Уравнение состояния такое же, как для идеального газа. Здесь появляется неболь- шая неувязка, поскольку следовало бы ожидать, что эф- фекты парного взаимодействия входят во второй ви- риальный коэффициент. Неувязка эта возникает потому, что мы заменяем Л((х; Ft) больцмановским оператором столкновений даже в случае, когда Ft существенно за-
Уравнение Больцмана 249 висит от q. Если подходящим образом учесть эту зави- симость, то, как показал Боголюбов, мы получим ожи- даемое отклонение от закона идеального газа. 3. В третьем порядке по ц получаются так назы- ваемые уравнения Бернетта. Они очень сложны и до сих пор очень мало применялись к конкретным зада- чам. Действительно, в частных случаях обычно проще пользоваться не разложением Энскога, а исходить не- посредственно из уравнения Больцмана. Однако разло- жение Энскога во всяком случае верно. Оно только становится очень сложным в высших порядках по ц, и, вероятно, это разложение не сходится, а является толь- ко асимптотическим. Если в кинетическом уравнении (8) оставить только члены с Л2, Аз и т. д., так что будут учитываться трой- ные и более высокого порядка столкновения, то ситуа- ция значительно усложнится. В первом порядке по ц все еще можно ожидать получить уравнения Эйлера для идеальной жидкости, но уравнение состояния со- держит теперь столько вириальных коэффициентов, сколько членов Лп(х; Л) оставлено в кинетическом уравнении. Это, действительно, было доказано недав- но1), по крайней мере для членов порядка 1/v3 (чет- вертый вириальный коэффициент); общее доказатель- ство связано с некоторыми еще не решенными комби- наторными задачами. Если в кинетическом уравнении оставить члены трой- ных столкновений (1/ц2)Л2(х; Ft), то во втором порядке по ц снова получается уравнение Навье — Стокса1). Однако теперь вязкость и коэффициент теплопроводно- сти зависят от плотности; в самом деле, для этих коэф- фициентов переноса получается вириальное разложе- ние в виде P = Ho(7') + PPi(7’) + •••. Х = Х0(7') + рХ](Г)-!- ..., *) Ch oh S. Т., Dissertation, University of Michigan, 1958.
250 Приложение ! где Цо и Хо совпадают с выражениями, найденными Чеп- меном и Энскогом (они зависят от поперечника сече- ния двойных столкновений), и Ц1 и М — поправки, воз- никающие за счет тройных столкновений. Они сложно выражаются через динамические характеристики взаи- модействия трех частиц, и поэтому трудно (но не не- возможно!) получить численные результаты. В заключе- ние интересно отметить, что теперь появляется также второй коэффициент вязкости, который в этом прибли- жении пропорционален плотности.
ПРИЛОЖЕНИЕ II КВАНТОВАЯ МЕХАНИКА А. Р. ГИББС Профессор Кац описал различные типы вероятност- ных мер. Он объяснил также, что в схеме квантовой механики, предложенной Фейнманом, используется ана- лог вероятностной меры, дающий возможность описать поведение квантовомеханических частиц. Он упомянул, что эта мера обладает некоторыми особенностями; в частности, она комплексна. В этой статье я сообщу некоторые дополнительные сведения о квантовомеханической мере и коснусь, в част- ности, следующих трех вопросов. Во-первых, я хочу об- судить вопрос о том, почему для описания поведения некоторой физической величины необходима эта осо- бая комплекснозначная мера. Во-вторых, я хочу выяс- нить, что это за мера и как именно она описывает по- ведение некоторой физической системы. В-третьих, я хочу показать два различных математических под- хода. Один из них дает возможность вычислять так на- зываемые интегралы по траекториям и приводит с их помощью к более или менее полному описанию движе- ния квантовомеханической частицы. Второй в действи- тельности несколько искажает квантовомеханическую меру, но тем не менее позволяет решать другой тип за- дач из квантовой механики. Мы начнем с обсуждения оснований квантовомехани- ческой меры. Поскольку это лекция по физике, естествен- но исходить из опыта, быть может, воображаемого, но все-таки опыта. Представим себе источник, излучаю- щий электроны (спираль в левой части рис. 1); они дви- жутся к экрану (а), проходят через две щели в нем А и в, а затем направляются к счетчику электронов, кото- рый может перемещаться вниз и вверх вдоль экрана (б).
252 Приложение П Если бы электроны подчинялись законам классиче- ской физики, то можно было бы ожидать, что счетчик включается (т. е. отмечает поступление электрона) только в двух положениях. Одно из этих положений Рис 1. определяется пересечением с экраном (б) прямой, про- веденной от источника через щель А, другое—пересе- чением прямой, проведенной от источника через щель В. Однако мы не слишком удивились бы, обнаружив, что электроны не следуют этим классическим предписаниям. Поступающие электроны не сосредоточены в двух раз- личных местах на экране, а размазаны по нему. В дей- ствительности мы убедимся в том, что невозможно связать с начальными (источник) и граничными (по- ложение щели) условиями нашего эксперимента какое- нибудь определенное место поступления электронов на экран. Лучшее, что мы можем сделать, — это связать
Квантовая механика 253 с этими условиями вероятность попадания электрона в какую-нибудь точку на экране (б). Для простоты допустим, что электроны, испускаемые источником, имеют одинаковую энергию. Исследуем те- перь вид вероятностных законов, поочередно закрывая одну из щелей А и В. Когда открыта только щель А, распределение электронов, наблюдаемое на экране (б), выглядит, как показано на рис. 2а; если же открыта только щель В, то это распределение выглядит, как по- казано на рис. 26. Открывая одновременно обе щели, мы могли бы ожидать на основе естественных предположений, что результирующее распределение равно сумме распреде- лений, изображенных на рис. 2а и 26. Однако если действительно произвести такой опыт, то получающееся распределение выглядит так, как показано на рис. 3. Это распределение, напоминающее интерференцион- ную картину, совершенно определенно отличается от суммы распределений, полученных в отдельности от ще- лей А и В. Таким образом, в терминах теории вероят- ностей Р(Д4-В)¥=Р(Л) + Р(В). (1) Почему это так? Почему наше привычное представле- ние о вероятностях и о правилах обращения с ними ока- зывается непригодным? Мы могли бы подумать, что наши допущения неправильны, а именно что прохо- ждение через щели А и В не определяет отдельных-
254 Приложение П событий и, может быть, электрон дробится и одна его часть проходит сквозь щель Л, а другая — сквозь щель В. Однако мы можем проверить эту гипотезу, помещая источник света позади щелей и подстерегая проходящие через них электроны. Электроны рассеивают свет, так что мы можем заметить, какая из щелей пропустила электрон, по тому, в какой точке рассеялся свет. Если выбрать достаточно слабый источник электронов, испу- скающий не более одного электрона в любой момент времени, то можно обнаружить, что свет рассеивается только позади какой-нибудь одной из щелей А или В, но никогда не рассеивается позади обеих щелей одно- временно. Мы могли бы также измерить заряд, кото- рый проходит через щель А или В, и обнаружить, что он совпадает с полным зарядом электрона, проходив- шим в это время через соответствующую щель. Мы могли бы представить себе другую возможность: что электроны совершают особого рода движение, про- ходя сначала через одну щель, затем через другую, по- том снова через первую и т. д., прежде чем они окон- чательно попадают на экран (б). Мы опять можем про- верить эту гипотезу, освещая щели и наблюдая за рассеянием света. Мы найдем, что если взят источник электронов достаточно слабой интенсивности, то каждый раз, когда электрон проходит от источника к счетчику, свет рассеивается только позади одной щели. Из этих наблюдений мы вынуждены сделать следую- щие заключения: 1. Движение электронов должно описываться неко- торым вероятностным законом, поскольку совокупности начальных условий мы можем сопоставить лишь рас- пределение конечного положения электрона. 2. Правила, управляющие «сложением> вероятно- стей для взаимно исключающих способов движения, от- личаются от тех правил, к которым мы привыкли в обыч- ной теории вероятности. Оказывается, что такое движение электронов можно описать, вводя новое математическое понятие «ампли- туды вероятности:». Мы обозначим амплитуду вероят- ности через <р и припишем каждому из возможных способов попадания электрона из источника на экран
Квантовая механика 2Б5 свою амплитуду. Таким образом, в нашем опыте есть две амплитуды, <рА и <рв, для каждой из двух щелей. Правило сложения амплитуд для двух взаимно исклю- чающих путей состоит в обычном сложении амплитуд. Таким образом, общая амплитуда вероятности для элек- трона, проходящего от источника к счетчику, при обеих открытых щелях равна Ф(Л + В) = <р(Д) + ф(В). (2) Далее постулируется, что вероятность события рав- на квадрату модуля амплитуды вероятности этого собы- тия. Итак, всегда Р=|ф|2. (3) Амплитуда и, таким образом, вероятность зависят от начальных условий, конечного положения и, разумеется, от любых ограничений, встречающихся по пути, таких, как положение щелей А и В. Используя предыдущие правила, мы можем полу- чить вероятность того, что электрон попадет в какую- нибудь выбранную точку экрана (б), когда обе щели открыты: Р(А + В)= |ф(А + В)|2= |ф(А) + ф(В)|2 = = |Ф (А)|2 + |Ф (Д)|2 + Ф (А) Ф* (В) + ф* (А) ф (В) = = Р(А)+Р(В)+2Ке[ф(А)ф*(В)]. (4) Так как вещественная часть произведения ф(А)ф*(В), вообще говоря, не равна нулю, мы видим, что Р(А + В) ¥= Р(А) + Р(В). (5) Можно представить себе, что, когда мы обсуждали основания понятия амплитуды вероятности, мы ввели возможность парадокса. В самом деле, допустим, что мы помещаем источник света позади экрана (а) и на- блюдаем, какая из щелей рассеивает свет. Мы уже го- ворили, что таким способом можно сосчитать отдельно каждый электрон, проходящий через ту или иную щель. Предположим, что на чистом листе бумаги мы отдельно для каждого электрона отмечаем его прохождение через щель А или щель В, а также его конечное положение
256 Приложение II на экране (б). Если мы после этого построим кривые распределения отдельно для этих двух классов электро- нов, то получим кривые, изображенные на рис. 2а и 26; однако, сложив эти кривые, мы получим кривую, не имеющую никакого сходства с интерференционной картиной. По всей логике вещей эта кривая должна совпадать с наблюдаемой функцией распределения для объединенных классов. Мы можем сравнить эту результирующую кривую, полученную при помощи листка бумаги, с наблюдаемым распределением всех электронов. Проделав это, мы найдем, что они совпадают. Интерференционные явле- ния исчезли! Как это может быть? В нашем предыду- щем опыте мы наблюдали интерференционную картину, изображенную на рис. 3, тогда как теперь мы получили сравнительно гладкое распределение, совпадающее с суммой кривых на рис. 2а и 26. Различие этих опы- тов только в том, что в последнем случае мы следили за тем, через какую щель проходит электрон. Итак, мы открыли другую особенность квантовоме- ханического поведения. Если мы заглядываем в экспе- римент, так сказать, в середине, то мы меняем его конеч- ный результат. С физической точки зрения мы можем понять, почему это происходит. В случае электронов мы имеем дело с очень маленькими и очень легкими ча- стицами. Они на самом деле настолько легки, что их движение может существенно измениться от столкнове- ния с квантами света. Каждый световой квант обладает импульсом, обратно пропорциональным длине его вол- ны. При взаимодействии с электронами (это взаимо- действие и приводит к наблюдаемому рассеянию света) происходит перераспределение импульсов между све- товым квантом и электроном. Импульс электрона за- метно меняется, причем случайным образом, так что интерференционная картина в окончательном распреде- лении смазывается. Нет уже более интерференционных пиков и впадин. Теперь вам может прийти в голову, что существует способ выиграть эту игру. Можно постараться выбрать источник света столь слабым, чтобы импульс светового кванта был слишком мал и не мог заметно повлиять на
Квантовая механика 257 движение электронов. Однако, как я уже говорил, им- пульс светового кванта не зависит от интенсивности источника, а зависит лишь от длины световой волны. Раз так, мы могли бы сильно увеличить длину волны и тем самым уменьшить импульс каждого кванта. Однако это возможно лишь до определенного предела. Как хо- рошо известно, расстояние между двумя источниками света невозможно определить с большей точностью, чем, грубо говоря, длина волны излучаемого ими света. Этим обстоятельством в действительности и ограничена разрешающая способность оптических микроскопов. В нашем эксперименте мы хотим различить щели А и В. Таким образом, мы должны иметь дело только со светом, длина волны которого меньше расстояния ме- жду этими щелями. Но как раз тогда импульс, который несет квант света с такой длиной волны, уже настолько велик, что смывает интерференционную картину в окон- чательном распределении. Мы заключаем, что мы не в состоянии — по крайней мере используя такие мето- ды — сказать про каждый электрон, сквозь какую щель он прошел, с тем чтобы не разрушить интересующую нас интерференционную картину. Природа нас снова перехитрила. На самом деле неизвестна никакая эксперименталь- ная техника, которая позволила бы наблюдать ход экс- перимента так, чтобы не изменить его результат. Для привычных нам больших тел, таких, например, как тет- радь, карандаш, эти вызываемые наблюдениями возму- щения так ничтожны, что совершенно незаметны в на- шем обычном опыте. И только тогда, когда мы обра- щаемся к мельчайшим частицам, это обстоятельство становится существенным. Итак, мы приходим к вол- нующему заключению, что в описанном эксперименте, когда мы получаем функцию распределения, изображен- ную на рис. 3, нам не дано узнать, через какую щель проходит электрон. Некоторые физики скажут, что нельзя даже утверждать, что он проходит через какую- нибудь из щелей, поскольку можно утверждать лишь то, что поддается наблюдению. Самое большее, что мы можем сказать, — это то, что электрон имеет некото- рую амплитуду вероятности пройти сквозь каждую из 17 М. Кац
258 Приложение II щелей, и эти амплитуды, интерферируя, дают результи- рующее распределение. То обстоятельство, что технические возможности экс- перимента ограничены, и составляет принцип неопреде- ленности Гейзенберга. Мы можем сформулировать этот принцип многими способами. Традиционная формули- ровка касается неопределенности, возникающей при од- новременном измерении положения и импульса частиц. Утверждается, что положение и импульс частицы нельзя измерить одновременно с точностью, большей, чем по- стоянная действия Планка й, деленная на 2л (эта вели- чина— постоянная Планка, деленная на 2л, — обычно обозначается через Л). Однако этот принцип можно выразить другим способом, более близким к нашим рассмотрениям. Он состоит в следующем. Как только произведено наблюдение за движением некоторой ча- стицы, все другие альтернативные возможности этого движения немедленно исключаются. Это означает, что если мы наблюдаем за электроном, проходящим сквозь щель А, то из наших вычислений следует исключить ам- плитуду вероятности этого электрона пройти сквозь щель В. Мы знаем, что он через нее не прошел. Итак, каждое наблюдение ограничивает число допустимых альтернативных способов движения частиц. Оба эти выражения принципа неопределенности в действитель- ности эквивалентны. В само понятие квантовомеханического поведения мы включили то утверждение, что результат некоторого экс- перимента может быть получен только с той или иной вероятностью. Мы ввели понятие амплитуды вероят- ности, квадрат модуля которой дает вероятность или ее функцию распределения. Возникает очень интересный вопрос. Верно ли, что такая вероятностная интерпретация квантовомеханического поведения является единственно возможной? Может быть, существует более детермини- рованное описание такого поведения? До сих пор ка- залось, что только вероятностная точка зрения дает удовлетворительные результаты. Однако это, конечно, не доказано. Несмотря на то что этот вопрос интересен, он, по- видимому, не очень важен. Вероятностное описание дает
Квантовая механика 259 физику адекватное объяснение наблюдаемых им явле- ний. В настоящее время важнее понять особенности по- ведения ядерной материи. Интересно подумать, какие новые понятия придется ввести, чтобы объяснить пове- дение частиц, рождающихся при высоких энергиях в наших ускорителях. Теперь мы посмотрим, какой вид имеет амплитуда вероятности. На самом деле, она имеет очень простой вид Ф ~ ехр (iS/ti), (6) где S — действие вдоль траектории, которой приписы- вается амплитуда ф, т. е. ‘ъ S= f L(x, х, t)dt, (7) •a где L — функция Лагранжа, равная разности кинетиче- ской и потенциальной энергии, а интеграл берется вдоль указанной траектории от начального до конечного мо- ментов опыта. Сама эта траектория является траекто- рией частицы. Мы можем построить ее, если захотим, обобщая наш воображаемый эксперимент. Допустим, что мы поставили очень много экранов между источни- ком и счетчиком и в каждом экране просверлили не- сколько щелей. Затем, записав последовательность ще- лей, через которые проходит электрон, и моменты вре- мени каждого прохождения, мы получим приближенное описание его траектории. Мы придем к окончательному описанию в пределе, когда поставим бесконечное число экранов между источником н счетчиком и в каждом из них проделаем бесконечное число отверстий, так что фактически никаких экранов уже не останется, а мы по- лучим саму траекторию, т. е. положение электрона как функцию времени. Тогда полная амплитуда вероятности пройти от источника к счетчику представится суммой амплитуд для каждой отдельно взятой траектории по всем возможным бесконечным траекториям. Считая для простоты пространство одномерным, мы можем записать 17*
260 Приложение II амплитуду вероятности выхода из точки ха в момент времени ta и достижения точки хь в момент времени tb в виде ь U = f ехр а K(xb, tb; ха, 'ь Т f Ldi L *а 3x(t). Символ 3 обозначает операцию интегрирования по траекториям. Рис. 4. Это интегрирование можно определить таким спосо- бом, который позволит фактически вычислять инте- гралы. Интеграл строится по аналогии с обычным инте- гралом Римана. Допустим, что траектория разбита на ряд дискретных шагов по времени. Обозначим точки, через которые траектория проходит в отмеченные мо- менты времени, соответственно через xit х2, ..., х4, ..., как показано на рис. 4. Между точками деления мы заменим каждую траек- торию отрезком классического пути. Иными словами, мы вообразим, что частица проходит через точки деле- ния, а между точками деления движется как классиче- ская частица под действием потенциального поля в со- ответствующих точках пространства и времени. Таким образом, на отрезке пути между точками (x<t /<) и
Квантовая механика 261 (Xi+i, ti+i) действие равно ‘i J” ^класс. dt = ‘seX-lto — х,-_,)/£, (Xf + x^j)#; (it + /Z-i)/2] (9) и для всякой траектории действие вдоль всей траекто- рии приблизительно равно S = е 2 £ |(х, - x.-0/e, (xt + х^/2, (tt + /,-0/2]. (10) is 1 Теперь полная амплитуда вероятности движения ча- стицы из начальной точки а в конечную точку b полу- чается интегрированием по всем значениям х в точках деления. Таким образом, К(b,a)— lim J ... J ехр £кдасс.dt dxx ... dxN_x, (П) где начальная и конечная точки х0 и xN фиксированы и совпадают с ха и хъ, а число делений равно W= = (tb—Для лагранжианов, квадратичных по ско- ростям, все интегралы сводятся к гауссовым квадрату- рам, и, таким образом, их можно вычислить. Однако при переходе к пределу при е->-0 мы с ужасом обна- ружим, что функция, определенная уравнением (11), расходится. Очевидно, что требуется некоторый норми- рующий множитель. В определении обычного интеграла Римана мы скла- дываем ординаты дискретного множества точек и рас- сматриваем предел, когда число точек стремится к бес- конечности. Однако мы должны всегда умножить эту сумму на расстояние между точками, чтобы избежать расходимости. В случае интеграла по траектории мы должны умножить кратный интеграл на (^Afe/m)-*'2. Вы, возможно, заметили, что в определении инте- грала по траектории молчаливо подразумевается, что пути могут быть разбиты по времени и результаты по- следовательно складываются. Иными словами, мы поль- зуемся тем принципом, что амплитуда вероятности
282 Приложений II событий, происходящих последовательно во времени, получается как произведение амплитуд для каждого из двух событий. Отсюда получаем уравнение K(b, а)= f К(Ъ, с) К (С. a)dxc. (12) — <х Этот результат справедлив всегда, когда действие само может быть разделено, т. е. всякий раз, когда действие вдоль пути от одной точки до другой может быть пред- ставлено как сумма двух действий: от начальной точки до некоторой промежуточной точки и от этой точки до конечной. Поскольку действие входит в показатель экс- поненты для амплитуды, мы видим, откуда получается формула с произведением. В релятивистской квантовой механике этот результат так непосредственно не получается. Здесь движение электрона определяется полем фотонов, сквозь которое он движется. Кроме того, электроны испускают вирту- альные фотоны и затем при своем дальнейшем движе- нии снова их поглощают. Таким образом, полное опи- сание системы в произвольный момент времени требует указания не только положения и импульса электронов, но также и состояния полного электромагнитного поля, окружающего электрон; тем самым вводится зависи- мость от предыдущего движения электрона. Описанный подход к квантовой механике (при по- мощи интеграла по траекториям) помогает легко по- нять классическое описание движения больших масс. Пусть, например, рассматривается движение массы бил- лиардного шара. Для каждого возможного пути из на- чальной точки движения в конечную существует ампли- туда вероятности, пропорциональная экспоненте, где в показателе стоит действие, умноженное па i и делен- ное на Л. При очень больших массах действие чрезвы- чайно велико по сравнению с Л. Всякое небольшое из- менение пути приводит к очень большому изменению отношения действия к h и тем самым к бешеной осцил- ляции амплитуды между +1 и —1. Таким образом, при сложении амплитуд всех близких путей эти амплитуды гасят друг друга, так что в результате получается нуль.
Квантовая механики 21м Однако в окрестности одной особой траектории, а имен- но в окрестности траектории, где действие экстремаль- но, дело обстоит иначе. Здесь малое отклонение траек- тории приводит к незначительному изменению действия. В этой области просуммированные амплитуды будут интерферировать так, что результат окажется ненуле- вым. Таким образом, только вдоль пути, для которого действие экстремально, амплитуда будет заметно отли- чаться от нуля. Но это есть в точности классический результат, а именно: всякое тело движется по пути наименьшего действия. Вам, возможно, приходилось иногда слышать о ве- личине, называемой волновой функцией и являющейся решением волнового уравнения Шредингера. Оказы- вается, что амплитуда, которую мы записали в виде (8), сама является волновой функцией специального типа и удовлетворяет волновому уравнению Шредингера. Это уравнение, которое является, возможно, самым важным сегодня сведено к виду математическим утверждением, было Это операторное (14) Еф = Нф. (13) Это операторное уравнение, и его кажущаяся простота несколько обманчива. Здесь Е — оператор энергии, Я — оператор Гамильтона. Для частицы, движущейся в од- номерном пространстве под действием потенциала V(x, t), это уравнение принимает вид i dt ~ 2m Ox3 + ” ^X' Его решением являются волновые функции ф(х, /), за- висящие от х (положение в пространстве) и t (время). Эта волновая функция представляет собой на самом деле специального вида амплитуду вероятности, опре- деленную формулой (8); она получается, когда началь- ная точка ха, ta опущена в определении и остается только конечная точка. Такие амплитуды полезны в тех случаях, когда прошлая история частицы несущественна и нам нужно знать лишь некоторую функцию, которая описывает положение частицы в данный момент и в дан- ном месте.
264 Приложение II То, что амплитуда вероятности, определенная с по- мощью интеграла по траекториям, удовлетворяет урав- нению Шредингера, можно доказать, исследуя, как ме- няется амплитуда за очень короткий промежуток вре- мени и на очень малых расстояниях в пространстве. Со- гласно правилу перемножения амплитуд для событий, происходящих в последовательные промежутки вре- мени, мы напишем •*!• Л) = = f К(х2, хг — 1, t2)K(x2 — Z, t2, xv tjdi. (15) Первый множитель под знаком интеграла может быть записан в виде Л'’ехр[-^г-ту^’ М (16) с точностью до первого порядка по 8 и второго порядка по Второй множитель может быть разложен в ряд Тейлора по Z, и тогда интегрирование по £ даст все не- обходимые члены. Если левую часть уравнения (15) разложить в ряд Тейлора по 8, то можно затем приравнять члены одина- кового порядка по б. Приравнивая члены нулевого порядка по б, мы уви- дим, что нормирующая константа, которая вводится, чтобы обеспечить сходимость выражения (11), действи- тельно определяется формулой А = У (2л/Ле)//п. (17) Приравнивая члены первого порядка по б, мы полу- чим волновое уравнение Шредингера, где все призвод- ные берутся по переменным, относящимся к конечной точке. (Несколько изменений знака приводят к урав- нению, связывающему производные по переменным, от- носящимся к начальной точке.) Определение интеграла по траектории, записанное формулой (Н), на самом деле довольно неудобно для практического использования. К счастью, существует
Квантовая механика 265 другой технический прием, вполне пригодный для боль- шинства квантовомеханических задач. Сделаем замену переменных, полагая х=х+у, где х—траектория, про- ходящая через заданные конечные точки, вдоль которой действие S экстремально. Тогда у обращается в нуль в концах. Сделаем эту замену в лагранжиане L и рас- смотрим его интеграл вдоль какой-нибудь траектории. Этот интеграл равен, конечно, действию вдоль этой тра- ектории, и, поскольку х определяется как траектория, вдоль которой действие S экстремально, все члены, со- держащие у в первой степени, должны при интегриро- вании исчезнуть. Следовательно, в том частном случае, когда лагранжиан L является квадратичным по про- странственным переменным, после интегрирования не может остаться членов, содержащих смешанные произ- ведения вида ху. В результате мы получаем, что в этом случае действие по любой траектории разбивается в сум- му двух действий, а именно — *^класс. И + S'M- (18) Здесь 5класс. — действие вдоль траектории, по которой частица должна была бы двигаться по классическим за- конам, т. е. классическое действие, a S' — дополнитель- ное действие, зависящее только от отклонения у от классической траектории. Поскольку траектория х фиксирована, при сумми- ровании изменяется только у. Таким образом, интеграл по траекториям может быть записан в виде » K(b, a) = f ехр а 'ъ Т f Ldi 'а О = f ехр [j ($класс. + S')] Ю = о о = ехр (4 $класс.) f ехр (4$' |t/j) 3y(t). (19) &X(t) = Здесь мы видим, что интегрирование по траекториям распространяется только на те траектории, которые
266 Приложение П начинаются и кончаются в нуле. Таким образом, нам удалось вытащить за знак интеграла множитель, в ко- тором содержится вся зависимость амплитуды от кон- цов траекторий а и Ь. Далее, легко показать, что если лагранжиан явно не зависит от времени, то оставшийся интеграл по траекториям может зависеть только от промежутка времени tb — /о, но не от самих абсолют- ных значений начального и конечного моментов вре- мени. Конечно, выражение (19) все еще содержит инте- грал по траекториям, который нужно вычислять. Одна- ко для большого числа важных и интересных задач мно- житель, стоящий перед знаком интеграла, заключает наиболее существенные физические сведения, а инте- грал по траекториям играет роль немногим большую, чем нормирующая константа. Действительно, во мно- гих случаях абсолютная величина этого интеграла мо- жет быть фактически найдена как нормирующая кон- станта для известного уже распределения вероятностей, по крайней мере с точностью до неизвестного, но и не- существенного фазового множителя [т. е. exp(Zd), где б — постоянная фаза]. В других случаях оставшийся интеграл по траекториям можно иногда вычислить, рас- сматривая частный случай задачи, который может сов- падать с предыдущим примером. Например, в случае гармонического осциллятора вид этого интеграла мо- жет быть определен при помощи обращения к частному случаю осциллятора с пулевой частотой, т. е. к случаю, когда гармонический осциллятор совпадает со свобод- ной частицей. Если же никакие из этих трюков не по- могут, мы всегда можем вернуться к определению, за- данному формулой (11). В заключение этой статьи я приведу краткое описа- ние одного метода использования интеграла по траекто- риям для определения наинизшего энергетического уровня квантовомеханической системы. Существует уже много технических приемов для такого вычисления. Ве- роятно, самый известный из них — это вариационный метод Рэлея — Ритца. Прежде всего допустим, что мы определяем произвольное стационарное состояние си- стемы. Такие состояния, если они существуют, являются
Квантовая механика 267 собственными функциями <р„ уравнения Шредингера -7-^ = ^ (20) с собственными значениями Еп. Итак, мы можем напи- сать £яфя = Лфя- (21) Всякое решение уравнения Шредингера может быть представлено в виде ряда из собственных функций Ф = S С,ФЯ ехр (— iE„tlh). (22) п Допустим теперь, что мы всюду в нашей задаче делаем замену 4-й—т. Мы получим те же самые собственные функции н собственные значения, и всякое решение уравнения Шредингера запишется по-прежнему в виде ряда из собственных функций. Но теперь этот ряд при- мет вид Ф = 2 сяфя ехр (— £„т/Л). (23) II Если мы выберем т достаточно большим (скажем, рав- ным Г), то в выражение (23) все больший и больший вклад будет давать первый член: Ф^соф„ехр(—£0Г/А). (24) Но мы уже знаем, что всякое решение уравнений Шредингера выражается через интеграл по траекто- риям. Таким образом, можно записать г Ф = J ехр (S/А) $х (т), (25) о и если мы вычислим этот интеграл для достаточно боль- ших значении Г, то результат будет пропорционален ехр(—Е0Т/ h). Вычисление интеграла может оказаться очень труд- ным, если S— достаточно сложная функция. Мы укажем
268 Приложение II сейчас прием, позволяющий получить хорошую оценку значений этого интеграла при помощи искусственно построенной функции действия. Обозначим это новое действие через S( и постараемся подобрать его так, чтобы оно было настолько близко к исходному дей- ствию S, насколько это возможно, и в то же время при- водило к вычисляемому интегралу по траекториям. Перепишем интеграл по траекториям в виде г Ф = J ехр (S/H) 3)х (х) = о г = f ехр RS - $,)//>] ехр (S./й) Зх (т) (26) о и определим «среднее значение» функционала F следую- щим образом: f F ехр (S/й) (т) <F) = . (27) J ехр(5/й)#х(т) Обратимся теперь к одной важной и хорошо известной лемме: для всякого среднего, определяемого с помощью положительной весовой функции, выполняется неравен- ство (ехр F} > ехр (F). (28) Воспользовавшись определением среднего по фор- муле (27), определим энергию Е соотношением г fехр (т ~ si>)ехр (тг) ~ ехр ЕТ^’ о Тогда из указанной леммы следует, что (30) Таким образом, независимо от выбора получающееся значение Е всегда превосходит истинный нижний уро- вень энергии Ер. Чем меньшее значение мы найдем для
Квантовая механика 269 £, тем лучшую оценку получим для £0. Для того чтобы вычислить £, мы должны вычислить два интеграла по траекториям г J ехр (Sj/й) S&x (т) = ехр (— EJ/h), о т f (S-S1)exp(Sl/A)3!x(T) = о г = <S - S,) f ехр (5,/Л) 3>х (т). (31) о При искусном выборе St эти интегралы можно вычис- лить даже несмотря на то, что интеграл (25) не вычис- ляется. Мы можем несколько усовершенствовать этот прием, выбирая Si так, чтобы оно зависело от нескольких не- определенных параметров. Затем, вычислив £ как функ- цию этих параметров, мы можем, варьируя их, найти минимум £ и тем самым улучшить оценку для £о. В этой статье я попытался, следуя профессору Кацу, описать различного рода вероятностные меры и объяс- нить те особенности, которыми обладает мера, исполь- зуемая в квантовой механике; я также слегка коснулся новых вероятностных понятий, которые, по-видимому, должны быть приспособлены для объяснения поведения элементарных частиц, существующих в природе. Я по- казал, каким образом эта мера и соответствующий ей интеграл могут быть использованы не только для ре- шения задач, возникающих в квантовой механике, но и для более глубокого понимания основных физических законов. Изложенный здесь метод интегралов по траек- ториям не привел пока ни к каким ошеломляющим от- крытиям в области квантовой механики, однако во мно- гих случаях (например, в последнем примере) эта тех- ника может привести к лучшим результатам, чем преж- ние приемы, со значительно меньшей затратой сил. Но, может быть, наиболее существенно в этом подходе то,
Z1Q Приложение П что он улучшает наше интуитивное представление о при- роде. По поводу изложенного в этой статье см.: Feyn- man R., The concept of probability in quantum mecha- nics, Proc, of the Second Berkeley Symposium on Mathe- matical Statistics and Probability, p. 533; The space-time approach to non-relativistic quantum mechanics, Rev. Modern Phys., 20 (1948), 367; Slow electrons in a polar crystal, Phys. Rev., 97 (1955), 660.
ПРИЛОЖЕНИЕ III ТЕОРИЯ ВАН-ДЕР-ВААЛЬСА О РАРН9РГСИИ МЕЖДУ ГАЗОМ И ЖИДКОСТЬЮ*) М. КАЦ, Г. Е. УЛЕНБЕК, П. К. ХЕММЕР Часть I ИЗУЧЕНИЕ ОДНОМЕРНОЙ МОДЕЛИ 1. Введение В этой серии статей мы хотим вновь обсудить старую теорию Ван-дер-Ваальса •) **) о переходе вещества из газообразного состояния в жидкое. Как известно, наи- большая заслуга этой теории состоит в том, что она впервые, исходя из представлений кинетической теории, дала качественную интерпретацию явления конденсации, а также существования критической точки. С другой сто- роны, оказалось очень трудно сделать эту теорию более строгой; поэтому в современной теории 2) уравнения со- стояния нендеального газа следуют чаще всего идее Ка- мерлинга Оннеса о представлении всех величин для неидеального газа в виде ряда по степеням плотности — так называемого вириального разложения. Этим спосо- бом можно последовательно учитывать взаимодействие двух, трех, четырех и т. д. частиц и вывести точные вы- ражения для последовательных отклонений от законов идеального газа в терминах межмолекулярного потен- циала. Делалось много попыток3), однако до сих пор совершенно безуспешных, построить строгую теорию фа- зовых переходов с помощью таких разложений. На са- мом деле мы думаем, что такое построение выполнить очень трудно, если вообще возможно4), поэтому нам кажется целесообразной попытка переформулировать бо- лее строгим образом основные идеи Ван-дер-Ваальса. *) К ас М„ Uhlenbeck G. Е., Hem mer Р. С., On the van der Waals theory of the vapor-liquid equilibrium. I. Discussion of a onedimensional model, II. Discussion of the distribution functions, III Discussion of the critical region, Journal of Mathematical Physics, 4, 2 (1963), 216—228, 229—247; 5, 1 (1964), 60—74. **) Примечания авторов см. в конце каждой части.— Прим. ред.
272 Приложение III Мы старались это сделать, исходя раз и навсегда из модели одномерного газа, предложенной М. Кацем5); для этой модели все вычисления могут быть выполнены точно. Вот описание этой модели: в отрезке длины L движутся W частиц с парным взаимодействием, описы- ваемым экспоненциальным притягивающим потенциалом Рис. 1. Потенциал взаимодействия ф(х). ф(х) с твердой сердцевиной размера б (рис. 1). Для этой модели можно точно исследовать статистический инте- грал в термодинамическом пределе L-^oo, N-^ao, l=L/N — конечно. Как было показано ранее Кацем, за- дача отыскания этого предела может быть сведена к ис- следованию линейного интегрального уравнения с поло- жительно определенным ядром Гильберта—Шмидта. Наибольшее собственное значение этого ядра определяет термодинамический потенциал (гиббсовскую свободную энергию) системы. Этот результат воспроизводится в п. 2. Для конечных у [у — показатель экспоненты потенциа- ла ф(х), ф(х)=—ye-0**, х>б], т. е. при конечном радиу- се действия сил притяжения, в системе не происходит фазовых переходов, в соответствии со всеми известными ранее результатами ®) для одномерных систем. Однако, если положить а=аоу и затем устремить у к нулю (т. е. рассмотреть слабые, но очень дальнодействующие силы) ОО гак, чтобы при этом интеграл J* dx фпр. (х) о
Теория Ван-дер-Ваальса. I 273 оставался конечным (мы будем называть это ван-дер- ваальсовским пределом), то возникнет фазовый пере- ход, описываемый в точности уравнением Ван-дер-Ва- альса р= kT—^2- (1) г /—б р и; в сочетании с хорошо известным правилом Максвелла7). Все это подробно показано в п. 3. В п. 4 при указанном предельном переходе найдены все собственные функции и собственные значения ин- тегрального уравнения Каца. Это сделано с помощью теории возмущений, причем за малый параметр вы- брано уб. Фазовый переход соответствует двойному вырождению наибольшего собственного значения; этот эффект сохраняется в членах любой конечной степени относительно уб. Следует заметить, что это разложе- ние справедливо только вдали от критической точки. Область вблизи критической точки требует особого ис- следования; мы приведем его в третьей статье этой серии. В последнем пункте обсуждается применимость на- ших результатов к трехмерной задаче и их связь с обыч- ным выводом уравнения Ван-дер-Ваальса. 2. Интегральное уравнение Каца Статистическая сумма для нашего одномерного газа имеет вид Z(Z. т. 0 Xexpf— -k L L = > (Л Л» HI J J L ... fd^ ...dtNX 0 KJ ^..d^exp v X . KJ хЦ>(|/< —0D« (2) KJ 18 М. Кац
274 Приложение HI где Л2 = Л2/2птЛ7’, v = a.lkT и ступенчатая функция S(x) определяется так: с/ _|° при 1х1<6’ Х — I 1 при |х| > б. Поскольку подинтегральное выражение симметрично относительно переменных /2, • •., G, а твердая сердце- вина устанавливает линейный порядок частиц в L, мы можем переписать формулу (2) в виде -1-ЛГу Z(L, T,N) = ±_p_ f...f dtx...dtNX o<tl<ti< ... <lfil <L X exp NN -1 ЛГ-1 t=i j=i >=* (3) Притягивающая часть подинтегрального выражения так- же может быть упорядочена, если воспользоваться ра- венством ехр ехр (—YK—*/1) = I"... f dxi ... dxN ехр |v'/> (х, + ... -|- xiV)| X — ОО X^(Xj) JJP(x7|xy+1, t)+l-tj), (4) /=1 где и7(х)=ткехр[_-M' P(x| у, /) = [(2n(l-e-2v')},/‘]"1X X exp|—(у — x<?-v')2/2(l — <?"2v')|- (5) Мотивировкой и доказательством тождества (4) слу- жит замечание, что ехр(—yl—/>|) есть корреляционная функция для одномерного гауссовского марковского про-
Теория Ван-дер-Ваальса. / 275 цесса (так называемый О-У-процесс); разумеется, это равенство может быть доказано и непосредственно. Под- ставляя (4) в (3) и применяя преобразование Лапласа по L, мы увидим, что интеграл Je~sLZ(L, Т, N)dL о можно переписать в виде f dLe~sL f dix fdt2fdta... f dtN Ц F} (tJ+1 -t,) = о о ft Z7V-1 ; = 1 co co co co N — 1 =fdt, fdt2... f dtN f dLe~sL ПFt(/y+I -/y), (6) о tN_x tN 7=1 где каждое переменное tj входит в разности только с со- седним переменным tj_x или ti+x. Полагая Л = тг ^2==Т1 + Т2’ •••> ^№=Т1“Ь т2+ • • • Ч-ТЛГ> Z, = Tj-|-т2... -Н xN + ^+1, легко показать, что выражение (6) принимает вид ТУ— 1 оо 7=1 о Подставляя сюда соответствующее выражение дляГДг), мы получаем (опуская теперь переменную темпера- туры Т) с 1 e-№/2 Г ” С f dLe~sLZ(L, W) =7^-45— J fdx, ... dJC^X О --о N-t X exp |v'/« (x, + ... -I- Xjv)) F(X; - П A <xi I <7) 7=1 18'
Приложение III где РЛХI У) = / dx е-^Р (х I у, т). (8) б То, что Xi упорядочены в последовательные пары, наво- дит на мысль рассмотреть ядро Ks(x, y)=W(х)Ps{хl?/ехрГ|v1/»(х + i/)l (9) ' [17(х) W(у)]/’ EL2 v v ’ и соответствующее интегральное уравнение, предложен- ное впервые М. Кацем: f dyKs(x, = (10) Легко видеть, что К, (х, у) симметрично, и, кроме того, можно показать (доказательство см. в работе Каца, ука- занной в примечании 5), что: (а) ядро Кз (х, у) положительно определено, т. е. квадратичная форма f f Ks(x, y)ty(x)ty(y)dxdy всегда положительна для любой функции ф(х), отлич- ной от тождественного нуля; (б) К»(х, у)—ядро Гильберта — Шмидта, т. е. f J Ki (х, у) dx dy < оо. Из этих двух свойств можно вывести, что уравнение (10) имеет дискретное множество положительных собствен- ных значений Х<($), начинающихся с наибольшего соб- ственного значения Хо($) и стремящихся к нулю при /-►оо; при этом соответствующие собственные функции ф{(х, $) образуют полную ортонормированную систему и ядро К«(х, у) может быть разложено в сходящийся ряд Ks(x, !0в^М*)1>/(*» s)^(jy, s). (П)
Теория Ван-дер-Ваальса. ! Переписывая уравнение (7) в виде fdle-siZ(L, /V) = о —2^ 00 г i/f , = ~ANS2 J ” ’ ••• dXN^P [V(X1 +**)jX —co AT XIWW П«A*» Xj+i) и используя разложение (11), проинтегрируем по х2, хз, .. ., Хдг-Г, мы получим J dLe~tLZ(L, N) = 1 (s) A2J, (12) О j =0 где Aj= f dx^j(x, s)W'h(x)e'i>v^. (13) —ОО Если теперь образовать большую статистическую сумму G(L, г) = SZ(£, N)(Az)N, (14) ЛГ=1 то из уравнения (12) следует равенство со t 2 fdLe--O(L, (15) в предположении, что z<e,/»v/Xo(s). .Ясно поэтому, что граница сходимости преобразования Лапласа функции G(L, z) совпадает с тем значением $, при котором z = e'^lKa(s). (16)
278 Приложение III Поскольку, с другой стороны, эта граница равна также пределу lim 4-In G (£, г), (17) который имеет термодинамический смысл величины ptkT, то связь между z и давлением газа задается формулой l0(PlkT)^e'^lz. (18) Далее, поскольку z имеет термодинамический смысл ак- тивности, которая связана с химическим потенциалом (гиббсовской свободной энергией на одну частицу) ц (р, Г) соотношением P==mn(Az), (19) то отсюда получается уравнение состояния: I=(дц/др)т = - ^ (з)Д0 (з), s=p/kT, (20) где штрих означает дифференцирование по s. Можно доказать следующие утверждения, касаю- щиеся наибольшего собственного значения Ао($), а так- же всего спектра собственных значений Ms) (см. при- ложение I): (а) все собственные значения являются монотонно убывающими функциями s и стремятся к нулю при з->оо; (б) наибольшее собственное значение ko(s) уходит в бесконечность при з->0. Ни при каком значении s оно не вырождено (однократно) и является аналитической функцией от з для всех вещественных s>0. Наконец, вы- полняется неравенство [^(з)]а-ко (з)^(з) <0, (21) из которого следует, что производная ко ($) всегда поло- жительна; (в) все другие собственные значения конечны при з=0. Кажется весьма правдоподобным, что кривые Ms), (>0, также не пересекаются друг с другом, и в этом
Теория Ван-дер-Ваальса. I 279 случае спектр как функцию от s можно изобразить, как показано на рис. 2. Можно вывести, что для всякого z существует един- ственное значение а, удовлетворяющее уравнению (16), а из уравнений (20) и (21) тогда следует, что I— моно- тонно убывающая и аналитическая функция от s=~p/kT для всех положительных s. Это означает отсутствие фа- зового перехода. Заметим, что в этой теории получается явное выражение [см. (18) и (19)] для гиббсовской сво- бодной энергии как функция давления, и поэтому удель- ный «объем» (точнее, удельная длина) I получается как функция давления, а не давление выражается в виде функции от /, как в теории Майера. Поэтому связь с ви- риальным разложением для уравнения состояния доста- точно сложна. Можно показать, что наибольшее соб- ственное значение М$) допускает разложение ko(s) = e,/.v(S-i_|_ao_|_aiS_|_a;}S2_|_ .(22) Коэффициенты а{ можно вычислять последовательно, и они связаны с майеровскими групповыми интеграла- ми bi. Находим во = &2» ^1 = ^з — Ьг (23) и т. д. За доказательством мы снова отсылаем к при- ложению 1. С помощью уравнений (22) н (23) можно
280 Приложение III затем проверить, что уравнение состояния (20) для не- больших значений давления есть просто обращение обычного вириального разложения pllkT= 1 +ВЦ + С/Р + ..., где В = — Ь2, С=—2Ьз+АЬ2 и т. д. Мы не в состоянии как-либо просто «графологически» охарактеризовать коэффициенты 3. Ван-дер-ваальсовский предел Мы выясним теперь, что происходит с наибольшим собственным значением Xo(s), если положить а=аоу и перейти к пределу при у-*0. Чтобы сделать это, мы ис- следуем моменты распределения собственных значений X,(s). Имеем СО = J ... fdXi ... dxnKs(Xi, X2)KS{X2, л3)... I -co оо ... Ks(xn, xt) = f... fdx,...dx„X — CO co Xexp[—(v0#(x1+x2+---------h-Ul f ••• fdxi - dr„x 6 Л Xexp[— s(Tj+ ... 4-t„)] П P(*/I*/+1. T/)- i=l где vo=a,o/kT и xn+i=Xi. Можно выполнить интегриро- вание no Xi, а затем исследовать, что происходит в пре- деле при у-*•(). Необходимые подробности содержатся в приложении 2. Ответ дается следующей теоремой. При у->0 имеем Y i -со (СО \ П ехр [т] (2у0),/ж] f dx ехр [— эт — у (£2 + П2) т] I • (24) « /
Теория Ван-дер-Ваальса. / 281 Изложим теперь дальнейшие эвристические соображе- ния. Положим СО f ft» Т|) = ехр [л (2v0)%] f dt ехр [— st - ± ft» + if) т]; 6 (25) поскольку равенство (24) имеет место для всех п, мож- но ожидать, что для всякой «хорошей» функции g(x) существует предел __ со v2^) = -SF f f ‘Mgl/tb T|)J. (26) ^“*0 l -co Возьмем теперь в качестве g(x) ступенчатую функцию {1 при а < х < ₽, 0 для остальных х, и пусть Л'т (а, Р) — число собственных значений между а и Р; из уравнения (26) вытекает, что = (27) Sa3 —площадь области на плоскости (g, т]), где a<f(£< л) <₽• Допустим, что fft, т)) имеет абсолютный максимум ©(s); тогда очевидно, что ©(s) при у-*0 дол- жна быть предельной точкой последовательности соб- ственных значений, так как во всяком интервале между ©—е и © должно оказаться в пределе при у->0 беско- нечно много собственных значений, поскольку площадь области ©—e<f(^, 1))<© конечна. Поэтому кажется есте- ственным ожидать, что ©(s) при у->0 является наи- большим собственным значением или, иначе, что lim%0(s, Y) = ©(s) = max/ft, i)) = maxF(ii), (28) v->o 11) i) где F(i])=/(0, л) = = exp [— 6 (s+у if) — In (s + -j if) + Я (2v0)v’],
£82 Приложение III поскольку максимум функций /(£, т]) всегда достигается при £=0. Заметим, что наше рассуждение на самом деле еще не доказывает, что из уравнения (27) следует равенство (28), поскольку (27) не исключает, что несколько ди- скретных собственных значений оказывается больше <o(s) при у->0. Однако уравнение (28) правильно, и рас- суждение можно сделаль вполне строгим. Мы здесь не будем этого делать, потому что в следующем пункте мы подробно исследуем предельный переход при у-*0 и получим строгое доказательство уравнения (28). Для дальнейшего рассмотрения формулы (28) заме- тим сначала, что значение n(s), ПРИ котором дости- гается максимум F(t])> удовлетворяет уравнению Л (п)[б +1 Дд 4-1T1J | = (2v0;A. (29) Уравнение df,/di\=O приводит к равенству s + 4^ = il1 ±(1-856)4 (30) Здесь мы должны различать два случая: (а) 8$б>1. В этом случае М'1) — монотонно возра- стающая функция т], и уравнение (29) имеет единствен- ное решение r|(s); ему соответствует единственный мак- симум F(t|). Уравнение состояния принимает вид -<>'($) _ . 1 _ (2v0)'/« зп Z--JHSr- + 6 + 7—Т—Т—Ь n(s) (31) [в последнем равенстве мы использовали уравнение (29)]. Подставляя s=plkT и tj(s) = (2vo)77/ в уравнение (29), мы получим уравнение Ван-дер-Ваальса кТ (б) 8s6< 1. В этом случае функция f,(r|) имеет мак- симум и минимум (рис. 3), и легко проверить, что для S=*/86 МЫ имеем /mln=fmax= (3/г) (Зб)7’ И ЧТО fmln И fmax монотонно возрастают для убывающих $; при этом
Теория Ван-дер-Ваальса. 1 283 fmin остается конечным, в то время как fmax стремится к бесконечности при s -* 0. Если теперь (2V0)7’ < /min, то снова существует толь- ко одно решение уравнения (29), соответствующее един- ственному максимуму функции F{t\)- То же самое будет при (2vo) ,/j>fmax. Однако если fmln< (2v0) '2</тах, ТО уравнение (29) имеет три корня; два крайних соответ- Рис. 4. Наибольшее собственное значение в ван-дер-ваальсовском пределе для температуры ниже критической. ствуют локальным максимумам функции Е(т]), а вну- тренний — ее локальному минимуму. Мы должны теперь выбрать тот из двух локальных максимумов, который служит абсолютным максимумом F(r\). Очевидно, что если менять v0 при фиксированном s или менять s (не нарушая неравенства 8s6< 1) при фиксированном vo, то
284 Приложение HI найдется такое значение s(vo), при котором оба макси- мума совпадут. При этом значении s нарушается анали- тическое поведение a(s), поскольку т) (s) мгновенно пе- репрыгивает с ветви 1 кривой на ветвь 2 (рис. 3). На самом деле можно показать, что при s=s производ- ная ©(s) имеет разрыв и, поскольку 1=—w/(s)/w(s), на соответствующей изотерме имеется горизонтальный уча- сток (рис. 4 и 5). Далее, поскольку уравнение (31) остается верным, как жидкая, так и газообразная часть по-прежнему описывается уравнением Ван-дер-Ваальса. Рис. 5. Изотерма, соответствующая рис. 4. Наконец, равенство максимумов F(r\) при s=s или двух значений w(s) означает равенство гиббсовских свобод- ных энергий обеих фаз при s=s, что в свою очередь эквивалентно правилу Максвелла. Критическая точка определяется из уравнений 8sKp б = 1, (2укр.)'л = /mln ($кр.) = /т„ ($кр.) = 4 (36)*. Это приводит к хорошо известной формуле т\р. = 3б; Лр. = 0^2762; kTKf. = 8а0/27б. (32) 4. Собственные функции и собственные значения при малых у Очевидно, что причина, по которой при малых у соб- ственные значения Хп(«, у) уравнения Каца сгущаются около точки w(s), должна быть связана с тем обстоя- тельством, что при у->0 функция P(x\y,t) приближает-
Теория Ван-дер-Ваальса. 7 285 ся к 6-функции Дирака 6(х — у). Однако если допустить, что при у-»-0 собственные функции фп(х, s, у) сосредо- точиваются в окрестности х=0, как в обычной задаче о собственных значениях, то из уравнения (10) следова- ло бы, что при у-► 0 собственные значения должны груп- пироваться около e~,6/s — максимального собственного значения для газа из твердых палочек. Этого противоре- чия можно избежать, только если считать, что при у -* 0 собственные функции располагаются все дальше и дальше от начала координат. В этом обстоятельстве ключ к построению согласованных последовательных приближений для собственных функций и собственных значений при малых у- В основном интегральном уравнении (10) сделаем подстановку х = х' + т1(2/у),,\ y = y' + n(2/Y),/*. (33) где t] = t](s)—то значение т), при котором функция F(r), s), определенная формулой (28), достигает своего абсолютного максимума. Рассмотрим сначала однофа- зовую область, так что т) (s) единственно. Пусть Й(х,)=ф[х' + Л(2/У)'/’]. (34) Тогда уравнение (10) можно переписать в виде exp[rI(2v0),/’] f dy' pfr [ -^ ]% P (x' | y', t)X- —00 6 Xexp [— st —-у-th (^.) + (Z + y,)±!^_ - i (y),A th (-г) +У'>]h № = u (*')• (35) Теперь ясно, что P(x'\y', т) -*-t>(x'—у') при y~*-0, если Л (л/) сосредоточена около х'=0. Собственные значения стремятся к величине ехр [т] (2v0),/’] f drехр J -st —^-] = co (s), 6 как и ожидалось. Мы можем сказать, что при помощи подстановки (33) интегральное уравнение «приспосабли-
286 Приложение HI вается» к разложению вида X = G)(S) {1 -|-Ц<1’у-|-ц2у2_|- . Л (х') = Л<®> (х') + у'/«Л< > > (х') + уЛ(2) (*')+••.• (36) Поскольку выкладки здесь довольно сложны, мы просто укажем, как это делается. В левой части уравнения (35) мы полагаем у' = х'<?-*т-|-С(1 — е-^),,г и разлагаем все подинтегральное выражение в ряд по степеням у7». Интегрирование по £ сводится к гауссовым квадратурам, а интегралы по т могут быть выражены с помощью w(s) и ее производных. Если ограничиться раз- ложением до порядка у”1 и сократить на общий множи- тель (о (s), то левая часть уравнения (35) примет вид Л (х') + У/ [Л" (х') + Л (л) (1 -1X'2 + 4- х'\ U - 6)2)] + + [¥- (I - 6)2] [j х'3Л (х') (1 - (/ - б)) - — у x'h, (л') — Л' (л') — л'Л" (лЭ] • где мы воспользовались формулой (31), чтобы выразить •q(s) через I. Если теперь подставить разложения (36) в обе части уравнения (35) и приравнять одинаковые степени у71, то мы получим в нулевом приближении ^+[т(т-|*,”)-4]я‘”и)=о- <37> где использованы обозначения В2 = Р - 2v0 (/ — б)2//, л' = z (1/В)>1г, hw(x') = H^(z). (38) Уравнение (37) есть уравнение для функций Вебера, и отсюда можно заключить, что ц(П = 1|/-(2/Ц-1)В], H^{z) = NhDn(z), (39)
Теория Ван-дер-Ваальса. I 287 где Nn — нормирующий множитель (Bf2.nl)'1* (л!)-1/». За- метим, что величина В связана с сжимаемостью газа, по- скольку из уравнения Ван-дер-Ваальса получаем 52 = [ /2(/_ 6)* -], др i kT J \dl )т' (40) В однофазовой области производная dp/dl всегда отри- цательна, и поэтому В можно выбрать положительным. Наибольшее собственное значение соответствует поэто- му л=0, и мы получаем в первом приближении Y)=®(s)[l +4v(( — 5)]- (41) Это доказывает утверждение п. 3, что наибольшее ственное значение в ван-дер-ваальсовском пределе няется co(s). В первом приближении мы получаем —+ (“+?-Тг)/л = “7^—5Г+ соб- рав- бЛ’В’'» ^(<-6)2 / / vJ’(/-6)3(/-36) 3 (0) \2В п 2) а гП"' (42) Можно без труда проверить, что правая часть здесь ор- тогональна Н(п\ так что уравнение (42) имеет единствен- ное решение. Явный вид этого решения, а также второго приближения, которые нам понадобятся в следующей статье этой серии, приведены в приложении 3. Рассмотрим теперь двухфазовую область. Ясно, что в этом случае наше рассуждение следует уточнить, поскольку выбор T)(s) в подстановке (33) те- перь неединствен. Действительно, так как F(r], s) имеет теперь два равных максимума, существуют два значения r](s), соответствующие предельным объемам Ц и /2 для насыщенных газообразной и жидкой фаз (рис. 5). Для каждого из этих двух значений можно произвести за- мену (33) и повторить все наши рассуждения. Очевидно, что в обоих случаях мы придем к одной и той же ве- личине w(s) собственного значения нулевого порядка, но получим разные собственные функции, поскольку
288 Приложение HI величина l/В различна для lt и 12. Мы можем сказать, следовательно, что для 12<1<1\, т. е. в двухфазовой об- ласти, наибольшее собственное значение в ван-дер-ва- альсовском пределе дважды выррждено (двукратно) и в наименьшем порядке собственная функция имеет вид [поскольку О0(г) = ехр[—Tz2)]: +<W«₽[-&('-чж <*> где _ _ rii(s) = (2v0),/’//i и n2(s) = (2v0)'/74- Возникает вопрос, какая линейная комбинация соот- ветствует удельной длине (где £i и & —мо- лярные доли жидкой и газообразной фаз), так что Si+b=l- Мы увидим, что = = 4 (44) Чтобы доказать это, заметим сначала, что при малых у две гауссовы функции в (43) не перекрываются. Следо- вательно, для нормированной собственной функции ф(х, з) получаем aj +а* = 1. Далее, для всякого конеч- ного у из уравнения Каца следует, что Ms, V) = f f dxdyKs(x, у)Ф0(*. Y)to(y, s, Y), ^(s, Y) = -Ms> Y)/= (45) = J J dxdy^f%(x, s, Y)to(y, s, y) [поскольку дифференцирование собственной функции по з приводит к нулю, так как из условия нормировки фо(х, s, у) следует, что Jt0(x, з, Y)-^-to'x, s, yM* = 0]- Выберем теперь з=з, и пусть у-*0. Поскольку для ка- ждой из двух функций в формуле (43) выполняется
Теория Ван-дер-Ваальса. I 289 уравнение, подобное уравнению (45), с тем же самым s и тем же самым Xq(s) =©($), но с I, соответственно равным 1\ и /2, и поскольку снова можно пренебречь тем, что эти две функции перекрываются, из уравне- ния (45) при у-*0 получаем Это и доказывает соотношение (44). В заключение этого пункта сделаем следующие два замечания: Рис. 6. Обозначения: — ю(з); — • • —Л(з, у) (точное значение); —........Л(з, у) (значение с точностью до уб);------------А.(з, у) (значение с точностью до (уб)*). (а) Ясно, что наше разложение становится неверным вблизи критической точки, так как в этой точке В->0 и Ц=12- Поэтому нельзя уже пренебрегать перекрыванием двух собственных функций в двухфазовой области. В критической области следует уже иначе перестраивать интегральное уравнение; как это делается, мы покажем в третьей статье этой серии. (б) Из уравнения (41) следует, что в первом порядке по у функция Xo(s, у) по-прежнему имеет разрыв произ- водной, и можно с уверенностью ожидать, что этот раз- рыв сохранится в любом члене ряда теории возмущений. Для конечных у функция Xo(s,y) является аналитиче- ской по s при s>0. Это означает, что для малых у раз- витый нами метод последовательных приближений при- ближает аналитическую функцию Ло(з,у) с помощью 19 м. Кац
290 Приложение III ряда функций, имеющих разрыв первой производной в области изменения s, где производная Xo(s, у) меняет- ся очень быстро (рис. 6). Отсюда следует, что фазовый переход остается вплоть до любого конечного порядка по у, хотя уравнение состояния в этом случае, конечно, отличается от уравнения Ван-дер-Ваальса. В самом деле, легко показать из уравнения (41), что уравнение состоя- ния в первом порядке по у в однофазовой области имеет вид в__ ЬТ ___tt° I Y f АТ__—(ьт___ °0 11 Р— 1 — Ь I» Т 2 В[К‘ Р Jr Давление насыщенного газа и плотности насыщенного газа и жидкости также соответственно изменятся. Нахо- дим п =р<°) 4-y— fД| д*.___________ А'н.с. У 2 \ Ц-It li Л воО? —б2)\1 Bt \ kTl] /J где i=l, 2. 5. Заключительные замечания Чтобы оценить, насколько наш результат пригоден для трехмерного случая, мы сначала напомним обычный вывод уравнения Ван-дер-Ваальса из статистической суммы8). Можно рассуждать так: если радиус действия притягивающей силы очень велик, так что в сферу дей- ствия каждой молекулы попадает много других молекул, то потенциальная энергия притягивающих сил должна для почти всех конфигураций молекул равняться своему среднему значению Фпр. = -С№/2У, (46) где С = — /drq>np.(r). Уравнение (46) получается из того, что в среднем потен- циальная энергия одной, молекулы пропорциональна
Теория Ван-дер-Ваальса. I 291 плотности N/V и фактически равна — CN/V. Множитель Ч2 в уравнении (46) нужен потому, что каждая молеку- ла взаимодействует со всеми другими молекулами*). Поэтому для дальнодействующих притягивающих сил представляется разумным приблизить статистическую сумму выражением Z(V, 7’,^ = -^-l-exp|C№/2ATVJX X / ••• J^ri ^r/vTT^(lr/-r/l). (47) v v i<j где S(x) —та же самая ступенчатая функция, которую мы уже использовали в п. 2. Если теперь объем V очень велик по сравнению с об- 4 щим собственным объемом молекул Nv0, ®о = "з’яго> т0 ясно, что интеграл приблизительно равен в то время как если V того же порядка, что и Nv0, интеграл обра- щается в нуль приблизительно как (И — Nv0)N. Прибли- женное «интерполирование> интеграла с помощью фор- мулы (V — fe)w, где b = Nvo, немедленно приводит к ура- внению Ван-дер-Ваальса [p+Jr}(V-b) = RT, (48) где а=уС№. Этот вывод вызвал критику в основном по двум при- чинам. 1. Истинный термодинамический предел статистиче- ского интеграла должен всегда давать устойчивую изо- терму, для которой dpfdv < 0. Это было строго доказано Ван Ховом 8) для межмолекулярных сил конечного ра- диуса действия с твердой сердцевиной. Поскольку ниже критической температуры в уравнении Ван-дер-Ваальса существует неустойчивая часть, это уравнение противо- речит упомянутой теореме. 2. Приближение (V—b)N для отталкивающей части статистического интеграла должно быть очень грубым. Даже если выбрать b так, чтобы получить правильный *) То есть число пар молекул порядка АР/2. — Прим, перев. 19*
292 Приложение III второй вириальный коэффициент (для этого нужно при- нять b — 4Nvo), следующие вириальные коэффициенты, которые могут быть вычислены точно, не согласуются с ван-дер-ваальсовскими значениями. Вернемся теперь к нашей одномерной системе. Заме- тим, что те же самые рассуждения, что и выше, приво- Рис. 7. Обозначения: —изотерма Ван-дер-Ваальса (у = 0); --------точная изотерма;----------изотерма с точностью до уб. дят к следующему выражению для статистической суммы: xf ... f dt. ... d/ArJjSa^-OI). (49) L L 1<] Здесь C=2ao (множитель 2 возникает ввиду того, что мы рассматриваем притягивающий потенциал —аоуехр[—у|/|1). Огромное различие между уравнения- ми (47) и (49) состоит в том, что интеграл в уравнении (49) может быть вычислен точно благодаря линейному упорядочиванию в системе твердых палочек. В резуль- тате получается (L — Nb)N. Для газа из твердых пало- чек длины б уравнение состояния, как заметил Тонкс10), имеет в точности ван-дер-ваальсовский вид p = kT/(l-6). (50) Второе возражение против уравнения Ван-дер-Ваальса в одномерном случае исчезает, и поэтому не удивитель-
Теория Ван-дер-Ваальса. I 293 но, что для нашей модели в ван-дер-ваальсовском пре- деле уравнение (48) с b=N6 и а = а0№ выполняется точно. Остается только вопрос о противоречии между уравнением (48) и теоремой Ван Хова. С точки зрения изложенного в п. 2 и 3 ясно, откуда возникает это про- тиворечие. В приведенном выше выводе переход к тер- модинамическому и ван-дер-ваальсовскому пределам со- вершается одновременно, в то время как это нужно де- лать отдельно и в определенном порядке: сначала пе- рейти к термодинамическому пределу для отталкиваю- щих сил конечного радиуса действия, а затем устремить этот радиус к бесконечности. Таким путем мы избежим противоречия с теоремой Ван Хова и всегда получим устойчивую изотерму11). Нам кажется поэтому, что пер- вое возражение против уравнения Ван-дер-Ваальса не так серьезно, как нам всегда внушали. Чтобы подытожить наши рассмотрения, выскажем в заключение несколько соображений. (а) Представляется разумным, следуя примеру Ван- дер-Ваальса, постараться в уравнении состояния отде- лить эффекты притяжения и отталкивания и расклады- вать всякую термодинамическую функцию по параметру: ___ Радиус действия отталкивающей силы ,\ Р Радиус действия притягивающей силы * ' Можно ожидать, что при р<С 1 мы получим уравнение состояния ван-дер-ваальсовского типа, из которого сле- дует конденсация и существование критической точки. Условия термодинамического равновесия будут автома- тически вытекать из первоначального перехода к термо- динамическому пределу. (б) Только в одномерном случае мы получим в пре- деле при р—»-0 в точности ван-дер-ваальсовское уравне- ние состояния для твердых отталкивающихся шариков. Этот вывод не должен зависеть от точного вида притя- гивающей силы. Мы можем это подтвердить, обобщая модель Каца для случая, когда притягивающие силы имеют вид m <Pnp.W = — 5«4?ехр(— у\х). (52)
294 Приложение HI Вычисление статистической суммы можно свести, как и в п. 2, к интегральному уравнению для функции т пе- ременных, а поведение наибольшего собственного значе- ния в пределе при у-*-0 можно изучать тем же самым способом, что и в п. 3. Получается снова уравнение (28), с той только разницей, что 2vo заменяется величиной лг Id “5^ = ~ИТ f W dx‘ (53> <=i о Итак, снова получается уравнение Ван-дер-Ваальса, а ван-дер-ваальсовская константа а по-прежнему пропор- циональна интегралу притягивающего потенциала. (в) В трехмерном случае уравнение состояния для газа из твердых шариков, конечно, не совпадает с урав- нением p=kTI(y—b), хотя качественно его поведение может быть похожим. Даже для очень дальнодействую- щих притягивающих сил можно только надеяться прийти к уравнению состояния, подобному уравнению Ван-дер- Ваальса. В определенном смысле задача о газе из твер- дых шариков становится центральной. Верно ли, что та- кой газ должен обнаруживать фазовый переход для плотностей, близких к плотности плотной упаковки (так называемый переход Кирквуда)? Это известный нере- шенный вопрос. Нам кажется, что существуют веские аргументы в пользу существования такого перехода и что этот переход может быть идеализацией (или кари- катурой!) перехода жидкости в твердое тело. Очевидно, что в одномерном случае [см. (50)] такого перехода не существует, и мы уверены поэтому, что даже при даль- нодействующих силах, принуждающих молекулы к объе- динению, в одномерном случае существует не более од- ного фазового перехода. Наконец, следует упомянуть о двух вопросах, на ко- торые мы пока не можем дать удовлетворительного от- вета. 1. Как связана наша теория с теорией конденсации Ли и Янга? Ввиду существования твердой сердцевины большая статистическая сумма G(L,z) является поли- номом степени M=Lj6 по z с положительными коэффи-
Теория Ван-дер-Ваальса. I 295 циентами. Полагая G(L, г) = ехр | Ах (Л г)], мы можем написать м где Zi — нули полинома G(L, z), которые не могут ле- жать на положительной части вещественной оси. Функ- цию х(^<г) можно интерпретировать как комплексный логарифмический потенциал М точечных зарядов вели- чины 1/L, помещенных в точках z(. В пределе при L-*-co величина зарядов становится все меньше и меньше, в то время как их число М возрастает. Предположим теперь, что в пределе при L-*-oo заряды концентрируются около некоторой дуги («простого слоя>), которая пересекает положительную часть вещественной оси, скажем, в точке z=z0. Предельная функция X(z)= lim х(Д z), L-ba> которая наверняка существует, будет тогда для поло- жительных вещественных z состоять из двух аналитиче- ских частей: одной —для z<z0 и другой —для z>z0. В точке Zo эти две части имеют одно и то же значение, но разные первые производные. Поскольку x(z) =p/kT, получится такая кривая, как на рис. 4 (с переставлен- ными абсциссой и ординатой), и произойдет конденсация. Очевидно, что нечто подобное должно произойти и в на- шей модели в ван-дер-ваальсовском пределе. При конеч- ных у «простой слой> не должен пересекать положитель- ной части вещественной оси, и зазор между ними имеет величину, скажем, порядка у. Для конечных у функция X(z) будет тогда аналитической для всех вещественных положительных г, но в ван-дер-ваальсовском пределе, когда зазор исчезает, происходит конденсация. Однако мы не в состоянии проверить эту картину, так как труд- но изучить поведение собственных значений уравнения Каца для комплексных значений $.
296 Приложение III 2. Как связана наша теория с теорией Урселла— Майера? Мы уже упоминали о задаче «графологическо- го истолкования коэффициентов а, в разложении Ао($) [см. уравнение (22)]. Существуют также и другие вопро- сы. Например, можно было бы ввести майеровские функ- ции f как для отталкивающей, так и для притягивающей части межмолекулярного потенциала, которые привели бы к графам с двумя типами линий. Тогда возникает вопрос, какое появляется упрощение, если притягиваю- щие силы дальнодействующие, и можем ли мы, изу- чая одномерную модель, как-нибудь лучше характери- зовать уравнение типа Ван-дер-Ваальса в трехмерном случае. Приложение t Доказательство утверждения (а) см. в работе Каца, указанной в примечании 5. Там же доказывается, что l0(s)>e,/>v Jdrexpf—sr+ve-YT], (П. 1) в и поскольку при s=0 интеграл расходится, Xo(s)-><» при $—>-0. Далее, так как можно показать, что правая часть формулы (П. 1) соответствует приближению, когда учитывается только взаимодействие между «ближайши- ми соседями>, следует ожидать, что для малых s (т. е. малого давления) функция Xo(s) становится равной этой правой части, откуда вытекает, что Xo(s) ~ e'Av/s при s->0. Это подтвердится в дальнейшем, когда мы выведем разложение (22). Утверждение, что Xo(s) не может быть вырожденной ни при каком значении s, следует из положительности ядра К,(х,у) для всех х, у при s>0. Поскольку f f dxdytp (х) Ks (x, у) q> (у) («) > —-------г-------------- (П. 2> l<ixtf(x)
Теория Ван-дер-Ваальса I 297 для любой функции ф(х) и поскольку максимум дости- гается при ф(х)—фо(х)' из неравенства К«(х,у)>0 вы- текает, что функция фо(х) должна быть одного знака для всех х, и мы можем считать поэтому фо(х)>О. Да- лее фо(х) не может обращаться в нуль ни при каком значении х. Иначе для некоторого значения х, скажем х0, К,(хо,у) равнялось бы нулю тождественно по у, что про- тиворечит условию К,>0. Теперь допустим, что при не- котором а значение Хо(а) вырождается и ему соответ- ствуют две собственные функции ф^Чх) и ф^Чх). Вы- бирая ф^Чх) > 0, можно построить линейную комбина- цию ф(х) из Ф'о’Чх) и ф^(х), которая ортогональна к Ф^Чх) и удовлетворяет уравнению f f dxdytf (х) Kt (х, у) <р (у) Ы«) = “---------с-------------• (П. 3) J rfxq>»(x) Поскольку Ф*0’Чх) не обращается в нуль, ф(х), будучи ортогональной к ф^11, должна принимать как положитель- ные, так и отрицательные значения, что приводит к про- тиворечию. Из невырожденности lofs) вытекает, что Xo(s) — аналитическая функция для всех вещественных а>0. Это следует из того, что, как известно, %<(а) яв- ляются нулями по X определителя Фредгольма £)(а,%), являющегося целой функцией % и аналитической функ- цией а для всех вещественных а>0. Следовательно, Xt(s)—аналитическая функция а, за исключением тех значений а, при которых два или большее число соб- ственных значений совпадают. Наконец, неравенство (21) доказывается так: из ра- венства М$) = / J ^хс?уф0(х, s)Ks(x, у) Фо (у, $). где ф0(х,а)—нормированная собственная функция, по- лучаем, что квадратичная форма Q(z) = Xo(s)z2-|-2Xo(s)z-|-^(a)
298 Приложение HI равна J J dxdyt0(x. $)to(y. У) + 2г-^£ + -^г-] + — CO + «J4*^+<Ы* — CO (П.4) Из уравнения (9) для K»(x, у) можно увидеть, что пере- менная s входит в К» только через ра(х,у), а из уравне- ния (8) следует, что первый член в равенстве (П. 4) положителен для всех г. Второй член в (П. 4) также по- ложителен; действительно, воспользовавшись равен- ством К, (X, у) = S %„ (s) tn (X, s) t„ (у. S) п=0 и тем обстоятельством, что для всякого $ функции tn(*, s) образуют ортонормированную систему, этот член можно преобразовать к виду —СО co р со *t2 ~22Ч(«) fdxd^s} ^,(x,s) ; поскольку Xn(s)<Ao(s) при л>1, это выражение боль- ше, чем 2X0(s) —оо О *). ’) Здесь использовано то обстоятельство, что для нормирован- ных to(x,s^ f rfxt0(x, s)-^=0. </«j —ОО — Прим, черев.
Теория Ван-дер-Ваальса. I 299 Последнее же выражение равно нулю в силу равенства Парсеваля, примененного к функции Следователь- но, Q(z)>0 для всех z, откуда и вытекает неравен- ство (21). Утверждение (в) из п. 2 следует из соотношения СО со = J dxKs(x, х) = О — оо которое показывает, что при s->0 сумма всех собствен- ных значений стремится к бесконечности, как e',tV/s. По- скольку это совпадает с поведением Xo(s) при s->-0, все остальные собственные значения должны оставаться ко- нечными при s=0. Чтобы найти разложение (22) для Xo(s), следует произвести вычисления по теории возмущений в окрест- ности s=0 для собственных значений уравнения f dyK, (х, у) Фо (У. s) = Хо ($) Фо (х< «)• (П. 5) -СО Сначала мы разложим К,(х, у) в ряд по. степеням s. Чтобы сделать это, мы перепишем Ks(x, у) в виде К, (х, у) = ехр [1 vV. (х + у)] {[ IF(x) W(у)]7’ + + 2 -Т- Jdx т" ([тРТУгГ Р (х| у’ Т)Н W W(у)Р) . л=0 6 (П.6) Теперь положим e'/»v М*)=—(a-t+aoS+eisM- •••)» Фо (X, s) = Ф(о) (х) + 5фп) (X) + .... <П’
300 Приложение 111 и пусть ф(0)(х) нормирована. Подставляя (П. 6)и(П.7) в (П.5) и приравнивая члены, пропорциональные 1/з, мы получаем ОО f dy [ W (X) W(y)\h exp [I v'/. (X + y)] (y) = = a_1i|)«>»(x)^v. (П. 8> Легко проверить, что это уравнение имеет решение -?+¥•*]• (П-9> Заметим, что если бы мы попытались определить таким же путем величины других собственных значений Xn(s) при s=0, мы нашли бы, что в этом приближении = =0, так что все Хп (0) при л>0 вырождены, и чтобы найти истинные значения, мы должны были бы найти корни бесконечного «векового» детерминанта. Лишь одно Xo(s) стремится к бесконечности при s-*0, и только для него можно продолжить вычисления с помощью тео- рии возмущений. Приравнивая в выражении (П. 5) члены, не завися- щие от 5, найдем ОО / f dy ехр [1V’/. (х+у)] И -б [ W(х) ^(у)]7* + —©о \ +р’[-г$Т’(₽<*|у. ’) - W'OTlI **<у>+ + (1Г(х) (П. 10> Умножим обе части этого равенства на ф<°>(х) и проин- тегрируем по х. Используя уравнение (П. 9), ортогональ- ность ф<‘>(х) к ф<°>(х) и формулу J fdxdy ехр [v'A (х 4- у)] W(х) Р (х | у, т) = — 03 = exp[v(l-|-^-v^[
Теория Ван-дер-Ваальса. I 301 которая является частным случаем уравнения (4), по- лучаем Оо=— д+ JdT{exp(ve-v< —1)}. (П. 11) д Правая часть может быть переписана так: Д™ 2Г f /Л1Л»{ехр[1Ягф(|/'”/2|)]~ Ч’ что совпадает с майеровским коэффициентом b2. С по- мощью уравнения (П. 10) легко также проверить, что фп,(х) = — (а0+й)Ф(0)(х)+ Jс/уФ°(у)Х —со Xexp[4-(x+y)]p4v^r^(xly’ 6 Мы можем продолжать таким же путем далее, ио вы- числения вскоре становятся очень длинными. Мы прове- рили, что в следующем приближении получается at = =b3—by где майеровский коэффициент Ь3 определяется* формулой b3 = lim f f ^idi2d^3X X [ЛаЛз+ЛгАз+ЛаЛз+ЛгЛаАз)» где fu = exp [-j-y Ф (| tt — tj I)] — 1. Общее выражение для a< через майеровские коэффи- циенты bi отсутствует. Чтобы получить правильное урав- нение состояния вплоть до четвертого вириального коэф- фициента, а2 следует положить равным ^-ЗМз + 2^ но мы этого не проверяли.
302 Приложение III Приложение 2 Чтобы понять, как выводится уравнение (24), доста- точно рассмотреть случай л=3. Имеем = / f f Л1^2^“5(Т,+Т,+Т,)Х i ъ Xfffdxi dx2 dx3 exp [— (voY)1'* (x, + x2 4- x3)] X XP(Xi|x2, tJPUjIjCa, т2)Р(х3|хр Тз), где P(x|y, т) задается уравнением (5). Введем новые переменные 6i = (х2 - xte~ w) (1 - fc2 = (х3 - Х7е~ ^«) (1 - Ь = (х1 - х£~ Щ (1 - e-2vT.)-v«, Якобиан этого преобразования равен = 11 - *-v(t,+”+Tt)l Ц (1 ~ ехр [- 2ут,|)-%. Интеграл по превращается в интеграл {(гл)*'* 11 — е-т(Т|+т»+тЛ]}“| X Xf J f ^dlAexp[-^^+^+^]x хцр[7.кМ_т2лА где Д,=(1 -e-’v’0%[e’v<T<+1+T<*«)+<vt<+«+ 1] и T4STlt Т5 = т2.
Теория Ван-дер-Ваальса. I 303 В таком виде удобно перейти к пределу при у->-0. Поскольку А{ приближенно равняется 3(2ут(),/1, подин- тегральное выражение в предыдущем интеграле не за- висит от у и мы получаем limy^X? = J* J J Л1Л2Лзе_*(т,+т‘*’*>Х v->° z J 6 oo X + T2 + T3)]-1 fffd^d^d^x —CO хПехр[-4й-1^к]. (a) /= 1 Чтобы отделить интегрирование по т< и gj, введем вспо- могательную переменную и умножим обе части равенства (а) на Здесь использовано представление б-функции в виде ин- теграла Фурье. Положим и=а>(т1+т24-тз) и проинте- грируем сначала по gj. Мы получим lim у У} =-^ f di] J dw X / — Q — oo — oo co 3 J dtexp t] (2v0),,‘ -I- у 6 Наконец, полагая u> = g+ it), мы получаем уравнение (24) для л=3. Доказательство для произвольного п прово- дится таким же способом.
304 Приложение III где И Приложение 3 Решение уравнения (42) можно переписать в виде Н™(г) = Мя[РяО Л+З (z) + QaDя+1 («)+ + К/Рл-Х (2) + ^л^л-3 (г)Ь n _n v^(Z-6)8(/-3d) я— 18Z’^’ Q„ = 9(« + l)P + (« + l)V-ir, Rn = — 9я2Р — nW+nW, Sa = — n(n — \)(n — 2)P (I — Ь//(1'1гВ'/г), W=$ (I—Ь?/(21ч,В*1г). Чтобы получить уравнение для следующего приближе- ния, левую часть уравнения (35) следует разложить до членов порядка у2. Используя разложения (36) и при- равнивая члены порядка у2, получаем ) I („ I 1 \ tz'2) Мл ’ „(0) , “5?—Ц/1 + ‘2---Г/"" = ~в~На + , V^(Z-6)2Z’/’ /4v0 , v^(Z-6)2^rf2M„” ( 4В‘'> \3Z2 2 dg2 +• v^«(Z-6)2 ( 1 ( В dH^ | + w I?2"- +t~s~)+ (-+4-^)^- — (IS/3 — 36/% 4- 30/62 — 863) + + ^(2/2-2/6 + 62)U+(n+l)4- / 2 , . 3\ В2 И v0 (Z — б)3 (Z-|-б) — (л2 4- п + -4 / “/Г I ]------РВ--------2 ~dT ' откуда Ц(2) и затем Я(2) можно определить обычным путем.
Примечания 305 Примечания к части I ') Van der Waals J. D., Dissertation, Leiden, 1873. Это изло- жено в книге <Die Kontinuitat des gasformigen und fiussigen Zu- standes» (Leipzig, 1899). См. также монографию: Kuenen J. P., Die Zustandsgleichung, Braunschweig, 1907. *) Эта теория принадлежит в основном Дж. Майеру; она изло- жена в книге: Майер Дж., Гипперт-Майер М., Статистиче- ская механика, ИЛ, М., 1952, гл. 13, 14. Современное изложение можно найти в монографии Уленбека и Форда в серии «Studies in Statistical Mechanics» (Amsterdam, 1962, v. 1, part B). 3) Эти попытки также восходят к Майеру (см. книгу, цит. в примечании 2, гл. 14). Более современное изложение можно найти в статье Ikeda К., Progr. of Theoret. Phys. (Kyoto), 19 (1958), 653; 26 (1961), 173. Многие исходили из аналогии с конденсацией Бозе — Эйнштейна, на которую указали Кан и Уленбек (Kahn В., Uhlenbeck G. Е., Physica, 5 (1938) 399). Однако мы теперь ду- маем. что эта аналогия поверхностна и что на самом деле не суще- ствует никакой связи между конденсацией Бозе — Эйнштейна и обычной конденсацией. 4) Эти трудности становятся особенно явными в той формули- ровке задачи о конденсации, которая принадлежит Янгу и Ли (см. Yang С. N., Lee Т. D., Phys. Rev., 87 (1952), 404; ср. также с исследованием Уленбека и Форда, приведенным в гл. 3 книги Lectures in Statistical Mechanics (Proceedings of the Summer Semi- nar, Boulder, Colorado, 1960; published by the Amer. Math. Soc. Providence, Rhode Island, 1963). [Перевод: Уленбек Г., Форд Г., Лекции по статистической механике, М., 1965.] 8) К а с М., Phys. Fluids. 2 (1959), 8. *) Отсутствие фазовых переходов в одчомерных системах с взаимодействием только между ближайшими частицами установле- но впервые в работе: Gursey F„ Proc. Cambridge Phil. Soc., 46 (1950), 182. Обобщение для случая, когда каждая частица взаимо- действует с конечным числом соседних частиц, получено Ван Ховом, см. Van Hove L., Physica, 16 (1950), 137; ср. также иссле- дование, приведенное А. Мюнстером в его книге «Statistische Ther- modynamik» (Springer, Berlin, 1956), § 7.7, 8.8, где также можно найти дальнейшие ссылки. 7) Так называемое правило равных площадей. См. Maxwell, Collected Works, Dover reprint, V. II, p. 425. 20 м. Кац
306 Примечания *) Этот вывод восходит к Орнштрйну (см. О г ns t ein L. S., Dissertation, Leiden, 1908). Сам Ван-дер-Ваальс, а затем позднее также Лоренц (Collected Papers, Martinus Nyhoff, The Hague, Ne- therlands, 1935, v. 6, p. 40) исходили из вириальной теоремы Клау- зиуса. Мы вернемся еще к этому во второй статье из этой серин. ’) Van Hove L., Physica. 16 (1949), 951. Недавно Ван Кам- пен указал на пробел в рассуждениях Ван Хова. Однако эту теоре- му можно доказать даже при менее ограничительных условиях дру- гим методом (см. недавнюю статью: Ruelle D., Helv. Phys. Acta, 36 (1963), 183). °) Tonks L., Phys. Rev., 50 (1936), 955. ") В нашей модели теорема Ван Хова выражается неравен- ством (21) для наибольшего собственного значения Xo(s, у), которое справедливо для всякого значения у. Изотерма монотонно убывает при всяком у, а поэтому и в пределе при у—0 и др/dl < 0.
Часть II ИЗУЧЕНИЕ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ 1. Введение Первая попытка выйти за рамки вопросов, связанных с уравнением состояния неидеального газа, и обратиться к более глубокой проблеме корреляции положений мо- лекул в газе или жидкости была сделана Орнштейном и Цернике в их хорошо известной теории критической опа- лесценции’)- Позднее Цернике, Принс и др.2) использо- вали те же идеи, чтобы интерпретировать результаты по рассеянию рентгеновских лучей в жидкости в терминах так называемой двухточечной корреляционной функции. Эта корреляционная функция совпадает, по существу, с преобразованием Фурье углового распределения рассе- янных лучей, и поэтому непосредственно наблюдается. Этого нельзя сказать о так называемых s-точечных кор- реляционных функциях (s = 3, 4, ...); однако эти функ- ции можно точно определить для системы, находящейся в равновесии, и с возрастанием s они описывают струк- туру этой системы все более и более подробно. Общая теория этих корреляционных функций или функций распределения была развита в сороковых го- дах, в основном Кирквудом, Ивоном, де Боером, Май- ером и их сотрудниками3). Эти авторы получили общее разложение функций распределения в ряды по степеням активности или по степеням плотности 4). Найденные ими разложения обобщают соответствующие вириальные разложения для уравнения состояния. Они предложили также различные схемы приближений, из которых наи- более известна кирквудовская схема суперпозициониого приближения. Это привело к новым очень интересным попыткам решить задачу о фазовом переходе5). Насколько нам известно, никто не пытался систе- матическим образом связать эти общие разложения с основными идеями Ван-дер-Ваальса. Поэтому нам представляется интересным вывести выражения для функций распределения в модели одномерного газа. 20*
308 Приложение III описанной в части 1, и посмотреть, что произойдет с этими функциями при переходе к ван-дер-ваальсовскому пределу. В п. 2 выводится выражение для двухточечной и трехточечной функций распределения. Этим путем мож- но построить также и общее выражение для s-точечной функции распределения. Оказывается, что в выражения для функций распределения входят все собственные зна- чения и собственные функции основного интегрального уравнения Каца [часть I, (10)]. Можно сказать, что эти выражения и дают физическое истолкование собствен- ным функциям и собственным значениям, хотя мы не знаем еще, можно ли однозначно определить сами эти собственные функции и собственные значения при по- мощи всего набора функций распределения. В п. 2 выводится также другое общее выражение функций распределения через резольвенту уравнения Каца и соб- ственную функцию фо(*). соответствующую наиболь- шему собственному значению Xo(s). Это выражение играет особенно важную роль при изучении функций распределения в двухфазовой области. В п. 3 выводятся хорошо известные вириальные и флуктуационные теоремы. Общее доказательство этих теорем, конечно, верно, но представляется ценным вы- вести их непосредственно из уравнения Каца. Поскольку эти теоремы связывают двухточечные функции распре- деления с уравнением состояния, они служат важным средством проверки для любого метода последователь- ных приближений. Кроме того, они связаны с первона- чальным выводом уравнения Ван-дер-Ваальса. В п. 4 и 5 изучается ван-дер-ваальсовский предел и последовательные приближения по степеням уб Для двух- точечной функции распределения в однофазовой обла- сти. Показано, что следует отличать случай, когда рас- стояние между двумя молекулами имеет порядок б, от случая, когда это расстояние имеет порядок радиуса дей- ствия притягивающих сил 1/у. Поскольку в ван-дер- ваальсовском пределе притягивающие силы очень слабы, двухточечная функция распределения при малых рас- стояниях в нулевом приближении, как и следовало ожи- дать, совпадает с функцией распределения для газа из твердых палочек.
Теория Ван-дер-Ваальса. 11 309 В первом приближении притягивающие силы не- сколько влияют на поведение двухточечной функции при малых расстояниях, но гораздо более интересным обра- зом этот эффект сказывается на поведении этой функ- ции при больших расстояниях. Мы нашли, что в этом приближении добавка к функции распределения экспо- ненциально зависит от расстояния, причем показатель экспоненты меняется в зависимости от сжимаемости газа. Такое поведение связано с той формой, которая предсказывается одномерным вариантом теории Орн- штейна — Цернике, и при приближении к критической области эта связь оказывается общей (т. е. ие зависит от вида дальнодействуюшей притягивающей силы). Од- нако в критической области наше разложение стано- вится неверным, и следует ожидать отклонений от тео- рии Орнштейна — Цернике. Мы вернемся к этому в части III, где будем в деталях изучать поведение двух- точечной функции распределения в критической области. В п. 6 функции распределения в ван-дер-ваальсов- ском пределе изучаются в двухфазовой области. Мы по- казываем, что все функции распределения являются в этой области линейными комбинациями двух функций распределения, соответствующих насыщенной жидкости и насыщенному газу, с коэффициентами, пропорцио- нальными молярным долям жидкой и газообразной фаз. По нашему мнению, это показывает прежде всего, что пространственное разделение жидкой и газообразной фаз автоматически вытекает из теории. В самом деле, это свойство функций распределения представляется нам более глубокой формулировкой проблемы конденса- ции, чем свойство постоянства давления газа (горизон- тальная часть у изотермы), которое вытекает из преды- дущего. Это указывалось уже в основной статье Май- ера в 1947 г.в), и, возможно, наши результаты можно рассматривать как строгое доказательство для частного случая общих рассмотрений этой статьи, хотя точная связь нам пока еще не ясна. В п. 7 мы обсуждаем в деталях связь наших резуль- татов с теорией Орнштейна — Цернике, особенно в от- ношении недавней очень интересной формулировки этой
310 Приложение 111 теории, предложенной Лебовичем и Перкусом7). В за- ключение мы делаем несколько замечаний о пригодно- сти наших результатов в трехмерном случае. 2. Общее выражение для функции распределения Сначала мы напомним общее определение функции распределения. Для канонического ансамбля s-частич- ная функция распределения определяется так: л,(Г1....П. Ю = = (N — S)l f “ ‘ f • ^rN^N (Г1.....глг)» (1) V V где °"° д*м Z(V. дг, 1>1- <2> i<J J Соответствующая формула для большого канонического ансамбля имеет вид рДП......rf, V, z) = 2 ns(Ti.....rs, V, N)Pn, (3) N> s где PN = (Az)NZ(V, N)/O(V, z). (4) В дальнейшем мы всегда будем предполагать, что веще- ство находится в однофазовом состоянии. В этом случае известно, что в термодинамическом пределе функции распределения стремятся к определенным значениям lim л,(Г1, ...,rs,N, V) = ijf(r1.г/ -ц), TV. V-Ъ jo 1 _ (5) Ншрд(Г1.....r„ V, г)=р,(Г!.......г,; г) И->со и эти функции отличаются друг от друга только тем, что зависят от разных переменных — соответственно v и г, которые однозначно связаны друг с другом вторым соот- ношением Майера _ l/'u = zx'(z). (6) Кроме того, известно, что в этом случае п, и р, про- странственно однородны: если к переменным гь ..., глдо-
Теория Ван-дер-Ваальса. II 311 бавить один и тот же вектор, то функции п, и ps не изме- нятся. Следовательно, Л2(Г|,г2;о) зависит только от |г1 — г2|, Лз(гь Га, Гз; о) зависит только от длин сторон треугольника (Г|, га. г3) н т. д. Наконец, известно, что в этом случае функции л» и р, обладают свойством мультипликативности. Это означает, что если s частиц разбить на группы, содержащие ai, a2, ... частиц, то для расположений, в которых эти группы отстоят далеко одна от другой, с большой точностью выполняется ра- венство Л, = Л01-Ла, ... (7) и аналогично для р,. Заметим, что смысл слова «да- леко» зависит от значений и или г. Из свойства мульти- пликативности вытекает, что если все частицы находятся далеко друг от друга, то n4-*(l/v)* и p«-*(pi)’. За- метим, что это свойство мультипликативности является лишь непосредственным соотношением между функ- циями ля или р« и более низкими функциями распреде- ления. Эти более низкие функции распределения нельзя найти только с помощью интегрирования по положениям некоторых частиц. Между этими функциями распреде- ления существуют интегральные соотношения — так на- зываемые флуктуационные теоремы, но эти соотношения более сложны. Мы вернемся к ним в следующем пункте. Для малых плотностей или малых z функция распре- деления приближается к больцмайовскому множителю л,(П. •• ^)->р-ехр S KI . (8) и, как уже говорилось, можно получить полное вириаль- ное разложение или разложение по степеням активности (см. примечание 4). После этих предварительных напоминаний вёрнемся к нашей одномерной модели. Мы покажем, что все функции распределения можно выразить через собствен- ные значения Xn(s) и собственные функции фп(*,
312 Приложение 111 интегрального уравнения Каца [часть 1, (10)]. В ча- стности, мы покажем, что ОО I J dxe-^n^x-, I) = о = 2<0, s|n, s + o) * + °|0> (9а) л=0 IJ J dxdy у, Г) = о о = 21 2 <0. SI Л» 5+°) хо (s)L(x^(S4-a) X л«0 л'=0 Х<“. s+’l”'. s+°'10' ’>’ (96) Здесь s=pfkT и символ {k, m|£', m'} = {k', m'\k, m) означает матричный элемент {kt m|£', т'} = J dx^k(x, т)-фк, (x, tn'). (10) —CO Функции распределения записаны в относительных коор- динатах, так что л2(х; /) = /12(/2— /р /), Лз(х, у, 0 = Лз(/2 />, /3 /2; /), /3 tj (И) где /1, ta, tz — координаты частиц. Мы подробно не вы- водим преобразования Лапласа для s-частичной функ- ции распределения, но структура выражений (9а) и (96) настолько прозрачна, что их обобщение на случай выс- ших функций распределения представляется очевидным. Вывод уравнения (9а). Мы применим сле- дующий искусственный прием: введем добавочное экспо- ненциальное притяжение между всеми парами молекул
Теория Ван-дер-Ваальса. II 313 и будем исходить из новой статистической суммы 2<£' "’-тог/•••/“ о о X ехр V 2 *”v . (12> е где использованы те же обозначения, что и в части I, (2). Тогда легко показать, что ? L L 1 = i f f dt'dt* e~°1' 1/12 N' £)- te=0 о 0 Отсюда получается аналогичное выражение _ L L I = i f f dt>dt* e'°1 * L' г) <13> le=° 2 о 0 де для статистической суммы в большом каноническом ансамбле. Поскольку в термодинамическом пределе In G-> L% (z, е), из формулы (13) получаем в пределе при £-♦ со ~ с» le-o = I dX е~°Ъ (*’ 2)’ (И> где х = t3 — 6. Точно так же, как в части I, п. 2, мы можем связать со статистической суммой (12) интегральное уравнение X » J fdydy'Kt(x, х’\ у, у')Ч(у, y') = AW(x, х'), (15) -ОО — оо где К,(х. х'; у. уЭ=[гйгЙГх X ехр [j V1/» (х + у) 4- у е‘А (х' 4- у')] X X Jdxe~nPy(x\y, т)Ри(х'|/, т). (16) д
314 Приложение HI Мы опускаем доказательство, так как оно должно быть очевидно читателю. Обозначения здесь те же самые, что и раньше, за исключением того, что индекс при функции Р означает различные показатели экспоненты притягивающего потенциала. Функция x(z, е) связана о наибольшим собственным значением A0(s, в) уравне- ния (15) с помощью уравнения [подобного уравнению (18), части I] Ло («. е) = у ехр [-| (v 4-е)], (17) где s = p/kT = x(z, е). Чтобы вычислить левую часть уравнения (14), следует по теории возмущений вычис- лить Ло с точностью до членов первого порядка по 8. Легко показать, что при в = 0 в уравнении (15) пе- ременные разделяются и собственные функции имеют вид (х, х', 5) = ф„ (х, $ + п'о) Nn'Dn' (*'), (18) а соответствующие собственные значения равны A<®,„.(s) = X„(s + «/o). (19) где фп (x,s), Xn(s)—собственные функции и собствен- ные значения уравнения Каца [часть I, (10)], Dn(x) — функции Вебера и Nn — нормирующий множитель, рав- ный Полагая Л ($, е) = Л(0) ($) 4- еЛ(1) ($)+---, V (х, х', $, е) = Чг<0)(х, х', $)4-е'/’Ч,(,,(х, х', $) + мы найдем с помощью непосредственных вычислений по теории возмущений наибольшее собственное значение и соответствующую собственную функцию W<1) / „ „Z е\_ 1 V ^0 (s + g) 4Z *0° х 'S> ~ "2 2л A0(s)-A„(s + a) х Х<0, $|/1. S4-o)M°,)(x, $), A&(s) = Ms)X X Il v M*+<n 2^ 1л X0(s)-A.„(s4-a) л=0 (0, $|/l, (20)
Теория Ван-дер-Ваальса. П 315 При выводе мы воспользовались полнотой системы функций фп(«+о): 2(0, $|/I, $ + о)2=1. (21) п Возвращаясь теперь к уравнению (17), мы найдем наибольшее собственное значение интегрального урав- нения (15) Ao(s, e) = X0(s) + eAg,,(s)+ ••• • Введем здесь ~ _ S = X(z, е) = х(г)4-ех1(г)4- .... где х(з) = P/kT, как следует из части I, (18). Тогда из равенства (17), приравнивая члены, пропорциональные 8, получим Xi(2) дх(*. е) де. _1 г ла>(х) е=о 1 L Х°(Х> (22) Здесь мы воспользовались уравнением (20) из части I. Подставляя полученное выражение в формулу (14), мы получим с помощью формулы (20) уравиение_(9а), по- скольку в термодинамическом пределе р2(х, г) = =й2(х, /), где l//=zx'U)- Вывод уравнения (96). Чтобы обобщить прием, использованный в предыдущем выводе, стоит ввести три дополнительных потенциала, соответствую- щих трем расстояниям между тремя частицами. Однако, чтобы обеспечить соотношения между этими расстояния- ми, которые существуют между сторонами треугольника, необходимо приписать каждой молекуле «внутреннюю координату» pt, принимающую два значения, ц,- = ±1, и усреднить затем по всем множествам значений {ц>}. Мы исходим, следовательно, из новой статистической суммы L L Z(L, N, 8ц 82, 83)= S / ” ’ (М 0 0 XП5<1 ^-01 )exP v£e-’l'r'/l + l<i L <</ 3 a=l Ki (23)
316 Приложение III Дифференцируя по еа, полагая их равными нулю, сум- мируя по pt и воспользовавшись еще тем обстоятель- ством, что рз(Л, h, /3; L, г) симметрична по t\, t2, t3, мы найдем,что 3е1 дц Зе, L 0= Iff ^1^2^зРз(Л» <г> L, z) X X ехр [ оР11 /21 ор> | /2 t31 ар> | /3 — /j | ], pi где сумма распространена на все шесть перестановок индексов 1,2,3. Это выражение похоже иа уравне- ние (13). Переходя к термодинамическому пределу, по- лагая In G = Lx(z, 8i, 82, ез) и t2—ti=x, t3—t2=y, полу- чаем ~ со со 41 о о Х^ехр[— ОрХ— Opjy—ор ,(х + у)]. (24) pi Это напоминает уравнение (14). Теперь снова сопоставим статистической сумме (23) соответствующее интегральное уравнение, а именно со fff $dydtJ' dy* dy3K° <x’ у) x — 00 / 3 \ /3 X ch I xae'/« j ch I ^yaf% \a=i ! 'a=l W(y) = AW(x), (25) где x = (x, x„ x2, x3), y = (y, i/i, y2, y3) и x>=^{»)Te>p (<+я] x X J dx e~ (x I у, T) JJ POa (x01 ya, T). (26) 6 0=^1 Эти формулы аналогичны формулам (15) и (16). Ги- перболический косинус вместо экспоненты возникает в связи с суммированием по рц. Наибольшее собственное
Теория Ван-дер-Ваальса. П 317 значение Ao(s, ei, 82, 83) уравнения (25) снова связано с функцией x(z, 8ь 82. ез) соотношением Ло ($, e„ е2, 83) = у ехр [у (v + 81 + % + е3)], (27) где s=plkT=4(z, 81, 82, 83). Чтобы определить левую часть уравнения (24), надо вычислить Ло по теории воз- мущений до членов первого порядка по 81, 82 и 83. Это становится теперь значительно сложнее, чем раньше, и мы отсылаем читателя к приложению А, где приводятся детали, завершающие доказательство. Если ввести резольвенту Rs(x, у, р) интегрального уравнения Каца (часть I, (10)], то выражения (9а) и (96) для функций распределения можно преобразовать к виду I fdx е~ахп2(х-, = f fdxdy^(x, s)X 0 —oo XRs+a (ж, у; s), (28a) 1 ff = f f f dx1dx2dx3X 0 Л°' ' -oo X^ (Xi. S) Rs+a (*1. *2; X X Rs+a' (*2> *3; Xo(s)) (*3’ (286) Доказать это очень просто. Резольвента определяется с помощью ряда из итерированных ядер Я,(х, у, р) = ^0,(х, уУ + рК^х, у) + р9КР(х, у)+ ..., (29) гДе К?(х, у)= f dzK^(x, z)K,(z, у) — оо и К®\х, y) = Ks(x, у). Так как итерированное ядро выражается через собственные функции по формуле (х, у) = 2 Ц+* ($) фя (х, S) (у, s), (30) л=0
318 Приложение 111 то уравнения (28а) и (286) получаются из уравнений (9а) и (96), если дроби в последних уравнениях разло- жить в ряды по степеням kn(s+a)/ko(s) и затем про- суммировать по п. Мы закончим этот пункт проверкой общих формул (9а) и (96) для некоторых простых случаев. а) Для v=0, т. е. для газа из твердых палочек, не зависит от s, так что (,0, sin, s4-o) = dn0 и Xo(s) = = e~‘6/s. Поэтому уравнение (9а) дает СО I f dx е~ахп™-ЫЛ-(х-, Г) =-------5--тт---. (31) Здесь мы воспользовались соотношением s=p/kT= = \/(1 — 6). Это эквивалентно хорошо известному ре- зультату, полученному впервые Цернике и Принсом8). 6) Для v=0 получаем из уравнения (96) следующее соотношение: IJ J dxdye-ax-a'vni' m* (x, у; 1) = О оо оо = /J dxe-°xn”naj,(x; I)-I J dye~a'i>n™n“(y; I). (31a) 0 c Этого и следовало ожидать, поскольку известно, что для одномерных систем с взаимодействием между ближай- шими соседями имеет место кирквудовский принцип суперпозиции ®). в) Для больших х имеем п2(х; /) —* , поскольку lim n2 (х; I) = lim о f dxe-^n, (х; I) = — -= * Л->оо о->0 * / Ло($) * и (0, s | л, s) = й„0. Подобным же образом доказывается, что для больших у lim f Лсе-°хЛз(х, у; — dx е~ахп2(х; I). ’"Ч о
Теория Ван-дер-Ваальса. // 319 Мы, таким образом, проверили свойство мультиплика- тивности для л2 и Лз. Моркио также показать, что для больших / величины лг и Лз близки к соответствующему больцмановскому множителю [см. уравнение (8)]; дока- зательство этого мы предоставляем читателю. 3. Флуктуационные и вириальные теоремы Из свойства мультипликативности функций распреде- ления лв и р, следует так называемое групповое свой- ство для соответствующих групповых функций, которые определяются следующим образом: Xi(fi; 2) = ^^; г), Х2 (г 1- h; 2) = ^(Г!, г2; г)—pjti; 2)pi(r2; z), Хз(Г1. г2. гз! *) = Рз(Г1, Г2, Г3: z) —р2(гь г2; z)ih(r3; z) — — P2(r2, г3; z) — Рг(гз. ip z)p,(r2; z) + + z)p!(r2; zjpjta; z) (32) и т. д.I0) Групповое свойство означает, что для всякого расположения, в котором s частиц разбиты на две или большее число невзаимодействующих групп, функция Х«(Г1, ...» r4;z) исчезает. Вследствие этого интегралы ., г,; z)dr,... dr, (33) должны иметь термодинамический смысл, и соответ- ствующие результаты составляют так называемые флук- туационные теоремы. Из определений ps легко найти1)» что (34а) lim -у f f f dridr2dr3X3 = ит.Д.
320 Приложение 111 Эти результаты можно также вывести непосредствен- но из выражений (9а) и (96) для функций распределе- ния. Например, из формулы (9а) получаем, что СО fdxe-a^[n2(x; /) —-^-] = —-577—-J-+ о +7-S + <°- ^1"- (35) л=0 Здесь мы воспользовались соотношением полноты (21). Теперь для о->0 имеем (0, s\n, s+o)-»-0 при п + 0 и (0, s|0, s+o)—*• 14-О(о2), что вытекает из условия норми- ровки. Поэтому для о —0 правая часть уравнения (35) принимает вид ОН 1 ~ , X 1 „2, ' — аА.о (s) — у <гЛ0 (s) — ... 1 1 Xo(s) 1 kT dl — —7~ 2? X'(s) 2?— 2? Up ’ при этом мы воспользовались соотношением 1=—к'0/К0, s=p/kT. Следовательно, СО lim-j-J f dlldtix2 = 2f dxp2(x; I) — -^-1 = г-*°° L 0 _ 1 kT dl I P dp' (36) откуда и следует уравнение (34а). Подобным же обра- зом можно проверить уравнение (346). Другая группа «термодинамических» соотношений для функций распределения следует из того обстоятель- ства, что гельмгольцевская свободная энергия V равна —kTlnZ(V, Т, N). Отсюда следует, что внутренняя энергия задается уравнением с „г т дЧ 3NkT , E = W-T-dT=~2----------Ь + f rt; К N)> (37) v
Теория Ван-дер-Ваальса. II 321 а давление — уравнением ,2) дУ NkT 1 г ( dp К, Р OV ~ V 6И J J rfrlrfr2(r12-^) X Хл2(Г1, г2; К N)- (38) Это уравнение в термодинамическом пределе дает P = ^- — ifdrr^n2(r;v). (39) Это и называется вириальной теоремой, поскольку эту формулу можно также непосредственно получить из ви- риальной теоремы Клаузиуса. Если межмолекулярный потенциал ср (г) имеет твердую отталкивающую сердце- вину, то при r=d (d — диаметр этой сердцевины) произ- водная dy/dr не определена и уравнение (39) следует заменить уравнением p=^- + bkTn2{d+\ v) —fdrr^^^n^r; v), (40) d где b = у nd3 и ni(d+; -o) = limn2(r; -о). Заметим, что в одномерном случае уравнение (40) имеет вид kT т а p = ~i—|-№7>12(б+; /) — Jdjcjc-^n^x; I), (40а) & где б — по-прежнему длина твердой палочки. Дифференцируя далее по Т и V, мы получим из фор- мул (37) и (38) термодинамические соотношения, вклю- чающие высшие функции распределения. Например, из формулы (37) мы получаем для удельной теплоемкости при постоянном объеме общее выражение сг=-у-4-2И5- f ^Ф(/*){ф(/*)л2(п ®)+ + f dT3[v(rtt)+v(r^]'n3(rl, г2, г3; ®)+ +у [ f dr^r^n^Ty r2, r3, r4; v) — — МП, r2; -v)n2(r3, ^)1}- 21 M. Кац
JO2 Приложение Hl Возникает вопрос, как проверить эти соотношения непосредственно с помощью выражений (9) или (28) для функций распределения, и здесь мы встречаемся со следующей очевидной трудностью. Так как фпр.= = —ае-*1, интегралы в (37) и (40а), включающие йг(х; /), похожи на преобразование Лапласа от йа(х;1), если о равно у. Однако в соответствии с формулой (9а) преобразование Лапласа от йг(х; /) зависит от всех соб- ственных значений и собственных функций уравнения Каца, в то время как в соответствии с формулой (37) [которая для нашей модели превращается в (s=E/N)] мы имеем <» е = — al J dxe~ (х; /); (41) в преобразование Лапласа имеет термодинамический смысл и поэтому может зависеть только от наибольшего собственного значения Хо- Причина такого очевидного упрощения при о=у становится понятной, если возвра- титься снова к выводу уравнения (9а). Очевидно, что при о=у добавка к притягивающему потенциалу мг°* сводится к увеличению константы взаимодействия v на е. Уравнения (14) и (17) по-прежнему остаются верными, но соответствующее интегральное уравнение теперь почти в точности такое же, как уравнение Каца, за исключением того, что v заменено на v+в. Ядро можно разложить в ряд по степеням в и получить К,(х, у, г) = К,(х, У)[1 + (е/М.)(х+у)+ ...]. Применяя теорию возмущений, найдем Ао($, е) = Хо(s)-|-eXo\s)-f- ..., где = fdxxtf(x). ->00 При помощи аналога уравнения (22) получаем вместо уравнения (9а) уравнение СО оо I f dxe~^n2(x-, 1) = -^ f 4/ххф»(х)-1. (42) О —оо
Теория Ван-дер-Ваальса. II 323 Легко теперь проверить, что последнее уравнение экви- валентно уравнению (41). Действительно, поскольку в терминах химического потенциала можно написать е —ц Т дТ Р др и [см. часть I, (18), (19)] ц = kT In (Az), InXo(s, v) = yv — Inz, находим *г4-Ж+т При помощи этого равенства и уравнения уравнение (41) сводится к (42). Вириальную теорему (39а) можно проверить анало- гичным способом. Мы опускаем детали, так как эта проверка состоит в повторении обычных термодинамиче- ских рассуждений. Остается только вопрос, как вывести основные тождества вида уравнения (42), которое мож- но также записать в форме —со со = / / dxdMx, sYMy, s)#J+v (х, у\ , непосредственно из интегрального уравнения Каца. Та- кой вывод приведен в приложении Б. 4. Ван-дер-ваальсовский предел двухточечной функции распределения. Поведение на близких расстояниях Для исследования того, как ведет себя функция й»(х; /) на близких расстояниях порядка б после пере- хода к ван-дер-ваальсовскому пределу, т. е. при у-»-0 и 21*
324 Приложение Ш одновременной замене v на voy, проще всего исходить из уравнения (28а). Сначала мы перестроим ядро Ks+o (х, у) так же, как в части I, п. 3, с помощью под- становки х = х' + n (2/y)'h, у = у’ + П (2/у)'Л, где tj(s) определяется уравнением (29) части I. Если ограничиться первым членом ряда (29) для резольвен- ты, то левая часть уравнения (28а) примет вид X Ру (X' | т) ехр { у (Vqy)7’ (х' + у' + 2у\ (2/у)‘Л) — — [п2/У 4- П (х'+у')/(2у)'1г] th (у ут)}. где й(х') определяется уравнением (34) части I. Теперь нужно подставить разложение (36) части I для h(xf) и Xo(s) и разложить все, что получится, в ряд по степе- ням у. Ввиду того что наше уравнение было пере- строено, нулевое приближение будет очень простым; так как при у->0 мы имеем Р¥(х'|1Л т)-*6(х'— у') и так как /t(°)(xz) нормировано, мы получим при у->0 J dx ехр [- ($+о)т - 7 п2т] = & exp[r|(2vo)'/’ —(s + a+y А Иначе можно сказать, что при у->0 ядро Ks+o (х, у) можно заменить на Ab(x'— if) =Дб(х — у), где А опре- деляется уравнением (43). Следовательно,/С$+0(х, у)-> -► Л2д(х — у) и т. д. Мы получаем ‘ f 0=4+£+£+------------------- О I — (1 + о (I - 6)]°* - 1 ’
Теория Ван-дер-Ваальса. П 325 воспользовавшись при этом равенством $ 4- т]2) = = 1/(1 — б), которое следует из уравнений (30) и (31) части I. В нулевом приближении мы получаем, следователь- но, в точности тот же ответ, что и для газа из твердых палочек [см. уравнение (31)]. Этого и следовало, ко- нечно, ожидать, поскольку при малых у притягивающие силы на расстояниях порядка б очень малы и в нулевом приближении не влияют на расположение молекул. Эти расположения будут определяться только отталкиваю- щей твердой сердцевиной. В первом приближении притягивающие силы уже сказываются даже на расстояниях порядка б. Чтобы вычислить этот эффект, мы должны собрать все члены порядка у в ряде (29) для резольвенты. После этого мы найдем yv.q-*)4 аУа6 IB {[14-a(Z — d)]«°6 — l}3 (44) В приложении В приведены эти длинные выкладки; при этом надо воспользоваться еще результатами п. 3 ча- сти I. Как Мы уже упоминали в введении, интересно сравнить эти результаты с вириальной теоремой_в фор- ме (40а). Чтобы сделать это, мы должны найти Да(б+; /) из уравнения (44). Умножив обе части уравнения (44) на ое®*, перейдем затем к пределу при о->оо. Левая часть (гдех'=х — б) примет вид ОО lim a f dx'e-^'n^fx'-j-i»; l)m а->оо J ОО (б+; /)о j* dx'e-o*' = (б+; /), о и, вычисляя предел правой части, мы получим ^(б+; /)=!//(/-б) +^(/-6)/^+ ... • (45) 22 М. Кац
326 Приложение III Рассмотрим сначала нулевое приближение и подставим в формулу (40а). Получим СО — voy2 J dxхе~^п2 (х; /). 6 Если мы сделаем замену в интеграле ух=х', то, по- скольку в пределе при у-»-0 имеем й2(х'/у; /) = 1//2, ин- теграл примет вид о Таким образом, снова получается уравнение Ван-дер- Ваальса. Второй член в формуле (45) дает часть по- правки к ван-дер-ваальсовскому уравнению порядка у, упоминавшемуся в конце части 1, в п. 4. Чтобы полу- чить полную поправку, мы должны знать также поправ- ку порядка у к поведению функции Лг(х; I) при больших расстояниях. Это требуется также для того, чтобы разо- браться, почему первый член в формуле (44), подстав- ленный в флуктуационный интеграл [уравнение (36)], не согласуется с уравнением Ван-дер-Ваальса. Действи- тельно, для первого члена уравнения (44) находим ОО fdx[^(x; I)—= + (46) о что согласуется с уравненнем_(36), если p/kT=\l(t—б). Мы увидим, что выражение л2(х;/) при больших рас- стояниях с точностью до порядка у дает вклад нулевого порядка в флуктуационный интеграл. Это приводит уже уравнение (36) в соответствие с уравнением Ван-дер- Ваальса. 5. Ван-дер-ваальсовский предел двухточечной функции распределения. Поведение при больших расстояниях Чтобы определить поведение п2(х;/) для х порядка 1/у, мы воспользуемся уравнением (9а) для п2(х;/).
Теория Ван-дер-Ваальса. // 327 Заменим а на оу, разложим затем правую часть по сте- пеням у. Сначала рассмотрим матричный элемент <0, s | л, $-|-оу> = fdjcip0(jc, s, у)фя(х, s+oy. У)- (47) — СО Мы знаем, что ф(х, s, y) = h(x', s, у) = Л(0)(х', 5) + у'/«Л(п(х', $)+ .... где х=х/+т](э) (2/уР* и h^(x', s) определяются в п. 3 части I. Следовательно, *«(•*. « + оу. У) = Ля(х —•n(s + oy)(2/y),/’, s+ay, у) = =*?’(/, «)+?[«’(*'. Поскольку функция Ля” ортогональна АоО) при п>0, то для таких п [если принять во внимание уравнения (38) н (39) части I] найдем (0, s|n, 5 + оу> = -о(^),/,-|3-бя1 + О(у). (48) При л=0 получаем <0, .$|0, s + oY) = l-o’^-(-g.)2 +О(уЧ (49) Заметим, что уравнения (48) и (49) до членов поряд- ка у согласуются с условием полноты 2 (0, s| п, s+oy)2 = 1. л=0 Затем рассмотрим собственные значения. Мы знаем, что 4(s. Y) = «(5)[l+Y^1)(s)+O(Y2)], (50) где |*<*> задается уравнением (39) части I. Поэтому 4(«+<>У. У) = ‘»(5){1+у[а4^+^,(5)] + О(У2)}. (51) 22*
328 Приложение 111 Используя все эти формулы, получаем из уравнения (9а) СО I f dxe~a>xn2(x; l) = о Ш Г ° ® ® d$>' ш' ds 1 а<о' 2 ш' — а(®7®) + Мо,)—И?’ + .... (52) Теперь возникает следующая сложность: хотелось бы заменить ы,($)/ш(5) на (—/) в соответствии с уравне- нием (31) части I, но это неправильно. Разложение соб- ственных функций и собственных значений велось при постоянном s, в то время как преобразование Лапласа функции Ля (х; /) вычисляется при фиксированном значе- нии / = —Xo(s)/Xo(s). Поскольку Xo(s) и со($) отли- чаются на величину порядка у [см. уравнение (50)], мы имеем X0(s) <о |_ ^Y®' ds "'J и с точностью до членов порядка у Эту поправку порядка у следует принять во внимание в первом члене уравнения (52), но ею можно, конечно, пренебречь в других членах. Поскольку в нулевом по- рядке <о* _ . , 1 dl _ . 1(1 — 6)* ш' — '1 ds ~ 1 В2 • n(s)=^. (2)’-*^. иа)_ ц(У = Д, р — &= .gM*-6)*, формулу (52) можно упростить Cdxe-oyxn <х. л — J__1 . 1 J dxe n2(x’ l>— yoP 2/"*" 2Z3 * I* В ’ В + оГ 0
Теория Ван-дер-Ваальса. // 329 Так как для газа из твердых палочек [см. уравнение (46)] с точностью до членов нулевого порядка по у мы нашли выражение СО О ТО оо / dx е-™ [л2 (х; /) - «7- (х; /)] = v°(ff~6)4 • . о ' Отсюда, обращая преобразование Лапласа, мы заклю- чаем, что (х; /) = (х; /)+у ^-6)4?ехр [- (В/l) ух]. (54) Это верно для х порядка 1/у. так что л”-п,л-(х; /) сле- дует заменить на I//2. Однако из выражения (54) для функции распределения видно, что наш результат свя- зан с выражением (44) для функции пя(х;/) при малых расстояниях; выведенным в предыдущем пункте. Дей- ствительно, из (44) следует, что при о->-0 fdxe-^(x-, /)=1[^. + ^</-б)4]+ о так что при х->оо мы получаем й (г- а— 1 । УМ* —6)4 /12(Х, I)— । pg > и второй член является в точности амплитудой при убы- вающей экспоненте в выражении (54). Заметим также, что если подставить выражение (54) в флуктуационный интеграл (36) и воспользоваться формулой (46), то по- лучится О _ 1 I (/-&)* — 2/ 21В* '
330 Приложение III как и ожидалось, поскольку в соответствии с уравне- нием Ван-дер-Ваальса kT dl _ 1 dl _ (/ — б)» 21* dp ~ 21* ds ~ 21В* ’ Легко также проверить, что уравнение (54) вместе с уравнением (45) после подстановки в вириальный инте- грал (40а) дает полную поправку порядка у к уравне- нию Ван-дер-Ваальса. _ Мы вычислим также члены порядка у2 в выражении Л](х; /) при больших расстояниях. Поскольку все вычис- ления проводятся непосредственно, хотя и очень длинно, мы лишь приведем окончательный результат, так как он понадобится нам в части III. Обозначим обратное пре- образование Лапласа от правой части уравнения (44) через п2(х, I) близи/. оно состоит, следовательно, из ят». пал. (х; /) и первой поправки, возникающей за счет притягивающей силы. Тогда мы найдем, что М* Z) = «2(x; /U«.+YV°(рв б)\е-д^-1)+ [-б(2/-36)+|^г-^] ?хе~™ - —— 6(21—3d) v0 U—*)’ <4*2 + WW—27й2) 6Р 2Г/Р I 1 з/1 I г® (55) В качестве проверки можно подставить это выражение в флуктуационный интеграл и получить ожидаемый ре- зультат, причем дЦдр следует вычислять из уравнения Ван-дер-Ваальса с поправкой порядка у. Наиболее ин- тересная особенность формулы (55) состоит в том, что в ней появляется экспонента с вдвое меньшим показа- телем, чем у экспоненты в первом приближении В * * * * 13).
Теория Ван-дер-Ваальса. II 331 6. Функция распределения в двухфазовой области Поскольку при том значении г активности z, при ко- тором происходит конденсация, удельный объем v как функция z имеет разрыв, все функции распределения большого канонического ансамбля рв(Г|,..., re, z) изме- няются в точке z от значения й,(гь .... re, Vi) скачко- образно к значению йДп,.... г,, Ог), где Vi и Ог— удель- ные объемы соответственно насыщенного газа и насы- щенной жидкости. Таким образом, в области конденса- ции функции р((Г1, .... r„ z) теряют смысл, но мы все еще можем говорить о функциях распределения канони- ческого ансамбля nt(rit .... г*; о). Следуя Майеру, мы утверждаем, что для каждого конечного s следует ожи- дать, что «Лп......г,; ®) = “ j- (п...........г,; т»1)+&2т>2л, (гр .... г,; ®2)], (56) где 51 и 5г — молярные доли жидкой и газообразной фаз, w=£iWi+£202. Считается, что уравнение (56) вы- ражает геометрическое разделение двух фаз. Это пред- ставление основано на следующем физическом рассу- ждении: так как внешние силы отсутствуют, мы должны ожидать, что в равновесном состоянии конденсированная фаза образует большую сферу, окруженную газообраз- ной фазой, причем положение этой сферы чисто случай- ное. Разумеется, этого нельзя детально обосновать, ибо при переходе к термодинамическому пределу из рассмот- рения выпадают все поверхностные эффекты; тем не ме- нее можно ожидать, что все результаты будут находить- ся в согласии с такой картиной. Это относится, в част- ности, и к уравнению (56). Первый множитель 1/v в формуле (56) равен плотности вероятности найти одну частицу, скажем, в точке rt. Из-за случайного положения жидкой сферы эта вероятность не зависит от того, к ка- кой фазе принадлежит частица. Однако если первая ча- стица принадлежит жидкой или, наоборот, газообразной фазе, то все остальные (s — 1) частиц принадлежат той же самой фазе: действительно, вероятность того, что
332 Приложение 111 некоторые из них принадлежат другой фазе, пропорцио- нальна отношению поверхности жидкой сферы к ее объему, и, следовательно, эта вероятность исчезает при переходе к термодинамическому пределу. Так как П1П3(Г|...г»; 01) и О2Лз(Г1, . • г», Ог) равны условным вероятностям найти (s— 1) частиц в первой или во вто- рой фазе, если первая частица находится в той же фазе, и так как и равны безусловным вероятностям най- ти первую частицу в первой или во второй фазе, то мы и получаем второй множитель в формуле (56). Следует отметить несколько обстоятельств. а) Несмотря на существование двух фаз, функции л,(гь ..., г4; о) по-прежнему пространственно однород- ны. Это происходит, очевидно, снова благодаря тому, что положение жидкой сферы случайно. б) Теперь уже л,(Г|, .... гя; о) не обладают свой- ством мультипликативности. Наличие двух фаз приводит к корреляции даже тогда, когда частицы находятся да- леко друг от друга. В частности, «2 (П. r2; „)-l(iL4-^.) при удалении двух частиц друг от друга, и поскольку 1 ____L > 0 V \ ' Vt / V* ’ флуктуационный интеграл стремится к оо, что согласует- ся с постоянством давления в газе для двухфазовой об- ласти. в) Если выражение (56) подставить в левую часть уравнения (39), выражающего вириальную теорему для s=2, и воспользоваться вириальной теоремой для функций распределения каждой из фаз в отдельности, то получится Т f dt г W (r: i f dT r <r: ir “ / \i SiVi l*T \ , (kT \ kT HV2 (r; <u2)] = - A)+ - a) = v-A- Таким образом, мы видим, что давление действительно постоянно и равно р,.
Теория Ван-дер-Ваальса. 11 333 Все эти общие утверждения в действительности, ко- нечно, до сих пор не доказаны. Поэтому чрезвычайно интересно, что для нашей одномерной модели соотно- шение (56) в ван-дер-ваальсовском пределе получается вполне строго. Это легко показать при помощи уравне- ний (28а) и (286). Мы знаем из п. 4 части I, что в ван- дер-ваальсовском пределе наибольшее собственное зна- чение в двухфазовой области дважды вырождено и что две собственные функции при малых уд не перекры- ваются. Так как мы уже показали, что соответствующая удельной длине 1=+ ^12 собственная функция имеет вид %(*; 0=l?*o(x; то отсюда_с помощью уравнений (28а) и (286) полу- чаем, что п2(х\ I) и пз(х, у; I) удовлетворяют одномер- ному варианту общего уравнения (56) для s=2 и s=3. Уравнения (28а) и (286) настолько очевидным образом обобщаются на случай больших $, что нет никакого со- мнения в справедливости уравнения (56) для произ- вольных $. 7. Связь с теорией Орнштейиа — Цернике Чтобы показать связь наших результатов с теорией Орнштейна — Цернике, мы изложим сначала одномер- ный вариант этой теории. Мы начнем с интегрального уравнения, связывающего корреляционную функцию g(th h), которая определяется равенством g (t„ it) = g (x) = I (x; I) —i]. (57) с так называемой прямой корреляционной функцией c(t\, t2)=c(x). Обе функции зависят только от абсо- лютной величины расстояния x=t2 —h между двумя ча- стицами в точках /1 и t2 и в однофазовой области стре- мятся к нулю при х->оо. Интегральное уравнение, о котором идет речь, имеет вид СО g(/i, t2) = c(tv /2)+ /d/3g(/n /3)с(/3, t2). (58) — ОО Следующее рассуждение делает это уравнение правдо- подобным: корреляция положения двух частиц в первый
334 Приложение Hl момент определяется их непосредственным взаимодей- ствием. Это и выражается первым членом c(tt, /2). Кро- ме того, на них оказывает влияние третья частица, на- ходящаяся по соседству от этих двух; этот эффект описывается вторым членом уравнения (58). Мы не пы- таемся дать формальный вывод уравнения (58) и). При использовании этого уравнения кажется очевидным, что оно верно только в некотором асимптотическом смысле и для дальнодействующих притягивающих сил. Заметим, что его можно переписать в виде ОО g(x) = c (х) + f dyg(x — y)c (у), (58а) —оо откуда вытекает, что для преобразований Фурье выпол- няется простое соотношение g(k) = c(k)+g(k)c(k). (59) Заметим теперь, что вблизи критической точки функция g(x) возрастает из-за малой сжимаемости газа. Это сле- дует из флуктуационной теоремы, которая дает ОО / g (х) dx = g (0) = -1 —£ (A)r. (60) —00 Однако величина прямой корреляционной функции с(х) не должна возрастать вблизи критической точки, по- скольку эта функция определяется притягивающей си- лой. Это подтверждается соотношением (61) — 00 вытекающим из формул (59) и (60). Поэтому в критической области Орнштейн и Цернике разлагают g(x — у) в уравнении (58а) по степеням у вплоть до у2. Поскольку мы рассматриваем область, где £(х)^>с(х), можно пренебречь функцией с(х). Исполь- зуя четность функции с(х), получаем дифференциальное уравнение •g—x2g = 0, (62)
Теория Ван-дер-Ваальса. II 335 где со 2 1- fdyc(y) х2 = J -----------£ = \ЬТ)\д1)т (б3) Jdyy’c(y) ]*<*УУ*с(У) — СО —со Уравнение (62) имеет решение gW = »(-^.A)e-« (64> [здесь использована формула (60)]. Это выражение можно теперь сравнить с видом функ- ции л2(х; /) при больших х, который изучался в п. 6. Очевидно, первое приближение (54) согласуется с фор- мулой (64) как по форме, так и по зависимости от сжи- маемости др/dl. Поскольку х зависит от неизвестной функции с(х), мы ничего не можем больше сказать. Од- нако, как заметили Лебович и Перкус (см. примеча- ние 7), можно более подробно исследовать уравнение Орнштейна — Цернике (58а), если воспользоваться ос- новными идеями теории Ван-дер-Ваальса. Прежде всего ясно, что для больших х функция с(х) должна быть про- порциональна притягивающему потенциалу <р(х) и что только при х, близких к нулю, с(х) будет отклоняться от <р(х) из-за твердой сердцевины. Тогда, поскольку соот- ветствующее уравнение Ван-дер-Ваальса имеет вид (65) где ОО “о = ~/ rf*<P(*) = —уФ(0), о и так как с(0) удовлетворяет уравнению (61), весьма правдоподобно, что выражение для c(k) имеет вид *) c(k) = c^^(Q)- (66) *) Далее в этом пункте постоянная Больцмана обозначается через А Б • — Прим, перев.
336 Приложение Ш где ~ I2 дпп-П4Л- ^”Л(0) = 1+^^- Из уравнения (66) мы получаем g(k) с помощью фор- мулы (59), и если мы теперь определим поведение g (k) при больших расстояниях формулой gux (k) = g(k) — gn- п,л(0), (67) (68) где (69) с"мл(0) ® 4 ' 1 _ сп-п,л- (0)' то мы получим 8 1 ' Ф (0) 4-1* dpldl ф (Л) — ф (0) — Z* dpldl' Этот результат принадлежит Лебовичу и Перкусу. Мож- но проверить, что в нашей модели, где Ф (•*) = —<Хое-у|х|, ф(А) = — 2воУ/(у2+Л2), из формулы_(69) получается в точности первое прибли- жение для Пг(х\ I) при больших расстояниях, которое было выведено в п. 5. Для малых плотностей /3-^- * — lkbT очень велико, и поэтому уравнение (69) принимает вид что согласуется с ожидаемым результатом М* /)« ±е-*™**т « А [1 ~ФМ ]. (70) Вблизи критической точки производная dp/dl очень ма- ла, и уравнение (69) можно приблизить для малых k уравнением g^(k)« йбг/[|ф"(0) k2 - P(dpldlj\. Отсюда получаем iM4 W«^(-2a0/3-^-) А«р[-£(-Я$)Л]. (71)
Теория Ван-дер-Ваальса. II 337 где /? определяется формулой ОО ^fx^(x)dx <72) J dxtfix) — ОО Функция в (71) имеет в точности тот же вид, что и у Орнштейна — Цернике, с той только разницей, что те- перь радиус 1/х выражен через межмолекулярный по- тенциал. Действительно, формула (64) превращается в (71), если положить 1 / /3 др\Ч, х = 7?(~2а;’Эг) • Мы уверены, что уравнение (69) представляет собой точный результат в том смысле, что оно дает правиль- ный вид корреляционной функции в первом приближе- нии для всякого дальнодействующего потенциала и для целого диапазона значений плотности, простирающегося от малых значений, когда газ близок к идеальному, до значений, лежащих на границе критической области. Мы смогли подкрепить нашу уверенность тем, что обоб- щили исследование, проведенное в п. 5, на случай, когда притягивающий потенциал является суммой экспонент [см. часть I, (52)]. Мы снова нашли, что уравнение (69) удовлетворяется точно. Поскольку вычисления прово- дятся так же, как и для одной экспоненты, мы наметим только основной контур доказательства. Для потенциала Л1 Фпр. V / ч т-у =—Y V, ехр (— а(ух), Б /=1 где Vi=at/kET, интегральное уравнение Каца пишется для функции т переменных и ею ядро имеет вид ("^1» • • • • У I' • • • ’ Ут) == F ТТ W (*,) Т''* Г *'/* 1 =Jdx е~” П j ехР 1т J I У» f).
338 Приложение III Чтобы изучить, что происходит при у->-0, мы пере- строим интегральное уравнение с помощью подстановки xi = x'i + Я/ (2/уо/)'/*, у = y't + т), где n Cv//aJ^ Здесь т] определена так же, как и в части I, (33). В ну- левом приближении тогда получаем вместо уравнения (37) части I дифференциальное уравнение ХЯ«>(г,.....г„) = 0, (74) где zt = и матрица М задается формулой (75) Здесь (76) Поскольку матрицу М можно привести к диагональному виду ортогональным преобразованием = 2 так что 2-М,^=2Л»Й. (77) 4, / Л мы найдем в этом приближении (78) Ц..... = «(») {1 + [S 7— S Ь+4) Л?'] + •''} где Nnl = (nil)~>,*(23Wi)~\ Поскольку наибольшее соб- ственное значение по-прежнему равно со($), мы снова получим ван-дер-ваальсовское уравнение состояния, как
Теория Ван-дер-Ваальса. // 339 уже отмечалось в части I. Ван-дер-ваальсовская кон- станта ао дается формулой [см. часть I, (53)] v°s'^r = — ~k^f Jrfx<₽np .(•*) = 2о7’ так что 2Jq = l-(4)2, (80) где В снова определяется уравнением (38) части I. С помощью этих результатов вычисление вида функ- ции nz(x\ I) при больших х обобщается непосредствен- но, и мы находим n2(x;/) = nj,-n,j, (x; /)+--^-6- • х*Л^’ехр [—Л?ух], *=1 (81) где = <82> При выводе мы должны использовать тождество (вз> *=1 которое немедленно следует из формулы (77), если по- ложить = Для изУчения уравнения (81) нам понадобятся Л*. Теперь легко показать, что характери- стический многочлен матрицы М можно записать в виде ПМ./-Л./П =П«-Л)(> - Ё i=l \ (=1 л) Следовательно, Л* служат т вещественными корнями уравнения m о V с‘а‘ 1
340 Приложение III Подставляя выражение (76) для Ci и используя урав- нение (79) и выражение для В, можно все это записать так: t/-x_ V (2«//Oj) НО — ^(го0‘—! l = \ =—l3 (84) где г=А~'1г. Из формулы (81) можно видеть, что т кор- ней г< этого уравнения входят в показатели экспонент в выражении для пг(х; /). График функции f(r) изобра- жен на рис. 1. При небольших плотностях —13др[д1~ f^lkT, и, таким образом, значение f(r) очень велико. То- гда и поскольку с<-*0, из уравнения (75) вид- но, что ортогональная матрица а,? стремится к 6ц, а из уравнения (82) следует, что амплитуды экспо- нент в формуле (81) становятся равными 2vk/l, так что п2(х; /) приближается к ожидаемому виду (70). Вблизи критической точки величина —Fdpldl очень мала, и из рис. 1 видно, что гт становится очень большим, в то вре- мя как все остальные показатели остаются конечными. Из формулы (84) можно найти, что в этом предельном
Теория Ван-дер-Ваальса. II 341 случае гт определяется из уравнения 1 V _ /л дР дГ которое можно переписать так: где R определяется уравнением (72). Показатель т-й экспоненты превращается, таким образом, в показатель Орнштейна— Цернике (73). Чтобы показать, что ампли- туда также совпадает с той, которая получается в урав- нении (71), заметим, что, поскольку в соответствии с уравнением (80) вблизи критической точки собственный вектор aim должен быть близок к значению (01 _ c'/*/g< (2 (‘./’Эр' потому что это дает и нулевое собственное которому приближается Ат. Из формулы следует, что = — (/<3~— Y2/?2. значение, к (82) тогда (86) что и приводит к амплитуде из уравнения (71). Нако- нец, мы можем показать, что не только показатели, но и амплитуды остальных (т— 1) экспонент остаются ко- нечными вблизи критической точки. Это следует из то- ждества (83), поскольку оно позволяет нам заключить, что 2 А4—£—лл-от. если при этом использовать формулы (85) и (86) и за- метить, что вблизи критической точки (—/3/2осо) (dpldl) ~В2//2. Следовательно, так как все Ак положительны, все s2k должны стремиться к нулю по крайней мере как
342 Приложение III В4, и из формулы (81) следует, что все амплитуды, кро- ме /n-й, остаются конечными в критической точке. Таким образом, мы видим, что уравнение (81) ведет себя так же, как формула Лебовича — Перкуса (69) и в случае идеального газа, и в критической области. Что- бы показать, что преобразование Фурье выражения (81) удовлетворяет уравнению (69) точно, требуется дока- зать тождество /я «2 _2 / Л1 \ 2 (87) * \ /«1 / где Доказательство приводится в приложении Г. 8. Заключительные замечания Хотя мы в основном ограничивались одномерным случаем, ясно, что в некоторых аспектах наше исследо- вание обобщается и на трехмерный случай. 1. Связь между вириальной теоремой и уравнением Ван-дер-Ваальса, изучавшаяся в п. 4, может быть та- ким же образом изучена и в трехмерном случае. Для слабого, но дальнодействующего притяжения вириаль- ная теорема в форме уравнения (40) показывает, что можно отделить в нулевом приближении действие твер- дой сердцевины от действия притягивающих сил. Функ- ция n2(d+; v) определяется отталкиванием твердых ша- риков, в то время как в последнем члене уравнения (40) «2 (г; о) можно заменить асимптотическим значением I/о2. Это приводит к уравнению Р=Г’-П,Л—(88) где а=|л/rfrr3-^L = -|frfr<pIip.(r), о
Теория Ван-дер-Ваальса. П 343 что согласуется с значением С/2, выведенным в п. 5 ча- сти I. Конечно, величина n2(d+; v) для газа из твердых шариков неизвестна, так что, как и в п. 5 части I, мы можем только заключить, что уравнение состояния есть уравнение ван-дер-ваальсовского типа. Следует заметить также, что этот вывод полностью эквивалентен ориги- нальным рассмотрениям Ван-дер-Ваальса и Лоренца. 2. Теория Орнштейна — Цернике и, в частности, уравнение (69), очевидно, остаются верными для лю- бого числа измерений. Первое приближение поведения пг(г; о) при больших расстояниях, которое дает эта тео- рия, согласуется с уравнением (88) ван-дер-ваальсов- ского типа при помощи флуктуационной теоремы и дает поправку к давлению (—a/о2), которая получается с по- мощью вириальной теоремы. Если бы удалось найти фи- зические (а потому допускающие обобщения) основания для (а) следующего приближения к п2(г; о) при малых расстояниях, соответствующего последнему члену в урав- нении (44), и (б) высших приближений поведения й2(х; о) при больших х, соответствующих уравнению (55), то можно было бы с помощью флуктуационных и вириальных теорем развить метод последовательных приближений для уравнения состояния, в котором урав- нение (88) служило бы нулевым приближением. 3. Мы уверены, что линейное соотношение (56) для функций распределения в двухфазовой области остается верным при любом числе измерений. Мы показали в п. 6, что с помощью вириальной теоремы эти соотношения приводят к постоянству давления газа в двухфазовой об- ласти. Конечно, это еще не доказывает, что существуют две фазы. Линейное функциональное уравнение (подоб- ное уравнению Каца), наибольшее собственное значение которого было бы двукратным в области конденсации, а собственные функции не перекрывались бы, в трехмер- ном случае отсутствует. Можно ли построить такое функциональное уравнение с помощью всего набора функций распределения, как это пытался сделать Майер, и можно ли строго доказать вырожденность его наи- большего собственного значения и справедливость соот- ношения (56) — все это предстоит еще увидеть.
344 Приложение 111 Приложение А. Завершение доказательства уравнения (96) Мы должны решить интегральное уравнение (25) с помощью теории возмущений по малому параметру е,/}. Полагая Т = ЦЛООО) 2 e*/2e''2e”,'V*"n), "lm (П1) Л=л(000’ 4- 2 v ’ him немедленно находим, что в нулевом порядке собствен- ные функции и собственные значения имеют вид п000’ (х) = (х; s+nloi+«202 + лз03) Ц ЛЦ D„t (xi), Aff00’ = (<? 4- /1,0, 4- «2°2 + лз°з). где n=(n, iti, nt, п3). Нам нужно Л^оо* и, в частности, Лоооо- Поскольку вычисления очень длинные, мы будем выписывать только те промежуточные результаты, кото- рые потребуются для окончательного ответа. Легко ви- деть, что ЧГ(|00’=ЧГ(010>—Т(001,=0 и что в Л дают вклад только целые степени е{. Находим С(х)=2«0(х). л=0 где /7(110)_ 1 M$) + *4»(s + g|+g*) /Л » I д I д\ в« “2 Ao(s)-An(54-0,4-0,) \U’5।п' 5“Г°*“Г и подобные выражения для Ч^оооо и Ч'оооо- Для члена порядка Bi получаем = у = X Хо (s). „ (П 2) чвю-гвГчЯкх), ДжО
Теория Ван-дер-Ваальса. II 345 где (200) _ J_ Ms) + Ms + 2g|) /0 I _ . о,. \ Ля “У М«)-М« + 2с() sIл’s и подобные формулы для членов порядка е2 и ез- Затем для члена поряда eie2 находим -М») |+х «> *I"• • я=0 (ПЗ) Относительно функции у¥$о8(х) мы должны знать толь- ко, что интеграл пропорционален ftn,o. В членах порядка е^егез)1^ мы получим для коэффи- циентов а(иП) разложения WoS» по ’ЗИЙЯ, т. е. для ин- тегралов следующее выражение Л(2”)____1_/Л <j|„ - I - I р\ I 1 М$) + *я (s + g» + <b)xz «я------4 ф, S|Я, SH-o2H-o3>+ 2 X0(s)-X„(s4-a1-|-a,)X х 2 [<л«s+а2+°з1/п- «+«1+«2> Х т=0 Х<т, sH-Oj+qjIO, $) + (л, $+(j2+<T3|/n, s+oi+<t8)X Другие коэффициенты разложения нам не нужны. Окон- чательно это приводит в члене порядка eie2es к выра- 23 М. Кац
346 Приложение 111 жению .(222) 00 л=0 ^Х+.:и»»+».+".у+ + м^?ЙЬ5<0- s|“’ s+-”+’>>!] + + 2S 2 [<0’ S1/I’ S + °2 + °3>X л=0 m=0 Х,.Х-Н4-.Л *+’>+'з1». »+«i+<h>X X + (m, s+0 _|_ a 10, S) 4- X0(s) —Ara(s4-ai4-o2) ' । it 2i ’/ г + два аналогичных члена, получающихся из преды- дущего заменой (аг, Оз), (оь Ог) на (оь <т3), (оь Ог) и (°1» »з). (°г. »з)] • (П4) Чтобы вычислить левую часть уравнения (24), мы долж- ны снова разложить уравнение (27) с помощью подста- новки в разложение для Aoooo(s) выражения s=^/A7 = X(ei, Ьг, ез, z) = x(z)4- S ef^e^x'*^. *, l, т Приравнивая в формуле (27) члены с одинаковыми сте- пенями 8{, можно выразить x(*Zm) через функции Aoooo^s), где теперь s=p/A7=x(z). Находим 7200) _ -Х020) _ -(002) _ 0 Aq (S) * и, наконец, + ZTT {л®-т |л©+л®'+ ЛЗД}. (П5)
Теория Ван-дер-Ваальса. И 347 Подставляя в это уравнение выражения (ПЗ) и (П4), находим, что /х(И2) в точности равно удвоенной сумме в уравнении (П4). Так как эта удвоенная сумма симмет* рична по О|, аг, оз, все шесть членов правой части урав- нения (24) равны друг другу, и мы можем записать это уравнение в виде 61 f J dxdyp3(x, у, z)e-a'x-^-a^x+^ = li{322). (П6) о Поскольку преобразование Лапласа берется по двум от- носительным расстояниям х и у, нам нужно только две переменные о. Полагая 1 , 1 , Oj — О3 — *2" ® ’ ®1 — ® "2” ® г легко проверить, что все три члена удвоенной суммы в (П4) становятся равными друг другу, и, следовательно, формула (П6) приводит к уравнению (96). Приложение Б. Доказательство тождества (42) С помощью уравнений (8) и (9) из части I легко проверить, что ядро Кв(х, у) интегрального уравнения Каца удовлетворяет тождеству дК^ду дК^дх = у v'/» (/G+v Н- Ks) Н- у уКл+ч — xKs- Умножим это уравнение на фк(у; s) фп(х; s+y) и про- интегрируем по х и у. В каждом члене можно выпол- нить одно из этих интегрирований. После интегрирова- ния второго члена по частям ответ запишется в виде s>= — 00 со = 2^ /dxx^n(x\ $+yH*(x; s)+ —00 + / dx^n (x; s-j-у) ф* (x; s). — 00 23»
348 Приложение 111 Умножим это уравнение на СО Jdy^a(y\ s+iWutifi s) — ОО и просуммируем затем по всем п. В правой части, если использовать соотношение полноты, получим 2фл(х; s+yH«({/; $+y)=6(x— у). Л»0 Член, содержащий д/дх, исчезает, и мы приходим к формуле IV МНЫЖ) 2 Zi X*(s)-X„(s+y) со “|2 оо X f dxФ*(x\s)Ф„(х;S4-у) = Jdxхф*(х: s). Это равенство выполняется для всех k. Полагая k=Q и используя равенство (9а), мы получаем уравнение (42). Мы предоставляет читателю вывести аналогичным спосо- бом тождество, вытекающее из вириальной теоремы (40а). Приложение В. Доказательство уравнения (44) После подстановки, перестраивающей уравнение Ка- ца, и разложения ядра до членов О (у), вклад n-го члена ряда резольвенты (29) в уравнение (28а) можно запи- сать в виде У1^! г"(dx'dy-inx’ywx *0 («) J J v —00 х [-ЖГ/• • fiz' • • • • • f — 00 6 X JJ e"oz< [ 1 4- Y%«< («/-14- */)4- 4- jya]zj'] Py (zj_11 zi, h).
Теория Ван-дер-Ваальса. II 349 где <*=«+»+-2П2; =у п (у y) (/—М Z0 = X'' г'п = У’ и где X0(s), Л(х') и Л(/) по-прежнему определяются разложением (36) из части I. Мы уже видели, что в нулевом порядке получается (Л/ш) , где Л = (1/а) ехр [— ад т| (2v0)%]. Члены, пропорциональные у, возникают в шести местах. 1. В нулевом порядке $4~4Tl2=l/U—д). Посколь- ку мы вели разложение при постоянном I, мы получаем с точностью до первого порядка s + |T)2=l/(/+A/_6), где &l = yd^'l/ds, a ^’’(s) задается уравнением (39) части 1. Таким образом, вклад от нулевого приближения равен —Р"ло Д//[ 14-а (/ — д)], где Р=е-<*/[1+(/-д)]. 2. От Xo(s), очевидно, возникает вклад - Р^уц’)1' = — у пу(1 — В)РЯ. 3. От членов в квадратных скобках, содержащих у, получаем лН®(1-т(6+4)+-Ид,+“+£)}- 4. От членов с y'h в квадратных скобках в сочетании с поправкой О (у7’) к собственным функциям А(х/) и А(/) получаем n₽-^L(Z_S_±)«^x
350 Приложение 111 5. От произведения двух членов с у'1' в квадратных скобках получаем 6. При нахождении всех этих вкладов мы заменили функцию P^z'^ |zj, ее нулевым приближением, а именно d(zj — Мы должны поэтому вычислить еще вклад, возникающий из-за отклонения функции Pv от d-функции. Все другие множители можно при этом заменить их значениями в нулевом приближении. При помощи марковости функции Pv все интегралы по z'i можно немедленно вычислить. Затем можно выполнить интегрирование по у', если использовать то, что с точ- ностью до О (у) справедливо равенство f dy'F (у') Ру (х' | у', t) = F (х') - yx'tF' (х')+ylF" (х'). — со Интеграл по х' также можно вычислить, и мы оконча- тельно получаем я₽’т(4+4)[1—j+t?]' Объединяя все эти результаты и суммируя по п, мы приходим к уравнению (44). Здесь, как и во многих дру- гих вычислениях, принцип максимальной простоты ока- зался очень действенным. До тех пор, пока окончатель- ный ответ не получился простым, мы неизменно обнару- живали, что совершили какую-нибудь алгебраическую ошибку! Приложение Г. Доказательство тождества (87) Мы признательны за это доказательство д-ру Хал- тону (J. Н. Halton, Brookhaven National Laboratory). Первый шаг состоит в разложении левой части уравне- ния (87) по отрицательным степеням k3. Используя ра- венство
Теория Ван-дер-Ваальса. II 351 из которого, если положить zt = следует, что i.J J мы получаем для левой части выражение (П7) А* 44 ktr 44' Ofii ' r=0 I, J 1 Теперь несколько более удобно ввести вместо матрицы М [задаваемой уравнением (75)] матрицу £<* = ~5^ (4?) Л М‘» = 6'* — с*- Таким образом, уравнение (П7) можно переписать в виде A* k” S ciLulLiltt • • • X r=o i, /,.........‘r+iJ Суммирование no i и j может быть сразу выполнено, и мы получаем множитель c‘i Введем обозначение р<= —а2/А2 и ради удобства записи положим d = —di. Тогда легко видеть, что тождество (87) можно переписать в виде QO ___ Z 2 • • • Ч-им •••₽',= «•=» lV <1.1, Т^Ф-’ (П8) где теперь
352 Приложение III Подставляя L и подсчитывая это произведение, можно проверить, что сумма по й, i2, ..ir может быть перепи- сана так: 2 5=1 где суммирование распространено на целые гк от 1 до г— 1, связанные условием (оно обозначено штрихом) П + ГгЧ- ••• +G = r- Изменение порядка суммирования по г и s в формуле (П8) приводит к тому, что левая часть этой формулы превращается в 2 2 где сумма по гл берется от 1 до оо и не связывается ни- какими условиями. Итак, получаем SV A V/V dg>i \«_ ф Zd I I 1— р, ~А[ id 1— Р/ ) ~ 1— ф ’ »-1 /,.it *-i '* / что и доказывает формулу (П8). Примечания и части II *) Оrnstein L. S., Zernike F., Proc. Acad. Sci. Amsterdam, 17 (1914), 793; Physik Z., 19 (1918), 134; 27 (1926), 761. См. также Zernike F., Dissertation, Groningen, Netherlands 1916, reprinted in Arch. Neerl. Zool., Ser. 13 A, 4 (1917), 74. Более позднее изложение см. в работах Ландау Л., Лифшиц Е., Статистическая физика, М., 1951; Klein М„ Tisza L, Phys. Rev., 76 (1949), 1861; Fi- e г z M., Pauli Memorial Volume, New York, 1960, p. 175, и в осо- бенности Debye P., Non-Crystalline Solids, New York, I960, pp. 1—20; J. Chern. Phys., 31 (1959), 680. *) Zernike F., Prins J. A., Z. Physik, 41 (1927), 184; De- bye P., M e n k e H., Physik. Z., 33 (1932), 593. ’) Так как литература no этим вопросам весьма обширна, мы отсылаем читателя к работам Y v о n J., Fluctuations еп density Paris, 1937; Boer J. de, Rep. Progr. Phys., 12 (1949), 305; Mun- ster A., Statistische Thermodynamik, Berlin, 1956, Кар. 8; Mayer J., Handbuch der Physik, Berlin, 1958, В. XXII, S. 152. 4) Полное исследование этих разложений можно найти в ра- боте Mayer J. Е., Mon troll Е. W., J. Chem. Phys., 9 (1941), 2.
Теория Ван-дер-Ваальса. И 353 См. также обзор, сделанный Уленбеком н Фордом в книге Studies in Statistical Mechanics, Amsterdam, v. I, p. B. •) Мы имели в виду, в частности, попытки Кирквуда и его со- трудников получить фазовый переход жидкость — твердое тело и показать, что такой переход существует уже в системе твердых ша- риков. См. Kirkwood J. G., Monroe Е., J. Chem. Phus., 9 (1941), 514; Kirkwood J. G., Mann Е. К., Alder В. J., J. Chem. Phys., 18 (1950), 1040. •) Ma yer J. E., J. Chem. Phus., 15 (1947), 187. Ср. также с его статьей в журнале J. Chem. Phys., 18 (1948), 665, и с обзором в книге Handbuch der Physik, Berlin, 1958, В. XII, S. 165. 7) L e b о w i t z J. L., P e г c u s J. K., Asymptotic behavior of the radial distribution, function (preprint). *) Результат Цернике и Принса, Z. Physik, 41 (1927), 184, можно записать в виде где S(y) —по-прежнему ступенчатая функция. Применив к этой формуле преобразование Лапласа, получим выражение (31). ’) S a I s b u г g Z. W., Z w a n z i g R. W., Kirkwood J. G., J. Спет. Phys., 21 (1953), 1098. Ср. также с исследованием одно- мерных систем: Munster A., Statistische Thermodynamik, 8.8. io) Общее правило таково: разобьем s частиц на некоторое число групп и перемножим функции распределения р>, каждая из которых зависит только от положения частиц данной группы. Тогда X» составляется как сумма таких произведений по всевозможным способам разбиения s частиц на группы, причем каждое слагаемое входит с коэффициентом (—1)*"*(я—1)1, где А —число групп, соот- ветствующих этому слагаемому. Аналогичные формулы справедливы н для функций распределения п,. Мы получаем те же самые функ- ции х. с той только разницей, что z должно быть выражено через и. *') Здесь возникает следующая трудность. Уравнения (34а) и (346) выводятся из нормирующего условия f ... ... dr.pjCfj, .... г,; V, г)=((ЛГ_в)!) . v v v' которое следует из определения о.. Среднее величины IV!/(IV—з)1 по большому каноническому ан- самблю можно выразить через № и его производные по хи- мическому потенциалу ц, что и приводит к уравнениям (34а) и (346). Если теперь использовать те же самые соображения для функций распределения п, (г,, .... г.; IV, V) в каноническом ансам- бле, которые нормированы условием f " fdrt ... drtns(гр ...» r4; N, И) = N_ , v v
354 Приложение III то получится другой ответ, так как усреднение по N выражается через производные удельного объема по давлению. С другой сторо- ны, если вещество находится _в однофазовом состоянии, предельные функции л. (г... г,; о) и р«(г(.г., г) совпадают, а поэтому и групповые функции, составленные из них, должны быть одинако- выми, если v выразить через г или наоборот. Этот парадокс часто обсуждался в литературе (см., например, Mayer J. С., Handbuch der Physik, Springer. Berlin, 1958, В.XII, S. 156). Математическая причина возникновения этой неувязки должна заключаться в том, что при выводе уравнений (34а) и (346) переставляется порядок двух предельных переходов. По-видимому, такая перестановка запрещена в случае функций распределения ка- нонического ансамбля, хотя точные причины этого нам еще неясны. **) Простейший вывод уравнения (38) получается для кубиче- ского сосуда объема V=L3 н принадлежит Грнну [Green Н. S., Proc. Roy. Soc. (London), 189 (1947), 103]. Полагая г*=Г(/Д, мы добьемся того, что пределы интегрирования не будут зависеть от L, и мы сможем дифференцировать по V или L под знаком интеграла. ”) Мы вычислили также с помощью уравнения (286) поведе- ние трехчастичной функции распределения при больших расстоя- ниях. С точностью до членов порядка у находим л3(х, у, /) = л«““(х, у, 0+ + i^{exp[-4v(x+»)] + + ехр [— у- ух] + ехр [— у . Следовательно, при больших расстояниях с точностью до О (у) вы- полняется принцип суперпозиции Лз (Л» ^2' ^3’ 0 = ^3^2(^l> ^2» 0^2 (Л> til 0^2 (^2» ^3> 0- Его следует сопоставить с той формой принципа суперпозиции для твердых палочек, которая представлена уравнением (31а). и) В статье Lebowitz J. L., Per с us J. К., Statistical ther- modynamics of non-uniform fluids, дается формальный вывод урав- нения Орнштейна — Цернике (58), которое они считают точным. Однако в настоящее время еще не ясно, приводит ли это к такому методу последовательных приближений, при котором можно было бы исходить из уравнения (69) в качестве первого приближения.
Часть III ИССЛЕДОВАНИЕ КРИТИЧЕСКОЙ ОБЛАСТИ 1. Введение Как мы уже отмечали в части I и II, наше исследо- вание ван-дер-ваальсовского предела теряет силу вбли- зи критической точки. Это становится ясным, если по- смотреть, каким образом величина В2, пропорциональная dpjdl, входит в разложения для собственных функций и собственных значений уравнения Каца, а также в раз- ложения для двухточечной функции распределения как при малом, так и при большом расстоянии между точ- ками. При В=0 от всех этих разложений ничего не остается. Поэтому для критической области необходимо провести новое изучение асимптотики уравнения Каца при у->-0. Это сделано в настоящей статье. Оказывается, что критическую область для темпера- туры и удельного объема следует определить так: (Г - Лр.уГкр.«(уб)‘\ (/ - /„₽.)//„₽. «(уб),/3, (1) где Гкр. и /кр. — ван-дер-ваальсовские критические значе- ния и уб — по-прежнему отношение радиусов действия отталкивающих и притягивающих сил. В п. 2 мы пока- зываем, что в этой области можно снова так перестроить уравнение Каца с помощью подходящей замены пере- менных, чтобы это привело к согласованному методу по- следовательных приближений для собственных функций и собственных значений. В отличие от однофазовой и двухфазовой областей параметром разложения служит уже не уб, а (уб)'7*, и собственными функциями нулево- го порядка являются уже не собственные функции гар- монического осциллятора (функции Вебера), а соответ- ствующие собственные функции осциллятора, потенци- альная энергия которого задается полиномом четвертой степени. В результате явно определить собственные функции и собственные значения уже нельзя. Однако можно проследить за качественным изменением соб-
356 Приложение III ственных функций при удалении от критической области, причем особенно интересно пронаблюдать различие ме- жду удалением в однофазовую и удалением в двухфазо- вую область. В первом случае собственные функции снова превращаются в функции Вебера, лишь слегка искаженные, а во втором случае (двухфазовая область) они приближаются к собственным функциям потенциала с двумя равными или почти равными минимумами. Хо- рошо известно, что у такого потенциала два наименьших собственных значения очень близки, и это соответствует началу вырождения, характерному для двухфазовой об- ласти. В п. 3 эти выводы обсуждаются в связи с видом изо- термы в критической области. В первой статье мы уже отмечали, что в любом порядке по уд метод последова- тельных приближений всегда дает фазовый переход и получается уравнение состояния типа уравнения Ван- дер-Ваальса. Мы обнаружим, что в критической области (т. е. для конечных уд) семейство изотерм качественно отличается от того, что предсказывает простая теория Ван-дер-Ваальса (т. е. когда уд=О). Для конечных уд переход из однофазового состояния в двухфазовое в кри- тической области происходит непрерывно1). Строго го- воря, для 7<7’кр. изотермы не имеют горизонтальной ча- сти, и поэтому нельзя говорить отдельно о плотностях двух совместно существующих фаз. Однако хотя трудно делать точные утверждения из-за той неопределенности, которая всегда возникает при попытках связать два раз- личных асимптотических разложения одной и той же функции, можно разумным образом продолжить геомет- рическое место точек сосуществования фаз из двухфазо- вой области в критическую область. Мы найдем тогда, что для конечного уд критическая плотность по-прежне- му имеет ван-дер-ваальсовское значение, но критическая температура уменьшается на ДТкр.. причем «0,702 (уд)’/». В этой новой критической точке кривая сосуществования фаз снова является параболой, но бо- лее плоской, чем предсказывает теория Ван-дер- Ваальса 2). В п. 4 и 5 эти выводы обсуждаются в связи с двух- точечной функцией распределения. Основной результат
Теория Ван-дер-Ваальса. Ill 3S1 состоит в том, что в критической области поведение этой функции в случае больших расстояний между точками представляется бесконечным рядом убывающих экспо* нент. Показатели этих экспонент все имеют порядок 1/у(уб)'А; все их амплитуды также имеют один и тот же порядок, а именно Следовательно, теория Орн- штейна — Цернике неверна в критической области. Од- нако мы можем показать, что если удаляться из крити- ческой области в однофазовую область, го наши резуль- таты перейдут в разложение для двухточечной функции распределения в случае большого расстояния между точками, которое было выведено в части Пив котором первый член совпал с экспонентой Орнштейна — Цер- нике. Ситуация, по-видимому, такова, что при прибли- жении к критической точке все больше и больше экспо- ненциальных членов вступает, так сказать, в игру. Вне критической области эти члены убывают по величине, но внутри критической области они дают заметный вклад. Нам кажется, что эта картина, указывающая на воз- никновение отклонений от теории Орнштейна — Цернике при приближении к критической точке, вероятно, имеет место и в трехмерном случае и не зависит от нашего предположения об экспоненциальном убывании отталки- вающего потенциала. Действительно, как показано в п. 6, все исследования п. 4 можно обобщить на случай, когда отталкивающий потенциал состоит из суммы m экспонент; при этом качественно картина не меняется, В п. 7 мы делаем несколько замечаний о некоторых недавних экспериментальных результатах по критиче- ской опалесценции и так называемой аномалии удель- ной теплоемкости, для того чтобы увидеть, имеются ли какие-нибудь экспериментальные указания на существо- вание критической области. 2. Собственные функции и собственные значения в критической области Мы разложим все величины в окрестности критиче- ской точки уравнения состояния нулевого порядка, т. е. уравнения Ван-дер-Ваальса S = !/(/- ft) -Vo/P
358 Приложение Ш (в обозначениях, использованных в части I и II). Кри- тические величины имеют вид ®кр.= 1/86, /кр. = 36, v01tp_ = -g-ft. (2) Теперь основное интегральное уравнение Каца [см. часть I, (10)] в окрестности критической точки следует перестроить не так, как это делалось в части I при вы- воде формулы (33), а с помощью подстановки г = (у6)'/,[х-т1кр.(2/у),/*]. (3) где (5кр.) = (2vokp.),z’//kp.. Это объясняется тем, что в однофазовой области перестроенные собственные функции зависят от переменной [см. часть I, (38)] z = (B/Z)‘/’[x-t1(2/y),/*]. (4) Если мы теперь определим критическую область для температуры и удельного объема с помощью уравнений, соответствующих формулам (1): *о = *окр. [H-Vi(1|6)4 (5) / = /«₽. [1 +Ш (6) то найдем, что ВЦ имеет порядок (уб)71, так что уравне- ние (4) переходит в уравнение (3). Однако мы должны, конечно, еще показать, что подстановка (3) действи- тельно работает! Мы поступим так же, как в части I. Для переменной у в уравнении Каца мы сделаем ана- логичную подстановку z/ = (yd)'/‘[i/ —т1кр.(2/у)'/‘] и положим z' = ze-v< + (уб)7* с (1 — е-^)\ t (х) = Ф [(Уб)-’Л2 + Ър. (2/у)7’] = (уд)7" Я(2), где множитель (уб)7” вводится для нормировки Н(г). Наконец, напишем разложение для s3) s = sKp.[l -ЭМуб)‘'*+Муб) + МубГ’+ ...], (7) где числа $i, Sz, ... зависят от данных чисел Vi и 1л че- рез уравнение состояния, которое по-прежнему задается формулой [см. часть I, (20)] / = (8)
Теория Ван-дер-Ваальса. Ill 359 где lo(s) — наибольшее собственное значение уравнения Каца. Сделав все эти замены, введя разложения (5) и (7) и разложив ядро по степеням (у6)'А До порядка (уб)*7’, мы придем после интегрирования по $ я т и использо- вания формулы (2) к следующему уравнению: [3 (уб)‘Л - (6)‘A z (уб)’7’] - (б)'7* (уб)*Л + 4-//(Z)[3A-h(|),/’Z{(-J—l)(y6f + (^-fiH)(y6)’7’} +- +^{-^-(уб/7’ 4-(1 -^)(у6)*}-|(4)\(уб)*М- -TB-(Yft)4/,24 + 4(4)'/*(Yft),/,25] = 0. (9) В этом уравнении новый собственный параметр Л свя- зан с исходным собственным значением Л уравнением + ~^+ +t(-s>+tv!)<vs>‘'‘+----------ЗЛ- <‘°> Из формулы (9) видно, что можно получить сходящиеся последовательные приближения, если положить H(z) = Я10» (z) 4- (уб)'7* Я(1) (г) 4- (уб)’7’ Я(2> (z) 4- ... . Л=6 (уб)<7‘ 4- Q (уб)’7’ 4- 2 (уб)2 4- (П) В наименьшем порядке [т. е. (уб)’7’] мы получим & -Hvz2+<6)",/‘ (т-1) J + "!О)(*)=0’ (12) а в следующем порядке [т. е. (уб)*7’] — [£—& + т2’ + <6>''4т - ’)г+в] = = [71 Л. - Л____“ i 1,з . [Аз/ агХ аг 20<6>*Л ' 8 V2/
360 Приложение III Эти уравнения определяют в принципе собственные функции Hn\z) и соответствующие им собствен- ные значения 0Л. йп как функции постоянных vi, st и s2. Возвращаясь теперь к уравнению состояния, мы бу- дем исходить из общего выражения -^(«) = f рХ^фь(Х)ф>(у)[-^-],АХ —оо X ехр {(х 4- у)} fdx хе~1ХРу (х | у, т). Разлагая vo и s в окрестности критических значений и используя указанные подстановки для х и у, мы полу- чаем -Xi(s) = ®(SKp.) 36 —6(6),,‘(у6)'/‘ J^г(яГ(г)У4- 4- (уб)’7* I - 26 (6)'л Jdz (z) (z) 4- | -оо 4-26 f rfz?(/^0)(z))24-Y-6v1 .4- ... . (14) Из уравнения (10) и уравнения состояния (8) мы най- дем то, что нам требуется, сравнив полученное выраже- ние для I с определяющим его уравнением (6): $dzz№(z)t--- (15) -2 (4)7’ / dzzH$>\z)HP(z)+ — ОО 4-J pz?(^0)(^))’4-|v1 = 0. (16) — ОО Эти уравнения определяют в принципе зависимость $1 и Sj от Vj и 1\.
Теория Ван-дер-Ваальса. Ill 361 3. Семейство изотерм в критической области Поскольку уравнение состояния выражается с по- мощью наименьшего собственного значения и собствен- ной функции уравнения (12), которые нельзя найти в замкнутом виде, для наших исследований удобно вос- пользоваться следующей физической аналогией. Пере- пишем уравнение (12) в виде +16 - V (z)+Fz] (z) = 0, (17) где V'(z) = A-^-(|v1)^, F = (^-4)/4(6)v’. (18) Ясно, что уравнение (12) можно рассматривать как уравнение Шредингера для частицы, движущейся в по- тенциальном поле V(z) под действием «квазиэлектриче- ского» поля напряженности F. Далее нетрудно показать, что из уравнения (15) следует соотношение <19> Следовательно, 1\ пропорционально «электрическому мо- менту», создаваемому полем F, и исследование изотермы становится эквивалентным исследованию эффекта Штар- ка для наинизшего уровня частицы, движущейся в по- тенциальном поле V(z). Рассмотрим сначала случай, когда F мало. Поскольку V(z) = V(—г), наименьшая собственная функция //0(0)(z) также симметрична по г, когда F=Q. Следовательно, эффект Штарка квадратично зависит от F, так что /1=0 при F=0; это вытекает и непосредственно из (15). С по- мощью обычной теории возмущений находим е.(Г1=е,-Р2^ Л=1 оо 12 JdzzHSW* 4-O(F<),(20) где 0П и Ял0) — собственные функции и собственные зна- чения невозмущенного уравнения. ^Следовательно, для F=Q имеем <0 и не только -з^- = 0, но также и 0Г* 0Г 24 м. Кац
362 Приложение III ^^ = 0. Отсюда вытекает, что при критической плот- ности, т. е. при /1=0, все изотермы имеют точку перегиба с отрицательным наклоном. Действительно, из (19) и (20) мы получаем (уд),;» /у 1 46» /Zzen-e0 Л=1 < jdzzH^(z)H^(z) ; -ОО (21) эта величина всегда отрицательна. Поэтому изотермы не имеют горизонтальной части в критической области. Однако поведение наклона (21) в зависимости от темпе- ратуры совершенно различно для положительного и от- рицательного vi, т. е. для 7'<7'кр. и 7’>Ткр.. Очевидно, для отрицательного vz (7'>7’кр.) потенциал V(z) имеет только минимум при z=0, а при vi<—1 он превращает- ся в параболу, а собственные функции становятся функ- циями Вебера. Для vi<—1 очень просто развить метод теории возмущений для 0П и /A0>(z) и, следовательно, для наклона (21). Находим для viC—1 ) = v Гj . —1 + q v)-з]j (22j \i'Z/Zie0 46» Ч 2(— v,)*'1 1 1 JJ ' Легко также показать, что это согласуется с уравнением состояния в однофазовой области »-7=Т-» + ![' ~И1 - Я- <23> где В2/Р = \ — 2v0(Z — 6)2/Z3, которое было найдено в п. 4 части I. Используя (5) и (6), мы получаем из (23) разложение (7) для s со зна- чением =6^ - у /?+4 - 6А (3Z? -4vi)*/*, (24) откуда следует (22). В случае vi>0, т. е. 7’<7’кр., используются совершен- но другие соображения. Потенциал V(z) имеет теперь
Теория Ван-дер-Ваальса. Ill 363 два минимума (рис. I), и для vi^> 1 это приводит к хо- рошо известной почти вырожденности наименьшего уровня энергии, соответствующей симметричной и анти- симметричной комбинациям двух наименьших собствен- Рис 1. Потенциал V(z) из уравнения (17) при температуре значительно ниже критической. ных функций гармонического осциллятора в окрестности обоих минимумов. Используя метод ВКБ4), найдем ОО 0! -0О «[(WVdехр [-(2V/’], /dzzH^H?} «(бу/’. В сумме (21) существен только первый член, так что для Ц—<25> dl Наклон изотермы, следовательно, быстро стремится к нулю при возрастании vi. Рассмотрим далее случай, когда F и, следовательно, 1\ не являются малыми. Снова, чтобы исследовать vi), мы должны различать два случая: vi«;—1 и у,Э> 1. Для температур выше Лер (vi<—1) «потенциаль- ная функция» V(z) — Fz по-прежнему имеет только один 24*
364 Приложение HI минимум в точке z=zq, определяемой из уравнения (26) «Энергия» 0о приблизительно равна 60 = V (z0) - Fz0 + 2~,,г (z20 - 2v,)v’, (27) где последний член представляет собой «нулевую энер- гию» уЛо) колебаний около Zq [при Л = 1, т=х]2 потен- циальная энергия равна — 2о)2=у го)2- так что ® = 27‘^-^-j р = 2_%(4 — 2vi)%|. Из (19) и (27) с использованием (26) получаем (4) Л h = -2о+2-,/’гоН-2vi)-,/* = = — Zo -ь 2%/(4—2v>)4 В нулевом приближении минимум г0 равен —(т)*^’ Подставляя это значение в (26) и выражая F через $1 с помощью (18), мы получаем первые три члена урав- нения состояния (24), которые также следуют из урав- нения Ван-дер-Ваальса. Можно сказать, что эти ван- дер-ваальсовские члены соответствуют «классическому» приближению эффекта Штарка. В первом приближении z0 = - (4)V* /1 [1 - 2 (б)7’ /1/(3/? - 4V1)7’ J, и это приводит к последнему члену уравнения состояния (24), который, таким образом, представляет, так ска- зать, первую «квантовую» поправку к уравнению Ван- дер-Ваальса. Заметим, что соответствующее выражение для уровней энергии 0П имеет вид а собственные функции в этом приближении являются функциями Вебера Dn(y), где х/ = 2”7‘(3/? —4vi)'‘|z+ (I)’'’/»}- (29)
Теория Ван-дер-Ваальса. Ill 365 Нетрудно также найти высшие приближения. Ответы приведены в приложении 1, поскольку они понадобятся нам в п. 4. Для температур ниже 7"Кр. (vi^>l) потенциальная функция V(z) — Fz может иметь два минимума разной глубины, и какой из них глубже, определяет знак F [или ($1 — 4)]. Если в нулевом приближении мы снова пред- положим, что энергия во равна значению потенциала в наименьшем из минимумов, то найдем (в точности так же, как и раньше), что уравнение состояния примет вид = — 2vjf.sign(s. -4)—<£^+0^%). (30) Это следует также из уравнения Ван-дер-Ваальса [пер- вые три члена в уравнении (24)], дополненного прави- лом Максвелла (см. рис. 2). Опять можно сказать, что Рис. 2. Форма изотермы ниже критической точки; — для уравнения (30); —----------для уравнения Ван-дер-Ваальса;---------для уравнения (30а). ван-дер-ваальсовское уравнение служит «классическим» приближением для соответствующей задачи об эффекте Штарка. В частности, горизонтальная часть изотермы при Si==4 возникает из-за того, что наименьший мини- мум переходит справа налево прн изменении знака F. Добавляя к наименьшей энергии нулевую энергию, мы качественно не изменим картину: горизонтальная часть изотермы сохранится. Конечный наклон изотермы, о ко- тором мы говорили выше [см. уравнение (25)], возникает из-за второго «квантовомеханического» эффекта, а имен-
366 Приложение III но проникновения через барьер между двумя минимума- ми, если их глубина становится почти одинаковой. Ис- пользуя метод ВКБ, мсжно показать, что этот эффект проникновения изменит уравнение (30), а именно , _ _ 2v'i/1(si~4) _ (si~4) 1 l(*i - 4)» 4- 12v. ’ где eeTF exp [—(W'*]. Это согласуется с уравнением (25). До сих пор мы изучали в основном семейство изо- терм при Vf<C—1 и vi^>> 1. Хотя качественной понятно, каким образом изменяются изотермы, проходя через критическую область, тем не менее трудно сделать точ- ные утверждения, если vi имеет порядок единицы, и, очевидно, нельзя сказать ничего определенного о форме кривой сосуществования фаз в критической области. Од- нако представляется разумным считать, что в силу чет- ности функции V(z) критическая плотность не изменяет- ся для конечного уб, но критическая температура пони- жается, так как V(z) имеет два минимума при vi>0, что некоторым образом указывает на разделение фаз. Тогда можно определить новую критическую темпера- туру как такое значение г1( для которого нижний уро- вень энергии равен в точности нулю и совпадает тем самым со значением V(z) в точке максимума. Чтобы определить это значение, можно использовать один из вариантов метода ВКБ, который был предложен Кра- мерсом и Итманом6). С помощью этого метода мы най- дем, что соотношение между vi и 0о для /1=0 и 0О, близкого к нулю, имеет вид V1=(-Т5-Г+1к1Ш/,[,п(36л)+с+т] • <31> где Z = 2фл’Г,/* и С — константа Эйлера. Следователь- но, Vj — л) А = 0,702, если 0о=О. Таким образом, критическая температура изменяется на ДТкр., причем ДТ’кр./Т’кр.и0,702 (уб) \ Для более низких температур,
Теория Ван-дер-Ваальса. Ill 367 т. е. для vi >0,702, нижняя собственная функция имеет два максимума. Представляется заманчивым отожде- ствить положение этих максимумов с тем значением *11'2'1 > где зарождаются «газообразная> и <жидкая> фазы. Проделав это, мы получим /i = 4vr,A|X|. (32) Исключив |Х| из уравнений (31) и (32), мы придем к экстраполированной кривой сосуществования фаз6) v* = (тг)*+-4- [1п(36л)+с+т] '?== 0,702 + 0,143/?. (33) Это все еще парабола, но заметно более плоская, чем парабола Ваи-дер-Ваальса vi = -j^? (см. рис. 3). Рис. 3. Форма кривой сосуществования фаз вблизи критической точки; ----для уравнения Ван-дер-Ваальса;---------для уравнения Ван-дер-Ваальса с поправкой порядка у [уравнение (23)]; — для уравнения (33). 4. Двухточечная функция распределения в критической области Чтобы определить поведение в критической области двухточечной функции распределения при больших рас- стояниях, мы применим тот же самый метод, что и в
368 Приложение III п. 5 части II для однофазовой области. Однако, посколь- ку в этой области пг(х-, I) стремится к 1/Z2 по экспонен- циальному закону Орнштейна — Цернике ехр(—Вух/1) [часть II, (54)] и поскольку в критической области ВЦ имеет порядок (уд)'А, следует ожидать, что в критиче- ской области множитель при х в показателе экспоненты имеет порядок 1/у(уд)'Л. Мы должны, следовательно, за- менить в основной формуле [часть II, (9а)] для преоб- разования Лапласа функции л3(х; I) переменную о пе- ременной оу (yd J7' и исходить из представления IJ dxn2(x\ /)ехр[— оу(уо)7,х] = (*) где Ья= f dx$0(x; з)Фв(х; з4-<М^)'/’). Сначала мы подсчитаем Ья до членов порядка (уд) '• Введем переменную z по формуле (3) и разложение (11) для собственных функций. Заметим, что з+оу(уд)'А получается из разложения (7) для з добавлением 8о к 32, так что уравнение (12) для М°> не изменится при пе- реходе от з к з 4-оу (уд)7|. Используя ортонормирован- ность, получаем bn=d«o 4- (уд)7’ J dz М0’ (z, з) [М” (z, з+оу (уд)7’) — -№’(2, з)] +2(уд)7'д„о f dz[rf00)(z, S)X X [A/?’ (z, s 4- оу (уд)7’)—М2) (z, з)] 4- + М1)(г, з)[Мп(«. з+оу(уд)7*)-fff(z, з)]}. (35) Второй член можно вычислить так. Из уравнения (13) для На> и того обстоятельства, что переход от з К
Теория Ван-дер-Ваальса. Ill 369 а+оу(уд)'/’ не затрагивает Яд” и Qn, можно вывести, что rd* я* । v,** , д,—4 , й ] v [ dx* 48 4 4(6)'/* г+вп]Х X [Л»’(z, S + oy (yd)7*) — //e”(z, S)] = = [-(4),,*o2-Qn(a)+Qn(0)]/40,(z, s). (36) где Qa(a)sQ„($ +°У(Y^)7’)- Умножая уравнение (36) на Hq} (z, s) и интегрируя, получаем для пФ О / tfzM0)(z, s)(/4n(z, 5-|-Оу(уб)7,)_//„,,(2, S)} = —СО = -(4)'A-§TZe; J dzzH^(z,s)№(z, s). (37) — OO Чтобы вычислить следующие члены в уравнении (34), содержащие собственные значения, нужно продолжить разложение (10) до членов порядка (уд)3. Это приводит к выражению Ло(5)-^(5+<^(уд)7') = ®(5Кр.){3(0в-0о+а)(уд)7Ч- 4-3|Ов(о)-Ц>(0)](уд)’/Ч- 4-3 [3„(o)-a0(0)+-^v1o](ya)3+ • • }. откуда находим 3 (yd)7* a---------------гт- =------------- Ae(s)-An(s4av(y6)7’) a + e0- 0. - la»<°>-^P)l + (уд)7,о1 1 11V| , 9vi Л , 6„-e0\ , -1- (а + ня_в())» j 4 4- 4 ^-1 J J4- , [Од (g) — О (0))* g„ (g) - g (0) 1 -i- ff[o+e,-e,] 5 r w Заметим также, что из уравнения (36) для л«=0 полу* чается после умножения иа (z, s) и интегрирования
370 Приложение III следующее соотношение: ОО Ц)(о)-00(0) = -(|),/*о f dzzW(z, з)\г = а1х (39) — ОО [мы воспользовались уравнением состояния (15)]. Подставляя все эти результаты в формулу (34), мы найдем после некоторых простых преобразований /«р.сту (y*)1'1 J* rfxexp[—оу(уй),/,х][/12(х; /) — !•] = о /|я! оо “|2 f dzzfflW +(у6)’/,Я (40) Здесь буквой R обозначены все члены, которые приве- дены в приложении 2; там же мы покажем, что на са- мом деле /?=0. Разумеется, формула (40) законна лишь в критической области, так что I всегда задается урав- нением (6) и собственные значения 0П и собственные функции Нп} следует определять из уравнения (12). При R=0 можно обратить преобразование Лапласа и найти 1)=^ 2 Л = 1 2 dzzH^H™ 2 3 X X ехр [— (0„—0О) ул (уб)7’]. (41) Это окончательны^ результат. Он показывает, что в кри- тической области л2(х; /) стремится на бесконечности к I//2 * * * * [т. е. к тому значению пг(х; I), которое получается без учета корреляции между молекулами] со скоростью, определяемой бесконечной суммой экспонент, показа- тели которых имеют порядок 1/у(уб)7’. Прежде чем подробно рассмотреть уравнение (41), мы сделаем несколько замечаний. (а) Флуктуационная теорема [см. часть II, (34а)] может быть проверена следующим образом. Из уравне-
Теория Ван-дер-Ваальса. Ill ЗП ния (41) получаем / dxpi2(x; 0 — ± со г со *|2 Из уравнения (21) видно, что с точностью до порядка (уб) -,/* правая часть равна у Pj/(ds/dl), что также получается и из флуктуационной теоремы. (б) На расстояниях х~1/у уравнение (41) в наиниз- шем порядке дает г if л * L \ * / -I КР- ЛсО -со xM’W’l _Л+' 1 ^р- Л I V2/ J (42) Здесь используется уравнение состояния (15), чтобы распространить суммирование от нуля до бесконечности, после чего применяется равенство Парсеваля. Можно вывести уравнение (42) непосредственно из основной формулы [часть II, (9а)], заменив о на оу и разложив до порядка (уб)’7’; мы предоставляем это читателю. Из уравнения (42) ясно видно, что в критической области расстояния порядка 1/у не являются основными, по- скольку в этой области лг(х; /) все еще отличается от 1/Р на величину порядка (уб)Ч (в) Чтобы проверить вириальную теорему [см. часть П, (40а)] со з = у + бл^(б+; /) —vuy2 J dxхе-^п^х-, I) ь в критической области, необходимо найти поправку по- рядка (уб),/г к л2(х; /) при малых расстояниях. В при-
372 Приложение III ложении 3 мы докажем, что /»з(й+; 0= + +4-(^)’/* J Чг+(т)Л/>Т W'M2- И3) 4/ко * L \ * / J "₽• —со Используя формулу (42) и разложения (5), (6) и (7) для vo, Ins, легко проверить вириальную теорему с точ- ностью до членов порядка (уб) 5. Исследование уравнения (41) Мы покажем, что уравнение (41) приводит к резуль- татам, полученным в части II, относительно поведения пг(х; I) при больших расстояниях в однофазовой и двух- фазовой областях. Рассмотрим сначала двухфазовую область. Мы нашли (см. часть II, п. 6), что здесь на расстояниях х~1/у и до порядка у где £ж. и 5г. — молярные доли жидкой и газообразной фаз с удельными объемами /ж. и /г.» так что L + U = l. + +5ж.6г.(Лг.-6.ж.).(^ + 0(v6)> Воспользовавшись разложением (5) для v0 и разложе- нием (6) для /ж. и 1Г., находим = (уб)*'* (j 1н — v,)'7*. где I = ж. или г., (45) \ ^ж. ^г. Далее, вблизи критической точки — — 2v‘/« и /1Г = = 2v^, поскольку ван-дер-ваальсовская кривая сосуще- ствования фаз определяется уравнением /J = 4vr Сле-
Теория Ван-дер-Ваальса. Ill 373 довательно, B/l= (y6),/,(2vi)'/* как для жидкой, так и для газообразной фаз, так что две экспоненты в формуле (44) становятся одинаковыми. Окончательно имеем К ~ &жАж. “Ь £г/1г. = 2*/* (&г. &».)’ что дает Подставляя все это в формулу (44), получаем - л 1 i2(y*)’/'Ьм 3.2, «2 (*. О - 7 + - -JT- { 6V! - - h + + (2vo!s’exp^— (2V1),/‘V(‘v6) (46) Это следует также из уравнения (41) при vi}>» 1. Да- вайте проверим это только в симметричном случае ,(Zi=0). Мы видели в п. 3, что в этом случае уровни энергии 0П образуют ряд близких дублетов, соответ- ствующих симметричным и антисимметричным комби- нациям собственных функций гармонического осцилля- тора в окрестности двух минимумов. В сумму (41) дают вклад только нечетные члены, и для первого приближе- ния следует рассматривать лишь л=1 и л=3. Находим ©j—0о«О, 03-0o«(2v1)‘/‘; J dzzHfttf? «(бУ!)'71, / dz « (2vi)-‘'‘, так что уравнение (41) совпадает с уравнением (46) при /1=0. Перейдем теперь в однофазовую область; это очень интересно, поскольку здесь можно получить более по- дробные результаты [см. часть П, п. 5, уравнения (54) и (55)]. Для vi<—1 или лучше для (3/? —4vi)^>l мы нашли в п. 3, что в первом приближении (см. уравне- ние (28)) 0в —0О =уЛ(3/1- 4V/ я собственные функции являются в точности функциями Вебера Dn(y), где у задается уравнением (29). Тогда легко проверить, что первый член суммы в формуле (41)
374 Приложение 111 «1-4*! принимает вид Это выражение совпадает с тем, что дает экспонента Орнштейна — Цернике [см. часть II, (54)] [yv0 (/ — Ъ)*/РВ] ехр [— (В/Г) ух] в критической области с точностью до порядка (уб)*'*. Надо только воспользоваться выражением (45) для ВЦ и заменить vo и I их критическими значениями. В следующем приближении, используя результаты, выведенные в приложении 1, находим ee-eb = |n(3/?-4vi),/*4- + 2(3Z?-4V1) и с точностью до порядка е2 pzz//«0)=(|/?-4v1)-,/‘ U* Г1 I е* 12vi~5/2 1 2/2Va е/* А I Х( я1 [ + 3 3Z? —4v, J 2Ы (3Z?-4v,) 6»2)- Здесь опущены члены, которые после возведения в квад- рат не дают вклада в слагаемые нужного нам порядка. В этом порядке нам, следовательно, в сумме (41) нуж- ны только первые два члена. Получаем Tulr- П- 1 - <*>’* Г« 1 7—де 4 /J-Hvj ,, 8 5/?-12v. 1 + 3 (32? - 4v,)’/« УХ (V6) ~ 9 (32?-4v,)3 J Х X ехр [— у (З/i — 4v1)l/* ух (уб)'4] + +1^4 (a;-\v,yеХ|> (3'; ~ vx Wl + - • (47)
Теория Ван-дер-Ваальса. Ill 375 Можно проверить, что последние три члена в формуле (47) соответствуют в точности трем поправкам поряд- ка у2 к выражению Орнштейна — Цернике в однофазо- вой области [см. часть II, (55)], если эти поправки вы- числять в критической области до порядка (уб)’7’. Это подтверждает общую картину, о которой упоминалось в введении, и снова показывает, что экспонента Орнштей- на — Цернике является главным членом только вне кри- тической области. Так как в экспериментальных исследованиях по кри- тической опалесценции наблюдается преобразование Фурье двухточечной функции распределения, интересно и для нашей модели изучить функцию ОО оо g(k)= f dx eikxg(x)=l f dxel*x^n2(x; [) — -i-J. — CO -oo Для экспоненты Орнштейна — Цернике (при любом числе измерений) g(k)—&Ь2 , где Ь2 пропорциональ- но сжимаемости. Следовательно, график l/g(k)=f(k) как функции k2 должен быть прямой линией, пересекаю- щей ось f(k) в точке, которая стремится к нулю при при- ближении к критической точке, если теория Орнштейна— Цернике правильна. Так как уравнение (41) имеет вид g(x)=fiaae~b^ л=0 где ап и Ьп положительны, мы получаем для нашей мо- дели в критической области 1 = а (Ь) = У 2дя*я , Для k2 больших по сравнению с Ь2 функция f(k) почти линейна по k2. Действительно, f{k) 2 2 «А + 2(2 «лМ2 \ * (48)
376 Приложение III Чтобы исследовать кривизну при малых k2, заметим, что можно написать Г______Г V а»ьп I2 _ /V а«д» \ V а"ь« 2/3 ” [ » (^ + Л2)2 J где штрихи означают дифференцирование по А2. Отсюда, согласно неравенству Шварца, заключаем, что f" <0, т. е. кривая обращена выпуклостью к оси А2. Для изучения зависимости графика Орнштейна — Цернике от температуры мы ограничимся случаем /1=0 (критическая плотность) и V14;—1. Тогда можно ис- пользовать уравнение (47); поскольку последний член исчезает, мы можем написать g(x) в виде одной экспо- ненты, помещая второй член снова в показатель экспо- ненты. Мы получим g(x)=ale~^, где 1 3/кр. (-V,)'/. L 4(-v1),/« 1 J о L 4(— Vi)'1 J Так как наклон графика Орнштейна — Цернике равен то наклоны этих графиков при разных темпера- турах отличаются на величину порядка (—vi)-*/*, т. е. прямолинейные части графиков почти параллельны. Из уравнения (48) видно далее, что пересечение графика с осью f (А) находится в точке bjiai, или Н0>=7(^(-’41 + 2<Г^+-]' Поскольку — (уб)’Ч1= (Т—Ткр')1Ткр,, то видно, что с точностью до порядка (уд) в первом приближении ЦО) — Тир.; это и есть результат Орнштейна — Цер- нике. Однако ближе к критической точке ЦО) отклоняется вверх и, как можно показать (используя точное уравне- ние (41)), ЦО) остается конечным при Г=Гкр., Это откло-
Теория Ван-дер-Ваальса. Ill sn некие от теории Орнштейна — Цернике, получающееся в нашей модели, выглядит приблизительно так, как изо- бражено на рис. 4. Рис. 4. График Орнштейна—Цернике, соответствующий уравнению (47). Наконец, обсудим кратко так называемую аномалию удельной теплоемкости1). Хорошо известно, что в соот- ветствии с теорией Ван-дер-Ваальса удельная теплоем- кость при постоянном объеме постоянна (=2’^) в од- нофазовой области и мгновенно возрастает, если мы переходим в двухфазовую область при фиксированной плотности. В частности, при критическом значении плот- ности находим Асг = О для Т > Ткр., -§(7'кр.-7')/7'кр.+ ...] для Г<7'кр.. (49) Поскольку экспериментальные данные полностью расхо- дятся с этим результатом (в этом и состоит аномалия), 25 м. Кац
378 Приложение III интересно посмотреть, что дает уравнение (41) для удельной теплоемкости. Мы исходим из уравнения кТ °° 2 /кр. рф+А^)7’]2 (W)]2- (50) — 00 которое вытекает из общего результата [см. часть П, (41)], если выразить лг(х; /) с помощью формулы (42). Поскольку в критической области д _____ Др_______1______д_ дТ~ ЛТ2кр. v0ifp (Y6)’/. ’ мы, дифференцируя равенство (12) для Ho\z) по vi в точке 1\ и используя уравнение состояния (15), получаем ,~Т = V.. Ч]! = — ОО Это показывает, что наша модель дает в критической области поправки к удельной теплоемкости порядка k, так что в этом смысле в нашей модели обнаруживается аномальное поведение cv. Для дальнейшего изучения уравнения (51) рассмотрим сначала случай /1=0. Легко показать, что тогда оо Г со 12 используя результаты п. 3, находим8) для vi<S—1 A^ = {^[l/(-v1),/’]+ .... а для V! 1 Aet,=4*-|Hl/(2v1),/’]+ ....
Теория Ван-дер-Ваальса. Ill 379 В критической области скачок теплоемкости для нашей модели несколько сглажен по сравнению с (49), т. е. с тем, что следует из уравнения Ван-дер-Ваальса. Рас- смотрим далее зависимость Дс0 от А при фиксированном vi. Из уравнения (51) следует, что Р(Д<чЖ4 = |Ч^<^.- <52> Здесь использовано соотношение «(W^WA),. вытекающее из уравнения (19). Уравнение (52) в точ- ности совпадает с переписанной в новых обозначениях термодинамической формулой (dcv/dv)T = Т (&р1дТ\. Это показывает, что при критической плотности Ас0 имеет всегда экстремум, потому что ($1 —4) — нечетная функция /ь так что производная равна нулю при /1=0. Далее, для малых 1\ Ч=Ч('1 = °)+'! в4(Л./^'.к-»+ •••• что дает при Vi — 1 Дс„ = Дс, (А = 0) —g- k [/?/(— уЛ + ... И при V! 1 Дс^Де^/^О) -^-(2v1),/*exp[-(2vl),/’l так что экстремум, вероятно, всегда является максиму- мом. Этот максимум становится все более острым, когда мы приближаемся к критической точке из однофазовой области, и затем быстро уплощается при удалении в двухфазовую область. По-видимому, ширина максимума наименьшая при vi порядка единицы. 6. Обобщение уравнения (41) Чтобы показать, что качественное поведение двухто- чечной функции распределения в критической области нечувствительно к изменению вида притягивающего по- 25*
380 Приложение III тенциала (в предположении, что он остается дальнодей- ствуюшим), мы обобщим исследование, проведенное в п. 4, на случай, когда притягивающий потенциал состоит из суммы т экспонент. Поскольку формулы здесь ока- зываются очень громоздкими, мы приведем только на- бросок вычислений. Как и в п. 7 части II, мы запишем притягивающий потенциал в виде Фпр./^Т' = — У S V/ ехр (— уо;х), где Vi=a.i/kT. Мы будем исходить из интегрального уравнения Каца, перестроенного тем же способом, что в части II, за исключением того, что мы заменяем г) на г)Кр=т|(51<р)- Разлагая ван-дер-ваальсовское значение Vu= (см. часть II, (79)] и s по формулам (5) и (7) и вводя затем точно так же, как в части II, (75), новые переменные уп, с помощью ортогонального преоб- разования, которое приводит к диагональному виду матрицу где теперь _ кр. (1кр. ~ №__кр. _ _ v/ кр. _ С‘ ~ 0Д “ 27of6 — Мокр ~ Мо и Vj кр. = а,/ЛГкр.. Отсюда следует, что I» и соот- ветствии с уравнением (80) части II, поскольку В — 0; из исследования, приведенного в части II, вытекает, что наименьшее собственное значение Ат равно 0, так что Переменная ут играет особую роль; только в этой пере- менной мы должны сделать второе, приспособленное к критической области изменение уравнения Каца 1/т = г/(уй)'/‘, после чего мы получим сходящуюся схему последова- тельных приближений по параметру (уб)7*. С точностью
Теория Ван-дер-Ваальса. Ill 381 до членов порядка (уб)'6 получаем’) * 2 (-S- ^-й*)+(* I ММ* L 4 *" б* (Ph (ц*)4 дз? 48 m \ + *—1 / J А.Й + Л4-0. (53) Это уравнение заменяет уравнение (9) до указанного порядка. В уравнении (53) h является функцией пере- менных у\, у* ..ym-i, z, и новое собственное значение Л определяется уравнением ЗЛ = 1 + 4- (убЛ + 4 (уб) ( 2 О/ - т) + ч-i / + <54) заменяющим уравнение (10). Наконец, величина ц определяется из уравнения m / т \1 2°?а?т= ЕМ**/,») Е^ Z-1 \/«1 / где а» — ортогональная матрица, приводящая матрицу Мц к диагональному виду. Введем вместо уь новые пе* ременные w* с помощью формулы = + ||1г/2(6),,’](уб),'*|. Уравнение (53) можно переписать [всегда до порядка (уб) ] в виде *[*-тюг4] + + Й-(7-2о'У] + лл=0-
382 Приложение Hi Это уравнение допускает разделение переменных. Легко проверить, что уравнение (55) удовлетворяется, если по- ложить л=уб 2 л^(л>+|)+е(убЛ IB— 1 А(®1 ... z)= П Л^я£>я(Д?то*)//(0)(z), (56) *=i где Н®\г) и в удовлетворяют уравнению dz* 48 4 + («*+?) +01//0)=0. (57) Это уравнение имеет тот же самый вид, что и уравнение (12). Действительно, если ввести новые переменные Z = Vj = Vjp-’/', 0 = 0Ц-,/>, ;i=44-1(s1-42o<+2 2 /Of (58) и положить Hi0\z)= ц'1'Fi (z), то уравнение (97) пре- вратится в уравнение <Р____Z* У|?* dz* 48 4 +жНг“А»|+ёв Ha(z) = 0, (59) О'* I 4 Н / очень напоминающее уравнение (12). Разница только в том, что из-за крайнего члена, содержащего пь, соб- ственные значения 0П и собственные функции На зави- сят от целого множества «квантовых» чисел п=п1(
Теория Ван-дер-Ваальса. Ill 383 «г. •.., пт. Заметим еще, что в обозначениях (58) при у = |ху (60) уравнение (5) для критической температурной области может быть переписано в виде *о = *окр.[1 +*1(УЬ)’/’]- В то же время уравнение (7) для давления превра- щается в уравнение s=s«P. (m г* 1-1 т-1 \ лЯб6)+м?6)'/’+ •• где s2 = s2n-,/’. Наконец, уравнения (54) и (56) для собственных значений Хп можно преобразовать к виду X_(s) 9 - - ^=1+Г1(7б)Ч 3 J 2^ S1 т т-1 'п— Из уравнения (59) очевидно следует, что наибольшее собственное значение и соответствующая собственная функция, для которой все множество п обращается в нуль, подчиняются относительно переменных с крышеч- кой точно такому же уравнению, что и раньше. Поэто- му уравнение состояния по-прежнему определяется ра- венством /dz ... о(г)= - (4)'Л I, (61) —оо где Г] определяется из уравнения / = 4p.[i+W'‘]. аналогичного уравнению (6).
384 Приложение III Обращаясь теперь к поведению двухточечной функции распределения при расстояниях порядка 1/у(уб)1/1 с точ- ностью до членов порядка (уб)’7’, нетрудно показать, что и в этом случае вычисления проводятся так же, как выше. Исходной точкой является очевидное обобщение уравнения (34). Покажем затем, что только члены с П1 = пг= ... = nm-i = 0 дают вклад порядка (уб)’7’. По- скольку в этом случае уравнение для Й,... onm(z) то же самое, что и уравнение (12) для Нп(г), мы получаем в полной аналогии с уравнением (41), что в общем случае „ ,2 I ‘ ‘п 3 Z«P- «-ll-a, X ехр [—(ё„ — ё0) Ху (уб)1'"], (62) где Нп есть та же самая функция от z, что и НТ от z в уравнении (41) и 6П равно 6П, входящему в уравне- ние (41) ,0). Следовательно, существенное изменение со- стоит только в том, что у заменяется на у=уц. Теперь, как мы видели в части 11 [см. уравнение, следующее за уравнением (85)], в критической точке Следовательно, так как с<= (а</о,) (1МЛТ). Поэтому мы можем напи- сать Jrfxx’<j>np.(|x|) (63) J dx <г„р. (| х |)
Теория Ван-дер-Ваальса. Ill 385 так что 1/у есть в точности расстояние R, фигурирующее в теории Орнштейна — Цернике [см. часть II, (72)]. Соображения, приведенные в п. 5 и показывающие, что первый член ряда (41) превращается в однофазовой об- ласти в экспоненту Орнштейна—Цернике, можно, сле- довательно, в точности повторить и в общем случае. Мы не исследовали подробно, что происходит в выс- ших приближениях, но кажется весьма правдоподобным, что по крайней мере качественно ничего не меняется. 7. Заключительные замечания Хорошо известно, что преобразование Фурье экспо- ненты Орнштейна — Цернике [функция g(k) из п. 5] не зависит от числа измерений, и можно поэтому на- деяться, что отклонения от теории Орнштейна — Цер- нике, вытекающие из нашей модели для функции g(k), по крайней мере качественно будут такими же и в трех- мерном случае. Это подтверждается результатами Хем- мера*), которому удалось обобщить на случай трех измерений исследование поведения корреляционной функции при больших расстояниях, проведенное нами в части 11. Поэтому интересно выяснить, существуют ли какие-нибудь экспериментальные указания на отклонение от теории Орнштейна — Цернике, обсуждавшиеся в п. 5 (см., в частности, рис. 411)). К сожалению, среди экспери- ментов нет еще решающего. Недавние работы Томаса и Шмидта 12) по критической опалесценции аргона не об- наруживают никаких отклонений от теории Орнштейна — Цернике. С другой стороны, такие отклонения описаны для различных бинарных смесей, причем выглядят они так же, как отклонения, показанные на рис. 413). Нам представляется чрезвычайно интересным выяснить, пока- жут ли более тонкие эксперименты отклонения от тео- рии Орнштейна — Цернике, поскольку такие отклонения вблизи критической точки, возможно, послужат более *) Эти результаты излагаются в части IV этой статьи [Нет- тег Р. С., IV. The pair correlation function and equation of state lor long-range forces, 1. Math. Phys., 5, 1 (1964), 75—84], перевод которой здесь не приводится. — Прим, перев.
386 Приложение III явным указанием на существование критической обла- сти. Что касается аномалии удельной теплоемкости, то экспериментыи) явно показывают, что величина с„ не постоянна в однофазовой области, а имеет как функция плотности при постоянной температуре резко выражен- ный максимум вблизи критической точки. Этот макси- мум расположен вблизи от критической плотности, и в этом отношении аномалия качественно согласуется с результатами для нашей модели. Однако cv зависит от температуры совершенно иначе. Вместо сглаженного ван-дер-ваальсовского скачка, предсказываемого нашей моделью, в недавних экспериментах с аргоном получи- лось *8), что при критической плотности cv как функция температуры имеет асимметричную логарифмическую особенность при критической температуре. Поэтому в трехмерном случае, по-видимому, существует как крити- ческая область, так и критическая точка! Будет ли это явление общим, более или менее не зависящим от меж- молекулярных сил, предстоит еще выяснить. Приложение 1. Высшие приближения собственных функций вблизи однофазовой области Для систематического применения теории возмуще- ний к основному уравнению (12), когда V|«<C— 1, пере- менную z лучше заменить переменной у из уравнения (29). Уравнение (12) примет тогда вид [£-(«;- f+(з/i - 4v,)-'- - L «у1 6 3 '* —f+«He]K(y)e0, (П.1) где *(!/) = ({ 4-v,)"1'’ Я<0,(г), (П,2) e=(3/?-4v1)',/,x X(20 + Z1-^-4+4/k-^-Z1).
Теория Ван-дер-Ваальса. Ill 387 В качестве малого параметра выберем e=(3Zi — Заметим, что /,/(3/*— всегда порядка единицы. Напишем формулу (П. 1) в виде Г ____сгу* _/._4vi \~у» еу* у* . [rfy2 6 \ 3/? ) 3 4 +а(е)!/ + 0(е)]к(!/) = О и введем разложения К(!/) = К(0)(!/)+е/<(П(!/) + егК(2)(у)+ ...» а(е) = а0 + е(х1 + е2а2+ .... 0 (е) = 0(О) + е0<1) -+- е20(2) 4- ... . В нулевом порядке получим [W -1 у2++0(О)] Кт = 0. (П. 3) Поскольку из уравнения состояния (15) вытекает, что для основного состояния (П.4) — ОО следовательно, и во должно быть нулем. Отсюда №”(!/) = ^D„(if) и (П.5) 0<?> = «Н-’/2- В первом порядке получаем [£-4+»44W'w= = [-(>-•(п.б)
388 Приложение III Так как (К? (у)]’— четная функция от у, то умножая формулу (П. 6) на Кп} и интегрируя по у, получаем 6^=0. (П.7) Для п=0 получаем из (П. 6) Так как из формулы (П. 4) следует, что f dyyKM^O, то мы заключаем, что (П.8) Уравнение (П. 2) вместе с уравнениями (П. 5), (П. 7) и (П. 8) приводит к результатам (24) и (28) для уравне- ния состояния и энергии ©п- В первом порядке поправ- ки к собственным функциям получаются тогда из урав- ния (П. 6) №’(У) = Л/Л (1 -[|nD„+1- -п(л-1)£>я 8]. Во втором порядке находим х(у-4)^1)^+(4-^-0»,)лН«0’^’ (П-9)
Теория Ван-дер-Ваальса. Ill 389 откуда получаем е=л2+*+4 -13^/(3z? - 4voj (4 «2 - 4 *+4) • (П. 10) Из формулы (П. 4) заключаем, что +оо — СО Это приводит к а2 = 0; Kn'iy) затем можно определить обычным образом и т. д. Приложение 2. Завершение вывода уравнения (41) Неопределенная величина R, стоящая в левой части равенства (40), имеет вид оо Г +оо 12 Я = f У 0((Г-вя^в,,) / dz гН'Ж 0 ЛШ фП--- I J лж1 L — со 4-2 / Нр} + —СО 4- 2 [ dz W(z, s 4-оу (уб)1'*) — Яо1’} — 8, (а)-3(0) у, ,п — о 2 ’ '** где подразумевается, что явно не обозначенные аргу- менты собственных функций всегда равны z и $. Это выражение можно упростить, воспользовавшись тем обстоятельством, что ОО ЛсО Подставляя выражение (35) и используя формулу (37), мы видим, что второй и третий члены в (П. 11) равны __2у о* 3 л-, (е«-0о) +со "|2 / dzzH^H^ ,
390 Приложение III так что мы получаем ОО +00 Л-----/ «ггН^ - л«1 L“°° _s.(g)-s.(O) (П 12) Теперь вычислим So(o)—So(O). Для этого нам потре- буется уравнение для которое получается про- должением разложения (9) до членов порядка (уд)*. Мы не будем адесь приводить явное выражение, а лишь заметим, что общий вид уравнений для определения по- следовательных приближений собственной функции с Точностью до члена Н® (z) такой: £1ЯГ=0, (П. 13а) ЬН^ = 12Н^, (П. 136) £1Яо<2’ = L2HP + 1зН?\ (П. 13в) где вид операторов Li и Lt усматривается из уравнений (12) и (13). Заменив а на s+ay(y6)'l>, мы не изме- ним Li, но изменим Lz и Мы укажем на это, записав новые операторы в виде L2( a), L3( о). Собственное значе- ние So входит в Lt, и для того чтобы вычислить So (о) — — So(O), нужно найти Ls(o)—L$. Продолжив разложе- ние (9) до членов порядка (уд)2, найдем [£з (а) - Аз| Я0(0) (г) = £ г2Яо'О) (г) - [20 (а) - So (0)) № (г). Таким образом, +СО £ j dzzWT- —00
Теория Ван-дер-Ваальса. Ill 391 Последний интеграл можно преобразовать с помощью уравнения (П. 13в); мы получим +00 ao(a)-so(O)=^ j dz?(H0(0))2+ —со +оо + f dzHML2(o)HV4z, s + oy(y6)’?‘)-L2HH = — 00 +oo -----Т+о(4)''‘ j — 00 +co -° (If / dzz^Wtz, 5+Оу(уб),/’)_^] + — 00 +oo + J dzH^L^Hpiz, 5 + оу(уб),/’)_//0,>1. (П. 14) —co Здесь мы использовали уравнение состояния (16), соот- ношение L, (о) = Ц - о (4)‘Л z + Ц, (0) - Ц) (о) (П. 15) и то обстоятельство, что +оо J dzH$\z> s}H$\z, s)=0 —со для s' = s и $' = $+«у(у6)Ч Подставляя формулу (П. 14) в равенство (П. 12), получаем 00 +00 -]1 = 1 е f dzzH^H^ - & ЛЯ Од — J Л»! ц—оо +00 -(у)7’ j dzzH)?W+ —CO +00 + (|)’4 j — —00 1“CO -1 J dzHpU\Hk"(z, 5+оу(Я,/,)-^,,1- (П. 16)
392 Приложение HI Выразим теперь Hq} (z, s+ayiyt»)'1*) через весь набор функций М0). Из уравнения (п. 136), записанного для а+оу(уб),Л вместо s, получаем " и<0) +°° s + oyW'’)------£ f dz Л=1 -ио Исключим таким образом все функции //"’ из выраже- ния (П. 16) для R. Снова используя формулу (П. 15) и то обстоятельство, что А2 — эрмитов оператор, мы при- дем к ожидаемому результату /?=0. Приложение 3. Доказательство уравнения (43) Мы исходим из уравнения . +» D—fasrf — оо X Ру (XI у, б) ехр { У (VoY)'7* (х 4- у)}. (П. 17) Это уравнение является точным следствием общей фор- мулы [см._часть II, (28а)] для преобразования Лапласа функции nj(x;/). Чтобы показать это, умножим уравне- ние (28а) части II на о ехр (об) и перейдем_к пределу при о->оо. Левая часть превратится тогда в /п2(б+;/)- Вос- пользовавшись в правой части рядом [см. часть II, (29)] для резольвенты Rs+a и выражением [см. часть I, (9)] для ядра Ks+a(x,y), легко показать, что первый член этого ряда приводит к формуле (П. 17), так как lim 0еодр5(х, у) = е~ЛРу (х | у, б), а все остальные члены этого ряда исчезают в пределе при 0->оо. Перестроим теперь интеграл в (П. 17) с помощью той же самой подстановки, что и в п. 2, заменяя переменные х, у на z и £. Разлагая подинтегральное выражение по степеням (уб)'71 и используя разложения (о), (6), (7) и (11) для vo,/, s и собственной функции Hq(z), мы най-
Теория Ван-дер-Ваальса. Ill 393 дем, воспользовавшись также уравнениями (15) и (16), что до членов порядка (убр'1 1-4/1(y6)‘,+ + 4(y6)’’ / d2?(^0,(z))2 (П. 18) Легко проверить, что до членов порядка (уб)’/» выраже- ние (П. 18) эквивалентно уравнению (43). Примечания к части III *) Понятие критической области в отличие от критической точки часто обсуждалось, в особенности при объяснении различных ано- мальных критических явлений, явным образом противоречащих уравнению Ван-дер-Ваальса. Для ознакомления с более ранней ли- тературой см., например, К u е п е п J. Р., Die Zustandsgleichung, Braunschweig, 1907, Кар. 5, особенно по поводу того, что касается эффектов гравитации и неоднородностей в критических явлениях. Нам известна лишь одна попытка ввести критическую область, сле- дуя идеям Ван-дер-Ваальса. Эта попытка предпринята Баккером [Bakker G., Z. Physik. Chem., 49 (1904), 609]. Он указывал на то, что может существовать область температур, где толщина капил- лярного слоя того же порядка, что и о/ — v£. В этой области не должно быть мениска, хотя по-прежнему существуют две фазы. Это было указано также Майером. Ознакомиться с его рассуждениями, которые частично формальны, а частично носят физический харак- тер и основаны на внриальиых разложениях, можно по кинге Дж. Е. Майера и М Гипперт-Майер «Статистическая механика», ИЛ, М., 1956, гл. 14. Авторы заключают, что может существовать температура Тя. < Гкр., при которой мениск должен исчезнуть, хотя изотерма по-прежнему имеет горизонтальную часть при тем- пературах между 7И. и ГИр.. В этой области температур изотермы входят в двухфазовую область с горизонтальной касательной. При этом получается такая форма кривой сосуществования фаз вблизи критической точки, что эту область часто называют «жокейской ша- почкой» Майера. С экспериментальной точки зрения существование такой крити- ческой области пока еще спорно. Обзор недавних эксперименталь- ных результатов см. в книге: Гиршфельдер Дж., Кертис Ч., Берд Р., Молекулярная теория газов и жидкостей, ИЛ, М., 1961. См. также работу Хабгуда и Шнейдера по ксенону [Нabgo- od Н. W.. Schneider W. G., Can. I. Chem., 32 (1954), 98, 164]. 2) Вопрос о форме кривой сосуществования фаз вблизи крити- ческой точки рассматривался многими авторами. Гуггенхейм [G u g- 26 м. Кац
394 Приложение Hi genheim, J. Chem. Phys., 13 (1945), 253] указывал, что экспери- ментальным данным более соответствует закон vt—v3~ (Тнр,—Т)Ч>, чем ван-дер-ваальсовскнй результат Vi—v3~ (Ткр—Ту/г, который вытекает из параболической формы кривой сосуществования фаз вблизи критической точки. См. также Weinberger М. А., Schneider W. G., Сал. 1. Chem., 30 (1952), 442, и более позд- нее обсуждение в работе W i d о m В., Rice О. К., J. Chem. Phys., 23 (1955), 1250. Из результата Гуггенхейма следовало бы, что в критической точке также и (д3р/д«а)т обращается в нуль, а Цнмм [Zimm В. Н„ J. Chem. Phys., 19 (1951), 1019] привел правдоподоб- ные аргументы в пользу исчезновения всех производных в критиче- ской точке. Однако и в этом отношении не существует достоверных результатов. *) Как следует из уравнения Ван-дер-Ваальса и уравнений (5) и (6), в разложении (7) коэффициент при члене порядка (уд)1/» должен быть равен (—3v,). Нетрудно также показать, что только в этом случае мы получим сходящиеся последовательные прибли- жения для уравнения Каца. 4) Ср. Dennison D. М., Uhlenbeck G. Е., Phys. Rev. 41 (1932), 313. ’) Kramers Н. A., I Itmann G. Р., Z. Physik, 58 (1929), 217. См. в особенности п. 6. •) Заметим, что уравнение кривой сосуществования фаз, полу- чаемое из уравнения Ван-дер-Ваальса с поправкой О (у) (см. часть I, п. 4), имеет особенность в критической точке, так что не- посредственная экстраполяция невозможна. 7) Мы признательны д-ру Зенгерсу, указавшему нам, что было бы интересно изучить эту аномалию в нашей модели. •) Эти результаты можно вывести проще, не используя урав- нение (51), а непосредственно обращаясь к общему результату (см. часть II, (41)) и используя затем уравнение (46) для nj(x; /). ’) В этом уравнении vi не следует смешивать с vi « cci/kT. Теперь у нас будут встречаться только критические значения ViKp. и Vi всегда будет означать число, определяемое уравне- нием (5). *°) Эти в„ не следует смешивать с в, входящим в уравнение (57), которое связано с 0 уравнением (58). **) Вопрос о законности теории Орнштейна — Цернике вблизи критической точки изучался, в частности, Грином [Green М. S., /. Chem. Phys., 33 (1960), 1403]. Хотя мы и не согласны с его тео- ретическими положениями, мы очень признательны д-ру Грину за то, что он рассказал нам о своей работе и сообщил об эксперимен- тальных результатах, указывающих на отклонение от теории Орн- штейна — Цернике. (См. также обзор Райса в книге Thermodyna- mics and Physics of Matter (Princeton University Press, Princeton, N. J., 1955, sec. E), где приводится обширная библиография.) *’) Thomas J. E., Schmidt P. W., J Chem. Phys, (в пе- чати). ,s) См., в частности, McIntyre D., W i m s A., Green М. S., ]. Chem. Phys. 37 (1962), 3019.
Теория Ван-дер-Ваальса. Ill 395 м) Наиболее полные данные имеются для аргона, но и другие вещества обнаруживают такое же поведение (см. L е v е 11 J. М. Н., Dissertation, University of Amsterdam, 1958). IS) Багатский M. И., В ороне ль А. В., Г у за к В. Г., Ж урн. зкспер. теор. физ., 43 (1962), 728. Мы признательны д-ру Фншеру, указавшему нам на эту работу.
Добавление переводчика КРАТКИЕ СВЕДЕНИЯ О ТЕОРИИ ФАЗОВЫХ ПЕРЕХОДОВ В КЛАССИЧЕСКОЙ СТАТИСТИЧЕСКОЙ ФИЗИКЕ Это добавление предназначено читателю, мало зна- комому с теорией фазовых переходов в классической статистической физике и ее нынешним состоянием. Хотя почти все сообщаемые здесь сведения разбросаны в трех статьях Каца, Уленбека и Хеммера об одномерной мо- дели вещества, мы предпочли кратко изложить их в од- ном месте, чтобы тем самым несколько подготовить чи- тателя к чтению этих статей. Для равновесной системы, состоящей из N одинако- вых частиц с парным взаимодействием, заключенных в сосуде объема И, постулируется1), что плотность веро- ятности найти эти частицы в точках .....xN равна .....^ = 7 ехр Г— ₽ Ulxi — 0) L К) J (распределение Гиббса), где Р=1/ЛГ (Л— постоянная Больцмана, Т — абсолют- ная температура), U(x) = С/(|х|)— потенциал парного взаимодействия между частицами, a Z — нормирующий множитель, равный, очевидно, Z(V, N, ₽) = = 77F f • * • f ехР Г~₽ 2 —dxN. V V L KJ J Множитель возникает из-за того, что для нас несу- ществен порядок частиц и мы отождествляем все распо- ложения (а их ЛИ) частиц в точках х>,..., xN, отличаю- *) Считается, что этот постулат асимптотически (при больших V и N) может быть выведен из общих принципов механики в пред- положении эргодичности системы. Однако строгого вывода, кроме случая невзаимодействующих частиц, до сих пор нет, и поэтому распределение (1) удобнее просто постулировать.
Добавление переводчика 397 шиеся порядком. Функция Z(V, N, $)') называется ста- тистической суммой (или конфигурационным интегра- лом) и содержит, как мы сейчас увидим, почти всю не- обходимую в термодинамике информацию о системе. Следует сразу же заметить, что для реальных систем значения V и N очень велики и сами по себе не имеют физического смысла (по крайней мере в термодина- мике). Смысл имеет их отношение -р-=Р (плотность) или обратная величина v — ^ (удельный объем). По- этому функцию Z(V, ЛГ, Р) следует изучать асимптоти- чески при V-*ao и /У-ьоо, причем -jy--*® (» —фиксиро- вано). Этот предельный переход обычно называют термодинамическим пределом. Оказывается, что суще- ствует предел .. lnZ(V, N, р) .. V ------------ N - = f(^ 0)- (2) V-*co V N-*oo N"*’ Функция f(v, р) называется обычно гельмгольцевской свободной энергией и является одной из важнейших функций, используемых в термодинамике. Существова- ние предела (2) предполагалось физиками очень давно, но строгое математическое доказательство было полу- чено сравнительно недавно2). Кроме того, была дока- зана выпуклость функции f(v, р) по переменной о. Отметим, что предел (2) существует лишь при опреде- ленных ограничениях на потенциал, а именно достаточ- *) Строго говоря, Z(V, N, ₽) зависит не только от объема, ио также и от формы сосуда. Поэтому для определенности мы будем считать сосуд кубическим. Однако приводимая ниже асимптотиче- ская формула для Z(V, ЛГ, Р), по-видимому, справедлива для сосу- дов любой формы. !) См. Van Hove L., Physica, 15 (1949), 951. В этом дока- зательстве имеется некоторый пробел [см. Lee Т. D., Yang С. N., Phys. Rev. 87 (1952), 404, 410]. Наиболее полное доказательство принадлежит Рюеллу [Ruelle D., Helv. Phys. Acta, 38 (1963), 183]. P. Л. Добрушин значительно обобщил работу Рюелла и нашел по- чти исчерпывающие условия, которым должен удовлетворять по- тенциал, для того чтобы существовал предел (2), см. Теория ее» роятностей и ее применения, декабрь, 1964.
398 Добавление переводчика но быстрый рост в нуле и достаточно быстрое убывание на бесконечности. Принимают, что реальные потенциалы взаимодействия между молекулами газа имеют вид, изображенный на рис. i или 2. Область левее точки а называется отталкивающей, а правее — притягивающей частью потенциала. Для таких потенциалов предел (2) существует. Величина р= называется давлением, а уравнение р=р(о, 0) —уравнением состояния вещества. Если на плоскости (о, р) нарисовать семейство кривых p=p(v, 0) при разных значениях 0, то полученные кри- вые называют изотермами. Из выпуклости функции f(v, 0) по переменному v следует, что каждая изотерма не возрастает с ростом v. Однако не исключена воз- можность, что на некоторых участках она горизон- тальна. Такие участки называют участками фазового перехода. Мы ясно сознаем, что такое определение по- кажется формальным, но в этом кратком обзоре мы затрудняемся привести хоть какое-нибудь физическое истолкование этому чисто математическому определе- нию, истолкование, которое взывало бы к нашему интуи- тивному представлению о конденсации. В настоящее время, по существу, ни для какой реальной модели газа не доказано существование (или, наборот, отсутствие) фазового перехода, хотя известно очень много хитро- умных догадок и предположений о том, как такое явле- ние могло бы произойти. Мы находимся в положении того бедняка, который прекрасно знал, как истратить миллионы, будь они у него. По-видимому, как говорит опыт, горизонтальный участок существует не у всех изотерм. Картина прибли- зительно такая, как изображено на рис. 3. Область, по- крываемая горизонтальными участками изотерм, за- штрихована. Значение Гкр.» выше которого у изотермы нет горизонтального участка, называется критическим. Значения ркр. и окр. в вершине заштрихованной области также называют критическими значениями. Наряду с описанием системы из большого числа частиц с помощью распределения (1) (называемого обычно каноническим ансамблем) рассматривают так
Рис. 1. Здесь 1/(г) — оопри г<го. Эта область потенциала называется обычно твердой сердцевиной. Рис. 2. Потенциал без твердой сердцевины, но достаточно быстро растущий в нуле. Рис. 3.
400 Добавление переводчика называемый большой канонический ансамбль. Здесь предполагается, что система может состоять из произ- вольного числа частиц, находящихся в области (кубе) объема V, и плотность вероятности того, что в системе находится ровно N частиц, расположенных в точках Xi,.... xN, задается формулой co(N; .... хЛГ) = -^-ехр Г—р </(•*/—•*/)]. (3) L kj J где z — параметр, называемый активностью, а 3 — нор- мирующий множитель, называемый большой статисти- ческой суммой-. 2(z, р, И) = 00 дг = 2 WT f ••• f ехР — р U(xt—xi)\dxl...dxN. N=0 V V i<J J Функцию S(z, p, V) следует снова рассматривать в тер- модинамическом пределе V-»-oo. Оказывается, что при тех же условиях относительно потенциала U(xt— х,), при которых существует предел (2) в каноническом ан- самбле, существует также предел lim -д^ = х(х, р). У->ио v Функция x(z, р) называется гиббсовской свободной энергией. Существует связь между термодинамическими функциями канонического и большого канонического ансамблей. В частности, функции х(г, Р) и Р) и их аргументы и и z связаны соотношениями In 2= vf' (V) — f(v), Х(г, Р) = /'С»)- (4) Из этих формул видно, что на участках, где f(v) строго выпукла, z и г(2. Р) монотонно убывают с ростом V.
Добавление переводчика 401 Если же на участке [v2. vj функция f (v, 0) линейна (участок фазового перехода), то г и х(г, 0) остаются постоянными, однако при этом значении г=г0 производ- ная хДг, 0) терпит разрыв: х;(* *,+о. ч—1 [1-1]. Таким образом, в терминах функции х(г>0) фазовый переход связан с изломом на графике этой функции. Сверх того делают даже более сильное допущение относительно функции 0) (0 постоянно): вне лю- бой окрестности точек излома х(г> 0) можно анали- тически продолжить в некоторую окрестность положи- тельной части вещественной оси1)- Поскольку функция Х(г, 0) определяется с помощью 1пЗ, она аналитична, как можно показать2). в окрестности вещественной оси, не содержащей точек, предельных для нулей функций 8 (г, V). Таким образом, если при V-+oo нули 3(г, Й) не накапливаются к положительной части вещественной оси, то фазовый переход отсутствует, и , наоборот, появ- лением фазового перехода мы обязаны тому, что нули 8 (г, V) при V -► оо достаточно густо подходят к ка- кой-нибудь точке на положительной части вещественной оси. Эти соображения привели Ли и Янга к более силь- ной гипотезе: нули семейства целых функций В (г, У) [для потенциала, изображенного на рис. 1, 8 (г, V) — многочлен степени ~ V] при V -► оо концентрируются вдоль некоторых кривых на комплексной плоскости с не- которой предельной линейной плотностью. Фазовый пе- реход имеет место тогда, когда какая-нибудь из этих дуг пересекает положительную часть вещественной оси. Хотя в общем случае гипотеза Ли и Янга не доказана, она подтверждается для некоторых моделей. Наиболее мощным и глубоким средством изучения си- стем большого числа частиц служат так называемые функции распределения (или, как их еще называют, ) Аналитичность х(г, 0) доказана пока только для малых зна- чений г. См., например, Ruelle D., Ann. Phys., 25 (1963), 109—120. *) Доказательство принадлежит А. Я- Повзнеру (устное сообще- ние иа семинаре в МГУ).
402 Добавление переводчика корреляционные функции). Они определяются так: рл(хр .... xs; V, N) — (N_sy Z(V. W, Р)x X J • • • J exp —₽ 2 U(xt — Xj)—2 u(xt—yj)~ V V 1<J /=1 7 = 1 —₽ 2 —*o)ldy'' • • dy"-* Ki J — для канонического ансамбля; P,(*i. ...» хл; z, V) = Jexp[-₽S v=o v v L kj s N — ₽2 2 u(xi — У})—₽ 2 и(У1—У}) dyt ... dyN KJ — для большого канонического ансамбля. Величины ps(xi, .... х4; V, N) [р»(Х|, .... х»; z, V)] равны плотности вероятности обнаружить $ частиц в точках Xi, ..., xt при произвольном расположении остальных частиц. Эти функции также следует рассма- тривать в термодинамическом пределе (V->oo, AZ->oo, jy—для канонического ансамбля, и просто У->оо для большого канонического ансамбля). Предполагается, что рл(Х], хл; V, ^->р,(ль ..., хл; v) у ПРИ У->ОО, ^->OO, и Р,(Х,...хл; z, V)-»A(*b •••> -X,; г) при V->oo, (5) однако строгое доказательство в настоящее время по- лучено лишь для большого канонического ансамбля при
Добавление переводчика 403 малых значениях г1)- Как обстоит дело для больших z, не известно. Считается, что в большом каноническом ансамбле предел (5) существует для всех значений z, от- личных от того, при котором происходит конденсация, а в точке конденсации z=z0 все p«(* *i, .... г) меняются скачком. Относительно функций канонического ан- самбля предполагается существование термодинамиче- ского предела (5) для всех значений плотности. При этом считают, что на участке фазового перехода [vb vj справедливо следующее соотношение: р, (хь .... х,; (х„ .... х,; vj + &>, (хь ..., х,; где Кроме того, считается, что в термодинамическом пре- деле функции распределения большого и малого кано- нических ансамблей вне области фазового перехода совпадают, т. е. p4(xlt ..., х,; ®)=р(х1..х,; z). причем v и z связаны соотношением (4). Однако стро- гое доказательство почти всех этих фактов еще отсут- ствует. Самым эффективным средством изучения функций распределения служат связывающие их системы беско- нечного числа интегральных уравнений. Таких систем существует довольно много2). При изучении каждой такой системы обычно применяется какая-нибудь схема аппроксимаций, состоящая, как правило, в том, что пред- полагается определенная зависимость высших функций распределения от низших. Это дает возможность обо- рвать бесконечную цепочку уравнений, а оставшуюся приближенную систему решать, например, численно. Эти методы фактически применяются и часто дают ре- зультаты, хорошо согласующиеся с экспериментальными данными. Иногда даже в этих схемах аппроксимаций ') См. Ruelle D., Ann. Phys.. 25 (1963), 109—120. *) См., например, книгу: Фишер 3. И., Статистическая теория жидкостей, где даны ссылки на оригинальные работы.
404 Добавление переводчика возникают некоторые качественные указания на суще- ствование фазового перехода, но на самом деле мы еще слишком мало знаем о качестве самих аппроксимаций, чтобы доверять таким указаниям. Функции р«(*ь v) или г) со- держат гораздо больше информации о системе, чем уравнение состояния. Более того, уравнение состояния можно восстановить по самим функциям распределения [достаточно второй функции распределения p»(xi, *2)] с помощью различных интегральных соотношений, кото- рые называются флуктуационными и вириальными тео- ремами. В заключение хочется отметить, что излагаемая в трех предшествующих статьях модель фазового пере- хода, хотя и далека от реальности и никак не вскрывает математический механизм возникновения фазового пе- рехода (в самой модели такой механизм является очень специальным и, по-видимому, не может быть обобщен), хороша, как и всякая модель, тем, что может служить пробным камнем для разного рода гипотез и связей. Сами авторы с завидной полнотой проследили все эти связи и проверили все, что могли проверить. Исключе- ние, правда, составила гипотеза Ли и Янга, а также проверка каких-нибудь предположений о связи между высшими и низшими функциями распределения, на ос- нове которых строятся приближенные схемы.
УКАЗАТЕЛЬ Авогадро число 170, 193 Адамар 40 Айринг 221 Боголюбов 162, 233, 240 Больцман 80, 152, 222, 227 Больших чисел закон слабый 39, 219 -------усиленный 39, 219 Большой канонический ансамбль 130 Боненблюст 74 Борель 219 Борн 233 Броуновское движение 163. 168, 172, 193, 215 Броут 154, 160, 224, 232 Ваи Хов 244 Вейль 221 Вероятность последействия 169 — условная 93, 98 Винер 194, 196, 225 Винера интеграл 197, 198, 201 — мера 194, 196, 204 Возвращения время 120, 185, 191, 228 — — дисперсия 122 — — среднее 103, 120, 190, 222 — теорема Пуанкаре 83, 189, 228 Возмущений теория 48, 53 Время возвращения 120, 185, 191, 228 — — среднее 103, 120, 190, 191, 222 — устойчивости 183 Выборочное пространство 13, 27 Герб или решетка 34 Гесс 115 Гиббс 108, 223, 228 Град 224 Грин Г. 233 Грии М. 160, 224 Дисперсия времени возвращения 122 Диффузии коэффициент 170, 193 Дуб 93, 195, 197 Зигерт 115, 224 Ивон 233 Исключенный объем 55 Канонический ансамбль 130 Карамата 62 Кац 221, 222, 232, 251 Кирквуд 214, 233 Клаузиус 80 Клейн 122, 224 Кнудсена газ 191 Колмогоров 93, 173, 194, 219, 223 Кон 244 Кривая Я-теоремы 129 Крупнозернистая плотность 134 Лаплас 26 Латтииджер 244 Леви 197, 220 Линдлей 225 Лиувилля оператор 131 — теорема 84, 104, 229 — уравнение 108, 132, 154, 232 Лошмндт 82
406 Указатель Максвелл 16, 80, 219, 227 Марков 221 Маркова процесс 179, 185, 230 — цепь 96 Марковский характер эренфе- стовской модели 111, 120 Марковское свойство 111, 176 Метрическая транзитивность 89 Микроканонический ансамбль 130 Микроканоническое распределе- ние 229, 232 Молекулярный хаос 141 Моран 221 Навье — Стокса уравнение 239, 249 Неопределенности принцип 66, 221, 258 Объемный потенциал 218 Онзагер 222 Основное уравнение 131, 134, 136, 139, 232 Оффорд 25, 219 Плотность крупнозернистая 108, 229 Потенциала теория 214, 218 Произведение мер 164, 214 Пуанкаре 228 — теорема возвращения 83,189, 228 — цикл 88, 228 Райс 220 Распределения функции 44 Рей 209 Реньи 220 Сведберг 162 Свободные от квадратов числа 33 Сегё 73, 222 Сильное перемешивание 95 Слабый закон больших чисел 17, 39, 213 Случайные блуждания 153, 220 — процессы 91, 163, 230 Смолуховского процесс 174 Спитцер 74, 222 Статистическое равновесие 167 Тауберова теорема 62, 208 Теплицева матрица 72 Тепловое равновесие 15 Термодинамики второй закон 82, 124 Уленбек 154, 161, 223 Усиленный закон больших чисел 219 Условная вероятность 169 Устойчивости время 183 Устойчивый процесс 179, 181 Фейнман 199, 200, 251 Фейнмана интеграл 200 Феллер 221 Фредгольма определитель 77 Халмош 223 Хаит 68 Центральная предельная теоре- ма 78 Цермело 83, 222, 228 Чандрасекар 220, 224, 243 Частичное распределение 233,241 Числа, свободные от квадратов 33 Шредингера уравнение 201, 211, 263 Штейнгауз 219 Эйнштейн 193 Энтропия 82, 122, 227 Эратосфен 28 Эргодическая теорема 223 Эрдеш 25, 219. 222 Эренфест П. 96, 222 Эренфест Т. 96, 222 Эренфестовская модель 96 Эренфестовской модели марков- ский характер 111, 120 Яглом 226
ОГЛАВЛЕНИЕ Предисловие переводчика ........................... 5 От американского редакционного комитета............ 7 Предисловие........................................ 9 Глава I. Теоретико-вероятностный способ рассуждений ... 13 Глава II. Некоторые аналитические средства и приемы теории вероятностей ........................................ 42 Глава III. Вероятность в некоторых задачах классической ста- тистической механики................................. 80 Глава IV. Интегрирование в функциональных пространствах и некоторые приложения.................................193 Примечания и библиография............................219 Приложение I. Уравнение Больцмана. Г. Е. Уленбек .... 227 Приложение II. Квантовая механика. А. Р. Гиббс.......251 Приложение III. Теория Ван-дер-Ваальса о равновесии между газом н жидкостью. М. Кац, Г. Е. Уленбек, П. К. Хеммер ................ 271 Часть I. Изучение одномерной модели...............271 Часть II. Изучение функций распределения..........307 Часть III. Исследование критической области.......355 Добавление переводчика. Краткие сведения о теории фазо- вых переходов в классической статистической физике . . 396 Указатель............................................405
М. Кац ВЕРОЯТНОСТЬ И СМЕЖНЫЕ ВОПРОСЫ В ФИЗИКЕ Редактор Н. И. Плужником Художник Н. А. Усач1з Художественный редактор В. И. Шапомлоз Технический редактор А. Г. Резоухоза Корректор И. С. Цветкова Сдано в производство 8/1 1965 г. Подписано к печати 18/V 1965 г. Бумага 84Х108'/>з~6,4 бум. л. 20,9 печ. л. Уч.-нзд. л. 18,06. Изд. М 1/2600. Цена 1 р. 41 к. Зак. 1037 Темплан 1965 г. изд-ва «МИР». Пор. N 5. ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Ленинградская типография № 2 имени Евгении Соколовой Главполиграфпрома Государственного комитета Совета Министров СССР по печати Измайловский проспект, 29